Sistema de Submissão de Resumos, I Encontro de Iniciação Científica - 2011 (ENCERRADO)

Tamanho da fonte: 
Uma ferramenta para auxílio à pesquisa em análise de sentimento
Ronaldo Prati, Gleison Moraes

Última alteração: 2011-09-11

Resumo


Introdução

 

 

A Internet estabeleceu várias mudanças de paradigma na sociedade moderna. Uma dessas mudanças é a maneira como nos baseamos nas opiniões de outras pessoas para formar a nossa própria opinião. Há não muito tempo atrás, éramos limitados às opiniões de indivíduos próximos a nós, como amigos, parentes, etc.

 

Com a popularização da Internet, a fonte de opiniões se ampliou substancialmente. Todavia, essa mesma popularização trouxe uma quantidade muito grande de opiniões, mais do que uma pessoa poderia avaliar em tempo hábil. Assim, uma lacuna existe no âmbito do tratamento dessa grande quantidade de opiniões e é com essa lacuna que se preocupa a Análise de Sentimento, ou Mineração de Opinião

Objetivos

Como objetivo específico, esse projeto visa a construção de uma ferramenta para o auxílio à pesquisa em Análise de Sentimento em redes sociais, o Twitter em específico, com textos escritos em português.

Metodologia

Para fazer a busca no Twitter e preparar a base de dados o Twitter4j, uma biblioteca Java não oficial para a API do Twitter, foi utilizada.

Por fim, através da API do Weka a base de dados foi convertida para um formato específico (arff) ideal para a aplicação de classificadores pré-treinados por essa mesma API.

Resultados

Foi criada uma ferramenta e uma interface gráfica com extensão para web (via applet), que faz uma busca por uma chave no site de mircroblog twitter e classifica o resultado da busca de acordo com a polaridade de opinião (positiva, negativa ou neutra). O resultado também é mostrado no formato de gráfico de pizza, com a porcentagem de cada polaridade.

Conclusão

A ferramenta pode ser executada tanto no modo de consulta, em que é usado o classificador padrão da ferramenta, ou a partir de um novo classificador, gerado a partir de um conjunto de treinamento do próprio usuário. Esses dois modos de utilização permitem uma boa flexibilidade, de maneira que tanto o classificador padrão pode ser testado com novas consultas ou novos classificadores gerados a partir de diferentes conjuntos de treinamento podem ser facilmente incorporados e testado com novas consultas.