Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://bibliotecatede.uninove.br/handle/tede/225
Tipo do documento: Dissertação
Título: Comparando modelos de classificação dos comentários de clientes: mineração de opiniões em empresa brasileira de classificados online de empregos
Autor: Miranda, Marcelo Drudi 
Primeiro orientador: Sassi, Renato José
Primeiro membro da banca: Chaves, Marcírio Silveira
Segundo membro da banca: Santana, José Carlos Curvelo
Resumo: A Internet hoje é uma realidade presente na vida das pessoas, possibilitando o surgimento de muitas empresas que fornecem serviços online. Porém, para se manterem no mercado, é fundamental que essas empresas se preocupem com a qualidade dos serviços prestados. Neste contexto, torna-se importante conseguir avaliar a satisfação do cliente em relação a esses serviços. Uma das formas utilizadas para avaliar o sentimento dos clientes em relação aos serviços prestados é a Mineração de Opiniões, que se refere ao conjunto de técnicas utilizadas para extrair e avaliar sentimentos expressos em fontes de dados textuais. O objetivo deste trabalho foi comparar Modelos de Classificação dos comentários de clientes para a Mineração de Opiniões em empresa brasileira de classificados online de empregos. Foram implementados três Modelos de Classificação: baseado no software comercial Repustate; baseado em Dicionário e baseado em Naive Bayes. Os modelos foram aplicados em uma base de dados contendo comentários não estruturados de clientes em língua portuguesa, coletados no formulário de cancelamento do serviço. Um comentário não estruturado apresenta erro de grafia, de concordância e pode ser quase ininteligível. Classificar comentários não estruturados em língua portuguesa é uma tarefa complexa para um classificador por dois motivos: os erros contidos nos comentários e a escassez de modelos de classificação de comentários em língua portuguesa disponíveis para serem tomados como exemplo. Estes motivos tornam os modelos desenvolvidos nesse trabalho relevantes para as pesquisas em Análise de Sentimentos e Mineração de Opiniões. A avaliação do desempenho dos modelos de classificação foi feita usando o índice Kappa e a Matriz de Confusão. O desempenho na classificação dos três Modelos foi analisado por meio da comparação com a classificação realizada por jurados (seres humanos), que também tiveram a avaliação de sua concordância realizada com o índice Kappa e a Matriz de Confusão. A característica não estruturada dos comentários provocou divergência na sua classificação por parte dos jurados e também dos Modelos de Classificação. A concordância entre os classificadores e os jurados chegou no máximo a moderada, com melhor desempenho para o classificador baseado em Naive Bayes. Os modelos foram aplicados na base de dados e, apesar das características dos comentários, a Mineração de Opiniões foi realizada. Conclui-se, então, que o desempenho dos classificadores na mineração de opiniões em empresa brasileira de classificados online de empregos foi positivo e o objetivo do trabalho foi atingido. Vale destacar que a Mineração de Opiniões em comentários não estruturados em língua portuguesa é uma tarefa complexa, que exige pesquisa e que este cenário está aberto para novos estudos.
Abstract: The Internet nowadays is a reality in people's lives, enabling the growth of many online services companies. However, to maintain their activities and stay in the market, it s important for these companies to worry about the quality of the provided services. In this context, it becomes important to be able to assess the client satisfaction regarding those services. One way to assess the clients' sentiment regarding the provided services is Opinion Mining, which refers to the set of techniques used to extract and assess the sentiment expressed in texts. The goal of this work was to compare Classification Models for the clients' comments for Opinion Mining in a Brazilian online job search company. Three models were implemented: one based on commercial software named Repustate; one Dictionary based and one based on Naive Bayes. The Models were applied to a database containing non-structured comments of clients in Portuguese, captured in a service cancellation form. A non-structured comment contains typos, concordance errors and can be almost unintelligible. Classifying non-structured comments in Portuguese is a complex task for a classifier for two reasons: the errors in comments and the scarcity of Classification Models for comments in Portuguese to be taken as examples. Those reasons make the Models developed in this work relevant for the research field of Sentiment Analysis and Opinion Mining. The performance evaluation of the Classification Models was performed using Kappa coefficient and the Confusion Matrix. The classification performance of the three models was analyzed by comparing it with the classification made by human judges, that in turn, had their agreement among them assessed using Kappa and Confusion Matrix. The non-structured characteristic of the comments caused divergence in the judges classification and also among the Classification Models. The agreement among the classifiers and the judges was moderate at best, with the best performance achieved by the Naïve Bayes based classifier. The models were applied to the database and, despite the characteristics of the comments the Opinion Mining was performed. The conclusion is that the performance of the classifiers in the Opinion Mining in a Brazilian online search company was positive and the goal of this work has been reached. It s worth to note that the Opinion Mining in non-structured comments in Portuguese is a complex task, that demands research and this scenario is open for new studies.
Palavras-chave: mineração de opiniões
análise de sentimentos
modelos de classificação
classificação de comentários em língua portuguesa
recuperação de informações
processamento de linguagem natural
opinion mining
sentiment analysis
classification models
comment classification in portuguese
information retrieval
natural language processing
Área(s) do CNPq: ENGENHARIAS::ENGENHARIA DE PRODUCAO
Idioma: por
País: BR
Instituição: Universidade Nove de Julho
Sigla da instituição: Uninove
Departamento: Engenharia
Programa: Programa de Pós-Graduação de Mestrado e Doutorado em Engenharia de Produção
Citação: MIRANDA, Marcelo Drudi. Comparando modelos de classificação dos comentários de clientes: mineração de opiniões em empresa brasileira de classificados online de empregos. 2014. 97 f. Dissertação (Mestrado em Engenharia) - Universidade Nove de Julho, São Paulo, 2014.
Tipo de acesso: Acesso Aberto
URI: http://bibliotecatede.uninove.br/tede/handle/tede/225
Data de defesa: 28-Set-2014
Aparece nas coleções:Programa de Pós-Graduação de Mestrado e Doutorado em Engenharia de Produção

Arquivos associados a este item:
Arquivo TamanhoFormato 
Marcelo Drudi Miranda.pdf3,18 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.