Compartilhamento |
|
Use este identificador para citar ou linkar para este item:
http://bibliotecatede.uninove.br/handle/tede/3092
Tipo do documento: | Dissertação |
Título: | Análise de textos com aplicação de técnicas de inteligência artificial: estudo comparativo para classificação de fuga ao tema em redações |
Título(s) alternativo(s): | Text analysis with the application of artificial intelligence techniques: comparative study for classify theme away in writings |
Autor: | Pinho, Cintia Maria de Araújo |
Primeiro orientador: | Gaspar, Marcos Antônio |
Primeiro membro da banca: | Gaspar, Marcos Antônio |
Segundo membro da banca: | Silva, Leandro Augusto da |
Terceiro membro da banca: | Dias, Cleber Gustavo |
Quarto membro da banca: | Sassi, Renato José |
Resumo: | O processo de correção manual de redações acarreta algumas dificuldades, dentre as quais aponta-se o tempo dispendido para a correção e para a devolutiva de resposta ao aluno. Para instituições como as universidades e o Exame Nacional do Ensino Médio (ENEM), que se utilizam de redação como avaliação para o ingresso no ensino superior, além das escolas de ensino básico, tal atividade demanda tempo e custo para a avaliação dos textos produzidos. A fuga ao tema é um dos itens avaliados na redação do ENEM e, quando o estudante comete tal falha, sua redação é anulada por não ter desenvolvido os conceitos solicitados na proposta do tema estipulado para a redação. Neste contexto, a análise automática de redações com a aplicação de Processamento de Linguagem Natural (PLN), Mineração de Textos (MT) e outras técnicas de Inteligência Artificial (IA) tem se revelado promissora no processo de avaliação automatizada da linguagem escrita. Face ao contexto exposto, o objetivo desta pesquisa é comparar diferentes técnicas de IA para classificação de fuga ao tema em textos e identificar aquelas que trouxeram melhores resultados. Esta é uma pesquisa aplicada e experimental executada por meio da aplicação de algoritmos e mensuração dos resultados obtidos. Os experimentos delinearam em especial a classificação de 1320 redações de língua portuguesa com 119 temas diferentes. Além da PLN e MT, a pesquisa se utilizou das seguintes técnicas inteligentes de classificação: Redes Neurais Convolucionais (RNC), Multilayer Perceptron (MPL), Árvores de Decisão, Florestas Aleatórias, Gradiente Boosting, Ada Boost, Stochastic Gradiente Descent, Support Vector Machines e outras técnicas para identificar padrões na base de dados por meio de algoritmos não supervisionados como a clusterização. Os experimentos trouxeram os melhores resultados para o classificador RNC, que obteve acurácia de até 89%, com taxa de Falso Positivo (FP) de 5,7% e Verdadeiro Positivo (VP) de 49%. Outros classificadores com resultados satisfatórios foram MLP e Gradiente Boosting, com acurácia de 90% e 74%, VP de 33% e 51% e média de FP de 4% e 20%, respectivamente. Espera-se que a solução desenvolvida nesta pesquisa contribua para impactar positivamente o trabalho de professores e instituições de ensino, por meio da redução de tempo e custos associados ao processo de avaliação de redações. |
Abstract: | The process of manual correction of essays brings some difficulties, among which is the time spent for the correction and for returning the answer to the student. For institutions such as universities and the Exame Nacional do Ensino Médio (ENEM), which use essays as an evaluation for admission to higher education, as well as elementary schools, this activity demands time and cost to evaluate the texts produced. Changing the subject is one of the items evaluated on ENEM, when a student commits such mistake, his or her text is annulled because the concepts were not developed as requested in the stipulated theme for the essay. In this context, the automatic analysis of essays with the application of Natural Language Processing (NLP), Text Mining (TM) and other Artificial Intelligence (AI) techniques has shown promise in the process of automated assessment of written language. Given the referred context, the aim of this research is to compare different AI techniques for classification of topic avoidance in texts and identify those that brought better results. This is an applied and experimental research executed by applying algorithms and measuring the results obtained. The experiments outlined in particular the classification of 1320 Portuguese language essays with 119 different themes. Besides PLN and MT, the research used the following intelligent classification techniques: Convolutional Neural Networks (CNN), Multilayer Perceptron (MPL), Decision Trees, Random Forests, Gradient Boosting, Ada Boost, Stochastic Gradient Descent, Support Vector Machines, and other techniques to identify patterns in the database through unsupervised algorithms such as clustering. The experiments brought the best results for the RNC classifier, which obtained accuracy up to 89%, with False Positive (FP) rate of 5.7% and True Positive (VP) rate of 49%. Other classifiers with satisfactory results were MLP and Gradient Boosting, with accuracy of 90% and 74%, PV of 33% and 51%, and average FP of 4% and 20%, respectively. It is hoped that the solution developed in this research will contribute to impact the work of teachers and educational institutions by reducing the time and costs associated with the essay evaluation process. |
Palavras-chave: | redações avaliação automática fuga ao tema inteligência artificial essays automatic evaluation escape from the topic artificial intelligence |
Área(s) do CNPq: | CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
Idioma: | por |
País: | Brasil |
Instituição: | Universidade Nove de Julho |
Sigla da instituição: | UNINOVE |
Departamento: | Informática |
Programa: | Programa de Pós-Graduação em Informática e Gestão do Conhecimento |
Citação: | Pinho, Cintia Maria de Araújo. Análise de textos com aplicação de técnicas de inteligência artificial: estudo comparativo para classificação de fuga ao tema em redações. 2021. 152 f. Dissertação( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo. |
Tipo de acesso: | Acesso Aberto |
URI: | http://bibliotecatede.uninove.br/handle/tede/3092 |
Data de defesa: | 30-Ago-2021 |
Aparece nas coleções: | Programa de Pós-Graduação em Informática e Gestão do Conhecimento |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Cintia Maria de Araújo Pinho.pdf | Cintia Maria de Araújo Pinho | 3,44 MB | Adobe PDF | Baixar/Abrir Pré-Visualizar |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.