Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://bibliotecatede.uninove.br/handle/tede/3275
Tipo do documento: Dissertação
Título: Processamento de linguagem natural aplicado à identificação de padrões semânticos em relatos de mulheres vítimas de violência doméstica e familiar
Autor: Foroni, Deborah Quenia Gouveia 
Primeiro orientador: Belan, Peterson Adriano
Primeiro membro da banca: Belan, Peterson Adriano
Segundo membro da banca: Martins, Fellipe Silva
Terceiro membro da banca: Sassi, Renato José
Resumo: A violência doméstica e familiar (VDF) contra a mulher ainda é considerada um fenômeno tabu para muitos indivíduos, isso impacta diretamente no ciclo de coleta de dados, pois os profissionais envolvidos, por vezes, não se sentem preparados e responsáveis por essa coleta de dados. Diante isso, as mídias sociais têm sido usadas por milhões de pessoas para compartilhamento de vivências cotidianas que também abrange relatos de experiências vividas de vítimas de violências. Diante dessa perspectiva de aumento de dados disponíveis nas mídias sociais, a vasta quantidade de informação gerada vai além das competências de processamento dos seres humanos. Neste contexto, as técnicas de Aprendizado de Máquina (AM), Processamento de Linguagem Natural (PLN) e topic modeling podem colaborar na identificação de padrões e características semânticas em relatos publicados por mulheres vítimas de VDF. Esta pesquisa propõe identificar temas representativos em relatos de mulheres vítimas de VDF e utilizá-los como ferramentas para lidar com esse problema, embora reconheça as dificuldades em abordar todas as nuances e complexidades desse fenômeno. Para tal propósito, foi desenvolvido uma metodologia para identificar tópicos que emergem em conjunto de dados coletados de forma espontânea e não estruturado de relatos de mulheres vítimas de VDF na plataforma YouTube. Foram conduzidos três experimentos empregando os algoritmos PCA, UMAP, K-means e HDBSCAN. O experimento que combinou os algoritmos UMAP e HDBSCAN demonstrou a viabilidade do uso de PLN para identificar padrões semânticos nos tópicos que emergiram a partir do conjunto de dados coletado. Como resultado, foi possível identificar 27 tópicos que demonstram uma representação semântica melhor de interpretação para identificar padrões nos relatos de mulheres vítimas de VDF.
Abstract: Domestic and family violence (DFV) against women is still considered a taboo phenomenon for many individuals, which directly impacts the data collection cycle as the professionals involved often do not feel prepared and responsible for this data collection. In light of this, social media has been used by millions of people to share their everyday experiences, including accounts of violence experienced by victims. Given this perspective of an increasing amount of data available on social media, the vast quantity of information generated exceeds the processing capabilities of human beings. In this context, Machine Learning (ML), Natural Language Processing (NLP), and topic modeling techniques can contribute to identifying patterns and semantic characteristics in reports published by female victims of DFV. This research aims to identify representative themes in reports from women victims of DFV and use them as tools to address this issue, although it recognizes the challenges in addressing all the nuances and complexities of this phenomenon. For this purpose, a methodology was developed to identify topics that emerge from spontaneously collected and unstructured data of reports from women victims of DFV on the YouTube platform. Three experiments were conducted employing the PCA, UMAP, K-means, and HDBSCAN algorithms. The experiment that combined the UMAP and HDBSCAN algorithms demonstrated the feasibility of using NLP to identify semantic patterns in the topics that emerged from the collected dataset. As a result, it was possible to identify 27 topics that demonstrate a better semantic representation for interpreting patterns in reports from female victims of DFV.
Palavras-chave: processamento de linguagem natural
topic modeling
BERTopic
violência doméstica e familiar
njatural language processing
topic modeling
BERTopic
domestic and family violence
Área(s) do CNPq: CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma: por
País: Brasil
Instituição: Universidade Nove de Julho
Sigla da instituição: UNINOVE
Departamento: Informática
Programa: Programa de Pós-Graduação em Informática e Gestão do Conhecimento
Citação: Foroni, Deborah Quenia Gouveia. Processamento de linguagem natural aplicado à identificação de padrões semânticos em relatos de mulheres vítimas de violência doméstica e familiar. 2023. 84 f. Dissertação( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.
Tipo de acesso: Acesso Aberto
URI: http://bibliotecatede.uninove.br/handle/tede/3275
Data de defesa: 27-Jun-2023
Aparece nas coleções:Programa de Pós-Graduação em Informática e Gestão do Conhecimento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Deborah Quenia Gouveia Foroni.pdfDeborah Quenia Gouveia Foroni19,07 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.