Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://bibliotecatede.uninove.br/handle/tede/2586
Tipo do documento: Dissertação
Título: Abordagem de inteligência de fontes abertas com mapas auto-organizáveis de kohonen e processamento de linguagem natural para execução automática de dorks
Título(s) alternativo(s): Open source intelligence approach with self-organizing maps of kohonen and natural language processing for automatic execution of dorks
Autor: Evangelista, João Rafael Gonçalves 
Primeiro orientador: Sassi, Renato José
Primeiro membro da banca: Sassi, Renato José
Segundo membro da banca: Chaves, Marcirio Silveira
Terceiro membro da banca: Napolitano, Domingos Marcio Rodrigues
Quarto membro da banca: Belan, Peterson Adriano
Resumo: Para proteger as informações localizadas na internet, a área da Segurança da Informação dispõe de um processo para testar a segurança de páginas web, denominado Teste de Intrusão ou Pentest. Em sua fase inicial, o teste visa realizar buscas na internet a fim de reunir o máximo de informações disponíveis para apoiar as demais fases do processo e, até mesmo, já encontrar algumas vulnerabilidades. Essa fase inicial é chamada de Inteligência de Fontes Abertas, ou, em inglês, Open Source Intelligence (OSINT). Uma prática para OSINT utilizada em Pentest é o Google Hacking, que funciona aplicando strings denominadas Dorks. O Google Hacking pode ser executado de duas formas: manual e automática, sendo que a primeira possui um tempo de duração superior ao da segunda. Uma maneira de melhorar o desempenho do Pentest é torná-lo automático com a aplicação de técnicas de Inteligência Artificial (IA), como os Mapas Auto-Organizáveis (SOM) de Kohonen, um tipo de rede neural artificial utilizada para gerar agrupamentos, e o Processamento de Linguagem Natural (PLN), uma subárea da IA responsável por fazer com que os computadores interpretem e desenvolvam conteúdo em linguagem humana. Assim, o objetivo deste trabalho foi desenvolver uma abordagem de Inteligência de Fontes Abertas, por meio dos Mapas Auto-Organizáveis de Kohonen e do Processamento de Linguagem Natural, para execução automática de Dorks, a fim de melhorar o desempenho da prática do Google Hacking. A base de dados selecionada foi o Google Hacking Database (GHDB), contendo 4.211 Dorks e 4 atributos. A abordagem proposta neste trabalho foi desenvolvida em 10 fases: preparação do ambiente para executar o OSINT, definição do escopo de OSINT, seleção da base de Dorks, seleção e avaliação das ferramentas OSINT, pré-processamento da base de Dorks, transformação da base de Dorks, aplicação da rede SOM na base de Dorks, análise dos resultados, adição das novas informações na base de Dorks e validação da execução automática de Dorks. Os resultados obtidos apontaram um melhor desempenho da abordagem proposta quando executada automaticamente a base de Dorks comparada à execução manual. Desta forma, concluiu-se que a abordagem de Inteligência de Fontes Abertas, utilizando Mapas Auto-Organizáveis de Kohonen e Processamento de Linguagem Natural, pode ser aplicada na execução automática de Dorks.
Abstract: To protect the information located on the Internet, the Information Security area has a process to test the security of web pages, called Intrusion Test or Pentest. In its initial phase, the test performs searches on Web pages to gather or obtain the maximum information available to support other phases of the process, or even, find some vulnerabilities. This phase is called Open Source Intelligence (OSINT). A practice for OSINT used in Pentest is Google Hacking, which works using strings called Dorks. Google Hacking can be performed in two ways: manual and automatic, and the first has a longer duration than the second. One way to improve Pentest performance is to make it automatic with the application of Artificial Intelligence (AI) techniques, such as Kohonen's Self-Organizing Maps (SOM), a type of artificial neural network used to generate clusters, and Natural Language Processing (PLN), a subarea of AI responsible for making computers able to interpret and develop content in human language. So, the objective of this work was to develop an Open Source Intelligence Approach with Kohonen's Self-Organizing Maps and Natural Language Processing for automatic execution of Dorks to improve the performance of the Google Hacking practice. The selected database was the Google Hacking Database (GHDB), containing 4,211 Dorks and 4 attributes. The approach proposed in this work was developed in 10 phases: preparing the environment to run OSINT, defining the OSINT scope, selecting the Dorks base, selecting and evaluating the OSINT tools, pre-processing the Dorks base, transforming the Dorks base, application of SOM in the Dorks base, analysis of results, addition of new information in the Dorks database and validation of the automatic execution of Dorks. The results obtained revealed a better performance of the proposed approach when automatically executing the Dorks base compared to manual execution. It was concluded, then, that Open Source Intelligence Approach with Kohonen's Self-Organizing Maps and Natural Language Processing can be applied in the automatic execution of Dorks.
Palavras-chave: OSINT
inteligência de fontes abertas
dorks
processamento de linguagem natural
mapas auto-organizáveis de Kohonen
pentest automático
OSINT
open source intelligence
dorks
natural language processing
self-organizing maps
automatic pentest
Área(s) do CNPq: CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Idioma: por
País: Brasil
Instituição: Universidade Nove de Julho
Sigla da instituição: UNINOVE
Departamento: Informática
Programa: Programa de Pós-Graduação em Informática e Gestão do Conhecimento
Citação: Evangelista, João Rafael Gonçalves. Abordagem de inteligência de fontes abertas com mapas auto-organizáveis de kohonen e processamento de linguagem natural para execução automática de dorks. 2020. 153 f. Dissertação( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.
Tipo de acesso: Acesso Aberto
URI: http://bibliotecatede.uninove.br/handle/tede/2586
Data de defesa: 29-Jun-2020
Aparece nas coleções:Programa de Pós-Graduação em Informática e Gestão do Conhecimento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
João Rafael Gonçalves Evangelista.pdfJoão Rafael Gonçalves Evangelista3,73 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.