@MASTERSTHESIS{ 2020:778083610, title = {Abordagem de inteligência de fontes abertas com mapas auto-organizáveis de kohonen e processamento de linguagem natural para execução automática de dorks}, year = {2020}, url = "http://bibliotecatede.uninove.br/handle/tede/2586", abstract = "Para proteger as informações localizadas na internet, a área da Segurança da Informação dispõe de um processo para testar a segurança de páginas web, denominado Teste de Intrusão ou Pentest. Em sua fase inicial, o teste visa realizar buscas na internet a fim de reunir o máximo de informações disponíveis para apoiar as demais fases do processo e, até mesmo, já encontrar algumas vulnerabilidades. Essa fase inicial é chamada de Inteligência de Fontes Abertas, ou, em inglês, Open Source Intelligence (OSINT). Uma prática para OSINT utilizada em Pentest é o Google Hacking, que funciona aplicando strings denominadas Dorks. O Google Hacking pode ser executado de duas formas: manual e automática, sendo que a primeira possui um tempo de duração superior ao da segunda. Uma maneira de melhorar o desempenho do Pentest é torná-lo automático com a aplicação de técnicas de Inteligência Artificial (IA), como os Mapas Auto-Organizáveis (SOM) de Kohonen, um tipo de rede neural artificial utilizada para gerar agrupamentos, e o Processamento de Linguagem Natural (PLN), uma subárea da IA responsável por fazer com que os computadores interpretem e desenvolvam conteúdo em linguagem humana. Assim, o objetivo deste trabalho foi desenvolver uma abordagem de Inteligência de Fontes Abertas, por meio dos Mapas Auto-Organizáveis de Kohonen e do Processamento de Linguagem Natural, para execução automática de Dorks, a fim de melhorar o desempenho da prática do Google Hacking. A base de dados selecionada foi o Google Hacking Database (GHDB), contendo 4.211 Dorks e 4 atributos. A abordagem proposta neste trabalho foi desenvolvida em 10 fases: preparação do ambiente para executar o OSINT, definição do escopo de OSINT, seleção da base de Dorks, seleção e avaliação das ferramentas OSINT, pré-processamento da base de Dorks, transformação da base de Dorks, aplicação da rede SOM na base de Dorks, análise dos resultados, adição das novas informações na base de Dorks e validação da execução automática de Dorks. Os resultados obtidos apontaram um melhor desempenho da abordagem proposta quando executada automaticamente a base de Dorks comparada à execução manual. Desta forma, concluiu-se que a abordagem de Inteligência de Fontes Abertas, utilizando Mapas Auto-Organizáveis de Kohonen e Processamento de Linguagem Natural, pode ser aplicada na execução automática de Dorks.", publisher = {Universidade Nove de Julho}, scholl = {Programa de Pós-Graduação em Informática e Gestão do Conhecimento}, note = {Informática} }