Exportar este item: EndNote BibTex

Use este identificador para citar ou linkar para este item: http://bibliotecatede.uninove.br/handle/tede/3242
Registro completo de metadados
Campo DCValorIdioma
dc.creatorLeonardis, Roger Willian Joel-
dc.creator.Latteshttp://lattes.cnpq.br/8686118656991273por
dc.contributor.advisor1Sassi, Renato José-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8750334661789610por
dc.contributor.referee1Sassi, Renato José-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/8750334661789610por
dc.contributor.referee2Kitani, Edson Caoru-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/6731656353508097por
dc.contributor.referee3Pereira, Fabio Henrique-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/0382304490753424por
dc.date.accessioned2023-12-04T15:38:10Z-
dc.date.issued2023-06-26-
dc.identifier.citationLeonardis, Roger Willian Joel. Detecção de fraudes em transações com cartão de crédito: uma comparação do desempenho de técnicas inteligentes com base na avaliação da função de custo. 2023. 75 f. Dissertação( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.por
dc.identifier.urihttp://bibliotecatede.uninove.br/handle/tede/3242-
dc.description.resumoA detecção de fraudes em cartões de crédito enfrenta um problema relativo ao número de casos de fraudes ser menor do que o de não fraudes, dificultando a detecção por parte de técnicas inteligentes. A solução passa pela aplicação de dois métodos que tratam este desbalanceamento, o Oversampling e o Undersampling. Para avaliar e comparar o desempenho das técnicas, utiliza-se a Matriz de Confusão (MC), o Coeficiente de Correlação de Matthew (MCC), a Área sob a Curva (AUC) e a Função de Custo (FC). O resultado da FC quantifica o impacto financeiro causado por uma classificação incorreta e, por se tratar de custo, quanto menor o seu valor, melhor o desempenho da técnica. O objetivo geral deste trabalho foi comparar o desempenho de técnicas inteligentes com base na avaliação da Função de Custo para detectar fraudes em transações com cartões de crédito em base de dados desbalanceada. A base de dados utilizada contém informações sobre transações realizadas com cartões de crédito europeus coletadas no ano de 2013. Foram aplicadas as seguintes técnicas: Regressão Logística (RL), Decision Trees (DT), Random Forest (RF), Support Vector Machine (SVM), Deep Learning (DL) e XGBoost (XG), sobre as bases de dados desbalanceada e balanceada com Oversampling e Undersampling. Para avaliar e comparar os resultados foram utilizadas a MC, o MCC, a AUC e a FC. O melhor desempenho para a AUC foi da RL com Oversampling, para o MCC foi da RF aplicada à base desbalanceada e para a FC, novamente a RL com Oversampling foi a melhor. A justificativa para a RL com Oversampling apresentar o melhor desempenho em duas das três métricas avaliadas pode residir no fato de ser uma técnica tradicionalmente aplicada em problemas de detecção de fraudes e, por isto, apresentou mais aderência à base de dados utilizada. No estudo do Aprendizado de Máquina, o princípio da Navalha de Occam recomenda que, diante de vários modelos, o mais simples deve ser escolhido, como ocorreu com a RL com Oversampling. Ao considerar o custo de uma predição incorreta, não basta avaliar somente os resultados obtidos com as métricas AUC e MCC, deve-se considerar também a aplicação da FC para apoiar a escolha de uma técnica inteligente.por
dc.description.abstractCredit card fraud detection faces an issue with the number of the fraud transactions being lower than non-fraud, making it difficult for machine learning models to effectively detect them. There are different types of solution to fix this imbalance, Oversampling and Undersampling can be used to deal with it. To evaluate and compare the performance of the machine learning models, metrics like the Confusion Matrix (CM), the Matthew Correlation Coefficient (MCC), the Area under the Curve (AUC) and the Cost Function (FC) can be applied. The FC result quantifies the financial impact caused by a real fraud misclassification and, because it is cost related, the lower its value the better its performance. The objective of this experiment was to compare the performance of machine learning models using the FC to detect fraud in credit card transactions in an unbalanced dataset. The dataset contains information about European credit cards transactions collected in 2013. The following models were applied: Logistic Regression (RL), Decision Trees (DT), Random Forest (RF), Support Vector Machine (SVM), Deep Learning (DL) and XGBoost (XG), over the unbalanced and balanced databases with Oversampling and Undersampling. To evaluate and compare the results, CM, MCC, AUC and FC were used. The best performance for AUC was RL with Oversampling, for MCC was for RF applied to the unbalanced base and for FC also RL with Oversampling presented the best performance. The reasons why RL with Oversampling outperformed the other models in two out of the three metrics may be connected to the common use of this model in fraud detection problems, therefore presented more adherence to the database used. As stated in the principle of Occam's Razor the recommendation for Machine Learning models use is to adopt the simplest one: RL with Oversampling. When considering the cost of an incorrect prediction, it is not enough to evaluate only the results obtained with the AUC and MCC metrics, one should also consider the results of the FC to support of a machine learning model definition.eng
dc.description.provenanceSubmitted by Nadir Basilio (nadirsb@uninove.br) on 2023-12-04T15:38:10Z No. of bitstreams: 1 Roger Willian Joel Leonardis.pdf: 4095369 bytes, checksum: 153cc45250d81ba40bb0177d2934efea (MD5)eng
dc.description.provenanceMade available in DSpace on 2023-12-04T15:38:10Z (GMT). No. of bitstreams: 1 Roger Willian Joel Leonardis.pdf: 4095369 bytes, checksum: 153cc45250d81ba40bb0177d2934efea (MD5) Previous issue date: 2023-06-26eng
dc.formatapplication/pdf*
dc.languageporpor
dc.publisherUniversidade Nove de Julhopor
dc.publisher.departmentInformáticapor
dc.publisher.countryBrasilpor
dc.publisher.initialsUNINOVEpor
dc.publisher.programPrograma de Pós-Graduação em Informática e Gestão do Conhecimentopor
dc.rightsAcesso Abertopor
dc.subjectfraudes em cartão de créditopor
dc.subjectfunção de custopor
dc.subjectcusto de classificaçãopor
dc.subjectinteligência artificialpor
dc.subjectbase de dados desbalanceadapor
dc.subjectcredit card fraudeng
dc.subjectcost functioneng
dc.subjectclassification costeng
dc.subjectartificial intelligenceeng
dc.subjectimbalanced dataseteng
dc.subject.cnpqCIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpor
dc.titleDetecção de fraudes em transações com cartão de crédito: uma comparação do desempenho de técnicas inteligentes com base na avaliação da função de custopor
dc.title.alternativeFraud detection in credit card transactions: comparing machine learning models using the cost functioneng
dc.typeDissertaçãopor
Aparece nas coleções:Programa de Pós-Graduação em Informática e Gestão do Conhecimento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Roger Willian Joel Leonardis.pdfRoger Willian Joel Leonardis4 MBAdobe PDFBaixar/Abrir Pré-Visualizar


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.