RDBU| Repositório Digital da Biblioteca da Unisinos

A hybrid model for fraud detection on purchase orders based on unsupervised learning

Mostrar registro simples

Autor Oliverio, William Ferreira Moreno;
Lattes do autor http://lattes.cnpq.br/7380008989239864;
Orientador Rigo, Sandro José;
Lattes do orientador http://lattes.cnpq.br/3914159735707328;
Instituição Universidade do Vale do Rio dos Sinos;
Sigla da instituição Unisinos;
País da instituição Brasil;
Instituto/Departamento Escola Politécnica;
Idioma en;
Título A hybrid model for fraud detection on purchase orders based on unsupervised learning;
Resumo Fraud on the purchasing area is an issue which impacts companies all around the globe. This issue is treated with audits. However, due to the massive volume of the data available, it is impossible to verify all the transactions of a company. Therefore only a small sample of the data is verified. Due to the small number of frauds compared to the standard transactions, frequently, these fraudulent transactions are not included in the sample and hence are not verified during the audit. This work presents a new approach using the techniques of signature detection associated with clustering for an increased probability of inclusion of fraud-related documents in the sample. Due to the non-existence of a public database for fraud detection related to the purchase area of companies, this work uses real procurement data to compare the probability of selecting a fraudulent document into a data sample. Our work compares random sampling versus the sampling obtained from the proposed model. We also explore what would be the best clustering algorithm for this specific problem. The proposed methodology was able to classify the purchase orders on different clusters using the HDBSCAN clustering algorithm, on which one of them grouped the POs with the most symptoms of a fraudulent transaction in a completely automated way, something which was not being found on any paper related to the topic on fraud detection on the corporate procurement area.;
Abstract A fraude na área de compras é uma questão que afeta empresas de todo o mundo. Esse problema é tratado com auditorias. No entanto, devido ao grande volume de dados disponíveis, é impossível verificar todas as transações de uma empresa. Portanto, apenas uma pequena amostra dos dados é verificada. Devido ao pequeno número de fraudes em comparação com as transações padrão, frequentemente essas transações fraudulentas não são incluídas na amostra e, portanto, não são verificadas durante a auditoria. Este trabalho apresenta uma nova abordagem utilizando as técnicas de detecção de assinatura associadas ao clustering para aumentar a probabilidade de inclusão de documentos relacionados à fraude na amostra. Devido à inexistência de um banco de dados público para detecção de fraudes relacionadas à área de compras das empresas, este trabalho utiliza dados de aquisições reais para comparar a probabilidade de selecionar um documento fraudulento em uma amostra de dados. Nosso trabalho compara amostragem aleatória versus a amostragem obtida a partir do modelo proposto. Também exploramos qual seria o melhor algoritmo de clustering para esse problema específico. A metodologia proposta foi capaz de classificar os documentos de compras em diferentes clusters através da utilização do algortimo HDSCAN, no qual um deles contendo os documentos com o maior volume de sintomas associados a transações fraudulentas, de uma maneira completamente automática, algo que não foi encontrado nos papers relacionados ao tópico de fraudes na área de compras corporativas.;
Palavras-chave Fraud detection; Procurement; Non-supervised machine learning; Clustering; Signature detection; Detecção de fraudes; Agrupamento; Detecção de assinaturas;
Área(s) do conhecimento ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação;
Tipo Dissertação;
Data de defesa 2019-09-17;
Agência de fomento Nenhuma;
Direitos de acesso openAccess;
URI http://www.repositorio.jesuita.org.br/handle/UNISINOS/9071;
Programa Programa de Pós-Graduação em Computação Aplicada;


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar

Busca avançada

Navegar

Minha conta

Estatística