Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado
Descripción del Articulo
Internal fraud is a big issue for companies, resulting in relevant monetary losses. Several investigations have proposed improvements to the personnel selection process making using of Data Mining. The present work proposes to use past information of applicants to a company to predict if they will c...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2020 |
Institución: | Universidad de Lima |
Repositorio: | ULIMA-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.ulima.edu.pe:20.500.12724/12355 |
Enlace del recurso: | https://hdl.handle.net/20.500.12724/12355 |
Nivel de acceso: | acceso abierto |
Materia: | Data mining Fraud Employee selection Míneria de datos Fraude Selección de personal https://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
RULI_a50852dd4617c912ad3e76dba8197fd6 |
---|---|
oai_identifier_str |
oai:repositorio.ulima.edu.pe:20.500.12724/12355 |
network_acronym_str |
RULI |
network_name_str |
ULIMA-Institucional |
repository_id_str |
3883 |
dc.title.es_PE.fl_str_mv |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
title |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
spellingShingle |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado Espinoza Montalvo, Sergio Ernesto Data mining Fraud Employee selection Míneria de datos Fraude Selección de personal https://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
title_full |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
title_fullStr |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
title_full_unstemmed |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
title_sort |
Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado |
author |
Espinoza Montalvo, Sergio Ernesto |
author_facet |
Espinoza Montalvo, Sergio Ernesto |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Taquía Gutiérrez, José Antonio |
dc.contributor.author.fl_str_mv |
Espinoza Montalvo, Sergio Ernesto |
dc.subject.en_EN.fl_str_mv |
Data mining Fraud Employee selection |
topic |
Data mining Fraud Employee selection Míneria de datos Fraude Selección de personal https://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.es_PE.fl_str_mv |
Míneria de datos Fraude Selección de personal |
dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
Internal fraud is a big issue for companies, resulting in relevant monetary losses. Several investigations have proposed improvements to the personnel selection process making using of Data Mining. The present work proposes to use past information of applicants to a company to predict if they will commit fraud during their stay. We find models with high precision, but that have a bigger classification error to find the fraud cases. After several experiments, we find around 13 features of this universe that are most relevant to the model. Some of these features match with features mentioned in literature about antisocial disorders. We conclude that there is value in applicant information to predict if they will commit internal fraud during their stay in the company. |
publishDate |
2020 |
dc.date.accessioned.none.fl_str_mv |
2021-01-22T05:46:58Z |
dc.date.available.none.fl_str_mv |
2021-01-22T05:46:58Z |
dc.date.issued.fl_str_mv |
2020 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.other.none.fl_str_mv |
Tesis |
format |
bachelorThesis |
dc.identifier.citation.es_PE.fl_str_mv |
Espinoza Montalvo, S. E. (2020). Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/12355 |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12724/12355 |
identifier_str_mv |
Espinoza Montalvo, S. E. (2020). Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/12355 |
url |
https://hdl.handle.net/20.500.12724/12355 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.*.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad de Lima |
dc.publisher.country.none.fl_str_mv |
PE |
publisher.none.fl_str_mv |
Universidad de Lima |
dc.source.none.fl_str_mv |
Repositorio Institucional - Ulima Universidad de Lima reponame:ULIMA-Institucional instname:Universidad de Lima instacron:ULIMA |
instname_str |
Universidad de Lima |
instacron_str |
ULIMA |
institution |
ULIMA |
reponame_str |
ULIMA-Institucional |
collection |
ULIMA-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/4/Espinoza_Prediccion-postulantes-cometeran.pdf.txt https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/5/Espinoza_Prediccion-postulantes-cometeran.pdf.jpg https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/1/Espinoza_Prediccion-postulantes-cometeran.pdf https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/2/license_rdf https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/3/license.txt |
bitstream.checksum.fl_str_mv |
143106226dbb5286864780ba903dc4dd eb7a631c98ec2cb245a4eff149fdbd8c eda6e51f2be7974dd42849e84e5df391 3655808e5dd46167956d6870b0f43800 8a4605be74aa9ea9d79846c1fba20a33 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Universidad de Lima |
repository.mail.fl_str_mv |
repositorio@ulima.edu.pe |
_version_ |
1840270944477642752 |
spelling |
Taquía Gutiérrez, José AntonioEspinoza Montalvo, Sergio Ernesto2021-01-22T05:46:58Z2021-01-22T05:46:58Z2020Espinoza Montalvo, S. E. (2020). Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisado [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/12355https://hdl.handle.net/20.500.12724/12355Internal fraud is a big issue for companies, resulting in relevant monetary losses. Several investigations have proposed improvements to the personnel selection process making using of Data Mining. The present work proposes to use past information of applicants to a company to predict if they will commit fraud during their stay. We find models with high precision, but that have a bigger classification error to find the fraud cases. After several experiments, we find around 13 features of this universe that are most relevant to the model. Some of these features match with features mentioned in literature about antisocial disorders. We conclude that there is value in applicant information to predict if they will commit internal fraud during their stay in the company.El fraude interno es un gran problema para las empresas, ocasionando pérdidas monetarias importantes. Diversas investigaciones han propuesto mejoras al proceso de selección de personal utilizando minería de datos. El presente trabajo propone utilizar la información histórica de postulantes a una empresa para predecir si cometerán fraude durante su estadía. Se encuentran modelos con un nivel de precisión alto, pero que tienen un error de clasificación mayor para encontrar los casos de fraude. Se realizaron modelos con los algoritmos de C-45, Random Forest y redes neuronales y se evaluó el aporte de las características al resultado. Utilizando un algoritmo genético se determinó que 13 variables eran las más relevantes para el problema. Algunas de estas variables coinciden con variables mencionadas en la literatura encontrada sobre trastornos antisociales. Se concluye que hay valor en información de postulantes para determinar si cometerán fraude interno durante su estadía en la empresa.Tesisapplication/pdfspaUniversidad de LimaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Repositorio Institucional - UlimaUniversidad de Limareponame:ULIMA-Institucionalinstname:Universidad de Limainstacron:ULIMAData miningFraudEmployee selectionMíneria de datosFraudeSelección de personalhttps://purl.org/pe-repo/ocde/ford#2.02.04Predicción de postulantes que cometerán fraude interno con algoritmo de aprendizaje supervisadoinfo:eu-repo/semantics/bachelorThesisTesisSUNEDUTítulo ProfesionalIngeniería de sistemasUniversidad de Lima. Facultad de Ingeniería y ArquitecturaIngeniero de sistemashttps://orcid.org/0000-0002-1711-66030999437061207672618195https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisTEXTEspinoza_Prediccion-postulantes-cometeran.pdf.txtEspinoza_Prediccion-postulantes-cometeran.pdf.txtExtracted texttext/plain127481https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/4/Espinoza_Prediccion-postulantes-cometeran.pdf.txt143106226dbb5286864780ba903dc4ddMD54THUMBNAILEspinoza_Prediccion-postulantes-cometeran.pdf.jpgEspinoza_Prediccion-postulantes-cometeran.pdf.jpgGenerated Thumbnailimage/jpeg10673https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/5/Espinoza_Prediccion-postulantes-cometeran.pdf.jpgeb7a631c98ec2cb245a4eff149fdbd8cMD55ORIGINALEspinoza_Prediccion-postulantes-cometeran.pdfEspinoza_Prediccion-postulantes-cometeran.pdfTesisapplication/pdf1228097https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/1/Espinoza_Prediccion-postulantes-cometeran.pdfeda6e51f2be7974dd42849e84e5df391MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/2/license_rdf3655808e5dd46167956d6870b0f43800MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ulima.edu.pe/bitstream/20.500.12724/12355/3/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5320.500.12724/12355oai:repositorio.ulima.edu.pe:20.500.12724/123552025-04-16 11:05:59.502Repositorio Universidad de Limarepositorio@ulima.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.11166 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).