Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística

Descripción del Articulo

Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
Detalles Bibliográficos
Autor: Pariona Huarhuachi, Jefferson Clauss
Formato: tesis de grado
Fecha de Publicación:2017
Institución:Universidad Nacional Agraria La Molina
Repositorio:UNALM-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.lamolina.edu.pe:20.500.12996/3329
Enlace del recurso:https://hdl.handle.net/20.500.12996/3329
Nivel de acceso:acceso abierto
Materia:Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
id UNAL_d487239a9c0f99bb7bf9738b4021843f
oai_identifier_str oai:repositorio.lamolina.edu.pe:20.500.12996/3329
network_acronym_str UNAL
network_name_str UNALM-Institucional
repository_id_str 3039
dc.title.none.fl_str_mv Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
spellingShingle Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
Pariona Huarhuachi, Jefferson Clauss
Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
title_short Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_full Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_fullStr Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_full_unstemmed Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
title_sort Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
author Pariona Huarhuachi, Jefferson Clauss
author_facet Pariona Huarhuachi, Jefferson Clauss
author_role author
dc.contributor.advisor.fl_str_mv Salinas Flores, Jesús Walter
dc.contributor.author.fl_str_mv Pariona Huarhuachi, Jefferson Clauss
dc.subject.none.fl_str_mv Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
topic Instituciones financieras
Consumidores
Comportamiento del consumidor
Métodos estadísticos
Modelos matemáticos
Análisis de la regresión
Técnicas de predicción
Evaluación
Perú
Algoritmo Smote
Fuga de clientes
Retención de clientes
http://purl.org/pe-repo/ocde/ford#4.05.00
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#4.05.00
description Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
publishDate 2017
dc.date.accessioned.none.fl_str_mv 2018-05-30T13:05:31Z
dc.date.available.none.fl_str_mv 2018-05-30T13:05:31Z
dc.date.issued.fl_str_mv 2017
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
format bachelorThesis
status_str publishedVersion
dc.identifier.other.none.fl_str_mv E13.P37-T BAN UNALM
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12996/3329
identifier_str_mv E13.P37-T BAN UNALM
url https://hdl.handle.net/20.500.12996/3329
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Nacional Agraria La Molina
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Nacional Agraria La Molina
dc.source.none.fl_str_mv Universidad Nacional Agraria La Molina
Repositorio institucional - UNALM
reponame:UNALM-Institucional
instname:Universidad Nacional Agraria La Molina
instacron:UNALM
instname_str Universidad Nacional Agraria La Molina
instacron_str UNALM
institution UNALM
reponame_str UNALM-Institucional
collection UNALM-Institucional
bitstream.url.fl_str_mv https://repositorio.lamolina.edu.pe/bitstreams/c186ee9d-025d-461c-af78-18dd33435887/download
https://repositorio.lamolina.edu.pe/bitstreams/b1ff7551-5d9e-4bc0-beca-1ac0da9410a6/download
https://repositorio.lamolina.edu.pe/bitstreams/7b69942f-4581-4cfb-b71c-c796be9a69f1/download
https://repositorio.lamolina.edu.pe/bitstreams/a09fc51e-0505-4d37-87e5-09e531f07f5d/download
https://repositorio.lamolina.edu.pe/bitstreams/bd74f0e0-a125-4fa7-abf6-db3bce74a5d1/download
https://repositorio.lamolina.edu.pe/bitstreams/8ecd5341-e1c5-4b7d-992f-cb561d585846/download
https://repositorio.lamolina.edu.pe/bitstreams/00439923-97a0-4245-9d30-2a10159c388a/download
https://repositorio.lamolina.edu.pe/bitstreams/2d0664c4-3ea2-4510-be22-c27abd529533/download
https://repositorio.lamolina.edu.pe/bitstreams/59f336f9-a63b-4ec1-ae27-1b47e24bee8f/download
https://repositorio.lamolina.edu.pe/bitstreams/09fa7d6e-f871-47b4-9e96-a61cb6ebb929/download
bitstream.checksum.fl_str_mv d37bb7c2c0e61ec4e9747e11f366aeca
fa3a3f7be5c5dbabadcfd097bb97e8e0
f41512e50aafd1b4a87c1006ee37b2c1
d7c7d10be4ba2d319b432d34dcc48e24
85fe63c67ab90c79bc55862dd98c392b
b67b547b780638caaf481798ee9f8fa2
85e652b8dfa19b82485c505314e0a902
47c7b06387f71d6f8c1327387b48e15b
e08b0c0ce680677a23bd4688d8e971b0
02975a18ac9730cafb9484a4c8592a4b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Universidad Nacional Agraria La Molina
repository.mail.fl_str_mv dspace@lamolina.edu.pe
_version_ 1843170216796749824
spelling Salinas Flores, Jesús Walter7e7212bd-a8ab-42a0-86b3-9b146adc9cf9-1Pariona Huarhuachi, Jefferson Clauss2018-05-30T13:05:31Z2018-05-30T13:05:31Z2017E13.P37-T BAN UNALMhttps://hdl.handle.net/20.500.12996/3329Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e InformáticaLa retención de clientes ha tomado mucha importancia en los últimos años en las entidades financieras debido a la competencia agresiva por parte del sector, así como la autonomía del cliente en buscar mejores beneficios dentro de todas las ofertas que existen en el mercado bancario lo que se ve reflejado en el aumento de la tasa de clientes fugados. Ante esto se ha visto necesaria la implementación de técnicas estadísticas y/o técnicas de minería de datos, con la finalidad de construir un clasificador predictivo que pueda ayudar a identificar a clientes potenciales a fugarse. En muchos casos cuando se aplican técnicas de clasificación, es común que la clase a predecir ocurra con menor frecuencia que la otra clase: la presencia de datos desbalanceados. Es decir, se tiene menor número de clientes fugados que no fugados, lo cual representa un inconveniente debido a que el clasificador necesita datos suficientes de ambas clases para poder aprender de ellas y así alcanzar una buena predicción. En esta investigación se propone el algoritmo Syntetic Minority Over-sampling Technique (SMOTE) como solución a este problema. SMOTE crea instancias nuevas a partir de un sobre-muestreo de las instancias existentes, llevando la clase minoritaria a un número suficiente para ser considerada balanceada y la clase mayoritaria si es necesaria reducirla mediante sub-muestreo aleatorio. En la presente investigación se validarán tales beneficios con la construcción de un modelo de regresión logística binaria con datos desbalanceados con y sin la aplicación del algoritmo de SMOTE; con el fin predecir la fuga de clientes en una entidad financiera. Se usarán para medir la precisión, la curva ROC y elementos de la comprobación de tabla cruzada como la especificidad y la sensibilidad.Customer retention has taken much importance in recent years in financial institutions due to aggressive competition from the sector, as well as the autonomy of the client to seek better benefits within all offers that exist in the banking market, which is reflected in the increase in the rate of customers escaped. It has been necessary the implementation of statistical or technical techniques of data mining, in order to build a predictive classifier that can help identify potential customers to abscond. In many cases when classification techniques are applied, it is common to predict class to occur less frequently than other kind: the presence of unbalanced data. I.e. you have fewer customers escaped than not escapees, which represents a drawback since the classifier needs sufficient both kinds of data to be able to learn from them and thus achieve a good prediction. This research proposes the Syntetic Minority Over-sampling algorithm Technique (SMOTE) as a solution to this problem. SMOTE creates instances new starting from a sobre-muestreo of them instances existing, carrying the class minority to a number enough to be considered balanced and the class majority if is necessary reduce it by sub-sampling random. In the present study are validated such benefits with the construction of a model of binary logistic regression with unbalanced data with and without the application of the algorithm of SMOTE; in order to predict the flight of clients in a financial institution. They will be used to measure the precision, the ROC curve and elements of table cross as the specificity and sensitivity testing.Tesisapplication/pdfspaUniversidad Nacional Agraria La MolinaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional Agraria La MolinaRepositorio institucional - UNALMreponame:UNALM-Institucionalinstname:Universidad Nacional Agraria La Molinainstacron:UNALMInstituciones financierasConsumidoresComportamiento del consumidorMétodos estadísticosModelos matemáticosAnálisis de la regresiónTécnicas de predicciónEvaluaciónPerúAlgoritmo SmoteFuga de clientesRetención de clienteshttp://purl.org/pe-repo/ocde/ford#4.05.00Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logísticainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionSUNEDUEstadística e InformáticaUniversidad Nacional Agraria La Molina. Facultad de Economía y PlanificaciónIngeniero Estadístico e InformáticoTítulo ProfesionalTHUMBNAILpariona-huarhuachi-jefferson-clauss..pdf.jpgpariona-huarhuachi-jefferson-clauss..pdf.jpgGenerated Thumbnailimage/jpeg3152https://repositorio.lamolina.edu.pe/bitstreams/c186ee9d-025d-461c-af78-18dd33435887/downloadd37bb7c2c0e61ec4e9747e11f366aecaMD59E13-P37-T.pdf.jpgE13-P37-T.pdf.jpgGenerated Thumbnailimage/jpeg3149https://repositorio.lamolina.edu.pe/bitstreams/b1ff7551-5d9e-4bc0-beca-1ac0da9410a6/downloadfa3a3f7be5c5dbabadcfd097bb97e8e0MD510E13-P37-T-resumen.pdf.jpgE13-P37-T-resumen.pdf.jpgGenerated Thumbnailimage/jpeg3450https://repositorio.lamolina.edu.pe/bitstreams/7b69942f-4581-4cfb-b71c-c796be9a69f1/downloadf41512e50aafd1b4a87c1006ee37b2c1MD511ORIGINALpariona-huarhuachi-jefferson-clauss..pdfpariona-huarhuachi-jefferson-clauss..pdfTexto completoapplication/pdf2781532https://repositorio.lamolina.edu.pe/bitstreams/a09fc51e-0505-4d37-87e5-09e531f07f5d/downloadd7c7d10be4ba2d319b432d34dcc48e24MD51E13-P37-T.pdfE13-P37-T.pdfTexto completoapplication/pdf2782208https://repositorio.lamolina.edu.pe/bitstreams/bd74f0e0-a125-4fa7-abf6-db3bce74a5d1/download85fe63c67ab90c79bc55862dd98c392bMD53E13-P37-T-resumen.pdfE13-P37-T-resumen.pdfResumenapplication/pdf71950https://repositorio.lamolina.edu.pe/bitstreams/8ecd5341-e1c5-4b7d-992f-cb561d585846/downloadb67b547b780638caaf481798ee9f8fa2MD58LICENSElicense.txtlicense.txttext/plain; charset=utf-81683https://repositorio.lamolina.edu.pe/bitstreams/00439923-97a0-4245-9d30-2a10159c388a/download85e652b8dfa19b82485c505314e0a902MD52TEXTE13-P37-T.pdf.txtE13-P37-T.pdf.txtExtracted texttext/plain160247https://repositorio.lamolina.edu.pe/bitstreams/2d0664c4-3ea2-4510-be22-c27abd529533/download47c7b06387f71d6f8c1327387b48e15bMD55E13-P37-T-resumen.pdf.txtE13-P37-T-resumen.pdf.txtExtracted texttext/plain4457https://repositorio.lamolina.edu.pe/bitstreams/59f336f9-a63b-4ec1-ae27-1b47e24bee8f/downloade08b0c0ce680677a23bd4688d8e971b0MD56pariona-huarhuachi-jefferson-clauss..pdf.txtpariona-huarhuachi-jefferson-clauss..pdf.txtExtracted texttext/plain160267https://repositorio.lamolina.edu.pe/bitstreams/09fa7d6e-f871-47b4-9e96-a61cb6ebb929/download02975a18ac9730cafb9484a4c8592a4bMD5720.500.12996/3329oai:repositorio.lamolina.edu.pe:20.500.12996/33292025-06-13 16:15:23.095https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.lamolina.edu.peRepositorio Universidad Nacional Agraria La Molinadspace@lamolina.edu.peTGljZW5jaWEgZGUgVXNvCiAKTGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgQWdyYXJpYSBMYSBNb2xpbmEgKFVOQUxNKSwgZGlmdW5kZSBtZWRpYW50ZSBzdSAKcmVwb3NpdG9yaW8gbG9zIHRyYWJham9zIGRlIGludmVzdGlnYWNpw7NuIHByb2R1Y2lkb3MgcG9yIGxvcyBtaWVtYnJvcyBkZSBsYSAKdW5pdmVyc2lkYWQuIEVsIGNvbnRlbmlkbyBkZSBsb3MgZG9jdW1lbnRvcyBkaWdpdGFsZXMgZXMgZGUgYWNjZXNvIGFiaWVydG8gCnBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIAplcyBuZWNlc2FyaW8gcXVlIHNlIGN1bXBsYSBjb24gbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXM6CgpFbCBuZWNlc2FyaW8gcmVjb25vY2ltaWVudG8gZGUgbGEgYXV0b3LDrWEgZGUgbGEgb2JyYSwgaWRlbnRpZmljYW5kbyBvcG9ydHVuYSB5CmNvcnJlY3RhbWVudGUgYSBsYSBwZXJzb25hIHF1ZSBwb3NlYSBsb3MgZGVyZWNob3MgZGUgYXV0b3IuCgpObyBlc3TDoSBwZXJtaXRpZG8gZWwgdXNvIGluZGViaWRvIGRlbCB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuIGNvbiBmaW5lcyBkZSAKbHVjcm8gbyBjdWFscXVpZXIgdGlwbyBkZSBhY3RpdmlkYWQgcXVlIHByb2R1emNhIGdhbmFuY2lhcyBhIGxhcyBwZXJzb25hcyBxdWUgCmxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyB0cmFiYWpvcyBxdWUgc2UgcHJvZHV6Y2FuLCBhIHBhcnRpciBkZSBsYSBvYnJhLCBkZWJlbiBwb3NlZXIgbGEgY2l0YWNpw7NuIApwZXJ0aW5lbnRlIHRhbCBjb21vIGxvIGluZGljYW4gbGFzIE5vcm1hcyBUw6ljbmljYXMgZGVsIElJQ0EgeSBDQVRJRSBkZSAKUmVkYWNjacOzbiBkZSBSZWZlcmVuY2lhcyBCaWJsaW9ncsOhZmljYXMuIENhc28gY29udHJhcmlvLCBzZSBpbmN1cnJpcsOhIGVuIGxhIApmaWd1cmEganVyw61kaWNhIGRlbCBwbGFnaW8uCgpMb3MgZGVyZWNob3MgbW9yYWxlcyBkZWwgYXV0b3Igbm8gc29uIGFmZWN0YWRvcyBwb3IgbGEgcHJlc2VudGUgbGljZW5jaWEgZGUgdXNvLgoKRGVyZWNob3MgZGUgYXV0b3IKCkxhIFVOQUxNIG5vIHBvc2VlIGxvcyBkZXJlY2hvcyBkZSBwcm9waWVkYWQgaW50ZWxlY3R1YWwuIExvcyBkZXJlY2hvcyBkZSBhdXRvciAKc2UgZW5jdWVudHJhbiBwcm90ZWdpZG9zIHBvciBsYSBsZWdpc2xhY2nDs24gcGVydWFuYTogTGV5IHNvYnJlIGVsIERlcmVjaG8gZGUgCkF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgCjE4OcKwIGRlbCBkZWNyZXRvIGxlZ2lzbGF0aXZvIE7CsDgyMiwgTGV5IHNvYnJlIGRlcmVjaG9zIGRlIGF1dG9yIHByb211bGdhZG8gZW4gCjIwMDUgKExleSBOwrAyODUxNyksIERlY3JldG8gTGVnaXNsYXRpdm8gcXVlIGFwcnVlYmEgbGEgbW9kaWZpY2FjacOzbiBkZWwgCkRlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggCihELkwuIE7CsDEwNzYpLgoKT2JzZXJ2YWNpb25lczoKCkluc2NyaWJpcnNlIGVuIENyZWF0aXZlIENvbW1vbnMgQkFOCiAK
score 12.660685
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).