Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística
Descripción del Articulo
Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2017 |
Institución: | Universidad Nacional Agraria La Molina |
Repositorio: | UNALM-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.lamolina.edu.pe:20.500.12996/3329 |
Enlace del recurso: | https://hdl.handle.net/20.500.12996/3329 |
Nivel de acceso: | acceso abierto |
Materia: | Instituciones financieras Consumidores Comportamiento del consumidor Métodos estadísticos Modelos matemáticos Análisis de la regresión Técnicas de predicción Evaluación Perú Algoritmo Smote Fuga de clientes Retención de clientes http://purl.org/pe-repo/ocde/ford#4.05.00 |
id |
UNAL_d487239a9c0f99bb7bf9738b4021843f |
---|---|
oai_identifier_str |
oai:repositorio.lamolina.edu.pe:20.500.12996/3329 |
network_acronym_str |
UNAL |
network_name_str |
UNALM-Institucional |
repository_id_str |
3039 |
dc.title.none.fl_str_mv |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
title |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
spellingShingle |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística Pariona Huarhuachi, Jefferson Clauss Instituciones financieras Consumidores Comportamiento del consumidor Métodos estadísticos Modelos matemáticos Análisis de la regresión Técnicas de predicción Evaluación Perú Algoritmo Smote Fuga de clientes Retención de clientes http://purl.org/pe-repo/ocde/ford#4.05.00 |
title_short |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
title_full |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
title_fullStr |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
title_full_unstemmed |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
title_sort |
Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logística |
author |
Pariona Huarhuachi, Jefferson Clauss |
author_facet |
Pariona Huarhuachi, Jefferson Clauss |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Salinas Flores, Jesús Walter |
dc.contributor.author.fl_str_mv |
Pariona Huarhuachi, Jefferson Clauss |
dc.subject.none.fl_str_mv |
Instituciones financieras Consumidores Comportamiento del consumidor Métodos estadísticos Modelos matemáticos Análisis de la regresión Técnicas de predicción Evaluación Perú Algoritmo Smote Fuga de clientes Retención de clientes |
topic |
Instituciones financieras Consumidores Comportamiento del consumidor Métodos estadísticos Modelos matemáticos Análisis de la regresión Técnicas de predicción Evaluación Perú Algoritmo Smote Fuga de clientes Retención de clientes http://purl.org/pe-repo/ocde/ford#4.05.00 |
dc.subject.ocde.none.fl_str_mv |
http://purl.org/pe-repo/ocde/ford#4.05.00 |
description |
Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e Informática |
publishDate |
2017 |
dc.date.accessioned.none.fl_str_mv |
2018-05-30T13:05:31Z |
dc.date.available.none.fl_str_mv |
2018-05-30T13:05:31Z |
dc.date.issued.fl_str_mv |
2017 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.other.none.fl_str_mv |
E13.P37-T BAN UNALM |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12996/3329 |
identifier_str_mv |
E13.P37-T BAN UNALM |
url |
https://hdl.handle.net/20.500.12996/3329 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidad Nacional Agraria La Molina |
dc.publisher.country.none.fl_str_mv |
PE |
publisher.none.fl_str_mv |
Universidad Nacional Agraria La Molina |
dc.source.none.fl_str_mv |
Universidad Nacional Agraria La Molina Repositorio institucional - UNALM reponame:UNALM-Institucional instname:Universidad Nacional Agraria La Molina instacron:UNALM |
instname_str |
Universidad Nacional Agraria La Molina |
instacron_str |
UNALM |
institution |
UNALM |
reponame_str |
UNALM-Institucional |
collection |
UNALM-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.lamolina.edu.pe/bitstreams/c186ee9d-025d-461c-af78-18dd33435887/download https://repositorio.lamolina.edu.pe/bitstreams/b1ff7551-5d9e-4bc0-beca-1ac0da9410a6/download https://repositorio.lamolina.edu.pe/bitstreams/7b69942f-4581-4cfb-b71c-c796be9a69f1/download https://repositorio.lamolina.edu.pe/bitstreams/a09fc51e-0505-4d37-87e5-09e531f07f5d/download https://repositorio.lamolina.edu.pe/bitstreams/bd74f0e0-a125-4fa7-abf6-db3bce74a5d1/download https://repositorio.lamolina.edu.pe/bitstreams/8ecd5341-e1c5-4b7d-992f-cb561d585846/download https://repositorio.lamolina.edu.pe/bitstreams/00439923-97a0-4245-9d30-2a10159c388a/download https://repositorio.lamolina.edu.pe/bitstreams/2d0664c4-3ea2-4510-be22-c27abd529533/download https://repositorio.lamolina.edu.pe/bitstreams/59f336f9-a63b-4ec1-ae27-1b47e24bee8f/download https://repositorio.lamolina.edu.pe/bitstreams/09fa7d6e-f871-47b4-9e96-a61cb6ebb929/download |
bitstream.checksum.fl_str_mv |
d37bb7c2c0e61ec4e9747e11f366aeca fa3a3f7be5c5dbabadcfd097bb97e8e0 f41512e50aafd1b4a87c1006ee37b2c1 d7c7d10be4ba2d319b432d34dcc48e24 85fe63c67ab90c79bc55862dd98c392b b67b547b780638caaf481798ee9f8fa2 85e652b8dfa19b82485c505314e0a902 47c7b06387f71d6f8c1327387b48e15b e08b0c0ce680677a23bd4688d8e971b0 02975a18ac9730cafb9484a4c8592a4b |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Universidad Nacional Agraria La Molina |
repository.mail.fl_str_mv |
dspace@lamolina.edu.pe |
_version_ |
1843170216796749824 |
spelling |
Salinas Flores, Jesús Walter7e7212bd-a8ab-42a0-86b3-9b146adc9cf9-1Pariona Huarhuachi, Jefferson Clauss2018-05-30T13:05:31Z2018-05-30T13:05:31Z2017E13.P37-T BAN UNALMhttps://hdl.handle.net/20.500.12996/3329Universidad Nacional Agraria La Molina. Facultad de Economía y Planificación. Departamento Académico de Estadística e InformáticaLa retención de clientes ha tomado mucha importancia en los últimos años en las entidades financieras debido a la competencia agresiva por parte del sector, así como la autonomía del cliente en buscar mejores beneficios dentro de todas las ofertas que existen en el mercado bancario lo que se ve reflejado en el aumento de la tasa de clientes fugados. Ante esto se ha visto necesaria la implementación de técnicas estadísticas y/o técnicas de minería de datos, con la finalidad de construir un clasificador predictivo que pueda ayudar a identificar a clientes potenciales a fugarse. En muchos casos cuando se aplican técnicas de clasificación, es común que la clase a predecir ocurra con menor frecuencia que la otra clase: la presencia de datos desbalanceados. Es decir, se tiene menor número de clientes fugados que no fugados, lo cual representa un inconveniente debido a que el clasificador necesita datos suficientes de ambas clases para poder aprender de ellas y así alcanzar una buena predicción. En esta investigación se propone el algoritmo Syntetic Minority Over-sampling Technique (SMOTE) como solución a este problema. SMOTE crea instancias nuevas a partir de un sobre-muestreo de las instancias existentes, llevando la clase minoritaria a un número suficiente para ser considerada balanceada y la clase mayoritaria si es necesaria reducirla mediante sub-muestreo aleatorio. En la presente investigación se validarán tales beneficios con la construcción de un modelo de regresión logística binaria con datos desbalanceados con y sin la aplicación del algoritmo de SMOTE; con el fin predecir la fuga de clientes en una entidad financiera. Se usarán para medir la precisión, la curva ROC y elementos de la comprobación de tabla cruzada como la especificidad y la sensibilidad.Customer retention has taken much importance in recent years in financial institutions due to aggressive competition from the sector, as well as the autonomy of the client to seek better benefits within all offers that exist in the banking market, which is reflected in the increase in the rate of customers escaped. It has been necessary the implementation of statistical or technical techniques of data mining, in order to build a predictive classifier that can help identify potential customers to abscond. In many cases when classification techniques are applied, it is common to predict class to occur less frequently than other kind: the presence of unbalanced data. I.e. you have fewer customers escaped than not escapees, which represents a drawback since the classifier needs sufficient both kinds of data to be able to learn from them and thus achieve a good prediction. This research proposes the Syntetic Minority Over-sampling algorithm Technique (SMOTE) as a solution to this problem. SMOTE creates instances new starting from a sobre-muestreo of them instances existing, carrying the class minority to a number enough to be considered balanced and the class majority if is necessary reduce it by sub-sampling random. In the present study are validated such benefits with the construction of a model of binary logistic regression with unbalanced data with and without the application of the algorithm of SMOTE; in order to predict the flight of clients in a financial institution. They will be used to measure the precision, the ROC curve and elements of table cross as the specificity and sensitivity testing.Tesisapplication/pdfspaUniversidad Nacional Agraria La MolinaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional Agraria La MolinaRepositorio institucional - UNALMreponame:UNALM-Institucionalinstname:Universidad Nacional Agraria La Molinainstacron:UNALMInstituciones financierasConsumidoresComportamiento del consumidorMétodos estadísticosModelos matemáticosAnálisis de la regresiónTécnicas de predicciónEvaluaciónPerúAlgoritmo SmoteFuga de clientesRetención de clienteshttp://purl.org/pe-repo/ocde/ford#4.05.00Clasificación de fuga de clientes en una entidad financiera utilizando el algoritmo Smote para datos desbalanceados en una regresión logísticainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionSUNEDUEstadística e InformáticaUniversidad Nacional Agraria La Molina. Facultad de Economía y PlanificaciónIngeniero Estadístico e InformáticoTítulo ProfesionalTHUMBNAILpariona-huarhuachi-jefferson-clauss..pdf.jpgpariona-huarhuachi-jefferson-clauss..pdf.jpgGenerated Thumbnailimage/jpeg3152https://repositorio.lamolina.edu.pe/bitstreams/c186ee9d-025d-461c-af78-18dd33435887/downloadd37bb7c2c0e61ec4e9747e11f366aecaMD59E13-P37-T.pdf.jpgE13-P37-T.pdf.jpgGenerated Thumbnailimage/jpeg3149https://repositorio.lamolina.edu.pe/bitstreams/b1ff7551-5d9e-4bc0-beca-1ac0da9410a6/downloadfa3a3f7be5c5dbabadcfd097bb97e8e0MD510E13-P37-T-resumen.pdf.jpgE13-P37-T-resumen.pdf.jpgGenerated Thumbnailimage/jpeg3450https://repositorio.lamolina.edu.pe/bitstreams/7b69942f-4581-4cfb-b71c-c796be9a69f1/downloadf41512e50aafd1b4a87c1006ee37b2c1MD511ORIGINALpariona-huarhuachi-jefferson-clauss..pdfpariona-huarhuachi-jefferson-clauss..pdfTexto completoapplication/pdf2781532https://repositorio.lamolina.edu.pe/bitstreams/a09fc51e-0505-4d37-87e5-09e531f07f5d/downloadd7c7d10be4ba2d319b432d34dcc48e24MD51E13-P37-T.pdfE13-P37-T.pdfTexto completoapplication/pdf2782208https://repositorio.lamolina.edu.pe/bitstreams/bd74f0e0-a125-4fa7-abf6-db3bce74a5d1/download85fe63c67ab90c79bc55862dd98c392bMD53E13-P37-T-resumen.pdfE13-P37-T-resumen.pdfResumenapplication/pdf71950https://repositorio.lamolina.edu.pe/bitstreams/8ecd5341-e1c5-4b7d-992f-cb561d585846/downloadb67b547b780638caaf481798ee9f8fa2MD58LICENSElicense.txtlicense.txttext/plain; charset=utf-81683https://repositorio.lamolina.edu.pe/bitstreams/00439923-97a0-4245-9d30-2a10159c388a/download85e652b8dfa19b82485c505314e0a902MD52TEXTE13-P37-T.pdf.txtE13-P37-T.pdf.txtExtracted texttext/plain160247https://repositorio.lamolina.edu.pe/bitstreams/2d0664c4-3ea2-4510-be22-c27abd529533/download47c7b06387f71d6f8c1327387b48e15bMD55E13-P37-T-resumen.pdf.txtE13-P37-T-resumen.pdf.txtExtracted texttext/plain4457https://repositorio.lamolina.edu.pe/bitstreams/59f336f9-a63b-4ec1-ae27-1b47e24bee8f/downloade08b0c0ce680677a23bd4688d8e971b0MD56pariona-huarhuachi-jefferson-clauss..pdf.txtpariona-huarhuachi-jefferson-clauss..pdf.txtExtracted texttext/plain160267https://repositorio.lamolina.edu.pe/bitstreams/09fa7d6e-f871-47b4-9e96-a61cb6ebb929/download02975a18ac9730cafb9484a4c8592a4bMD5720.500.12996/3329oai:repositorio.lamolina.edu.pe:20.500.12996/33292025-06-13 16:15:23.095https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.lamolina.edu.peRepositorio Universidad Nacional Agraria La Molinadspace@lamolina.edu.peTGljZW5jaWEgZGUgVXNvCiAKTGEgVW5pdmVyc2lkYWQgTmFjaW9uYWwgQWdyYXJpYSBMYSBNb2xpbmEgKFVOQUxNKSwgZGlmdW5kZSBtZWRpYW50ZSBzdSAKcmVwb3NpdG9yaW8gbG9zIHRyYWJham9zIGRlIGludmVzdGlnYWNpw7NuIHByb2R1Y2lkb3MgcG9yIGxvcyBtaWVtYnJvcyBkZSBsYSAKdW5pdmVyc2lkYWQuIEVsIGNvbnRlbmlkbyBkZSBsb3MgZG9jdW1lbnRvcyBkaWdpdGFsZXMgZXMgZGUgYWNjZXNvIGFiaWVydG8gCnBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIAplcyBuZWNlc2FyaW8gcXVlIHNlIGN1bXBsYSBjb24gbGFzIHNpZ3VpZW50ZXMgY29uZGljaW9uZXM6CgpFbCBuZWNlc2FyaW8gcmVjb25vY2ltaWVudG8gZGUgbGEgYXV0b3LDrWEgZGUgbGEgb2JyYSwgaWRlbnRpZmljYW5kbyBvcG9ydHVuYSB5CmNvcnJlY3RhbWVudGUgYSBsYSBwZXJzb25hIHF1ZSBwb3NlYSBsb3MgZGVyZWNob3MgZGUgYXV0b3IuCgpObyBlc3TDoSBwZXJtaXRpZG8gZWwgdXNvIGluZGViaWRvIGRlbCB0cmFiYWpvIGRlIGludmVzdGlnYWNpw7NuIGNvbiBmaW5lcyBkZSAKbHVjcm8gbyBjdWFscXVpZXIgdGlwbyBkZSBhY3RpdmlkYWQgcXVlIHByb2R1emNhIGdhbmFuY2lhcyBhIGxhcyBwZXJzb25hcyBxdWUgCmxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyB0cmFiYWpvcyBxdWUgc2UgcHJvZHV6Y2FuLCBhIHBhcnRpciBkZSBsYSBvYnJhLCBkZWJlbiBwb3NlZXIgbGEgY2l0YWNpw7NuIApwZXJ0aW5lbnRlIHRhbCBjb21vIGxvIGluZGljYW4gbGFzIE5vcm1hcyBUw6ljbmljYXMgZGVsIElJQ0EgeSBDQVRJRSBkZSAKUmVkYWNjacOzbiBkZSBSZWZlcmVuY2lhcyBCaWJsaW9ncsOhZmljYXMuIENhc28gY29udHJhcmlvLCBzZSBpbmN1cnJpcsOhIGVuIGxhIApmaWd1cmEganVyw61kaWNhIGRlbCBwbGFnaW8uCgpMb3MgZGVyZWNob3MgbW9yYWxlcyBkZWwgYXV0b3Igbm8gc29uIGFmZWN0YWRvcyBwb3IgbGEgcHJlc2VudGUgbGljZW5jaWEgZGUgdXNvLgoKRGVyZWNob3MgZGUgYXV0b3IKCkxhIFVOQUxNIG5vIHBvc2VlIGxvcyBkZXJlY2hvcyBkZSBwcm9waWVkYWQgaW50ZWxlY3R1YWwuIExvcyBkZXJlY2hvcyBkZSBhdXRvciAKc2UgZW5jdWVudHJhbiBwcm90ZWdpZG9zIHBvciBsYSBsZWdpc2xhY2nDs24gcGVydWFuYTogTGV5IHNvYnJlIGVsIERlcmVjaG8gZGUgCkF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgCjE4OcKwIGRlbCBkZWNyZXRvIGxlZ2lzbGF0aXZvIE7CsDgyMiwgTGV5IHNvYnJlIGRlcmVjaG9zIGRlIGF1dG9yIHByb211bGdhZG8gZW4gCjIwMDUgKExleSBOwrAyODUxNyksIERlY3JldG8gTGVnaXNsYXRpdm8gcXVlIGFwcnVlYmEgbGEgbW9kaWZpY2FjacOzbiBkZWwgCkRlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggCihELkwuIE7CsDEwNzYpLgoKT2JzZXJ2YWNpb25lczoKCkluc2NyaWJpcnNlIGVuIENyZWF0aXZlIENvbW1vbnMgQkFOCiAK |
score |
12.660685 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).