Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados

Descripción del Articulo

En este trabajo de tesis se planteó abordar un enfoque de modelamiento de aprendizaje supervisado de clasificación mediante el modelo de random forest, se utilizó la librería h2o, que permitió tener una comparación de los modelos planteados dando un balanceo de la variable respuesta (target) y sin b...

Descripción completa

Detalles Bibliográficos
Autor: Cárdenas Garro, José Antonio
Formato: tesis de maestría
Fecha de Publicación:2019
Institución:Universidad Ricardo Palma
Repositorio:URP-Tesis
Lenguaje:español
OAI Identifier:oai:repositorio.urp.edu.pe:20.500.14138/2307
Enlace del recurso:https://hdl.handle.net/20.500.14138/2307
Nivel de acceso:acceso abierto
Materia:Aprendizaje supervisado de clasificación
target
random forest
balanceo
AUC
especificidad
sensibilidad
id URPU_a6ca9cdaf1e55193691aed3db3498eef
oai_identifier_str oai:repositorio.urp.edu.pe:20.500.14138/2307
network_acronym_str URPU
network_name_str URP-Tesis
repository_id_str 4057
dc.title.es_ES.fl_str_mv Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
title Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
spellingShingle Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
Cárdenas Garro, José Antonio
Aprendizaje supervisado de clasificación
target
random forest
balanceo
AUC
especificidad
sensibilidad
title_short Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
title_full Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
title_fullStr Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
title_full_unstemmed Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
title_sort Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
author Cárdenas Garro, José Antonio
author_facet Cárdenas Garro, José Antonio
author_role author
dc.contributor.advisor.fl_str_mv Salinas Flores, Jesús
dc.contributor.author.fl_str_mv Cárdenas Garro, José Antonio
dc.subject.es_ES.fl_str_mv Aprendizaje supervisado de clasificación
target
random forest
balanceo
AUC
especificidad
sensibilidad
topic Aprendizaje supervisado de clasificación
target
random forest
balanceo
AUC
especificidad
sensibilidad
description En este trabajo de tesis se planteó abordar un enfoque de modelamiento de aprendizaje supervisado de clasificación mediante el modelo de random forest, se utilizó la librería h2o, que permitió tener una comparación de los modelos planteados dando un balanceo de la variable respuesta (target) y sin balancear y asimismo ejecutar en un menor tiempo estos modelos, puesto que la librería trabaja en procesamiento en paralelo, también realizar el tuning de parámetros del modelo de random forest y compararlos mediante los indicadores de Área Bajo la Curva (AUC), especificidad y sensibilidad. Los datos a utilizar pertenecen a una entidad financiera en el mes de abril del 2018, donde la variable target es la aceptación de una campaña de tarjeta de crédito. Los principales resultados obtenidos fueron para el caso del indicador AUC, los 4 modelos planteados obtuvieron similar indicador alrededor de 0.75, en el indicador de especificidad, los mejores modelos fueron los que trabajaron con datos desbalanceados, en el indicador de sensibilidad, los mejores modelos fueron los que trabajaron con datos balanceados. Dado el interés del negocio se escogió un modelo con datos balanceados y con mejor desempeño en la sensibilidad.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2019-09-05T17:44:06Z
dc.date.available.none.fl_str_mv 2019-09-05T17:44:06Z
dc.date.issued.fl_str_mv 2019
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.14138/2307
url https://hdl.handle.net/20.500.14138/2307
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.es_ES.fl_str_mv Universidad Ricardo Palma
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.es_ES.fl_str_mv Universidad Ricardo Palma - URP
dc.source.none.fl_str_mv reponame:URP-Tesis
instname:Universidad Ricardo Palma
instacron:URP
instname_str Universidad Ricardo Palma
instacron_str URP
institution URP
reponame_str URP-Tesis
collection URP-Tesis
bitstream.url.fl_str_mv https://dspace-urp.metabuscador.org/bitstreams/9efbcac8-4225-42c2-b382-37ddb6bc348e/download
https://dspace-urp.metabuscador.org/bitstreams/f30798db-e44a-4c46-9502-696367083f71/download
https://dspace-urp.metabuscador.org/bitstreams/90a6f397-1306-41e0-9bee-d6202d3a6367/download
https://dspace-urp.metabuscador.org/bitstreams/aa5afc4e-f96b-441c-a178-a3bc01532e54/download
bitstream.checksum.fl_str_mv dea1efaadcd9c802351b442d7aeed480
8a4605be74aa9ea9d79846c1fba20a33
819df6dd61a3707ec82b91ec7fb6ff58
070feb4a21f190aa1edd8efba3fccae5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad Ricardo Palma
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1847339802188316672
spelling Salinas Flores, JesúsCárdenas Garro, José Antonio2019-09-05T17:44:06Z2019-09-05T17:44:06Z2019https://hdl.handle.net/20.500.14138/2307En este trabajo de tesis se planteó abordar un enfoque de modelamiento de aprendizaje supervisado de clasificación mediante el modelo de random forest, se utilizó la librería h2o, que permitió tener una comparación de los modelos planteados dando un balanceo de la variable respuesta (target) y sin balancear y asimismo ejecutar en un menor tiempo estos modelos, puesto que la librería trabaja en procesamiento en paralelo, también realizar el tuning de parámetros del modelo de random forest y compararlos mediante los indicadores de Área Bajo la Curva (AUC), especificidad y sensibilidad. Los datos a utilizar pertenecen a una entidad financiera en el mes de abril del 2018, donde la variable target es la aceptación de una campaña de tarjeta de crédito. Los principales resultados obtenidos fueron para el caso del indicador AUC, los 4 modelos planteados obtuvieron similar indicador alrededor de 0.75, en el indicador de especificidad, los mejores modelos fueron los que trabajaron con datos desbalanceados, en el indicador de sensibilidad, los mejores modelos fueron los que trabajaron con datos balanceados. Dado el interés del negocio se escogió un modelo con datos balanceados y con mejor desempeño en la sensibilidad.Tesisapplication/pdfspaUniversidad Ricardo PalmaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Ricardo Palma - URPreponame:URP-Tesisinstname:Universidad Ricardo Palmainstacron:URPAprendizaje supervisado de clasificacióntargetrandom forestbalanceoAUCespecificidadsensibilidadClasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceadosinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionSUNEDUMaestría en Ciencia de los DatosUniversidad Ricardo Palma. Escuela de PosgradoMaestríaMaestría en Ciencia de los DatosMaestro en Ciencia de los DatosPublicationORIGINALT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdfT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdfapplication/pdf1320720https://dspace-urp.metabuscador.org/bitstreams/9efbcac8-4225-42c2-b382-37ddb6bc348e/downloaddea1efaadcd9c802351b442d7aeed480MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace-urp.metabuscador.org/bitstreams/f30798db-e44a-4c46-9502-696367083f71/download8a4605be74aa9ea9d79846c1fba20a33MD52TEXTT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.txtT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.txtExtracted texttext/plain88739https://dspace-urp.metabuscador.org/bitstreams/90a6f397-1306-41e0-9bee-d6202d3a6367/download819df6dd61a3707ec82b91ec7fb6ff58MD53THUMBNAILT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.jpgT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.jpgGenerated Thumbnailimage/jpeg12301https://dspace-urp.metabuscador.org/bitstreams/aa5afc4e-f96b-441c-a178-a3bc01532e54/download070feb4a21f190aa1edd8efba3fccae5MD5420.500.14138/2307oai:dspace-urp.metabuscador.org:20.500.14138/23072024-11-24 10:08:34.985https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://dspace-urp.metabuscador.orgRepositorio Institucional de la Universidad Ricardo Palmabdigital@metabiblioteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 12.834301
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).