Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados
Descripción del Articulo
En este trabajo de tesis se planteó abordar un enfoque de modelamiento de aprendizaje supervisado de clasificación mediante el modelo de random forest, se utilizó la librería h2o, que permitió tener una comparación de los modelos planteados dando un balanceo de la variable respuesta (target) y sin b...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2019 |
| Institución: | Universidad Ricardo Palma |
| Repositorio: | URP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.urp.edu.pe:20.500.14138/2307 |
| Enlace del recurso: | https://hdl.handle.net/20.500.14138/2307 |
| Nivel de acceso: | acceso abierto |
| Materia: | Aprendizaje supervisado de clasificación target random forest balanceo AUC especificidad sensibilidad |
| id |
URPU_a6ca9cdaf1e55193691aed3db3498eef |
|---|---|
| oai_identifier_str |
oai:repositorio.urp.edu.pe:20.500.14138/2307 |
| network_acronym_str |
URPU |
| network_name_str |
URP-Tesis |
| repository_id_str |
4057 |
| dc.title.es_ES.fl_str_mv |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| title |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| spellingShingle |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados Cárdenas Garro, José Antonio Aprendizaje supervisado de clasificación target random forest balanceo AUC especificidad sensibilidad |
| title_short |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| title_full |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| title_fullStr |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| title_full_unstemmed |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| title_sort |
Clasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceados |
| author |
Cárdenas Garro, José Antonio |
| author_facet |
Cárdenas Garro, José Antonio |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Salinas Flores, Jesús |
| dc.contributor.author.fl_str_mv |
Cárdenas Garro, José Antonio |
| dc.subject.es_ES.fl_str_mv |
Aprendizaje supervisado de clasificación target random forest balanceo AUC especificidad sensibilidad |
| topic |
Aprendizaje supervisado de clasificación target random forest balanceo AUC especificidad sensibilidad |
| description |
En este trabajo de tesis se planteó abordar un enfoque de modelamiento de aprendizaje supervisado de clasificación mediante el modelo de random forest, se utilizó la librería h2o, que permitió tener una comparación de los modelos planteados dando un balanceo de la variable respuesta (target) y sin balancear y asimismo ejecutar en un menor tiempo estos modelos, puesto que la librería trabaja en procesamiento en paralelo, también realizar el tuning de parámetros del modelo de random forest y compararlos mediante los indicadores de Área Bajo la Curva (AUC), especificidad y sensibilidad. Los datos a utilizar pertenecen a una entidad financiera en el mes de abril del 2018, donde la variable target es la aceptación de una campaña de tarjeta de crédito. Los principales resultados obtenidos fueron para el caso del indicador AUC, los 4 modelos planteados obtuvieron similar indicador alrededor de 0.75, en el indicador de especificidad, los mejores modelos fueron los que trabajaron con datos desbalanceados, en el indicador de sensibilidad, los mejores modelos fueron los que trabajaron con datos balanceados. Dado el interés del negocio se escogió un modelo con datos balanceados y con mejor desempeño en la sensibilidad. |
| publishDate |
2019 |
| dc.date.accessioned.none.fl_str_mv |
2019-09-05T17:44:06Z |
| dc.date.available.none.fl_str_mv |
2019-09-05T17:44:06Z |
| dc.date.issued.fl_str_mv |
2019 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.14138/2307 |
| url |
https://hdl.handle.net/20.500.14138/2307 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.es_ES.fl_str_mv |
Universidad Ricardo Palma |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.es_ES.fl_str_mv |
Universidad Ricardo Palma - URP |
| dc.source.none.fl_str_mv |
reponame:URP-Tesis instname:Universidad Ricardo Palma instacron:URP |
| instname_str |
Universidad Ricardo Palma |
| instacron_str |
URP |
| institution |
URP |
| reponame_str |
URP-Tesis |
| collection |
URP-Tesis |
| bitstream.url.fl_str_mv |
https://dspace-urp.metabuscador.org/bitstreams/9efbcac8-4225-42c2-b382-37ddb6bc348e/download https://dspace-urp.metabuscador.org/bitstreams/f30798db-e44a-4c46-9502-696367083f71/download https://dspace-urp.metabuscador.org/bitstreams/90a6f397-1306-41e0-9bee-d6202d3a6367/download https://dspace-urp.metabuscador.org/bitstreams/aa5afc4e-f96b-441c-a178-a3bc01532e54/download |
| bitstream.checksum.fl_str_mv |
dea1efaadcd9c802351b442d7aeed480 8a4605be74aa9ea9d79846c1fba20a33 819df6dd61a3707ec82b91ec7fb6ff58 070feb4a21f190aa1edd8efba3fccae5 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad Ricardo Palma |
| repository.mail.fl_str_mv |
bdigital@metabiblioteca.com |
| _version_ |
1847339802188316672 |
| spelling |
Salinas Flores, JesúsCárdenas Garro, José Antonio2019-09-05T17:44:06Z2019-09-05T17:44:06Z2019https://hdl.handle.net/20.500.14138/2307En este trabajo de tesis se planteó abordar un enfoque de modelamiento de aprendizaje supervisado de clasificación mediante el modelo de random forest, se utilizó la librería h2o, que permitió tener una comparación de los modelos planteados dando un balanceo de la variable respuesta (target) y sin balancear y asimismo ejecutar en un menor tiempo estos modelos, puesto que la librería trabaja en procesamiento en paralelo, también realizar el tuning de parámetros del modelo de random forest y compararlos mediante los indicadores de Área Bajo la Curva (AUC), especificidad y sensibilidad. Los datos a utilizar pertenecen a una entidad financiera en el mes de abril del 2018, donde la variable target es la aceptación de una campaña de tarjeta de crédito. Los principales resultados obtenidos fueron para el caso del indicador AUC, los 4 modelos planteados obtuvieron similar indicador alrededor de 0.75, en el indicador de especificidad, los mejores modelos fueron los que trabajaron con datos desbalanceados, en el indicador de sensibilidad, los mejores modelos fueron los que trabajaron con datos balanceados. Dado el interés del negocio se escogió un modelo con datos balanceados y con mejor desempeño en la sensibilidad.Tesisapplication/pdfspaUniversidad Ricardo PalmaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Ricardo Palma - URPreponame:URP-Tesisinstname:Universidad Ricardo Palmainstacron:URPAprendizaje supervisado de clasificacióntargetrandom forestbalanceoAUCespecificidadsensibilidadClasificación de aceptación de campañas para una entidad financiera, usando random forest con datos balanceados y datos no balanceadosinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionSUNEDUMaestría en Ciencia de los DatosUniversidad Ricardo Palma. Escuela de PosgradoMaestríaMaestría en Ciencia de los DatosMaestro en Ciencia de los DatosPublicationORIGINALT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdfT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdfapplication/pdf1320720https://dspace-urp.metabuscador.org/bitstreams/9efbcac8-4225-42c2-b382-37ddb6bc348e/downloaddea1efaadcd9c802351b442d7aeed480MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace-urp.metabuscador.org/bitstreams/f30798db-e44a-4c46-9502-696367083f71/download8a4605be74aa9ea9d79846c1fba20a33MD52TEXTT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.txtT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.txtExtracted texttext/plain88739https://dspace-urp.metabuscador.org/bitstreams/90a6f397-1306-41e0-9bee-d6202d3a6367/download819df6dd61a3707ec82b91ec7fb6ff58MD53THUMBNAILT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.jpgT030_47199993_M CARDENAS GARRO JOSÉ ANTONIO.pdf.jpgGenerated Thumbnailimage/jpeg12301https://dspace-urp.metabuscador.org/bitstreams/aa5afc4e-f96b-441c-a178-a3bc01532e54/download070feb4a21f190aa1edd8efba3fccae5MD5420.500.14138/2307oai:dspace-urp.metabuscador.org:20.500.14138/23072024-11-24 10:08:34.985https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://dspace-urp.metabuscador.orgRepositorio Institucional de la Universidad Ricardo Palmabdigital@metabiblioteca.comTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
12.834301 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).