Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero
Descripción del Articulo
El presente informe se fundamenta en la necesidad de definir un proceso de validación robusta de modelos estadísticos que utilizan la técnica de aprendizaje XGBoost. Para este fin se presenta la propuesta del diseño de validación considerando una aplicación de la técnica en la predicción de ingresos...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2022 |
| Institución: | Universidad Nacional de Ingeniería |
| Repositorio: | UNI-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.uni.edu.pe:20.500.14076/29064 |
| Enlace del recurso: | http://hdl.handle.net/20.500.14076/29064 |
| Nivel de acceso: | acceso abierto |
| Materia: | Machine learning Modelos Predictivos Aprendizaje automático Análisis estadístico Sistema financiero XGBoost https://purl.org/pe-repo/ocde/ford#1.01.03 |
| id |
UUNI_ebc0a2ff1ea3622df5bd66cceee96c79 |
|---|---|
| oai_identifier_str |
oai:cybertesis.uni.edu.pe:20.500.14076/29064 |
| network_acronym_str |
UUNI |
| network_name_str |
UNI-Tesis |
| repository_id_str |
1534 |
| dc.title.es.fl_str_mv |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| title |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| spellingShingle |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero Miranda Vásquez, Isbella Merici Machine learning Modelos Predictivos Aprendizaje automático Análisis estadístico Sistema financiero XGBoost https://purl.org/pe-repo/ocde/ford#1.01.03 |
| title_short |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| title_full |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| title_fullStr |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| title_full_unstemmed |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| title_sort |
Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financiero |
| dc.creator.none.fl_str_mv |
Miranda Vásquez, Isbella Merici |
| author |
Miranda Vásquez, Isbella Merici |
| author_facet |
Miranda Vásquez, Isbella Merici |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Huamanchumo De la Cuba, Luis Emilio |
| dc.contributor.author.fl_str_mv |
Miranda Vásquez, Isbella Merici |
| dc.subject.es.fl_str_mv |
Machine learning Modelos Predictivos Aprendizaje automático Análisis estadístico Sistema financiero XGBoost |
| topic |
Machine learning Modelos Predictivos Aprendizaje automático Análisis estadístico Sistema financiero XGBoost https://purl.org/pe-repo/ocde/ford#1.01.03 |
| dc.subject.ocde.es.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.01.03 |
| description |
El presente informe se fundamenta en la necesidad de definir un proceso de validación robusta de modelos estadísticos que utilizan la técnica de aprendizaje XGBoost. Para este fin se presenta la propuesta del diseño de validación considerando una aplicación de la técnica en la predicción de ingresos de personas naturales que tienen información limitada en el sistema financiero. El objetivo de la validación de modelos es brindar la seguridad que todas las fases de construcción del modelo se han desarrollado de forma óptima considerando los criterios estadísticos necesarios para obtener un performance del modelo aceptable tal que el modelo pueda ser implementado en la gestión del negocio. A lo largo del documento se presentará y revisará el esquema completo de validación, que incluye desde la definición de la metodología, análisis y extracción de datos, proceso de modelado hasta la revisión de la completitud de la documentación que facilitará la implementación del modelo para la puesta en producción. Cumplir con los requisitos mínimos de la validación es necesario para dar luz verde a la salida a producción del modelo. Finalmente, se podrá observar cómo contribuye este nuevo diseño de validación en el desempeño del modelo final y la correcta integración a la gestión. |
| publishDate |
2022 |
| dc.date.accessioned.none.fl_str_mv |
2026-03-18T18:51:17Z |
| dc.date.available.none.fl_str_mv |
2026-03-18T18:51:17Z |
| dc.date.issued.fl_str_mv |
2022 |
| dc.type.es.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.14076/29064 |
| url |
http://hdl.handle.net/20.500.14076/29064 |
| dc.language.iso.es.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es.fl_str_mv |
application/pdf |
| dc.publisher.es.fl_str_mv |
Universidad Nacional de Ingeniería |
| dc.publisher.country.es.fl_str_mv |
PE |
| dc.source.es.fl_str_mv |
Universidad Nacional de Ingeniería Repositorio Institucional - UNI |
| dc.source.none.fl_str_mv |
reponame:UNI-Tesis instname:Universidad Nacional de Ingeniería instacron:UNI |
| instname_str |
Universidad Nacional de Ingeniería |
| instacron_str |
UNI |
| institution |
UNI |
| reponame_str |
UNI-Tesis |
| collection |
UNI-Tesis |
| bitstream.url.fl_str_mv |
http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/6/miranda_vi.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/7/miranda_vi%28acta%29.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/8/informe_de_similitud.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/9/carta_de_autorizaci%c3%b3n.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/5/license.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/1/miranda_vi.pdf http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/2/miranda_vi%28acta%29.pdf http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/3/informe_de_similitud.pdf http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/4/carta_de_autorizaci%c3%b3n.pdf |
| bitstream.checksum.fl_str_mv |
4aab210035f5bd72725c8434114d2119 c35e3ef4f18010dab79abb1ec2ebbc9f a4c7552bbfdcff057ab624b7dba23bdf 8703a6110132e4e2e3bab43bad761e52 8a4605be74aa9ea9d79846c1fba20a33 c2967ae40326ed4b45676727a0d54e57 4fe3f1c402ce3d1c5b055c605f31a208 42754d34fb8b6be8441e1adc738670ca ade30662490781789170cc7879cb26ba |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional Universidad Nacional de Ingeniería |
| repository.mail.fl_str_mv |
repositorio@uni.edu.pe |
| _version_ |
1861013430057566208 |
| spelling |
Huamanchumo De la Cuba, Luis EmilioMiranda Vásquez, Isbella MericiMiranda Vásquez, Isbella Merici2026-03-18T18:51:17Z2026-03-18T18:51:17Z2022http://hdl.handle.net/20.500.14076/29064El presente informe se fundamenta en la necesidad de definir un proceso de validación robusta de modelos estadísticos que utilizan la técnica de aprendizaje XGBoost. Para este fin se presenta la propuesta del diseño de validación considerando una aplicación de la técnica en la predicción de ingresos de personas naturales que tienen información limitada en el sistema financiero. El objetivo de la validación de modelos es brindar la seguridad que todas las fases de construcción del modelo se han desarrollado de forma óptima considerando los criterios estadísticos necesarios para obtener un performance del modelo aceptable tal que el modelo pueda ser implementado en la gestión del negocio. A lo largo del documento se presentará y revisará el esquema completo de validación, que incluye desde la definición de la metodología, análisis y extracción de datos, proceso de modelado hasta la revisión de la completitud de la documentación que facilitará la implementación del modelo para la puesta en producción. Cumplir con los requisitos mínimos de la validación es necesario para dar luz verde a la salida a producción del modelo. Finalmente, se podrá observar cómo contribuye este nuevo diseño de validación en el desempeño del modelo final y la correcta integración a la gestión.This report is based on the needed to define a robust validation process for statistical models using the XGBoost learning technique. For this purpose, the validation design proposal is presented considering an application of the technique in the prediction of income of individuals who have limited information in the financial system. The objective of model validation is to provide assurance that all phases of model construction have been optimally developed considering the necessary statistical criteria to obtain acceptable model performance such that the model can be implemented in business management. Throughout the document, the complete validation scheme will be presented and reviewed, which includes everything from the definition of the methodology, data analysis and extraction, the modeling process to the review of the completeness of the documentation that will facilitate the implementation of the model for the put into production. Meeting the minimum validation requirements is necessary to give the green light for the model to go into production. Finally, is possible to observe how this new validation design contributes to the performance of the final model and the correct integration to management. .Submitted by Quispe Rabanal Flavio (flaviofime@hotmail.com) on 2026-03-18T18:51:17Z No. of bitstreams: 4 miranda_vi.pdf: 1656721 bytes, checksum: c2967ae40326ed4b45676727a0d54e57 (MD5) miranda_vi(acta).pdf: 355824 bytes, checksum: 4fe3f1c402ce3d1c5b055c605f31a208 (MD5) informe_de_similitud.pdf: 440578 bytes, checksum: 42754d34fb8b6be8441e1adc738670ca (MD5) carta_de_autorización.pdf: 237953 bytes, checksum: ade30662490781789170cc7879cb26ba (MD5)Made available in DSpace on 2026-03-18T18:51:17Z (GMT). No. of bitstreams: 4 miranda_vi.pdf: 1656721 bytes, checksum: c2967ae40326ed4b45676727a0d54e57 (MD5) miranda_vi(acta).pdf: 355824 bytes, checksum: 4fe3f1c402ce3d1c5b055c605f31a208 (MD5) informe_de_similitud.pdf: 440578 bytes, checksum: 42754d34fb8b6be8441e1adc738670ca (MD5) carta_de_autorización.pdf: 237953 bytes, checksum: ade30662490781789170cc7879cb26ba (MD5) Previous issue date: 2022Trabajo de suficiencia profesionalapplication/pdfspaUniversidad Nacional de IngenieríaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de IngenieríaRepositorio Institucional - UNIreponame:UNI-Tesisinstname:Universidad Nacional de Ingenieríainstacron:UNIMachine learningModelos PredictivosAprendizaje automáticoAnálisis estadísticoSistema financieroXGBoosthttps://purl.org/pe-repo/ocde/ford#1.01.03Diseño del proceso de validación de un modelo predictivo con metodología XGBoost para predicción de ingresos de personas naturales con información limitada en el sistema financieroinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniero EstadísticoUniversidad Nacional de Ingeniería. Facultad de Ingeniería Económica, Estadística y Ciencias SocialesTítulo ProfesionalIngeniería EstadísticaIngenieríahttps://orcid.org/0000-0002-2239-53010676118545589140https://purl.org/pe-repo/renati/type#trabajoDeSuficienciaProfesionalhttps://purl.org/pe-repo/renati/level#tituloProfesional542056Risco Franco, Carlos AlvaroPinedo Sánchez, AmélidaParedes Cruz, Ibar GerardoTEXTmiranda_vi.pdf.txtmiranda_vi.pdf.txtExtracted texttext/plain79609http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/6/miranda_vi.pdf.txt4aab210035f5bd72725c8434114d2119MD56miranda_vi(acta).pdf.txtmiranda_vi(acta).pdf.txtExtracted texttext/plain1941http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/7/miranda_vi%28acta%29.pdf.txtc35e3ef4f18010dab79abb1ec2ebbc9fMD57informe_de_similitud.pdf.txtinforme_de_similitud.pdf.txtExtracted texttext/plain5572http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/8/informe_de_similitud.pdf.txta4c7552bbfdcff057ab624b7dba23bdfMD58carta_de_autorización.pdf.txtcarta_de_autorización.pdf.txtExtracted texttext/plain2789http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/9/carta_de_autorizaci%c3%b3n.pdf.txt8703a6110132e4e2e3bab43bad761e52MD59LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55ORIGINALmiranda_vi.pdfmiranda_vi.pdfapplication/pdf1656721http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/1/miranda_vi.pdfc2967ae40326ed4b45676727a0d54e57MD51miranda_vi(acta).pdfmiranda_vi(acta).pdfapplication/pdf355824http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/2/miranda_vi%28acta%29.pdf4fe3f1c402ce3d1c5b055c605f31a208MD52informe_de_similitud.pdfinforme_de_similitud.pdfapplication/pdf440578http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/3/informe_de_similitud.pdf42754d34fb8b6be8441e1adc738670caMD53carta_de_autorización.pdfcarta_de_autorización.pdfapplication/pdf237953http://cybertesis.uni.edu.pe/bitstream/20.500.14076/29064/4/carta_de_autorizaci%c3%b3n.pdfade30662490781789170cc7879cb26baMD5420.500.14076/29064oai:cybertesis.uni.edu.pe:20.500.14076/290642026-03-19 02:35:27.348Repositorio Institucional Universidad Nacional de Ingenieríarepositorio@uni.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.996193 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).