Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models

Descripción del Articulo

COVID-19 has caused an economic crisis in the business world, leaving limitations in the continuity of the payment chain, with companies resorting to credit access. This study aimed to determine the optimal machine learning predictive model for the credit risk of companies under the Reactiva Peru Pr...

Descripción completa

Detalles Bibliográficos
Autores: Geraldo Campos, Luis Alberto, Soria, Juan J., Pando Ezcurra, Tamara
Formato: artículo
Fecha de Publicación:2022
Institución:Universidad Privada Peruano Alemana
Repositorio:UPAL - Institucional
Lenguaje:inglés
OAI Identifier:oai:repositorio.upal.edu.pe:20.500.14107/81
Enlace del recurso:https://hdl.handle.net/20.500.14107/81
https://doi.org/10.3390/economies10080188
Nivel de acceso:acceso abierto
Materia:Aprendizaje automático
Modelos matemáticos
Predicciones económicas
Riesgo crediticio
https://purl.org/pe-repo/ocde/ford#5.02.02
id UPAL_a47b69d2c3ecc76691adcbf52d446926
oai_identifier_str oai:repositorio.upal.edu.pe:20.500.14107/81
network_acronym_str UPAL
network_name_str UPAL - Institucional
repository_id_str
dc.title.es_PE.fl_str_mv Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
title Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
spellingShingle Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
Geraldo Campos, Luis Alberto
Aprendizaje automático
Modelos matemáticos
Predicciones económicas
Riesgo crediticio
https://purl.org/pe-repo/ocde/ford#5.02.02
title_short Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
title_full Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
title_fullStr Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
title_full_unstemmed Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
title_sort Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models
author Geraldo Campos, Luis Alberto
author_facet Geraldo Campos, Luis Alberto
Soria, Juan J.
Pando Ezcurra, Tamara
author_role author
author2 Soria, Juan J.
Pando Ezcurra, Tamara
author2_role author
author
dc.contributor.author.fl_str_mv Geraldo Campos, Luis Alberto
Soria, Juan J.
Pando Ezcurra, Tamara
dc.subject.es_PE.fl_str_mv Aprendizaje automático
Modelos matemáticos
Predicciones económicas
Riesgo crediticio
topic Aprendizaje automático
Modelos matemáticos
Predicciones económicas
Riesgo crediticio
https://purl.org/pe-repo/ocde/ford#5.02.02
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#5.02.02
description COVID-19 has caused an economic crisis in the business world, leaving limitations in the continuity of the payment chain, with companies resorting to credit access. This study aimed to determine the optimal machine learning predictive model for the credit risk of companies under the Reactiva Peru Program because of COVID-19. A multivariate regression analysis was applied with four regressor variables (economic sector, granting entity, amount covered, and department) and one predictor (risk level), with a population of 501,298 companies benefiting from the program, under the CRISP-DM methodology oriented especially for data mining projects, with artificial intelligence techniques under the machine learning Lasso and Ridge regression models, with econometric algebraic mathematical verification to compare and validate the predictive models using SPSS, Jamovi, R Studio, and MATLAB software. The results revealed a better Lasso regression model (λ60 = 0.00038; RMSE = 0.3573685) that optimally predicted the level of risk compared to the Ridge regression model (λ100 = 0.00910; RMSE = 0.3573812) and the least squares model with algebraic mathematics, which corroborates that the Lasso regression model is the best predictive model to detect the level of credit risk of the Reactiva Peru Program. The best predictive model for detecting the level of corporate credit risk is the Lasso regression model. La COVID-19 ha provocado una crisis económica en el mundo empresarial, dejando limitaciones en la continuidad de la cadena de pagos, con empresas recurriendo al acceso al crédito. El objetivo de este estudio es determinar el modelo predictivo óptimo de aprendizaje automático para el riesgo crediticio de las empresas del Programa Reactiva Perú, como consecuencia de la COVID-19. Se aplicó un análisis de regresión multivariado con cuatro variables regresoras (sector económico, entidad otorgante, monto cubierto y departamento) y un predictor (nivel de riesgo), con una población de 501.298 empresas beneficiarias del programa, bajo la metodología CRISP-DM, orientada especialmente para proyectos de minería de datos, con técnicas de inteligencia artificial bajo los modelos de regresión de machine learning Lasso y Ridge y con verificación matemática algebraica econométrica para comparar y validar los modelos predictivos utilizando los software SPSS, Jamovi, R Studio y MATLAB. Los resultados revelaron un mejor modelo de regresión de Lasso (λ60 = 0,00038; RMSE = 0,3573685) el cual predijo de manera óptima el nivel de riesgo en comparación con el modelo de regresión de Ridge (λ100 = 0,00910; RMSE = 0,3573812) y el modelo de mínimos cuadrados con matemáticas algebraicas, lo que corrobora que el modelo de regresión de Lasso es el mejor modelo predictivo para detectar el nivel de riesgo crediticio del Programa Reactiva Perú. El mejor modelo predictivo para detectar el nivel de riesgo de crédito corporativo es el modelo de regresión de Lasso.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-08-02T16:55:15Z
dc.date.available.none.fl_str_mv 2022-08-02T16:55:15Z
dc.date.issued.fl_str_mv 2022-08-01
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/article
format article
dc.identifier.citation.es_PE.fl_str_mv Geraldo-Campos, L. A., Soria, J. J., & Pando-Ezcurra, T. (2022). Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models. Economies, 10(8). https://doi.org/10.3390/economies10080188
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.14107/81
dc.identifier.journal.es_PE.fl_str_mv Economies
dc.identifier.doi.es_PE.fl_str_mv https://doi.org/10.3390/economies10080188
identifier_str_mv Geraldo-Campos, L. A., Soria, J. J., & Pando-Ezcurra, T. (2022). Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models. Economies, 10(8). https://doi.org/10.3390/economies10080188
Economies
url https://hdl.handle.net/20.500.14107/81
https://doi.org/10.3390/economies10080188
dc.language.iso.es_PE.fl_str_mv eng
language eng
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Multidisciplinary Digital Publishing Institute (MDPI)
dc.source.es_PE.fl_str_mv Repositorio institucional UPAL
dc.source.none.fl_str_mv reponame:UPAL - Institucional
instname:Universidad Privada Peruano Alemana
instacron:UPAL
instname_str Universidad Privada Peruano Alemana
instacron_str UPAL
institution UPAL
reponame_str UPAL - Institucional
collection UPAL - Institucional
bitstream.url.fl_str_mv http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/1/Geraldo_Soria_Pando.pdf
http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/2/license.txt
http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/3/Geraldo_Soria_Pando.pdf.txt
http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/4/Geraldo_Soria_Pando.pdf.jpg
bitstream.checksum.fl_str_mv ebc474b07b61778a0168da942a4c196d
8a4605be74aa9ea9d79846c1fba20a33
3529d75babfe05cea5e1752dfbe5b573
fe8744a9935019e5aec288dcc98af303
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad Privada Peruano Alemana
repository.mail.fl_str_mv repositorio@upal.edu.pe
_version_ 1752940556820938752
spelling Geraldo Campos, Luis AlbertoSoria, Juan J.Pando Ezcurra, Tamara2022-08-02T16:55:15Z2022-08-02T16:55:15Z2022-08-01Geraldo-Campos, L. A., Soria, J. J., & Pando-Ezcurra, T. (2022). Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression models. Economies, 10(8). https://doi.org/10.3390/economies10080188https://hdl.handle.net/20.500.14107/81Economieshttps://doi.org/10.3390/economies10080188COVID-19 has caused an economic crisis in the business world, leaving limitations in the continuity of the payment chain, with companies resorting to credit access. This study aimed to determine the optimal machine learning predictive model for the credit risk of companies under the Reactiva Peru Program because of COVID-19. A multivariate regression analysis was applied with four regressor variables (economic sector, granting entity, amount covered, and department) and one predictor (risk level), with a population of 501,298 companies benefiting from the program, under the CRISP-DM methodology oriented especially for data mining projects, with artificial intelligence techniques under the machine learning Lasso and Ridge regression models, with econometric algebraic mathematical verification to compare and validate the predictive models using SPSS, Jamovi, R Studio, and MATLAB software. The results revealed a better Lasso regression model (λ60 = 0.00038; RMSE = 0.3573685) that optimally predicted the level of risk compared to the Ridge regression model (λ100 = 0.00910; RMSE = 0.3573812) and the least squares model with algebraic mathematics, which corroborates that the Lasso regression model is the best predictive model to detect the level of credit risk of the Reactiva Peru Program. The best predictive model for detecting the level of corporate credit risk is the Lasso regression model. La COVID-19 ha provocado una crisis económica en el mundo empresarial, dejando limitaciones en la continuidad de la cadena de pagos, con empresas recurriendo al acceso al crédito. El objetivo de este estudio es determinar el modelo predictivo óptimo de aprendizaje automático para el riesgo crediticio de las empresas del Programa Reactiva Perú, como consecuencia de la COVID-19. Se aplicó un análisis de regresión multivariado con cuatro variables regresoras (sector económico, entidad otorgante, monto cubierto y departamento) y un predictor (nivel de riesgo), con una población de 501.298 empresas beneficiarias del programa, bajo la metodología CRISP-DM, orientada especialmente para proyectos de minería de datos, con técnicas de inteligencia artificial bajo los modelos de regresión de machine learning Lasso y Ridge y con verificación matemática algebraica econométrica para comparar y validar los modelos predictivos utilizando los software SPSS, Jamovi, R Studio y MATLAB. Los resultados revelaron un mejor modelo de regresión de Lasso (λ60 = 0,00038; RMSE = 0,3573685) el cual predijo de manera óptima el nivel de riesgo en comparación con el modelo de regresión de Ridge (λ100 = 0,00910; RMSE = 0,3573812) y el modelo de mínimos cuadrados con matemáticas algebraicas, lo que corrobora que el modelo de regresión de Lasso es el mejor modelo predictivo para detectar el nivel de riesgo crediticio del Programa Reactiva Perú. El mejor modelo predictivo para detectar el nivel de riesgo de crédito corporativo es el modelo de regresión de Lasso.Revisión por paresapplication/pdfengMultidisciplinary Digital Publishing Institute (MDPI)info:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/Repositorio institucional UPALreponame:UPAL - Institucionalinstname:Universidad Privada Peruano Alemanainstacron:UPALAprendizaje automáticoModelos matemáticosPredicciones económicasRiesgo crediticiohttps://purl.org/pe-repo/ocde/ford#5.02.02Machine Learning for credit risk in the Reactive Peru Program: a comparison of the Lasso and Ridge regression modelsinfo:eu-repo/semantics/articleORIGINALGeraldo_Soria_Pando.pdfGeraldo_Soria_Pando.pdfapplication/pdf1213219http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/1/Geraldo_Soria_Pando.pdfebc474b07b61778a0168da942a4c196dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTGeraldo_Soria_Pando.pdf.txtGeraldo_Soria_Pando.pdf.txtExtracted texttext/plain80090http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/3/Geraldo_Soria_Pando.pdf.txt3529d75babfe05cea5e1752dfbe5b573MD53THUMBNAILGeraldo_Soria_Pando.pdf.jpgGeraldo_Soria_Pando.pdf.jpgGenerated Thumbnailimage/jpeg1651http://repositorio.upal.edu.pe/bitstream/20.500.14107/81/4/Geraldo_Soria_Pando.pdf.jpgfe8744a9935019e5aec288dcc98af303MD5420.500.14107/81oai:repositorio.upal.edu.pe:20.500.14107/812022-08-03 03:00:07.26Repositorio de la Universidad Privada Peruano Alemanarepositorio@upal.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.903504
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).