Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú
Descripción del Articulo
En esta tesis se desarrolla una plataforma basada en modelos de aprendizaje automático para estimar los ingresos laborales en Perú. Se emplean datos provenientes de la Encuesta Permanente de Empleo Nacional del INEI de 26 ciudades, la cual constituye la fuente principal y especializada sobre el merc...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Nacional Mayor de San Marcos |
| Repositorio: | UNMSM-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/25322 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12672/25322 |
| Nivel de acceso: | acceso abierto |
| Materia: | Aprendizaje automático optimización Computacional Trabajo Python (Lenguaje de programación de computadoras) https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| id |
UNMS_16da8979ebd8790b61467ad403da35c7 |
|---|---|
| oai_identifier_str |
oai:cybertesis.unmsm.edu.pe:20.500.12672/25322 |
| network_acronym_str |
UNMS |
| network_name_str |
UNMSM-Tesis |
| repository_id_str |
410 |
| dc.title.none.fl_str_mv |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| title |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| spellingShingle |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú Madge Escobedo, Jennifer Yvonne Aprendizaje automático optimización Computacional Trabajo Python (Lenguaje de programación de computadoras) https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| title_short |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| title_full |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| title_fullStr |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| title_full_unstemmed |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| title_sort |
Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú |
| author |
Madge Escobedo, Jennifer Yvonne |
| author_facet |
Madge Escobedo, Jennifer Yvonne |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Vásquez Serpa, Luis Javier |
| dc.contributor.author.fl_str_mv |
Madge Escobedo, Jennifer Yvonne |
| dc.subject.none.fl_str_mv |
Aprendizaje automático optimización Computacional Trabajo Python (Lenguaje de programación de computadoras) |
| topic |
Aprendizaje automático optimización Computacional Trabajo Python (Lenguaje de programación de computadoras) https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 https://purl.org/pe-repo/ocde/ford#1.02.02 |
| description |
En esta tesis se desarrolla una plataforma basada en modelos de aprendizaje automático para estimar los ingresos laborales en Perú. Se emplean datos provenientes de la Encuesta Permanente de Empleo Nacional del INEI de 26 ciudades, la cual constituye la fuente principal y especializada sobre el mercado laboral peruano. Estos datos fueron procesados en SQL y analizados en Power BI y Python. El tratamiento de los datos incluye la aplicación del Análisis de Componentes Principales como técnica de reducción de dimensionalidad. Por cada ciudad, se evalúan cinco modelos de aprendizaje automático: Random Forest, Extra Trees, LightGBM, XGBoost, CatBoost y para cada uno se realizó la optimización de parámetros usando Random Search, Bayesian Optimization y Grid Search obteniendo un total de 22,360 modelos. Con los resultados de cada ciudad se implementa una herramienta interactiva que ofrece estimaciones salariales personalizadas basadas en su perfil socioeconómico. Esta aplicación simplifica el uso de herramientas de aprendizaje automático, ajustándolas a situaciones como la planificación económica y la toma de decisiones en el ámbito laboral. El enfoque metodológico y la innovación tecnológica de este trabajo contribuyen al entendimiento y mejoramiento del análisis del mercado laboral peruano. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-02-12T14:14:51Z |
| dc.date.available.none.fl_str_mv |
2025-02-12T14:14:51Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.citation.none.fl_str_mv |
Madge, J. (2025). Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12672/25322 |
| identifier_str_mv |
Madge, J. (2025). Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. |
| url |
https://hdl.handle.net/20.500.12672/25322 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
| dc.source.none.fl_str_mv |
reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
| instname_str |
Universidad Nacional Mayor de San Marcos |
| instacron_str |
UNMSM |
| institution |
UNMSM |
| reponame_str |
UNMSM-Tesis |
| collection |
UNMSM-Tesis |
| bitstream.url.fl_str_mv |
https://cybertesis.unmsm.edu.pe/bitstreams/56205829-9b84-487e-acb2-36ce7901cc9d/download https://cybertesis.unmsm.edu.pe/bitstreams/103bb9bd-2948-41e8-8add-282827cc75bf/download https://cybertesis.unmsm.edu.pe/bitstreams/1de8ecdd-634b-4547-a99d-fadd85e7a0b3/download https://cybertesis.unmsm.edu.pe/bitstreams/d56ffad4-7bac-4686-8a50-44338cf1626e/download https://cybertesis.unmsm.edu.pe/bitstreams/c4859b67-5a97-454a-82f9-216911095d55/download https://cybertesis.unmsm.edu.pe/bitstreams/0e855340-4a25-46c6-8bb4-a252321be0e3/download https://cybertesis.unmsm.edu.pe/bitstreams/f8740eb9-75f9-446e-9779-3336c27333c3/download https://cybertesis.unmsm.edu.pe/bitstreams/2ab10353-394a-483c-82ff-1294f01b491b/download https://cybertesis.unmsm.edu.pe/bitstreams/a4939ce8-7d20-403a-a5f4-2649796d7169/download https://cybertesis.unmsm.edu.pe/bitstreams/f0cf683a-560e-41f3-84da-06a1a7381f03/download https://cybertesis.unmsm.edu.pe/bitstreams/53a759b7-ad45-4593-aa25-28adb99c5574/download |
| bitstream.checksum.fl_str_mv |
1f14487299a8a795dc379bc1df9968a0 617f7d376e72cdc62221b15bb50fd58b 531bd2674350dc08e601c5a3c62beaff 6627f275f178ada5225e53813f363716 bb9bdc0b3349e4284e09149f943790b4 12d7523b4439d689cba23bec80cd5656 928a6caf8b8134432650ca7a82b190e1 5447c5344f2a9cd76fa20c8e41aba375 52e6b410f9c534b43f6164e6b9c3d97d c0f50ee1a241503d663e32e6f8cfbb71 5475d91518ca36aac8beb5d4a94be786 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Cybertesis UNMSM |
| repository.mail.fl_str_mv |
cybertesis@unmsm.edu.pe |
| _version_ |
1853595039580553216 |
| spelling |
Vásquez Serpa, Luis JavierMadge Escobedo, Jennifer Yvonne2025-02-12T14:14:51Z2025-02-12T14:14:51Z2025Madge, J. (2025). Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perú. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/25322En esta tesis se desarrolla una plataforma basada en modelos de aprendizaje automático para estimar los ingresos laborales en Perú. Se emplean datos provenientes de la Encuesta Permanente de Empleo Nacional del INEI de 26 ciudades, la cual constituye la fuente principal y especializada sobre el mercado laboral peruano. Estos datos fueron procesados en SQL y analizados en Power BI y Python. El tratamiento de los datos incluye la aplicación del Análisis de Componentes Principales como técnica de reducción de dimensionalidad. Por cada ciudad, se evalúan cinco modelos de aprendizaje automático: Random Forest, Extra Trees, LightGBM, XGBoost, CatBoost y para cada uno se realizó la optimización de parámetros usando Random Search, Bayesian Optimization y Grid Search obteniendo un total de 22,360 modelos. Con los resultados de cada ciudad se implementa una herramienta interactiva que ofrece estimaciones salariales personalizadas basadas en su perfil socioeconómico. Esta aplicación simplifica el uso de herramientas de aprendizaje automático, ajustándolas a situaciones como la planificación económica y la toma de decisiones en el ámbito laboral. El enfoque metodológico y la innovación tecnológica de este trabajo contribuyen al entendimiento y mejoramiento del análisis del mercado laboral peruano.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Aprendizaje automáticooptimización ComputacionalTrabajoPython (Lenguaje de programación de computadoras)https://purl.org/pe-repo/ocde/ford#1.02.01https://purl.org/pe-repo/ocde/ford#1.02.02Aplicación de modelos de aprendizaje automático y optimización de parámetros para estimar los ingresos laborales en el Perúinfo:eu-repo/semantics/bachelorThesisreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMSUNEDULicenciada en Computación CientíficaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación CientíficaComputación Científica43389380https://orcid.org/0000-0002-5414-676474944280611026Medina Aguilar, Rosa LuzPérez Núñez, Jhelly Reynaluzhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis1004824744076412CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8905https://cybertesis.unmsm.edu.pe/bitstreams/56205829-9b84-487e-acb2-36ce7901cc9d/download1f14487299a8a795dc379bc1df9968a0MD51ORIGINALMadge_ej.pdfMadge_ej.pdfapplication/pdf17839174https://cybertesis.unmsm.edu.pe/bitstreams/103bb9bd-2948-41e8-8add-282827cc75bf/download617f7d376e72cdc62221b15bb50fd58bMD52C0578_2025_Madge_ej_autorización.pdfapplication/pdf138931https://cybertesis.unmsm.edu.pe/bitstreams/1de8ecdd-634b-4547-a99d-fadd85e7a0b3/download531bd2674350dc08e601c5a3c62beaffMD54C0578_2025_Madge_ej_reporte.pdfapplication/pdf7499100https://cybertesis.unmsm.edu.pe/bitstreams/d56ffad4-7bac-4686-8a50-44338cf1626e/download6627f275f178ada5225e53813f363716MD55LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/c4859b67-5a97-454a-82f9-216911095d55/downloadbb9bdc0b3349e4284e09149f943790b4MD53TEXTMadge_ej.pdf.txtMadge_ej.pdf.txtExtracted texttext/plain102412https://cybertesis.unmsm.edu.pe/bitstreams/0e855340-4a25-46c6-8bb4-a252321be0e3/download12d7523b4439d689cba23bec80cd5656MD56C0578_2025_Madge_ej_autorización.pdf.txtC0578_2025_Madge_ej_autorización.pdf.txtExtracted texttext/plain3876https://cybertesis.unmsm.edu.pe/bitstreams/f8740eb9-75f9-446e-9779-3336c27333c3/download928a6caf8b8134432650ca7a82b190e1MD58C0578_2025_Madge_ej_reporte.pdf.txtC0578_2025_Madge_ej_reporte.pdf.txtExtracted texttext/plain102524https://cybertesis.unmsm.edu.pe/bitstreams/2ab10353-394a-483c-82ff-1294f01b491b/download5447c5344f2a9cd76fa20c8e41aba375MD510THUMBNAILMadge_ej.pdf.jpgMadge_ej.pdf.jpgGenerated Thumbnailimage/jpeg15020https://cybertesis.unmsm.edu.pe/bitstreams/a4939ce8-7d20-403a-a5f4-2649796d7169/download52e6b410f9c534b43f6164e6b9c3d97dMD57C0578_2025_Madge_ej_autorización.pdf.jpgC0578_2025_Madge_ej_autorización.pdf.jpgGenerated Thumbnailimage/jpeg20621https://cybertesis.unmsm.edu.pe/bitstreams/f0cf683a-560e-41f3-84da-06a1a7381f03/downloadc0f50ee1a241503d663e32e6f8cfbb71MD59C0578_2025_Madge_ej_reporte.pdf.jpgC0578_2025_Madge_ej_reporte.pdf.jpgGenerated Thumbnailimage/jpeg16147https://cybertesis.unmsm.edu.pe/bitstreams/53a759b7-ad45-4593-aa25-28adb99c5574/download5475d91518ca36aac8beb5d4a94be786MD51120.500.12672/25322oai:cybertesis.unmsm.edu.pe:20.500.12672/253222025-02-16 03:04:38.811https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.406609 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).