Método para la fusión de categorías usando técnicas de agrupamiento

Descripción del Articulo

En la actualidad, muchas organizaciones disponen o tienen acceso a una gran cantidad y variedad de datos que les permiten tomar decisiones acordes en temas económicos, sociales, de educación, de salud, entre otros. Con frecuencia, los estudios que se realizan se enfocan en el objetivo de explicar un...

Descripción completa

Detalles Bibliográficos
Autor: Farro Diaz, Victor Daniel
Formato: tesis de maestría
Fecha de Publicación:2021
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/184588
Enlace del recurso:http://hdl.handle.net/20.500.12404/22223
Nivel de acceso:acceso abierto
Materia:Modelos lineales (Estadística)
Estadística bayesiana
Variables (Estadística)
https://purl.org/pe-repo/ocde/ford#1.01.03
id RPUC_0cfe6efe6e0f35d465f9bbb1dcb8a340
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/184588
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Bayes Rodriguez, Cristian LuisFarro Diaz, Victor Daniel2022-04-29T00:47:02Z2022-04-29T00:47:02Z20212022-04-28http://hdl.handle.net/20.500.12404/22223En la actualidad, muchas organizaciones disponen o tienen acceso a una gran cantidad y variedad de datos que les permiten tomar decisiones acordes en temas económicos, sociales, de educación, de salud, entre otros. Con frecuencia, los estudios que se realizan se enfocan en el objetivo de explicar una variable de interés utilizando un conjunto de variables explicativas; y si la relación de dependencia es lineal, se le conoce como modelo de regresión lineal. Los modelos de regresión lineal presentan su principal reto en la estimación de los parámetros de la regresión, que se consiguen a partir de la información obtenida mediante el análisis de las observaciones de una muestra previamente recogida. La complejidad de los modelos de regresión lineal aumenta con la existencia de covariables que son medidas en una escala nominal u ordinal, y que en muchas ocasiones presentan una gran cantidad de categorías, como por ejemplo: estado civil, grupo sanguíneo, entre otros. Lo habitual para modelar el efecto total de una covariable categórica es definir una categoría (o nivel) como línea base y utilizar variables ficticias para las otras categorías (o niveles). La presente tesis tiene como principal objetivo el desarrollo del método de fusión de efectos de covariables categóricas usando técnicas de agrupamiento PAM, propuesto por Malsiner-Walli, Pauger y Wagner (2018), y aplicarlo en un conjunto de datos reales relacionados a los ingresos monetarios de la población de Lima Metropolitana y Callao del primer trimestre del 2020.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/Modelos lineales (Estadística)Estadística bayesianaVariables (Estadística)https://purl.org/pe-repo/ocde/ford#1.01.03Método para la fusión de categorías usando técnicas de agrupamientoinfo:eu-repo/semantics/masterThesisTesis de maestríareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en EstadísticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Estadística40372640https://orcid.org/0000-0003-0474-792145139911542037Sal Y Rosas Celi, Victor GiancarloBayes Rodriguez, Cristian LuisValdivieso Serrano, Luis Hilmarhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesis20.500.14657/184588oai:repositorio.pucp.edu.pe:20.500.14657/1845882024-06-10 10:46:32.87http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Método para la fusión de categorías usando técnicas de agrupamiento
title Método para la fusión de categorías usando técnicas de agrupamiento
spellingShingle Método para la fusión de categorías usando técnicas de agrupamiento
Farro Diaz, Victor Daniel
Modelos lineales (Estadística)
Estadística bayesiana
Variables (Estadística)
https://purl.org/pe-repo/ocde/ford#1.01.03
title_short Método para la fusión de categorías usando técnicas de agrupamiento
title_full Método para la fusión de categorías usando técnicas de agrupamiento
title_fullStr Método para la fusión de categorías usando técnicas de agrupamiento
title_full_unstemmed Método para la fusión de categorías usando técnicas de agrupamiento
title_sort Método para la fusión de categorías usando técnicas de agrupamiento
author Farro Diaz, Victor Daniel
author_facet Farro Diaz, Victor Daniel
author_role author
dc.contributor.advisor.fl_str_mv Bayes Rodriguez, Cristian Luis
dc.contributor.author.fl_str_mv Farro Diaz, Victor Daniel
dc.subject.es_ES.fl_str_mv Modelos lineales (Estadística)
Estadística bayesiana
Variables (Estadística)
topic Modelos lineales (Estadística)
Estadística bayesiana
Variables (Estadística)
https://purl.org/pe-repo/ocde/ford#1.01.03
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.01.03
description En la actualidad, muchas organizaciones disponen o tienen acceso a una gran cantidad y variedad de datos que les permiten tomar decisiones acordes en temas económicos, sociales, de educación, de salud, entre otros. Con frecuencia, los estudios que se realizan se enfocan en el objetivo de explicar una variable de interés utilizando un conjunto de variables explicativas; y si la relación de dependencia es lineal, se le conoce como modelo de regresión lineal. Los modelos de regresión lineal presentan su principal reto en la estimación de los parámetros de la regresión, que se consiguen a partir de la información obtenida mediante el análisis de las observaciones de una muestra previamente recogida. La complejidad de los modelos de regresión lineal aumenta con la existencia de covariables que son medidas en una escala nominal u ordinal, y que en muchas ocasiones presentan una gran cantidad de categorías, como por ejemplo: estado civil, grupo sanguíneo, entre otros. Lo habitual para modelar el efecto total de una covariable categórica es definir una categoría (o nivel) como línea base y utilizar variables ficticias para las otras categorías (o niveles). La presente tesis tiene como principal objetivo el desarrollo del método de fusión de efectos de covariables categóricas usando técnicas de agrupamiento PAM, propuesto por Malsiner-Walli, Pauger y Wagner (2018), y aplicarlo en un conjunto de datos reales relacionados a los ingresos monetarios de la población de Lima Metropolitana y Callao del primer trimestre del 2020.
publishDate 2021
dc.date.created.none.fl_str_mv 2021
dc.date.accessioned.none.fl_str_mv 2022-04-29T00:47:02Z
dc.date.available.none.fl_str_mv 2022-04-29T00:47:02Z
dc.date.issued.fl_str_mv 2022-04-28
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.other.none.fl_str_mv Tesis de maestría
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/22223
url http://hdl.handle.net/20.500.12404/22223
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835638938864189440
score 13.92416
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).