Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua

Descripción del Articulo

En muchas situaciones se dispone de una variable aleatoria continua no negativa con asimetría positiva que eventualmente podría tomar el valor cero. Datos de esta naturaleza son llamados semicontinuos o cero-inflacionados y fueron tradicionalmente modelados usando el modelo de regresión de dos parte...

Descripción completa

Detalles Bibliográficos
Autor: Bautista Bautista, Luis Alberto
Formato: tesis de maestría
Fecha de Publicación:2020
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/180791
Enlace del recurso:http://hdl.handle.net/20.500.12404/20211
Nivel de acceso:acceso abierto
Materia:Estadística bayesiana
Variables (Estadística)
Análisis de regresión
http://purl.org/pe-repo/ocde/ford#1.01.03
id RPUC_309f614d15452f4a4d1dc7179044c4bd
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/180791
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Valdivieso Serrano, Luis HilmarBautista Bautista, Luis Alberto2021-09-01T21:25:20Z2021-09-01T21:25:20Z20202021-09-01http://hdl.handle.net/20.500.12404/20211En muchas situaciones se dispone de una variable aleatoria continua no negativa con asimetría positiva que eventualmente podría tomar el valor cero. Datos de esta naturaleza son llamados semicontinuos o cero-inflacionados y fueron tradicionalmente modelados usando el modelo de regresión de dos partes propuesto por Duan et al. (1983). En este modelo la variable respuesta sigue una distribución mixta de probabilidades conformada por una distribución de Bernoulli y una distribución continua no negativa. Una versión longitudinal de este modelo de regresión, pero que apunta a explicar la media de la variable de respuesta, fue propuesto por Smith et al. (2017). Este modelo planteaba, para su componente continua de respuesta, una distribución Log Skew Normal. El objetivo de este trabajo es estudiar un modelo alternativo al de Smith et al. (2017), que llamaremos, en general, un modelo de regresión a la media con efectos mixtos para respuestas semicontinuas, pues plantea una parametrización que permite estimar e interpretar los efectos de un conjunto de covariables sobre la media de las respuestas y no sobre la media condicionada a valores positivos. A diferencia del modelo de Smith et al. (2017), que hace uso de la distribución Log Skew Normal cero-inflacionada, nosotros modelaremos la respuesta con una distribución Gamma Generalizada cero-inflacionada. Este modelamiento, como se muestra, permite capturar de manera flexible ciertas características de los datos de respuesta, tales como, la asimetría y el comportamiento de las colas. Los resultados del estudio de simulación para el nuevo modelo mostraron un adecuado desempeño en la recuperación de sus parámetros, donde para la estimación de estos utilizamos un enfoque bayesiano y el uso de métodos MCMC Hamiltonianos. Por último, los resultados de su aplicación en el estudio longitudinal del efecto que ciertas variables podrán ejercer sobre la media de los gastos en educación de los hogares en el Perú, mostraron un mejor ajuste a los datos respecto al modelo de Smith et al. (2017), en base a los criterios de información ampliamente aplicado y de validación cruzada de Leave-one-out.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/pe/Estadística bayesianaVariables (Estadística)Análisis de regresiónhttp://purl.org/pe-repo/ocde/ford#1.01.03Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinuainfo:eu-repo/semantics/masterThesisTesis de maestríareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en EstadísticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Estadística07958730https://orcid.org/ 0000-0002-8975-755746975854542037Bayes Rodríguez, Cristian LuisValdivieso Serrano, Luis HilmarMaehara Aliaga, Rocío Paolahttps://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#tesis20.500.14657/180791oai:repositorio.pucp.edu.pe:20.500.14657/1807912024-06-10 10:54:44.985http://creativecommons.org/licenses/by/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
title Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
spellingShingle Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
Bautista Bautista, Luis Alberto
Estadística bayesiana
Variables (Estadística)
Análisis de regresión
http://purl.org/pe-repo/ocde/ford#1.01.03
title_short Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
title_full Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
title_fullStr Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
title_full_unstemmed Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
title_sort Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
author Bautista Bautista, Luis Alberto
author_facet Bautista Bautista, Luis Alberto
author_role author
dc.contributor.advisor.fl_str_mv Valdivieso Serrano, Luis Hilmar
dc.contributor.author.fl_str_mv Bautista Bautista, Luis Alberto
dc.subject.es_ES.fl_str_mv Estadística bayesiana
Variables (Estadística)
Análisis de regresión
topic Estadística bayesiana
Variables (Estadística)
Análisis de regresión
http://purl.org/pe-repo/ocde/ford#1.01.03
dc.subject.ocde.es_ES.fl_str_mv http://purl.org/pe-repo/ocde/ford#1.01.03
description En muchas situaciones se dispone de una variable aleatoria continua no negativa con asimetría positiva que eventualmente podría tomar el valor cero. Datos de esta naturaleza son llamados semicontinuos o cero-inflacionados y fueron tradicionalmente modelados usando el modelo de regresión de dos partes propuesto por Duan et al. (1983). En este modelo la variable respuesta sigue una distribución mixta de probabilidades conformada por una distribución de Bernoulli y una distribución continua no negativa. Una versión longitudinal de este modelo de regresión, pero que apunta a explicar la media de la variable de respuesta, fue propuesto por Smith et al. (2017). Este modelo planteaba, para su componente continua de respuesta, una distribución Log Skew Normal. El objetivo de este trabajo es estudiar un modelo alternativo al de Smith et al. (2017), que llamaremos, en general, un modelo de regresión a la media con efectos mixtos para respuestas semicontinuas, pues plantea una parametrización que permite estimar e interpretar los efectos de un conjunto de covariables sobre la media de las respuestas y no sobre la media condicionada a valores positivos. A diferencia del modelo de Smith et al. (2017), que hace uso de la distribución Log Skew Normal cero-inflacionada, nosotros modelaremos la respuesta con una distribución Gamma Generalizada cero-inflacionada. Este modelamiento, como se muestra, permite capturar de manera flexible ciertas características de los datos de respuesta, tales como, la asimetría y el comportamiento de las colas. Los resultados del estudio de simulación para el nuevo modelo mostraron un adecuado desempeño en la recuperación de sus parámetros, donde para la estimación de estos utilizamos un enfoque bayesiano y el uso de métodos MCMC Hamiltonianos. Por último, los resultados de su aplicación en el estudio longitudinal del efecto que ciertas variables podrán ejercer sobre la media de los gastos en educación de los hogares en el Perú, mostraron un mejor ajuste a los datos respecto al modelo de Smith et al. (2017), en base a los criterios de información ampliamente aplicado y de validación cruzada de Leave-one-out.
publishDate 2020
dc.date.created.none.fl_str_mv 2020
dc.date.accessioned.none.fl_str_mv 2021-09-01T21:25:20Z
dc.date.available.none.fl_str_mv 2021-09-01T21:25:20Z
dc.date.issued.fl_str_mv 2021-09-01
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.other.none.fl_str_mv Tesis de maestría
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/20211
url http://hdl.handle.net/20.500.12404/20211
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835638358482616320
score 13.87115
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).