Modelos de regresión robusta para datos de conteo

Descripción del Articulo

En esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una es...

Descripción completa

Detalles Bibliográficos
Autor: Villar Naccha, Christoffer Augusto
Formato: tesis de maestría
Fecha de Publicación:2025
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/31523
Enlace del recurso:http://hdl.handle.net/20.500.12404/31523
Nivel de acceso:acceso abierto
Materia:Análisis de regresión--Modelos matemáticos
Estadística robusta
Dispersión (Matemáticas)
Distribución binomial negativa
https://purl.org/pe-repo/ocde/ford#1.01.03
id PUCP_e3ea0bdf8af8519853a707df6994fd55
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/31523
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.none.fl_str_mv Modelos de regresión robusta para datos de conteo
title Modelos de regresión robusta para datos de conteo
spellingShingle Modelos de regresión robusta para datos de conteo
Villar Naccha, Christoffer Augusto
Análisis de regresión--Modelos matemáticos
Estadística robusta
Dispersión (Matemáticas)
Distribución binomial negativa
https://purl.org/pe-repo/ocde/ford#1.01.03
title_short Modelos de regresión robusta para datos de conteo
title_full Modelos de regresión robusta para datos de conteo
title_fullStr Modelos de regresión robusta para datos de conteo
title_full_unstemmed Modelos de regresión robusta para datos de conteo
title_sort Modelos de regresión robusta para datos de conteo
author Villar Naccha, Christoffer Augusto
author_facet Villar Naccha, Christoffer Augusto
author_role author
dc.contributor.advisor.fl_str_mv Bayes Rodriguez, Cristian Luis
dc.contributor.author.fl_str_mv Villar Naccha, Christoffer Augusto
dc.subject.none.fl_str_mv Análisis de regresión--Modelos matemáticos
Estadística robusta
Dispersión (Matemáticas)
Distribución binomial negativa
topic Análisis de regresión--Modelos matemáticos
Estadística robusta
Dispersión (Matemáticas)
Distribución binomial negativa
https://purl.org/pe-repo/ocde/ford#1.01.03
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.01.03
description En esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una estructura de mixtura en el parámetro de dispersión de la distribución Binomial Negativa, lo que permite que el modelo sea menos sensible a observaciones extremas, preservando así la estructura general de los datos. Se presentan dos formulaciones específicas, denominadas NB-G y NB-IG, que emplean distribuciones Gamma e Inversa Gamma, respectivamente, como componentes de mezcla. Se adopta un enfoque bayesiano para la estimación de los parámetros, utilizándose simulaciones de cadenas de Markov Monte Carlo (MCMC) implementadas en el lenguaje Stan. Se realiza un estudio de simulación para evaluar la robustez del modelo frente a diferentes escenarios de contaminación, así como dos aplicaciones prácticas con datos reales provenientes del ámbito de salud. Los resultados muestran que las variantes propuestas presentan mejor desempeño respecto al modelo de Regresión Binomial Negativa tradicional en términos de estabilidad y precisión, especialmente en presencia de observaciones atípicas. Esta investigación aporta una estrategia robusta y flexible para el modelado de datos de conteo, capaz de adaptarse a contextos con alta variabilidad y presencia de valores extremos.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-08-14T14:18:33Z
dc.date.created.none.fl_str_mv 2025
dc.date.issued.fl_str_mv 2025-08-14
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/31523
url http://hdl.handle.net/20.500.12404/31523
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/60aa71a2-08fe-4bff-adbe-06877f638876/download
https://tesis.pucp.edu.pe/bitstreams/d90957dc-5976-4cf5-a54d-2550545b8659/download
https://tesis.pucp.edu.pe/bitstreams/62d71540-77af-4a14-9f1c-5f1608bd407f/download
https://tesis.pucp.edu.pe/bitstreams/14737f5d-ce04-4992-b69b-217b8e933788/download
https://tesis.pucp.edu.pe/bitstreams/557b8dc0-1bca-4cca-b703-758aad1334c4/download
https://tesis.pucp.edu.pe/bitstreams/8883668d-32b2-403a-b177-4a13a6262824/download
https://tesis.pucp.edu.pe/bitstreams/70f59e2d-956f-4078-89b2-30cafaeda5e3/download
https://tesis.pucp.edu.pe/bitstreams/3cd3aa76-b4ed-4342-b3e4-a3acdf2881d7/download
bitstream.checksum.fl_str_mv b5e8bc476967dfdf2db5c4e3b33f56b6
15f93d37566806f722187c13add40e9d
3cce22cdbfa6875906fb15a718e73ab5
bb9bdc0b3349e4284e09149f943790b4
5e63960024350b38bd614e2b419ba9ad
c60a163f901aa735e9858347a24cf845
587e318d8bde3bad20a6767d5d82f30a
ff25f292eba6e647083757fc294ecf07
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1841712737581793280
spelling Bayes Rodriguez, Cristian LuisVillar Naccha, Christoffer Augusto2025-08-14T14:18:33Z20252025-08-14http://hdl.handle.net/20.500.12404/31523En esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una estructura de mixtura en el parámetro de dispersión de la distribución Binomial Negativa, lo que permite que el modelo sea menos sensible a observaciones extremas, preservando así la estructura general de los datos. Se presentan dos formulaciones específicas, denominadas NB-G y NB-IG, que emplean distribuciones Gamma e Inversa Gamma, respectivamente, como componentes de mezcla. Se adopta un enfoque bayesiano para la estimación de los parámetros, utilizándose simulaciones de cadenas de Markov Monte Carlo (MCMC) implementadas en el lenguaje Stan. Se realiza un estudio de simulación para evaluar la robustez del modelo frente a diferentes escenarios de contaminación, así como dos aplicaciones prácticas con datos reales provenientes del ámbito de salud. Los resultados muestran que las variantes propuestas presentan mejor desempeño respecto al modelo de Regresión Binomial Negativa tradicional en términos de estabilidad y precisión, especialmente en presencia de observaciones atípicas. Esta investigación aporta una estrategia robusta y flexible para el modelado de datos de conteo, capaz de adaptarse a contextos con alta variabilidad y presencia de valores extremos.This thesis proposes a new model, referred to as Negative Binomial Regression with Mixture in the Dispersion (NB-H), as a robust alternative for analyzing count data affected by overdispersion and the presence of outliers. The proposed approach incorporates a mixture structure in the dispersion parameter of the Negative Binomial distribution, making the model less sensitive to extreme observations, thereby preserving the overall data structure. Two specific formulations are developed: NB-G and NB-IG, which use Gamma and Inverse Gamma distributions, respectively, as mixing components. A Bayesian approach is adopted for parameter estimation, using Markov Chain Monte Carlo (MCMC) simulations implemented in the Stan programming language. A simulation study is performed to evaluate the robustness of the model under various contamination scenarios, alongside two real-world applications involving health-related count data. The results show that the proposed variants outperform the traditional Negative Binomial model in terms of stability and estimation accuracy, particularly in the presence of extreme values. This research introduces a flexible and resilient strategy for modeling count data under challenging conditions of high variability and outliers.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Análisis de regresión--Modelos matemáticosEstadística robustaDispersión (Matemáticas)Distribución binomial negativahttps://purl.org/pe-repo/ocde/ford#1.01.03Modelos de regresión robusta para datos de conteoinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en EstadísticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Estadística40372640https://orcid.org/0000-0003-0474-792174027347542037Valdivieso Serrano, Luis HilmarBayes Rodriguez, Cristian LuisDe La Cruz Huayanay, Alexhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdfVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdfTexto completoapplication/pdf1411429https://tesis.pucp.edu.pe/bitstreams/60aa71a2-08fe-4bff-adbe-06877f638876/downloadb5e8bc476967dfdf2db5c4e3b33f56b6MD51trueAnonymousREADVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdfVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdfReporte de originalidadapplication/pdf10110588https://tesis.pucp.edu.pe/bitstreams/d90957dc-5976-4cf5-a54d-2550545b8659/download15f93d37566806f722187c13add40e9dMD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81166https://tesis.pucp.edu.pe/bitstreams/62d71540-77af-4a14-9f1c-5f1608bd407f/download3cce22cdbfa6875906fb15a718e73ab5MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/14737f5d-ce04-4992-b69b-217b8e933788/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.txtVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.txtExtracted texttext/plain105778https://tesis.pucp.edu.pe/bitstreams/557b8dc0-1bca-4cca-b703-758aad1334c4/download5e63960024350b38bd614e2b419ba9adMD55falseAnonymousREADVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.txtVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.txtExtracted texttext/plain12045https://tesis.pucp.edu.pe/bitstreams/8883668d-32b2-403a-b177-4a13a6262824/downloadc60a163f901aa735e9858347a24cf845MD57falseAdministratorREADTHUMBNAILVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.jpgVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.jpgGenerated Thumbnailimage/jpeg8133https://tesis.pucp.edu.pe/bitstreams/70f59e2d-956f-4078-89b2-30cafaeda5e3/download587e318d8bde3bad20a6767d5d82f30aMD56falseAnonymousREADVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.jpgVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.jpgGenerated Thumbnailimage/jpeg6234https://tesis.pucp.edu.pe/bitstreams/3cd3aa76-b4ed-4342-b3e4-a3acdf2881d7/downloadff25f292eba6e647083757fc294ecf07MD58falseAdministratorREAD20.500.12404/31523oai:tesis.pucp.edu.pe:20.500.12404/315232025-08-15 09:06:04.797http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.918182
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).