Modelos de regresión robusta para datos de conteo
Descripción del Articulo
En esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una es...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2025 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/31523 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/31523 |
| Nivel de acceso: | acceso abierto |
| Materia: | Análisis de regresión--Modelos matemáticos Estadística robusta Dispersión (Matemáticas) Distribución binomial negativa https://purl.org/pe-repo/ocde/ford#1.01.03 |
| id |
PUCP_e3ea0bdf8af8519853a707df6994fd55 |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/31523 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.none.fl_str_mv |
Modelos de regresión robusta para datos de conteo |
| title |
Modelos de regresión robusta para datos de conteo |
| spellingShingle |
Modelos de regresión robusta para datos de conteo Villar Naccha, Christoffer Augusto Análisis de regresión--Modelos matemáticos Estadística robusta Dispersión (Matemáticas) Distribución binomial negativa https://purl.org/pe-repo/ocde/ford#1.01.03 |
| title_short |
Modelos de regresión robusta para datos de conteo |
| title_full |
Modelos de regresión robusta para datos de conteo |
| title_fullStr |
Modelos de regresión robusta para datos de conteo |
| title_full_unstemmed |
Modelos de regresión robusta para datos de conteo |
| title_sort |
Modelos de regresión robusta para datos de conteo |
| author |
Villar Naccha, Christoffer Augusto |
| author_facet |
Villar Naccha, Christoffer Augusto |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Bayes Rodriguez, Cristian Luis |
| dc.contributor.author.fl_str_mv |
Villar Naccha, Christoffer Augusto |
| dc.subject.none.fl_str_mv |
Análisis de regresión--Modelos matemáticos Estadística robusta Dispersión (Matemáticas) Distribución binomial negativa |
| topic |
Análisis de regresión--Modelos matemáticos Estadística robusta Dispersión (Matemáticas) Distribución binomial negativa https://purl.org/pe-repo/ocde/ford#1.01.03 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.01.03 |
| description |
En esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una estructura de mixtura en el parámetro de dispersión de la distribución Binomial Negativa, lo que permite que el modelo sea menos sensible a observaciones extremas, preservando así la estructura general de los datos. Se presentan dos formulaciones específicas, denominadas NB-G y NB-IG, que emplean distribuciones Gamma e Inversa Gamma, respectivamente, como componentes de mezcla. Se adopta un enfoque bayesiano para la estimación de los parámetros, utilizándose simulaciones de cadenas de Markov Monte Carlo (MCMC) implementadas en el lenguaje Stan. Se realiza un estudio de simulación para evaluar la robustez del modelo frente a diferentes escenarios de contaminación, así como dos aplicaciones prácticas con datos reales provenientes del ámbito de salud. Los resultados muestran que las variantes propuestas presentan mejor desempeño respecto al modelo de Regresión Binomial Negativa tradicional en términos de estabilidad y precisión, especialmente en presencia de observaciones atípicas. Esta investigación aporta una estrategia robusta y flexible para el modelado de datos de conteo, capaz de adaptarse a contextos con alta variabilidad y presencia de valores extremos. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-08-14T14:18:33Z |
| dc.date.created.none.fl_str_mv |
2025 |
| dc.date.issued.fl_str_mv |
2025-08-14 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/31523 |
| url |
http://hdl.handle.net/20.500.12404/31523 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.none.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/60aa71a2-08fe-4bff-adbe-06877f638876/download https://tesis.pucp.edu.pe/bitstreams/d90957dc-5976-4cf5-a54d-2550545b8659/download https://tesis.pucp.edu.pe/bitstreams/62d71540-77af-4a14-9f1c-5f1608bd407f/download https://tesis.pucp.edu.pe/bitstreams/14737f5d-ce04-4992-b69b-217b8e933788/download https://tesis.pucp.edu.pe/bitstreams/557b8dc0-1bca-4cca-b703-758aad1334c4/download https://tesis.pucp.edu.pe/bitstreams/8883668d-32b2-403a-b177-4a13a6262824/download https://tesis.pucp.edu.pe/bitstreams/70f59e2d-956f-4078-89b2-30cafaeda5e3/download https://tesis.pucp.edu.pe/bitstreams/3cd3aa76-b4ed-4342-b3e4-a3acdf2881d7/download |
| bitstream.checksum.fl_str_mv |
b5e8bc476967dfdf2db5c4e3b33f56b6 15f93d37566806f722187c13add40e9d 3cce22cdbfa6875906fb15a718e73ab5 bb9bdc0b3349e4284e09149f943790b4 5e63960024350b38bd614e2b419ba9ad c60a163f901aa735e9858347a24cf845 587e318d8bde3bad20a6767d5d82f30a ff25f292eba6e647083757fc294ecf07 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1841712737581793280 |
| spelling |
Bayes Rodriguez, Cristian LuisVillar Naccha, Christoffer Augusto2025-08-14T14:18:33Z20252025-08-14http://hdl.handle.net/20.500.12404/31523En esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una estructura de mixtura en el parámetro de dispersión de la distribución Binomial Negativa, lo que permite que el modelo sea menos sensible a observaciones extremas, preservando así la estructura general de los datos. Se presentan dos formulaciones específicas, denominadas NB-G y NB-IG, que emplean distribuciones Gamma e Inversa Gamma, respectivamente, como componentes de mezcla. Se adopta un enfoque bayesiano para la estimación de los parámetros, utilizándose simulaciones de cadenas de Markov Monte Carlo (MCMC) implementadas en el lenguaje Stan. Se realiza un estudio de simulación para evaluar la robustez del modelo frente a diferentes escenarios de contaminación, así como dos aplicaciones prácticas con datos reales provenientes del ámbito de salud. Los resultados muestran que las variantes propuestas presentan mejor desempeño respecto al modelo de Regresión Binomial Negativa tradicional en términos de estabilidad y precisión, especialmente en presencia de observaciones atípicas. Esta investigación aporta una estrategia robusta y flexible para el modelado de datos de conteo, capaz de adaptarse a contextos con alta variabilidad y presencia de valores extremos.This thesis proposes a new model, referred to as Negative Binomial Regression with Mixture in the Dispersion (NB-H), as a robust alternative for analyzing count data affected by overdispersion and the presence of outliers. The proposed approach incorporates a mixture structure in the dispersion parameter of the Negative Binomial distribution, making the model less sensitive to extreme observations, thereby preserving the overall data structure. Two specific formulations are developed: NB-G and NB-IG, which use Gamma and Inverse Gamma distributions, respectively, as mixing components. A Bayesian approach is adopted for parameter estimation, using Markov Chain Monte Carlo (MCMC) simulations implemented in the Stan programming language. A simulation study is performed to evaluate the robustness of the model under various contamination scenarios, alongside two real-world applications involving health-related count data. The results show that the proposed variants outperform the traditional Negative Binomial model in terms of stability and estimation accuracy, particularly in the presence of extreme values. This research introduces a flexible and resilient strategy for modeling count data under challenging conditions of high variability and outliers.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Análisis de regresión--Modelos matemáticosEstadística robustaDispersión (Matemáticas)Distribución binomial negativahttps://purl.org/pe-repo/ocde/ford#1.01.03Modelos de regresión robusta para datos de conteoinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en EstadísticaMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Estadística40372640https://orcid.org/0000-0003-0474-792174027347542037Valdivieso Serrano, Luis HilmarBayes Rodriguez, Cristian LuisDe La Cruz Huayanay, Alexhttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdfVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdfTexto completoapplication/pdf1411429https://tesis.pucp.edu.pe/bitstreams/60aa71a2-08fe-4bff-adbe-06877f638876/downloadb5e8bc476967dfdf2db5c4e3b33f56b6MD51trueAnonymousREADVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdfVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdfReporte de originalidadapplication/pdf10110588https://tesis.pucp.edu.pe/bitstreams/d90957dc-5976-4cf5-a54d-2550545b8659/download15f93d37566806f722187c13add40e9dMD52falseAdministratorREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81166https://tesis.pucp.edu.pe/bitstreams/62d71540-77af-4a14-9f1c-5f1608bd407f/download3cce22cdbfa6875906fb15a718e73ab5MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/14737f5d-ce04-4992-b69b-217b8e933788/downloadbb9bdc0b3349e4284e09149f943790b4MD54falseAnonymousREADTEXTVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.txtVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.txtExtracted texttext/plain105778https://tesis.pucp.edu.pe/bitstreams/557b8dc0-1bca-4cca-b703-758aad1334c4/download5e63960024350b38bd614e2b419ba9adMD55falseAnonymousREADVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.txtVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.txtExtracted texttext/plain12045https://tesis.pucp.edu.pe/bitstreams/8883668d-32b2-403a-b177-4a13a6262824/downloadc60a163f901aa735e9858347a24cf845MD57falseAdministratorREADTHUMBNAILVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.jpgVILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf.jpgGenerated Thumbnailimage/jpeg8133https://tesis.pucp.edu.pe/bitstreams/70f59e2d-956f-4078-89b2-30cafaeda5e3/download587e318d8bde3bad20a6767d5d82f30aMD56falseAnonymousREADVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.jpgVILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf.jpgGenerated Thumbnailimage/jpeg6234https://tesis.pucp.edu.pe/bitstreams/3cd3aa76-b4ed-4342-b3e4-a3acdf2881d7/downloadff25f292eba6e647083757fc294ecf07MD58falseAdministratorREAD20.500.12404/31523oai:tesis.pucp.edu.pe:20.500.12404/315232025-08-15 09:06:04.797http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0IG93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLCB0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZyB0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sIGluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlIHN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yIHB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZSB0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQgdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uIGFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LCB5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZSBjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdCBzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkIHdpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRCBCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUgRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSCBDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZSBzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMgbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.918182 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).