Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view

Descripción del Articulo

En la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de...

Descripción completa

Detalles Bibliográficos
Autor: Cortés Tejada, Fernando Javier
Formato: tesis de maestría
Fecha de Publicación:2020
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:inglés
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/17386
Enlace del recurso:http://hdl.handle.net/20.500.12404/17386
Nivel de acceso:acceso abierto
Materia:Estadística bayesiana
Análisis de regresión
Estadística--Modelos matemáticos
https://purl.org/pe-repo/ocde/ford#1.01.03
id PUCP_645e5174b71a2177a03a71e66abac97d
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/17386
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
title Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
spellingShingle Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
Cortés Tejada, Fernando Javier
Estadística bayesiana
Análisis de regresión
Estadística--Modelos matemáticos
https://purl.org/pe-repo/ocde/ford#1.01.03
title_short Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
title_full Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
title_fullStr Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
title_full_unstemmed Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
title_sort Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
author Cortés Tejada, Fernando Javier
author_facet Cortés Tejada, Fernando Javier
author_role author
dc.contributor.advisor.fl_str_mv Bayes Rodríguez, Cristian Luis
dc.contributor.author.fl_str_mv Cortés Tejada, Fernando Javier
dc.subject.es_ES.fl_str_mv Estadística bayesiana
Análisis de regresión
Estadística--Modelos matemáticos
topic Estadística bayesiana
Análisis de regresión
Estadística--Modelos matemáticos
https://purl.org/pe-repo/ocde/ford#1.01.03
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.01.03
description En la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de los modelos propuestos permiten modelar distintos efectos, como modelar directamente la media marginal a través de covariables e interpretar fácilmente su efecto sobre ella o modelar la media condicional y las probabilidades de inflación de forma separada. Además, se forman clústeres de grupos de individuos con perfiles longitudinales similares a través de una variable latente, asumiendo que las variables respuesta siguen un modelo de mixtura finita. Debido a la complejidad de los modelos, los parámetros se estiman desde un punto de vista bayesiano, a partir de simulaciones MCMC utilizando el software JAGS en R. Se prueban los modelos propuestos sobre diferentes bases de datos simulados para medir el desempeño de los mismos y se comparan con otros modelos a fin de verificar cual ajusta mejor los perfiles longitudinales de variables fraccionarias mixtas y variables binarias. Por último, se aplican los modelos propuestos a datos reales de un banco peruano, con información del ratio de uso de tarjetas de crédito en el periodo de un año, estado de default del cliente y otras covariables correspondientes al cliente poseedor de la tarjeta, con el objetivo de obtener clústeres de individuos con similar ratio de uso de tarjeta de crédito y relacionarlos con la probabilidad de caer en default que presenta cada grupo.
publishDate 2020
dc.date.accessioned.none.fl_str_mv 2020-10-27T22:06:11Z
dc.date.available.none.fl_str_mv 2020-10-27T22:06:11Z
dc.date.created.none.fl_str_mv 2020
dc.date.issued.fl_str_mv 2020-10-27
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/17386
url http://hdl.handle.net/20.500.12404/17386
dc.language.iso.es_ES.fl_str_mv eng
language eng
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-sa/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/ba934257-aba5-4f97-8461-f543a44fec79/download
https://tesis.pucp.edu.pe/bitstreams/ecdd18ce-a643-4dd2-92e9-ce42933d3d2d/download
https://tesis.pucp.edu.pe/bitstreams/88781f58-04c9-4457-9f77-02b5086e3ce2/download
https://tesis.pucp.edu.pe/bitstreams/cbf5e46c-32ec-4c99-830c-988a246f8f9d/download
https://tesis.pucp.edu.pe/bitstreams/ad342c2d-9419-482b-8855-928e54dd9a06/download
https://tesis.pucp.edu.pe/bitstreams/f13392da-3e6a-44f4-ab0c-e063b6b139db/download
https://tesis.pucp.edu.pe/bitstreams/7ecbadcf-7d8a-4a69-bf85-87755bc01e8f/download
https://tesis.pucp.edu.pe/bitstreams/58951b8a-d01e-4cb3-b4a9-c44f3d641740/download
https://tesis.pucp.edu.pe/bitstreams/336c5304-f22a-4192-9271-3289ec05b83e/download
https://tesis.pucp.edu.pe/bitstreams/e6512ceb-8722-40c2-b5bf-e7b53e7d58d1/download
https://tesis.pucp.edu.pe/bitstreams/dfc59908-c441-4e05-9b04-25df7d9c84d1/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
8fc46f5e71650fd7adee84a69b9163c2
50f21090422e5108407077e21084e993
40369acadf88e2e5ecf96d9342dfe482
40369acadf88e2e5ecf96d9342dfe482
40369acadf88e2e5ecf96d9342dfe482
40369acadf88e2e5ecf96d9342dfe482
8d885e969d20c30fa7780a6254f77ecc
8d885e969d20c30fa7780a6254f77ecc
8d885e969d20c30fa7780a6254f77ecc
8d885e969d20c30fa7780a6254f77ecc
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736911734800384
spelling Bayes Rodríguez, Cristian LuisCortés Tejada, Fernando Javier2020-10-27T22:06:11Z2020-10-27T22:06:11Z20202020-10-27http://hdl.handle.net/20.500.12404/17386En la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de los modelos propuestos permiten modelar distintos efectos, como modelar directamente la media marginal a través de covariables e interpretar fácilmente su efecto sobre ella o modelar la media condicional y las probabilidades de inflación de forma separada. Además, se forman clústeres de grupos de individuos con perfiles longitudinales similares a través de una variable latente, asumiendo que las variables respuesta siguen un modelo de mixtura finita. Debido a la complejidad de los modelos, los parámetros se estiman desde un punto de vista bayesiano, a partir de simulaciones MCMC utilizando el software JAGS en R. Se prueban los modelos propuestos sobre diferentes bases de datos simulados para medir el desempeño de los mismos y se comparan con otros modelos a fin de verificar cual ajusta mejor los perfiles longitudinales de variables fraccionarias mixtas y variables binarias. Por último, se aplican los modelos propuestos a datos reales de un banco peruano, con información del ratio de uso de tarjetas de crédito en el periodo de un año, estado de default del cliente y otras covariables correspondientes al cliente poseedor de la tarjeta, con el objetivo de obtener clústeres de individuos con similar ratio de uso de tarjeta de crédito y relacionarlos con la probabilidad de caer en default que presenta cada grupo.The following thesis proposes classi cation models that consist of jointly tting longitudinal pro les of mixed fractional and binary variables modelled by zero-one beta in ated mixed regressions with cluster formation. The distinct proposed parametrizations allow di erent effects to be modelled, such as modelling the marginal mean directly through independent variables and easily interpret its e ect on it or modelling the conditional mean and the in- ation probabilities separately. In addition, individuals with similar fractional longitudinal pro les are grouped into a cluster through a latent variable, assuming that the response variables follow a nite mixture model. Due to the complexity of the models, the parameters are estimated from a Bayesian point of view by simulating a MCMC using JAGS software in R. The proposed models are tted in various simulated datasets and are compared against other models to measure performance in tting fractional longitudinal pro les and binary variables. Finally, an application on real data is conducted, consisting on longitudinal information of credit card utilization ratio and default status as dependants variables and covariates corresponding to client information, aiming to obtain clusters of clients with similar behaviour in evolution of credit card utilization and relate them to their probability of default.TesisengPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/Estadística bayesianaAnálisis de regresiónEstadística--Modelos matemáticoshttps://purl.org/pe-repo/ocde/ford#1.01.03Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of viewinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en EstadísticaMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoEstadística40372640https://orcid.org/0000-0003-0474-7921542037https://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/ba934257-aba5-4f97-8461-f543a44fec79/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81037https://tesis.pucp.edu.pe/bitstreams/ecdd18ce-a643-4dd2-92e9-ce42933d3d2d/download8fc46f5e71650fd7adee84a69b9163c2MD52falseAnonymousREADORIGINALCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdfCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdfTexto completoapplication/pdf44733130https://tesis.pucp.edu.pe/bitstreams/88781f58-04c9-4457-9f77-02b5086e3ce2/download50f21090422e5108407077e21084e993MD51trueAnonymousREADTHUMBNAILCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgIM Thumbnailimage/jpeg16831https://tesis.pucp.edu.pe/bitstreams/cbf5e46c-32ec-4c99-830c-988a246f8f9d/download40369acadf88e2e5ecf96d9342dfe482MD54falseAnonymousREADTHUMBNAILCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgIM Thumbnailimage/jpeg16831https://tesis.pucp.edu.pe/bitstreams/ad342c2d-9419-482b-8855-928e54dd9a06/download40369acadf88e2e5ecf96d9342dfe482MD54falseAnonymousREADTHUMBNAILCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgIM Thumbnailimage/jpeg16831https://tesis.pucp.edu.pe/bitstreams/f13392da-3e6a-44f4-ab0c-e063b6b139db/download40369acadf88e2e5ecf96d9342dfe482MD54falseAnonymousREADTHUMBNAILCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.jpgIM Thumbnailimage/jpeg16831https://tesis.pucp.edu.pe/bitstreams/7ecbadcf-7d8a-4a69-bf85-87755bc01e8f/download40369acadf88e2e5ecf96d9342dfe482MD54falseAnonymousREADTEXTCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtExtracted texttext/plain116398https://tesis.pucp.edu.pe/bitstreams/58951b8a-d01e-4cb3-b4a9-c44f3d641740/download8d885e969d20c30fa7780a6254f77eccMD55falseAnonymousREADTEXTCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtExtracted texttext/plain116398https://tesis.pucp.edu.pe/bitstreams/336c5304-f22a-4192-9271-3289ec05b83e/download8d885e969d20c30fa7780a6254f77eccMD55falseAnonymousREADTEXTCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtExtracted texttext/plain116398https://tesis.pucp.edu.pe/bitstreams/e6512ceb-8722-40c2-b5bf-e7b53e7d58d1/download8d885e969d20c30fa7780a6254f77eccMD55falseAnonymousREADTEXTCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtCORTES_TEJADA_FERNANDO_JOINTLY_MODELLING_CLUSTER.pdf.txtExtracted texttext/plain116398https://tesis.pucp.edu.pe/bitstreams/dfc59908-c441-4e05-9b04-25df7d9c84d1/download8d885e969d20c30fa7780a6254f77eccMD55falseAnonymousREAD20.500.12404/17386oai:tesis.pucp.edu.pe:20.500.12404/173862025-03-28 15:00:09.105http://creativecommons.org/licenses/by-nc-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.977288
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).