Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo

Descripción del Articulo

Este trabajo de investigación aborda el problema de falta de robustez, mediante el reemplazo de la matriz de covarianzas obtenida con el método clásico, por la matriz de covarianzas obtenida con el método robusto MCD (Todorov y Filzmoser, 2009). El método robusto MCD: Minimun Covariance Determinant,...

Descripción completa

Detalles Bibliográficos
Autor: Hualpa Benavente, Flor Patricia
Formato: tesis de grado
Fecha de Publicación:2012
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/3136
Enlace del recurso:https://hdl.handle.net/20.500.12672/3136
Nivel de acceso:acceso abierto
Materia:Análisis de covarianza
Análisis de varianza
https://purl.org/pe-repo/ocde/ford#1.01.03
id UNMS_1d37b18d38e16e797873ceee2df3adf1
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/3136
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.none.fl_str_mv Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
title Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
spellingShingle Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
Hualpa Benavente, Flor Patricia
Análisis de covarianza
Análisis de varianza
https://purl.org/pe-repo/ocde/ford#1.01.03
title_short Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
title_full Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
title_fullStr Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
title_full_unstemmed Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
title_sort Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimo
author Hualpa Benavente, Flor Patricia
author_facet Hualpa Benavente, Flor Patricia
author_role author
dc.contributor.advisor.fl_str_mv Gómez Ticerán, Doris Albina
dc.contributor.author.fl_str_mv Hualpa Benavente, Flor Patricia
dc.subject.none.fl_str_mv Análisis de covarianza
Análisis de varianza
topic Análisis de covarianza
Análisis de varianza
https://purl.org/pe-repo/ocde/ford#1.01.03
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.01.03
description Este trabajo de investigación aborda el problema de falta de robustez, mediante el reemplazo de la matriz de covarianzas obtenida con el método clásico, por la matriz de covarianzas obtenida con el método robusto MCD (Todorov y Filzmoser, 2009). El método robusto MCD: Minimun Covariance Determinant, consiste en realizar las estimaciones para el vector de medias y la matriz de covarianzas a partir de la selección de una submuestra obtenida del remuestreo del conjunto de datos en estudio, cuya característica principal es que tiene la matriz de covarianzas con determinante mínimo. Muchas veces, el análisis estadístico en presencia de datos atípicos, mediante métodos clásicos, puede llevar a conclusiones erróneas debido a la sensibilidad de dichos métodos, por ello el objetivo del presente trabajo es presentar la metodología de los estimadores MCD, a fin de conseguir una “matriz de covarianzas robustificada” la cual será utilizada para realizar el Análisis de Componentes Principales en conjuntos de datos con presencia de observaciones atípicas. Se ilustra la metodología de la teoría y la aplicación para dos conjuntos de datos, resultados de investigaciones en la Botánica (Quinteros, 2010 y Gómez, et. al., 2008), se analiza el comportamiento de las Componentes Principales con la metodología MCD y se compara con la metodología clásica. Se determina que las Componentes Principales obtenidas por el método de MCD permiten encontrar mejores indicadores para los conjuntos de datos que tienen valores atípicos. -- Palabras clave: Minimum Covariance Determinant, MCD, Componentes Principales, Estimación Robusta, Matriz de Varianzas y Covarianzas.
publishDate 2012
dc.date.accessioned.none.fl_str_mv 2013-10-03T21:40:30Z
dc.date.available.none.fl_str_mv 2013-10-03T21:40:30Z
dc.date.issued.fl_str_mv 2012
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/3136
url https://hdl.handle.net/20.500.12672/3136
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.source.none.fl_str_mv Universidad Nacional Mayor de San Marcos
Repositorio de Tesis - UNMSM
reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/0e0538c0-12a6-4ced-bd80-dcbb8f56eb0c/download
https://cybertesis.unmsm.edu.pe/bitstreams/5db93c38-a53f-4a54-a762-56a9ee3f088e/download
https://cybertesis.unmsm.edu.pe/bitstreams/c75d9e17-a5e4-4590-8835-918c848954ad/download
bitstream.checksum.fl_str_mv 6f54d7254bdb6e8684d78b1ec5788f1d
873235d1a267501c2393f0e38afd5461
5d1d876c3fc0ee6b7c53f64269f2e3df
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1845982976421134336
spelling Gómez Ticerán, Doris AlbinaHualpa Benavente, Flor Patricia2013-10-03T21:40:30Z2013-10-03T21:40:30Z2012https://hdl.handle.net/20.500.12672/3136Este trabajo de investigación aborda el problema de falta de robustez, mediante el reemplazo de la matriz de covarianzas obtenida con el método clásico, por la matriz de covarianzas obtenida con el método robusto MCD (Todorov y Filzmoser, 2009). El método robusto MCD: Minimun Covariance Determinant, consiste en realizar las estimaciones para el vector de medias y la matriz de covarianzas a partir de la selección de una submuestra obtenida del remuestreo del conjunto de datos en estudio, cuya característica principal es que tiene la matriz de covarianzas con determinante mínimo. Muchas veces, el análisis estadístico en presencia de datos atípicos, mediante métodos clásicos, puede llevar a conclusiones erróneas debido a la sensibilidad de dichos métodos, por ello el objetivo del presente trabajo es presentar la metodología de los estimadores MCD, a fin de conseguir una “matriz de covarianzas robustificada” la cual será utilizada para realizar el Análisis de Componentes Principales en conjuntos de datos con presencia de observaciones atípicas. Se ilustra la metodología de la teoría y la aplicación para dos conjuntos de datos, resultados de investigaciones en la Botánica (Quinteros, 2010 y Gómez, et. al., 2008), se analiza el comportamiento de las Componentes Principales con la metodología MCD y se compara con la metodología clásica. Se determina que las Componentes Principales obtenidas por el método de MCD permiten encontrar mejores indicadores para los conjuntos de datos que tienen valores atípicos. -- Palabras clave: Minimum Covariance Determinant, MCD, Componentes Principales, Estimación Robusta, Matriz de Varianzas y Covarianzas.--- This research addresses the problem of lack of robustness, by replacing the covariance matrix obtained with the classical method for the covariance matrix obtained with the robust MCD method (Todorov and Filzmoser, 2009). The robust method MCD: Minimun Covariance Determinant, involves making estimates for the mean vector and covariance matrix from the selection of a subsample obtained from the resampling of the data set under study, whose main characteristic is that it has the covariance matrix with the minimum determinant. Many times, the statistical analysis in the presence of outliers, by standard methods, can be misleading because of the sensitivity of these methods, which is why the objective of this paper is to present the methodology of the MCD estimators in order to achieve the “robustified covariance matrix“ which will be used to perform Principal Component Analysis on data sets with the presence of outliers. We illustrate the methodology of the theory and application, for two sets of data, research results in the Botany (Quinteros, 2010 and Gomez, et. Al., 2008), we analyze the behavior of the Principal Components with the MCD method and we compare it to the classic methodology. It is determined that the principal components obtained by the MCD method allows to find better indicators for data sets with outliers. -- Keywords: Minimum Covariance Determinant, MCD, Principal Components, Robust Estimation, Scatter Matrix.TesisspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMAnálisis de covarianzaAnálisis de varianzahttps://purl.org/pe-repo/ocde/ford#1.01.03Componentes principales mediante el método robusto MCD: Matriz de covarianzas de determinante mínimoinfo:eu-repo/semantics/bachelorThesisSUNEDULicenciado en EstadísticaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Académico Profesional de EstadísticaEstadística08575257https://orcid.org/0000-0001-9253-3661https://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALHualpa_bf.pdfapplication/pdf19440952https://cybertesis.unmsm.edu.pe/bitstreams/0e0538c0-12a6-4ced-bd80-dcbb8f56eb0c/download6f54d7254bdb6e8684d78b1ec5788f1dMD51TEXTHualpa_bf.pdf.txtHualpa_bf.pdf.txtExtracted texttext/plain102878https://cybertesis.unmsm.edu.pe/bitstreams/5db93c38-a53f-4a54-a762-56a9ee3f088e/download873235d1a267501c2393f0e38afd5461MD54THUMBNAILHualpa_bf.pdf.jpgHualpa_bf.pdf.jpgGenerated Thumbnailimage/jpeg13109https://cybertesis.unmsm.edu.pe/bitstreams/c75d9e17-a5e4-4590-8835-918c848954ad/download5d1d876c3fc0ee6b7c53f64269f2e3dfMD5520.500.12672/3136oai:cybertesis.unmsm.edu.pe:20.500.12672/31362024-08-15 23:19:19.658https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.pe
score 13.039981
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).