Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning

Descripción del Articulo

El cáncer de seno, es una de las enfermedades, que aproximadamente genera 2.26 millones de muertes a nivel mundial anualmente, según la Organización Mundial de la Salud. El diagnóstico de la enfermedad, en etapas iniciales es importante, para permitir un tratamiento que elimine y/o alivie las consec...

Descripción completa

Detalles Bibliográficos
Autor: Palma Ttito, Luis Beltran
Formato: tesis doctoral
Fecha de Publicación:2023
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/21675
Enlace del recurso:https://repositorio.unap.edu.pe/handle/20.500.14082/21675
Nivel de acceso:acceso abierto
Materia:Aprendizaje automático
Cáncer de seno
Ensambles
Expresión génica
Microarray
Welch ANOVA
https://purl.org/pe-repo/ocde/ford#1.02.03
id RNAP_70f390c166389161dbc234bdf6faaa45
oai_identifier_str oai:https://repositorio.unap.edu.pe:20.500.14082/21675
network_acronym_str RNAP
network_name_str UNAP-Institucional
repository_id_str 9382
dc.title.es_PE.fl_str_mv Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
title Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
spellingShingle Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
Palma Ttito, Luis Beltran
Aprendizaje automático
Cáncer de seno
Ensambles
Expresión génica
Microarray
Welch ANOVA
https://purl.org/pe-repo/ocde/ford#1.02.03
title_short Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
title_full Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
title_fullStr Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
title_full_unstemmed Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
title_sort Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
author Palma Ttito, Luis Beltran
author_facet Palma Ttito, Luis Beltran
author_role author
dc.contributor.advisor.fl_str_mv Canqui Flores, Bernabé
dc.contributor.author.fl_str_mv Palma Ttito, Luis Beltran
dc.subject.es_PE.fl_str_mv Aprendizaje automático
Cáncer de seno
Ensambles
Expresión génica
Microarray
Welch ANOVA
topic Aprendizaje automático
Cáncer de seno
Ensambles
Expresión génica
Microarray
Welch ANOVA
https://purl.org/pe-repo/ocde/ford#1.02.03
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.03
description El cáncer de seno, es una de las enfermedades, que aproximadamente genera 2.26 millones de muertes a nivel mundial anualmente, según la Organización Mundial de la Salud. El diagnóstico de la enfermedad, en etapas iniciales es importante, para permitir un tratamiento que elimine y/o alivie las consecuencias del mismo. Proveer de diversas técnicas para la detección del cáncer de seno, dará mayores opciones a los pacientes para el diagnóstico, y permitirá la disminución de costos. Por ello, es necesario conocer, ¿qué ensambles heterogéneos de aprendizaje automático, tiene mejor predicción de cáncer de seno, a partir de datos de expresiones géneticas de microarray?. En la presente investigación, se diseñó e implemento, cuatro ensambles de algoritmos heterogéneos: voting, bagging, boosting y stacking, los cuales fueron entrenados con un dataset de 4113 muestras miARN, cada uno con 2542 atributos, luego se aplicó los test Welch ANOVA y test de Games Showel, con diez resultados de exactitud, obtenidos por validación cruzada, y se detectó, que los ensambles no presentan diferencias significativas, logrando alcanzar una exactitud de predicción promedio de 98.23%. También se aplicó la misma metodología a, 121 muestras ADN extraídas por biopsia de células de mama, que constan de 54676 atributos, obteniendo una exactitud de predicción promedio de 99.99%.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2024-02-05T16:47:32Z
dc.date.available.none.fl_str_mv 2024-02-05T16:47:32Z
dc.date.issued.fl_str_mv 2023-05-22
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/doctoralThesis
dc.type.version.es_PE.fl_str_mv info:eu-repo/semantics/acceptedVersion
format doctoralThesis
status_str acceptedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.unap.edu.pe/handle/20.500.14082/21675
url https://repositorio.unap.edu.pe/handle/20.500.14082/21675
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Altiplano. Repositorio Institucional - UNAP
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.none.fl_str_mv reponame:UNAP-Institucional
instname:Universidad Nacional Del Altiplano
instacron:UNAP
instname_str Universidad Nacional Del Altiplano
instacron_str UNAP
institution UNAP
reponame_str UNAP-Institucional
collection UNAP-Institucional
bitstream.url.fl_str_mv https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/1/Luis_Beltran_Palma_Ttito.pdf
https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/3/REPORTE%20DE%20SIMILITUD.pdf
https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/2/license.txt
bitstream.checksum.fl_str_mv c0a5d1da98868fcf44bcfd5ee7f24b3c
c4f650bd1240def7e5da5f50951be2bf
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional de la Universidad Nacional del Altiplano
repository.mail.fl_str_mv dspace-help@myu.edu
_version_ 1819880782631534592
spelling Canqui Flores, BernabéPalma Ttito, Luis Beltran2024-02-05T16:47:32Z2024-02-05T16:47:32Z2023-05-22https://repositorio.unap.edu.pe/handle/20.500.14082/21675El cáncer de seno, es una de las enfermedades, que aproximadamente genera 2.26 millones de muertes a nivel mundial anualmente, según la Organización Mundial de la Salud. El diagnóstico de la enfermedad, en etapas iniciales es importante, para permitir un tratamiento que elimine y/o alivie las consecuencias del mismo. Proveer de diversas técnicas para la detección del cáncer de seno, dará mayores opciones a los pacientes para el diagnóstico, y permitirá la disminución de costos. Por ello, es necesario conocer, ¿qué ensambles heterogéneos de aprendizaje automático, tiene mejor predicción de cáncer de seno, a partir de datos de expresiones géneticas de microarray?. En la presente investigación, se diseñó e implemento, cuatro ensambles de algoritmos heterogéneos: voting, bagging, boosting y stacking, los cuales fueron entrenados con un dataset de 4113 muestras miARN, cada uno con 2542 atributos, luego se aplicó los test Welch ANOVA y test de Games Showel, con diez resultados de exactitud, obtenidos por validación cruzada, y se detectó, que los ensambles no presentan diferencias significativas, logrando alcanzar una exactitud de predicción promedio de 98.23%. También se aplicó la misma metodología a, 121 muestras ADN extraídas por biopsia de células de mama, que constan de 54676 atributos, obteniendo una exactitud de predicción promedio de 99.99%.application/pdfspaUniversidad Nacional del Altiplano. Repositorio Institucional - UNAPPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esAprendizaje automáticoCáncer de senoEnsamblesExpresión génicaMicroarrayWelch ANOVAhttps://purl.org/pe-repo/ocde/ford#1.02.03Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learninginfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPSUNEDUDoctor en Ciencias de la ComputaciónCiencias de la ComputaciónUniversidad Nacional del Altiplano. Escuela de Posgradohttps://orcid.org/0000-0003-2204-062001221978https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#doctor611028Coyla Idme, LeonelJuarez Vargas, Juan CarlosJiménez Chura, Adolfo Carlos23949672ORIGINALLuis_Beltran_Palma_Ttito.pdfLuis_Beltran_Palma_Ttito.pdfapplication/pdf10084905https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/1/Luis_Beltran_Palma_Ttito.pdfc0a5d1da98868fcf44bcfd5ee7f24b3cMD51REPORTE DE SIMILITUD.pdfREPORTE DE SIMILITUD.pdfapplication/pdf7052483https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/3/REPORTE%20DE%20SIMILITUD.pdfc4f650bd1240def7e5da5f50951be2bfMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5220.500.14082/21675oai:https://repositorio.unap.edu.pe:20.500.14082/216752024-02-05 16:51:23.883Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.eduTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.936249
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).