Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning
Descripción del Articulo
El cáncer de seno, es una de las enfermedades, que aproximadamente genera 2.26 millones de muertes a nivel mundial anualmente, según la Organización Mundial de la Salud. El diagnóstico de la enfermedad, en etapas iniciales es importante, para permitir un tratamiento que elimine y/o alivie las consec...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Nacional Del Altiplano |
| Repositorio: | UNAP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:https://repositorio.unap.edu.pe:20.500.14082/21675 |
| Enlace del recurso: | https://repositorio.unap.edu.pe/handle/20.500.14082/21675 |
| Nivel de acceso: | acceso abierto |
| Materia: | Aprendizaje automático Cáncer de seno Ensambles Expresión génica Microarray Welch ANOVA https://purl.org/pe-repo/ocde/ford#1.02.03 |
| id |
RNAP_70f390c166389161dbc234bdf6faaa45 |
|---|---|
| oai_identifier_str |
oai:https://repositorio.unap.edu.pe:20.500.14082/21675 |
| network_acronym_str |
RNAP |
| network_name_str |
UNAP-Institucional |
| repository_id_str |
9382 |
| dc.title.es_PE.fl_str_mv |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| title |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| spellingShingle |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning Palma Ttito, Luis Beltran Aprendizaje automático Cáncer de seno Ensambles Expresión génica Microarray Welch ANOVA https://purl.org/pe-repo/ocde/ford#1.02.03 |
| title_short |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| title_full |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| title_fullStr |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| title_full_unstemmed |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| title_sort |
Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learning |
| author |
Palma Ttito, Luis Beltran |
| author_facet |
Palma Ttito, Luis Beltran |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Canqui Flores, Bernabé |
| dc.contributor.author.fl_str_mv |
Palma Ttito, Luis Beltran |
| dc.subject.es_PE.fl_str_mv |
Aprendizaje automático Cáncer de seno Ensambles Expresión génica Microarray Welch ANOVA |
| topic |
Aprendizaje automático Cáncer de seno Ensambles Expresión génica Microarray Welch ANOVA https://purl.org/pe-repo/ocde/ford#1.02.03 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.03 |
| description |
El cáncer de seno, es una de las enfermedades, que aproximadamente genera 2.26 millones de muertes a nivel mundial anualmente, según la Organización Mundial de la Salud. El diagnóstico de la enfermedad, en etapas iniciales es importante, para permitir un tratamiento que elimine y/o alivie las consecuencias del mismo. Proveer de diversas técnicas para la detección del cáncer de seno, dará mayores opciones a los pacientes para el diagnóstico, y permitirá la disminución de costos. Por ello, es necesario conocer, ¿qué ensambles heterogéneos de aprendizaje automático, tiene mejor predicción de cáncer de seno, a partir de datos de expresiones géneticas de microarray?. En la presente investigación, se diseñó e implemento, cuatro ensambles de algoritmos heterogéneos: voting, bagging, boosting y stacking, los cuales fueron entrenados con un dataset de 4113 muestras miARN, cada uno con 2542 atributos, luego se aplicó los test Welch ANOVA y test de Games Showel, con diez resultados de exactitud, obtenidos por validación cruzada, y se detectó, que los ensambles no presentan diferencias significativas, logrando alcanzar una exactitud de predicción promedio de 98.23%. También se aplicó la misma metodología a, 121 muestras ADN extraídas por biopsia de células de mama, que constan de 54676 atributos, obteniendo una exactitud de predicción promedio de 99.99%. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2024-02-05T16:47:32Z |
| dc.date.available.none.fl_str_mv |
2024-02-05T16:47:32Z |
| dc.date.issued.fl_str_mv |
2023-05-22 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| dc.type.version.es_PE.fl_str_mv |
info:eu-repo/semantics/acceptedVersion |
| format |
doctoralThesis |
| status_str |
acceptedVersion |
| dc.identifier.uri.none.fl_str_mv |
https://repositorio.unap.edu.pe/handle/20.500.14082/21675 |
| url |
https://repositorio.unap.edu.pe/handle/20.500.14082/21675 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional del Altiplano. Repositorio Institucional - UNAP |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:UNAP-Institucional instname:Universidad Nacional Del Altiplano instacron:UNAP |
| instname_str |
Universidad Nacional Del Altiplano |
| instacron_str |
UNAP |
| institution |
UNAP |
| reponame_str |
UNAP-Institucional |
| collection |
UNAP-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/1/Luis_Beltran_Palma_Ttito.pdf https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/3/REPORTE%20DE%20SIMILITUD.pdf https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/2/license.txt |
| bitstream.checksum.fl_str_mv |
c0a5d1da98868fcf44bcfd5ee7f24b3c c4f650bd1240def7e5da5f50951be2bf 8a4605be74aa9ea9d79846c1fba20a33 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio institucional de la Universidad Nacional del Altiplano |
| repository.mail.fl_str_mv |
dspace-help@myu.edu |
| _version_ |
1819880782631534592 |
| spelling |
Canqui Flores, BernabéPalma Ttito, Luis Beltran2024-02-05T16:47:32Z2024-02-05T16:47:32Z2023-05-22https://repositorio.unap.edu.pe/handle/20.500.14082/21675El cáncer de seno, es una de las enfermedades, que aproximadamente genera 2.26 millones de muertes a nivel mundial anualmente, según la Organización Mundial de la Salud. El diagnóstico de la enfermedad, en etapas iniciales es importante, para permitir un tratamiento que elimine y/o alivie las consecuencias del mismo. Proveer de diversas técnicas para la detección del cáncer de seno, dará mayores opciones a los pacientes para el diagnóstico, y permitirá la disminución de costos. Por ello, es necesario conocer, ¿qué ensambles heterogéneos de aprendizaje automático, tiene mejor predicción de cáncer de seno, a partir de datos de expresiones géneticas de microarray?. En la presente investigación, se diseñó e implemento, cuatro ensambles de algoritmos heterogéneos: voting, bagging, boosting y stacking, los cuales fueron entrenados con un dataset de 4113 muestras miARN, cada uno con 2542 atributos, luego se aplicó los test Welch ANOVA y test de Games Showel, con diez resultados de exactitud, obtenidos por validación cruzada, y se detectó, que los ensambles no presentan diferencias significativas, logrando alcanzar una exactitud de predicción promedio de 98.23%. También se aplicó la misma metodología a, 121 muestras ADN extraídas por biopsia de células de mama, que constan de 54676 atributos, obteniendo una exactitud de predicción promedio de 99.99%.application/pdfspaUniversidad Nacional del Altiplano. Repositorio Institucional - UNAPPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esAprendizaje automáticoCáncer de senoEnsamblesExpresión génicaMicroarrayWelch ANOVAhttps://purl.org/pe-repo/ocde/ford#1.02.03Predicción de cáncer en expresiones genéticas de microarrays mediante un ensamble de modelos heterogéneos de machine learninginfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/acceptedVersionreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPSUNEDUDoctor en Ciencias de la ComputaciónCiencias de la ComputaciónUniversidad Nacional del Altiplano. Escuela de Posgradohttps://orcid.org/0000-0003-2204-062001221978https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#doctor611028Coyla Idme, LeonelJuarez Vargas, Juan CarlosJiménez Chura, Adolfo Carlos23949672ORIGINALLuis_Beltran_Palma_Ttito.pdfLuis_Beltran_Palma_Ttito.pdfapplication/pdf10084905https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/1/Luis_Beltran_Palma_Ttito.pdfc0a5d1da98868fcf44bcfd5ee7f24b3cMD51REPORTE DE SIMILITUD.pdfREPORTE DE SIMILITUD.pdfapplication/pdf7052483https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/3/REPORTE%20DE%20SIMILITUD.pdfc4f650bd1240def7e5da5f50951be2bfMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unap.edu.pe/bitstream/20.500.14082/21675/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD5220.500.14082/21675oai:https://repositorio.unap.edu.pe:20.500.14082/216752024-02-05 16:51:23.883Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.eduTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.936249 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).