Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer

Descripción del Articulo

personalizadas basadas en Neoantígenos. Sin embargo, el proceso para identificar Neoantígenos, es complejo y existen varias etapas para lograrlo, desde el secuenciamiento de muestras tumorales, alineamiento con muestras de tejido saludable, identificación y anotación de mutaciones, para luego proseg...

Descripción completa

Detalles Bibliográficos
Autor: Machaca Arceda, Vicente Enrique
Formato: tesis doctoral
Fecha de Publicación:2023
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/17856
Enlace del recurso:https://hdl.handle.net/20.500.12773/17856
Nivel de acceso:acceso abierto
Materia:Transformers
Transfer learning
Neoantígenos
Cáncer
deep learning
https://purl.org/pe-repo/ocde/ford#1.02.01
id UNSA_9502151b40b6034e71e08bf088c39699
oai_identifier_str oai:repositorio.unsa.edu.pe:20.500.12773/17856
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
dc.title.es_PE.fl_str_mv Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
title Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
spellingShingle Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
Machaca Arceda, Vicente Enrique
Transformers
Transfer learning
Neoantígenos
Cáncer
deep learning
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
title_full Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
title_fullStr Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
title_full_unstemmed Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
title_sort Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
author Machaca Arceda, Vicente Enrique
author_facet Machaca Arceda, Vicente Enrique
author_role author
dc.contributor.advisor.fl_str_mv Lopez Del Alamo, Cristian Jose
dc.contributor.author.fl_str_mv Machaca Arceda, Vicente Enrique
dc.subject.es_PE.fl_str_mv Transformers
Transfer learning
Neoantígenos
Cáncer
deep learning
topic Transformers
Transfer learning
Neoantígenos
Cáncer
deep learning
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
description personalizadas basadas en Neoantígenos. Sin embargo, el proceso para identificar Neoantígenos, es complejo y existen varias etapas para lograrlo, desde el secuenciamiento de muestras tumorales, alineamiento con muestras de tejido saludable, identificación y anotación de mutaciones, para luego proseguir con la predicción de la unión de péptidos con el MHC y posteriormente la unión del pMHC con el TCR. Si esta unión procede, el péptido en cuestión es un fuerte candidato a Neoantígenos. En este proceso, una de las fases más críticas es la predicción de la unión pMHC, lo cual ha motivado el desarrollo de esta tesis. Además, las redes neuronales Transformers han revolucionado el campo del procesamiento natural del lenguaje y se han aplicado en muchas otras áreas como en Proteómica. Esto porque las proteínas al ser representadas como secuencias de amino ácidos, son muy similares a las secuencias de palabras en una oración. Es así, que otras investigaciones han aplicado el uso de Transformers y redes neuronales con mecanismos de atención para la predicción de la unión pMHC. Adicionalmente, existen modelos pre-entrenados como TAPE, ProtBert y ESM2, estos han sido entrenados con grandes volúmenes de datos para varias tareas de Proteómica. Basados en lo anterior, en esta tesis se propone el uso de aplicar fine-tuning a TAPE, ProtBert, ESM2(t6), ESM2(t12), ESM2(t30) y ESM2(t33) para la tarea de predicción de la unión pMHC, el fine-tunning consistió en agregar un bloque BiLSTM al final del modelo. Además, se ha evaluado el uso de Gradient Accumulation Steps (GAS) y una metodología de congelamiento de capas. Luego de los experimentos, los modelos con mejores resultados fueron TAPE-GAS, que resultó de aplicar GAS a TAPE y ESM2(t6)-Freeze, que resultó de aplicar la metodología de congelamiento a ESM2. Finalmente, se compararon estos modelos con los métodos de mejor resultado en el estado del arte, tales como: NetMHCpan4.1, MHCflurry2.0, ACME, Anthem y MixMHCpred2.2. Al finalizar los experimentos, TAPE-GAS y ESM2-Freeze superaron a los otros métodos en accuracy, AUC, precisión, f1-score y MCC. En términos de AUC, TAPE-GAS y ESM2(t6)-Freeze obtuvieron 0.9841 y 0.9830 respectivamente, frente a 0.9557 y 0.9642 de NetMHCpan4.1 y MhcFlurry2.0.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2024-05-20T15:54:07Z
dc.date.available.none.fl_str_mv 2024-05-20T15:54:07Z
dc.date.issued.fl_str_mv 2023
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12773/17856
url https://hdl.handle.net/20.500.12773/17856
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/a1ef46db-95d6-4147-a40c-45eaad9fd933/download
https://repositorio.unsa.edu.pe/bitstreams/5efd91b2-317a-4492-a665-94a01c4d10a8/download
https://repositorio.unsa.edu.pe/bitstreams/c78f4bd7-65b0-4a8e-8fb9-21e17b303a2b/download
bitstream.checksum.fl_str_mv 76fa5fb46482a99daa32993ed86f6452
a074183a93fee968d4e39fc8687309bc
6ce4daa50a3ff39d63fa1935ac7cd957
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv repositorio@unsa.edu.pe
_version_ 1828763010700673024
spelling Lopez Del Alamo, Cristian JoseMachaca Arceda, Vicente Enrique2024-05-20T15:54:07Z2024-05-20T15:54:07Z2023personalizadas basadas en Neoantígenos. Sin embargo, el proceso para identificar Neoantígenos, es complejo y existen varias etapas para lograrlo, desde el secuenciamiento de muestras tumorales, alineamiento con muestras de tejido saludable, identificación y anotación de mutaciones, para luego proseguir con la predicción de la unión de péptidos con el MHC y posteriormente la unión del pMHC con el TCR. Si esta unión procede, el péptido en cuestión es un fuerte candidato a Neoantígenos. En este proceso, una de las fases más críticas es la predicción de la unión pMHC, lo cual ha motivado el desarrollo de esta tesis. Además, las redes neuronales Transformers han revolucionado el campo del procesamiento natural del lenguaje y se han aplicado en muchas otras áreas como en Proteómica. Esto porque las proteínas al ser representadas como secuencias de amino ácidos, son muy similares a las secuencias de palabras en una oración. Es así, que otras investigaciones han aplicado el uso de Transformers y redes neuronales con mecanismos de atención para la predicción de la unión pMHC. Adicionalmente, existen modelos pre-entrenados como TAPE, ProtBert y ESM2, estos han sido entrenados con grandes volúmenes de datos para varias tareas de Proteómica. Basados en lo anterior, en esta tesis se propone el uso de aplicar fine-tuning a TAPE, ProtBert, ESM2(t6), ESM2(t12), ESM2(t30) y ESM2(t33) para la tarea de predicción de la unión pMHC, el fine-tunning consistió en agregar un bloque BiLSTM al final del modelo. Además, se ha evaluado el uso de Gradient Accumulation Steps (GAS) y una metodología de congelamiento de capas. Luego de los experimentos, los modelos con mejores resultados fueron TAPE-GAS, que resultó de aplicar GAS a TAPE y ESM2(t6)-Freeze, que resultó de aplicar la metodología de congelamiento a ESM2. Finalmente, se compararon estos modelos con los métodos de mejor resultado en el estado del arte, tales como: NetMHCpan4.1, MHCflurry2.0, ACME, Anthem y MixMHCpred2.2. Al finalizar los experimentos, TAPE-GAS y ESM2-Freeze superaron a los otros métodos en accuracy, AUC, precisión, f1-score y MCC. En términos de AUC, TAPE-GAS y ESM2(t6)-Freeze obtuvieron 0.9841 y 0.9830 respectivamente, frente a 0.9557 y 0.9642 de NetMHCpan4.1 y MhcFlurry2.0.application/pdfhttps://hdl.handle.net/20.500.12773/17856spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSATransformersTransfer learningNeoantígenosCáncerdeep learninghttps://purl.org/pe-repo/ocde/ford#1.02.01Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncerinfo:eu-repo/semantics/doctoralThesisSUNEDU29708892https://orcid.org/0000-0002-2568-650X43684244611028Tupac Valdivia, Yvan JesusSarmiento Calisaya, EdgarYari Ramos, Yessenia DeysiMamani Aliaga, Alvaro HenryLopez Del Alamo, Cristian Josehttps://purl.org/pe-repo/renati/level#doctorhttps://purl.org/pe-repo/renati/type#tesisDoctorado en Ciencias de la ComputaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ingeniería de Producción y ServiciosDoctor en Ciencias de la ComputaciónORIGINALTesis.pdfapplication/pdf8996461https://repositorio.unsa.edu.pe/bitstreams/a1ef46db-95d6-4147-a40c-45eaad9fd933/download76fa5fb46482a99daa32993ed86f6452MD51Reporte de Similitud.pdfapplication/pdf622165https://repositorio.unsa.edu.pe/bitstreams/5efd91b2-317a-4492-a665-94a01c4d10a8/downloada074183a93fee968d4e39fc8687309bcMD52Autorización de Publicación Digital.pdfapplication/pdf397576https://repositorio.unsa.edu.pe/bitstreams/c78f4bd7-65b0-4a8e-8fb9-21e17b303a2b/download6ce4daa50a3ff39d63fa1935ac7cd957MD5320.500.12773/17856oai:repositorio.unsa.edu.pe:20.500.12773/178562024-09-11 09:06:51.457http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe
score 13.936249
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).