Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer
Descripción del Articulo
personalizadas basadas en Neoantígenos. Sin embargo, el proceso para identificar Neoantígenos, es complejo y existen varias etapas para lograrlo, desde el secuenciamiento de muestras tumorales, alineamiento con muestras de tejido saludable, identificación y anotación de mutaciones, para luego proseg...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Nacional de San Agustín |
| Repositorio: | UNSA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/17856 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12773/17856 |
| Nivel de acceso: | acceso abierto |
| Materia: | Transformers Transfer learning Neoantígenos Cáncer deep learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
UNSA_9502151b40b6034e71e08bf088c39699 |
|---|---|
| oai_identifier_str |
oai:repositorio.unsa.edu.pe:20.500.12773/17856 |
| network_acronym_str |
UNSA |
| network_name_str |
UNSA-Institucional |
| repository_id_str |
4847 |
| dc.title.es_PE.fl_str_mv |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| title |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| spellingShingle |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer Machaca Arceda, Vicente Enrique Transformers Transfer learning Neoantígenos Cáncer deep learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| title_full |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| title_fullStr |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| title_full_unstemmed |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| title_sort |
Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncer |
| author |
Machaca Arceda, Vicente Enrique |
| author_facet |
Machaca Arceda, Vicente Enrique |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Lopez Del Alamo, Cristian Jose |
| dc.contributor.author.fl_str_mv |
Machaca Arceda, Vicente Enrique |
| dc.subject.es_PE.fl_str_mv |
Transformers Transfer learning Neoantígenos Cáncer deep learning |
| topic |
Transformers Transfer learning Neoantígenos Cáncer deep learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
personalizadas basadas en Neoantígenos. Sin embargo, el proceso para identificar Neoantígenos, es complejo y existen varias etapas para lograrlo, desde el secuenciamiento de muestras tumorales, alineamiento con muestras de tejido saludable, identificación y anotación de mutaciones, para luego proseguir con la predicción de la unión de péptidos con el MHC y posteriormente la unión del pMHC con el TCR. Si esta unión procede, el péptido en cuestión es un fuerte candidato a Neoantígenos. En este proceso, una de las fases más críticas es la predicción de la unión pMHC, lo cual ha motivado el desarrollo de esta tesis. Además, las redes neuronales Transformers han revolucionado el campo del procesamiento natural del lenguaje y se han aplicado en muchas otras áreas como en Proteómica. Esto porque las proteínas al ser representadas como secuencias de amino ácidos, son muy similares a las secuencias de palabras en una oración. Es así, que otras investigaciones han aplicado el uso de Transformers y redes neuronales con mecanismos de atención para la predicción de la unión pMHC. Adicionalmente, existen modelos pre-entrenados como TAPE, ProtBert y ESM2, estos han sido entrenados con grandes volúmenes de datos para varias tareas de Proteómica. Basados en lo anterior, en esta tesis se propone el uso de aplicar fine-tuning a TAPE, ProtBert, ESM2(t6), ESM2(t12), ESM2(t30) y ESM2(t33) para la tarea de predicción de la unión pMHC, el fine-tunning consistió en agregar un bloque BiLSTM al final del modelo. Además, se ha evaluado el uso de Gradient Accumulation Steps (GAS) y una metodología de congelamiento de capas. Luego de los experimentos, los modelos con mejores resultados fueron TAPE-GAS, que resultó de aplicar GAS a TAPE y ESM2(t6)-Freeze, que resultó de aplicar la metodología de congelamiento a ESM2. Finalmente, se compararon estos modelos con los métodos de mejor resultado en el estado del arte, tales como: NetMHCpan4.1, MHCflurry2.0, ACME, Anthem y MixMHCpred2.2. Al finalizar los experimentos, TAPE-GAS y ESM2-Freeze superaron a los otros métodos en accuracy, AUC, precisión, f1-score y MCC. En términos de AUC, TAPE-GAS y ESM2(t6)-Freeze obtuvieron 0.9841 y 0.9830 respectivamente, frente a 0.9557 y 0.9642 de NetMHCpan4.1 y MhcFlurry2.0. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2024-05-20T15:54:07Z |
| dc.date.available.none.fl_str_mv |
2024-05-20T15:54:07Z |
| dc.date.issued.fl_str_mv |
2023 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12773/17856 |
| url |
https://hdl.handle.net/20.500.12773/17856 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa Repositorio Institucional - UNSA |
| dc.source.none.fl_str_mv |
reponame:UNSA-Institucional instname:Universidad Nacional de San Agustín instacron:UNSA |
| instname_str |
Universidad Nacional de San Agustín |
| instacron_str |
UNSA |
| institution |
UNSA |
| reponame_str |
UNSA-Institucional |
| collection |
UNSA-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.unsa.edu.pe/bitstreams/a1ef46db-95d6-4147-a40c-45eaad9fd933/download https://repositorio.unsa.edu.pe/bitstreams/5efd91b2-317a-4492-a665-94a01c4d10a8/download https://repositorio.unsa.edu.pe/bitstreams/c78f4bd7-65b0-4a8e-8fb9-21e17b303a2b/download |
| bitstream.checksum.fl_str_mv |
76fa5fb46482a99daa32993ed86f6452 a074183a93fee968d4e39fc8687309bc 6ce4daa50a3ff39d63fa1935ac7cd957 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional UNSA |
| repository.mail.fl_str_mv |
repositorio@unsa.edu.pe |
| _version_ |
1828763010700673024 |
| spelling |
Lopez Del Alamo, Cristian JoseMachaca Arceda, Vicente Enrique2024-05-20T15:54:07Z2024-05-20T15:54:07Z2023personalizadas basadas en Neoantígenos. Sin embargo, el proceso para identificar Neoantígenos, es complejo y existen varias etapas para lograrlo, desde el secuenciamiento de muestras tumorales, alineamiento con muestras de tejido saludable, identificación y anotación de mutaciones, para luego proseguir con la predicción de la unión de péptidos con el MHC y posteriormente la unión del pMHC con el TCR. Si esta unión procede, el péptido en cuestión es un fuerte candidato a Neoantígenos. En este proceso, una de las fases más críticas es la predicción de la unión pMHC, lo cual ha motivado el desarrollo de esta tesis. Además, las redes neuronales Transformers han revolucionado el campo del procesamiento natural del lenguaje y se han aplicado en muchas otras áreas como en Proteómica. Esto porque las proteínas al ser representadas como secuencias de amino ácidos, son muy similares a las secuencias de palabras en una oración. Es así, que otras investigaciones han aplicado el uso de Transformers y redes neuronales con mecanismos de atención para la predicción de la unión pMHC. Adicionalmente, existen modelos pre-entrenados como TAPE, ProtBert y ESM2, estos han sido entrenados con grandes volúmenes de datos para varias tareas de Proteómica. Basados en lo anterior, en esta tesis se propone el uso de aplicar fine-tuning a TAPE, ProtBert, ESM2(t6), ESM2(t12), ESM2(t30) y ESM2(t33) para la tarea de predicción de la unión pMHC, el fine-tunning consistió en agregar un bloque BiLSTM al final del modelo. Además, se ha evaluado el uso de Gradient Accumulation Steps (GAS) y una metodología de congelamiento de capas. Luego de los experimentos, los modelos con mejores resultados fueron TAPE-GAS, que resultó de aplicar GAS a TAPE y ESM2(t6)-Freeze, que resultó de aplicar la metodología de congelamiento a ESM2. Finalmente, se compararon estos modelos con los métodos de mejor resultado en el estado del arte, tales como: NetMHCpan4.1, MHCflurry2.0, ACME, Anthem y MixMHCpred2.2. Al finalizar los experimentos, TAPE-GAS y ESM2-Freeze superaron a los otros métodos en accuracy, AUC, precisión, f1-score y MCC. En términos de AUC, TAPE-GAS y ESM2(t6)-Freeze obtuvieron 0.9841 y 0.9830 respectivamente, frente a 0.9557 y 0.9642 de NetMHCpan4.1 y MhcFlurry2.0.application/pdfhttps://hdl.handle.net/20.500.12773/17856spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSATransformersTransfer learningNeoantígenosCáncerdeep learninghttps://purl.org/pe-repo/ocde/ford#1.02.01Detección in silico de neoantígenos utilizando transformers y transfer learning en el marco de desarrollo de vacunas personalizadas para tratar el cáncerinfo:eu-repo/semantics/doctoralThesisSUNEDU29708892https://orcid.org/0000-0002-2568-650X43684244611028Tupac Valdivia, Yvan JesusSarmiento Calisaya, EdgarYari Ramos, Yessenia DeysiMamani Aliaga, Alvaro HenryLopez Del Alamo, Cristian Josehttps://purl.org/pe-repo/renati/level#doctorhttps://purl.org/pe-repo/renati/type#tesisDoctorado en Ciencias de la ComputaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ingeniería de Producción y ServiciosDoctor en Ciencias de la ComputaciónORIGINALTesis.pdfapplication/pdf8996461https://repositorio.unsa.edu.pe/bitstreams/a1ef46db-95d6-4147-a40c-45eaad9fd933/download76fa5fb46482a99daa32993ed86f6452MD51Reporte de Similitud.pdfapplication/pdf622165https://repositorio.unsa.edu.pe/bitstreams/5efd91b2-317a-4492-a665-94a01c4d10a8/downloada074183a93fee968d4e39fc8687309bcMD52Autorización de Publicación Digital.pdfapplication/pdf397576https://repositorio.unsa.edu.pe/bitstreams/c78f4bd7-65b0-4a8e-8fb9-21e17b303a2b/download6ce4daa50a3ff39d63fa1935ac7cd957MD5320.500.12773/17856oai:repositorio.unsa.edu.pe:20.500.12773/178562024-09-11 09:06:51.457http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe |
| score |
13.936249 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).