Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias

Descripción del Articulo

Actualmente las secuencias de Acido Desoxirribonucleico (ADN) se han convertido en un objeto de estudio amplio, los avances tecnológicos han permitido a los investigadores conocer que el ADN contiene una amplia información, que nos permite conocer las evoluciones biológicas, relaciones de parentesco...

Descripción completa

Detalles Bibliográficos
Autor: Cervantes Carrasco, Edward Jhosep
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Católica San Pablo
Repositorio:UCSP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucsp.edu.pe:20.500.12590/17814
Enlace del recurso:https://hdl.handle.net/20.500.12590/17814
Nivel de acceso:acceso abierto
Materia:Unidad de procesamiento gráfico
Modelo oculto de Markov
Arquitectura unificada de dispositivos de Cómputo
Ácido desoxirribonucleico
Alineamiento múltiple de secuencias
Hilos
Avance
Retroceso
https://purl.org/pe-repo/ocde/ford#1.02.03
id UCSP_1eec21f29c8effc1e2032d820c60bc84
oai_identifier_str oai:repositorio.ucsp.edu.pe:20.500.12590/17814
network_acronym_str UCSP
network_name_str UCSP-Institucional
repository_id_str 3854
dc.title.es_PE.fl_str_mv Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
title Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
spellingShingle Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
Cervantes Carrasco, Edward Jhosep
Unidad de procesamiento gráfico
Modelo oculto de Markov
Arquitectura unificada de dispositivos de Cómputo
Ácido desoxirribonucleico
Alineamiento múltiple de secuencias
Hilos
Avance
Retroceso
https://purl.org/pe-repo/ocde/ford#1.02.03
title_short Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
title_full Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
title_fullStr Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
title_full_unstemmed Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
title_sort Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
author Cervantes Carrasco, Edward Jhosep
author_facet Cervantes Carrasco, Edward Jhosep
author_role author
dc.contributor.advisor.fl_str_mv Tupac Valdivia, Yvan Jesus
dc.contributor.author.fl_str_mv Cervantes Carrasco, Edward Jhosep
dc.subject.es_PE.fl_str_mv Unidad de procesamiento gráfico
Modelo oculto de Markov
Arquitectura unificada de dispositivos de Cómputo
Ácido desoxirribonucleico
Alineamiento múltiple de secuencias
Hilos
Avance
Retroceso
topic Unidad de procesamiento gráfico
Modelo oculto de Markov
Arquitectura unificada de dispositivos de Cómputo
Ácido desoxirribonucleico
Alineamiento múltiple de secuencias
Hilos
Avance
Retroceso
https://purl.org/pe-repo/ocde/ford#1.02.03
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.03
description Actualmente las secuencias de Acido Desoxirribonucleico (ADN) se han convertido en un objeto de estudio amplio, los avances tecnológicos han permitido a los investigadores conocer que el ADN contiene una amplia información, que nos permite conocer las evoluciones biológicas, relaciones de parentesco entre seres vivos, polimorfismos genéticos, predicción de estructuras proteicas, causas y soluciones a diversos problemas biológicos. Las bases de datos con información biológica como colecciones de nucleótidos, aminoácidos, proteinas, genomas, dominios y más estructuras de diferentes especies, se incrementan constantemente y con este crecimiento hacen falta mejorar o crear nuevos métodos tecnológicos que puedan analizar esta informacion. Uno de los procesos más importantes es el alineamiento simultaneo de un conjunto de secuencias biológicas. Esto es conocido como un Alineamiento Múltiple de Secuencias (AMS), el cual es una técnica que consiste en comparar y alinear tres o más secuencias biológicas. El objetivo es encontrar regiones comunes que indiquen una similitud estructural, lo cual es importante para determinar diversas funciones biológicas en la especie. En esta tesis se utiliza el método probabilístico del Hidden Model Markov (HMM) para encontrar un alineamiento de calidad en función del número de secuencias, mínimo crecimiento original de cada secuencia, identidad de secuencias y tiempo completo de la ejecución del método. Para conseguir el objetivo se realizará la implementación en Graphics Processing Unit (GPU), lo que permitirá optimizar el tiempo de construcción del modelo de Markov, entrenamiento de los datos, para lo cual se utilizará el algoritmo de Baum-Welch, con sus respectivos sub-algoritmos que lo conforman. El desarrollo en GPU, también permitirá realizar las pruebas con secuencias biológicas de mayor tamaño. Finalmente los resultados son comparados con Múltiple Alignment using Fast Fourier Transform (MAFFT), el cual ha sido seleccionado como método de comparación por ser actualmente uno de los mejores programas para el AMS.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-11-13T15:47:49Z
dc.date.available.none.fl_str_mv 2023-11-13T15:47:49Z
dc.date.issued.fl_str_mv 2023
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
format bachelorThesis
status_str publishedVersion
dc.identifier.other.none.fl_str_mv 1080171
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12590/17814
identifier_str_mv 1080171
url https://hdl.handle.net/20.500.12590/17814
dc.language.iso.none.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidad Católica San Pablo
dc.publisher.country.none.fl_str_mv PE
publisher.none.fl_str_mv Universidad Católica San Pablo
dc.source.none.fl_str_mv reponame:UCSP-Institucional
instname:Universidad Católica San Pablo
instacron:UCSP
instname_str Universidad Católica San Pablo
instacron_str UCSP
institution UCSP
reponame_str UCSP-Institucional
collection UCSP-Institucional
bitstream.url.fl_str_mv https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/344ac052-36bd-44ac-a05f-51dd053449b5/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/21fe2f3c-b420-4793-9f74-ec7c106c9027/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/c1ca0ea7-2ed3-4b27-ad21-2ea22ab0bd7d/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/b27bd011-79d5-4ea7-9b38-15b2efa591f1/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/fe89b27f-9e53-44d5-b538-a3b21456902c/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a274e2a3-85b3-432a-b5e5-189b8467f671/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/540f20ca-2191-445b-9eac-12833a317a6e/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/cad22ff0-15c3-4b1f-aa3e-7c911dc9953f/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/f3eec5e4-e8a0-420c-9ba0-a8a4186b1dba/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a16bc1a7-4478-4cce-847d-8ef7e8994e6d/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/5c6580ff-9fcf-4abc-a59c-cfbac83c06c0/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/17f21832-1025-4f02-84d0-6bf9b37811a3/download
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/3748e479-7b82-4ed1-9b0d-3910f0c58660/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
95d21c75148798b89955b70b61a0ab42
5e33d7a865f0bf84b427cdd484b0480f
358acd26a58eae2572d57bd196c09fae
ce04c8f4d1b71ad76f8edccf326501db
7364f466f5166f15c4051911775ce51d
ba32de7921eea39ded6e39611422ff25
32542035b63f46f758319ec5ca3dae66
3fd6b09e2e6b578aca28d32fc80e09e7
a3bf0d8815c94953b3fc023eaf1dba5a
baa58ef2483b8a0d18f5521b0d7fa419
324ecf65eb841321e7afc826af737945
0882f3f8b8fa83da5a825f99e9812f08
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad Católica San Pablo
repository.mail.fl_str_mv dspace@ucsp.edu.pe
_version_ 1851053046980673536
spelling Tupac Valdivia, Yvan JesusCervantes Carrasco, Edward Jhosep2023-11-13T15:47:49Z2023-11-13T15:47:49Z20231080171https://hdl.handle.net/20.500.12590/17814Actualmente las secuencias de Acido Desoxirribonucleico (ADN) se han convertido en un objeto de estudio amplio, los avances tecnológicos han permitido a los investigadores conocer que el ADN contiene una amplia información, que nos permite conocer las evoluciones biológicas, relaciones de parentesco entre seres vivos, polimorfismos genéticos, predicción de estructuras proteicas, causas y soluciones a diversos problemas biológicos. Las bases de datos con información biológica como colecciones de nucleótidos, aminoácidos, proteinas, genomas, dominios y más estructuras de diferentes especies, se incrementan constantemente y con este crecimiento hacen falta mejorar o crear nuevos métodos tecnológicos que puedan analizar esta informacion. Uno de los procesos más importantes es el alineamiento simultaneo de un conjunto de secuencias biológicas. Esto es conocido como un Alineamiento Múltiple de Secuencias (AMS), el cual es una técnica que consiste en comparar y alinear tres o más secuencias biológicas. El objetivo es encontrar regiones comunes que indiquen una similitud estructural, lo cual es importante para determinar diversas funciones biológicas en la especie. En esta tesis se utiliza el método probabilístico del Hidden Model Markov (HMM) para encontrar un alineamiento de calidad en función del número de secuencias, mínimo crecimiento original de cada secuencia, identidad de secuencias y tiempo completo de la ejecución del método. Para conseguir el objetivo se realizará la implementación en Graphics Processing Unit (GPU), lo que permitirá optimizar el tiempo de construcción del modelo de Markov, entrenamiento de los datos, para lo cual se utilizará el algoritmo de Baum-Welch, con sus respectivos sub-algoritmos que lo conforman. El desarrollo en GPU, también permitirá realizar las pruebas con secuencias biológicas de mayor tamaño. Finalmente los resultados son comparados con Múltiple Alignment using Fast Fourier Transform (MAFFT), el cual ha sido seleccionado como método de comparación por ser actualmente uno de los mejores programas para el AMS.Tesis de pregradoapplication/pdfspaUniversidad Católica San PabloPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Unidad de procesamiento gráficoModelo oculto de MarkovArquitectura unificada de dispositivos de CómputoÁcido desoxirribonucleicoAlineamiento múltiple de secuenciasHilosAvanceRetrocesohttps://purl.org/pe-repo/ocde/ford#1.02.03Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuenciasinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:UCSP-Institucionalinstname:Universidad Católica San Pabloinstacron:UCSPSUNEDUIngeniero InformáticoUniversidad Católica San Pablo. Departamento de Ciencias de la ComputaciónTítulo ProfesionalCiencia de la ComputaciónEscuela Profesional Ciencia de la Computaciónhttps://orcid.org/0000-0002-7279-310529600586https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional611016Cuadros Vargas, Alex JesusGutierrez Pachas, Daniel AlexisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/344ac052-36bd-44ac-a05f-51dd053449b5/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALCERVANTES_CARRASCO_EDW_IMP.pdfCERVANTES_CARRASCO_EDW_IMP.pdfapplication/pdf1148644https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/21fe2f3c-b420-4793-9f74-ec7c106c9027/download95d21c75148798b89955b70b61a0ab42MD52AUTORIZACIÓN.pdfAUTORIZACIÓN.pdfapplication/pdf1064226https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/c1ca0ea7-2ed3-4b27-ad21-2ea22ab0bd7d/download5e33d7a865f0bf84b427cdd484b0480fMD54TURNITIN.pdfTURNITIN.pdfapplication/pdf9002320https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/b27bd011-79d5-4ea7-9b38-15b2efa591f1/download358acd26a58eae2572d57bd196c09faeMD55ACTA.pdfACTA.pdfapplication/pdf876941https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/fe89b27f-9e53-44d5-b538-a3b21456902c/downloadce04c8f4d1b71ad76f8edccf326501dbMD53TEXTCERVANTES_CARRASCO_EDW_IMP.pdf.txtCERVANTES_CARRASCO_EDW_IMP.pdf.txtExtracted texttext/plain101333https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a274e2a3-85b3-432a-b5e5-189b8467f671/download7364f466f5166f15c4051911775ce51dMD56AUTORIZACIÓN.pdf.txtAUTORIZACIÓN.pdf.txtExtracted texttext/plain4049https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/540f20ca-2191-445b-9eac-12833a317a6e/downloadba32de7921eea39ded6e39611422ff25MD58TURNITIN.pdf.txtTURNITIN.pdf.txtExtracted texttext/plain4990https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/cad22ff0-15c3-4b1f-aa3e-7c911dc9953f/download32542035b63f46f758319ec5ca3dae66MD510ACTA.pdf.txtACTA.pdf.txtExtracted texttext/plain372https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/f3eec5e4-e8a0-420c-9ba0-a8a4186b1dba/download3fd6b09e2e6b578aca28d32fc80e09e7MD512THUMBNAILCERVANTES_CARRASCO_EDW_IMP.pdf.jpgCERVANTES_CARRASCO_EDW_IMP.pdf.jpgGenerated Thumbnailimage/jpeg5169https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a16bc1a7-4478-4cce-847d-8ef7e8994e6d/downloada3bf0d8815c94953b3fc023eaf1dba5aMD57AUTORIZACIÓN.pdf.jpgAUTORIZACIÓN.pdf.jpgGenerated Thumbnailimage/jpeg5696https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/5c6580ff-9fcf-4abc-a59c-cfbac83c06c0/downloadbaa58ef2483b8a0d18f5521b0d7fa419MD59TURNITIN.pdf.jpgTURNITIN.pdf.jpgGenerated Thumbnailimage/jpeg2648https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/17f21832-1025-4f02-84d0-6bf9b37811a3/download324ecf65eb841321e7afc826af737945MD511ACTA.pdf.jpgACTA.pdf.jpgGenerated Thumbnailimage/jpeg5051https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/3748e479-7b82-4ed1-9b0d-3910f0c58660/download0882f3f8b8fa83da5a825f99e9812f08MD51320.500.12590/17814oai:repositorio.ucsp.edu.pe:20.500.12590/178142023-11-14 03:00:56.277https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.ucsp.edu.peRepositorio Institucional de la Universidad Católica San Pablodspace@ucsp.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.446179
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).