Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias
Descripción del Articulo
Actualmente las secuencias de Acido Desoxirribonucleico (ADN) se han convertido en un objeto de estudio amplio, los avances tecnológicos han permitido a los investigadores conocer que el ADN contiene una amplia información, que nos permite conocer las evoluciones biológicas, relaciones de parentesco...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Católica San Pablo |
| Repositorio: | UCSP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucsp.edu.pe:20.500.12590/17814 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12590/17814 |
| Nivel de acceso: | acceso abierto |
| Materia: | Unidad de procesamiento gráfico Modelo oculto de Markov Arquitectura unificada de dispositivos de Cómputo Ácido desoxirribonucleico Alineamiento múltiple de secuencias Hilos Avance Retroceso https://purl.org/pe-repo/ocde/ford#1.02.03 |
| id |
UCSP_1eec21f29c8effc1e2032d820c60bc84 |
|---|---|
| oai_identifier_str |
oai:repositorio.ucsp.edu.pe:20.500.12590/17814 |
| network_acronym_str |
UCSP |
| network_name_str |
UCSP-Institucional |
| repository_id_str |
3854 |
| dc.title.es_PE.fl_str_mv |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| title |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| spellingShingle |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias Cervantes Carrasco, Edward Jhosep Unidad de procesamiento gráfico Modelo oculto de Markov Arquitectura unificada de dispositivos de Cómputo Ácido desoxirribonucleico Alineamiento múltiple de secuencias Hilos Avance Retroceso https://purl.org/pe-repo/ocde/ford#1.02.03 |
| title_short |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| title_full |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| title_fullStr |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| title_full_unstemmed |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| title_sort |
Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuencias |
| author |
Cervantes Carrasco, Edward Jhosep |
| author_facet |
Cervantes Carrasco, Edward Jhosep |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Tupac Valdivia, Yvan Jesus |
| dc.contributor.author.fl_str_mv |
Cervantes Carrasco, Edward Jhosep |
| dc.subject.es_PE.fl_str_mv |
Unidad de procesamiento gráfico Modelo oculto de Markov Arquitectura unificada de dispositivos de Cómputo Ácido desoxirribonucleico Alineamiento múltiple de secuencias Hilos Avance Retroceso |
| topic |
Unidad de procesamiento gráfico Modelo oculto de Markov Arquitectura unificada de dispositivos de Cómputo Ácido desoxirribonucleico Alineamiento múltiple de secuencias Hilos Avance Retroceso https://purl.org/pe-repo/ocde/ford#1.02.03 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.03 |
| description |
Actualmente las secuencias de Acido Desoxirribonucleico (ADN) se han convertido en un objeto de estudio amplio, los avances tecnológicos han permitido a los investigadores conocer que el ADN contiene una amplia información, que nos permite conocer las evoluciones biológicas, relaciones de parentesco entre seres vivos, polimorfismos genéticos, predicción de estructuras proteicas, causas y soluciones a diversos problemas biológicos. Las bases de datos con información biológica como colecciones de nucleótidos, aminoácidos, proteinas, genomas, dominios y más estructuras de diferentes especies, se incrementan constantemente y con este crecimiento hacen falta mejorar o crear nuevos métodos tecnológicos que puedan analizar esta informacion. Uno de los procesos más importantes es el alineamiento simultaneo de un conjunto de secuencias biológicas. Esto es conocido como un Alineamiento Múltiple de Secuencias (AMS), el cual es una técnica que consiste en comparar y alinear tres o más secuencias biológicas. El objetivo es encontrar regiones comunes que indiquen una similitud estructural, lo cual es importante para determinar diversas funciones biológicas en la especie. En esta tesis se utiliza el método probabilístico del Hidden Model Markov (HMM) para encontrar un alineamiento de calidad en función del número de secuencias, mínimo crecimiento original de cada secuencia, identidad de secuencias y tiempo completo de la ejecución del método. Para conseguir el objetivo se realizará la implementación en Graphics Processing Unit (GPU), lo que permitirá optimizar el tiempo de construcción del modelo de Markov, entrenamiento de los datos, para lo cual se utilizará el algoritmo de Baum-Welch, con sus respectivos sub-algoritmos que lo conforman. El desarrollo en GPU, también permitirá realizar las pruebas con secuencias biológicas de mayor tamaño. Finalmente los resultados son comparados con Múltiple Alignment using Fast Fourier Transform (MAFFT), el cual ha sido seleccionado como método de comparación por ser actualmente uno de los mejores programas para el AMS. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2023-11-13T15:47:49Z |
| dc.date.available.none.fl_str_mv |
2023-11-13T15:47:49Z |
| dc.date.issued.fl_str_mv |
2023 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| dc.type.version.none.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.other.none.fl_str_mv |
1080171 |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12590/17814 |
| identifier_str_mv |
1080171 |
| url |
https://hdl.handle.net/20.500.12590/17814 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.none.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.none.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad Católica San Pablo |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad Católica San Pablo |
| dc.source.none.fl_str_mv |
reponame:UCSP-Institucional instname:Universidad Católica San Pablo instacron:UCSP |
| instname_str |
Universidad Católica San Pablo |
| instacron_str |
UCSP |
| institution |
UCSP |
| reponame_str |
UCSP-Institucional |
| collection |
UCSP-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/344ac052-36bd-44ac-a05f-51dd053449b5/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/21fe2f3c-b420-4793-9f74-ec7c106c9027/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/c1ca0ea7-2ed3-4b27-ad21-2ea22ab0bd7d/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/b27bd011-79d5-4ea7-9b38-15b2efa591f1/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/fe89b27f-9e53-44d5-b538-a3b21456902c/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a274e2a3-85b3-432a-b5e5-189b8467f671/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/540f20ca-2191-445b-9eac-12833a317a6e/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/cad22ff0-15c3-4b1f-aa3e-7c911dc9953f/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/f3eec5e4-e8a0-420c-9ba0-a8a4186b1dba/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a16bc1a7-4478-4cce-847d-8ef7e8994e6d/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/5c6580ff-9fcf-4abc-a59c-cfbac83c06c0/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/17f21832-1025-4f02-84d0-6bf9b37811a3/download https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/3748e479-7b82-4ed1-9b0d-3910f0c58660/download |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 95d21c75148798b89955b70b61a0ab42 5e33d7a865f0bf84b427cdd484b0480f 358acd26a58eae2572d57bd196c09fae ce04c8f4d1b71ad76f8edccf326501db 7364f466f5166f15c4051911775ce51d ba32de7921eea39ded6e39611422ff25 32542035b63f46f758319ec5ca3dae66 3fd6b09e2e6b578aca28d32fc80e09e7 a3bf0d8815c94953b3fc023eaf1dba5a baa58ef2483b8a0d18f5521b0d7fa419 324ecf65eb841321e7afc826af737945 0882f3f8b8fa83da5a825f99e9812f08 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional de la Universidad Católica San Pablo |
| repository.mail.fl_str_mv |
dspace@ucsp.edu.pe |
| _version_ |
1851053046980673536 |
| spelling |
Tupac Valdivia, Yvan JesusCervantes Carrasco, Edward Jhosep2023-11-13T15:47:49Z2023-11-13T15:47:49Z20231080171https://hdl.handle.net/20.500.12590/17814Actualmente las secuencias de Acido Desoxirribonucleico (ADN) se han convertido en un objeto de estudio amplio, los avances tecnológicos han permitido a los investigadores conocer que el ADN contiene una amplia información, que nos permite conocer las evoluciones biológicas, relaciones de parentesco entre seres vivos, polimorfismos genéticos, predicción de estructuras proteicas, causas y soluciones a diversos problemas biológicos. Las bases de datos con información biológica como colecciones de nucleótidos, aminoácidos, proteinas, genomas, dominios y más estructuras de diferentes especies, se incrementan constantemente y con este crecimiento hacen falta mejorar o crear nuevos métodos tecnológicos que puedan analizar esta informacion. Uno de los procesos más importantes es el alineamiento simultaneo de un conjunto de secuencias biológicas. Esto es conocido como un Alineamiento Múltiple de Secuencias (AMS), el cual es una técnica que consiste en comparar y alinear tres o más secuencias biológicas. El objetivo es encontrar regiones comunes que indiquen una similitud estructural, lo cual es importante para determinar diversas funciones biológicas en la especie. En esta tesis se utiliza el método probabilístico del Hidden Model Markov (HMM) para encontrar un alineamiento de calidad en función del número de secuencias, mínimo crecimiento original de cada secuencia, identidad de secuencias y tiempo completo de la ejecución del método. Para conseguir el objetivo se realizará la implementación en Graphics Processing Unit (GPU), lo que permitirá optimizar el tiempo de construcción del modelo de Markov, entrenamiento de los datos, para lo cual se utilizará el algoritmo de Baum-Welch, con sus respectivos sub-algoritmos que lo conforman. El desarrollo en GPU, también permitirá realizar las pruebas con secuencias biológicas de mayor tamaño. Finalmente los resultados son comparados con Múltiple Alignment using Fast Fourier Transform (MAFFT), el cual ha sido seleccionado como método de comparación por ser actualmente uno de los mejores programas para el AMS.Tesis de pregradoapplication/pdfspaUniversidad Católica San PabloPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Unidad de procesamiento gráficoModelo oculto de MarkovArquitectura unificada de dispositivos de CómputoÁcido desoxirribonucleicoAlineamiento múltiple de secuenciasHilosAvanceRetrocesohttps://purl.org/pe-repo/ocde/ford#1.02.03Implementación paralela en GPU del modelo oculto de Markov para el alineamiento múltiple de secuenciasinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:UCSP-Institucionalinstname:Universidad Católica San Pabloinstacron:UCSPSUNEDUIngeniero InformáticoUniversidad Católica San Pablo. Departamento de Ciencias de la ComputaciónTítulo ProfesionalCiencia de la ComputaciónEscuela Profesional Ciencia de la Computaciónhttps://orcid.org/0000-0002-7279-310529600586https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#tituloProfesional611016Cuadros Vargas, Alex JesusGutierrez Pachas, Daniel AlexisLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/344ac052-36bd-44ac-a05f-51dd053449b5/download8a4605be74aa9ea9d79846c1fba20a33MD51ORIGINALCERVANTES_CARRASCO_EDW_IMP.pdfCERVANTES_CARRASCO_EDW_IMP.pdfapplication/pdf1148644https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/21fe2f3c-b420-4793-9f74-ec7c106c9027/download95d21c75148798b89955b70b61a0ab42MD52AUTORIZACIÓN.pdfAUTORIZACIÓN.pdfapplication/pdf1064226https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/c1ca0ea7-2ed3-4b27-ad21-2ea22ab0bd7d/download5e33d7a865f0bf84b427cdd484b0480fMD54TURNITIN.pdfTURNITIN.pdfapplication/pdf9002320https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/b27bd011-79d5-4ea7-9b38-15b2efa591f1/download358acd26a58eae2572d57bd196c09faeMD55ACTA.pdfACTA.pdfapplication/pdf876941https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/fe89b27f-9e53-44d5-b538-a3b21456902c/downloadce04c8f4d1b71ad76f8edccf326501dbMD53TEXTCERVANTES_CARRASCO_EDW_IMP.pdf.txtCERVANTES_CARRASCO_EDW_IMP.pdf.txtExtracted texttext/plain101333https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a274e2a3-85b3-432a-b5e5-189b8467f671/download7364f466f5166f15c4051911775ce51dMD56AUTORIZACIÓN.pdf.txtAUTORIZACIÓN.pdf.txtExtracted texttext/plain4049https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/540f20ca-2191-445b-9eac-12833a317a6e/downloadba32de7921eea39ded6e39611422ff25MD58TURNITIN.pdf.txtTURNITIN.pdf.txtExtracted texttext/plain4990https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/cad22ff0-15c3-4b1f-aa3e-7c911dc9953f/download32542035b63f46f758319ec5ca3dae66MD510ACTA.pdf.txtACTA.pdf.txtExtracted texttext/plain372https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/f3eec5e4-e8a0-420c-9ba0-a8a4186b1dba/download3fd6b09e2e6b578aca28d32fc80e09e7MD512THUMBNAILCERVANTES_CARRASCO_EDW_IMP.pdf.jpgCERVANTES_CARRASCO_EDW_IMP.pdf.jpgGenerated Thumbnailimage/jpeg5169https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/a16bc1a7-4478-4cce-847d-8ef7e8994e6d/downloada3bf0d8815c94953b3fc023eaf1dba5aMD57AUTORIZACIÓN.pdf.jpgAUTORIZACIÓN.pdf.jpgGenerated Thumbnailimage/jpeg5696https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/5c6580ff-9fcf-4abc-a59c-cfbac83c06c0/downloadbaa58ef2483b8a0d18f5521b0d7fa419MD59TURNITIN.pdf.jpgTURNITIN.pdf.jpgGenerated Thumbnailimage/jpeg2648https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/17f21832-1025-4f02-84d0-6bf9b37811a3/download324ecf65eb841321e7afc826af737945MD511ACTA.pdf.jpgACTA.pdf.jpgGenerated Thumbnailimage/jpeg5051https://repositorio.ucsp.edu.pe/backend/api/core/bitstreams/3748e479-7b82-4ed1-9b0d-3910f0c58660/download0882f3f8b8fa83da5a825f99e9812f08MD51320.500.12590/17814oai:repositorio.ucsp.edu.pe:20.500.12590/178142023-11-14 03:00:56.277https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.ucsp.edu.peRepositorio Institucional de la Universidad Católica San Pablodspace@ucsp.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.446179 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).