Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
Descripción del Articulo
En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distri...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2019 |
| Institución: | Universidad Nacional de San Agustín |
| Repositorio: | UNSA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/12015 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12773/12015 |
| Nivel de acceso: | acceso abierto |
| Materia: | ADN optimización paralelismo alineamiento GPU BLAST https://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
UNSA_0538e503146de040d6126bb9ce4ea4a3 |
|---|---|
| oai_identifier_str |
oai:repositorio.unsa.edu.pe:20.500.12773/12015 |
| network_acronym_str |
UNSA |
| network_name_str |
UNSA-Institucional |
| repository_id_str |
4847 |
| dc.title.es_PE.fl_str_mv |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| title |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| spellingShingle |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido Cruz Gamero, Franklin Luis Antonio ADN optimización paralelismo alineamiento GPU BLAST https://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| title_full |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| title_fullStr |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| title_full_unstemmed |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| title_sort |
Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido |
| author |
Cruz Gamero, Franklin Luis Antonio |
| author_facet |
Cruz Gamero, Franklin Luis Antonio |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Gutierrez Caceres, Juan Carlos |
| dc.contributor.author.fl_str_mv |
Cruz Gamero, Franklin Luis Antonio |
| dc.subject.es_PE.fl_str_mv |
ADN optimización paralelismo alineamiento GPU BLAST |
| topic |
ADN optimización paralelismo alineamiento GPU BLAST https://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distribuidos. En este trabajo se presenta dos algoritmos de optimización del al- goritmo Basic Local Alignment Search Tool (BLAST), basado en tablas Hash, para el alineamiento de una secuencia (unisecuencial) y para el alineamiento de múltiples secuencias (multisecuencial) de consulta de Ácido Desoxirribonuclei- co (ADN), usando técnicas masivamente paralelas y distribuidas, mediante el modelo de programación con Compute Unified Device Architecture (CUDA) y uso de la GPU. Comparando su rendimiento en implementaciones secuenciales usando CPUs e implementaciones con la GPU. Evaluando su rendimiento en tiempo de procesamiento usando secuencias de ADN de referencia obtenidas de las bases de datos públicas National Center for Biotechnology Informa- tion (NCBI) y EMSEMBL como el genoma humano, mostrando los mejores rendimientos los algoritmos Cuda Naive (CN) para BLAST unisecuencial con un speedup de latencia de 1.24X sobre el algoritmo Knut Morris Pratt (KMP) y Cuda Base 5 (CB5) para BLAST multisecuencial con un speedup de 1.23X sobre el algoritmo Base 5 (B5), ambos con arquitectura GPU (con paralelis- mo) mejorando en el tiempo de procesamiento la heurística del BLAST. |
| publishDate |
2019 |
| dc.date.accessioned.none.fl_str_mv |
2021-03-15T00:24:35Z |
| dc.date.available.none.fl_str_mv |
2021-03-15T00:24:35Z |
| dc.date.issued.fl_str_mv |
2019 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12773/12015 |
| url |
http://hdl.handle.net/20.500.12773/12015 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa Repositorio Institucional - UNSA |
| dc.source.none.fl_str_mv |
reponame:UNSA-Institucional instname:Universidad Nacional de San Agustín instacron:UNSA |
| instname_str |
Universidad Nacional de San Agustín |
| instacron_str |
UNSA |
| institution |
UNSA |
| reponame_str |
UNSA-Institucional |
| collection |
UNSA-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.unsa.edu.pe/bitstreams/998a1de5-75d1-4151-9946-a57c3f7fcb57/download https://repositorio.unsa.edu.pe/bitstreams/deedd494-de92-4e75-9343-3db1e29dc411/download https://repositorio.unsa.edu.pe/bitstreams/31dba266-8845-4963-be6d-2e58e5eaed56/download |
| bitstream.checksum.fl_str_mv |
a13b32c12e11cdcab82c050a0fef5738 c52066b9c50a8f86be96c82978636682 70bd4889afb22c207c3823929c8872bd |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional UNSA |
| repository.mail.fl_str_mv |
repositorio@unsa.edu.pe |
| _version_ |
1828762836016300032 |
| spelling |
Gutierrez Caceres, Juan CarlosCruz Gamero, Franklin Luis Antonio2021-03-15T00:24:35Z2021-03-15T00:24:35Z2019En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distribuidos. En este trabajo se presenta dos algoritmos de optimización del al- goritmo Basic Local Alignment Search Tool (BLAST), basado en tablas Hash, para el alineamiento de una secuencia (unisecuencial) y para el alineamiento de múltiples secuencias (multisecuencial) de consulta de Ácido Desoxirribonuclei- co (ADN), usando técnicas masivamente paralelas y distribuidas, mediante el modelo de programación con Compute Unified Device Architecture (CUDA) y uso de la GPU. Comparando su rendimiento en implementaciones secuenciales usando CPUs e implementaciones con la GPU. Evaluando su rendimiento en tiempo de procesamiento usando secuencias de ADN de referencia obtenidas de las bases de datos públicas National Center for Biotechnology Informa- tion (NCBI) y EMSEMBL como el genoma humano, mostrando los mejores rendimientos los algoritmos Cuda Naive (CN) para BLAST unisecuencial con un speedup de latencia de 1.24X sobre el algoritmo Knut Morris Pratt (KMP) y Cuda Base 5 (CB5) para BLAST multisecuencial con un speedup de 1.23X sobre el algoritmo Base 5 (B5), ambos con arquitectura GPU (con paralelis- mo) mejorando en el tiempo de procesamiento la heurística del BLAST.Tesisapplication/pdfhttp://hdl.handle.net/20.500.12773/12015spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAADNoptimizaciónparalelismoalineamientoGPUBLASThttps://purl.org/pe-repo/ocde/ford#1.02.01Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuidoinfo:eu-repo/semantics/bachelorThesisSUNEDU30677357https://orcid.org/0000-0001-6379-869542932629611016Lopez del Alamo, Cristian JoseGutierrez Caceres, Juan CarlosMamani Aliaga, Alvaro Henryhttp://purl.org/pe-repo/renati/level#tituloProfesionalhttp://purl.org/pe-repo/renati/type#tesisCiencia de la ComputaciónUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosTítulo ProfesionalLicenciado en Ciencia de la ComputaciónORIGINALCCcrgafl.pdfCCcrgafl.pdfapplication/pdf985067https://repositorio.unsa.edu.pe/bitstreams/998a1de5-75d1-4151-9946-a57c3f7fcb57/downloada13b32c12e11cdcab82c050a0fef5738MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unsa.edu.pe/bitstreams/deedd494-de92-4e75-9343-3db1e29dc411/downloadc52066b9c50a8f86be96c82978636682MD52TEXTCCcrgafl.pdf.txtCCcrgafl.pdf.txtExtracted texttext/plain93813https://repositorio.unsa.edu.pe/bitstreams/31dba266-8845-4963-be6d-2e58e5eaed56/download70bd4889afb22c207c3823929c8872bdMD5320.500.12773/12015oai:repositorio.unsa.edu.pe:20.500.12773/120152022-12-13 00:37:05.312http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg== |
| score |
13.936249 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).