Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido

Descripción del Articulo

En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distri...

Descripción completa

Detalles Bibliográficos
Autor: Cruz Gamero, Franklin Luis Antonio
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/12015
Enlace del recurso:http://hdl.handle.net/20.500.12773/12015
Nivel de acceso:acceso abierto
Materia:ADN
optimización
paralelismo
alineamiento
GPU
BLAST
https://purl.org/pe-repo/ocde/ford#1.02.01
id UNSA_0538e503146de040d6126bb9ce4ea4a3
oai_identifier_str oai:repositorio.unsa.edu.pe:20.500.12773/12015
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
dc.title.es_PE.fl_str_mv Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
title Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
spellingShingle Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
Cruz Gamero, Franklin Luis Antonio
ADN
optimización
paralelismo
alineamiento
GPU
BLAST
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
title_full Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
title_fullStr Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
title_full_unstemmed Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
title_sort Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido
author Cruz Gamero, Franklin Luis Antonio
author_facet Cruz Gamero, Franklin Luis Antonio
author_role author
dc.contributor.advisor.fl_str_mv Gutierrez Caceres, Juan Carlos
dc.contributor.author.fl_str_mv Cruz Gamero, Franklin Luis Antonio
dc.subject.es_PE.fl_str_mv ADN
optimización
paralelismo
alineamiento
GPU
BLAST
topic ADN
optimización
paralelismo
alineamiento
GPU
BLAST
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
description En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distribuidos. En este trabajo se presenta dos algoritmos de optimización del al- goritmo Basic Local Alignment Search Tool (BLAST), basado en tablas Hash, para el alineamiento de una secuencia (unisecuencial) y para el alineamiento de múltiples secuencias (multisecuencial) de consulta de Ácido Desoxirribonuclei- co (ADN), usando técnicas masivamente paralelas y distribuidas, mediante el modelo de programación con Compute Unified Device Architecture (CUDA) y uso de la GPU. Comparando su rendimiento en implementaciones secuenciales usando CPUs e implementaciones con la GPU. Evaluando su rendimiento en tiempo de procesamiento usando secuencias de ADN de referencia obtenidas de las bases de datos públicas National Center for Biotechnology Informa- tion (NCBI) y EMSEMBL como el genoma humano, mostrando los mejores rendimientos los algoritmos Cuda Naive (CN) para BLAST unisecuencial con un speedup de latencia de 1.24X sobre el algoritmo Knut Morris Pratt (KMP) y Cuda Base 5 (CB5) para BLAST multisecuencial con un speedup de 1.23X sobre el algoritmo Base 5 (B5), ambos con arquitectura GPU (con paralelis- mo) mejorando en el tiempo de procesamiento la heurística del BLAST.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2021-03-15T00:24:35Z
dc.date.available.none.fl_str_mv 2021-03-15T00:24:35Z
dc.date.issued.fl_str_mv 2019
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12773/12015
url http://hdl.handle.net/20.500.12773/12015
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/998a1de5-75d1-4151-9946-a57c3f7fcb57/download
https://repositorio.unsa.edu.pe/bitstreams/deedd494-de92-4e75-9343-3db1e29dc411/download
https://repositorio.unsa.edu.pe/bitstreams/31dba266-8845-4963-be6d-2e58e5eaed56/download
bitstream.checksum.fl_str_mv a13b32c12e11cdcab82c050a0fef5738
c52066b9c50a8f86be96c82978636682
70bd4889afb22c207c3823929c8872bd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv repositorio@unsa.edu.pe
_version_ 1828762836016300032
spelling Gutierrez Caceres, Juan CarlosCruz Gamero, Franklin Luis Antonio2021-03-15T00:24:35Z2021-03-15T00:24:35Z2019En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distribuidos. En este trabajo se presenta dos algoritmos de optimización del al- goritmo Basic Local Alignment Search Tool (BLAST), basado en tablas Hash, para el alineamiento de una secuencia (unisecuencial) y para el alineamiento de múltiples secuencias (multisecuencial) de consulta de Ácido Desoxirribonuclei- co (ADN), usando técnicas masivamente paralelas y distribuidas, mediante el modelo de programación con Compute Unified Device Architecture (CUDA) y uso de la GPU. Comparando su rendimiento en implementaciones secuenciales usando CPUs e implementaciones con la GPU. Evaluando su rendimiento en tiempo de procesamiento usando secuencias de ADN de referencia obtenidas de las bases de datos públicas National Center for Biotechnology Informa- tion (NCBI) y EMSEMBL como el genoma humano, mostrando los mejores rendimientos los algoritmos Cuda Naive (CN) para BLAST unisecuencial con un speedup de latencia de 1.24X sobre el algoritmo Knut Morris Pratt (KMP) y Cuda Base 5 (CB5) para BLAST multisecuencial con un speedup de 1.23X sobre el algoritmo Base 5 (B5), ambos con arquitectura GPU (con paralelis- mo) mejorando en el tiempo de procesamiento la heurística del BLAST.Tesisapplication/pdfhttp://hdl.handle.net/20.500.12773/12015spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAADNoptimizaciónparalelismoalineamientoGPUBLASThttps://purl.org/pe-repo/ocde/ford#1.02.01Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuidoinfo:eu-repo/semantics/bachelorThesisSUNEDU30677357https://orcid.org/0000-0001-6379-869542932629611016Lopez del Alamo, Cristian JoseGutierrez Caceres, Juan CarlosMamani Aliaga, Alvaro Henryhttp://purl.org/pe-repo/renati/level#tituloProfesionalhttp://purl.org/pe-repo/renati/type#tesisCiencia de la ComputaciónUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosTítulo ProfesionalLicenciado en Ciencia de la ComputaciónORIGINALCCcrgafl.pdfCCcrgafl.pdfapplication/pdf985067https://repositorio.unsa.edu.pe/bitstreams/998a1de5-75d1-4151-9946-a57c3f7fcb57/downloada13b32c12e11cdcab82c050a0fef5738MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unsa.edu.pe/bitstreams/deedd494-de92-4e75-9343-3db1e29dc411/downloadc52066b9c50a8f86be96c82978636682MD52TEXTCCcrgafl.pdf.txtCCcrgafl.pdf.txtExtracted texttext/plain93813https://repositorio.unsa.edu.pe/bitstreams/31dba266-8845-4963-be6d-2e58e5eaed56/download70bd4889afb22c207c3823929c8872bdMD5320.500.12773/12015oai:repositorio.unsa.edu.pe:20.500.12773/120152022-12-13 00:37:05.312http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.936249
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).