Optimización del algoritmo Blast en el alineamiento de secuencias de ADN basado en procesamiento masivamente paralelo y distribuido

Descripción del Articulo

En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distri...

Descripción completa

Detalles Bibliográficos
Autor: Cruz Gamero, Franklin Luis Antonio
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/12015
Enlace del recurso:http://hdl.handle.net/20.500.12773/12015
Nivel de acceso:acceso abierto
Materia:ADN
optimización
paralelismo
alineamiento
GPU
BLAST
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:En Bioinformática intentan definir modelos matemáticas de sistemas biológicos usando grandes cantidades de Unidades de Procesamiento Centra- les (CPUs), generando aplicaciones poco prácticas. Esto esta´ siendo optimizado por paralelismo usando unidad de Procesamiento Gráficos (GPU) y sistemas distribuidos. En este trabajo se presenta dos algoritmos de optimización del al- goritmo Basic Local Alignment Search Tool (BLAST), basado en tablas Hash, para el alineamiento de una secuencia (unisecuencial) y para el alineamiento de múltiples secuencias (multisecuencial) de consulta de Ácido Desoxirribonuclei- co (ADN), usando técnicas masivamente paralelas y distribuidas, mediante el modelo de programación con Compute Unified Device Architecture (CUDA) y uso de la GPU. Comparando su rendimiento en implementaciones secuenciales usando CPUs e implementaciones con la GPU. Evaluando su rendimiento en tiempo de procesamiento usando secuencias de ADN de referencia obtenidas de las bases de datos públicas National Center for Biotechnology Informa- tion (NCBI) y EMSEMBL como el genoma humano, mostrando los mejores rendimientos los algoritmos Cuda Naive (CN) para BLAST unisecuencial con un speedup de latencia de 1.24X sobre el algoritmo Knut Morris Pratt (KMP) y Cuda Base 5 (CB5) para BLAST multisecuencial con un speedup de 1.23X sobre el algoritmo Base 5 (B5), ambos con arquitectura GPU (con paralelis- mo) mejorando en el tiempo de procesamiento la heurística del BLAST.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).