1
tesis de maestría
Publicado 2025
Enlace
Enlace
El cáncer es una de las principales causas de mortalidad a nivel mundial, con aproximadamente 10 millones de muertes anuales. Se proyecta un aumento significativo en los casos para 2030, especialmente en países como Perú. El Next Generation Sequencing (NGS) se ha consolidado como una herramienta esencial para el diagnóstico del cáncer, generando una gran cantidad de datos genómicos que presentan desafíos significativos en su procesamiento y análisis, particularmente en documentos no estructurados. Este proyecto se centra en el análisis comparativo de 5 LLMs de código abierto (Qwen, Mistral, LLaMA-2, Gemma-2, Deepseek) para la recuperación de información de resultados en documentos NGS. Estos modelos fueron seleccionados debido a sus características similares, como el tamaño de sus parámetros, que es aproximadamente 7 mil millones (7B). A través de la evaluación de métri...