Exploratory analysis of mass spectrometry data based on graph embeddings

Descripción del Articulo

El análisis metabolómico basado en la espectrometría de masas (EM) es una herramienta poderosa, pero conlleva sus propios retos. El flujo de trabajo de la EM implica múltiples pasos antes de su interpretación, el cual típicamente se denomina minería de datos. La extracción de datos consiste en un pr...

Descripción completa

Detalles Bibliográficos
Autor: Alvarez Mamani, Edwin
Formato: tesis doctoral
Fecha de Publicación:2025
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:inglés
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/31234
Enlace del recurso:http://hdl.handle.net/20.500.12404/31234
Nivel de acceso:acceso abierto
Materia:Espectometría de masas
Redes neuronales (Computación)
Teoría de grafos
Aprendizaje profundo (Aprendizaje automático)
https://purl.org/pe-repo/ocde/ford#2.00.00
Descripción
Sumario:El análisis metabolómico basado en la espectrometría de masas (EM) es una herramienta poderosa, pero conlleva sus propios retos. El flujo de trabajo de la EM implica múltiples pasos antes de su interpretación, el cual típicamente se denomina minería de datos. La extracción de datos consiste en un proceso de dos pasos. Primero, los datos de la EM se ordenan, organizan y presentan para su filtrado antes de ser analizados. Segundo, los datos filtrados y reducidos se analizan utilizando técnicas estadísticas para eliminar más variabilidad. Esto es especialmente cierto en el caso de los estudios metabolómicos no dirigidos (untargeted) basados en EM, que se centran en comprender los cambios en las redes metabólicas. Dado que la tarea de filtrar e identificar cambios a partir de un gran conjunto de datos es un reto, se necesitan técnicas automatizadas para la minería de datos metabolómicos no dirigidos basados en MS. El enfoque tradicional basado en estadísticas tiende a filtrar en exceso los datos en bruto, lo que puede dar lugar a la eliminación de datos relevantes y conducir a la identificación de menos cambios metabolómicos. Esta limitación del enfoque tradicional subraya la necesidad de un nuevo método. En este trabajo, presentamos un nuevo enfoque de aprendizaje profundo que utiliza node embeddings (impulsado por Graph Neural Networks), edge embeddings y un algoritmo de detección de anomalías para analizar los datos generados por la metabolómica basada en EM llamado GEMNA (Graph Embedding-based Metabolomics Network Analysis), Por ejemplo, para un estudio de volatilidad no dirigida en caramelos Mentos, los grupos de datos producidos por GEMNA fueron mejores que los de las técnicas tradicionales, es decir, GEMNA consigue una silhouette score = 0.409, vs el enfoque tradicional que consigue una silhouette score = −0.004.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).