Análisis comparativo de clasificadores para la detección de subtipos de cáncer

Descripción del Articulo

En la actualidad el cáncer es una de las primeras causas de muerte a nivel mundial, en la ingeniería el aprendizaje automático se está utilizando para analizar datos y aprender de ellos, consecuentemente son capaces de predecir o sugerir, y está teniendo un alto impacto en los avances tecnológicos m...

Descripción completa

Detalles Bibliográficos
Autor: Díaz Bernilla, Nataly Marlene
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Señor de Sipan
Repositorio:USS-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.uss.edu.pe:20.500.12802/8386
Enlace del recurso:https://hdl.handle.net/20.500.12802/8386
Nivel de acceso:acceso abierto
Materia:Clasificación automática
Subtipos de Cáncer
Support Vector Machines
K-Nearest Neighbor
Naive Bayes
http://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:En la actualidad el cáncer es una de las primeras causas de muerte a nivel mundial, en la ingeniería el aprendizaje automático se está utilizando para analizar datos y aprender de ellos, consecuentemente son capaces de predecir o sugerir, y está teniendo un alto impacto en los avances tecnológicos médicos. El objetivo de este trabajo es realizar un análisis comparativo para la detección de los subtipos de un cáncer, la investigación inicia con la selección del tipo de cáncer, el cual se seleccionó el cáncer de mama, posteriormente se caracterizó los subtipos del cáncer obteniendo 4 subtipos los cuales son, Luminal A, Luminal B, Basal o triple negativo y el tipo de cáncer enriquecido con Her2. Posteriormente se realizó la clasificación siendo los clasificadores Support Vector Machines, K-Nearest Neighbor y Naive Bayes los seleccionados, además se utilizaron los datos obtenidos del bioproyecto GSE10886 que contiene 200 muestras de tejido tumorosos generados en GEO2R (Herramienta que analiza datos genómicos). Los resultados obtenidos de los indicadores precisión, error, sensibilidad y especificidad de los clasificadores son SVM (97%, 3%, 95%, 99%) , siendo el que obtuvo mejor performance en comparación al clasificador KNN(88%, 12%, 89%, 96%) y del clasificador NB (90%, 10%, 89% y 98%) respectivamente, demás se obtuvo el tiempo de respuesta de la ejecución de los clasificadores siendo del clasificador SVM 0.36 segundos, 2.79 segundos del clasificador KNN y 0.33 segundos del clasificador Naive Bayes. Finalmente se concluyó que el clasificador que obtuvo mejor performance en los resultados evaluados es el clasificador SVM con un 97% de precisión, 3% de error , 95% de sensibilidad y un 99% de especificidad y por último el clasificador con menos tiempo de respuesta fue el clasificador Naive Bayes con 0.33 segundos.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).