Análisis comparativo de clasificadores para la detección de subtipos de cáncer
Descripción del Articulo
En la actualidad el cáncer es una de las primeras causas de muerte a nivel mundial, en la ingeniería el aprendizaje automático se está utilizando para analizar datos y aprender de ellos, consecuentemente son capaces de predecir o sugerir, y está teniendo un alto impacto en los avances tecnológicos m...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2021 |
Institución: | Universidad Señor de Sipan |
Repositorio: | USS-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.uss.edu.pe:20.500.12802/8386 |
Enlace del recurso: | https://hdl.handle.net/20.500.12802/8386 |
Nivel de acceso: | acceso abierto |
Materia: | Clasificación automática Subtipos de Cáncer Support Vector Machines K-Nearest Neighbor Naive Bayes http://purl.org/pe-repo/ocde/ford#2.02.04 |
Sumario: | En la actualidad el cáncer es una de las primeras causas de muerte a nivel mundial, en la ingeniería el aprendizaje automático se está utilizando para analizar datos y aprender de ellos, consecuentemente son capaces de predecir o sugerir, y está teniendo un alto impacto en los avances tecnológicos médicos. El objetivo de este trabajo es realizar un análisis comparativo para la detección de los subtipos de un cáncer, la investigación inicia con la selección del tipo de cáncer, el cual se seleccionó el cáncer de mama, posteriormente se caracterizó los subtipos del cáncer obteniendo 4 subtipos los cuales son, Luminal A, Luminal B, Basal o triple negativo y el tipo de cáncer enriquecido con Her2. Posteriormente se realizó la clasificación siendo los clasificadores Support Vector Machines, K-Nearest Neighbor y Naive Bayes los seleccionados, además se utilizaron los datos obtenidos del bioproyecto GSE10886 que contiene 200 muestras de tejido tumorosos generados en GEO2R (Herramienta que analiza datos genómicos). Los resultados obtenidos de los indicadores precisión, error, sensibilidad y especificidad de los clasificadores son SVM (97%, 3%, 95%, 99%) , siendo el que obtuvo mejor performance en comparación al clasificador KNN(88%, 12%, 89%, 96%) y del clasificador NB (90%, 10%, 89% y 98%) respectivamente, demás se obtuvo el tiempo de respuesta de la ejecución de los clasificadores siendo del clasificador SVM 0.36 segundos, 2.79 segundos del clasificador KNN y 0.33 segundos del clasificador Naive Bayes. Finalmente se concluyó que el clasificador que obtuvo mejor performance en los resultados evaluados es el clasificador SVM con un 97% de precisión, 3% de error , 95% de sensibilidad y un 99% de especificidad y por último el clasificador con menos tiempo de respuesta fue el clasificador Naive Bayes con 0.33 segundos. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).