Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF

Descripción del Articulo

El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión...

Descripción completa

Detalles Bibliográficos
Autores: Araujo Rodriguez, Jhon Alexander, Medina Paquiyuari, Fernando Jose
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Universidad Cesar Vallejo
Repositorio:UCV-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucv.edu.pe:20.500.12692/153103
Enlace del recurso:https://hdl.handle.net/20.500.12692/153103
Nivel de acceso:acceso abierto
Materia:Redes neuronales convolucionales
Bayesiana ingenua
Random forest
Tiempo de identificación
Exactitud
https://purl.org/pe-repo/ocde/ford#2.01.01
Descripción
Sumario:El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión del sistema para comparar y plasmar los resultados de la sensibilidad, la especificidad, la precisión, la exactitud, el tiempo de entrenamiento y el tiempo de diagnóstico de cáncer de mama de los algoritmos mencionados. Se consideró un total de 7632 imágenes mamográficas entre benignos (2520) y malignos (5112) para el diagnóstico de la enfermedad. La investigación fue de tipo aplicada, con un enfoque cuantitativo y diseño no experimental y tipo de diseño transversal descriptivo. Se usaron librerías gratuitas tales como Django, Keras, Tensorflow, OpenCV-Python, entre otras, para el desarrollo de lenguaje de programación Python. Además, se usó los criterios de inclusión y exclusión en la investigación para diferenciar qué imágenes no están incluidas y cuáles sí están incluidas para la población. Se utilizó el tipo y la cantidad de imágenes mamográficas para precisar la fuente (Data Science Kaggle) tipo (benigno y maligno), muestreo, el tiempo de identificación y tiempo de entrenamiento. Los resultados de la comparación indicaron que NB tuvo una repercusión positiva en la sensibilidad y precisión, debido a que estos indicadores fueron mayores a los obtenidos por los algoritmos CNN y RF; asimismo, NB tuvo menor tiempo de entrenamiento e identificación. La especificidad y la exactitudno fueron mayores a los resultados obtenidos por el algoritmo RF, pero fueron mayores a lo obtenido por el algoritmo CNN. Se recomendó emplear el algoritmo regresión logística, con la finalidad de manejar datos de alta dimensionalidad, lo cual permite identificar características relevantes, manejar datos no lineales y capturar relaciones complejas en los datos para una investigación a futuro.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).