Estudio comparativo de la eficiencia diagnóstica del cáncer de mama con los algoritmos CNN, NB y RF
Descripción del Articulo
El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión...
| Autores: | , |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Universidad Cesar Vallejo |
| Repositorio: | UCV-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucv.edu.pe:20.500.12692/153103 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12692/153103 |
| Nivel de acceso: | acceso abierto |
| Materia: | Redes neuronales convolucionales Bayesiana ingenua Random forest Tiempo de identificación Exactitud https://purl.org/pe-repo/ocde/ford#2.01.01 |
| Sumario: | El objetivo de la investigación fue comparar la eficiencia diagnóstica del cáncer de mama en mujeres con los algoritmos CNN (Convolutional Neural Networks - Redes Neuronales Convolucionales), RF (Random Forest - Bosque Aleatorio) y NB (Naive Bayes - Bayesiana Ingenua). Se usó la matriz de confusión del sistema para comparar y plasmar los resultados de la sensibilidad, la especificidad, la precisión, la exactitud, el tiempo de entrenamiento y el tiempo de diagnóstico de cáncer de mama de los algoritmos mencionados. Se consideró un total de 7632 imágenes mamográficas entre benignos (2520) y malignos (5112) para el diagnóstico de la enfermedad. La investigación fue de tipo aplicada, con un enfoque cuantitativo y diseño no experimental y tipo de diseño transversal descriptivo. Se usaron librerías gratuitas tales como Django, Keras, Tensorflow, OpenCV-Python, entre otras, para el desarrollo de lenguaje de programación Python. Además, se usó los criterios de inclusión y exclusión en la investigación para diferenciar qué imágenes no están incluidas y cuáles sí están incluidas para la población. Se utilizó el tipo y la cantidad de imágenes mamográficas para precisar la fuente (Data Science Kaggle) tipo (benigno y maligno), muestreo, el tiempo de identificación y tiempo de entrenamiento. Los resultados de la comparación indicaron que NB tuvo una repercusión positiva en la sensibilidad y precisión, debido a que estos indicadores fueron mayores a los obtenidos por los algoritmos CNN y RF; asimismo, NB tuvo menor tiempo de entrenamiento e identificación. La especificidad y la exactitudno fueron mayores a los resultados obtenidos por el algoritmo RF, pero fueron mayores a lo obtenido por el algoritmo CNN. Se recomendó emplear el algoritmo regresión logística, con la finalidad de manejar datos de alta dimensionalidad, lo cual permite identificar características relevantes, manejar datos no lineales y capturar relaciones complejas en los datos para una investigación a futuro. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).