Análisis comparativo de Redes Neuronales Convolucionales y Vision Transformers para el diagnóstico automatizado en imágenes radiográficas

Descripción del Articulo

El diagnóstico médico automatizado mediante técnicas de aprendizaje profundo representa un campo en constante evolución, donde la selección de arquitecturas óptimas es importante para garantizar diagnósticos precisos y confiables. Esta investigación de tipo comparativo evaluó el desempeño predictivo...

Descripción completa

Detalles Bibliográficos
Autor: Mamani Chambi, Yefer Andersson
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Nacional del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unap.edu.pe:20.500.14082/23680
Enlace del recurso:https://repositorio.unap.edu.pe/handle/20.500.14082/23680
Nivel de acceso:acceso abierto
Materia:Vision Transformers
Redes Neuronales Convolucionales
Diagnóstico automatizado
Imágenes radiográficas
Aprendizaje profundo
https://purl.org/pe-repo/ocde/ford#1.02.01
Descripción
Sumario:El diagnóstico médico automatizado mediante técnicas de aprendizaje profundo representa un campo en constante evolución, donde la selección de arquitecturas óptimas es importante para garantizar diagnósticos precisos y confiables. Esta investigación de tipo comparativo evaluó el desempeño predictivo de las Redes Neuronales Convolucionales (CNN) y los Vision Transformers (ViT) en el diagnóstico automatizado de imágenes radiográficas. Se analizaron 15,834 imágenes distribuidas entre casos de artrosis de rodilla, neumonía y tuberculosis, implementando cuatro variantes de cada arquitectura mediante validación cruzada de 5 folds y métricas exhaustivas de rendimiento. Los resultados demostraron una superioridad significativa de los Vision Transformers, con el modelo ViT-S/16 alcanzando un accuracy medio de 0.9132 (± 0.0144) en patología única y 0.9313 (± 0.0281) en múltiples patologías, superando al mejor modelo CNN (VGG16). El análisis inferencial mediante pruebas t de Student confirmó la significancia estadística de estas diferencias (p < 0.05). Se concluye que los Vision Transformers ofrecen un rendimiento superior y más estable para el diagnóstico automatizado mediante imágenes radiográficas, estableciendo una base sólida para su implementación en entornos clínicos.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).