Modelos de CNN para el análisis de imágenes y detección de datos de interés en partidas registrales

Descripción del Articulo

La revisión de imágenes de documentos digitales que son analizados tanto en instituciones públicas como privadas, es fundamental para mejorar el tiempo y calidad en la prestación de servicios. Actualmente en las entidades públicas se gestionan documentos registrales como actas, contratos entre otros...

Descripción completa

Detalles Bibliográficos
Autores: Olaechea Sanchez, Rodrigo Andre, Layme Aviega, Maryure Rotbel
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/18328
Enlace del recurso:https://hdl.handle.net/20.500.12773/18328
Nivel de acceso:acceso abierto
Materia:CNN
análisis de imágenes
partidas registrales
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:La revisión de imágenes de documentos digitales que son analizados tanto en instituciones públicas como privadas, es fundamental para mejorar el tiempo y calidad en la prestación de servicios. Actualmente en las entidades públicas se gestionan documentos registrales como actas, contratos entre otros documentos. En la ciudad de Arequipa se generan miles de asientos registrales los cuales presentan incidencias en la generación de las imágenes; por lo cual se realiza una revisión manual diaria, por el personal especializado de TI de la entidad registral, lo que términos de eficiencia y recursos humanos no es óptimo. La tesis presentada propone cuatro modelos inteligentes basado en redes convolucionales (CNN) para la detección automática de datos de interés en imágenes de partidas registrales para optimizar el proceso de revisión de documentos. El desarrollo de la propuesta presenta: organización y etiquetado de datos, preprocesamiento, arquitectura y entrenamiento del modelo que son indispensables para la detección de datos de interés. Como resultado se desarrollaron 4 modelos: Modelo de cabecera, firma, hoja en blanco y página mezclada. Para evaluar el desempeño de estos modelos entrenados, se utilizó un conjunto de 12,396 imágenes de partidas registrales, las cuales fueron revisadas por el personal especialista. Posterior a esta revisión se aplicaron métricas de evaluación como la precisión, exactitud y recuperación. En síntesis, los resultados experimentales obtenidos lograron una precisión de 98% para el modelo de hoja en blanco, 92% para el modelo firma , 91% para el modelo de cabecera y 91% para el modelo de hoja mezclada.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).