Reconocimiento de Palabras en Manuscritos Históricos Basado en Aprendizaje Online
Descripción del Articulo
Se propone un método de reconocimiento online para la transcripción de palabras de manuscritos históricos, el cual incluye tres etapas: preprocesamiento, que emplea técnicas para segmentar el documento en imágenes de palabras; extracción de características, que usa información basada en el gra...
| Autor: | |
|---|---|
| Formato: | tesis doctoral |
| Fecha de Publicación: | 2017 |
| Institución: | Universidad Nacional de San Agustín |
| Repositorio: | UNSA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsa.edu.pe:UNSA/4579 |
| Enlace del recurso: | http://repositorio.unsa.edu.pe/handle/UNSA/4579 |
| Nivel de acceso: | acceso abierto |
| Materia: | Palabras escritas Aprendizaje Online Máquinas de Vectores Soporte Online Manuscritos Históricos https://purl.org/pe-repo/ocde/ford#1.02.01 |
| Sumario: | Se propone un método de reconocimiento online para la transcripción de palabras de manuscritos históricos, el cual incluye tres etapas: preprocesamiento, que emplea técnicas para segmentar el documento en imágenes de palabras; extracción de características, que usa información basada en el gradiente; y reconocimiento propiamente dicho, donde se concentran las principales contribuciones de esta tesis. En esta última etapa, se propusieron dos extensiones de la SVM-Online: la primera permite que el modelo opere con conjuntos de datos de más de dos clases; la segunda permite que el modelo emita salidas probabilísticas y evita la segmentación del documento a nivel de caracter. El modelo propuesto, llamado Reconocedor Basado en Grafos, representa cada imagen a ser reconocida como un grafo direccionado, cuyas aristas están relacionadas a una subimagen y a una probabilidad. En función de ésta se estima, para cada arista, un costo que es empleado por el algoritmo Dijkstra Modificado, también propuesto en esta tesis, para emitir la transcripción de la imagen en cuestión. Los experimentos fueron realizados con tres conjuntos de datos. En base a los experimentos realizados, podemos concluir que los resultados obtenidos son satisfactorios en relación a otras propuestas de transcripción de textos presentadas en la literatura. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).