Estudio comparativo para la mejora de imágenes de documentos con diferentes familias tipográficas usando la transformada Wavelet, Curvelet y NMF

Descripción del Articulo

En la actualidad el proceso digitalización de documentos es muy importante; sin embargo la presencia de ruido digital genera un gran problema que afecta principalmente a la calidad visual del texto impidiendo la comodidad de las personas al momento de leer. Por este motivo, el objetivo principal de...

Descripción completa

Detalles Bibliográficos
Autor: Lloque Juárez, Antonio Emmanuel
Formato: tesis de grado
Fecha de Publicación:2018
Institución:Universidad Católica San Pablo
Repositorio:UCSP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.ucsp.edu.pe:20.500.12590/15560
Enlace del recurso:https://hdl.handle.net/20.500.12590/15560
Nivel de acceso:acceso abierto
Materia:Imágenes de documentos
Transformada Wavelet
Transformada Curvelet
NMF
https://purl.org/pe-repo/ocde/ford#2.02.05
Descripción
Sumario:En la actualidad el proceso digitalización de documentos es muy importante; sin embargo la presencia de ruido digital genera un gran problema que afecta principalmente a la calidad visual del texto impidiendo la comodidad de las personas al momento de leer. Por este motivo, el objetivo principal de este trabajo de tesis consiste en realizar un estudio comparativo entre dos métodos convencionales de eliminación de ruido basado en la Transformada Wavelet y la Transformada Curvelet con el método basado en NMF. NMF permite extraer exitosamente características de una imagen y presenta robustez frente a la presencia de ruido debido a su capacidad de representación dispersa de los datos. Sin embargo, NMF no considera un control explícito de la representación dispersa de la imagen en sus vectores base y coeficientes de activación o ganancia. En este trabajo se aplicó la función de coste de KullbackLeibler con parámetros de regulación para poder controlar el grado de dispersión del algoritmo NMF. Además, se aplicó un post-procesamiento de binarización Otsu y máscara espectral. Con la finalidad de evaluar el rendimiento de los métodos de eliminación de ruido mencionados anteriormente se usarán medidas de evaluación de calidad objetivas (PSNR y MSSIM) y subjetivas (MOS) usando una base de datos de imágenes de documentos con tres diferentes familias tipográficas (con serifa, sin serifa y máquina de escribir). Los resultados experimentales demuestran que dependiendo de la tipografía y tipo y nivel de ruido, algunos de los métodos de eliminación usados presentan un mejor rendimiento que el otro. Por ejemplo, para el caso del método basado en la Transformada Wavelet presenta mejores resultados en imágenes de documento contaminadas con ruido impulsivo al ser medidas con la medida subjetiva MOS, en el caso del método basado en la Transformada Curvelet es el que en general presenta mejor rendimiento en el proceso de eliminación de ruido. Mientras que en el caso del método basado en NMF presenta un rendimiento apropiado considerando las medidas objetivas PSNR y MSSIM al reducir ruido gaussiano, impulsivo y multiplicativo con tipográficas con y sin serifa superando al método basado en Transformada Wavelet; y de acuerdo a los resultados basados en la medida MOS, reduce sus diferencias con el método basado en la Transformada Curvelet.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).