Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video

Ramírez Díaz, José Fernando

Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video

Descripción del Articulo

En la presente tesis se aborda el diseño e implementación de un algoritmo que permite formar la imagen completa de un documento con texto impreso partiendo de un video que contiene fragmentos de la página en cuestión. Dicho algoritmo recibe como entrada un video registrado empleando la cámara de un...

Descripción completa

Detalles Bibliográficos
Autor:	Ramírez Díaz, José Fernando
Formato:	tesis de grado
Fecha de Publicación:	2020
Institución:	Pontificia Universidad Católica del Perú
Repositorio:	PUCP-Tesis
Lenguaje:	español
OAI Identifier:	oai:tesis.pucp.edu.pe:20.500.12404/17644
Enlace del recurso:	http://hdl.handle.net/20.500.12404/17644
Nivel de acceso:	acceso abierto
Materia:	Digitalización Procesamiento de imágenes digitales Sistemas de reconocimiento de patrones https://purl.org/pe-repo/ocde/ford#2.02.01

id	PUCP_d06d185323d94d2af5c6bafddbcbe0fa
oai_identifier_str	oai:tesis.pucp.edu.pe:20.500.12404/17644
network_acronym_str	PUCP
network_name_str	PUCP-Tesis
repository_id_str	.
dc.title.es_ES.fl_str_mv	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
title	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
spellingShingle	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video Ramírez Díaz, José Fernando Digitalización Procesamiento de imágenes digitales Sistemas de reconocimiento de patrones https://purl.org/pe-repo/ocde/ford#2.02.01
title_short	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
title_full	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
title_fullStr	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
title_full_unstemmed	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
title_sort	Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
author	Ramírez Díaz, José Fernando
author_facet	Ramírez Díaz, José Fernando
author_role	author
dc.contributor.advisor.fl_str_mv	Crisóstomo Romero, Pedro Moisés
dc.contributor.author.fl_str_mv	Ramírez Díaz, José Fernando
dc.subject.es_ES.fl_str_mv	Digitalización Procesamiento de imágenes digitales Sistemas de reconocimiento de patrones
topic	Digitalización Procesamiento de imágenes digitales Sistemas de reconocimiento de patrones https://purl.org/pe-repo/ocde/ford#2.02.01
dc.subject.ocde.es_ES.fl_str_mv	https://purl.org/pe-repo/ocde/ford#2.02.01
description	En la presente tesis se aborda el diseño e implementación de un algoritmo que permite formar la imagen completa de un documento con texto impreso partiendo de un video que contiene fragmentos de la página en cuestión. Dicho algoritmo recibe como entrada un video registrado empleando la cámara de un teléfono móvil y como resultado retornará la imagen del documento con texto completo; esta imagen puede ser empleada posteriormente en un algoritmo de reconocimiento óptico de caracteres (u OCR por sus siglas en inglés) para recuperar el texto en forma digital. El enfoque del desarrollo de esta propuesta es el de brindar una solución alternativa, en cuanto a adquisición de imágenes, para las existentes aplicaciones móviles de OCR enfocadas en apoyar a personas con ceguera parcial o total. Para abarcar el planteamiento y cumplimiento de los objetivos de este proyecto, se ha estructurado el mismo en 4 capítulos. En el capítulo 1 se aborda la actual situación de personas con distintos grados de discapacidad visual en nuestro país y diversos sistemas que buscan apoyarlos en recuperar su autonomía informativa y educativa. Además, se trata detalles sobre el estado del arte en adquisición de imágenes para las aplicaciones OCR existentes en la actualidad y sus falencias. En el capítulo 2 se presenta el marco teórico que avala el desarrollo del algoritmo propuesto, desde la teoría necesaria en procesamiento de imágenes y, también, sobre el registro de vídeos. En el capítulo 3 se trata el diseño e implementación del algoritmo en dos plataformas: inicialmente en Python 3.6 para la etapa de calibración de parámetros en una computadora de escritorio, y en C++ para las pruebas finales en un teléfono con SO Android. En dicho capítulo también se hace presente consideraciones planteadas para la creación del conjunto de videos de pruebas en Python. Finalmente, en el capítulo 4 se exponen las pruebas y resultados obtenidos de la aplicación del algoritmo, en Python, sobre la base de muestras creadas, y los resultados finales del uso de la aplicación en Android. Para estimar el grado de conformidad de la imagen resultante se hará uso de la métrica de Levenshtein o distancia de edición, la cual señala cuántos caracteres detectados en la imagen compuesta son diferentes a los caracteres del texto original.
publishDate	2020
dc.date.accessioned.none.fl_str_mv	2020-12-07T20:03:35Z
dc.date.available.none.fl_str_mv	2020-12-07T20:03:35Z
dc.date.created.none.fl_str_mv	2020
dc.date.issued.fl_str_mv	2020-12-07
dc.type.es_ES.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
dc.identifier.uri.none.fl_str_mv	http://hdl.handle.net/20.500.12404/17644
url	http://hdl.handle.net/20.500.12404/17644
dc.language.iso.es_ES.fl_str_mv	spa
language	spa
dc.relation.ispartof.fl_str_mv	SUNEDU
dc.rights.es_ES.fl_str_mv	info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv	http://creativecommons.org/licenses/by-nc/2.5/pe/
eu_rights_str_mv	openAccess
rights_invalid_str_mv	http://creativecommons.org/licenses/by-nc/2.5/pe/
dc.publisher.es_ES.fl_str_mv	Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv	PE
dc.source.none.fl_str_mv	reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP
instname_str	Pontificia Universidad Católica del Perú
instacron_str	PUCP
institution	PUCP
reponame_str	PUCP-Tesis
collection	PUCP-Tesis
bitstream.url.fl_str_mv	https://tesis.pucp.edu.pe/bitstreams/b0619ca0-c459-4c16-813b-9b050b52ccad/download https://tesis.pucp.edu.pe/bitstreams/e965e0e7-43ad-4469-8260-5a800ee26283/download https://tesis.pucp.edu.pe/bitstreams/c8bf5304-0b26-43c6-b7d7-504d3938fd99/download https://tesis.pucp.edu.pe/bitstreams/e5a40303-5b5d-4c8f-b481-ba90681f921f/download https://tesis.pucp.edu.pe/bitstreams/1ff39d14-6689-4ce1-829e-8119341678a7/download https://tesis.pucp.edu.pe/bitstreams/d4ff23cd-2a9f-4917-aa29-61c25169b234/download https://tesis.pucp.edu.pe/bitstreams/6583aa2a-4d53-44ef-be25-4671c677fffc/download https://tesis.pucp.edu.pe/bitstreams/3254ea25-989b-4c4c-845e-950a6c40847a/download https://tesis.pucp.edu.pe/bitstreams/e6d1c395-144c-485f-be3d-86596718a2bf/download
bitstream.checksum.fl_str_mv	1eb59b799c082835da0b6b91e152da6d a9a8238e6043663c064961e6230cfeb3 8a4605be74aa9ea9d79846c1fba20a33 ed4135857dd397ad5b80e432e9e9432a 359c44dc7a64a2a078e7503c011e0961 359c44dc7a64a2a078e7503c011e0961 359c44dc7a64a2a078e7503c011e0961 359c44dc7a64a2a078e7503c011e0961 359c44dc7a64a2a078e7503c011e0961
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositorio de Tesis PUCP
repository.mail.fl_str_mv	raul.sifuentes@pucp.pe
_version_	1834736872000061440
spelling	Crisóstomo Romero, Pedro MoisésRamírez Díaz, José Fernando2020-12-07T20:03:35Z2020-12-07T20:03:35Z20202020-12-07http://hdl.handle.net/20.500.12404/17644En la presente tesis se aborda el diseño e implementación de un algoritmo que permite formar la imagen completa de un documento con texto impreso partiendo de un video que contiene fragmentos de la página en cuestión. Dicho algoritmo recibe como entrada un video registrado empleando la cámara de un teléfono móvil y como resultado retornará la imagen del documento con texto completo; esta imagen puede ser empleada posteriormente en un algoritmo de reconocimiento óptico de caracteres (u OCR por sus siglas en inglés) para recuperar el texto en forma digital. El enfoque del desarrollo de esta propuesta es el de brindar una solución alternativa, en cuanto a adquisición de imágenes, para las existentes aplicaciones móviles de OCR enfocadas en apoyar a personas con ceguera parcial o total. Para abarcar el planteamiento y cumplimiento de los objetivos de este proyecto, se ha estructurado el mismo en 4 capítulos. En el capítulo 1 se aborda la actual situación de personas con distintos grados de discapacidad visual en nuestro país y diversos sistemas que buscan apoyarlos en recuperar su autonomía informativa y educativa. Además, se trata detalles sobre el estado del arte en adquisición de imágenes para las aplicaciones OCR existentes en la actualidad y sus falencias. En el capítulo 2 se presenta el marco teórico que avala el desarrollo del algoritmo propuesto, desde la teoría necesaria en procesamiento de imágenes y, también, sobre el registro de vídeos. En el capítulo 3 se trata el diseño e implementación del algoritmo en dos plataformas: inicialmente en Python 3.6 para la etapa de calibración de parámetros en una computadora de escritorio, y en C++ para las pruebas finales en un teléfono con SO Android. En dicho capítulo también se hace presente consideraciones planteadas para la creación del conjunto de videos de pruebas en Python. Finalmente, en el capítulo 4 se exponen las pruebas y resultados obtenidos de la aplicación del algoritmo, en Python, sobre la base de muestras creadas, y los resultados finales del uso de la aplicación en Android. Para estimar el grado de conformidad de la imagen resultante se hará uso de la métrica de Levenshtein o distancia de edición, la cual señala cuántos caracteres detectados en la imagen compuesta son diferentes a los caracteres del texto original.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc/2.5/pe/DigitalizaciónProcesamiento de imágenes digitalesSistemas de reconocimiento de patroneshttps://purl.org/pe-repo/ocde/ford#2.02.01Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un videoinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero ElectrónicoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Electrónica10131502https://orcid.org/0000-0002-8810-900572686091712026Rodriguez Valderrama, Paul AntonioCrisostomo Romero, Pedro MoisesTafur Sotelo, Julio Cesarhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdfRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdfTexto completoapplication/pdf71632441https://tesis.pucp.edu.pe/bitstreams/b0619ca0-c459-4c16-813b-9b050b52ccad/download1eb59b799c082835da0b6b91e152da6dMD51trueAnonymousREAD2020-12-12CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8920https://tesis.pucp.edu.pe/bitstreams/e965e0e7-43ad-4469-8260-5a800ee26283/downloada9a8238e6043663c064961e6230cfeb3MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/c8bf5304-0b26-43c6-b7d7-504d3938fd99/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.jpgRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.jpgIM Thumbnailimage/jpeg23700https://tesis.pucp.edu.pe/bitstreams/e5a40303-5b5d-4c8f-b481-ba90681f921f/downloaded4135857dd397ad5b80e432e9e9432aMD54falseAnonymousREADTEXTRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtExtracted texttext/plain196984https://tesis.pucp.edu.pe/bitstreams/1ff39d14-6689-4ce1-829e-8119341678a7/download359c44dc7a64a2a078e7503c011e0961MD55falseAnonymousREAD2020-12-12TEXTRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtExtracted texttext/plain196984https://tesis.pucp.edu.pe/bitstreams/d4ff23cd-2a9f-4917-aa29-61c25169b234/download359c44dc7a64a2a078e7503c011e0961MD55falseAnonymousREAD2020-12-12TEXTRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtExtracted texttext/plain196984https://tesis.pucp.edu.pe/bitstreams/6583aa2a-4d53-44ef-be25-4671c677fffc/download359c44dc7a64a2a078e7503c011e0961MD55falseAnonymousREAD2020-12-12TEXTRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtExtracted texttext/plain196984https://tesis.pucp.edu.pe/bitstreams/3254ea25-989b-4c4c-845e-950a6c40847a/download359c44dc7a64a2a078e7503c011e0961MD55falseAnonymousREAD2020-12-12TEXTRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtRAMIREZ_DIAZ_JOSE_FORMACIÓN_IMAGEN_COMPLETA.pdf.txtExtracted texttext/plain196984https://tesis.pucp.edu.pe/bitstreams/e6d1c395-144c-485f-be3d-86596718a2bf/download359c44dc7a64a2a078e7503c011e0961MD55falseAnonymousREAD2020-12-1220.500.12404/17644oai:tesis.pucp.edu.pe:20.500.12404/176442025-03-27 18:18:21.919http://creativecommons.org/licenses/by-nc/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score	13.917434

Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video

Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).

Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video

Descripción del Articulo

Ejemplares Similares