Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos

Descripción del Articulo

Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existe...

Descripción completa

Detalles Bibliográficos
Autor: Ascarza Mendoza, Franco Javier
Formato: tesis de maestría
Fecha de Publicación:2018
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/13050
Enlace del recurso:http://hdl.handle.net/20.500.12404/13050
Nivel de acceso:acceso abierto
Materia:Procesamiento de imágenes digitales
Manuscritos
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_787aff6bc60c3fa7eb725c40ed8aef14
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/13050
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
title Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
spellingShingle Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
Ascarza Mendoza, Franco Javier
Procesamiento de imágenes digitales
Manuscritos
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
title_full Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
title_fullStr Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
title_full_unstemmed Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
title_sort Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
author Ascarza Mendoza, Franco Javier
author_facet Ascarza Mendoza, Franco Javier
author_role author
dc.contributor.advisor.fl_str_mv Beltrán Castañón, César Armando
dc.contributor.author.fl_str_mv Ascarza Mendoza, Franco Javier
dc.subject.es_ES.fl_str_mv Procesamiento de imágenes digitales
Manuscritos
topic Procesamiento de imágenes digitales
Manuscritos
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existen documentos y manuscritos históricos escritos en un lenguaje extinto en la actualidad y una cantidad limitada de profesionales expertos en la interpretación y análisis de dichos documentos. Las imágenes de los documentos y manuscritos históricos poseen características particulares producto precisamente de su antigüedad como por ejemplo: La degradación del papel, el desvanecimiento de la tinta, la variabilidad en iluminación y textura, entre otros. Tareas como recuperación de información o traducción automática de imágenes de manuscritos históricos requieren una etapa de pre-procesamiento importante debido a las características mencionadas en el párrafo anterior. Entre las tareas de pre-procesamiento se puede mencionar la binarización y la segmentación de la imagen en regiones de interés. La presente tesis se enfoca en el procedimiento de segmentación en regiones de interés de las imágenes de manuscritos históricos. Existen métodos para segmentar imágenes de documentos históricos basados fundamentalmente en la extracción manual de características con previo conocimiento del dominio. La finalidad de la presente tesis es desarrollar un modelo general que automáticamente aprenda a extraer características de los pixeles de las imágenes de los documentos históricos y utilizar dichas características para clasificar los pixeles en las clases que previamente se definirán.
publishDate 2018
dc.date.accessioned.es_ES.fl_str_mv 2018-11-28T22:28:21Z
dc.date.available.es_ES.fl_str_mv 2018-11-28T22:28:21Z
dc.date.created.es_ES.fl_str_mv 2018
dc.date.issued.fl_str_mv 2018-11-28
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/13050
url http://hdl.handle.net/20.500.12404/13050
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/92d45028-5a66-4d4c-8637-5efc76ad1728/download
https://tesis.pucp.edu.pe/bitstreams/1f7b2a41-1711-4e16-ab5e-641a41751062/download
https://tesis.pucp.edu.pe/bitstreams/f832e005-9bbb-4f5b-a350-76fa36822840/download
https://tesis.pucp.edu.pe/bitstreams/03dfb3b8-6b77-451c-8547-53a473a630bb/download
https://tesis.pucp.edu.pe/bitstreams/ac837031-36b2-48b6-b5e5-a2bc21c3e401/download
bitstream.checksum.fl_str_mv ffeead7e3946f31a93cede39557c252a
63e069777db1d022a8dc5e82df4e9160
8a4605be74aa9ea9d79846c1fba20a33
f94486e63c380c9512f7fba19fd97035
6b02e18b8b3e15d5dca24ce76c837bd7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1839177410258403328
spelling Beltrán Castañón, César ArmandoAscarza Mendoza, Franco Javier2018-11-28T22:28:21Z2018-11-28T22:28:21Z20182018-11-28http://hdl.handle.net/20.500.12404/13050Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existen documentos y manuscritos históricos escritos en un lenguaje extinto en la actualidad y una cantidad limitada de profesionales expertos en la interpretación y análisis de dichos documentos. Las imágenes de los documentos y manuscritos históricos poseen características particulares producto precisamente de su antigüedad como por ejemplo: La degradación del papel, el desvanecimiento de la tinta, la variabilidad en iluminación y textura, entre otros. Tareas como recuperación de información o traducción automática de imágenes de manuscritos históricos requieren una etapa de pre-procesamiento importante debido a las características mencionadas en el párrafo anterior. Entre las tareas de pre-procesamiento se puede mencionar la binarización y la segmentación de la imagen en regiones de interés. La presente tesis se enfoca en el procedimiento de segmentación en regiones de interés de las imágenes de manuscritos históricos. Existen métodos para segmentar imágenes de documentos históricos basados fundamentalmente en la extracción manual de características con previo conocimiento del dominio. La finalidad de la presente tesis es desarrollar un modelo general que automáticamente aprenda a extraer características de los pixeles de las imágenes de los documentos históricos y utilizar dichas características para clasificar los pixeles en las clases que previamente se definirán.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Procesamiento de imágenes digitalesManuscritoshttps://purl.org/pe-repo/ocde/ford#1.02.00Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricosinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoInformática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-4140611087https://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALASCARZA_MENDOZA_FRANCO_JAVIER.pdfASCARZA_MENDOZA_FRANCO_JAVIER.pdfTexto completoapplication/pdf1489234https://tesis.pucp.edu.pe/bitstreams/92d45028-5a66-4d4c-8637-5efc76ad1728/downloadffeead7e3946f31a93cede39557c252aMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81030https://tesis.pucp.edu.pe/bitstreams/1f7b2a41-1711-4e16-ab5e-641a41751062/download63e069777db1d022a8dc5e82df4e9160MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/f832e005-9bbb-4f5b-a350-76fa36822840/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILASCARZA_MENDOZA_FRANCO_JAVIER.pdf.jpgASCARZA_MENDOZA_FRANCO_JAVIER.pdf.jpgIM Thumbnailimage/jpeg12011https://tesis.pucp.edu.pe/bitstreams/03dfb3b8-6b77-451c-8547-53a473a630bb/downloadf94486e63c380c9512f7fba19fd97035MD54falseAnonymousREADTEXTASCARZA_MENDOZA_FRANCO_JAVIER.pdf.txtASCARZA_MENDOZA_FRANCO_JAVIER.pdf.txtExtracted texttext/plain103063https://tesis.pucp.edu.pe/bitstreams/ac837031-36b2-48b6-b5e5-a2bc21c3e401/download6b02e18b8b3e15d5dca24ce76c837bd7MD55falseAnonymousREAD20.500.12404/13050oai:tesis.pucp.edu.pe:20.500.12404/130502025-07-18 12:54:07.138http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.403676
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).