Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
Descripción del Articulo
Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existe...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2018 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/13050 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/13050 |
Nivel de acceso: | acceso abierto |
Materia: | Procesamiento de imágenes digitales Manuscritos https://purl.org/pe-repo/ocde/ford#1.02.00 |
id |
PUCP_787aff6bc60c3fa7eb725c40ed8aef14 |
---|---|
oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/13050 |
network_acronym_str |
PUCP |
network_name_str |
PUCP-Tesis |
repository_id_str |
. |
dc.title.es_ES.fl_str_mv |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
title |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
spellingShingle |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos Ascarza Mendoza, Franco Javier Procesamiento de imágenes digitales Manuscritos https://purl.org/pe-repo/ocde/ford#1.02.00 |
title_short |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
title_full |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
title_fullStr |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
title_full_unstemmed |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
title_sort |
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos |
author |
Ascarza Mendoza, Franco Javier |
author_facet |
Ascarza Mendoza, Franco Javier |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Beltrán Castañón, César Armando |
dc.contributor.author.fl_str_mv |
Ascarza Mendoza, Franco Javier |
dc.subject.es_ES.fl_str_mv |
Procesamiento de imágenes digitales Manuscritos |
topic |
Procesamiento de imágenes digitales Manuscritos https://purl.org/pe-repo/ocde/ford#1.02.00 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
description |
Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existen documentos y manuscritos históricos escritos en un lenguaje extinto en la actualidad y una cantidad limitada de profesionales expertos en la interpretación y análisis de dichos documentos. Las imágenes de los documentos y manuscritos históricos poseen características particulares producto precisamente de su antigüedad como por ejemplo: La degradación del papel, el desvanecimiento de la tinta, la variabilidad en iluminación y textura, entre otros. Tareas como recuperación de información o traducción automática de imágenes de manuscritos históricos requieren una etapa de pre-procesamiento importante debido a las características mencionadas en el párrafo anterior. Entre las tareas de pre-procesamiento se puede mencionar la binarización y la segmentación de la imagen en regiones de interés. La presente tesis se enfoca en el procedimiento de segmentación en regiones de interés de las imágenes de manuscritos históricos. Existen métodos para segmentar imágenes de documentos históricos basados fundamentalmente en la extracción manual de características con previo conocimiento del dominio. La finalidad de la presente tesis es desarrollar un modelo general que automáticamente aprenda a extraer características de los pixeles de las imágenes de los documentos históricos y utilizar dichas características para clasificar los pixeles en las clases que previamente se definirán. |
publishDate |
2018 |
dc.date.accessioned.es_ES.fl_str_mv |
2018-11-28T22:28:21Z |
dc.date.available.es_ES.fl_str_mv |
2018-11-28T22:28:21Z |
dc.date.created.es_ES.fl_str_mv |
2018 |
dc.date.issued.fl_str_mv |
2018-11-28 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/13050 |
url |
http://hdl.handle.net/20.500.12404/13050 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Tesis |
collection |
PUCP-Tesis |
bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/92d45028-5a66-4d4c-8637-5efc76ad1728/download https://tesis.pucp.edu.pe/bitstreams/1f7b2a41-1711-4e16-ab5e-641a41751062/download https://tesis.pucp.edu.pe/bitstreams/f832e005-9bbb-4f5b-a350-76fa36822840/download https://tesis.pucp.edu.pe/bitstreams/03dfb3b8-6b77-451c-8547-53a473a630bb/download https://tesis.pucp.edu.pe/bitstreams/ac837031-36b2-48b6-b5e5-a2bc21c3e401/download |
bitstream.checksum.fl_str_mv |
ffeead7e3946f31a93cede39557c252a 63e069777db1d022a8dc5e82df4e9160 8a4605be74aa9ea9d79846c1fba20a33 f94486e63c380c9512f7fba19fd97035 6b02e18b8b3e15d5dca24ce76c837bd7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
_version_ |
1839177410258403328 |
spelling |
Beltrán Castañón, César ArmandoAscarza Mendoza, Franco Javier2018-11-28T22:28:21Z2018-11-28T22:28:21Z20182018-11-28http://hdl.handle.net/20.500.12404/13050Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existen documentos y manuscritos históricos escritos en un lenguaje extinto en la actualidad y una cantidad limitada de profesionales expertos en la interpretación y análisis de dichos documentos. Las imágenes de los documentos y manuscritos históricos poseen características particulares producto precisamente de su antigüedad como por ejemplo: La degradación del papel, el desvanecimiento de la tinta, la variabilidad en iluminación y textura, entre otros. Tareas como recuperación de información o traducción automática de imágenes de manuscritos históricos requieren una etapa de pre-procesamiento importante debido a las características mencionadas en el párrafo anterior. Entre las tareas de pre-procesamiento se puede mencionar la binarización y la segmentación de la imagen en regiones de interés. La presente tesis se enfoca en el procedimiento de segmentación en regiones de interés de las imágenes de manuscritos históricos. Existen métodos para segmentar imágenes de documentos históricos basados fundamentalmente en la extracción manual de características con previo conocimiento del dominio. La finalidad de la presente tesis es desarrollar un modelo general que automáticamente aprenda a extraer características de los pixeles de las imágenes de los documentos históricos y utilizar dichas características para clasificar los pixeles en las clases que previamente se definirán.TesisspaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Procesamiento de imágenes digitalesManuscritoshttps://purl.org/pe-repo/ocde/ford#1.02.00Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricosinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de PosgradoInformática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-4140611087https://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesisORIGINALASCARZA_MENDOZA_FRANCO_JAVIER.pdfASCARZA_MENDOZA_FRANCO_JAVIER.pdfTexto completoapplication/pdf1489234https://tesis.pucp.edu.pe/bitstreams/92d45028-5a66-4d4c-8637-5efc76ad1728/downloadffeead7e3946f31a93cede39557c252aMD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81030https://tesis.pucp.edu.pe/bitstreams/1f7b2a41-1711-4e16-ab5e-641a41751062/download63e069777db1d022a8dc5e82df4e9160MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/f832e005-9bbb-4f5b-a350-76fa36822840/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILASCARZA_MENDOZA_FRANCO_JAVIER.pdf.jpgASCARZA_MENDOZA_FRANCO_JAVIER.pdf.jpgIM Thumbnailimage/jpeg12011https://tesis.pucp.edu.pe/bitstreams/03dfb3b8-6b77-451c-8547-53a473a630bb/downloadf94486e63c380c9512f7fba19fd97035MD54falseAnonymousREADTEXTASCARZA_MENDOZA_FRANCO_JAVIER.pdf.txtASCARZA_MENDOZA_FRANCO_JAVIER.pdf.txtExtracted texttext/plain103063https://tesis.pucp.edu.pe/bitstreams/ac837031-36b2-48b6-b5e5-a2bc21c3e401/download6b02e18b8b3e15d5dca24ce76c837bd7MD55falseAnonymousREAD20.500.12404/13050oai:tesis.pucp.edu.pe:20.500.12404/130502025-07-18 12:54:07.138http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.403676 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).