Aprendizaje profundo para transcripción de textos históricos manuscritos en español

Descripción del Articulo

El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de...

Descripción completa

Detalles Bibliográficos
Autor: Choque Dextre, Gustavo Jorge
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/28295
Enlace del recurso:http://hdl.handle.net/20.500.12404/28295
Nivel de acceso:acceso abierto
Materia:Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_cf838673d3d1eac2565bfa1ebe5f3790
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/28295
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title Aprendizaje profundo para transcripción de textos históricos manuscritos en español
spellingShingle Aprendizaje profundo para transcripción de textos históricos manuscritos en español
Choque Dextre, Gustavo Jorge
Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_full Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_fullStr Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_full_unstemmed Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_sort Aprendizaje profundo para transcripción de textos históricos manuscritos en español
author Choque Dextre, Gustavo Jorge
author_facet Choque Dextre, Gustavo Jorge
author_role author
dc.contributor.advisor.fl_str_mv Beltrán Castañón, Cesar Armando
dc.contributor.author.fl_str_mv Choque Dextre, Gustavo Jorge
dc.subject.es_ES.fl_str_mv Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
topic Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-16T17:54:38Z
dc.date.available.none.fl_str_mv 2024-07-16T17:54:38Z
dc.date.created.none.fl_str_mv 2024
dc.date.issued.fl_str_mv 2024-07-16
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/28295
url http://hdl.handle.net/20.500.12404/28295
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/2db2387e-fc8b-4770-954d-466d3faefa4c/download
https://tesis.pucp.edu.pe/bitstreams/a9a3ddef-1227-484b-9fb7-e1ed55682b64/download
https://tesis.pucp.edu.pe/bitstreams/a214eb5c-5f59-4159-8f5e-ab68988c2c00/download
https://tesis.pucp.edu.pe/bitstreams/ec5cfaab-35a2-4e06-9e75-ed574fe20a60/download
https://tesis.pucp.edu.pe/bitstreams/7b420346-53f0-4afc-b7e4-08c65851c9de/download
https://tesis.pucp.edu.pe/bitstreams/93d8dd88-f6b1-4b8d-a411-b191851311a7/download
https://tesis.pucp.edu.pe/bitstreams/babbde1c-5630-4346-b3cf-fd31af6cd5b4/download
https://tesis.pucp.edu.pe/bitstreams/171b9572-7d7b-4fe3-822d-1185db67b229/download
https://tesis.pucp.edu.pe/bitstreams/affeef18-c0b4-4f54-850b-9f75b673d901/download
https://tesis.pucp.edu.pe/bitstreams/1d418932-1329-427e-b895-99a2dd47e900/download
bitstream.checksum.fl_str_mv 050f0b5e4c8b96087593b6d02df33372
5b26e6cfb0a68fb1e1d8917e37d03e01
3655808e5dd46167956d6870b0f43800
8a4605be74aa9ea9d79846c1fba20a33
ff4389de1ffb2f6611ab31822e4401bb
9ff5d80fffe8f192c261725f5a1bf35a
cdbffb3b14763f28b1b362a1136570a5
5b6811ac6ee42703f85e28b7a8db1eec
cdbffb3b14763f28b1b362a1136570a5
5b6811ac6ee42703f85e28b7a8db1eec
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736938564714496
spelling Beltrán Castañón, Cesar ArmandoChoque Dextre, Gustavo Jorge2024-07-16T17:54:38Z2024-07-16T17:54:38Z20242024-07-16http://hdl.handle.net/20.500.12404/28295El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Reconocimiento de imágenesAprendizaje automático (Inteligencia artificial)Redes neuronales (Computación)https://purl.org/pe-repo/ocde/ford#1.02.00Aprendizaje profundo para transcripción de textos históricos manuscritos en españolinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-414044402639611087Villanueva Talavera, Edwin RafaelBeltrán Castañón, César ArmandoPineda Ancco, Ferdinand Edgardohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALCHOQUE_DEXTRE_GUSTAVO_JORGE.pdfCHOQUE_DEXTRE_GUSTAVO_JORGE.pdfTexto completoapplication/pdf520489https://tesis.pucp.edu.pe/bitstreams/2db2387e-fc8b-4770-954d-466d3faefa4c/download050f0b5e4c8b96087593b6d02df33372MD51trueAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdfCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdfReporte de originalidadapplication/pdf2069090https://tesis.pucp.edu.pe/bitstreams/a9a3ddef-1227-484b-9fb7-e1ed55682b64/download5b26e6cfb0a68fb1e1d8917e37d03e01MD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://tesis.pucp.edu.pe/bitstreams/a214eb5c-5f59-4159-8f5e-ab68988c2c00/download3655808e5dd46167956d6870b0f43800MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/ec5cfaab-35a2-4e06-9e75-ed574fe20a60/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.jpgCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.jpgIM Thumbnailimage/jpeg22381https://tesis.pucp.edu.pe/bitstreams/7b420346-53f0-4afc-b7e4-08c65851c9de/downloadff4389de1ffb2f6611ab31822e4401bbMD55falseAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.jpgCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.jpgIM Thumbnailimage/jpeg7893https://tesis.pucp.edu.pe/bitstreams/93d8dd88-f6b1-4b8d-a411-b191851311a7/download9ff5d80fffe8f192c261725f5a1bf35aMD56falseAnonymousREAD2500-01-01TEXTCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtExtracted texttext/plain33690https://tesis.pucp.edu.pe/bitstreams/babbde1c-5630-4346-b3cf-fd31af6cd5b4/downloadcdbffb3b14763f28b1b362a1136570a5MD57falseAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtExtracted texttext/plain1660https://tesis.pucp.edu.pe/bitstreams/171b9572-7d7b-4fe3-822d-1185db67b229/download5b6811ac6ee42703f85e28b7a8db1eecMD58falseAnonymousREAD2500-01-01TEXTCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtExtracted texttext/plain33690https://tesis.pucp.edu.pe/bitstreams/affeef18-c0b4-4f54-850b-9f75b673d901/downloadcdbffb3b14763f28b1b362a1136570a5MD57falseAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtExtracted texttext/plain1660https://tesis.pucp.edu.pe/bitstreams/1d418932-1329-427e-b895-99a2dd47e900/download5b6811ac6ee42703f85e28b7a8db1eecMD58falseAnonymousREAD2500-01-0120.500.12404/28295oai:tesis.pucp.edu.pe:20.500.12404/282952025-03-29 11:13:39.847http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.918182
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).