Aprendizaje profundo para transcripción de textos históricos manuscritos en español

Descripción del Articulo

El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de...

Descripción completa

Detalles Bibliográficos
Autor: Choque Dextre, Gustavo Jorge
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/200435
Enlace del recurso:http://hdl.handle.net/20.500.12404/28295
Nivel de acceso:acceso abierto
Materia:Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.00
id RPUC_c39abef3801280ac58c2d46ea41bc0b8
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/200435
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
spelling Beltrán Castañón, Cesar ArmandoChoque Dextre, Gustavo Jorge2024-07-16T17:54:38Z2024-07-16T17:54:38Z20242024-07-16http://hdl.handle.net/20.500.12404/28295El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Reconocimiento de imágenesAprendizaje automático (Inteligencia artificial)Redes neuronales (Computación)https://purl.org/pe-repo/ocde/ford#1.02.00Aprendizaje profundo para transcripción de textos históricos manuscritos en españolinfo:eu-repo/semantics/masterThesisTesis de maestríareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-414044402639611087Villanueva Talavera, Edwin RafaelBeltrán Castañón, César ArmandoPineda Ancco, Ferdinand Edgardohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacion20.500.14657/200435oai:repositorio.pucp.edu.pe:20.500.14657/2004352024-08-08 11:14:57.666http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
dc.title.es_ES.fl_str_mv Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title Aprendizaje profundo para transcripción de textos históricos manuscritos en español
spellingShingle Aprendizaje profundo para transcripción de textos históricos manuscritos en español
Choque Dextre, Gustavo Jorge
Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_full Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_fullStr Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_full_unstemmed Aprendizaje profundo para transcripción de textos históricos manuscritos en español
title_sort Aprendizaje profundo para transcripción de textos históricos manuscritos en español
author Choque Dextre, Gustavo Jorge
author_facet Choque Dextre, Gustavo Jorge
author_role author
dc.contributor.advisor.fl_str_mv Beltrán Castañón, Cesar Armando
dc.contributor.author.fl_str_mv Choque Dextre, Gustavo Jorge
dc.subject.es_ES.fl_str_mv Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
topic Reconocimiento de imágenes
Aprendizaje automático (Inteligencia artificial)
Redes neuronales (Computación)
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-07-16T17:54:38Z
dc.date.available.none.fl_str_mv 2024-07-16T17:54:38Z
dc.date.created.none.fl_str_mv 2024
dc.date.issued.fl_str_mv 2024-07-16
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.other.none.fl_str_mv Tesis de maestría
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/28295
url http://hdl.handle.net/20.500.12404/28295
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835639799327752192
score 13.7211075
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).