Aprendizaje profundo para transcripción de textos históricos manuscritos en español
Descripción del Articulo
El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2024 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.pucp.edu.pe:20.500.14657/200435 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/28295 |
Nivel de acceso: | acceso abierto |
Materia: | Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
id |
RPUC_c39abef3801280ac58c2d46ea41bc0b8 |
---|---|
oai_identifier_str |
oai:repositorio.pucp.edu.pe:20.500.14657/200435 |
network_acronym_str |
RPUC |
network_name_str |
PUCP-Institucional |
repository_id_str |
2905 |
spelling |
Beltrán Castañón, Cesar ArmandoChoque Dextre, Gustavo Jorge2024-07-16T17:54:38Z2024-07-16T17:54:38Z20242024-07-16http://hdl.handle.net/20.500.12404/28295El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Reconocimiento de imágenesAprendizaje automático (Inteligencia artificial)Redes neuronales (Computación)https://purl.org/pe-repo/ocde/ford#1.02.00Aprendizaje profundo para transcripción de textos históricos manuscritos en españolinfo:eu-repo/semantics/masterThesisTesis de maestríareponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-414044402639611087Villanueva Talavera, Edwin RafaelBeltrán Castañón, César ArmandoPineda Ancco, Ferdinand Edgardohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacion20.500.14657/200435oai:repositorio.pucp.edu.pe:20.500.14657/2004352024-08-08 11:14:57.666http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe |
dc.title.es_ES.fl_str_mv |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
title |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
spellingShingle |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español Choque Dextre, Gustavo Jorge Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
title_short |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
title_full |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
title_fullStr |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
title_full_unstemmed |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
title_sort |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
author |
Choque Dextre, Gustavo Jorge |
author_facet |
Choque Dextre, Gustavo Jorge |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Beltrán Castañón, Cesar Armando |
dc.contributor.author.fl_str_mv |
Choque Dextre, Gustavo Jorge |
dc.subject.es_ES.fl_str_mv |
Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) |
topic |
Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
description |
El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII. |
publishDate |
2024 |
dc.date.accessioned.none.fl_str_mv |
2024-07-16T17:54:38Z |
dc.date.available.none.fl_str_mv |
2024-07-16T17:54:38Z |
dc.date.created.none.fl_str_mv |
2024 |
dc.date.issued.fl_str_mv |
2024-07-16 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.other.none.fl_str_mv |
Tesis de maestría |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/28295 |
url |
http://hdl.handle.net/20.500.12404/28295 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Institucional instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Institucional |
collection |
PUCP-Institucional |
repository.name.fl_str_mv |
Repositorio Institucional de la PUCP |
repository.mail.fl_str_mv |
repositorio@pucp.pe |
_version_ |
1835639799327752192 |
score |
13.7211075 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).