Aprendizaje profundo para transcripción de textos históricos manuscritos en español
Descripción del Articulo
El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2024 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/28295 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/28295 |
| Nivel de acceso: | acceso abierto |
| Materia: | Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_cf838673d3d1eac2565bfa1ebe5f3790 |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/28295 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.es_ES.fl_str_mv |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| title |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| spellingShingle |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español Choque Dextre, Gustavo Jorge Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| title_full |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| title_fullStr |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| title_full_unstemmed |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| title_sort |
Aprendizaje profundo para transcripción de textos históricos manuscritos en español |
| author |
Choque Dextre, Gustavo Jorge |
| author_facet |
Choque Dextre, Gustavo Jorge |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Beltrán Castañón, Cesar Armando |
| dc.contributor.author.fl_str_mv |
Choque Dextre, Gustavo Jorge |
| dc.subject.es_ES.fl_str_mv |
Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) |
| topic |
Reconocimiento de imágenes Aprendizaje automático (Inteligencia artificial) Redes neuronales (Computación) https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2024-07-16T17:54:38Z |
| dc.date.available.none.fl_str_mv |
2024-07-16T17:54:38Z |
| dc.date.created.none.fl_str_mv |
2024 |
| dc.date.issued.fl_str_mv |
2024-07-16 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/28295 |
| url |
http://hdl.handle.net/20.500.12404/28295 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/2db2387e-fc8b-4770-954d-466d3faefa4c/download https://tesis.pucp.edu.pe/bitstreams/a9a3ddef-1227-484b-9fb7-e1ed55682b64/download https://tesis.pucp.edu.pe/bitstreams/a214eb5c-5f59-4159-8f5e-ab68988c2c00/download https://tesis.pucp.edu.pe/bitstreams/ec5cfaab-35a2-4e06-9e75-ed574fe20a60/download https://tesis.pucp.edu.pe/bitstreams/7b420346-53f0-4afc-b7e4-08c65851c9de/download https://tesis.pucp.edu.pe/bitstreams/93d8dd88-f6b1-4b8d-a411-b191851311a7/download https://tesis.pucp.edu.pe/bitstreams/babbde1c-5630-4346-b3cf-fd31af6cd5b4/download https://tesis.pucp.edu.pe/bitstreams/171b9572-7d7b-4fe3-822d-1185db67b229/download https://tesis.pucp.edu.pe/bitstreams/affeef18-c0b4-4f54-850b-9f75b673d901/download https://tesis.pucp.edu.pe/bitstreams/1d418932-1329-427e-b895-99a2dd47e900/download |
| bitstream.checksum.fl_str_mv |
050f0b5e4c8b96087593b6d02df33372 5b26e6cfb0a68fb1e1d8917e37d03e01 3655808e5dd46167956d6870b0f43800 8a4605be74aa9ea9d79846c1fba20a33 ff4389de1ffb2f6611ab31822e4401bb 9ff5d80fffe8f192c261725f5a1bf35a cdbffb3b14763f28b1b362a1136570a5 5b6811ac6ee42703f85e28b7a8db1eec cdbffb3b14763f28b1b362a1136570a5 5b6811ac6ee42703f85e28b7a8db1eec |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1834736938564714496 |
| spelling |
Beltrán Castañón, Cesar ArmandoChoque Dextre, Gustavo Jorge2024-07-16T17:54:38Z2024-07-16T17:54:38Z20242024-07-16http://hdl.handle.net/20.500.12404/28295El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Reconocimiento de imágenesAprendizaje automático (Inteligencia artificial)Redes neuronales (Computación)https://purl.org/pe-repo/ocde/ford#1.02.00Aprendizaje profundo para transcripción de textos históricos manuscritos en españolinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-414044402639611087Villanueva Talavera, Edwin RafaelBeltrán Castañón, César ArmandoPineda Ancco, Ferdinand Edgardohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALCHOQUE_DEXTRE_GUSTAVO_JORGE.pdfCHOQUE_DEXTRE_GUSTAVO_JORGE.pdfTexto completoapplication/pdf520489https://tesis.pucp.edu.pe/bitstreams/2db2387e-fc8b-4770-954d-466d3faefa4c/download050f0b5e4c8b96087593b6d02df33372MD51trueAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdfCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdfReporte de originalidadapplication/pdf2069090https://tesis.pucp.edu.pe/bitstreams/a9a3ddef-1227-484b-9fb7-e1ed55682b64/download5b26e6cfb0a68fb1e1d8917e37d03e01MD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://tesis.pucp.edu.pe/bitstreams/a214eb5c-5f59-4159-8f5e-ab68988c2c00/download3655808e5dd46167956d6870b0f43800MD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/ec5cfaab-35a2-4e06-9e75-ed574fe20a60/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.jpgCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.jpgIM Thumbnailimage/jpeg22381https://tesis.pucp.edu.pe/bitstreams/7b420346-53f0-4afc-b7e4-08c65851c9de/downloadff4389de1ffb2f6611ab31822e4401bbMD55falseAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.jpgCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.jpgIM Thumbnailimage/jpeg7893https://tesis.pucp.edu.pe/bitstreams/93d8dd88-f6b1-4b8d-a411-b191851311a7/download9ff5d80fffe8f192c261725f5a1bf35aMD56falseAnonymousREAD2500-01-01TEXTCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtExtracted texttext/plain33690https://tesis.pucp.edu.pe/bitstreams/babbde1c-5630-4346-b3cf-fd31af6cd5b4/downloadcdbffb3b14763f28b1b362a1136570a5MD57falseAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtExtracted texttext/plain1660https://tesis.pucp.edu.pe/bitstreams/171b9572-7d7b-4fe3-822d-1185db67b229/download5b6811ac6ee42703f85e28b7a8db1eecMD58falseAnonymousREAD2500-01-01TEXTCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE.pdf.txtExtracted texttext/plain33690https://tesis.pucp.edu.pe/bitstreams/affeef18-c0b4-4f54-850b-9f75b673d901/downloadcdbffb3b14763f28b1b362a1136570a5MD57falseAnonymousREADCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtCHOQUE_DEXTRE_GUSTAVO_JORGE_T.pdf.txtExtracted texttext/plain1660https://tesis.pucp.edu.pe/bitstreams/1d418932-1329-427e-b895-99a2dd47e900/download5b6811ac6ee42703f85e28b7a8db1eecMD58falseAnonymousREAD2500-01-0120.500.12404/28295oai:tesis.pucp.edu.pe:20.500.12404/282952025-03-29 11:13:39.847http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.918182 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).