Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas

Descripción del Articulo

Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Y...

Descripción completa

Detalles Bibliográficos
Autor: Cardoso Yllanes, Gerardo
Formato: tesis de maestría
Fecha de Publicación:2022
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/23755
Enlace del recurso:http://hdl.handle.net/20.500.12404/23755
Nivel de acceso:acceso abierto
Materia:Redes neuronales (Computación)
Lingüística computacional
Lenguas indígenas--Perú
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_0456e0a7615425add0450644b8c78a6f
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/23755
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
title Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
spellingShingle Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
Cardoso Yllanes, Gerardo
Redes neuronales (Computación)
Lingüística computacional
Lenguas indígenas--Perú
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
title_full Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
title_fullStr Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
title_full_unstemmed Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
title_sort Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
author Cardoso Yllanes, Gerardo
author_facet Cardoso Yllanes, Gerardo
author_role author
dc.contributor.advisor.fl_str_mv Gómez Montoya, Héctor Erasmo
dc.contributor.author.fl_str_mv Cardoso Yllanes, Gerardo
dc.subject.es_ES.fl_str_mv Redes neuronales (Computación)
Lingüística computacional
Lenguas indígenas--Perú
topic Redes neuronales (Computación)
Lingüística computacional
Lenguas indígenas--Perú
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-11-09T20:46:41Z
dc.date.available.none.fl_str_mv 2022-11-09T20:46:41Z
dc.date.created.none.fl_str_mv 2022
dc.date.issued.fl_str_mv 2022-11-09
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/23755
url http://hdl.handle.net/20.500.12404/23755
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/9cb99fb6-ca66-4894-bfd3-a726fe2e1adc/download
https://tesis.pucp.edu.pe/bitstreams/ef8cc594-684c-48bb-b2a9-c08c8152dfa4/download
https://tesis.pucp.edu.pe/bitstreams/c0ae0b10-f4c7-4595-a392-247b14c842f3/download
https://tesis.pucp.edu.pe/bitstreams/c712efbc-c477-47f2-bda5-92dc514504a5/download
https://tesis.pucp.edu.pe/bitstreams/7ca29b04-cc3d-4b51-9a95-a8a140c75663/download
bitstream.checksum.fl_str_mv ae327c7bc6cfdee5891f9c74f1263413
5a4ffbc01f1b5eb70a835dac0d501661
8a4605be74aa9ea9d79846c1fba20a33
97403cdb886b13e95049d85b44f8666f
49de58bd763b8c12b244b976ffa7ce08
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834736845457457152
spelling Gómez Montoya, Héctor ErasmoCardoso Yllanes, Gerardo2022-11-09T20:46:41Z2022-11-09T20:46:41Z20222022-11-09http://hdl.handle.net/20.500.12404/23755Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/pe/Redes neuronales (Computación)Lingüística computacionalLenguas indígenas--Perúhttps://purl.org/pe-repo/ocde/ford#1.02.00Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanasinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación70599170https://orcid.org/0000-0002-1338-339248155961611087Villanueva Talavera, Edwin RafaelGomez Montoya, Hector ErasmoOncevay Marcos, Felix Arturohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdfCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdfTexto completoapplication/pdf276100https://tesis.pucp.edu.pe/bitstreams/9cb99fb6-ca66-4894-bfd3-a726fe2e1adc/downloadae327c7bc6cfdee5891f9c74f1263413MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://tesis.pucp.edu.pe/bitstreams/ef8cc594-684c-48bb-b2a9-c08c8152dfa4/download5a4ffbc01f1b5eb70a835dac0d501661MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/c0ae0b10-f4c7-4595-a392-247b14c842f3/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.jpgCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.jpgIM Thumbnailimage/jpeg13210https://tesis.pucp.edu.pe/bitstreams/c712efbc-c477-47f2-bda5-92dc514504a5/download97403cdb886b13e95049d85b44f8666fMD54falseAnonymousREADTEXTCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.txtCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.txtExtracted texttext/plain43828https://tesis.pucp.edu.pe/bitstreams/7ca29b04-cc3d-4b51-9a95-a8a140c75663/download49de58bd763b8c12b244b976ffa7ce08MD55falseAnonymousREAD20.500.12404/23755oai:tesis.pucp.edu.pe:20.500.12404/237552025-03-05 01:57:59.695http://creativecommons.org/licenses/by/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.919782
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).