Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
Descripción del Articulo
Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Y...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2022 |
Institución: | Pontificia Universidad Católica del Perú |
Repositorio: | PUCP-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/23755 |
Enlace del recurso: | http://hdl.handle.net/20.500.12404/23755 |
Nivel de acceso: | acceso abierto |
Materia: | Redes neuronales (Computación) Lingüística computacional Lenguas indígenas--Perú https://purl.org/pe-repo/ocde/ford#1.02.00 |
id |
PUCP_0456e0a7615425add0450644b8c78a6f |
---|---|
oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/23755 |
network_acronym_str |
PUCP |
network_name_str |
PUCP-Tesis |
repository_id_str |
. |
dc.title.es_ES.fl_str_mv |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
title |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
spellingShingle |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas Cardoso Yllanes, Gerardo Redes neuronales (Computación) Lingüística computacional Lenguas indígenas--Perú https://purl.org/pe-repo/ocde/ford#1.02.00 |
title_short |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
title_full |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
title_fullStr |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
title_full_unstemmed |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
title_sort |
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas |
author |
Cardoso Yllanes, Gerardo |
author_facet |
Cardoso Yllanes, Gerardo |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Gómez Montoya, Héctor Erasmo |
dc.contributor.author.fl_str_mv |
Cardoso Yllanes, Gerardo |
dc.subject.es_ES.fl_str_mv |
Redes neuronales (Computación) Lingüística computacional Lenguas indígenas--Perú |
topic |
Redes neuronales (Computación) Lingüística computacional Lenguas indígenas--Perú https://purl.org/pe-repo/ocde/ford#1.02.00 |
dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
description |
Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación. |
publishDate |
2022 |
dc.date.accessioned.none.fl_str_mv |
2022-11-09T20:46:41Z |
dc.date.available.none.fl_str_mv |
2022-11-09T20:46:41Z |
dc.date.created.none.fl_str_mv |
2022 |
dc.date.issued.fl_str_mv |
2022-11-09 |
dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/23755 |
url |
http://hdl.handle.net/20.500.12404/23755 |
dc.language.iso.es_ES.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by/2.5/pe/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by/2.5/pe/ |
dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
dc.publisher.country.es_ES.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
instname_str |
Pontificia Universidad Católica del Perú |
instacron_str |
PUCP |
institution |
PUCP |
reponame_str |
PUCP-Tesis |
collection |
PUCP-Tesis |
bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/9cb99fb6-ca66-4894-bfd3-a726fe2e1adc/download https://tesis.pucp.edu.pe/bitstreams/ef8cc594-684c-48bb-b2a9-c08c8152dfa4/download https://tesis.pucp.edu.pe/bitstreams/c0ae0b10-f4c7-4595-a392-247b14c842f3/download https://tesis.pucp.edu.pe/bitstreams/c712efbc-c477-47f2-bda5-92dc514504a5/download https://tesis.pucp.edu.pe/bitstreams/7ca29b04-cc3d-4b51-9a95-a8a140c75663/download |
bitstream.checksum.fl_str_mv |
ae327c7bc6cfdee5891f9c74f1263413 5a4ffbc01f1b5eb70a835dac0d501661 8a4605be74aa9ea9d79846c1fba20a33 97403cdb886b13e95049d85b44f8666f 49de58bd763b8c12b244b976ffa7ce08 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
_version_ |
1834736845457457152 |
spelling |
Gómez Montoya, Héctor ErasmoCardoso Yllanes, Gerardo2022-11-09T20:46:41Z2022-11-09T20:46:41Z20222022-11-09http://hdl.handle.net/20.500.12404/23755Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by/2.5/pe/Redes neuronales (Computación)Lingüística computacionalLenguas indígenas--Perúhttps://purl.org/pe-repo/ocde/ford#1.02.00Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanasinfo:eu-repo/semantics/masterThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación70599170https://orcid.org/0000-0002-1338-339248155961611087Villanueva Talavera, Edwin RafaelGomez Montoya, Hector ErasmoOncevay Marcos, Felix Arturohttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacionORIGINALCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdfCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdfTexto completoapplication/pdf276100https://tesis.pucp.edu.pe/bitstreams/9cb99fb6-ca66-4894-bfd3-a726fe2e1adc/downloadae327c7bc6cfdee5891f9c74f1263413MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://tesis.pucp.edu.pe/bitstreams/ef8cc594-684c-48bb-b2a9-c08c8152dfa4/download5a4ffbc01f1b5eb70a835dac0d501661MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/c0ae0b10-f4c7-4595-a392-247b14c842f3/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADTHUMBNAILCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.jpgCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.jpgIM Thumbnailimage/jpeg13210https://tesis.pucp.edu.pe/bitstreams/c712efbc-c477-47f2-bda5-92dc514504a5/download97403cdb886b13e95049d85b44f8666fMD54falseAnonymousREADTEXTCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.txtCARDOSO_YILANES_GERARDO_CORRECTOR_ORTOGRAFICO_NEURONAL.pdf.txtExtracted texttext/plain43828https://tesis.pucp.edu.pe/bitstreams/7ca29b04-cc3d-4b51-9a95-a8a140c75663/download49de58bd763b8c12b244b976ffa7ce08MD55falseAnonymousREAD20.500.12404/23755oai:tesis.pucp.edu.pe:20.500.12404/237552025-03-05 01:57:59.695http://creativecommons.org/licenses/by/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.919782 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).