Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU

Descripción del Articulo

El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fo...

Descripción completa

Detalles Bibliográficos
Autor: Asmat Ramirez, Evelyn Fiorella
Formato: tesis de grado
Fecha de Publicación:2023
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Tesis
Lenguaje:español
OAI Identifier:oai:tesis.pucp.edu.pe:20.500.12404/25281
Enlace del recurso:http://hdl.handle.net/20.500.12404/25281
Nivel de acceso:acceso abierto
Materia:Jebero (Shiwilu)--Perú--Amazonía, Región
Algoritmos
Aprendizaje automático
https://purl.org/pe-repo/ocde/ford#1.02.00
id PUCP_ed1cf72b9020b711e0297162cd59e7f9
oai_identifier_str oai:tesis.pucp.edu.pe:20.500.12404/25281
network_acronym_str PUCP
network_name_str PUCP-Tesis
repository_id_str .
dc.title.es_ES.fl_str_mv Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
title Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
spellingShingle Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
Asmat Ramirez, Evelyn Fiorella
Jebero (Shiwilu)--Perú--Amazonía, Región
Algoritmos
Aprendizaje automático
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
title_full Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
title_fullStr Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
title_full_unstemmed Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
title_sort Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
author Asmat Ramirez, Evelyn Fiorella
author_facet Asmat Ramirez, Evelyn Fiorella
author_role author
dc.contributor.advisor.fl_str_mv Zapata del Río, Claudia María del Pilar
Oncevay Marcos, Felix Arturo
dc.contributor.author.fl_str_mv Asmat Ramirez, Evelyn Fiorella
dc.subject.es_ES.fl_str_mv Jebero (Shiwilu)--Perú--Amazonía, Región
Algoritmos
Aprendizaje automático
topic Jebero (Shiwilu)--Perú--Amazonía, Región
Algoritmos
Aprendizaje automático
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fortalecimiento) para garantizar que no se extingan y así fomentar el interés de sus hablantes. Además, su documentación es muy escasa debido a los pocos estudios lingüísticos realizados. A fin de elevar su status, se sugiere la creación de recursos y tecnología de corte lingüístico, como corpus monolingüe y bilingüe, diccionarios, reconocimiento de categorías gramaticales, analizadores morfológicos, etc. Sin embargo, la mayoría de las lenguas existentes no se beneficia con alguno de estos recursos y/o tecnologías, y por ello son consideradas como lenguas de escasos recursos. Debido a la falta de inversión, se requiere un enfoque en el que se busquen soluciones robustas a un bajo costo a través de herramientas independientes de la lengua, modelos de desarrollo de código abierto o algoritmos de aprendizaje automático no supervisado. Bajo este contexto, se identifica como problema central el desconocimiento de un enfoque adecuado para la segmentación morfológica de una lengua de escasos recursos; y para ello, el presente proyecto propone realizar una segmentación morfológica automática no supervisada en una lengua con estas características a partir de la identificación del tipo de enfoque, monolingüe o multilingüe, que ofrece mejores resultados en esta tarea.
publishDate 2023
dc.date.accessioned.none.fl_str_mv 2023-06-27T15:09:29Z
dc.date.available.none.fl_str_mv 2023-06-27T15:09:29Z
dc.date.created.none.fl_str_mv 2023
dc.date.issued.fl_str_mv 2023-06-27
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/25281
url http://hdl.handle.net/20.500.12404/25281
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-sa/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-sa/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Tesis
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Tesis
collection PUCP-Tesis
bitstream.url.fl_str_mv https://tesis.pucp.edu.pe/bitstreams/afe6f899-26b6-4bee-9556-09ca7efe5f84/download
https://tesis.pucp.edu.pe/bitstreams/d4ee6b0f-a640-43a2-ac7c-291e2da34eb2/download
https://tesis.pucp.edu.pe/bitstreams/849dfc49-e01a-46ef-951f-f05663c438d3/download
https://tesis.pucp.edu.pe/bitstreams/3e3853ae-3a2b-48b8-bfd0-91e0c069ba69/download
https://tesis.pucp.edu.pe/bitstreams/4b7c65ac-fdf5-469d-941c-ee196bda65d6/download
https://tesis.pucp.edu.pe/bitstreams/0a851869-1c5e-420e-b169-8396764f2f18/download
bitstream.checksum.fl_str_mv 2ed6e6731c6cb5cfa3828d81a20967b1
8bd20a12aef194870f449842481e6d39
b7a36ada981bb81cbd668e3fd4618f2a
8a4605be74aa9ea9d79846c1fba20a33
c0e30ec8cd5fc072c67a420c5698a200
2154d11bf4b4a4d80522a939ce764f57
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de Tesis PUCP
repository.mail.fl_str_mv raul.sifuentes@pucp.pe
_version_ 1834737080330092544
spelling Zapata del Río, Claudia María del PilarOncevay Marcos, Felix ArturoAsmat Ramirez, Evelyn Fiorella2023-06-27T15:09:29Z2023-06-27T15:09:29Z20232023-06-27http://hdl.handle.net/20.500.12404/25281El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fortalecimiento) para garantizar que no se extingan y así fomentar el interés de sus hablantes. Además, su documentación es muy escasa debido a los pocos estudios lingüísticos realizados. A fin de elevar su status, se sugiere la creación de recursos y tecnología de corte lingüístico, como corpus monolingüe y bilingüe, diccionarios, reconocimiento de categorías gramaticales, analizadores morfológicos, etc. Sin embargo, la mayoría de las lenguas existentes no se beneficia con alguno de estos recursos y/o tecnologías, y por ello son consideradas como lenguas de escasos recursos. Debido a la falta de inversión, se requiere un enfoque en el que se busquen soluciones robustas a un bajo costo a través de herramientas independientes de la lengua, modelos de desarrollo de código abierto o algoritmos de aprendizaje automático no supervisado. Bajo este contexto, se identifica como problema central el desconocimiento de un enfoque adecuado para la segmentación morfológica de una lengua de escasos recursos; y para ello, el presente proyecto propone realizar una segmentación morfológica automática no supervisada en una lengua con estas características a partir de la identificación del tipo de enfoque, monolingüe o multilingüe, que ofrece mejores resultados en esta tarea.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/2.5/pe/Jebero (Shiwilu)--Perú--Amazonía, RegiónAlgoritmosAprendizaje automáticohttps://purl.org/pe-repo/ocde/ford#1.02.00Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILUinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática1079986446440101https://orcid.org/0000-0003-0134-6487https://orcid.org/0000-0001-7675-620846836821612286Melgar Sasieta, Hector AndresZapata Del Rio, Claudia Maria Del PilarVillanueva Talavera, Edwin Rafaelhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdfASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdfTexto completoapplication/pdf1211246https://tesis.pucp.edu.pe/bitstreams/afe6f899-26b6-4bee-9556-09ca7efe5f84/download2ed6e6731c6cb5cfa3828d81a20967b1MD51trueAnonymousREADASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdfASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdfReporte de originalidadapplication/pdf11906511https://tesis.pucp.edu.pe/bitstreams/d4ee6b0f-a640-43a2-ac7c-291e2da34eb2/download8bd20a12aef194870f449842481e6d39MD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://tesis.pucp.edu.pe/bitstreams/849dfc49-e01a-46ef-951f-f05663c438d3/downloadb7a36ada981bb81cbd668e3fd4618f2aMD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/3e3853ae-3a2b-48b8-bfd0-91e0c069ba69/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdf.jpgASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdf.jpgIM Thumbnailimage/jpeg12653https://tesis.pucp.edu.pe/bitstreams/4b7c65ac-fdf5-469d-941c-ee196bda65d6/downloadc0e30ec8cd5fc072c67a420c5698a200MD55falseAnonymousREADASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdf.jpgASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdf.jpgIM Thumbnailimage/jpeg6061https://tesis.pucp.edu.pe/bitstreams/0a851869-1c5e-420e-b169-8396764f2f18/download2154d11bf4b4a4d80522a939ce764f57MD56falseAnonymousREAD2500-01-0120.500.12404/25281oai:tesis.pucp.edu.pe:20.500.12404/252812024-09-04 12:30:37.2http://creativecommons.org/licenses/by-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.922529
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).