Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
Descripción del Articulo
El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fo...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2023 |
| Institución: | Pontificia Universidad Católica del Perú |
| Repositorio: | PUCP-Tesis |
| Lenguaje: | español |
| OAI Identifier: | oai:tesis.pucp.edu.pe:20.500.12404/25281 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12404/25281 |
| Nivel de acceso: | acceso abierto |
| Materia: | Jebero (Shiwilu)--Perú--Amazonía, Región Algoritmos Aprendizaje automático https://purl.org/pe-repo/ocde/ford#1.02.00 |
| id |
PUCP_ed1cf72b9020b711e0297162cd59e7f9 |
|---|---|
| oai_identifier_str |
oai:tesis.pucp.edu.pe:20.500.12404/25281 |
| network_acronym_str |
PUCP |
| network_name_str |
PUCP-Tesis |
| repository_id_str |
. |
| dc.title.es_ES.fl_str_mv |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| title |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| spellingShingle |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU Asmat Ramirez, Evelyn Fiorella Jebero (Shiwilu)--Perú--Amazonía, Región Algoritmos Aprendizaje automático https://purl.org/pe-repo/ocde/ford#1.02.00 |
| title_short |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| title_full |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| title_fullStr |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| title_full_unstemmed |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| title_sort |
Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU |
| author |
Asmat Ramirez, Evelyn Fiorella |
| author_facet |
Asmat Ramirez, Evelyn Fiorella |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Zapata del Río, Claudia María del Pilar Oncevay Marcos, Felix Arturo |
| dc.contributor.author.fl_str_mv |
Asmat Ramirez, Evelyn Fiorella |
| dc.subject.es_ES.fl_str_mv |
Jebero (Shiwilu)--Perú--Amazonía, Región Algoritmos Aprendizaje automático |
| topic |
Jebero (Shiwilu)--Perú--Amazonía, Región Algoritmos Aprendizaje automático https://purl.org/pe-repo/ocde/ford#1.02.00 |
| dc.subject.ocde.es_ES.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.00 |
| description |
El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fortalecimiento) para garantizar que no se extingan y así fomentar el interés de sus hablantes. Además, su documentación es muy escasa debido a los pocos estudios lingüísticos realizados. A fin de elevar su status, se sugiere la creación de recursos y tecnología de corte lingüístico, como corpus monolingüe y bilingüe, diccionarios, reconocimiento de categorías gramaticales, analizadores morfológicos, etc. Sin embargo, la mayoría de las lenguas existentes no se beneficia con alguno de estos recursos y/o tecnologías, y por ello son consideradas como lenguas de escasos recursos. Debido a la falta de inversión, se requiere un enfoque en el que se busquen soluciones robustas a un bajo costo a través de herramientas independientes de la lengua, modelos de desarrollo de código abierto o algoritmos de aprendizaje automático no supervisado. Bajo este contexto, se identifica como problema central el desconocimiento de un enfoque adecuado para la segmentación morfológica de una lengua de escasos recursos; y para ello, el presente proyecto propone realizar una segmentación morfológica automática no supervisada en una lengua con estas características a partir de la identificación del tipo de enfoque, monolingüe o multilingüe, que ofrece mejores resultados en esta tarea. |
| publishDate |
2023 |
| dc.date.accessioned.none.fl_str_mv |
2023-06-27T15:09:29Z |
| dc.date.available.none.fl_str_mv |
2023-06-27T15:09:29Z |
| dc.date.created.none.fl_str_mv |
2023 |
| dc.date.issued.fl_str_mv |
2023-06-27 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12404/25281 |
| url |
http://hdl.handle.net/20.500.12404/25281 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-sa/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-sa/2.5/pe/ |
| dc.publisher.es_ES.fl_str_mv |
Pontificia Universidad Católica del Perú |
| dc.publisher.country.es_ES.fl_str_mv |
PE |
| dc.source.none.fl_str_mv |
reponame:PUCP-Tesis instname:Pontificia Universidad Católica del Perú instacron:PUCP |
| instname_str |
Pontificia Universidad Católica del Perú |
| instacron_str |
PUCP |
| institution |
PUCP |
| reponame_str |
PUCP-Tesis |
| collection |
PUCP-Tesis |
| bitstream.url.fl_str_mv |
https://tesis.pucp.edu.pe/bitstreams/afe6f899-26b6-4bee-9556-09ca7efe5f84/download https://tesis.pucp.edu.pe/bitstreams/d4ee6b0f-a640-43a2-ac7c-291e2da34eb2/download https://tesis.pucp.edu.pe/bitstreams/849dfc49-e01a-46ef-951f-f05663c438d3/download https://tesis.pucp.edu.pe/bitstreams/3e3853ae-3a2b-48b8-bfd0-91e0c069ba69/download https://tesis.pucp.edu.pe/bitstreams/4b7c65ac-fdf5-469d-941c-ee196bda65d6/download https://tesis.pucp.edu.pe/bitstreams/0a851869-1c5e-420e-b169-8396764f2f18/download |
| bitstream.checksum.fl_str_mv |
2ed6e6731c6cb5cfa3828d81a20967b1 8bd20a12aef194870f449842481e6d39 b7a36ada981bb81cbd668e3fd4618f2a 8a4605be74aa9ea9d79846c1fba20a33 c0e30ec8cd5fc072c67a420c5698a200 2154d11bf4b4a4d80522a939ce764f57 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de Tesis PUCP |
| repository.mail.fl_str_mv |
raul.sifuentes@pucp.pe |
| _version_ |
1834737080330092544 |
| spelling |
Zapata del Río, Claudia María del PilarOncevay Marcos, Felix ArturoAsmat Ramirez, Evelyn Fiorella2023-06-27T15:09:29Z2023-06-27T15:09:29Z20232023-06-27http://hdl.handle.net/20.500.12404/25281El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fortalecimiento) para garantizar que no se extingan y así fomentar el interés de sus hablantes. Además, su documentación es muy escasa debido a los pocos estudios lingüísticos realizados. A fin de elevar su status, se sugiere la creación de recursos y tecnología de corte lingüístico, como corpus monolingüe y bilingüe, diccionarios, reconocimiento de categorías gramaticales, analizadores morfológicos, etc. Sin embargo, la mayoría de las lenguas existentes no se beneficia con alguno de estos recursos y/o tecnologías, y por ello son consideradas como lenguas de escasos recursos. Debido a la falta de inversión, se requiere un enfoque en el que se busquen soluciones robustas a un bajo costo a través de herramientas independientes de la lengua, modelos de desarrollo de código abierto o algoritmos de aprendizaje automático no supervisado. Bajo este contexto, se identifica como problema central el desconocimiento de un enfoque adecuado para la segmentación morfológica de una lengua de escasos recursos; y para ello, el presente proyecto propone realizar una segmentación morfológica automática no supervisada en una lengua con estas características a partir de la identificación del tipo de enfoque, monolingüe o multilingüe, que ofrece mejores resultados en esta tarea.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-sa/2.5/pe/Jebero (Shiwilu)--Perú--Amazonía, RegiónAlgoritmosAprendizaje automáticohttps://purl.org/pe-repo/ocde/ford#1.02.00Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILUinfo:eu-repo/semantics/bachelorThesisreponame:PUCP-Tesisinstname:Pontificia Universidad Católica del Perúinstacron:PUCPSUNEDUIngeniero InformáticoTítulo ProfesionalPontificia Universidad Católica del Perú. Facultad de Ciencias e IngenieríaIngeniería Informática1079986446440101https://orcid.org/0000-0003-0134-6487https://orcid.org/0000-0001-7675-620846836821612286Melgar Sasieta, Hector AndresZapata Del Rio, Claudia Maria Del PilarVillanueva Talavera, Edwin Rafaelhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdfASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdfTexto completoapplication/pdf1211246https://tesis.pucp.edu.pe/bitstreams/afe6f899-26b6-4bee-9556-09ca7efe5f84/download2ed6e6731c6cb5cfa3828d81a20967b1MD51trueAnonymousREADASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdfASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdfReporte de originalidadapplication/pdf11906511https://tesis.pucp.edu.pe/bitstreams/d4ee6b0f-a640-43a2-ac7c-291e2da34eb2/download8bd20a12aef194870f449842481e6d39MD52falseAnonymousREAD2500-01-01CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81031https://tesis.pucp.edu.pe/bitstreams/849dfc49-e01a-46ef-951f-f05663c438d3/downloadb7a36ada981bb81cbd668e3fd4618f2aMD53falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://tesis.pucp.edu.pe/bitstreams/3e3853ae-3a2b-48b8-bfd0-91e0c069ba69/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTHUMBNAILASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdf.jpgASMAT_RAMIREZ_EVELYN_APRENDIZAJE_AUTOMATICO_SUPERVISADO.pdf.jpgIM Thumbnailimage/jpeg12653https://tesis.pucp.edu.pe/bitstreams/4b7c65ac-fdf5-469d-941c-ee196bda65d6/downloadc0e30ec8cd5fc072c67a420c5698a200MD55falseAnonymousREADASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdf.jpgASMAT_RAMIREZ_EVELYN_FIORELLA_T.pdf.jpgIM Thumbnailimage/jpeg6061https://tesis.pucp.edu.pe/bitstreams/0a851869-1c5e-420e-b169-8396764f2f18/download2154d11bf4b4a4d80522a939ce764f57MD56falseAnonymousREAD2500-01-0120.500.12404/25281oai:tesis.pucp.edu.pe:20.500.12404/252812024-09-04 12:30:37.2http://creativecommons.org/licenses/by-sa/2.5/pe/info:eu-repo/semantics/openAccessopen.accesshttps://tesis.pucp.edu.peRepositorio de Tesis PUCPraul.sifuentes@pucp.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.922529 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).