Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones
Descripción del Articulo
la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocion...
| Autor: | |
|---|---|
| Formato: | tesis de maestría |
| Fecha de Publicación: | 2022 |
| Institución: | Universidad Nacional de San Agustín |
| Repositorio: | UNSA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/15077 |
| Enlace del recurso: | http://hdl.handle.net/20.500.12773/15077 |
| Nivel de acceso: | acceso abierto |
| Materia: | Corpus orales Emociones Deep Learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
| id |
UNSA_7dbee8b3c86a6b71b63b02dc0bccadde |
|---|---|
| oai_identifier_str |
oai:repositorio.unsa.edu.pe:20.500.12773/15077 |
| network_acronym_str |
UNSA |
| network_name_str |
UNSA-Institucional |
| repository_id_str |
4847 |
| dc.title.es_PE.fl_str_mv |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| title |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| spellingShingle |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones Delgado Mattos, Alessandra Daniela Corpus orales Emociones Deep Learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
| title_short |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| title_full |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| title_fullStr |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| title_full_unstemmed |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| title_sort |
Un corpus oral en idioma español con acento peruano para el reconocimiento de emociones |
| author |
Delgado Mattos, Alessandra Daniela |
| author_facet |
Delgado Mattos, Alessandra Daniela |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Cuno Parari, Alvaro Ernesto Ramos Lovón, Wilber Roberto |
| dc.contributor.author.fl_str_mv |
Delgado Mattos, Alessandra Daniela |
| dc.subject.es_PE.fl_str_mv |
Corpus orales Emociones Deep Learning |
| topic |
Corpus orales Emociones Deep Learning https://purl.org/pe-repo/ocde/ford#1.02.01 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
| description |
la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocionalmente son un elemento clave en la implementación de sistemas automáticos de reconocimiento de emociones a partir de habla. La carencia de los mismos hace que los hablantes de un determinado idioma, acento o dialecto, no puedan usufructuar, en toda su amplitud, de los beneficios de este desarrollo tecnológico. [Objetivos] Esta tesis tiene como objetivo diseñar y construir un corpus de emociones en español con acento peruano, de modo que pueda ser utilizado en el entrenamiento y validación de sistemas basados en Deep Learning para el reconocimiento automático de emociones. [Método] Se comenzó realizando una revisión de la literatura sobre los modelos de clasificación de emociones y los esquemas relacionados al diseño y construcción de corpus orales de emociones. Después, se definieron los criterios para diseñar un método de construcción a partir de audio-vídeos existentes en la plataforma YouTube™. Finalmente, la calidad del corpus fue evaluada de manera cualitativa y cuantitativa. [Resultados] Se construyó un corpus etiquetado con tres atributos emocionales (valencia, excitación y dominancia), con un tamaño de 7 horas 45 minutos y 52 segundos, contiene voces de un total de 80 participantes (hombres y mujeres en edad adulta) desenvolviéndose en escenarios naturales tales como debates, entrevistas y reportajes. Asimismo, se encuentra disponible de forma abierta al público en el siguiente enlace: https://zenodo.org/record/5793223#.YczDf2jMLIV [Conclusión] El corpus oral de emociones fue evaluado cualitativamente en cuanto al alcance, naturalidad, contexto y descriptores, y cuantitativamente en cuanto a su eficacia real, cumpliendo las expectativas para lo que fue construido ya que permitió el entrenamiento y validación en sistemas de reconocimiento de emociones en idioma español con acento peruano, obteniendo un buen desempeño, del 0.84 y 0.73 para las etapas de entrenamiento y validación respectivamente. |
| publishDate |
2022 |
| dc.date.accessioned.none.fl_str_mv |
2022-11-29T14:01:50Z |
| dc.date.available.none.fl_str_mv |
2022-11-29T14:01:50Z |
| dc.date.issued.fl_str_mv |
2022 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12773/15077 |
| url |
http://hdl.handle.net/20.500.12773/15077 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa Repositorio Institucional - UNSA |
| dc.source.none.fl_str_mv |
reponame:UNSA-Institucional instname:Universidad Nacional de San Agustín instacron:UNSA |
| instname_str |
Universidad Nacional de San Agustín |
| instacron_str |
UNSA |
| institution |
UNSA |
| reponame_str |
UNSA-Institucional |
| collection |
UNSA-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.unsa.edu.pe/bitstreams/b55739b6-4e61-4aae-801c-7f1f0fe85e42/download https://repositorio.unsa.edu.pe/bitstreams/4054f6b0-9558-4204-8520-087e759e4d02/download https://repositorio.unsa.edu.pe/bitstreams/f17f0cf2-6e31-4b14-b923-8373838014c5/download |
| bitstream.checksum.fl_str_mv |
ae4df986ccee95e5d43740f054986195 c52066b9c50a8f86be96c82978636682 e6dee6a4532d5ad52bd4110ef713dfb7 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional UNSA |
| repository.mail.fl_str_mv |
repositorio@unsa.edu.pe |
| _version_ |
1828762739313475584 |
| spelling |
Cuno Parari, Alvaro ErnestoRamos Lovón, Wilber RobertoDelgado Mattos, Alessandra Daniela2022-11-29T14:01:50Z2022-11-29T14:01:50Z2022la comunicación, son las emociones, es por ello, que el rol de ellas ha sido ampliamente analizado en los sistemas automáticos de reconocimiento a partir del habla, los cuáles, requieren además de algoritmos robustos, corpus orales de emociones de calidad. [Motivación] Los corpus etiquetados emocionalmente son un elemento clave en la implementación de sistemas automáticos de reconocimiento de emociones a partir de habla. La carencia de los mismos hace que los hablantes de un determinado idioma, acento o dialecto, no puedan usufructuar, en toda su amplitud, de los beneficios de este desarrollo tecnológico. [Objetivos] Esta tesis tiene como objetivo diseñar y construir un corpus de emociones en español con acento peruano, de modo que pueda ser utilizado en el entrenamiento y validación de sistemas basados en Deep Learning para el reconocimiento automático de emociones. [Método] Se comenzó realizando una revisión de la literatura sobre los modelos de clasificación de emociones y los esquemas relacionados al diseño y construcción de corpus orales de emociones. Después, se definieron los criterios para diseñar un método de construcción a partir de audio-vídeos existentes en la plataforma YouTube™. Finalmente, la calidad del corpus fue evaluada de manera cualitativa y cuantitativa. [Resultados] Se construyó un corpus etiquetado con tres atributos emocionales (valencia, excitación y dominancia), con un tamaño de 7 horas 45 minutos y 52 segundos, contiene voces de un total de 80 participantes (hombres y mujeres en edad adulta) desenvolviéndose en escenarios naturales tales como debates, entrevistas y reportajes. Asimismo, se encuentra disponible de forma abierta al público en el siguiente enlace: https://zenodo.org/record/5793223#.YczDf2jMLIV [Conclusión] El corpus oral de emociones fue evaluado cualitativamente en cuanto al alcance, naturalidad, contexto y descriptores, y cuantitativamente en cuanto a su eficacia real, cumpliendo las expectativas para lo que fue construido ya que permitió el entrenamiento y validación en sistemas de reconocimiento de emociones en idioma español con acento peruano, obteniendo un buen desempeño, del 0.84 y 0.73 para las etapas de entrenamiento y validación respectivamente.Este trabajo fue financiado por el Fondo Fondo de Financiamiento: Proyecto Concytec-Banco Mundial "Mejoramiento y Ampliación de los Servicios del Sistema Nacional de Ciencia Tecnología e Innovación Tecnológica" 8682-PE, a través de su Unidad ejecutora ProCiencia. en el marco del Proyecto: KUSISQA Project: Supporting Emotions Regulation in the Teaching and Learning Processes [Numero de Contrato: 014-2019-FONDECYT-BM-INC.INV]application/pdfhttp://hdl.handle.net/20.500.12773/15077spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSACorpus oralesEmocionesDeep Learninghttps://purl.org/pe-repo/ocde/ford#1.02.01Un corpus oral en idioma español con acento peruano para el reconocimiento de emocionesinfo:eu-repo/semantics/masterThesisSUNEDU2969241329525079https://orcid.org/0000-0001-9595-471xhttps://orcid.org/0000-0003-0030-910770516066611107Cuadros Valdivia, Ana MariaMachaca Arceda, Vicente EnriqueCuno Parari, Alvaro Ernestohttp://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#tesisMaestría en Ciencias: Informática, con mención en Tecnologías de la Información y Comunicación en Gestión y EducaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ciencias de la EducaciónMaestra en Ciencias: Informática, con mención en Tecnologías de la Información y Comunicación en Gestión y EducaciónORIGINALUPdmaad.pdfUPdmaad.pdfapplication/pdf1343465https://repositorio.unsa.edu.pe/bitstreams/b55739b6-4e61-4aae-801c-7f1f0fe85e42/downloadae4df986ccee95e5d43740f054986195MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unsa.edu.pe/bitstreams/4054f6b0-9558-4204-8520-087e759e4d02/downloadc52066b9c50a8f86be96c82978636682MD52TEXTUPdmaad.pdf.txtUPdmaad.pdf.txtExtracted texttext/plain181012https://repositorio.unsa.edu.pe/bitstreams/f17f0cf2-6e31-4b14-b923-8373838014c5/downloade6dee6a4532d5ad52bd4110ef713dfb7MD5320.500.12773/15077oai:repositorio.unsa.edu.pe:20.500.12773/150772022-11-30 03:01:15.994http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg== |
| score |
13.968331 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).