Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN

Descripción del Articulo

El área de reconocimiento automática de voz(ASR) se define como la transformación de señales acústicas en palabras de cadena. Esta área se ha desarrollado durante muchos años para facilitar la vida de las personas, por lo que se implementó en varios idiomas. Sin embargo, el desarrollo de ASR en algu...

Descripción completa

Detalles Bibliográficos
Autor: Chacca Chuctaya, Hernan Faustino
Formato: tesis de grado
Fecha de Publicación:2019
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:UNSA/9904
Enlace del recurso:http://repositorio.unsa.edu.pe/handle/UNSA/9904
Nivel de acceso:acceso abierto
Materia:Reconocimiento automático de voz
MFCC
DTW
KNN
https://purl.org/pe-repo/ocde/ford#2.02.04
id UNSA_381f35073d0576b030f86f9a71c544c3
oai_identifier_str oai:repositorio.unsa.edu.pe:UNSA/9904
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
dc.title.es_PE.fl_str_mv Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
dc.title.alternative.es_PE.fl_str_mv Isolated automatic speech recognition of quechua numbers using MFCC, DTW and KNN
title Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
spellingShingle Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
Chacca Chuctaya, Hernan Faustino
Reconocimiento automático de voz
MFCC
DTW
KNN
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
title_full Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
title_fullStr Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
title_full_unstemmed Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
title_sort Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNN
author Chacca Chuctaya, Hernan Faustino
author_facet Chacca Chuctaya, Hernan Faustino
author_role author
dc.contributor.advisor.fl_str_mv Castro Gutierrez, Eveling Gloria
dc.contributor.author.fl_str_mv Chacca Chuctaya, Hernan Faustino
dc.subject.es_PE.fl_str_mv Reconocimiento automático de voz
MFCC
DTW
KNN
topic Reconocimiento automático de voz
MFCC
DTW
KNN
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description El área de reconocimiento automática de voz(ASR) se define como la transformación de señales acústicas en palabras de cadena. Esta área se ha desarrollado durante muchos años para facilitar la vida de las personas, por lo que se implementó en varios idiomas. Sin embargo, el desarrollo de ASR en algunos idiomas con pocos recursos de base de datos pero con una gran población que habla estos idiomas es muy bajo. El desarrollo de ASR en el idioma quechua es casi nulo, lo que lleva a la cultura y la población a aislarse de la tecnología y la información. En este trabajo se desarrolla un sistema ASR de números Quechua aislados donde se implementan los métodos de Mel-Frequency Cepstral Coefficients (MFCC), Dynamic Time Warping (DTW) y K-Nearest Neighbor (KNN) utilizando una base de datos compuesta por audios de números grabados en quechua desde uno hasta diez. Los audios grabados para alimentar la base de datos fueron grabados por hablantes nativos de quechua entre hombres y mujeres. La precisión de reconocimiento alcanzada en este trabajo de investigación fue de 91.1%.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2019-11-25T19:33:19Z
dc.date.available.none.fl_str_mv 2019-11-25T19:33:19Z
dc.date.issued.fl_str_mv 2019
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unsa.edu.pe/handle/UNSA/9904
url http://repositorio.unsa.edu.pe/handle/UNSA/9904
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/7e9a9da7-afd1-443b-98ff-42b397a78a53/download
https://repositorio.unsa.edu.pe/bitstreams/10fda30f-2415-461e-93b7-7cc24d59dae7/download
https://repositorio.unsa.edu.pe/bitstreams/cc8fb5c9-73c2-4698-8fa2-4a27443d8852/download
bitstream.checksum.fl_str_mv 03ec85cb8a3c93a409b0148a7186df51
7fd13982f4ea07a01b967d1f403c9e7e
c52066b9c50a8f86be96c82978636682
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv vridi.gestioninformacion@unsa.edu.pe
_version_ 1828762972581789696
spelling Castro Gutierrez, Eveling GloriaChacca Chuctaya, Hernan Faustino2019-11-25T19:33:19Z2019-11-25T19:33:19Z2019El área de reconocimiento automática de voz(ASR) se define como la transformación de señales acústicas en palabras de cadena. Esta área se ha desarrollado durante muchos años para facilitar la vida de las personas, por lo que se implementó en varios idiomas. Sin embargo, el desarrollo de ASR en algunos idiomas con pocos recursos de base de datos pero con una gran población que habla estos idiomas es muy bajo. El desarrollo de ASR en el idioma quechua es casi nulo, lo que lleva a la cultura y la población a aislarse de la tecnología y la información. En este trabajo se desarrolla un sistema ASR de números Quechua aislados donde se implementan los métodos de Mel-Frequency Cepstral Coefficients (MFCC), Dynamic Time Warping (DTW) y K-Nearest Neighbor (KNN) utilizando una base de datos compuesta por audios de números grabados en quechua desde uno hasta diez. Los audios grabados para alimentar la base de datos fueron grabados por hablantes nativos de quechua entre hombres y mujeres. La precisión de reconocimiento alcanzada en este trabajo de investigación fue de 91.1%.Tesisapplication/pdfhttp://repositorio.unsa.edu.pe/handle/UNSA/9904spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAReconocimiento automático de vozMFCCDTWKNNhttps://purl.org/pe-repo/ocde/ford#2.02.04Reconocimiento automático de habla aislado de números en Quechua usando MFCC, DTW AND KNNIsolated automatic speech recognition of quechua numbers using MFCC, DTW and KNNinfo:eu-repo/semantics/bachelorThesisSUNEDU29695284https://orcid.org/0000-0002-0203-041X612076http://purl.org/pe-repo/renati/level#tituloProfesionalhttp://purl.org/pe-repo/renati/type#tesisIngeniería de SistemasUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosTítulo ProfesionalIngeniero de SistemasTesis Formato ArtículoTEXTISchchhf.pdf.txtISchchhf.pdf.txtExtracted texttext/plain47700https://repositorio.unsa.edu.pe/bitstreams/7e9a9da7-afd1-443b-98ff-42b397a78a53/download03ec85cb8a3c93a409b0148a7186df51MD53ORIGINALISchchhf.pdfISchchhf.pdfapplication/pdf670648https://repositorio.unsa.edu.pe/bitstreams/10fda30f-2415-461e-93b7-7cc24d59dae7/download7fd13982f4ea07a01b967d1f403c9e7eMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unsa.edu.pe/bitstreams/cc8fb5c9-73c2-4698-8fa2-4a27443d8852/downloadc52066b9c50a8f86be96c82978636682MD52UNSA/9904oai:repositorio.unsa.edu.pe:UNSA/99042024-11-24 11:57:26.25http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSAvridi.gestioninformacion@unsa.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.927358
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).