Determinación del mejor método de clasificación para el desarrollo de software de identificación de voz en los docentes de la UNAMBA - 2018
Descripción del Articulo
El procesamiento del lenguaje natural es una rama de la inteligencia artificial, que actualmente se aplica en todas las áreas, como en el reconocimiento, identificación, escritura y traducción de voz mediante el uso de algoritmos y modelos de clasificación que aprenden a partir de los datos en volúm...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2022 |
Institución: | Universidad Nacional Micaela Bastidas de Apurímac |
Repositorio: | UNAMBA-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:172.16.0.151:UNAMBA/1065 |
Enlace del recurso: | http://repositorio.unamba.edu.pe/handle/UNAMBA/1065 |
Nivel de acceso: | acceso abierto |
Materia: | Procesamiento del lenguaje natural Identificación de voz https://purl.org/pe-repo/ocde/ford#1.02.00 |
Sumario: | El procesamiento del lenguaje natural es una rama de la inteligencia artificial, que actualmente se aplica en todas las áreas, como en el reconocimiento, identificación, escritura y traducción de voz mediante el uso de algoritmos y modelos de clasificación que aprenden a partir de los datos en volúmenes grandes o medianos a través de la técnica estadística y del aprendizaje basado en máquina. Al existir una variedad de métodos utilizados para la identificación de voz, actualmente hay pocos estudios que sugieran la confiabilidad del mejor método generando desconcierto entre los desarrolladores de software para la identificación de voz. Esta investigación tiene como propósito determinar el mejor método entre los tres investigados, los Modelos Ocultos de Markov, los Modelos de Mezclas Gaussianas y las Máquinas de Vectores Soporte, para el desarrollo de software de identificación de voz. Con esta finalidad hemos utilizado un diseño metodológico cuantitativo, aplicando instrumentos como tablas de comparación para el registro de cada método, a 32 docentes de la UNAMBA sede central. Nosotros efectuamos la evaluación mediante la métrica de la Accuracy y el estadístico denominado “análisis de varianza de un factor: diseño por bloques aleatorizados”. Nuestros resultados muestran un 95.83% de Accuracy para los Modelos de Mezclas Gaussianas, un 94.79% de Accuracy para los Modelos Ocultos de Markov y en último lugar un 30.21% de Accuracy para las Máquinas de Vectores Soporte. Las simulaciones que hemos realizado muestran que el método más efectivo en la identificación de voz son los Modelos de Mezclas Gaussianas que sobresalen de sus similares: los Modelos Ocultos de Markov, que ha obtenido el segundo lugar de Accuracy y las Máquinas de Vectores Soporte que es un método supervisado que presenta desventajas en su implementación. Esta investigación busca ser un aporte en la decisión del método a utilizar para el desarrollo de software de identificación de voz. Finalmente recomendamos estudios sobre las métricas de evaluación para modelos de clasificación aplicados a la identificación de voz y la forma de etiquetado de datos para voz en las Máquinas de Vectores Soporte |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).