Diseño de un algoritmo para crear y entrenar una red neuronal que permita el reconocimiento de voz

Descripción del Articulo

El Perú presenta bajo interés en realizar investigaciones tecnológicas dentro del campo de la inteligencia artificial (redes neuronales), la cual es un bum en el crecimiento tecnológico de hoy en día. Por tal motivo, el presente informe de investigación tiene como objetivo general crear, entrenar y...

Descripción completa

Detalles Bibliográficos
Autores: Aponte Castro, Augusto Emmanuel, Castañeda Flores, Edson Jhair, Medina Paredes, Grovert Enrique
Formato: tesis de grado
Fecha de Publicación:2020
Institución:Universidad Nacional de Piura
Repositorio:UNP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unp.edu.pe:20.500.12676/2747
Enlace del recurso:https://repositorio.unp.edu.pe/handle/20.500.12676/2747
Nivel de acceso:acceso abierto
Materia:Red neuronal
Python
Dataset
Deep learning
http://purl.org/pe-repo/ocde/ford#2.02.00
Descripción
Sumario:El Perú presenta bajo interés en realizar investigaciones tecnológicas dentro del campo de la inteligencia artificial (redes neuronales), la cual es un bum en el crecimiento tecnológico de hoy en día. Por tal motivo, el presente informe de investigación tiene como objetivo general crear, entrenar y evaluar una red neuronal que permita el reconocimiento de voz e identifique que persona está hablando. Para esto se utilizó un software libre denominado “Spyder”, y un servicio web gratuito “Google Colab” basado en el lenguaje de programación Python para desarrollo de redes neuronales artificiales, con el fin de lograr la predicción más alta en el reconocimiento de voz de la persona evaluada. Este informe de investigación fue dividido en tres etapas. La primera etapa consistió en el procesamiento de la voz con la cual se adquirió la voz mediante micrófono, y fue sometida a filtros digitales con la finalidad de reducir los ruidos que puedan existir en la grabación de la voz; en la segunda etapa se realizó la adquisición de datos y preprocesamiento de datos, los cuales se almacenaron en dataset de entrenamiento y evaluación, éstos fueron subidos en la plataforma de Google Colab en donde se realizó su preprocesamiento para su posterior ingreso a la red neuronal; la tercera y última etapa se centró en el Deep learning, que consistió en la creación, compilación, entrenamiento, evaluación y predicción de la red neuronal. En el proceso del desarrollo de este informe de investigación se requirieron dos dataset, uno de entrenamiento y uno de evaluación, para la red neuronal, lo cual conllevó a que los resultados obtenidos tengan un nivel alto de predicción en el rango de 80% a 100% de probabilidad.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).