Prototipo de señalización utilizando Raspberry Pi 3B e IBM Watson mediante reconocimiento de comandos de voz para prevenir accidentes

Descripción del Articulo

Este proyecto propone la implementación de un prototipo de señalización para ciclistas mediante el reconocimiento de comandos de voz. Su funcionamiento se basa en reconocer 3 comandos de voz, derecha, izquierda o alto. El prototipo reconocerá el comando dado independientemente si se pronuncia en una...

Descripción completa

Detalles Bibliográficos
Autores: Escalaya Angulo, Anthony Alejandro, Yactayo Sánchez, Yelstin Maicol
Formato: tesis de grado
Fecha de Publicación:2020
Institución:Universidad Ricardo Palma
Repositorio:URP-Tesis
Lenguaje:español
OAI Identifier:oai:repositorio.urp.edu.pe:20.500.14138/3502
Enlace del recurso:https://hdl.handle.net/20.500.14138/3502
Nivel de acceso:acceso abierto
Materia:Filtro Pasa Banda
Raspberry Pi 3B
Node-Red
IBM Watson
Speech to Text
https://purl.org/pe-repo/ocde/ford#2.02.00
Descripción
Sumario:Este proyecto propone la implementación de un prototipo de señalización para ciclistas mediante el reconocimiento de comandos de voz. Su funcionamiento se basa en reconocer 3 comandos de voz, derecha, izquierda o alto. El prototipo reconocerá el comando dado independientemente si se pronuncia en una palabra o una frase, teniendo en cuenta el tiempo de grabación de 3 segundos. Para capturar la voz, el Raspberry Pi 3B realiza grabaciones de 3 segundos en intervalos de 3 segundos, y para minimizar el ruido ambiental, se utilizó un filtro Butterworth pasa banda digital con frecuencias de 200 Hz y 1300 Hz y orden 6. La conversión de voz a texto se realizó mediante el servicio de Speech to Text que pertenece al grupo de IBM Watson, el cual sube la información que recibe a la nube de IBM y descarga el texto traducido. Todo este proceso de traducción se realizó en la plataforma Node-Red. Además, se diseñó los prototipos de visualización compuestos por leds, los cuales se conectaron directamente a los pines del Raspberry Pi 3B, quedando a la espera de la señal de excitación que se envía desde el Node-Red. Finalmente, para las pruebas se obtuvo el apoyo de 6 personas, 3 hombres y 3 mujeres, de diferentes edades. Se evaluaron 2 casos principales, sin filtro digital y con filtro digital, y para cada caso se consideraron dos tipos de mascarillas, una de tela de 3 capas y una KN95, también se consideró la presencia y no presencia de ruido ambiental. Los resultados obtenidos al reconocimiento de comandos muestran un promedio del 90%, sin embargo, hay un retardo muy considerable de 7 segundos desde que se dice el comando de voz hasta que se realiza la señalización, pero es una respuesta aceptable si se tiene en cuenta el retardo. Demostrándose el funcionamiento y autonomía del prototipo con una gran escalabilidad.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).