Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
Descripción del Articulo
Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de tran...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Tecnológica del Perú |
| Repositorio: | UTP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.utp.edu.pe:20.500.12867/13542 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12867/13542 |
| Nivel de acceso: | acceso abierto |
| Materia: | Modelo Whisper Reconocimiento de voz Sistema controlado por voz https://purl.org/pe-repo/ocde/ford#2.02.01 |
| Sumario: | Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de transcripción robusta en condiciones acústicamente adversas, lo que permite interpretar comandos de voz con precisión en ambientes hostiles. El sistema está compuesto por una Laptop de última generación, encargada del procesamiento del audio y ejecución del modelo de inteligencia artificial; un PLC Micro850 que actúa como unidad lógica de control; un variador de frecuencia PowerFlex525 para el accionamiento de un motor trifásico; y un HMI PanelView 800 que facilita la interacción con el operador. Los dispositivos están interconectados mediante protocolos Ethernet/IP, asegurando una transmisión de datos y en tiempo real. Se desarrollo tres modos de operación: manual, automático, y por voz, los cuales permiten flexibilidad operativa y continuidad ante fallas en uno de los modos. El modelo Whisper-small fue seleccionado por su equilibrio entre precisión, velocidad de procesamiento y consumo de recursos. Las pruebas de validación se realizaron en una planta industrial, donde el sistema reconoció con éxito comandos específicos con un tiempo promedio de respuesta de 21.6 segundos. Los resultados evidencian que este sistema mejora la seguridad operativa, reduce la necesidad de intervención física y permite una interacción humano- máquina más eficiente. Se concluye que la integración de IA con tecnologías industriales tradicionales ofrece alternativa viable y escalable para procesos críticos. Se recomienda en trabajos futuros optimizar los tiempos de respuesta, incorporar modelos avanzados y técnicas de personalización para distintos acentos o perfiles de usuarios, así como el uso de dispositivos más potentes como un Raspberry PI 5. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).