Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB

Descripción del Articulo

Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de tran...

Descripción completa

Detalles Bibliográficos
Autor: Caballero Huamán, Paolo Kenyi
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Tecnológica del Perú
Repositorio:UTP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.utp.edu.pe:20.500.12867/13611
Enlace del recurso:https://hdl.handle.net/20.500.12867/13611
Nivel de acceso:acceso abierto
Materia:Modelo Whisper
Reconocimiento de voz
Sistema de control de voz
https://purl.org/pe-repo/ocde/ford#2.02.01
Descripción
Sumario:Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de transcripción robusta en condiciones acústicamente adversas, lo que permite interpretar comandos de voz con precisión en ambientes hostiles. El sistema está compuesto por una Laptop de última generación, encargada del procesamiento del audio y ejecución del modelo de inteligencia artificial; un PLC Micro850 que actúa como unidad lógica de control; un variador de frecuencia PowerFlex525 para el accionamiento de un motor trifásico; y un HMI PanelView 800 que facilita la interacción con el operador. Los dispositivos están interconectados mediante protocolos Ethernet/IP, asegurando una transmisión de datos y en tiempo real. Se desarrollo tres modos de operación: manual, automático, y por voz, los cuales permiten flexibilidad operativa y continuidad ante fallas en uno de los modos. El modelo Whisper-small fue seleccionado por su equilibrio entre precisión, velocidad de procesamiento y consumo de recursos. Las pruebas de validación se realizaron en una planta industrial, donde el sistema reconoció con éxito comandos específicos con un tiempo promedio de respuesta de 21.6 segundos. Los resultados evidencian que este sistema mejora la seguridad operativa, reduce la necesidad de intervención física y permite una interacción humano- máquina más eficiente. Se concluye que la integración de IA con tecnologías industriales tradicionales ofrece alternativa viable y escalable para procesos críticos. Se recomienda en trabajos futuros optimizar los tiempos de respuesta, incorporar modelos avanzados y técnicas de personalización para distintos acentos o perfiles de usuarios, así como el uso de dispositivos más potentes como un Raspberry PI 5.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).