Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB

Descripción del Articulo

Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de tran...

Descripción completa

Detalles Bibliográficos
Autor: Caballero Huamán, Paolo Kenyi
Formato: tesis de grado
Fecha de Publicación:2025
Institución:Universidad Tecnológica del Perú
Repositorio:UTP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.utp.edu.pe:20.500.12867/13542
Enlace del recurso:https://hdl.handle.net/20.500.12867/13542
Nivel de acceso:acceso abierto
Materia:Modelo Whisper
Reconocimiento de voz
Sistema controlado por voz
https://purl.org/pe-repo/ocde/ford#2.02.01
id UTPD_1e5824181e94a75ad2152d884ec5cce2
oai_identifier_str oai:repositorio.utp.edu.pe:20.500.12867/13542
network_acronym_str UTPD
network_name_str UTP-Institucional
repository_id_str 4782
dc.title.es_PE.fl_str_mv Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
title Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
spellingShingle Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
Caballero Huamán, Paolo Kenyi
Modelo Whisper
Reconocimiento de voz
Sistema controlado por voz
https://purl.org/pe-repo/ocde/ford#2.02.01
title_short Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
title_full Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
title_fullStr Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
title_full_unstemmed Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
title_sort Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
author Caballero Huamán, Paolo Kenyi
author_facet Caballero Huamán, Paolo Kenyi
author_role author
dc.contributor.advisor.fl_str_mv Alfaro Purisaca, Paul Anthony
dc.contributor.author.fl_str_mv Caballero Huamán, Paolo Kenyi
dc.subject.es_PE.fl_str_mv Modelo Whisper
Reconocimiento de voz
Sistema controlado por voz
topic Modelo Whisper
Reconocimiento de voz
Sistema controlado por voz
https://purl.org/pe-repo/ocde/ford#2.02.01
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.01
description Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de transcripción robusta en condiciones acústicamente adversas, lo que permite interpretar comandos de voz con precisión en ambientes hostiles. El sistema está compuesto por una Laptop de última generación, encargada del procesamiento del audio y ejecución del modelo de inteligencia artificial; un PLC Micro850 que actúa como unidad lógica de control; un variador de frecuencia PowerFlex525 para el accionamiento de un motor trifásico; y un HMI PanelView 800 que facilita la interacción con el operador. Los dispositivos están interconectados mediante protocolos Ethernet/IP, asegurando una transmisión de datos y en tiempo real. Se desarrollo tres modos de operación: manual, automático, y por voz, los cuales permiten flexibilidad operativa y continuidad ante fallas en uno de los modos. El modelo Whisper-small fue seleccionado por su equilibrio entre precisión, velocidad de procesamiento y consumo de recursos. Las pruebas de validación se realizaron en una planta industrial, donde el sistema reconoció con éxito comandos específicos con un tiempo promedio de respuesta de 21.6 segundos. Los resultados evidencian que este sistema mejora la seguridad operativa, reduce la necesidad de intervención física y permite una interacción humano- máquina más eficiente. Se concluye que la integración de IA con tecnologías industriales tradicionales ofrece alternativa viable y escalable para procesos críticos. Se recomienda en trabajos futuros optimizar los tiempos de respuesta, incorporar modelos avanzados y técnicas de personalización para distintos acentos o perfiles de usuarios, así como el uso de dispositivos más potentes como un Raspberry PI 5.
publishDate 2025
dc.date.accessioned.none.fl_str_mv 2025-10-06T03:25:54Z
dc.date.available.none.fl_str_mv 2025-10-06T03:25:54Z
dc.date.issued.fl_str_mv 2025
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.es_PE.fl_str_mv info:eu-repo/semantics/publishedVersion
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12867/13542
url https://hdl.handle.net/20.500.12867/13542
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Tecnológica del Perú
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Repositorio Institucional - UTP
Universidad Tecnológica del Perú
dc.source.none.fl_str_mv reponame:UTP-Institucional
instname:Universidad Tecnológica del Perú
instacron:UTP
instname_str Universidad Tecnológica del Perú
instacron_str UTP
institution UTP
reponame_str UTP-Institucional
collection UTP-Institucional
bitstream.url.fl_str_mv https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9e65154a-e4a1-4e7d-8386-73d12b970ee4/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/db4119aa-d691-4a4d-93b8-e59ef05f740f/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9fce5e9b-7b21-4f1e-97fe-05c2e1b5181b/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/418f1770-14e8-4c57-9d0f-900c8643c71e/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/f6da30e2-9229-4f14-a720-c3149e1f5d03/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/739bdf51-eae1-4246-b4e5-b877720291d4/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/231182e2-fd9a-45f0-bc94-7b1fd3c77ac0/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e4eeeb63-5b8e-4dbf-88a2-cc2c3108cdd3/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e536fe08-6ea0-4bf0-bfa8-fde358b1b283/download
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/09c972c8-0259-4114-affa-69c9420f491d/download
bitstream.checksum.fl_str_mv 201bb4b840f6fd958ba3d190a5e69461
6cbc9b9d3266054a037106f479b091d8
0d16d056e7a2c79f130446e589c30e76
8a4605be74aa9ea9d79846c1fba20a33
cf4fcd6465d49c6a79628a01134aa97e
71e2fc67b651f48a010cfaeca3056ea5
7c790f9051ea8499854222f7f47c1e4d
fe94b3c663f4a31f895d3188a4639038
22890799898bb5a0437f726984aa3437
a192b7028b50c39af9328526715c0cb5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio de la Universidad Tecnológica del Perú
repository.mail.fl_str_mv repositorio@utp.edu.pe
_version_ 1852865522688851968
spelling Alfaro Purisaca, Paul AnthonyCaballero Huamán, Paolo Kenyi2025-10-06T03:25:54Z2025-10-06T03:25:54Z2025https://hdl.handle.net/20.500.12867/13542Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de transcripción robusta en condiciones acústicamente adversas, lo que permite interpretar comandos de voz con precisión en ambientes hostiles. El sistema está compuesto por una Laptop de última generación, encargada del procesamiento del audio y ejecución del modelo de inteligencia artificial; un PLC Micro850 que actúa como unidad lógica de control; un variador de frecuencia PowerFlex525 para el accionamiento de un motor trifásico; y un HMI PanelView 800 que facilita la interacción con el operador. Los dispositivos están interconectados mediante protocolos Ethernet/IP, asegurando una transmisión de datos y en tiempo real. Se desarrollo tres modos de operación: manual, automático, y por voz, los cuales permiten flexibilidad operativa y continuidad ante fallas en uno de los modos. El modelo Whisper-small fue seleccionado por su equilibrio entre precisión, velocidad de procesamiento y consumo de recursos. Las pruebas de validación se realizaron en una planta industrial, donde el sistema reconoció con éxito comandos específicos con un tiempo promedio de respuesta de 21.6 segundos. Los resultados evidencian que este sistema mejora la seguridad operativa, reduce la necesidad de intervención física y permite una interacción humano- máquina más eficiente. Se concluye que la integración de IA con tecnologías industriales tradicionales ofrece alternativa viable y escalable para procesos críticos. Se recomienda en trabajos futuros optimizar los tiempos de respuesta, incorporar modelos avanzados y técnicas de personalización para distintos acentos o perfiles de usuarios, así como el uso de dispositivos más potentes como un Raspberry PI 5.Campus Lima Centroapplication/pdfspaUniversidad Tecnológica del PerúPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Repositorio Institucional - UTPUniversidad Tecnológica del Perúreponame:UTP-Institucionalinstname:Universidad Tecnológica del Perúinstacron:UTPModelo WhisperReconocimiento de vozSistema controlado por vozhttps://purl.org/pe-repo/ocde/ford#2.02.01Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dBinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionSUNEDUIngeniero ElectrónicoUniversidad Tecnológica del Perú. Facultad de IngenieríaIngeniería ElectrónicaPregrado46309359https://orcid.org/0009-0005-8452-796247906464712026Raffo Jara, Mario AndrésDiaz Vilela, Pedro PabloCano Lengua, Miguel Ángelhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALP.Caballero_Tesis_Titulo Profesional_2025.pdfP.Caballero_Tesis_Titulo Profesional_2025.pdfapplication/pdf916317https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9e65154a-e4a1-4e7d-8386-73d12b970ee4/download201bb4b840f6fd958ba3d190a5e69461MD51P.Caballero_Formulario_de_Publicacion.pdfP.Caballero_Formulario_de_Publicacion.pdfapplication/pdf2255617https://repositorio.utp.edu.pe/backend/api/core/bitstreams/db4119aa-d691-4a4d-93b8-e59ef05f740f/download6cbc9b9d3266054a037106f479b091d8MD52P.Caballero_Informe de Similitud.pdfP.Caballero_Informe de Similitud.pdfapplication/pdf2320755https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9fce5e9b-7b21-4f1e-97fe-05c2e1b5181b/download0d16d056e7a2c79f130446e589c30e76MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.utp.edu.pe/backend/api/core/bitstreams/418f1770-14e8-4c57-9d0f-900c8643c71e/download8a4605be74aa9ea9d79846c1fba20a33MD54TEXTP.Caballero_Tesis_Titulo Profesional_2025.pdf.txtP.Caballero_Tesis_Titulo Profesional_2025.pdf.txtExtracted texttext/plain59504https://repositorio.utp.edu.pe/backend/api/core/bitstreams/f6da30e2-9229-4f14-a720-c3149e1f5d03/downloadcf4fcd6465d49c6a79628a01134aa97eMD511P.Caballero_Formulario_de_Publicacion.pdf.txtP.Caballero_Formulario_de_Publicacion.pdf.txtExtracted texttext/plain6094https://repositorio.utp.edu.pe/backend/api/core/bitstreams/739bdf51-eae1-4246-b4e5-b877720291d4/download71e2fc67b651f48a010cfaeca3056ea5MD513P.Caballero_Informe de Similitud.pdf.txtP.Caballero_Informe de Similitud.pdf.txtExtracted texttext/plain68007https://repositorio.utp.edu.pe/backend/api/core/bitstreams/231182e2-fd9a-45f0-bc94-7b1fd3c77ac0/download7c790f9051ea8499854222f7f47c1e4dMD515THUMBNAILP.Caballero_Tesis_Titulo Profesional_2025.pdf.jpgP.Caballero_Tesis_Titulo Profesional_2025.pdf.jpgGenerated Thumbnailimage/jpeg16703https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e4eeeb63-5b8e-4dbf-88a2-cc2c3108cdd3/downloadfe94b3c663f4a31f895d3188a4639038MD512P.Caballero_Formulario_de_Publicacion.pdf.jpgP.Caballero_Formulario_de_Publicacion.pdf.jpgGenerated Thumbnailimage/jpeg28607https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e536fe08-6ea0-4bf0-bfa8-fde358b1b283/download22890799898bb5a0437f726984aa3437MD514P.Caballero_Informe de Similitud.pdf.jpgP.Caballero_Informe de Similitud.pdf.jpgGenerated Thumbnailimage/jpeg17885https://repositorio.utp.edu.pe/backend/api/core/bitstreams/09c972c8-0259-4114-affa-69c9420f491d/downloada192b7028b50c39af9328526715c0cb5MD51620.500.12867/13542oai:repositorio.utp.edu.pe:20.500.12867/135422025-11-30 16:57:01.932https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.utp.edu.peRepositorio de la Universidad Tecnológica del Perúrepositorio@utp.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.472619
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).