Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB
Descripción del Articulo
Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de tran...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Tecnológica del Perú |
| Repositorio: | UTP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.utp.edu.pe:20.500.12867/13542 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12867/13542 |
| Nivel de acceso: | acceso abierto |
| Materia: | Modelo Whisper Reconocimiento de voz Sistema controlado por voz https://purl.org/pe-repo/ocde/ford#2.02.01 |
| id |
UTPD_1e5824181e94a75ad2152d884ec5cce2 |
|---|---|
| oai_identifier_str |
oai:repositorio.utp.edu.pe:20.500.12867/13542 |
| network_acronym_str |
UTPD |
| network_name_str |
UTP-Institucional |
| repository_id_str |
4782 |
| dc.title.es_PE.fl_str_mv |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| title |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| spellingShingle |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB Caballero Huamán, Paolo Kenyi Modelo Whisper Reconocimiento de voz Sistema controlado por voz https://purl.org/pe-repo/ocde/ford#2.02.01 |
| title_short |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| title_full |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| title_fullStr |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| title_full_unstemmed |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| title_sort |
Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dB |
| author |
Caballero Huamán, Paolo Kenyi |
| author_facet |
Caballero Huamán, Paolo Kenyi |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Alfaro Purisaca, Paul Anthony |
| dc.contributor.author.fl_str_mv |
Caballero Huamán, Paolo Kenyi |
| dc.subject.es_PE.fl_str_mv |
Modelo Whisper Reconocimiento de voz Sistema controlado por voz |
| topic |
Modelo Whisper Reconocimiento de voz Sistema controlado por voz https://purl.org/pe-repo/ocde/ford#2.02.01 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.01 |
| description |
Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de transcripción robusta en condiciones acústicamente adversas, lo que permite interpretar comandos de voz con precisión en ambientes hostiles. El sistema está compuesto por una Laptop de última generación, encargada del procesamiento del audio y ejecución del modelo de inteligencia artificial; un PLC Micro850 que actúa como unidad lógica de control; un variador de frecuencia PowerFlex525 para el accionamiento de un motor trifásico; y un HMI PanelView 800 que facilita la interacción con el operador. Los dispositivos están interconectados mediante protocolos Ethernet/IP, asegurando una transmisión de datos y en tiempo real. Se desarrollo tres modos de operación: manual, automático, y por voz, los cuales permiten flexibilidad operativa y continuidad ante fallas en uno de los modos. El modelo Whisper-small fue seleccionado por su equilibrio entre precisión, velocidad de procesamiento y consumo de recursos. Las pruebas de validación se realizaron en una planta industrial, donde el sistema reconoció con éxito comandos específicos con un tiempo promedio de respuesta de 21.6 segundos. Los resultados evidencian que este sistema mejora la seguridad operativa, reduce la necesidad de intervención física y permite una interacción humano- máquina más eficiente. Se concluye que la integración de IA con tecnologías industriales tradicionales ofrece alternativa viable y escalable para procesos críticos. Se recomienda en trabajos futuros optimizar los tiempos de respuesta, incorporar modelos avanzados y técnicas de personalización para distintos acentos o perfiles de usuarios, así como el uso de dispositivos más potentes como un Raspberry PI 5. |
| publishDate |
2025 |
| dc.date.accessioned.none.fl_str_mv |
2025-10-06T03:25:54Z |
| dc.date.available.none.fl_str_mv |
2025-10-06T03:25:54Z |
| dc.date.issued.fl_str_mv |
2025 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| dc.type.version.es_PE.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12867/13542 |
| url |
https://hdl.handle.net/20.500.12867/13542 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Tecnológica del Perú |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Repositorio Institucional - UTP Universidad Tecnológica del Perú |
| dc.source.none.fl_str_mv |
reponame:UTP-Institucional instname:Universidad Tecnológica del Perú instacron:UTP |
| instname_str |
Universidad Tecnológica del Perú |
| instacron_str |
UTP |
| institution |
UTP |
| reponame_str |
UTP-Institucional |
| collection |
UTP-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9e65154a-e4a1-4e7d-8386-73d12b970ee4/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/db4119aa-d691-4a4d-93b8-e59ef05f740f/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9fce5e9b-7b21-4f1e-97fe-05c2e1b5181b/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/418f1770-14e8-4c57-9d0f-900c8643c71e/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/f6da30e2-9229-4f14-a720-c3149e1f5d03/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/739bdf51-eae1-4246-b4e5-b877720291d4/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/231182e2-fd9a-45f0-bc94-7b1fd3c77ac0/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e4eeeb63-5b8e-4dbf-88a2-cc2c3108cdd3/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e536fe08-6ea0-4bf0-bfa8-fde358b1b283/download https://repositorio.utp.edu.pe/backend/api/core/bitstreams/09c972c8-0259-4114-affa-69c9420f491d/download |
| bitstream.checksum.fl_str_mv |
201bb4b840f6fd958ba3d190a5e69461 6cbc9b9d3266054a037106f479b091d8 0d16d056e7a2c79f130446e589c30e76 8a4605be74aa9ea9d79846c1fba20a33 cf4fcd6465d49c6a79628a01134aa97e 71e2fc67b651f48a010cfaeca3056ea5 7c790f9051ea8499854222f7f47c1e4d fe94b3c663f4a31f895d3188a4639038 22890799898bb5a0437f726984aa3437 a192b7028b50c39af9328526715c0cb5 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio de la Universidad Tecnológica del Perú |
| repository.mail.fl_str_mv |
repositorio@utp.edu.pe |
| _version_ |
1852865522688851968 |
| spelling |
Alfaro Purisaca, Paul AnthonyCaballero Huamán, Paolo Kenyi2025-10-06T03:25:54Z2025-10-06T03:25:54Z2025https://hdl.handle.net/20.500.12867/13542Esta investigación propone el desarrollo e implementación de un sistema de control automatizado basado en reconocimiento de voz, diseñado para operar en entornos industriales con niveles de ruido superiores a los 80 decibelios. Utiliza el modelo Whisper de OpenAI, reconocido por su capacidad de transcripción robusta en condiciones acústicamente adversas, lo que permite interpretar comandos de voz con precisión en ambientes hostiles. El sistema está compuesto por una Laptop de última generación, encargada del procesamiento del audio y ejecución del modelo de inteligencia artificial; un PLC Micro850 que actúa como unidad lógica de control; un variador de frecuencia PowerFlex525 para el accionamiento de un motor trifásico; y un HMI PanelView 800 que facilita la interacción con el operador. Los dispositivos están interconectados mediante protocolos Ethernet/IP, asegurando una transmisión de datos y en tiempo real. Se desarrollo tres modos de operación: manual, automático, y por voz, los cuales permiten flexibilidad operativa y continuidad ante fallas en uno de los modos. El modelo Whisper-small fue seleccionado por su equilibrio entre precisión, velocidad de procesamiento y consumo de recursos. Las pruebas de validación se realizaron en una planta industrial, donde el sistema reconoció con éxito comandos específicos con un tiempo promedio de respuesta de 21.6 segundos. Los resultados evidencian que este sistema mejora la seguridad operativa, reduce la necesidad de intervención física y permite una interacción humano- máquina más eficiente. Se concluye que la integración de IA con tecnologías industriales tradicionales ofrece alternativa viable y escalable para procesos críticos. Se recomienda en trabajos futuros optimizar los tiempos de respuesta, incorporar modelos avanzados y técnicas de personalización para distintos acentos o perfiles de usuarios, así como el uso de dispositivos más potentes como un Raspberry PI 5.Campus Lima Centroapplication/pdfspaUniversidad Tecnológica del PerúPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Repositorio Institucional - UTPUniversidad Tecnológica del Perúreponame:UTP-Institucionalinstname:Universidad Tecnológica del Perúinstacron:UTPModelo WhisperReconocimiento de vozSistema controlado por vozhttps://purl.org/pe-repo/ocde/ford#2.02.01Implementación de un sistema de control automatizado basado en reconocimiento de voz utilizando el modelo Whisper en entornos ruidosos industriales mayores a 80dBinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionSUNEDUIngeniero ElectrónicoUniversidad Tecnológica del Perú. Facultad de IngenieríaIngeniería ElectrónicaPregrado46309359https://orcid.org/0009-0005-8452-796247906464712026Raffo Jara, Mario AndrésDiaz Vilela, Pedro PabloCano Lengua, Miguel Ángelhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisORIGINALP.Caballero_Tesis_Titulo Profesional_2025.pdfP.Caballero_Tesis_Titulo Profesional_2025.pdfapplication/pdf916317https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9e65154a-e4a1-4e7d-8386-73d12b970ee4/download201bb4b840f6fd958ba3d190a5e69461MD51P.Caballero_Formulario_de_Publicacion.pdfP.Caballero_Formulario_de_Publicacion.pdfapplication/pdf2255617https://repositorio.utp.edu.pe/backend/api/core/bitstreams/db4119aa-d691-4a4d-93b8-e59ef05f740f/download6cbc9b9d3266054a037106f479b091d8MD52P.Caballero_Informe de Similitud.pdfP.Caballero_Informe de Similitud.pdfapplication/pdf2320755https://repositorio.utp.edu.pe/backend/api/core/bitstreams/9fce5e9b-7b21-4f1e-97fe-05c2e1b5181b/download0d16d056e7a2c79f130446e589c30e76MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.utp.edu.pe/backend/api/core/bitstreams/418f1770-14e8-4c57-9d0f-900c8643c71e/download8a4605be74aa9ea9d79846c1fba20a33MD54TEXTP.Caballero_Tesis_Titulo Profesional_2025.pdf.txtP.Caballero_Tesis_Titulo Profesional_2025.pdf.txtExtracted texttext/plain59504https://repositorio.utp.edu.pe/backend/api/core/bitstreams/f6da30e2-9229-4f14-a720-c3149e1f5d03/downloadcf4fcd6465d49c6a79628a01134aa97eMD511P.Caballero_Formulario_de_Publicacion.pdf.txtP.Caballero_Formulario_de_Publicacion.pdf.txtExtracted texttext/plain6094https://repositorio.utp.edu.pe/backend/api/core/bitstreams/739bdf51-eae1-4246-b4e5-b877720291d4/download71e2fc67b651f48a010cfaeca3056ea5MD513P.Caballero_Informe de Similitud.pdf.txtP.Caballero_Informe de Similitud.pdf.txtExtracted texttext/plain68007https://repositorio.utp.edu.pe/backend/api/core/bitstreams/231182e2-fd9a-45f0-bc94-7b1fd3c77ac0/download7c790f9051ea8499854222f7f47c1e4dMD515THUMBNAILP.Caballero_Tesis_Titulo Profesional_2025.pdf.jpgP.Caballero_Tesis_Titulo Profesional_2025.pdf.jpgGenerated Thumbnailimage/jpeg16703https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e4eeeb63-5b8e-4dbf-88a2-cc2c3108cdd3/downloadfe94b3c663f4a31f895d3188a4639038MD512P.Caballero_Formulario_de_Publicacion.pdf.jpgP.Caballero_Formulario_de_Publicacion.pdf.jpgGenerated Thumbnailimage/jpeg28607https://repositorio.utp.edu.pe/backend/api/core/bitstreams/e536fe08-6ea0-4bf0-bfa8-fde358b1b283/download22890799898bb5a0437f726984aa3437MD514P.Caballero_Informe de Similitud.pdf.jpgP.Caballero_Informe de Similitud.pdf.jpgGenerated Thumbnailimage/jpeg17885https://repositorio.utp.edu.pe/backend/api/core/bitstreams/09c972c8-0259-4114-affa-69c9420f491d/downloada192b7028b50c39af9328526715c0cb5MD51620.500.12867/13542oai:repositorio.utp.edu.pe:20.500.12867/135422025-11-30 16:57:01.932https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.utp.edu.peRepositorio de la Universidad Tecnológica del Perúrepositorio@utp.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.472619 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).