Diseño e implementación de un sistema de reconocimiento de imagen y voz usando redes neuronales para controlar brazo robot

Descripción del Articulo

El objetivo de la presente tesis es utilizar redes neuronales para el entrenamiento de reconocimiento de imágenes y voz, con los cuales sera capaz de dar acceso a las personas capacitadas y calificadas para poder controlar el brazo robot. La detección del rostro se divide en 4 partes: CAPTURA DE ROS...

Descripción completa

Detalles Bibliográficos
Autor: Santisteban Torres, Hugo Edison
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/19423
Enlace del recurso:https://hdl.handle.net/20.500.12773/19423
Nivel de acceso:acceso abierto
Materia:Diseño
Implementación de un sistema de reconocimiento de imagen y voz
Redes Neuronales
Brazo Robot
https://purl.org/pe-repo/ocde/ford#2.11.02
Descripción
Sumario:El objetivo de la presente tesis es utilizar redes neuronales para el entrenamiento de reconocimiento de imágenes y voz, con los cuales sera capaz de dar acceso a las personas capacitadas y calificadas para poder controlar el brazo robot. La detección del rostro se divide en 4 partes: CAPTURA DE ROSTRO: se creara una base de datos del rostro de la persona autorizada para controlar el brazo robot. se tomaran fotos del rostro en distintos ángulos y con distinta iluminación. Mientras mas grande y variada sea la base de datos, mejor sera para el entrenamiento de la red neuronal. Se almacenaran las imágenes en un mismo tamaño de 150x150 pıxeles y se transformaran a escala de grises. ENTRENAMIENTO PARA RECONOCIMIENTO DE ROSTRO CON REDES NEURONALES: se propone usar jupiter notebook para el entrenamiento de las redes neuronales. importaremos opencv y numpy. Antes de que podamos entrenar una red neuronal, necesitamos procesar los datos en un formato que acepte la biblioteca. Se pretende usar 32 y 64 filtros para la primera y segunda capa convolucional y una tasa de aprendizaje de 0,001. Una vez obtenida la red neuronal con los pesos para la detección de la persona se exportara para su uso IDENTIFICACION DE ROSTRO: Con el modelo entrenado con los pesos, se procederá a comparar la foto tomada con la cámara ESP32 y cuando el rostro haya sido identificado positivamente, se dara acceso al control del brazo robot. Caso contrario no se tendra acceso al brazo robot (inhabilitado la energía eléctrica) IDENTIFICACION DE COMANDO DE VOZ: Una vez detectada la persona autorizada para operar el brazo robot, tambien podra dar ordenes de voz como por ejemplo decir ”STOP” para una parada de emergencia. esto se lograra entrenando una red neuronal, pero con la ventaja de que existen varias bases de datos en ingles para el reconocimiento de voz, como por ejemplo ”SPECH COMAND DATASET”de google. Esto permitiría el aumento de seguridad para el acceso del brazo robot y a la vez facilitar algunas actividades al poder dar ordenes de voz.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).