Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning

Jimenez Moreano, Anaid; Qquecho Ccachainca, Brenda Alexandra

Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning

Descripción del Articulo

La investigación se enfoca en el desarrollo de un prototipo que permita reconocer una señal básica (cualquier letra estática del abecedario de lenguaje de señas peruano) capturada por webcam basándose en la lengua de señas del Perú dentro de un tiempo corto estimado. El prototipo utiliza la tecnolog...

Descripción completa

Detalles Bibliográficos
Autores:	Jimenez Moreano, Anaid, Qquecho Ccachainca, Brenda Alexandra
Formato:	tesis de grado
Fecha de Publicación:	2021
Institución:	Universidad Andina del Cusco
Repositorio:	UAC-Institucional
Lenguaje:	español
OAI Identifier:	oai:repositorio.uandina.edu.pe:20.500.12557/4177
Enlace del recurso:	https://hdl.handle.net/20.500.12557/4177
Nivel de acceso:	acceso abierto
Materia:	Lenguaje de señas Lenguaje de máquina Discapacidad auditiva https://purl.org/pe-repo/ocde/ford#2.02.04

id	UACI_a6ff227ceff044ba5f17114748f0fb20
oai_identifier_str	oai:repositorio.uandina.edu.pe:20.500.12557/4177
network_acronym_str	UACI
network_name_str	UAC-Institucional
repository_id_str	4842
dc.title.es_PE.fl_str_mv	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
title	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
spellingShingle	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning Jimenez Moreano, Anaid Lenguaje de señas Lenguaje de máquina Discapacidad auditiva https://purl.org/pe-repo/ocde/ford#2.02.04
title_short	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
title_full	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
title_fullStr	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
title_full_unstemmed	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
title_sort	Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning
author	Jimenez Moreano, Anaid
author_facet	Jimenez Moreano, Anaid Qquecho Ccachainca, Brenda Alexandra
author_role	author
author2	Qquecho Ccachainca, Brenda Alexandra
author2_role	author
dc.contributor.advisor.fl_str_mv	Molero Delgado, Iván
dc.contributor.author.fl_str_mv	Jimenez Moreano, Anaid Qquecho Ccachainca, Brenda Alexandra
dc.subject.es_PE.fl_str_mv	Lenguaje de señas Lenguaje de máquina Discapacidad auditiva
topic	Lenguaje de señas Lenguaje de máquina Discapacidad auditiva https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv	https://purl.org/pe-repo/ocde/ford#2.02.04
description	La investigación se enfoca en el desarrollo de un prototipo que permita reconocer una señal básica (cualquier letra estática del abecedario de lenguaje de señas peruano) capturada por webcam basándose en la lengua de señas del Perú dentro de un tiempo corto estimado. El prototipo utiliza la tecnología de Machine Learning usando una Convolutional Neural Network (CNN), en español llamada red neuronal convolucional de tres capas y Support Vector Machine (SVM) para la segunda fase; La primera capa de la CNN definida como “HandSegNet” ubica y aísla a la mano a detectar, la segunda capa definida como “PoseNet” que usa algoritmos de detección de puntos clave obtenidos de una imagen 2D RGB y la tercera capa deriva estos puntos base más el punto de vista de la cámara, considerando iluminación, perspectiva y giro a un plano 3D obtenidos a partir del paper “Learning to Estimate 3D Hand Pose from Single RGB Images” de Christian Zimmermann & Thomas Brox investigadores de la universidad de Freiburg en Alemania. La limitante de la red de Zimmermann se reduce a entregar coordenadas de los dedos de la mano 3D, para lo cual se desarrolló una etapa que pueda definir las poses del abecedario peruano usando umbrales de confianza, por ángulos y rizo, a la salida de estas coordenadas relativas usa la máquina de vectores de soporte (SVM), también la compara con una red neuronal estándar usando como función de activación la regresión lineal, finalmente escribe la letra sobre la seña correspondiente definida en el algoritmo. ACAT es un sistema desarrollado por S. Hawking, que tras su muerte se volvió de código abierto, este sistema fue nuestra inspiración, buscamos desarrollar un prototipo para ayudar de la misma forma a las personas con discapacidad auditiva del CEBE Don José de San Martin, así los niños con discapacidad auditiva (D.A) sean capaces de transmitir algunos pensamientos clave mediante las letras del abecedario estáticas, usando solo una webcam común y corriente a comparativa de sistemas ya hechos que usan cámaras complejas y de alto costo como la Kinect. A un trabajo futuro se espera una mejora considerable del prototipo y que los niños puedan comunicarse con sus amigos o familiares de manera libre y feliz como funciona un traductor actual de idiomas.
publishDate	2021
dc.date.accessioned.none.fl_str_mv	2021-10-18T21:00:20Z
dc.date.available.none.fl_str_mv	2021-10-18T21:00:20Z
dc.date.issued.fl_str_mv	2021-04-08
dc.type.es_PE.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
dc.identifier.uri.none.fl_str_mv	https://hdl.handle.net/20.500.12557/4177
url	https://hdl.handle.net/20.500.12557/4177
dc.language.iso.es_PE.fl_str_mv	spa
language	spa
dc.relation.ispartof.fl_str_mv	SUNEDU
dc.rights.es_PE.fl_str_mv	info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv	openAccess
rights_invalid_str_mv	https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv	application/pdf
dc.publisher.es_PE.fl_str_mv	Universidad Andina del Cusco
dc.publisher.country.es_PE.fl_str_mv	PE
dc.source.none.fl_str_mv	reponame:UAC-Institucional instname:Universidad Andina del Cusco instacron:UAC
instname_str	Universidad Andina del Cusco
instacron_str	UAC
institution	UAC
reponame_str	UAC-Institucional
collection	UAC-Institucional
bitstream.url.fl_str_mv	https://repositorio.uandina.edu.pe/bitstreams/1639ea93-849e-44b1-a50f-e907148ff004/download https://repositorio.uandina.edu.pe/bitstreams/04314ca8-b66b-445d-bc6c-c4eb66fabac2/download https://repositorio.uandina.edu.pe/bitstreams/b5e3e828-35c5-44ce-9179-3dd8c7b83e2b/download https://repositorio.uandina.edu.pe/bitstreams/9778e520-8803-475c-9d9c-9f3a78e47e57/download
bitstream.checksum.fl_str_mv	731e9e8ec4645b9c0f77f9cf85308de8 f367ff7feff786e62ad67d67c7d79f7c 243358e04103a08a9322a8bf44f16cd3 8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositorio Digital Universidad Andina del Cusco
repository.mail.fl_str_mv	jbenavides@uandina.edu.pe
_version_	1852952790902505472
spelling	Molero Delgado, Ivána3729024-0591-4224-812a-cc178df979fc7aa31423-1225-428a-a563-4562f44616bcJimenez Moreano, AnaidQquecho Ccachainca, Brenda Alexandra2021-10-18T21:00:20Z2021-10-18T21:00:20Z2021-04-08https://hdl.handle.net/20.500.12557/4177La investigación se enfoca en el desarrollo de un prototipo que permita reconocer una señal básica (cualquier letra estática del abecedario de lenguaje de señas peruano) capturada por webcam basándose en la lengua de señas del Perú dentro de un tiempo corto estimado. El prototipo utiliza la tecnología de Machine Learning usando una Convolutional Neural Network (CNN), en español llamada red neuronal convolucional de tres capas y Support Vector Machine (SVM) para la segunda fase; La primera capa de la CNN definida como “HandSegNet” ubica y aísla a la mano a detectar, la segunda capa definida como “PoseNet” que usa algoritmos de detección de puntos clave obtenidos de una imagen 2D RGB y la tercera capa deriva estos puntos base más el punto de vista de la cámara, considerando iluminación, perspectiva y giro a un plano 3D obtenidos a partir del paper “Learning to Estimate 3D Hand Pose from Single RGB Images” de Christian Zimmermann & Thomas Brox investigadores de la universidad de Freiburg en Alemania. La limitante de la red de Zimmermann se reduce a entregar coordenadas de los dedos de la mano 3D, para lo cual se desarrolló una etapa que pueda definir las poses del abecedario peruano usando umbrales de confianza, por ángulos y rizo, a la salida de estas coordenadas relativas usa la máquina de vectores de soporte (SVM), también la compara con una red neuronal estándar usando como función de activación la regresión lineal, finalmente escribe la letra sobre la seña correspondiente definida en el algoritmo. ACAT es un sistema desarrollado por S. Hawking, que tras su muerte se volvió de código abierto, este sistema fue nuestra inspiración, buscamos desarrollar un prototipo para ayudar de la misma forma a las personas con discapacidad auditiva del CEBE Don José de San Martin, así los niños con discapacidad auditiva (D.A) sean capaces de transmitir algunos pensamientos clave mediante las letras del abecedario estáticas, usando solo una webcam común y corriente a comparativa de sistemas ya hechos que usan cámaras complejas y de alto costo como la Kinect. A un trabajo futuro se espera una mejora considerable del prototipo y que los niños puedan comunicarse con sus amigos o familiares de manera libre y feliz como funciona un traductor actual de idiomas.The thesis focuses on the development of a prototype that allows us to recognize a basic and static signal of a peruvian signal language captured by webcam within a short estimated time. The prototype uses Machine Learning as main technology; First phase uses three-layer Convolutional Neural Network (CNN) and for the second phase uses Support Vector Machine (SVM). The first layer of the CNN defined as “HandSegNet” that locates and isolates the hand to be detected for the webcam, the second layer defined as “PoseNet” that uses key point detection algorithms obtained from a 2D RGB image and positioning to a 3D plane and the third layer derives these points base to the camera's point of view, this part represents the image’s depth, considering lighting, perspective and rotation to a 3D plane obtained from the paper “Learning to Estimate 3D Hand Pose from Single RGB Images” by Christian Zimmermann & Thomas Brox researchers from the University of Freiburg in Germany that has free access for use. The limitation of the Zimmermann network is reduced to delivering coordinates of the 3D planeo f fingers of the hand, we créate a Class to define the poses of the Peruvian alphabet using confidence thresholds, by angles and curls, at the exit of these Relative coordinates we use the support vector machine (SVM), finally write the letter over the corresponding sign defined in the Class. ACAT is a system developed by S. Hawking, which after his death became open source software, the system was our inspiration, we sought to develop the prototype to help people with hearing disabilities from CEBE Don José de San Martin for children with hearing impairment (DA) , so they’ll be able to transmit some key thoughts through the static letters of the alphabet, using only an ordinary webcam to comparison of ready-made systems that use complex cameras like the Kinect. In a future job, we consider a considerable improvement of the prototype, so children could communicate with their friends or family freely and happily as a current language translator Works with the system working over AWS service.application/pdfspaUniversidad Andina del CuscoPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Lenguaje de señasLenguaje de máquinaDiscapacidad auditivahttps://purl.org/pe-repo/ocde/ford#2.02.04Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learninginfo:eu-repo/semantics/bachelorThesisreponame:UAC-Institucionalinstname:Universidad Andina del Cuscoinstacron:UACSUNEDUIngeniero de SistemasUniversidad Andina del Cusco. Facultad de Ingeniería y ArquitecturaIngeniería de Sistemas25705893https://orcid.org/0000-0003-0568-05624696974170169963612076Acurio Gutierrez, Maria IsabelEspetia Huamanga, HugoRamírez Vargas, AdrielChoque Soto, Vanessa Maribelhttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisTEXTAnaid_Brenda_Tesis_Bachiller_2021.pdf.txtAnaid_Brenda_Tesis_Bachiller_2021.pdf.txtExtracted texttext/plain; charset=utf-8101760https://repositorio.uandina.edu.pe/bitstreams/1639ea93-849e-44b1-a50f-e907148ff004/download731e9e8ec4645b9c0f77f9cf85308de8MD55THUMBNAILAnaid_Brenda_Tesis_Bachiller_2021.pdf.jpgAnaid_Brenda_Tesis_Bachiller_2021.pdf.jpgGenerated Thumbnailimage/jpeg19770https://repositorio.uandina.edu.pe/bitstreams/04314ca8-b66b-445d-bc6c-c4eb66fabac2/downloadf367ff7feff786e62ad67d67c7d79f7cMD56ORIGINALAnaid_Brenda_Tesis_Bachiller_2021.pdfAnaid_Brenda_Tesis_Bachiller_2021.pdfapplication/pdf5276413https://repositorio.uandina.edu.pe/bitstreams/b5e3e828-35c5-44ce-9179-3dd8c7b83e2b/download243358e04103a08a9322a8bf44f16cd3MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.uandina.edu.pe/bitstreams/9778e520-8803-475c-9d9c-9f3a78e47e57/download8a4605be74aa9ea9d79846c1fba20a33MD5220.500.12557/4177oai:repositorio.uandina.edu.pe:20.500.12557/41772024-10-01 22:53:20.655https://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://repositorio.uandina.edu.peRepositorio Digital Universidad Andina del Cuscojbenavides@uandina.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score	13.057139

Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning

Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).

Prototipo de traductor de lenguaje de señas peruanas básicas usando machine learning

Descripción del Articulo

Ejemplares Similares