Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento

Descripción del Articulo

Una de las características importantes que identifica a una persona es su voz y nosotros los seres humanos usamos la voz para identificar a las personas, así como el género de cada una de ellas. Este hecho se puede emplear para el diseño de sistemas de reconocimiento automático los que podrían reemp...

Descripción completa

Detalles Bibliográficos
Autor: Joo Aguayo, Alcides Guillermo
Formato: informe técnico
Fecha de Publicación:2013
Institución:Universidad Nacional de Ingeniería
Repositorio:UNI-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.uni.edu.pe:20.500.14076/13113
Enlace del recurso:http://hdl.handle.net/20.500.14076/13113
Nivel de acceso:acceso abierto
Materia:Sistemas automáticos
Procesamiento de señales
Sistema de reconocimiento
id UUNI_c78c7b1a7cb0278a62c40852454c7c32
oai_identifier_str oai:cybertesis.uni.edu.pe:20.500.14076/13113
network_acronym_str UUNI
network_name_str UNI-Tesis
repository_id_str 1534
dc.title.es.fl_str_mv Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
title Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
spellingShingle Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
Joo Aguayo, Alcides Guillermo
Sistemas automáticos
Procesamiento de señales
Sistema de reconocimiento
title_short Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
title_full Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
title_fullStr Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
title_full_unstemmed Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
title_sort Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
dc.creator.none.fl_str_mv Joo Aguayo, Alcides Guillermo
author Joo Aguayo, Alcides Guillermo
author_facet Joo Aguayo, Alcides Guillermo
author_role author
dc.contributor.advisor.fl_str_mv Sotelo Valer, Freedy
dc.contributor.author.fl_str_mv Joo Aguayo, Alcides Guillermo
dc.subject.es.fl_str_mv Sistemas automáticos
Procesamiento de señales
Sistema de reconocimiento
topic Sistemas automáticos
Procesamiento de señales
Sistema de reconocimiento
description Una de las características importantes que identifica a una persona es su voz y nosotros los seres humanos usamos la voz para identificar a las personas, así como el género de cada una de ellas. Este hecho se puede emplear para el diseño de sistemas de reconocimiento automático los que podrían reemplazar a los métodos tradicionales como el uso de tarjetas de identificación, claves de acceso, etc. A pesar de la existencia de sistemas comerciales de reconocimiento basados en la voz, el desarrollo de un sistema alternativo no solo nos permite apreciar la aplicación del procesamiento de señales e inteligencia artificial en el reconocimiento del hablante, sino que nos perite el desarrollo de tecnología nacional aplicada y orientada a la solución de problemas reales. El presente trabajo consiste en el diseño e implementación de un sistema automático de reconocimiento basado en la voz usando una red perceptrón multicapa. Para tal fin, la presente tesis se ha organizado en cinco capítulos, los que están expuestos en el orden siguiente: En el capítulo 1, se mencionan los antecedentes del informe de sustentación de tesis, mencionando los trabajos previos y las referencias de aplicación existentes los cuales de alguna manera inspiraron y guiaron la presente investigación. Se plantean los objetivos a los que se desean llegar en el presente informe de suficiencia. Se explica la justificación y alcances de este trabajo para concluir este capítulo listando los recursos empleados para desarrollar la investigación. En el capítulo 2, se describe el sistema de reconocimiento, que partes tiene y en que consiste este sistema. Así mismo se describe el cómo es que el sistema realiza el reconocimiento de voz. En el capítulo 3, se realiza la identificación del problema, dando detalles de cuáles son los límites dentro de los cuales se desea enmarcar esta investigación. Una vez detallado el problema se expone la hipótesis de trabajo. En el capítulo 4, se exponen los fundamentos teóricos necesarios, de los cuales se estudiará en primer lugar las principales características de la voz humana. Se hará un breve estudio fisiológico de la voz, analizando su proceso de formación y sus principales características. Luego se hará un estudio del pitch y de las frecuencias formantes, ya que son las características que son únicas en cada persona y por tal basándonos en estas medidas podemos distinguir a una persona de otra. Se presentarán un conjunto de algoritmos del área de procesamiento de señales para la etapa de preprocesamiento y para la etapa de extracción de características. De esta manera, será posible representar de manera compacta y única la señal de voz de cada persona, y esta nueva representación será usada más adelante como las entradas del sistema de reconocimiento tanto para la etapa de entrenamiento como para la etapa de prueba y funcionamiento. Luego de estudiar la voz y el tratamiento de señales de voz, se presenta una reseña de la red perceptrón multicapa analizando las propiedades que la hacen adecuadas para la tarea de clasificación y reconocimiento. Se mostrará el algoritmo de optimización usado para la tarea de optimización de la red. Se discutirá la función de error adecuada para la tarea de clasificación y se mostrará el algoritmo de back- propagation como un método computacionalmente eficiente para el cálculo del gradiente de la función de error. Se concluye el capítulo de fundamentos teóricos dando una breve explicación de los sistemas de reconocimiento, según las ciencias computacionales como parte del enfoque que permitirá comprender el panorama de esta investigación. En el capítulo 5, se explica la estructura del sistema de reconocimiento, como se realiza la adquisición de señales de voz, la obtención de la señal pre-procesada, la extracción de características de las señales de voz, la obtención del sistema de reconocimiento y la comprobación de la calidad del sistema de reconocimiento de patrones de voz usando redes perceptrón multicapa. Para la comprobación de la calidad se muestran las pruebas y resultados del sistema de reconocimiento. En este capítulo se muestra los patrones característicos de cada persona, y se hace un análisis de la red neuronal para encontrar los parámetros que resulten en una mayor tasa de reconocimiento. Finalmente, para comprobar se hace un análisis del funcionamiento del sistema en tiempo real con la finalidad de verificar el correcto funcionamiento del sistema. Para concluir el informe, se presentan las Conclusiones y Recomendaciones encontradas en el desarrollo del presente trabajo y se adjuntan los anexos pertinentes para complementar la investigación. Este informe es útil porque nos permitió no solo optar por el título de ingeniero sino también porque al momento de realizarlo se aplicaron varios de los tópicos para el área de ciencias computacionales permitiendo realizar un sistema sencillo pero eficaz para realizar el reconocimiento de voz, este trabajo permitirá a las nuevas generaciones tener un referencia para seguir ampliando las investigaciones sobre este tema tan interesante.
publishDate 2013
dc.date.accessioned.none.fl_str_mv 2018-08-17T17:31:02Z
dc.date.available.none.fl_str_mv 2018-08-17T17:31:02Z
dc.date.issued.fl_str_mv 2013
dc.type.es.fl_str_mv info:eu-repo/semantics/report
format report
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.14076/13113
url http://hdl.handle.net/20.500.14076/13113
dc.language.iso.es.fl_str_mv spa
language spa
dc.rights.es.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es.fl_str_mv application/pdf
dc.publisher.es.fl_str_mv Universidad Nacional de Ingeniería
dc.source.es.fl_str_mv Universidad Nacional de Ingeniería
Repositorio Institucional - UNI
dc.source.none.fl_str_mv reponame:UNI-Tesis
instname:Universidad Nacional de Ingeniería
instacron:UNI
instname_str Universidad Nacional de Ingeniería
instacron_str UNI
institution UNI
reponame_str UNI-Tesis
collection UNI-Tesis
bitstream.url.fl_str_mv http://cybertesis.uni.edu.pe/bitstream/20.500.14076/13113/3/joo_aa.pdf.txt
http://cybertesis.uni.edu.pe/bitstream/20.500.14076/13113/2/license.txt
http://cybertesis.uni.edu.pe/bitstream/20.500.14076/13113/1/joo_aa.pdf
bitstream.checksum.fl_str_mv 03057aa0575fcd74e1a54a39af8f3bec
8a4605be74aa9ea9d79846c1fba20a33
7c441e30a2fb0321688709224486a602
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional - UNI
repository.mail.fl_str_mv repositorio@uni.edu.pe
_version_ 1840085541948751872
spelling Sotelo Valer, FreedyJoo Aguayo, Alcides GuillermoJoo Aguayo, Alcides Guillermo2018-08-17T17:31:02Z2018-08-17T17:31:02Z2013http://hdl.handle.net/20.500.14076/13113Una de las características importantes que identifica a una persona es su voz y nosotros los seres humanos usamos la voz para identificar a las personas, así como el género de cada una de ellas. Este hecho se puede emplear para el diseño de sistemas de reconocimiento automático los que podrían reemplazar a los métodos tradicionales como el uso de tarjetas de identificación, claves de acceso, etc. A pesar de la existencia de sistemas comerciales de reconocimiento basados en la voz, el desarrollo de un sistema alternativo no solo nos permite apreciar la aplicación del procesamiento de señales e inteligencia artificial en el reconocimiento del hablante, sino que nos perite el desarrollo de tecnología nacional aplicada y orientada a la solución de problemas reales. El presente trabajo consiste en el diseño e implementación de un sistema automático de reconocimiento basado en la voz usando una red perceptrón multicapa. Para tal fin, la presente tesis se ha organizado en cinco capítulos, los que están expuestos en el orden siguiente: En el capítulo 1, se mencionan los antecedentes del informe de sustentación de tesis, mencionando los trabajos previos y las referencias de aplicación existentes los cuales de alguna manera inspiraron y guiaron la presente investigación. Se plantean los objetivos a los que se desean llegar en el presente informe de suficiencia. Se explica la justificación y alcances de este trabajo para concluir este capítulo listando los recursos empleados para desarrollar la investigación. En el capítulo 2, se describe el sistema de reconocimiento, que partes tiene y en que consiste este sistema. Así mismo se describe el cómo es que el sistema realiza el reconocimiento de voz. En el capítulo 3, se realiza la identificación del problema, dando detalles de cuáles son los límites dentro de los cuales se desea enmarcar esta investigación. Una vez detallado el problema se expone la hipótesis de trabajo. En el capítulo 4, se exponen los fundamentos teóricos necesarios, de los cuales se estudiará en primer lugar las principales características de la voz humana. Se hará un breve estudio fisiológico de la voz, analizando su proceso de formación y sus principales características. Luego se hará un estudio del pitch y de las frecuencias formantes, ya que son las características que son únicas en cada persona y por tal basándonos en estas medidas podemos distinguir a una persona de otra. Se presentarán un conjunto de algoritmos del área de procesamiento de señales para la etapa de preprocesamiento y para la etapa de extracción de características. De esta manera, será posible representar de manera compacta y única la señal de voz de cada persona, y esta nueva representación será usada más adelante como las entradas del sistema de reconocimiento tanto para la etapa de entrenamiento como para la etapa de prueba y funcionamiento. Luego de estudiar la voz y el tratamiento de señales de voz, se presenta una reseña de la red perceptrón multicapa analizando las propiedades que la hacen adecuadas para la tarea de clasificación y reconocimiento. Se mostrará el algoritmo de optimización usado para la tarea de optimización de la red. Se discutirá la función de error adecuada para la tarea de clasificación y se mostrará el algoritmo de back- propagation como un método computacionalmente eficiente para el cálculo del gradiente de la función de error. Se concluye el capítulo de fundamentos teóricos dando una breve explicación de los sistemas de reconocimiento, según las ciencias computacionales como parte del enfoque que permitirá comprender el panorama de esta investigación. En el capítulo 5, se explica la estructura del sistema de reconocimiento, como se realiza la adquisición de señales de voz, la obtención de la señal pre-procesada, la extracción de características de las señales de voz, la obtención del sistema de reconocimiento y la comprobación de la calidad del sistema de reconocimiento de patrones de voz usando redes perceptrón multicapa. Para la comprobación de la calidad se muestran las pruebas y resultados del sistema de reconocimiento. En este capítulo se muestra los patrones característicos de cada persona, y se hace un análisis de la red neuronal para encontrar los parámetros que resulten en una mayor tasa de reconocimiento. Finalmente, para comprobar se hace un análisis del funcionamiento del sistema en tiempo real con la finalidad de verificar el correcto funcionamiento del sistema. Para concluir el informe, se presentan las Conclusiones y Recomendaciones encontradas en el desarrollo del presente trabajo y se adjuntan los anexos pertinentes para complementar la investigación. Este informe es útil porque nos permitió no solo optar por el título de ingeniero sino también porque al momento de realizarlo se aplicaron varios de los tópicos para el área de ciencias computacionales permitiendo realizar un sistema sencillo pero eficaz para realizar el reconocimiento de voz, este trabajo permitirá a las nuevas generaciones tener un referencia para seguir ampliando las investigaciones sobre este tema tan interesante.Submitted by luis oncebay lazo (luis11_182@hotmail.com) on 2018-08-17T17:31:02Z No. of bitstreams: 1 joo_aa.pdf: 5521682 bytes, checksum: 7c441e30a2fb0321688709224486a602 (MD5)Made available in DSpace on 2018-08-17T17:31:02Z (GMT). No. of bitstreams: 1 joo_aa.pdf: 5521682 bytes, checksum: 7c441e30a2fb0321688709224486a602 (MD5) Previous issue date: 2013Trabajo de suficiencia profesionalapplication/pdfspaUniversidad Nacional de Ingenieríainfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de IngenieríaRepositorio Institucional - UNIreponame:UNI-Tesisinstname:Universidad Nacional de Ingenieríainstacron:UNISistemas automáticosProcesamiento de señalesSistema de reconocimientoDesarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimientoinfo:eu-repo/semantics/reportIngeniero MecatrónicoUniversidad Nacional de Ingeniería. Facultad de Ingeniería MecánicaTítulo ProfesionalIngeniería MecatrónicaIngenieríaTEXTjoo_aa.pdf.txtjoo_aa.pdf.txtExtracted texttext/plain129798http://cybertesis.uni.edu.pe/bitstream/20.500.14076/13113/3/joo_aa.pdf.txt03057aa0575fcd74e1a54a39af8f3becMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://cybertesis.uni.edu.pe/bitstream/20.500.14076/13113/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALjoo_aa.pdfjoo_aa.pdfapplication/pdf5521682http://cybertesis.uni.edu.pe/bitstream/20.500.14076/13113/1/joo_aa.pdf7c441e30a2fb0321688709224486a602MD5120.500.14076/13113oai:cybertesis.uni.edu.pe:20.500.14076/131132022-05-23 16:28:03.345Repositorio Institucional - UNIrepositorio@uni.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.461011
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).