1
tesis de maestría
Está tesis presenta un análisis del paradigma End-To-End Deep Learning, que proyecta importantes desarrollos en diversas áreas de investigación. Este paradigma ha revolucionado la arquitectura, la implementación y las aplicaciones de los sistemas computacionales que se denominan comúnmente ASR 1 los cuales son capaces de reconocer el habla y generar un texto en forma automática que represente lo hablado. Este análisis, se basa en el trabajo del Baidu Research – Silicon Valley AI Lab, denominado Deep Speech [2]. La clave de este enfoque es el entrenamiento de una RNN 2 optimizada, que utiliza GPU 3, así como un conjunto de nuevas técnicas de sintetización que nos permiten obtener una gran cantidad de datos variados para el entrenamiento. Está arquitectura es más simple que los sistemas de voz tradicionales, que se basan en el enfoque estadístico, con arquitecturas de estru...
2
artículo
Publicado 2013
Enlace
Enlace
Due to the advancement of computing and the power of the new hardware, more economical, it is now feasible to have thousands of images which can be analyzed to allow classification for its shape and/or color. Furthermore, techniques and efficiency of the classification depends on the characteristics to be obtained of images in order to compare and classify them according to their similarity. Some images, such as model cars, planes and boats, can be discriminated by their shape. However, other images such as butterfly species where the shape is similar, the color plays an important role in the discrimination task. In this research we propose a novel approach to extract distinctive features of images by combining the HSV color model and wavelets filters. Furthermore, we investigate the best combination of features color and form. Experiments have shown improved performance by combining the...