1
tesis doctoral
Publicado 2018
Enlace
Enlace
La creciente disponibilidad de datos en diferente dominio de aplicación ha motivado el desarrollo de técnicas de recuperación y descubrimiento de conocimiento en grandes volúmenes de datos. Recientes trabajos muestran que tanto las técnicas de aprendizaje profundo como nuevos métodos de búsqueda aproximada en dominio de datos complejos son campos de investigación importantes, donde tanto la eficiencia como la escalabilidad de los algoritmos son factores críticos. Para resolver el problema de escalabilidad se han propuesto muchos enfoques. En problemas de gran escala con datos en altas dimensiones, una solución de búsqueda aproximada con un análisis teórico solido se muestra más adecuado que una solución exacta con un modelo teórico débil. Algoritmos de búsqueda aproximada basados en hashing son propuestos para consultar en conjuntos de datos alta dimensiones debido a su...
2
tesis de grado
Publicado 2015
Enlace
Enlace
La creciente disponibilidad de datos en diferentes ámbitos ha motivado el desarrollo de técnicas para el descubrimiento de conocimientos en grandes volúmenes de datos complejos. Un trabajo reciente muestra que la búsqueda del vecino más cercano en dominios de datos complejos es un importante campo de investigación en muchas tareas de minería de datos. Para resolver el problema de la búsqueda de los vecinos más cercanos se han propuesto muchos enfoques para reducir los efectos de la maldición de la alta dimensionalidad de los datos. Aunque se han propuesto muchos métodos exactos y aproximados, el modelo de programación impone restricciones sobre el rendimiento en la CPU para estos tipos de soluciones. Una forma de mejorar el tiempo de ejecución de las técnicas de recuperación y extracción de datos en varias órdenes de magnitud es el empleo de las nuevas arquitecturas de p...