Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares
Descripción del Articulo
La clasificación de objetos es uno de los campos de estudios más importantes de los últimos años y está asociado a la similitud de características entre los objetos y al continuo crecimiento de los conjuntos de datos de entrenamiento. En base a ello, aumentar el número de muestras de entrenamiento m...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2022 |
| Institución: | Universidad de Lima |
| Repositorio: | ULIMA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ulima.edu.pe:20.500.12724/18078 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12724/18078 |
| Nivel de acceso: | acceso abierto |
| Materia: | Automóviles Marcas comerciales Visión por computadora Vehicles Trademarks Computer vision https://purl.org/pe-repo/ocde/ford#2.02.04 |
| Sumario: | La clasificación de objetos es uno de los campos de estudios más importantes de los últimos años y está asociado a la similitud de características entre los objetos y al continuo crecimiento de los conjuntos de datos de entrenamiento. En base a ello, aumentar el número de muestras de entrenamiento mejora el rendimiento de los clasificadores. Sin embargo, no hay estudios que determinen un estimado de cuántas muestras de entrenamiento son necesarias para generar clasificadores robustos. En esta investigación se intenta responder esta pregunta, enfocando el problema en la clasificación por marca y modelo vehicular. Para ello, se creó un conjunto de datos compuesto por 32 modelos vehiculares diferentes y se utilizó la red VGG16 para la tarea de extracción de características. Asimismo, se utilizaron los algoritmos de clasificación Máquinas de Vector Soporte (SVM), Bosques Aleatorios (RF), Árboles de Decisión (DT) y Naive Bayes (NB). Se realizaron conjunto de entrenamientos en los que se variaron el número de muestras de entrenamiento y el número de categorías a clasificar por cada algoritmo. En estos experimentos, el algoritmo SVM fue el de mayor precisión con un 96.82% para el caso de 32 modelos vehiculares diferentes. Finalmente, se determinó que a medida que se aumenta el número de modelos vehiculares a clasificar, es necesario aumentar las muestras de entrenamiento para estabilizar la precisión, y que el número mínimo de muestras para este comportamiento es de 400 muestras para el escenario de 2 categorías y de 700 muestras para el resto de los escenarios con más categorías. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).