Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares
Descripción del Articulo
La clasificación de objetos es uno de los campos de estudios más importantes de los últimos años y está asociado a la similitud de características entre los objetos y al continuo crecimiento de los conjuntos de datos de entrenamiento. En base a ello, aumentar el número de muestras de entrenamiento m...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2022 |
| Institución: | Universidad de Lima |
| Repositorio: | ULIMA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ulima.edu.pe:20.500.12724/18078 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12724/18078 |
| Nivel de acceso: | acceso abierto |
| Materia: | Automóviles Marcas comerciales Visión por computadora Vehicles Trademarks Computer vision https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
RULI_ffee9d2e7b8744480e52d8ca62d4fe3e |
|---|---|
| oai_identifier_str |
oai:repositorio.ulima.edu.pe:20.500.12724/18078 |
| network_acronym_str |
RULI |
| network_name_str |
ULIMA-Institucional |
| repository_id_str |
3883 |
| dc.title.es_PE.fl_str_mv |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| title |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| spellingShingle |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares Castañeda Haro, Carlos Enrique Automóviles Marcas comerciales Visión por computadora Vehicles Trademarks Computer vision https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| title_full |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| title_fullStr |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| title_full_unstemmed |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| title_sort |
Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares |
| author |
Castañeda Haro, Carlos Enrique |
| author_facet |
Castañeda Haro, Carlos Enrique |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Ayma Quirita, Víctor Hugo |
| dc.contributor.author.fl_str_mv |
Castañeda Haro, Carlos Enrique |
| dc.subject.es_PE.fl_str_mv |
Automóviles Marcas comerciales Visión por computadora Vehicles Trademarks Computer vision |
| topic |
Automóviles Marcas comerciales Visión por computadora Vehicles Trademarks Computer vision https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.none.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
La clasificación de objetos es uno de los campos de estudios más importantes de los últimos años y está asociado a la similitud de características entre los objetos y al continuo crecimiento de los conjuntos de datos de entrenamiento. En base a ello, aumentar el número de muestras de entrenamiento mejora el rendimiento de los clasificadores. Sin embargo, no hay estudios que determinen un estimado de cuántas muestras de entrenamiento son necesarias para generar clasificadores robustos. En esta investigación se intenta responder esta pregunta, enfocando el problema en la clasificación por marca y modelo vehicular. Para ello, se creó un conjunto de datos compuesto por 32 modelos vehiculares diferentes y se utilizó la red VGG16 para la tarea de extracción de características. Asimismo, se utilizaron los algoritmos de clasificación Máquinas de Vector Soporte (SVM), Bosques Aleatorios (RF), Árboles de Decisión (DT) y Naive Bayes (NB). Se realizaron conjunto de entrenamientos en los que se variaron el número de muestras de entrenamiento y el número de categorías a clasificar por cada algoritmo. En estos experimentos, el algoritmo SVM fue el de mayor precisión con un 96.82% para el caso de 32 modelos vehiculares diferentes. Finalmente, se determinó que a medida que se aumenta el número de modelos vehiculares a clasificar, es necesario aumentar las muestras de entrenamiento para estabilizar la precisión, y que el número mínimo de muestras para este comportamiento es de 400 muestras para el escenario de 2 categorías y de 700 muestras para el resto de los escenarios con más categorías. |
| publishDate |
2022 |
| dc.date.accessioned.none.fl_str_mv |
2023-04-13T19:58:57Z |
| dc.date.available.none.fl_str_mv |
2023-04-13T19:58:57Z |
| dc.date.issued.fl_str_mv |
2022 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| dc.type.other.none.fl_str_mv |
Tesis |
| format |
bachelorThesis |
| dc.identifier.citation.es_PE.fl_str_mv |
Castañeda Haro, C. E. (2022). Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/18078 |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12724/18078 |
| identifier_str_mv |
Castañeda Haro, C. E. (2022). Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/18078 |
| url |
https://hdl.handle.net/20.500.12724/18078 |
| dc.language.iso.none.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.*.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.*.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidad de Lima |
| dc.publisher.country.none.fl_str_mv |
PE |
| publisher.none.fl_str_mv |
Universidad de Lima |
| dc.source.es_PE.fl_str_mv |
Repositorio Institucional - Ulima Universidad de Lima |
| dc.source.none.fl_str_mv |
reponame:ULIMA-Institucional instname:Universidad de Lima instacron:ULIMA |
| instname_str |
Universidad de Lima |
| instacron_str |
ULIMA |
| institution |
ULIMA |
| reponame_str |
ULIMA-Institucional |
| collection |
ULIMA-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/1/T018_71716684_T.pdf https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/2/FA_71716684.pdf https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/3/TURNITIN_DNI_71716684%20-%2020161905.pdf https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/7/T018_71716684_T.pdf.jpg https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/9/FA_71716684.pdf.jpg https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/11/TURNITIN_DNI_71716684%20-%2020161905.pdf.jpg https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/5/license.txt https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/4/license_rdf https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/6/T018_71716684_T.pdf.txt https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/8/FA_71716684.pdf.txt https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/10/TURNITIN_DNI_71716684%20-%2020161905.pdf.txt |
| bitstream.checksum.fl_str_mv |
78e16a2ad7cb259312c3d9b9bdbf92e6 dc75355f6ca7ca4a3ed6a62e5702d983 ccaad18986f1b4c001372959384fdace 46cc5c18c6c7ffc446422a3571c50e74 f6a0e84f2e7d3ba47ee4a0803cd5f91b 6a2599ccf8dcdbb067cd905f37c33cdb 8a4605be74aa9ea9d79846c1fba20a33 5a4ffbc01f1b5eb70a835dac0d501661 a669f47338732a41752b1fd8912472d8 cc6d60c1ef79462d95573a4587a25133 01df5d0b30f7732bdd252055b922c752 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Universidad de Lima |
| repository.mail.fl_str_mv |
repositorio@ulima.edu.pe |
| _version_ |
1847246591574933504 |
| spelling |
Ayma Quirita, Víctor HugoCastañeda Haro, Carlos Enrique2023-04-13T19:58:57Z2023-04-13T19:58:57Z2022Castañeda Haro, C. E. (2022). Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehiculares [Tesis para optar el Título Profesional de Ingeniero de Sistemas, Universidad de Lima]. Repositorio institucional de la Universidad de Lima. https://hdl.handle.net/20.500.12724/18078https://hdl.handle.net/20.500.12724/18078La clasificación de objetos es uno de los campos de estudios más importantes de los últimos años y está asociado a la similitud de características entre los objetos y al continuo crecimiento de los conjuntos de datos de entrenamiento. En base a ello, aumentar el número de muestras de entrenamiento mejora el rendimiento de los clasificadores. Sin embargo, no hay estudios que determinen un estimado de cuántas muestras de entrenamiento son necesarias para generar clasificadores robustos. En esta investigación se intenta responder esta pregunta, enfocando el problema en la clasificación por marca y modelo vehicular. Para ello, se creó un conjunto de datos compuesto por 32 modelos vehiculares diferentes y se utilizó la red VGG16 para la tarea de extracción de características. Asimismo, se utilizaron los algoritmos de clasificación Máquinas de Vector Soporte (SVM), Bosques Aleatorios (RF), Árboles de Decisión (DT) y Naive Bayes (NB). Se realizaron conjunto de entrenamientos en los que se variaron el número de muestras de entrenamiento y el número de categorías a clasificar por cada algoritmo. En estos experimentos, el algoritmo SVM fue el de mayor precisión con un 96.82% para el caso de 32 modelos vehiculares diferentes. Finalmente, se determinó que a medida que se aumenta el número de modelos vehiculares a clasificar, es necesario aumentar las muestras de entrenamiento para estabilizar la precisión, y que el número mínimo de muestras para este comportamiento es de 400 muestras para el escenario de 2 categorías y de 700 muestras para el resto de los escenarios con más categorías.Object classification is one of the most important fields of study in recent times and it is associated with the similarity between objects and the continuous growth of training data sets. Based on this, increasing the number of training samples improves the performance of the classifiers. However, there are no studies that determine an estimate of how many training samples are necessary to develop solid classifiers. This research attempts to answer this question, focusing the problem on vehicle make and model recognition (VMMR). To do this, a data set composed of 32 different vehicle models was created and the VGG16 network was used for the feature extraction task. Likewise, the Support Vector Machine (SVM), Random Forest (RF), Decision Trees (DT) and Naive Bayes (NB) classification algorithms were used. A set of experiments were carried out in which the number of training samples and the number of categories to be classified by each algorithm were varied. In these experiments, the SVM algorithm was the most accurate with 96.82% for the case of 32 different vehicle models. Finally, it was determined that as the number of vehicle models to be classified is increased, it is necessary to increase the training samples, to stabilize the precision, and that the minimum number of training samples for this stabilization is 400 samples for the scenario of 2 categories and 700 samples for the rest of the scenarios with more categories.application/pdfspaUniversidad de LimaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Repositorio Institucional - UlimaUniversidad de Limareponame:ULIMA-Institucionalinstname:Universidad de Limainstacron:ULIMAAutomóvilesMarcas comercialesVisión por computadoraVehiclesTrademarksComputer visionhttps://purl.org/pe-repo/ocde/ford#2.02.04Estudio sobre la cantidad mínima de muestras de entrenamiento para la clasificación de modelos vehicularesinfo:eu-repo/semantics/bachelorThesisTesisSUNEDUTítulo ProfesionalIngeniería de sistemasUniversidad de Lima. Facultad de Ingeniería y ArquitecturaIngeniero de sistemashttps://orcid.org/0000-0002-0284-26104502509561207671716684https://purl.org/pe-repo/renati/level#tituloProfesionalGuzman Jimenez, Rosario MarybelTeshima Guibu, Hiroaki FernandoSuni Lopez, FranciGuzman Jimenez, Rosario Marybelhttps://purl.org/pe-repo/renati/type#tesisOIORIGINALT018_71716684_T.pdfT018_71716684_T.pdfTesisapplication/pdf392949https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/1/T018_71716684_T.pdf78e16a2ad7cb259312c3d9b9bdbf92e6MD51FA_71716684.pdfFA_71716684.pdfAutorizaciónapplication/pdf187191https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/2/FA_71716684.pdfdc75355f6ca7ca4a3ed6a62e5702d983MD52TURNITIN_DNI_71716684 - 20161905.pdfTURNITIN_DNI_71716684 - 20161905.pdfReporte de similitudapplication/pdf4969785https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/3/TURNITIN_DNI_71716684%20-%2020161905.pdfccaad18986f1b4c001372959384fdaceMD53THUMBNAILT018_71716684_T.pdf.jpgT018_71716684_T.pdf.jpgGenerated Thumbnailimage/jpeg10716https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/7/T018_71716684_T.pdf.jpg46cc5c18c6c7ffc446422a3571c50e74MD57FA_71716684.pdf.jpgFA_71716684.pdf.jpgGenerated Thumbnailimage/jpeg16007https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/9/FA_71716684.pdf.jpgf6a0e84f2e7d3ba47ee4a0803cd5f91bMD59TURNITIN_DNI_71716684 - 20161905.pdf.jpgTURNITIN_DNI_71716684 - 20161905.pdf.jpgGenerated Thumbnailimage/jpeg13777https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/11/TURNITIN_DNI_71716684%20-%2020161905.pdf.jpg6a2599ccf8dcdbb067cd905f37c33cdbMD511LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/5/license.txt8a4605be74aa9ea9d79846c1fba20a33MD55CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8914https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/4/license_rdf5a4ffbc01f1b5eb70a835dac0d501661MD54TEXTT018_71716684_T.pdf.txtT018_71716684_T.pdf.txtExtracted texttext/plain63339https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/6/T018_71716684_T.pdf.txta669f47338732a41752b1fd8912472d8MD56FA_71716684.pdf.txtFA_71716684.pdf.txtExtracted texttext/plain2534https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/8/FA_71716684.pdf.txtcc6d60c1ef79462d95573a4587a25133MD58TURNITIN_DNI_71716684 - 20161905.pdf.txtTURNITIN_DNI_71716684 - 20161905.pdf.txtExtracted texttext/plain4990https://repositorio.ulima.edu.pe/bitstream/20.500.12724/18078/10/TURNITIN_DNI_71716684%20-%2020161905.pdf.txt01df5d0b30f7732bdd252055b922c752MD51020.500.12724/18078oai:repositorio.ulima.edu.pe:20.500.12724/180782024-11-05 15:04:13.923Repositorio Universidad de Limarepositorio@ulima.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
13.122135 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).