Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
Descripción del Articulo
This study addresses the global issue of marine pollution, with a particular focus on plastic bag contamination, by leveraging real-time object detection techniques powered by deep learning algorithms. A detailed comparison was carried out between the YOLOv8, YOLO-NAS, and RT-DETR models to assess t...
| Autores: | , , |
|---|---|
| Formato: | artículo |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad de Lima |
| Repositorio: | Revistas - Universidad de Lima |
| Lenguaje: | inglés |
| OAI Identifier: | oai:ojs.pkp.sfu.ca:article/7868 |
| Enlace del recurso: | https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868 |
| Nivel de acceso: | acceso abierto |
| Materia: | object detection deep learning plastic waste object detection model underwater images detección de objetos aprendizaje profundo residuos plásticos modelos de detección de objetos imágenes submarinas |
| id |
REVULIMA_5e49f55009078891b077499c1fb593b4 |
|---|---|
| oai_identifier_str |
oai:ojs.pkp.sfu.ca:article/7868 |
| network_acronym_str |
REVULIMA |
| network_name_str |
Revistas - Universidad de Lima |
| repository_id_str |
|
| dc.title.none.fl_str_mv |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models Detección de residuos plásticos submarinos con modelos YOLO y Vision Transformer |
| title |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models |
| spellingShingle |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models Cárdenas Rondoño, Jonathan Bruce object detection deep learning plastic waste object detection model underwater images detección de objetos aprendizaje profundo residuos plásticos modelos de detección de objetos imágenes submarinas |
| title_short |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models |
| title_full |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models |
| title_fullStr |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models |
| title_full_unstemmed |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models |
| title_sort |
Underwater Plastic Waste Detection with YOLO and Vision Transformer Models |
| dc.creator.none.fl_str_mv |
Cárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners Armando Escobedo Cárdenas, Edwin Jonathan Cárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners Armando Escobedo Cárdenas, Edwin Jonathan Cárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners Armando Escobedo Cárdenas, Edwin Jonathan |
| author |
Cárdenas Rondoño, Jonathan Bruce |
| author_facet |
Cárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners Armando Escobedo Cárdenas, Edwin Jonathan |
| author_role |
author |
| author2 |
Vasquez Espinoza, Ners Armando Escobedo Cárdenas, Edwin Jonathan |
| author2_role |
author author |
| dc.subject.none.fl_str_mv |
object detection deep learning plastic waste object detection model underwater images detección de objetos aprendizaje profundo residuos plásticos modelos de detección de objetos imágenes submarinas |
| topic |
object detection deep learning plastic waste object detection model underwater images detección de objetos aprendizaje profundo residuos plásticos modelos de detección de objetos imágenes submarinas |
| description |
This study addresses the global issue of marine pollution, with a particular focus on plastic bag contamination, by leveraging real-time object detection techniques powered by deep learning algorithms. A detailed comparison was carried out between the YOLOv8, YOLO-NAS, and RT-DETR models to assess their effectiveness in detecting plastic waste in underwater environments. The methodology encompassed several key stages, including data preprocessing, model implementation, and training through transfer learning. Evaluation was conducted using a simulated video environment, followed by an in-depth comparison of the results. Performance assessment was based on critical metrics such as mean average precision (mAP), recall, and inference time. The YOLOv8 model achieved an mAP50 of 0.921 on the validation dataset, along with a recall of 0.829 and an inference time of 14.1 milliseconds. The YOLO-NAS model, by contrast, reached an mAP50 of 0.813, a higher recall of 0.903, and an inference time of 17.8 milliseconds. The RT-DETR model obtained an mAP50 of 0.887, a recall of 0.819, and an inference time of 15.9 milliseconds. Notably, despite not having the highest mAP, the RT-DETR model demonstrated superior detection performance when deployed in real-world underwater conditions, highlighting its robustness and potential for practical environmental monitoring. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-07-31 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868 10.26439/interfases2025.n021.7868 |
| url |
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868 |
| identifier_str_mv |
10.26439/interfases2025.n021.7868 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7820 https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7821 |
| dc.rights.none.fl_str_mv |
Copyright (c) 2025 I info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Copyright (c) 2025 I |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf text/html |
| dc.publisher.none.fl_str_mv |
Universidad de Lima |
| publisher.none.fl_str_mv |
Universidad de Lima |
| dc.source.none.fl_str_mv |
Interfases; No. 021 (2025); 81-100 Interfases; Núm. 021 (2025); 81-100 Interfases; n. 021 (2025); 81-100 1993-4912 10.26439/interfases2025.n021 reponame:Revistas - Universidad de Lima instname:Universidad de Lima instacron:ULIMA |
| instname_str |
Universidad de Lima |
| instacron_str |
ULIMA |
| institution |
ULIMA |
| reponame_str |
Revistas - Universidad de Lima |
| collection |
Revistas - Universidad de Lima |
| repository.name.fl_str_mv |
|
| repository.mail.fl_str_mv |
|
| _version_ |
1846791802588233728 |
| spelling |
Underwater Plastic Waste Detection with YOLO and Vision Transformer ModelsDetección de residuos plásticos submarinos con modelos YOLO y Vision TransformerCárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners ArmandoEscobedo Cárdenas, Edwin JonathanCárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners ArmandoEscobedo Cárdenas, Edwin JonathanCárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners ArmandoEscobedo Cárdenas, Edwin Jonathanobject detectiondeep learningplastic wasteobject detection modelunderwater imagesdetección de objetosaprendizaje profundoresiduos plásticosmodelos de detección de objetosimágenes submarinasThis study addresses the global issue of marine pollution, with a particular focus on plastic bag contamination, by leveraging real-time object detection techniques powered by deep learning algorithms. A detailed comparison was carried out between the YOLOv8, YOLO-NAS, and RT-DETR models to assess their effectiveness in detecting plastic waste in underwater environments. The methodology encompassed several key stages, including data preprocessing, model implementation, and training through transfer learning. Evaluation was conducted using a simulated video environment, followed by an in-depth comparison of the results. Performance assessment was based on critical metrics such as mean average precision (mAP), recall, and inference time. The YOLOv8 model achieved an mAP50 of 0.921 on the validation dataset, along with a recall of 0.829 and an inference time of 14.1 milliseconds. The YOLO-NAS model, by contrast, reached an mAP50 of 0.813, a higher recall of 0.903, and an inference time of 17.8 milliseconds. The RT-DETR model obtained an mAP50 of 0.887, a recall of 0.819, and an inference time of 15.9 milliseconds. Notably, despite not having the highest mAP, the RT-DETR model demonstrated superior detection performance when deployed in real-world underwater conditions, highlighting its robustness and potential for practical environmental monitoring.Este estudio aborda el problema global de la contaminación marina, con un enfoque particular en la contaminación por bolsas de plástico, aprovechando técnicas de detección de objetos en tiempo real impulsadas por algoritmos de aprendizaje profundo. Se realizó una comparación detallada entre los modelos YOLO v8, YOLO-NAS y RT-DETR para evaluar su efectividad en la detección de desechos plásticos en entornos submarinos. La metodología abarcó varias etapas clave, incluyendo el preprocesamiento de datos, la implementación del modelo y el entrenamiento utilizando aprendizaje por transferencia. La evaluación se llevó a cabo a través de un entorno de video simulado, seguido de una comparación exhaustiva de los resultados. La evaluación del rendimiento se basó en métricas críticas como la precisión promedio (mAP), el recall y el tiempo de inferencia. El modelo YOLO v8 alcanzó un mAP50 de 0,921 en el conjunto de validación, con un recall de 0,829 y un tiempo de inferencia de 14,1 milisegundos. El modelo YOLONAS, en contraste, alcanzó un mAP50 de 0,813, un recall más alto de 0,903 y un tiempo de inferencia de 17,8 milisegundos. El modelo RT-DETR obtuvo un mAP de 0,887, un recall de 0,819 y un tiempo de inferencia de 15,9 milisegundos. Notablemente, a pesar de no tener el mAP más alto, el modelo RT-DETR demostró un rendimiento superior en la detección cuando se implementó en condiciones submarinas reales, destacando su robustez y potencial para aplicaciones prácticas de monitoreo ambiental.Universidad de Lima2025-07-31info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/htmlhttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/786810.26439/interfases2025.n021.7868Interfases; No. 021 (2025); 81-100Interfases; Núm. 021 (2025); 81-100Interfases; n. 021 (2025); 81-1001993-491210.26439/interfases2025.n021reponame:Revistas - Universidad de Limainstname:Universidad de Limainstacron:ULIMAenghttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7820https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7821Copyright (c) 2025 Iinfo:eu-repo/semantics/openAccessoai:ojs.pkp.sfu.ca:article/78682025-07-31T18:19:43Z |
| score |
13.945474 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).