Underwater Plastic Waste Detection with YOLO and Vision Transformer Models

Descripción del Articulo

This study addresses the global issue of marine pollution, with a particular focus on plastic bag contamination, by leveraging real-time object detection techniques powered by deep learning algorithms. A detailed comparison was carried out between the YOLOv8, YOLO-NAS, and RT-DETR models to assess t...

Descripción completa

Detalles Bibliográficos
Autores: Cárdenas Rondoño, Jonathan Bruce, Vasquez Espinoza, Ners Armando, Escobedo Cárdenas, Edwin Jonathan
Formato: artículo
Fecha de Publicación:2025
Institución:Universidad de Lima
Repositorio:Revistas - Universidad de Lima
Lenguaje:inglés
OAI Identifier:oai:ojs.pkp.sfu.ca:article/7868
Enlace del recurso:https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868
Nivel de acceso:acceso abierto
Materia:object detection
deep learning
plastic waste
object detection model
underwater images
detección de objetos
aprendizaje profundo
residuos plásticos
modelos de detección de objetos
imágenes submarinas
id REVULIMA_5e49f55009078891b077499c1fb593b4
oai_identifier_str oai:ojs.pkp.sfu.ca:article/7868
network_acronym_str REVULIMA
network_name_str Revistas - Universidad de Lima
repository_id_str
dc.title.none.fl_str_mv Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
Detección de residuos plásticos submarinos con modelos YOLO y Vision Transformer
title Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
spellingShingle Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
Cárdenas Rondoño, Jonathan Bruce
object detection
deep learning
plastic waste
object detection model
underwater images
detección de objetos
aprendizaje profundo
residuos plásticos
modelos de detección de objetos
imágenes submarinas
title_short Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
title_full Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
title_fullStr Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
title_full_unstemmed Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
title_sort Underwater Plastic Waste Detection with YOLO and Vision Transformer Models
dc.creator.none.fl_str_mv Cárdenas Rondoño, Jonathan Bruce
Vasquez Espinoza, Ners Armando
Escobedo Cárdenas, Edwin Jonathan
Cárdenas Rondoño, Jonathan Bruce
Vasquez Espinoza, Ners Armando
Escobedo Cárdenas, Edwin Jonathan
Cárdenas Rondoño, Jonathan Bruce
Vasquez Espinoza, Ners Armando
Escobedo Cárdenas, Edwin Jonathan
author Cárdenas Rondoño, Jonathan Bruce
author_facet Cárdenas Rondoño, Jonathan Bruce
Vasquez Espinoza, Ners Armando
Escobedo Cárdenas, Edwin Jonathan
author_role author
author2 Vasquez Espinoza, Ners Armando
Escobedo Cárdenas, Edwin Jonathan
author2_role author
author
dc.subject.none.fl_str_mv object detection
deep learning
plastic waste
object detection model
underwater images
detección de objetos
aprendizaje profundo
residuos plásticos
modelos de detección de objetos
imágenes submarinas
topic object detection
deep learning
plastic waste
object detection model
underwater images
detección de objetos
aprendizaje profundo
residuos plásticos
modelos de detección de objetos
imágenes submarinas
description This study addresses the global issue of marine pollution, with a particular focus on plastic bag contamination, by leveraging real-time object detection techniques powered by deep learning algorithms. A detailed comparison was carried out between the YOLOv8, YOLO-NAS, and RT-DETR models to assess their effectiveness in detecting plastic waste in underwater environments. The methodology encompassed several key stages, including data preprocessing, model implementation, and training through transfer learning. Evaluation was conducted using a simulated video environment, followed by an in-depth comparison of the results. Performance assessment was based on critical metrics such as mean average precision (mAP), recall, and inference time. The YOLOv8 model achieved an mAP50 of 0.921 on the validation dataset, along with a recall of 0.829 and an inference time of 14.1 milliseconds. The YOLO-NAS model, by contrast, reached an mAP50 of 0.813, a higher recall of 0.903, and an inference time of 17.8 milliseconds. The RT-DETR model obtained an mAP50 of 0.887, a recall of 0.819, and an inference time of 15.9 milliseconds. Notably, despite not having the highest mAP, the RT-DETR model demonstrated superior detection performance when deployed in real-world underwater conditions, highlighting its robustness and potential for practical environmental monitoring.
publishDate 2025
dc.date.none.fl_str_mv 2025-07-31
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868
10.26439/interfases2025.n021.7868
url https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868
identifier_str_mv 10.26439/interfases2025.n021.7868
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7820
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7821
dc.rights.none.fl_str_mv Copyright (c) 2025 I
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Copyright (c) 2025 I
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/html
dc.publisher.none.fl_str_mv Universidad de Lima
publisher.none.fl_str_mv Universidad de Lima
dc.source.none.fl_str_mv Interfases; No. 021 (2025); 81-100
Interfases; Núm. 021 (2025); 81-100
Interfases; n. 021 (2025); 81-100
1993-4912
10.26439/interfases2025.n021
reponame:Revistas - Universidad de Lima
instname:Universidad de Lima
instacron:ULIMA
instname_str Universidad de Lima
instacron_str ULIMA
institution ULIMA
reponame_str Revistas - Universidad de Lima
collection Revistas - Universidad de Lima
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1846791802588233728
spelling Underwater Plastic Waste Detection with YOLO and Vision Transformer ModelsDetección de residuos plásticos submarinos con modelos YOLO y Vision TransformerCárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners ArmandoEscobedo Cárdenas, Edwin JonathanCárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners ArmandoEscobedo Cárdenas, Edwin JonathanCárdenas Rondoño, Jonathan Bruce Vasquez Espinoza, Ners ArmandoEscobedo Cárdenas, Edwin Jonathanobject detectiondeep learningplastic wasteobject detection modelunderwater imagesdetección de objetosaprendizaje profundoresiduos plásticosmodelos de detección de objetosimágenes submarinasThis study addresses the global issue of marine pollution, with a particular focus on plastic bag contamination, by leveraging real-time object detection techniques powered by deep learning algorithms. A detailed comparison was carried out between the YOLOv8, YOLO-NAS, and RT-DETR models to assess their effectiveness in detecting plastic waste in underwater environments. The methodology encompassed several key stages, including data preprocessing, model implementation, and training through transfer learning. Evaluation was conducted using a simulated video environment, followed by an in-depth comparison of the results. Performance assessment was based on critical metrics such as mean average precision (mAP), recall, and inference time. The YOLOv8 model achieved an mAP50 of 0.921 on the validation dataset, along with a recall of 0.829 and an inference time of 14.1 milliseconds. The YOLO-NAS model, by contrast, reached an mAP50 of 0.813, a higher recall of 0.903, and an inference time of 17.8 milliseconds. The RT-DETR model obtained an mAP50 of 0.887, a recall of 0.819, and an inference time of 15.9 milliseconds. Notably, despite not having the highest mAP, the RT-DETR model demonstrated superior detection performance when deployed in real-world underwater conditions, highlighting its robustness and potential for practical environmental monitoring.Este estudio aborda el problema global de la contaminación marina, con un enfoque particular en la contaminación por bolsas de plástico, aprovechando técnicas de detección de objetos en tiempo real impulsadas por algoritmos de aprendizaje profundo. Se realizó una comparación detallada entre los modelos YOLO v8, YOLO-NAS y RT-DETR para evaluar su efectividad en la detección de desechos plásticos en entornos submarinos. La metodología abarcó varias etapas clave, incluyendo el preprocesamiento de datos, la implementación del modelo y el entrenamiento utilizando aprendizaje por transferencia. La evaluación se llevó a cabo a través de un entorno de video simulado, seguido de una comparación exhaustiva de los resultados. La evaluación del rendimiento se basó en métricas críticas como la precisión promedio (mAP), el recall y el tiempo de inferencia. El modelo YOLO v8 alcanzó un mAP50 de 0,921 en el conjunto de validación, con un recall de 0,829 y un tiempo de inferencia de 14,1 milisegundos. El modelo YOLONAS, en contraste, alcanzó un mAP50 de 0,813, un recall más alto de 0,903 y un tiempo de inferencia de 17,8 milisegundos. El modelo RT-DETR obtuvo un mAP de 0,887, un recall de 0,819 y un tiempo de inferencia de 15,9 milisegundos. Notablemente, a pesar de no tener el mAP más alto, el modelo RT-DETR demostró un rendimiento superior en la detección cuando se implementó en condiciones submarinas reales, destacando su robustez y potencial para aplicaciones prácticas de monitoreo ambiental.Universidad de Lima2025-07-31info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/htmlhttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/786810.26439/interfases2025.n021.7868Interfases; No. 021 (2025); 81-100Interfases; Núm. 021 (2025); 81-100Interfases; n. 021 (2025); 81-1001993-491210.26439/interfases2025.n021reponame:Revistas - Universidad de Limainstname:Universidad de Limainstacron:ULIMAenghttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7820https://revistas.ulima.edu.pe/index.php/Interfases/article/view/7868/7821Copyright (c) 2025 Iinfo:eu-repo/semantics/openAccessoai:ojs.pkp.sfu.ca:article/78682025-07-31T18:19:43Z
score 13.945474
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).