Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis

Descripción del Articulo

Pokémon Double Battles present a complex decision-making environment that has traditionally relied on manual data analysis. This paper introduces an automated system leveraging computer vision and deep learning to extract structured gameplay data from battle footage. Our approach integrates You Only...

Descripción completa

Detalles Bibliográficos
Autores: Lladó, Miguel R., Morley, Terence
Formato: artículo
Fecha de Publicación:2025
Institución:Universidad de Lima
Repositorio:Revistas - Universidad de Lima
Lenguaje:inglés
OAI Identifier:oai:ojs.pkp.sfu.ca:article/8270
Enlace del recurso:https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270
Nivel de acceso:acceso abierto
Materia:Computer Vision
Pokémon
YOLO
Tesseract
OCR
Visión por computadora
id REVULIMA_1bc15524c90a818fbccf56d72f9fc5fb
oai_identifier_str oai:ojs.pkp.sfu.ca:article/8270
network_acronym_str REVULIMA
network_name_str Revistas - Universidad de Lima
repository_id_str
spelling Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay AnalysisVisión por Computador para Batallas Pokémon: Un Sistema Basado en YOLO y Tesseract para el Reconocimiento Automatizado y el Análisis de JuegoLladó, Miguel R.Morley, TerenceLladó, Miguel R.Morley, TerenceLladó, Miguel R.Morley, TerenceComputer VisionPokémonYOLOTesseractOCRVisión por computadoraPokémonYOLOTesseractOCRPokémon Double Battles present a complex decision-making environment that has traditionally relied on manual data analysis. This paper introduces an automated system leveraging computer vision and deep learning to extract structured gameplay data from battle footage. Our approach integrates You Only Look Once (YOLO) for Pokémon sprite recognition along with Tesseract-based optical character recognition (OCR) for extracting move and status text. The study introduces a custom-built image dataset generated through the augmentation of publicly available Pokémon sprites, which is then used to train a YOLO model for sprite recognition. The system was tested across multiple controlled and real-world gameplay scenarios, achieving high accuracy in Pokémon recognition and action tracking. Additionally, a JSON-based gameplay notation system is proposed to structure battle sequences, thus improving analysis and strategic review. The results demonstrate the feasibility of AI-driven gameplay analysis, with potential applications for competitive players, game analysts, and developers. Given its exploratory nature, this study focuses on technical feasibility rather than statistical generalisation. Future work includes expanding the dataset, improving OCR performance, and enabling real-time processing to support broader practical use.Las batallas dobles de Pokémon presentan un entorno de toma de decisiones complejo que tradicionalmente ha dependido del análisis manual de datos. Este artículo presenta un sistema automatizado que aprovecha la visión por computadora y el aprendizaje profundo para extraer datos estructurados del metraje de batalla. Nuestro enfoque integra You Only Look Once (YOLO) para el reconocimiento de sprites de Pokémon y reconocimiento óptico de caracteres (OCR) con Tesseract para la extracción de movimientos y estados. El estudio presenta un conjunto de datos de imágenes personalizado, generado mediante la ampliación de sprites de Pokémon disponibles públicamente, y lo utiliza para entrenar un modelo YOLO para el reconocimiento de sprites. El sistema se probó en múltiples escenarios controlados y de juego real, logrando alta precisión en el reconocimiento y seguimiento de acciones. Además, se propone un sistema de notación basado en JSON para estructurar las secuencias de batalla, mejorando el análisis y la revisión estratégica. Los resultados demuestran la viabilidad del análisis de juego basado en IA, con aplicaciones potenciales para jugadores competitivos, analistas de videojuegos y desarrolladores. Dada su naturaleza exploratoria, este estudio se centra en la viabilidad técnica más que en la generalización estadística. Las mejoras futuras incluyen la expansión del conjunto de datos, la optimización del OCR y la integración de procesamiento en tiempo real para un uso más amplio.Universidad de Lima2025-12-19info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/htmlhttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/827010.26439/interfases2025.n022.8270Interfases; No. 022 (2025); 119-141Interfases; Núm. 022 (2025); 119-141Interfases; n. 022 (2025); 119-1411993-491210.26439/interfases2025.n022reponame:Revistas - Universidad de Limainstname:Universidad de Limainstacron:ULIMAenghttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8131https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8132https://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:ojs.pkp.sfu.ca:article/82702025-12-19T21:13:28Z
dc.title.none.fl_str_mv Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
Visión por Computador para Batallas Pokémon: Un Sistema Basado en YOLO y Tesseract para el Reconocimiento Automatizado y el Análisis de Juego
title Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
spellingShingle Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
Lladó, Miguel R.
Computer Vision
Pokémon
YOLO
Tesseract
OCR
Visión por computadora
Pokémon
YOLO
Tesseract
OCR
title_short Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
title_full Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
title_fullStr Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
title_full_unstemmed Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
title_sort Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
dc.creator.none.fl_str_mv Lladó, Miguel R.
Morley, Terence
Lladó, Miguel R.
Morley, Terence
Lladó, Miguel R.
Morley, Terence
author Lladó, Miguel R.
author_facet Lladó, Miguel R.
Morley, Terence
author_role author
author2 Morley, Terence
author2_role author
dc.subject.none.fl_str_mv Computer Vision
Pokémon
YOLO
Tesseract
OCR
Visión por computadora
Pokémon
YOLO
Tesseract
OCR
topic Computer Vision
Pokémon
YOLO
Tesseract
OCR
Visión por computadora
Pokémon
YOLO
Tesseract
OCR
description Pokémon Double Battles present a complex decision-making environment that has traditionally relied on manual data analysis. This paper introduces an automated system leveraging computer vision and deep learning to extract structured gameplay data from battle footage. Our approach integrates You Only Look Once (YOLO) for Pokémon sprite recognition along with Tesseract-based optical character recognition (OCR) for extracting move and status text. The study introduces a custom-built image dataset generated through the augmentation of publicly available Pokémon sprites, which is then used to train a YOLO model for sprite recognition. The system was tested across multiple controlled and real-world gameplay scenarios, achieving high accuracy in Pokémon recognition and action tracking. Additionally, a JSON-based gameplay notation system is proposed to structure battle sequences, thus improving analysis and strategic review. The results demonstrate the feasibility of AI-driven gameplay analysis, with potential applications for competitive players, game analysts, and developers. Given its exploratory nature, this study focuses on technical feasibility rather than statistical generalisation. Future work includes expanding the dataset, improving OCR performance, and enabling real-time processing to support broader practical use.
publishDate 2025
dc.date.none.fl_str_mv 2025-12-19
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270
10.26439/interfases2025.n022.8270
url https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270
identifier_str_mv 10.26439/interfases2025.n022.8270
dc.language.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8131
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8132
dc.rights.none.fl_str_mv https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/html
dc.publisher.none.fl_str_mv Universidad de Lima
publisher.none.fl_str_mv Universidad de Lima
dc.source.none.fl_str_mv Interfases; No. 022 (2025); 119-141
Interfases; Núm. 022 (2025); 119-141
Interfases; n. 022 (2025); 119-141
1993-4912
10.26439/interfases2025.n022
reponame:Revistas - Universidad de Lima
instname:Universidad de Lima
instacron:ULIMA
instname_str Universidad de Lima
instacron_str ULIMA
institution ULIMA
reponame_str Revistas - Universidad de Lima
collection Revistas - Universidad de Lima
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1852499437240188928
score 13.983277
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).