Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis
Descripción del Articulo
Pokémon Double Battles present a complex decision-making environment that has traditionally relied on manual data analysis. This paper introduces an automated system leveraging computer vision and deep learning to extract structured gameplay data from battle footage. Our approach integrates You Only...
| Autores: | , |
|---|---|
| Formato: | artículo |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad de Lima |
| Repositorio: | Revistas - Universidad de Lima |
| Lenguaje: | inglés |
| OAI Identifier: | oai:ojs.pkp.sfu.ca:article/8270 |
| Enlace del recurso: | https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270 |
| Nivel de acceso: | acceso abierto |
| Materia: | Computer Vision Pokémon YOLO Tesseract OCR Visión por computadora |
| id |
REVULIMA_1bc15524c90a818fbccf56d72f9fc5fb |
|---|---|
| oai_identifier_str |
oai:ojs.pkp.sfu.ca:article/8270 |
| network_acronym_str |
REVULIMA |
| network_name_str |
Revistas - Universidad de Lima |
| repository_id_str |
|
| spelling |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay AnalysisVisión por Computador para Batallas Pokémon: Un Sistema Basado en YOLO y Tesseract para el Reconocimiento Automatizado y el Análisis de JuegoLladó, Miguel R.Morley, TerenceLladó, Miguel R.Morley, TerenceLladó, Miguel R.Morley, TerenceComputer VisionPokémonYOLOTesseractOCRVisión por computadoraPokémonYOLOTesseractOCRPokémon Double Battles present a complex decision-making environment that has traditionally relied on manual data analysis. This paper introduces an automated system leveraging computer vision and deep learning to extract structured gameplay data from battle footage. Our approach integrates You Only Look Once (YOLO) for Pokémon sprite recognition along with Tesseract-based optical character recognition (OCR) for extracting move and status text. The study introduces a custom-built image dataset generated through the augmentation of publicly available Pokémon sprites, which is then used to train a YOLO model for sprite recognition. The system was tested across multiple controlled and real-world gameplay scenarios, achieving high accuracy in Pokémon recognition and action tracking. Additionally, a JSON-based gameplay notation system is proposed to structure battle sequences, thus improving analysis and strategic review. The results demonstrate the feasibility of AI-driven gameplay analysis, with potential applications for competitive players, game analysts, and developers. Given its exploratory nature, this study focuses on technical feasibility rather than statistical generalisation. Future work includes expanding the dataset, improving OCR performance, and enabling real-time processing to support broader practical use.Las batallas dobles de Pokémon presentan un entorno de toma de decisiones complejo que tradicionalmente ha dependido del análisis manual de datos. Este artículo presenta un sistema automatizado que aprovecha la visión por computadora y el aprendizaje profundo para extraer datos estructurados del metraje de batalla. Nuestro enfoque integra You Only Look Once (YOLO) para el reconocimiento de sprites de Pokémon y reconocimiento óptico de caracteres (OCR) con Tesseract para la extracción de movimientos y estados. El estudio presenta un conjunto de datos de imágenes personalizado, generado mediante la ampliación de sprites de Pokémon disponibles públicamente, y lo utiliza para entrenar un modelo YOLO para el reconocimiento de sprites. El sistema se probó en múltiples escenarios controlados y de juego real, logrando alta precisión en el reconocimiento y seguimiento de acciones. Además, se propone un sistema de notación basado en JSON para estructurar las secuencias de batalla, mejorando el análisis y la revisión estratégica. Los resultados demuestran la viabilidad del análisis de juego basado en IA, con aplicaciones potenciales para jugadores competitivos, analistas de videojuegos y desarrolladores. Dada su naturaleza exploratoria, este estudio se centra en la viabilidad técnica más que en la generalización estadística. Las mejoras futuras incluyen la expansión del conjunto de datos, la optimización del OCR y la integración de procesamiento en tiempo real para un uso más amplio.Universidad de Lima2025-12-19info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdftext/htmlhttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/827010.26439/interfases2025.n022.8270Interfases; No. 022 (2025); 119-141Interfases; Núm. 022 (2025); 119-141Interfases; n. 022 (2025); 119-1411993-491210.26439/interfases2025.n022reponame:Revistas - Universidad de Limainstname:Universidad de Limainstacron:ULIMAenghttps://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8131https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8132https://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:ojs.pkp.sfu.ca:article/82702025-12-19T21:13:28Z |
| dc.title.none.fl_str_mv |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis Visión por Computador para Batallas Pokémon: Un Sistema Basado en YOLO y Tesseract para el Reconocimiento Automatizado y el Análisis de Juego |
| title |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis |
| spellingShingle |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis Lladó, Miguel R. Computer Vision Pokémon YOLO Tesseract OCR Visión por computadora Pokémon YOLO Tesseract OCR |
| title_short |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis |
| title_full |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis |
| title_fullStr |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis |
| title_full_unstemmed |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis |
| title_sort |
Computer vision for Pokémon Battles: A YOLO and Tesseract-Based System for Automated Recognition and Gameplay Analysis |
| dc.creator.none.fl_str_mv |
Lladó, Miguel R. Morley, Terence Lladó, Miguel R. Morley, Terence Lladó, Miguel R. Morley, Terence |
| author |
Lladó, Miguel R. |
| author_facet |
Lladó, Miguel R. Morley, Terence |
| author_role |
author |
| author2 |
Morley, Terence |
| author2_role |
author |
| dc.subject.none.fl_str_mv |
Computer Vision Pokémon YOLO Tesseract OCR Visión por computadora Pokémon YOLO Tesseract OCR |
| topic |
Computer Vision Pokémon YOLO Tesseract OCR Visión por computadora Pokémon YOLO Tesseract OCR |
| description |
Pokémon Double Battles present a complex decision-making environment that has traditionally relied on manual data analysis. This paper introduces an automated system leveraging computer vision and deep learning to extract structured gameplay data from battle footage. Our approach integrates You Only Look Once (YOLO) for Pokémon sprite recognition along with Tesseract-based optical character recognition (OCR) for extracting move and status text. The study introduces a custom-built image dataset generated through the augmentation of publicly available Pokémon sprites, which is then used to train a YOLO model for sprite recognition. The system was tested across multiple controlled and real-world gameplay scenarios, achieving high accuracy in Pokémon recognition and action tracking. Additionally, a JSON-based gameplay notation system is proposed to structure battle sequences, thus improving analysis and strategic review. The results demonstrate the feasibility of AI-driven gameplay analysis, with potential applications for competitive players, game analysts, and developers. Given its exploratory nature, this study focuses on technical feasibility rather than statistical generalisation. Future work includes expanding the dataset, improving OCR performance, and enabling real-time processing to support broader practical use. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-12-19 |
| dc.type.none.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
| format |
article |
| status_str |
publishedVersion |
| dc.identifier.none.fl_str_mv |
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270 10.26439/interfases2025.n022.8270 |
| url |
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270 |
| identifier_str_mv |
10.26439/interfases2025.n022.8270 |
| dc.language.none.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8131 https://revistas.ulima.edu.pe/index.php/Interfases/article/view/8270/8132 |
| dc.rights.none.fl_str_mv |
https://creativecommons.org/licenses/by/4.0 info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0 |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf text/html |
| dc.publisher.none.fl_str_mv |
Universidad de Lima |
| publisher.none.fl_str_mv |
Universidad de Lima |
| dc.source.none.fl_str_mv |
Interfases; No. 022 (2025); 119-141 Interfases; Núm. 022 (2025); 119-141 Interfases; n. 022 (2025); 119-141 1993-4912 10.26439/interfases2025.n022 reponame:Revistas - Universidad de Lima instname:Universidad de Lima instacron:ULIMA |
| instname_str |
Universidad de Lima |
| instacron_str |
ULIMA |
| institution |
ULIMA |
| reponame_str |
Revistas - Universidad de Lima |
| collection |
Revistas - Universidad de Lima |
| repository.name.fl_str_mv |
|
| repository.mail.fl_str_mv |
|
| _version_ |
1852499437240188928 |
| score |
13.983277 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).