Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo

Descripción del Articulo

Desde que aparecieron las redes GAN, se han realizado varias investigaciones sobre cómo generar imágenes en diversos ámbitos, como la generación de imágenes, conversión de imágenes, síntesis de videos, síntesis de imágenes a partir de textos y predicción de cuadros de videos. Basándose mayormente en...

Descripción completa

Detalles Bibliográficos
Autor: Morales Pariona, Jose Ulises
Formato: tesis de maestría
Fecha de Publicación:2024
Institución:Pontificia Universidad Católica del Perú
Repositorio:PUCP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.pucp.edu.pe:20.500.14657/199592
Enlace del recurso:http://hdl.handle.net/20.500.12404/27570
Nivel de acceso:acceso abierto
Materia:Procesamiento de imágenes digitales
Procesamiento de datos
Aprendizaje profundo
https://purl.org/pe-repo/ocde/ford#1.02.00
id RPUC_34bf6ed4b497641ba94753a8fef0a515
oai_identifier_str oai:repositorio.pucp.edu.pe:20.500.14657/199592
network_acronym_str RPUC
network_name_str PUCP-Institucional
repository_id_str 2905
dc.title.es_ES.fl_str_mv Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
title Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
spellingShingle Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
Morales Pariona, Jose Ulises
Procesamiento de imágenes digitales
Procesamiento de datos
Aprendizaje profundo
https://purl.org/pe-repo/ocde/ford#1.02.00
title_short Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
title_full Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
title_fullStr Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
title_full_unstemmed Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
title_sort Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
author Morales Pariona, Jose Ulises
author_facet Morales Pariona, Jose Ulises
author_role author
dc.contributor.advisor.fl_str_mv Beltran Castañon, Cesar Armando
dc.contributor.author.fl_str_mv Morales Pariona, Jose Ulises
dc.subject.es_ES.fl_str_mv Procesamiento de imágenes digitales
Procesamiento de datos
Aprendizaje profundo
topic Procesamiento de imágenes digitales
Procesamiento de datos
Aprendizaje profundo
https://purl.org/pe-repo/ocde/ford#1.02.00
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.00
description Desde que aparecieron las redes GAN, se han realizado varias investigaciones sobre cómo generar imágenes en diversos ámbitos, como la generación de imágenes, conversión de imágenes, síntesis de videos, síntesis de imágenes a partir de textos y predicción de cuadros de videos. Basándose mayormente en mejorar la generación de imágenes de alta resolución y la reconstrucción o predicción de datos. El propósito de este trabajo es implementar las redes GAN en otros ámbitos, como la generación de imágenes de entidades realizando una acción. En este caso se consideró 3 acciones de personas, que son los ejercicios de Glúteo, Abdomen y Cardio. En primer lugar, se descargaron y procesaron las imágenes de YouTube, el cual incluye una secuencia de imágenes de cada acción. Posteriormente, se separó dos grupos de imágenes, de una sola persona, y de personas diferentes realizando las acciones. En segundo lugar, se seleccionó el modelo InfoGAN para la generación de imágenes, teniendo como evaluador de rendimiento, la Puntuación Inicial (PI). Obteniendo como resultados para el primer grupo, una puntuación máxima de 1.28 y en el segundo grupo, una puntuación máxima de 1.3. En conclusión, aunque no se obtuvo el puntaje máximo de 3 para este evaluador de rendimiento, debido a la cantidad y calidad de las imágenes. Se aprecia, que el modelo si logra diferenciar los 3 tipos de ejercicios, aunque existen casos donde se muestran incorrectamente las piernas, los brazos y la cabeza.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-04-16T20:32:04Z
dc.date.available.none.fl_str_mv 2024-04-16T20:32:04Z
dc.date.created.none.fl_str_mv 2024
dc.date.issued.fl_str_mv 2024-04-16
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12404/27570
url http://hdl.handle.net/20.500.12404/27570
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.none.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/pe/
dc.publisher.es_ES.fl_str_mv Pontificia Universidad Católica del Perú
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.none.fl_str_mv reponame:PUCP-Institucional
instname:Pontificia Universidad Católica del Perú
instacron:PUCP
instname_str Pontificia Universidad Católica del Perú
instacron_str PUCP
institution PUCP
reponame_str PUCP-Institucional
collection PUCP-Institucional
repository.name.fl_str_mv Repositorio Institucional de la PUCP
repository.mail.fl_str_mv repositorio@pucp.pe
_version_ 1835638753527332864
spelling Beltran Castañon, Cesar ArmandoMorales Pariona, Jose Ulises2024-04-16T20:32:04Z2024-04-16T20:32:04Z20242024-04-16http://hdl.handle.net/20.500.12404/27570Desde que aparecieron las redes GAN, se han realizado varias investigaciones sobre cómo generar imágenes en diversos ámbitos, como la generación de imágenes, conversión de imágenes, síntesis de videos, síntesis de imágenes a partir de textos y predicción de cuadros de videos. Basándose mayormente en mejorar la generación de imágenes de alta resolución y la reconstrucción o predicción de datos. El propósito de este trabajo es implementar las redes GAN en otros ámbitos, como la generación de imágenes de entidades realizando una acción. En este caso se consideró 3 acciones de personas, que son los ejercicios de Glúteo, Abdomen y Cardio. En primer lugar, se descargaron y procesaron las imágenes de YouTube, el cual incluye una secuencia de imágenes de cada acción. Posteriormente, se separó dos grupos de imágenes, de una sola persona, y de personas diferentes realizando las acciones. En segundo lugar, se seleccionó el modelo InfoGAN para la generación de imágenes, teniendo como evaluador de rendimiento, la Puntuación Inicial (PI). Obteniendo como resultados para el primer grupo, una puntuación máxima de 1.28 y en el segundo grupo, una puntuación máxima de 1.3. En conclusión, aunque no se obtuvo el puntaje máximo de 3 para este evaluador de rendimiento, debido a la cantidad y calidad de las imágenes. Se aprecia, que el modelo si logra diferenciar los 3 tipos de ejercicios, aunque existen casos donde se muestran incorrectamente las piernas, los brazos y la cabeza.Since the appearance of GAN networks, various investigations have been carried out on how to generate images in various fields, such as image generation, image conversion, video synthesis, image synthesis from text, and video frame prediction. Based mostly on improving the generation of high resolution images and the reconstruction or prediction of data. The purpose of this work is to implement GAN networks in other areas, such as the generation of images of entities performing an action. In this case, 3 actions of people were considered, which are the Gluteus, Abdomen and Cardio exercises. First, the images from YouTube were downloaded and processed, which includes a sequence of images of each action. Subsequently, two groups of images were separated, of a single person, and of different people performing the actions. Secondly, the InfoGAN model was selected for image generation, having the Initial Score (PI) as a performance evaluator. Obtaining as results for the first group, a maximum score of 1.28 and in the second group, a maximum score of 1.3. In conclusion, although the maximum score of 3 was not obtained for this performance tester, due to the quantity and quality of the images. It can be seen that the model is able to differentiate the 3 types of exercises, although there are cases where the legs, arms and head are shown incorrectly.spaPontificia Universidad Católica del PerúPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/Procesamiento de imágenes digitalesProcesamiento de datosAprendizaje profundohttps://purl.org/pe-repo/ocde/ford#1.02.00Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundoinfo:eu-repo/semantics/masterThesisreponame:PUCP-Institucionalinstname:Pontificia Universidad Católica del Perúinstacron:PUCPMaestro en Informática con mención en Ciencias de la ComputaciónMaestríaPontificia Universidad Católica del Perú. Escuela de Posgrado.Informática con mención en Ciencias de la Computación29561260https://orcid.org/0000-0002-0173-414046725998611087Olivares Poggi, Cesar AugustoBeltran Castañon, Cesar ArmandoAyma Quirita, Victor Andreshttps://purl.org/pe-repo/renati/level#maestrohttps://purl.org/pe-repo/renati/type#tesis20.500.14657/199592oai:repositorio.pucp.edu.pe:20.500.14657/1995922025-03-11 11:07:32.077http://creativecommons.org/licenses/by-nc-nd/2.5/pe/info:eu-repo/semantics/openAccessmetadata.onlyhttps://repositorio.pucp.edu.peRepositorio Institucional de la PUCPrepositorio@pucp.pe
score 13.905282
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).