Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español
Descripción del Articulo
En la actualidad, los avances en las técnicas de Inteligencia Artificial (IA) para la síntesis y generación de imágenes a partir de texto han experimentado un crecimiento y desarrollo constantes. Un caso especifico es la síntesis texto a cara mediante Redes Generativas Antagónicas (GANs), que consiste...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2023 |
Institución: | Universidad Nacional de Ingeniería |
Repositorio: | UNI-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:cybertesis.uni.edu.pe:20.500.14076/26927 |
Enlace del recurso: | http://hdl.handle.net/20.500.14076/26927 |
Nivel de acceso: | acceso abierto |
Materia: | Redes generativas Procesamiento del lenguaje natural (Informática) https://purl.org/pe-repo/ocde/ford#1.02.01 |
id |
UUNI_92ed1274c9d1ff17f91ceed10c45cf99 |
---|---|
oai_identifier_str |
oai:cybertesis.uni.edu.pe:20.500.14076/26927 |
network_acronym_str |
UUNI |
network_name_str |
UNI-Tesis |
repository_id_str |
1534 |
dc.title.es.fl_str_mv |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
title |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
spellingShingle |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español Yauri Lozano, Eduardo Redes generativas Procesamiento del lenguaje natural (Informática) https://purl.org/pe-repo/ocde/ford#1.02.01 |
title_short |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
title_full |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
title_fullStr |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
title_full_unstemmed |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
title_sort |
Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma español |
dc.creator.none.fl_str_mv |
Yauri Lozano, Eduardo |
author |
Yauri Lozano, Eduardo |
author_facet |
Yauri Lozano, Eduardo |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Castillo Cara, José Manuel |
dc.contributor.author.fl_str_mv |
Yauri Lozano, Eduardo |
dc.subject.es.fl_str_mv |
Redes generativas Procesamiento del lenguaje natural (Informática) |
topic |
Redes generativas Procesamiento del lenguaje natural (Informática) https://purl.org/pe-repo/ocde/ford#1.02.01 |
dc.subject.ocde.es.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
description |
En la actualidad, los avances en las técnicas de Inteligencia Artificial (IA) para la síntesis y generación de imágenes a partir de texto han experimentado un crecimiento y desarrollo constantes. Un caso especifico es la síntesis texto a cara mediante Redes Generativas Antagónicas (GANs), que consiste en generar una imagen facial a partir de una descripción textual de características físicas. Siguiendo este enfoque, las investigaciones se han centrado en dos áreas principales, en Procesamiento del Lenguaje Natural (PLN) codificadores para la síntesis texto-cara, y en visión por computador, GANs para la generación texto-cara. Sin embargo, la mayoría de los codificadores se han desarrollado para el idioma inglés. En este contexto, este trabajo presenta un primer estudio de tres codificadores texto-cara diferentes, el modelo preentrenado RoBERTa, y los modelos Sent2Vec y RoBERTa, entrenados con un corpus descriptivo en español del conjunto de datos CelebA. Además, se presenta un modelo personalizado de Redes Generativas Antagónicas Convolucionales Profundas condicionadas (cDCGANs) entrenado con el conjunto de datos CelebA para la síntesis texto-cara en español. Para la validación de los resultados obtenidos, se realiza una evaluación cualitativa con un análisis visual y una evaluación cuantitativa basada en las métricas IS, FID y LPIPS. Nuestra investigación muestra resultados prometedores con respecto a la literatura mejorando las métricas numéricas de FID en un 5 % y LPIPS en un 37 %. Además, esta misma investigación también muestra, a través de una comparación cuantitativa-cualitativa de las épocas de entrenamiento de cDCGAN, que la métrica IS no es una métrica objetiva adecuada para ser considerada en la evaluación de trabajos similares. El generador implementado puede ser usado como una herramienta valiosa para la elaboración del retrato hablado de una persona y tiene múltiples áreas de aplicación. Siendo una de los principales el ámbito Policial. Dado que para la identificación de criminales es necesario realizar bocetos de dichas personas. |
publishDate |
2023 |
dc.date.accessioned.none.fl_str_mv |
2024-02-28T21:23:45Z |
dc.date.available.none.fl_str_mv |
2024-02-28T21:23:45Z |
dc.date.issued.fl_str_mv |
2023 |
dc.type.es.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.14076/26927 |
url |
http://hdl.handle.net/20.500.14076/26927 |
dc.language.iso.es.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.es.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.format.es.fl_str_mv |
application/pdf |
dc.publisher.es.fl_str_mv |
Universidad Nacional de Ingeniería |
dc.publisher.country.es.fl_str_mv |
PE |
dc.source.es.fl_str_mv |
Universidad Nacional de Ingeniería Repositorio Institucional - UNI |
dc.source.none.fl_str_mv |
reponame:UNI-Tesis instname:Universidad Nacional de Ingeniería instacron:UNI |
instname_str |
Universidad Nacional de Ingeniería |
instacron_str |
UNI |
institution |
UNI |
reponame_str |
UNI-Tesis |
collection |
UNI-Tesis |
bitstream.url.fl_str_mv |
http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/5/yauri_le.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/6/informe_de_similitud.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/7/yauri_le%28acta%29.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/9/carta_de_autorizaci%c3%b3n.pdf.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/4/license.txt http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/1/yauri_le.pdf http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/2/informe_de_similitud.pdf http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/3/yauri_le%28acta%29.pdf http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/8/carta_de_autorizaci%c3%b3n.pdf |
bitstream.checksum.fl_str_mv |
0e9c66bca055bdabe3367f1beb1c1b92 e1c06d85ae7b8b032bef47e42e4c08f9 68b329da9893e34099c7d8ad5cb9c940 73903e98d26931f043ae1111669db71c 8a4605be74aa9ea9d79846c1fba20a33 a101c1f8f99394a9144f0db0947b28cd 8f2de9c7c2525414ee045188fa88e51c 86ea471264b21dfcef5baf590bde3037 931d4675ddace30c1dfe7ab26ce39eb6 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Institucional - UNI |
repository.mail.fl_str_mv |
repositorio@uni.edu.pe |
_version_ |
1842622166438248448 |
spelling |
Castillo Cara, José ManuelYauri Lozano, EduardoYauri Lozano, Eduardo2024-02-28T21:23:45Z2024-02-28T21:23:45Z2023http://hdl.handle.net/20.500.14076/26927En la actualidad, los avances en las técnicas de Inteligencia Artificial (IA) para la síntesis y generación de imágenes a partir de texto han experimentado un crecimiento y desarrollo constantes. Un caso especifico es la síntesis texto a cara mediante Redes Generativas Antagónicas (GANs), que consiste en generar una imagen facial a partir de una descripción textual de características físicas. Siguiendo este enfoque, las investigaciones se han centrado en dos áreas principales, en Procesamiento del Lenguaje Natural (PLN) codificadores para la síntesis texto-cara, y en visión por computador, GANs para la generación texto-cara. Sin embargo, la mayoría de los codificadores se han desarrollado para el idioma inglés. En este contexto, este trabajo presenta un primer estudio de tres codificadores texto-cara diferentes, el modelo preentrenado RoBERTa, y los modelos Sent2Vec y RoBERTa, entrenados con un corpus descriptivo en español del conjunto de datos CelebA. Además, se presenta un modelo personalizado de Redes Generativas Antagónicas Convolucionales Profundas condicionadas (cDCGANs) entrenado con el conjunto de datos CelebA para la síntesis texto-cara en español. Para la validación de los resultados obtenidos, se realiza una evaluación cualitativa con un análisis visual y una evaluación cuantitativa basada en las métricas IS, FID y LPIPS. Nuestra investigación muestra resultados prometedores con respecto a la literatura mejorando las métricas numéricas de FID en un 5 % y LPIPS en un 37 %. Además, esta misma investigación también muestra, a través de una comparación cuantitativa-cualitativa de las épocas de entrenamiento de cDCGAN, que la métrica IS no es una métrica objetiva adecuada para ser considerada en la evaluación de trabajos similares. El generador implementado puede ser usado como una herramienta valiosa para la elaboración del retrato hablado de una persona y tiene múltiples áreas de aplicación. Siendo una de los principales el ámbito Policial. Dado que para la identificación de criminales es necesario realizar bocetos de dichas personas.Submitted by Quispe Rabanal Flavio (flaviofime@hotmail.com) on 2024-02-28T21:23:45Z No. of bitstreams: 3 yauri_le.pdf: 2973371 bytes, checksum: a101c1f8f99394a9144f0db0947b28cd (MD5) informe_de_similitud.pdf: 686683 bytes, checksum: 8f2de9c7c2525414ee045188fa88e51c (MD5) yauri_le(acta).pdf: 466878 bytes, checksum: 86ea471264b21dfcef5baf590bde3037 (MD5)Made available in DSpace on 2024-02-28T21:23:45Z (GMT). No. of bitstreams: 3 yauri_le.pdf: 2973371 bytes, checksum: a101c1f8f99394a9144f0db0947b28cd (MD5) informe_de_similitud.pdf: 686683 bytes, checksum: 8f2de9c7c2525414ee045188fa88e51c (MD5) yauri_le(acta).pdf: 466878 bytes, checksum: 86ea471264b21dfcef5baf590bde3037 (MD5) Previous issue date: 2023Tesisapplication/pdfspaUniversidad Nacional de IngenieríaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de IngenieríaRepositorio Institucional - UNIreponame:UNI-Tesisinstname:Universidad Nacional de Ingenieríainstacron:UNIRedes generativasProcesamiento del lenguaje natural (Informática)https://purl.org/pe-repo/ocde/ford#1.02.01Redes generativas antagónicas para la síntesis y generación de texto imagen: Un análisis cuantitativo y cualitativo de codificadores de procesamiento de lenguaje natural para el idioma españolinfo:eu-repo/semantics/masterThesisSUNEDUMaestro en Ciencias en Ciencia de la Computación con Mención en Especialidad Computación CienctíficaUniversidad Nacional de Ingeniería. Facultad de Ciencias. Unidad de PosgradoMaestríaMaestría en Ciencias en Ciencia de la Computación con Mención en Especialidad Computación CienctíficaMaestríahttps://orcid.org/0000-0002-2990-709000096779671004497https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/level#maestro611047Solano Salinas, Carlos JavierOchoa Jiménez, RosendoBeltrán Castañón, Cesar ArmandoRosales Huamaní, Jimmy AurelioTEXTyauri_le.pdf.txtyauri_le.pdf.txtExtracted texttext/plain182293http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/5/yauri_le.pdf.txt0e9c66bca055bdabe3367f1beb1c1b92MD55informe_de_similitud.pdf.txtinforme_de_similitud.pdf.txtExtracted texttext/plain2http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/6/informe_de_similitud.pdf.txte1c06d85ae7b8b032bef47e42e4c08f9MD56yauri_le(acta).pdf.txtyauri_le(acta).pdf.txtExtracted texttext/plain1http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/7/yauri_le%28acta%29.pdf.txt68b329da9893e34099c7d8ad5cb9c940MD57carta_de_autorización.pdf.txtcarta_de_autorización.pdf.txtExtracted texttext/plain2613http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/9/carta_de_autorizaci%c3%b3n.pdf.txt73903e98d26931f043ae1111669db71cMD59LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54ORIGINALyauri_le.pdfyauri_le.pdfapplication/pdf2973371http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/1/yauri_le.pdfa101c1f8f99394a9144f0db0947b28cdMD51informe_de_similitud.pdfinforme_de_similitud.pdfapplication/pdf686683http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/2/informe_de_similitud.pdf8f2de9c7c2525414ee045188fa88e51cMD52yauri_le(acta).pdfyauri_le(acta).pdfapplication/pdf466878http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/3/yauri_le%28acta%29.pdf86ea471264b21dfcef5baf590bde3037MD53carta_de_autorización.pdfcarta_de_autorización.pdfapplication/pdf226025http://cybertesis.uni.edu.pe/bitstream/20.500.14076/26927/8/carta_de_autorizaci%c3%b3n.pdf931d4675ddace30c1dfe7ab26ce39eb6MD5820.500.14076/26927oai:cybertesis.uni.edu.pe:20.500.14076/269272025-08-26 19:09:28.511Repositorio Institucional - UNIrepositorio@uni.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.361153 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).