Subtitulado automático de imágenes una aplicación de DEEP LEARNING

Descripción del Articulo

El subtitulado autónomo de imágenes (Image captioning) requiere aplicar las áreas de visión artificial y procesamiento de lenguaje, el tema ha sido abordado por diferentes investigadores en el mundo, sin embargo la mayor parte de ellos son realizados en inglés, debido principalmente a que las bases...

Descripción completa

Detalles Bibliográficos
Autor: Huanca Luque, Ademir Yuri
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Católica de Santa María
Repositorio:UCSM-Tesis
Lenguaje:español
OAI Identifier:oai:repositorio.ucsm.edu.pe:20.500.12920/11380
Enlace del recurso:https://repositorio.ucsm.edu.pe/handle/20.500.12920/11380
Nivel de acceso:acceso abierto
Materia:Subtitulado autonomo
https://purl.org/pe-repo/ocde/ford#2.02.02
id UCSM_07c73ee779f9fa8247ea497e78bf49e6
oai_identifier_str oai:repositorio.ucsm.edu.pe:20.500.12920/11380
network_acronym_str UCSM
network_name_str UCSM-Tesis
repository_id_str 4282
dc.title.es_ES.fl_str_mv Subtitulado automático de imágenes una aplicación de DEEP LEARNING
title Subtitulado automático de imágenes una aplicación de DEEP LEARNING
spellingShingle Subtitulado automático de imágenes una aplicación de DEEP LEARNING
Huanca Luque, Ademir Yuri
Subtitulado autonomo
https://purl.org/pe-repo/ocde/ford#2.02.02
title_short Subtitulado automático de imágenes una aplicación de DEEP LEARNING
title_full Subtitulado automático de imágenes una aplicación de DEEP LEARNING
title_fullStr Subtitulado automático de imágenes una aplicación de DEEP LEARNING
title_full_unstemmed Subtitulado automático de imágenes una aplicación de DEEP LEARNING
title_sort Subtitulado automático de imágenes una aplicación de DEEP LEARNING
author Huanca Luque, Ademir Yuri
author_facet Huanca Luque, Ademir Yuri
author_role author
dc.contributor.advisor.fl_str_mv Delgado Barra, Lucy Angela
dc.contributor.author.fl_str_mv Huanca Luque, Ademir Yuri
dc.subject.es_ES.fl_str_mv Subtitulado autonomo
topic Subtitulado autonomo
https://purl.org/pe-repo/ocde/ford#2.02.02
dc.subject.ocde.es_ES.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.02
description El subtitulado autónomo de imágenes (Image captioning) requiere aplicar las áreas de visión artificial y procesamiento de lenguaje, el tema ha sido abordado por diferentes investigadores en el mundo, sin embargo la mayor parte de ellos son realizados en inglés, debido principalmente a que las bases de datos y las publicaciones se realizan en este idioma, no por ello debe dejarse al mundo hispanoparlante sin participación en este avance computacional. Se han realizado pocos estudios que aborden el subtitulado entre idiomas, siendo los mas recurrentes entre el chino e inglés, sin embargo los antecedentes para el español son prácticamente nulos. En la presente tesis se aborda la investigación e implementación de un algoritmo basado en Deep Learning, utilizando CNNs y RNNs el cuál sea capaz de generar descripciones de las imágenes que le sean alimentadas. Para conquistar el objetivo de esta tesis se propone la utilización de transferencia de aprendizaje en la extracción de características, aplicación de codificador y decodificador para el modelado de lenguaje y mecanismo de atención que permite localizar elementos resaltantes de las imágenes. Como base de datos se utiliza MSCOCO de Microsoft. Las oraciones resultantes se evalúan con BLEU y METEOR, el rendimiento del algoritmo se evalúa de acuerdo a su score en diferentes configuraciones variando EPOCHs, BATCHs y tamaño de dataset, a su vez se construyó una interfaz de usuario que permite realizar predicciones individuales de imágenes elegidas por el usuario.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-12-24T19:45:51Z
dc.date.available.none.fl_str_mv 2021-12-24T19:45:51Z
dc.date.issued.fl_str_mv 2021-12-07
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.es_ES.fl_str_mv info:eu-repo/semantics/publishedVersion
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv https://repositorio.ucsm.edu.pe/handle/20.500.12920/11380
url https://repositorio.ucsm.edu.pe/handle/20.500.12920/11380
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_ES.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_ES.fl_str_mv application/pdf
dc.publisher.es_ES.fl_str_mv Universidad Católica de Santa María
dc.publisher.country.es_ES.fl_str_mv PE
dc.source.es_ES.fl_str_mv Universidad Católica de Santa María
Repositorio de la Universidad Católica de Santa María - UCSM
dc.source.none.fl_str_mv reponame:UCSM-Tesis
instname:Universidad Católica de Santa María
instacron:UCSM
instname_str Universidad Católica de Santa María
instacron_str UCSM
institution UCSM
reponame_str UCSM-Tesis
collection UCSM-Tesis
bitstream.url.fl_str_mv https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/1/74.0209.IE.pdf
https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/2/license.txt
https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/3/74.0209.IE.pdf.txt
https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/4/74.0209.IE.pdf.jpg
bitstream.checksum.fl_str_mv 1465e8ac58fa3e0e6bcc225bc7ee7309
8a4605be74aa9ea9d79846c1fba20a33
3247ba8493910fc265627aea1ffaa4b1
13ad34bad7f607c66c399a3776c5d39e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad Católica de Santa María
repository.mail.fl_str_mv repositorio.biblioteca@ucsm.edu.pe
_version_ 1855940989478240256
spelling Delgado Barra, Lucy AngelaHuanca Luque, Ademir Yuri2021-12-24T19:45:51Z2021-12-24T19:45:51Z2021-12-07https://repositorio.ucsm.edu.pe/handle/20.500.12920/11380El subtitulado autónomo de imágenes (Image captioning) requiere aplicar las áreas de visión artificial y procesamiento de lenguaje, el tema ha sido abordado por diferentes investigadores en el mundo, sin embargo la mayor parte de ellos son realizados en inglés, debido principalmente a que las bases de datos y las publicaciones se realizan en este idioma, no por ello debe dejarse al mundo hispanoparlante sin participación en este avance computacional. Se han realizado pocos estudios que aborden el subtitulado entre idiomas, siendo los mas recurrentes entre el chino e inglés, sin embargo los antecedentes para el español son prácticamente nulos. En la presente tesis se aborda la investigación e implementación de un algoritmo basado en Deep Learning, utilizando CNNs y RNNs el cuál sea capaz de generar descripciones de las imágenes que le sean alimentadas. Para conquistar el objetivo de esta tesis se propone la utilización de transferencia de aprendizaje en la extracción de características, aplicación de codificador y decodificador para el modelado de lenguaje y mecanismo de atención que permite localizar elementos resaltantes de las imágenes. Como base de datos se utiliza MSCOCO de Microsoft. Las oraciones resultantes se evalúan con BLEU y METEOR, el rendimiento del algoritmo se evalúa de acuerdo a su score en diferentes configuraciones variando EPOCHs, BATCHs y tamaño de dataset, a su vez se construyó una interfaz de usuario que permite realizar predicciones individuales de imágenes elegidas por el usuario.Tesisapplication/pdfspaUniversidad Católica de Santa MaríaPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Católica de Santa MaríaRepositorio de la Universidad Católica de Santa María - UCSMreponame:UCSM-Tesisinstname:Universidad Católica de Santa Maríainstacron:UCSMSubtitulado autonomohttps://purl.org/pe-repo/ocde/ford#2.02.02Subtitulado automático de imágenes una aplicación de DEEP LEARNINGinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionSUNEDUIngeniero Electrónico con especialidad en Automatización y ControlIngeniería ElectrónicaUniversidad Católica de Santa María.Facultad de Ciencias e Ingenierías Físicas y FormalesTítulo Profesional720404430000-0002-7422-454729278874https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#tituloProfesional712026Urrutia Espinoza, Mario WilliamRivera Chávez, Victor HugoMalaga Chavez, César EduardoORIGINAL74.0209.IE.pdf74.0209.IE.pdfapplication/pdf5233271https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/1/74.0209.IE.pdf1465e8ac58fa3e0e6bcc225bc7ee7309MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXT74.0209.IE.pdf.txt74.0209.IE.pdf.txtExtracted texttext/plain121617https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/3/74.0209.IE.pdf.txt3247ba8493910fc265627aea1ffaa4b1MD53THUMBNAIL74.0209.IE.pdf.jpg74.0209.IE.pdf.jpgGenerated Thumbnailimage/jpeg10176https://repositorio.ucsm.edu.pe/bitstream/20.500.12920/11380/4/74.0209.IE.pdf.jpg13ad34bad7f607c66c399a3776c5d39eMD5420.500.12920/11380oai:repositorio.ucsm.edu.pe:20.500.12920/113802023-02-07 12:21:39.992Repositorio Institucional de la Universidad Católica de Santa Maríarepositorio.biblioteca@ucsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.089828
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).