Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio

Descripción del Articulo

Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles...

Descripción completa

Detalles Bibliográficos
Autor: Mauricio Salazar, Josue Angel
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/18485
Enlace del recurso:https://hdl.handle.net/20.500.12672/18485
Nivel de acceso:acceso abierto
Materia:Procesamiento de lenguaje natural (Computación)
Redes neuronales (Computación)
Emociones
https://purl.org/pe-repo/ocde/ford#1.02.01
id UNMS_fe03b025efe5a1c141c1cdc5caa96da7
oai_identifier_str oai:cybertesis.unmsm.edu.pe:20.500.12672/18485
network_acronym_str UNMS
network_name_str UNMSM-Tesis
repository_id_str 410
dc.title.es_PE.fl_str_mv Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
title Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
spellingShingle Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
Mauricio Salazar, Josue Angel
Procesamiento de lenguaje natural (Computación)
Redes neuronales (Computación)
Emociones
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
title_full Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
title_fullStr Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
title_full_unstemmed Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
title_sort Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
author Mauricio Salazar, Josue Angel
author_facet Mauricio Salazar, Josue Angel
author_role author
dc.contributor.advisor.fl_str_mv Pérez Núñez, Jhelly Reynaluz
dc.contributor.author.fl_str_mv Mauricio Salazar, Josue Angel
dc.subject.es_PE.fl_str_mv Procesamiento de lenguaje natural (Computación)
Redes neuronales (Computación)
Emociones
topic Procesamiento de lenguaje natural (Computación)
Redes neuronales (Computación)
Emociones
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
description Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles de estos mensajes contienen odio y cuáles no. Primero, se hará un repaso de un modelo de representación vectorial para texto, llamado word embeddings, generados mediante el uso del algoritmo Word2Vec, se mostrará adetalle el mecanismo y resultados del mismo. Posteriormente, se construirá un modelo de clasificación binaria, el cual está compuesto por una arquitectura de redes neuronales recurrentes con unidades Long Short-Term Memory (LSTM) bidireccional, entrenado con los embeddings generados por el algoritmo Word2Vec, se explicará el uso de los parámetros utilizados en la configuración inicial del modelo. Se mostrarán los resultados, haciendo uso de métricas de evaluación de nuestro modelo y por último, las respectivas conclusiones de nuestro estudio.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2022-09-12T04:18:48Z
dc.date.available.none.fl_str_mv 2022-09-12T04:18:48Z
dc.date.issued.fl_str_mv 2021
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.citation.es_PE.fl_str_mv Mauricio, J. (2021). Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12672/18485
identifier_str_mv Mauricio, J. (2021). Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.
url https://hdl.handle.net/20.500.12672/18485
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional Mayor de San Marcos
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional Mayor de San Marcos
Repositorio de Tesis - UNMSM
dc.source.none.fl_str_mv reponame:UNMSM-Tesis
instname:Universidad Nacional Mayor de San Marcos
instacron:UNMSM
instname_str Universidad Nacional Mayor de San Marcos
instacron_str UNMSM
institution UNMSM
reponame_str UNMSM-Tesis
collection UNMSM-Tesis
bitstream.url.fl_str_mv https://cybertesis.unmsm.edu.pe/bitstreams/2be27298-7959-40f9-b7ec-6a67f092d197/download
https://cybertesis.unmsm.edu.pe/bitstreams/5e922c46-19bd-4058-a2d7-09503c1f21f0/download
https://cybertesis.unmsm.edu.pe/bitstreams/6fbc7310-10c8-4874-a8b8-afa645432df0/download
https://cybertesis.unmsm.edu.pe/bitstreams/cf0219be-39b1-4a29-9b34-6df58e7c5987/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
c5af2d9d778ecf026d4605a2bfca1b71
5ea0916aaf0d324a23d3c0b8001ddc68
b79151fef8902a0d62c5db19435c92d1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Cybertesis UNMSM
repository.mail.fl_str_mv cybertesis@unmsm.edu.pe
_version_ 1844716364197003264
spelling Pérez Núñez, Jhelly ReynaluzMauricio Salazar, Josue Angel2022-09-12T04:18:48Z2022-09-12T04:18:48Z2021Mauricio, J. (2021). Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/18485Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles de estos mensajes contienen odio y cuáles no. Primero, se hará un repaso de un modelo de representación vectorial para texto, llamado word embeddings, generados mediante el uso del algoritmo Word2Vec, se mostrará adetalle el mecanismo y resultados del mismo. Posteriormente, se construirá un modelo de clasificación binaria, el cual está compuesto por una arquitectura de redes neuronales recurrentes con unidades Long Short-Term Memory (LSTM) bidireccional, entrenado con los embeddings generados por el algoritmo Word2Vec, se explicará el uso de los parámetros utilizados en la configuración inicial del modelo. Se mostrarán los resultados, haciendo uso de métricas de evaluación de nuestro modelo y por último, las respectivas conclusiones de nuestro estudio.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMProcesamiento de lenguaje natural (Computación)Redes neuronales (Computación)Emocioneshttps://purl.org/pe-repo/ocde/ford#1.02.01Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odioinfo:eu-repo/semantics/bachelorThesisSUNEDULicenciado en Computación CientíficaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación CientíficaComputación Científica44076412https://orcid.org/0000-0003-0717-827775854603611026Zegarra Garay, María NatividadRuiz De La Cruz Melo, Carlos Augustohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis0920699408249640LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/2be27298-7959-40f9-b7ec-6a67f092d197/download8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALMauricio_sj.pdfMauricio_sj.pdfapplication/pdf1034383https://cybertesis.unmsm.edu.pe/bitstreams/5e922c46-19bd-4058-a2d7-09503c1f21f0/downloadc5af2d9d778ecf026d4605a2bfca1b71MD53TEXTMauricio_sj.pdf.txtMauricio_sj.pdf.txtExtracted texttext/plain83514https://cybertesis.unmsm.edu.pe/bitstreams/6fbc7310-10c8-4874-a8b8-afa645432df0/download5ea0916aaf0d324a23d3c0b8001ddc68MD54THUMBNAILMauricio_sj.pdf.jpgMauricio_sj.pdf.jpgGenerated Thumbnailimage/jpeg8793https://cybertesis.unmsm.edu.pe/bitstreams/cf0219be-39b1-4a29-9b34-6df58e7c5987/downloadb79151fef8902a0d62c5db19435c92d1MD5520.500.12672/18485oai:cybertesis.unmsm.edu.pe:20.500.12672/184852023-07-08 03:05:48.202https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.2911825
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).