Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio
Descripción del Articulo
Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2021 |
Institución: | Universidad Nacional Mayor de San Marcos |
Repositorio: | UNMSM-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/18485 |
Enlace del recurso: | https://hdl.handle.net/20.500.12672/18485 |
Nivel de acceso: | acceso abierto |
Materia: | Procesamiento de lenguaje natural (Computación) Redes neuronales (Computación) Emociones https://purl.org/pe-repo/ocde/ford#1.02.01 |
id |
UNMS_fe03b025efe5a1c141c1cdc5caa96da7 |
---|---|
oai_identifier_str |
oai:cybertesis.unmsm.edu.pe:20.500.12672/18485 |
network_acronym_str |
UNMS |
network_name_str |
UNMSM-Tesis |
repository_id_str |
410 |
dc.title.es_PE.fl_str_mv |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
title |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
spellingShingle |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio Mauricio Salazar, Josue Angel Procesamiento de lenguaje natural (Computación) Redes neuronales (Computación) Emociones https://purl.org/pe-repo/ocde/ford#1.02.01 |
title_short |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
title_full |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
title_fullStr |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
title_full_unstemmed |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
title_sort |
Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio |
author |
Mauricio Salazar, Josue Angel |
author_facet |
Mauricio Salazar, Josue Angel |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Pérez Núñez, Jhelly Reynaluz |
dc.contributor.author.fl_str_mv |
Mauricio Salazar, Josue Angel |
dc.subject.es_PE.fl_str_mv |
Procesamiento de lenguaje natural (Computación) Redes neuronales (Computación) Emociones |
topic |
Procesamiento de lenguaje natural (Computación) Redes neuronales (Computación) Emociones https://purl.org/pe-repo/ocde/ford#1.02.01 |
dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.01 |
description |
Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles de estos mensajes contienen odio y cuáles no. Primero, se hará un repaso de un modelo de representación vectorial para texto, llamado word embeddings, generados mediante el uso del algoritmo Word2Vec, se mostrará adetalle el mecanismo y resultados del mismo. Posteriormente, se construirá un modelo de clasificación binaria, el cual está compuesto por una arquitectura de redes neuronales recurrentes con unidades Long Short-Term Memory (LSTM) bidireccional, entrenado con los embeddings generados por el algoritmo Word2Vec, se explicará el uso de los parámetros utilizados en la configuración inicial del modelo. Se mostrarán los resultados, haciendo uso de métricas de evaluación de nuestro modelo y por último, las respectivas conclusiones de nuestro estudio. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2022-09-12T04:18:48Z |
dc.date.available.none.fl_str_mv |
2022-09-12T04:18:48Z |
dc.date.issued.fl_str_mv |
2021 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
dc.identifier.citation.es_PE.fl_str_mv |
Mauricio, J. (2021). Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. |
dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12672/18485 |
identifier_str_mv |
Mauricio, J. (2021). Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM. |
url |
https://hdl.handle.net/20.500.12672/18485 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-sa/4.0/ |
dc.format.es_PE.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad Nacional Mayor de San Marcos |
dc.publisher.country.es_PE.fl_str_mv |
PE |
dc.source.es_PE.fl_str_mv |
Universidad Nacional Mayor de San Marcos Repositorio de Tesis - UNMSM |
dc.source.none.fl_str_mv |
reponame:UNMSM-Tesis instname:Universidad Nacional Mayor de San Marcos instacron:UNMSM |
instname_str |
Universidad Nacional Mayor de San Marcos |
instacron_str |
UNMSM |
institution |
UNMSM |
reponame_str |
UNMSM-Tesis |
collection |
UNMSM-Tesis |
bitstream.url.fl_str_mv |
https://cybertesis.unmsm.edu.pe/bitstreams/2be27298-7959-40f9-b7ec-6a67f092d197/download https://cybertesis.unmsm.edu.pe/bitstreams/5e922c46-19bd-4058-a2d7-09503c1f21f0/download https://cybertesis.unmsm.edu.pe/bitstreams/6fbc7310-10c8-4874-a8b8-afa645432df0/download https://cybertesis.unmsm.edu.pe/bitstreams/cf0219be-39b1-4a29-9b34-6df58e7c5987/download |
bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 c5af2d9d778ecf026d4605a2bfca1b71 5ea0916aaf0d324a23d3c0b8001ddc68 b79151fef8902a0d62c5db19435c92d1 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Cybertesis UNMSM |
repository.mail.fl_str_mv |
cybertesis@unmsm.edu.pe |
_version_ |
1844716364197003264 |
spelling |
Pérez Núñez, Jhelly ReynaluzMauricio Salazar, Josue Angel2022-09-12T04:18:48Z2022-09-12T04:18:48Z2021Mauricio, J. (2021). Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odio. [Tesis de pregrado, Universidad Nacional Mayor de San Marcos, Facultad de Ciencias Matemáticas, Escuela Profesional de Computación Científica]. Repositorio institucional Cybertesis UNMSM.https://hdl.handle.net/20.500.12672/18485Desarrolla de dos casos de estudio del Procesamiento de Lenguaje Natural usados en conjunto para poder generar un modelo de análisis de sentimientos, utilizando como fuente de datos tweets organizados en una tabla con 6000 datos etiquetados. Se buscará construir un modelo que pueda clasificar cuáles de estos mensajes contienen odio y cuáles no. Primero, se hará un repaso de un modelo de representación vectorial para texto, llamado word embeddings, generados mediante el uso del algoritmo Word2Vec, se mostrará adetalle el mecanismo y resultados del mismo. Posteriormente, se construirá un modelo de clasificación binaria, el cual está compuesto por una arquitectura de redes neuronales recurrentes con unidades Long Short-Term Memory (LSTM) bidireccional, entrenado con los embeddings generados por el algoritmo Word2Vec, se explicará el uso de los parámetros utilizados en la configuración inicial del modelo. Se mostrarán los resultados, haciendo uso de métricas de evaluación de nuestro modelo y por último, las respectivas conclusiones de nuestro estudio.application/pdfspaUniversidad Nacional Mayor de San MarcosPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by-nc-sa/4.0/Universidad Nacional Mayor de San MarcosRepositorio de Tesis - UNMSMreponame:UNMSM-Tesisinstname:Universidad Nacional Mayor de San Marcosinstacron:UNMSMProcesamiento de lenguaje natural (Computación)Redes neuronales (Computación)Emocioneshttps://purl.org/pe-repo/ocde/ford#1.02.01Modelo análisis de sentimientos: Word2Vec y un modelo BiRNR-LSTM para un discurso de odioinfo:eu-repo/semantics/bachelorThesisSUNEDULicenciado en Computación CientíficaUniversidad Nacional Mayor de San Marcos. Facultad de Ciencias Matemáticas. Escuela Profesional de Computación CientíficaComputación Científica44076412https://orcid.org/0000-0003-0717-827775854603611026Zegarra Garay, María NatividadRuiz De La Cruz Melo, Carlos Augustohttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesis0920699408249640LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://cybertesis.unmsm.edu.pe/bitstreams/2be27298-7959-40f9-b7ec-6a67f092d197/download8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALMauricio_sj.pdfMauricio_sj.pdfapplication/pdf1034383https://cybertesis.unmsm.edu.pe/bitstreams/5e922c46-19bd-4058-a2d7-09503c1f21f0/downloadc5af2d9d778ecf026d4605a2bfca1b71MD53TEXTMauricio_sj.pdf.txtMauricio_sj.pdf.txtExtracted texttext/plain83514https://cybertesis.unmsm.edu.pe/bitstreams/6fbc7310-10c8-4874-a8b8-afa645432df0/download5ea0916aaf0d324a23d3c0b8001ddc68MD54THUMBNAILMauricio_sj.pdf.jpgMauricio_sj.pdf.jpgGenerated Thumbnailimage/jpeg8793https://cybertesis.unmsm.edu.pe/bitstreams/cf0219be-39b1-4a29-9b34-6df58e7c5987/downloadb79151fef8902a0d62c5db19435c92d1MD5520.500.12672/18485oai:cybertesis.unmsm.edu.pe:20.500.12672/184852023-07-08 03:05:48.202https://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessopen.accesshttps://cybertesis.unmsm.edu.peCybertesis UNMSMcybertesis@unmsm.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
score |
13.2911825 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).