Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark

Descripción del Articulo

La presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre...

Descripción completa

Detalles Bibliográficos
Autor: Fernandez Chambi, Mayenka
Formato: tesis de maestría
Fecha de Publicación:2019
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/13506
Enlace del recurso:http://repositorio.unap.edu.pe/handle/20.500.14082/13506
Nivel de acceso:acceso abierto
Materia:Ingeniería de Software
Minería de textos
id RNAP_2f5438b0769b3f061c9c835f469bb2a5
oai_identifier_str oai:https://repositorio.unap.edu.pe:20.500.14082/13506
network_acronym_str RNAP
network_name_str UNAP-Institucional
repository_id_str 9382
dc.title.es_PE.fl_str_mv Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
title Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
spellingShingle Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
Fernandez Chambi, Mayenka
Ingeniería de Software
Minería de textos
title_short Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
title_full Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
title_fullStr Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
title_full_unstemmed Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
title_sort Análisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Spark
author Fernandez Chambi, Mayenka
author_facet Fernandez Chambi, Mayenka
author_role author
dc.contributor.advisor.fl_str_mv Apaza Cruz, Jorge Luis
dc.contributor.author.fl_str_mv Fernandez Chambi, Mayenka
dc.subject.es_PE.fl_str_mv Ingeniería de Software
Minería de textos
topic Ingeniería de Software
Minería de textos
description La presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre del 2017 según calendario clasificatorio Rusia 2018 de la FIFA. El modelo del análisis de opinión o sentimiento ha sido desarrollado en la plataforma de computación distribuida Spark; demostrándose que las tareas de preparación de datos, modelado y evaluación de algoritmos de aprendizaje de máquina para clasificación de texto se han desarrollado con eficiencia dentro del pipeline de Spark entre tareas transformadoras y estimadoras sobre la estructura de datos DataFrame y la librería MLlib, así los modelos estándar de aprendizaje de máquina para Big Data pueden ser realizadas en forma escalable y distribuida con facilidad de uso por los científicos de datos. Finalmente el modelo de clasificación binario de texto de tuits ha alcanzado una precisión de 83.51% para un modelo de regresión logística y está sobre las métricas estándar de aceptación de clasificadores de su mismo tipo; adicionalmente, esta investigación deja construido y disponible el dataset “PeruARusia2018.csv” con 3000 ítems de tuits etiquetados siguiendo los estándares adecuados que la hacen propicia para que la comunidad investigadora pueda seguir experimentando sobre ella y halle mejores resultados; así como 376,250 tuits como raw data.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2020-02-20T18:16:53Z
dc.date.available.none.fl_str_mv 2020-02-20T18:16:53Z
dc.date.issued.fl_str_mv 2019-12-06
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unap.edu.pe/handle/20.500.14082/13506
url http://repositorio.unap.edu.pe/handle/20.500.14082/13506
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Altiplano
dc.source.es_PE.fl_str_mv Universidad Nacional del Altiplano
Repositorio Institucional - UNAP
dc.source.none.fl_str_mv reponame:UNAP-Institucional
instname:Universidad Nacional Del Altiplano
instacron:UNAP
instname_str Universidad Nacional Del Altiplano
instacron_str UNAP
institution UNAP
reponame_str UNAP-Institucional
collection UNAP-Institucional
bitstream.url.fl_str_mv https://repositorio.unap.edu.pe/bitstream/20.500.14082/13506/1/Mayenka_Fernandez_Chambi.pdf
https://repositorio.unap.edu.pe/bitstream/20.500.14082/13506/2/license.txt
https://repositorio.unap.edu.pe/bitstream/20.500.14082/13506/3/Mayenka_Fernandez_Chambi.pdf.txt
bitstream.checksum.fl_str_mv ff5e1379af0ea2be9645bcf1cd33b943
c52066b9c50a8f86be96c82978636682
bb7afee5cd0962f67d8183467fb7fd37
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional de la Universidad Nacional del Altiplano
repository.mail.fl_str_mv dspace-help@myu.edu
_version_ 1819881000776237056
spelling Apaza Cruz, Jorge LuisFernandez Chambi, Mayenka2020-02-20T18:16:53Z2020-02-20T18:16:53Z2019-12-06http://repositorio.unap.edu.pe/handle/20.500.14082/13506La presente investigación muestra el análisis de opinión realizado en los tuits históricos publicados en la red social o microblogging, Twitter en idioma español durante el evento clasificatorio de la selección peruana de futbol al mundial Rusia-2018, durante el periodo del año 2015 hasta diciembre del 2017 según calendario clasificatorio Rusia 2018 de la FIFA. El modelo del análisis de opinión o sentimiento ha sido desarrollado en la plataforma de computación distribuida Spark; demostrándose que las tareas de preparación de datos, modelado y evaluación de algoritmos de aprendizaje de máquina para clasificación de texto se han desarrollado con eficiencia dentro del pipeline de Spark entre tareas transformadoras y estimadoras sobre la estructura de datos DataFrame y la librería MLlib, así los modelos estándar de aprendizaje de máquina para Big Data pueden ser realizadas en forma escalable y distribuida con facilidad de uso por los científicos de datos. Finalmente el modelo de clasificación binario de texto de tuits ha alcanzado una precisión de 83.51% para un modelo de regresión logística y está sobre las métricas estándar de aceptación de clasificadores de su mismo tipo; adicionalmente, esta investigación deja construido y disponible el dataset “PeruARusia2018.csv” con 3000 ítems de tuits etiquetados siguiendo los estándares adecuados que la hacen propicia para que la comunidad investigadora pueda seguir experimentando sobre ella y halle mejores resultados; así como 376,250 tuits como raw data.Tesisapplication/pdfspaUniversidad Nacional del Altiplanoinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esUniversidad Nacional del AltiplanoRepositorio Institucional - UNAPreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPIngeniería de SoftwareMinería de textosAnálisis de opinión del microblogging Twitter por la clasificación al mundial de fútbol Rusia - 2018 de la selección peruana de fútbol, usando el framework Sparkinfo:eu-repo/semantics/masterThesisSUNEDUMagister Scientiae en Informática con mención en Ingeniería de SoftwareInformáticaUniversidad Nacional del Altiplano. Escuela de PosgradoMaestríaORIGINALMayenka_Fernandez_Chambi.pdfMayenka_Fernandez_Chambi.pdfapplication/pdf3545006https://repositorio.unap.edu.pe/bitstream/20.500.14082/13506/1/Mayenka_Fernandez_Chambi.pdfff5e1379af0ea2be9645bcf1cd33b943MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unap.edu.pe/bitstream/20.500.14082/13506/2/license.txtc52066b9c50a8f86be96c82978636682MD52TEXTMayenka_Fernandez_Chambi.pdf.txtMayenka_Fernandez_Chambi.pdf.txtExtracted texttext/plain172991https://repositorio.unap.edu.pe/bitstream/20.500.14082/13506/3/Mayenka_Fernandez_Chambi.pdf.txtbb7afee5cd0962f67d8183467fb7fd37MD5320.500.14082/13506oai:https://repositorio.unap.edu.pe:20.500.14082/135062022-10-29 18:47:53.343Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.edu77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.936249
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).