Android comment classification using BERT

Descripción del Articulo

This project focuses on developing an NLP-based text analysis tool to evaluate Android app user feedback, specifically collected from F-Droid. The lack of an automated solution to analyze and understand these opinions, classifying them into specific topics, motivates research. The goal is to provide...

Descripción completa

Detalles Bibliográficos
Autores: Mansilla Ancco, Susana Rosa Elizabeth, Pérez Treviños, Marcelo Antony
Formato: artículo
Fecha de Publicación:2024
Institución:Universidad La Salle
Repositorio:Revistas - Universidad La Salle
Lenguaje:español
OAI Identifier:oai:ojs.revistas.ulasalle.edu.pe:article/120
Enlace del recurso:https://revistas.ulasalle.edu.pe/innosoft/article/view/120
https://doi.org/10.48168/innosoft.s15.a120
https://purl.org/42411/s15/a120
https://n2t.net/ark:/42411/s15/a120
Nivel de acceso:acceso abierto
Materia:Topic classification
text classification
natural language processing
BERT
clasificación de tópicos
clasificación de texto
procesamiento de lenguaje natural
id REVUSALLE_d7362509f83cb4677363c115b3cb1c35
oai_identifier_str oai:ojs.revistas.ulasalle.edu.pe:article/120
network_acronym_str REVUSALLE
network_name_str Revistas - Universidad La Salle
repository_id_str
spelling Android comment classification using BERTClasificación de comentarios de Android usando BERT Mansilla Ancco, Susana Rosa ElizabethPérez Treviños, Marcelo AntonyTopic classificationtext classificationnatural language processingBERTBERTclasificación de tópicosclasificación de textoprocesamiento de lenguaje naturalThis project focuses on developing an NLP-based text analysis tool to evaluate Android app user feedback, specifically collected from F-Droid. The lack of an automated solution to analyze and understand these opinions, classifying them into specific topics, motivates research. The goal is to provide developers, users, and data analysts with a detailed view of user preferences and perceptions. Using data sets in English between 2014 and 2017, the proposal is implemented in Python with the Pandas library. The BERT model is used for classification, with a specific focus on the comparison of different models. The graphical interface is built in Visual Studio, allowing users to enter comments and obtain topic rankings, along with word cloud visualizations.Este proyecto se centra en desarrollar una herramienta de análisis de texto basada en NLP para evaluar comentarios de usuarios de aplicaciones Android, específicamente recopilados de F-Droid. La falta de una solución automatizada para analizar y entender estas opiniones, clasificándolas en tópicos específicos, motiva la investigación. El objetivo es proporcionar a desarrolladores, usuarios y analistas de datos una visión detallada de las preferencias y percepciones de los usuarios. Utilizando conjuntos de datos en inglés entre 2014 y 2017, la propuesta se implementa en Python con la librería Pandas. Se emplea el modelo BERT para la clasificación, con un enfoque específico en la comparación de diferentes modelos. La interfaz gráfica se construye en Visual Studio, permitiendo a los usuarios ingresar comentarios y obtener clasificaciones de tópicos, junto con visualizaciones de nubes de palabras.Universidad La Salle2024-03-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionJournal paperImage and textArtículos originalesImagen y textoapplication/pdftext/htmlhttps://revistas.ulasalle.edu.pe/innosoft/article/view/120https://doi.org/10.48168/innosoft.s15.a120https://purl.org/42411/s15/a120https://n2t.net/ark:/42411/s15/a120Innovation and Software; Vol 5 No 1 (2024): March - August; 94-110Innovación y Software; Vol. 5 Núm. 1 (2024): Marzo - Agosto; 94-1102708-09352708-0927https://doi.org/10.48168/innosoft.s15https://purl.org/42411/s15https://n2t.net/ark:/42411/s15reponame:Revistas - Universidad La Salleinstname:Universidad La Salleinstacron:USALLEspahttps://revistas.ulasalle.edu.pe/innosoft/article/view/120/203https://revistas.ulasalle.edu.pe/innosoft/article/view/120/204Derechos de autor 2024 Innovación y Softwarehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:ojs.revistas.ulasalle.edu.pe:article/1202025-07-03T08:02:20Z
dc.title.none.fl_str_mv Android comment classification using BERT
Clasificación de comentarios de Android usando BERT
title Android comment classification using BERT
spellingShingle Android comment classification using BERT
Mansilla Ancco, Susana Rosa Elizabeth
Topic classification
text classification
natural language processing
BERT
BERT
clasificación de tópicos
clasificación de texto
procesamiento de lenguaje natural
title_short Android comment classification using BERT
title_full Android comment classification using BERT
title_fullStr Android comment classification using BERT
title_full_unstemmed Android comment classification using BERT
title_sort Android comment classification using BERT
dc.creator.none.fl_str_mv Mansilla Ancco, Susana Rosa Elizabeth
Pérez Treviños, Marcelo Antony
author Mansilla Ancco, Susana Rosa Elizabeth
author_facet Mansilla Ancco, Susana Rosa Elizabeth
Pérez Treviños, Marcelo Antony
author_role author
author2 Pérez Treviños, Marcelo Antony
author2_role author
dc.subject.none.fl_str_mv Topic classification
text classification
natural language processing
BERT
BERT
clasificación de tópicos
clasificación de texto
procesamiento de lenguaje natural
topic Topic classification
text classification
natural language processing
BERT
BERT
clasificación de tópicos
clasificación de texto
procesamiento de lenguaje natural
description This project focuses on developing an NLP-based text analysis tool to evaluate Android app user feedback, specifically collected from F-Droid. The lack of an automated solution to analyze and understand these opinions, classifying them into specific topics, motivates research. The goal is to provide developers, users, and data analysts with a detailed view of user preferences and perceptions. Using data sets in English between 2014 and 2017, the proposal is implemented in Python with the Pandas library. The BERT model is used for classification, with a specific focus on the comparison of different models. The graphical interface is built in Visual Studio, allowing users to enter comments and obtain topic rankings, along with word cloud visualizations.
publishDate 2024
dc.date.none.fl_str_mv 2024-03-30
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Journal paper
Image and text
Artículos originales
Imagen y texto
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistas.ulasalle.edu.pe/innosoft/article/view/120
https://doi.org/10.48168/innosoft.s15.a120
https://purl.org/42411/s15/a120
https://n2t.net/ark:/42411/s15/a120
url https://revistas.ulasalle.edu.pe/innosoft/article/view/120
https://doi.org/10.48168/innosoft.s15.a120
https://purl.org/42411/s15/a120
https://n2t.net/ark:/42411/s15/a120
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.ulasalle.edu.pe/innosoft/article/view/120/203
https://revistas.ulasalle.edu.pe/innosoft/article/view/120/204
dc.rights.none.fl_str_mv Derechos de autor 2024 Innovación y Software
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Derechos de autor 2024 Innovación y Software
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/html
dc.publisher.none.fl_str_mv Universidad La Salle
publisher.none.fl_str_mv Universidad La Salle
dc.source.none.fl_str_mv Innovation and Software; Vol 5 No 1 (2024): March - August; 94-110
Innovación y Software; Vol. 5 Núm. 1 (2024): Marzo - Agosto; 94-110
2708-0935
2708-0927
https://doi.org/10.48168/innosoft.s15
https://purl.org/42411/s15
https://n2t.net/ark:/42411/s15
reponame:Revistas - Universidad La Salle
instname:Universidad La Salle
instacron:USALLE
instname_str Universidad La Salle
instacron_str USALLE
institution USALLE
reponame_str Revistas - Universidad La Salle
collection Revistas - Universidad La Salle
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1844626634451189760
score 13.243185
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).