Depression classification model on Twitter using BERT

Descripción del Articulo

Today there are many signs of depression, as well as many suicide attempts caused by this emotional disorder, and this is reflected mostly on social networks, mainly on Twitter. For this reason, it is important for specialists and organizations seeking to safeguard people's lives to use softwar...

Descripción completa

Detalles Bibliográficos
Autores: Aleman-Zambrano, Guillermo José, Del Carpio-Lazo, Marvik Irzovic, Mendiguri-Chávez, Daniel Gustavo, Vilchez-Silva, Daniela Carolina, Tejada Toledo, Franco Eduardo
Formato: artículo
Fecha de Publicación:2023
Institución:Universidad La Salle
Repositorio:Revistas - Universidad La Salle
Lenguaje:español
OAI Identifier:oai:ojs.revistas.ulasalle.edu.pe:article/89
Enlace del recurso:https://revistas.ulasalle.edu.pe/innosoft/article/view/89
https://doi.org/10.48168/innosoft.s12.a89
https://purl.org/42411/s12/a89
https://n2t.net/ark:/42411/s12/a89
Nivel de acceso:acceso abierto
Materia:Depression classification
text classification
natural language processing
BERT
social networks
Clasificación de depresión
clasificación de texto
procesamiento de lenguaje natural
redes sociales
id REVUSALLE_f9230f76866ac814766155826a37380e
oai_identifier_str oai:ojs.revistas.ulasalle.edu.pe:article/89
network_acronym_str REVUSALLE
network_name_str Revistas - Universidad La Salle
repository_id_str
dc.title.none.fl_str_mv Depression classification model on Twitter using BERT
Modelo de clasificación de depresión en Tweets usando BERT
title Depression classification model on Twitter using BERT
spellingShingle Depression classification model on Twitter using BERT
Aleman-Zambrano, Guillermo José
Depression classification
text classification
natural language processing
BERT
social networks
Clasificación de depresión
clasificación de texto
procesamiento de lenguaje natural
BERT
redes sociales
title_short Depression classification model on Twitter using BERT
title_full Depression classification model on Twitter using BERT
title_fullStr Depression classification model on Twitter using BERT
title_full_unstemmed Depression classification model on Twitter using BERT
title_sort Depression classification model on Twitter using BERT
dc.creator.none.fl_str_mv Aleman-Zambrano, Guillermo José
Del Carpio-Lazo, Marvik Irzovic
Mendiguri-Chávez, Daniel Gustavo
Vilchez-Silva, Daniela Carolina
Tejada Toledo, Franco Eduardo
author Aleman-Zambrano, Guillermo José
author_facet Aleman-Zambrano, Guillermo José
Del Carpio-Lazo, Marvik Irzovic
Mendiguri-Chávez, Daniel Gustavo
Vilchez-Silva, Daniela Carolina
Tejada Toledo, Franco Eduardo
author_role author
author2 Del Carpio-Lazo, Marvik Irzovic
Mendiguri-Chávez, Daniel Gustavo
Vilchez-Silva, Daniela Carolina
Tejada Toledo, Franco Eduardo
author2_role author
author
author
author
dc.subject.none.fl_str_mv Depression classification
text classification
natural language processing
BERT
social networks
Clasificación de depresión
clasificación de texto
procesamiento de lenguaje natural
BERT
redes sociales
topic Depression classification
text classification
natural language processing
BERT
social networks
Clasificación de depresión
clasificación de texto
procesamiento de lenguaje natural
BERT
redes sociales
description Today there are many signs of depression, as well as many suicide attempts caused by this emotional disorder, and this is reflected mostly on social networks, mainly on Twitter. For this reason, it is important for specialists and organizations seeking to safeguard people's lives to use software tools to address this problem. For this, in this work a web tool called "UBDevs-Depression-Classifier" is proposed,  that allows you to automatically obtain and classify tweets for a specific topic. A greater emphasis was placed on tweets related to COVID-19in the years 2020-2021 the world experienced a pandemic that increased cases of depression in many places. This research proposal focuses on the use of a model based on NLP (Natural Language Processing) for the classification of Tweets in order to find those that incite depression or imply that users are in a bad mood, all this in order to maintain the mental and physical health of the users of this platform. There are several models that are used as a basis for NLP projects, however, at present BERT has proven to be one of the most efficient, so we selected it for the development of our proposal. To evaluate the efficiency of the project we applied the F1 metric obtaining a value of 0.8806, a quite acceptable result with respect to a textual classification.
publishDate 2023
dc.date.none.fl_str_mv 2023-09-30
dc.type.none.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
Journal paper
text
Artículos originales
format article
status_str publishedVersion
dc.identifier.none.fl_str_mv https://revistas.ulasalle.edu.pe/innosoft/article/view/89
https://doi.org/10.48168/innosoft.s12.a89
https://purl.org/42411/s12/a89
https://n2t.net/ark:/42411/s12/a89
url https://revistas.ulasalle.edu.pe/innosoft/article/view/89
https://doi.org/10.48168/innosoft.s12.a89
https://purl.org/42411/s12/a89
https://n2t.net/ark:/42411/s12/a89
dc.language.none.fl_str_mv spa
language spa
dc.relation.none.fl_str_mv https://revistas.ulasalle.edu.pe/innosoft/article/view/89/132
https://revistas.ulasalle.edu.pe/innosoft/article/view/89/146
https://purl.org/42411/s12/a89/g132
https://purl.org/42411/s12/a89/g146
https://n2t.net/ark:/42411/s12/a89/g132
https://n2t.net/ark:/42411/s12/a89/g146
dc.rights.none.fl_str_mv Derechos de autor 2023 Innovación y Software
https://creativecommons.org/licenses/by/4.0
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Derechos de autor 2023 Innovación y Software
https://creativecommons.org/licenses/by/4.0
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
text/html
dc.coverage.none.fl_str_mv 2023
2023
dc.publisher.none.fl_str_mv Universidad La Salle
publisher.none.fl_str_mv Universidad La Salle
dc.source.none.fl_str_mv Innovation and Software; Vol 4 No 2 (2023): September - February; 6-24
Innovación y Software; Vol. 4 Núm. 2 (2023): Septiembre - Febrero; 6-24
2708-0935
2708-0927
https://doi.org/10.48168/innosoft.s12
https://purl.org/42411/s12
https://n2t.net/ark:/42411/s12
reponame:Revistas - Universidad La Salle
instname:Universidad La Salle
instacron:USALLE
instname_str Universidad La Salle
instacron_str USALLE
institution USALLE
reponame_str Revistas - Universidad La Salle
collection Revistas - Universidad La Salle
repository.name.fl_str_mv
repository.mail.fl_str_mv
_version_ 1846529178538606592
spelling Depression classification model on Twitter using BERTModelo de clasificación de depresión en Tweets usando BERTAleman-Zambrano, Guillermo JoséDel Carpio-Lazo, Marvik IrzovicMendiguri-Chávez, Daniel GustavoVilchez-Silva, Daniela CarolinaTejada Toledo, Franco EduardoDepression classificationtext classificationnatural language processingBERTsocial networksClasificación de depresiónclasificación de textoprocesamiento de lenguaje naturalBERTredes socialesToday there are many signs of depression, as well as many suicide attempts caused by this emotional disorder, and this is reflected mostly on social networks, mainly on Twitter. For this reason, it is important for specialists and organizations seeking to safeguard people's lives to use software tools to address this problem. For this, in this work a web tool called "UBDevs-Depression-Classifier" is proposed,  that allows you to automatically obtain and classify tweets for a specific topic. A greater emphasis was placed on tweets related to COVID-19in the years 2020-2021 the world experienced a pandemic that increased cases of depression in many places. This research proposal focuses on the use of a model based on NLP (Natural Language Processing) for the classification of Tweets in order to find those that incite depression or imply that users are in a bad mood, all this in order to maintain the mental and physical health of the users of this platform. There are several models that are used as a basis for NLP projects, however, at present BERT has proven to be one of the most efficient, so we selected it for the development of our proposal. To evaluate the efficiency of the project we applied the F1 metric obtaining a value of 0.8806, a quite acceptable result with respect to a textual classification.Hoy en día existen muchos indicios de depresión, así como muchos intentos de suicidio causados por este trastorno emocional, esto se ve reflejado mayormente en redes sociales principalmente en Twitter. Por ello, es importante que los especialistas y organizaciones que busquen salvaguardar la vida de las personas, utilicen herramientas de software que permitan abordar este problema. Para ello, en este trabajo se propone una herramienta web llamada “UBDevs-Depression-Classifier” que permite clasificar y obtener tweets de forma automática por algún tema específico. Se puso un mayor énfasis a tweets relacionados con el COVID-19 debido a que en los años 2020-2021 en el mundo se vivió una pandemia que incrementó los casos de depresión en muchos lugares. Esta propuesta de investigación se centra en la utilización en un modelo basado en NLP (Natural Language Processing) para la clasificación de Tweets con el fin de encontrar aquellos que inciten a la depresión o den a entender que los usuarios se encuentren en un mal estado de ánimo, todo ello con el fin de mantener la salud mental y física de los usuarios de esta plataforma. Existen varios modelos usados como base para proyectos de NLP, sin embargo, en la actualidad BERT ha demostrado ser uno de los más eficientes por ello lo seleccionamos para el desarrollo de nuestra propuesta. Para evaluar la eficiencia del proyecto aplicamos la métrica F1 obteniendo un valor de 0.8806, resultado bastante aceptable respecto a una clasificación textual.Universidad La Salle2023-09-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionJournal papertextArtículos originalesapplication/pdftext/htmlhttps://revistas.ulasalle.edu.pe/innosoft/article/view/89https://doi.org/10.48168/innosoft.s12.a89https://purl.org/42411/s12/a89https://n2t.net/ark:/42411/s12/a89Innovation and Software; Vol 4 No 2 (2023): September - February; 6-24Innovación y Software; Vol. 4 Núm. 2 (2023): Septiembre - Febrero; 6-242708-09352708-0927https://doi.org/10.48168/innosoft.s12https://purl.org/42411/s12https://n2t.net/ark:/42411/s12reponame:Revistas - Universidad La Salleinstname:Universidad La Salleinstacron:USALLEspahttps://revistas.ulasalle.edu.pe/innosoft/article/view/89/132https://revistas.ulasalle.edu.pe/innosoft/article/view/89/146https://purl.org/42411/s12/a89/g132https://purl.org/42411/s12/a89/g146https://n2t.net/ark:/42411/s12/a89/g132https://n2t.net/ark:/42411/s12/a89/g14620232023Derechos de autor 2023 Innovación y Softwarehttps://creativecommons.org/licenses/by/4.0info:eu-repo/semantics/openAccessoai:ojs.revistas.ulasalle.edu.pe:article/892025-07-03T08:02:11Z
score 13.076814
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).