Modelo robusto basado en técnicas de Machine Learning y Deep Learning para la detección de riesgo de suicidio mediante el análisis de publicaciones en redes sociales

Descripción del Articulo

El suicidio es, a nivel global, un serio problema de salud publica, en países de primer mundo como Estados Unidos, las víctimas rondan las 50,000 en los ˙últimos 3 años, y hasta marzo del 2024, ya se registraron casi 12,000 casos. Por otro lado, en Per˙ se ha observado desde el 2021 un aumento de la...

Descripción completa

Detalles Bibliográficos
Autores: Luyo Chiok, Marcos Alfredo, Peñaloza Castañeda , Tatiana Lucero
Formato: artículo
Fecha de Publicación:2025
Institución:Universidad Tecnológica del Perú
Repositorio:UTP-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.utp.edu.pe:20.500.12867/14774
Enlace del recurso:https://hdl.handle.net/20.500.12867/14774
Nivel de acceso:acceso embargado
Materia:Redes sociales
Suicidio
Hiperpar·metros
https://purl.org/pe-repo/ocde/ford#2.02.04
Descripción
Sumario:El suicidio es, a nivel global, un serio problema de salud publica, en países de primer mundo como Estados Unidos, las víctimas rondan las 50,000 en los ˙últimos 3 años, y hasta marzo del 2024, ya se registraron casi 12,000 casos. Por otro lado, en Per˙ se ha observado desde el 2021 un aumento de la tasa de suicidio en la población de entre 15 y 25 años. A pesar de existir mecanismos de prevención, el problema fundamental es la carencia de una atención especializada rápida y eficiente, lo cual se lograría con una detección temprana de individuos con ideas suicidas. El objetivo de este estudio es desarrollar distintos modelos de clasificación usando técnicas de Machine Learning (ML) y Deep Learning (DL) para obtener un modelo óptimo que permita detectar con gran exactitud el riesgo de suicidio en una publicación en redes sociales, y de esta manera, las personas identificadas con tendencias suicidas reciban una atención oportuna de especialistas, así podrán superar su condición autolesiva y, de forma gradual, se podrá· reducir la tasa de suicidio. La metodología est· compuesta de 5 fases: Obtención del dataset, Preprocesamiento (eliminación de información irrelevante, reemplazo de caracteres, aumento de datos, tokenización y lematización), Extracción de características (Word2Vec, GloVe y FastText), Construcción del modelo, basado tanto en ML (LightGBM, CatBoost, SVM, Random Forest y Logistic Regression) como en DL (BERT, XLNet y ELECTRA), y Evaluación del modelo. Los resultados obtenidos con el modelo híbrido propuesto BERT + LSTM, lograron 96.52% de Accuracy, 96.17% de Precisión, 96.50% de F1- score, 96.84% de Recall y 96.52% de ROC-AUC, determinando así un modelo robusto capaz de clasificar de forma precisa el riesgo de suicidio presente en una publicación en redes sociales.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).