Modelo robusto basado en técnicas de Machine Learning y Deep Learning para la detección de riesgo de suicidio mediante el análisis de publicaciones en redes sociales
Descripción del Articulo
El suicidio es, a nivel global, un serio problema de salud publica, en países de primer mundo como Estados Unidos, las víctimas rondan las 50,000 en los ˙últimos 3 años, y hasta marzo del 2024, ya se registraron casi 12,000 casos. Por otro lado, en Per˙ se ha observado desde el 2021 un aumento de la...
| Autores: | , |
|---|---|
| Formato: | artículo |
| Fecha de Publicación: | 2025 |
| Institución: | Universidad Tecnológica del Perú |
| Repositorio: | UTP-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.utp.edu.pe:20.500.12867/14774 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12867/14774 |
| Nivel de acceso: | acceso embargado |
| Materia: | Redes sociales Suicidio Hiperpar·metros https://purl.org/pe-repo/ocde/ford#2.02.04 |
| Sumario: | El suicidio es, a nivel global, un serio problema de salud publica, en países de primer mundo como Estados Unidos, las víctimas rondan las 50,000 en los ˙últimos 3 años, y hasta marzo del 2024, ya se registraron casi 12,000 casos. Por otro lado, en Per˙ se ha observado desde el 2021 un aumento de la tasa de suicidio en la población de entre 15 y 25 años. A pesar de existir mecanismos de prevención, el problema fundamental es la carencia de una atención especializada rápida y eficiente, lo cual se lograría con una detección temprana de individuos con ideas suicidas. El objetivo de este estudio es desarrollar distintos modelos de clasificación usando técnicas de Machine Learning (ML) y Deep Learning (DL) para obtener un modelo óptimo que permita detectar con gran exactitud el riesgo de suicidio en una publicación en redes sociales, y de esta manera, las personas identificadas con tendencias suicidas reciban una atención oportuna de especialistas, así podrán superar su condición autolesiva y, de forma gradual, se podrá· reducir la tasa de suicidio. La metodología est· compuesta de 5 fases: Obtención del dataset, Preprocesamiento (eliminación de información irrelevante, reemplazo de caracteres, aumento de datos, tokenización y lematización), Extracción de características (Word2Vec, GloVe y FastText), Construcción del modelo, basado tanto en ML (LightGBM, CatBoost, SVM, Random Forest y Logistic Regression) como en DL (BERT, XLNet y ELECTRA), y Evaluación del modelo. Los resultados obtenidos con el modelo híbrido propuesto BERT + LSTM, lograron 96.52% de Accuracy, 96.17% de Precisión, 96.50% de F1- score, 96.84% de Recall y 96.52% de ROC-AUC, determinando así un modelo robusto capaz de clasificar de forma precisa el riesgo de suicidio presente en una publicación en redes sociales. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).