Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos

Descripción del Articulo

El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agr...

Descripción completa

Detalles Bibliográficos
Autor: Jimenez Palomino, Rosmery
Formato: tesis de grado
Fecha de Publicación:2018
Institución:Universidad Nacional José María Arguedas
Repositorio:UNAJMA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unajma.edu.pe:20.500.14168/323
Enlace del recurso:https://hdl.handle.net/20.500.14168/323
Nivel de acceso:acceso abierto
Materia:Técnicas de minería de textos
weka
modelo de clasificación
corpus conocimiento
KDD
servicio web
análisis de sentimientos
Descripción
Sumario:El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agresivos. La metodología que se empleó fue KDD (Knowledge Discovery in Databases), esta nos permitió determinar la influencia del corpus de conocimiento (Database) en la clasificación de comentarios de textos agresivos, basados en las técnicas de minería de textos. Las etapas que se desarrollaron fueron: 1) Selección de datos, 2) Procesamiento, 3) Transformación, 4) Data Mining, 5) Interpretación y evaluación. En la primera etapa, se extrajo los comentarios de textos de las redes sociales. En la segunda etapa, se realizó la limpieza de los datos. En la tercera etapa, se convirtió los datos al formato ARFF de la herramienta weka. En la cuarta etapa, se hizo usó de las técnicas y algoritmos de clasificación de weka. En la quinta etapa, se evaluó e interpretó los resultados obtenidos de los algoritmos NaiveBayes, BayesNet, DecisionStump, J48, OneR, PART, SMO, IBK y KStart. El menor Error Absoluto Medio fue de 0.09 adquirido por el algoritmo IBK con una data de 1561 comentarios de textos, teniendo una precisión de clasificación del 89.3%. Con su modelo de clasificación, se implementó un servicio web de clasificación de comentarios de textos agresivos al cual se denominó “duke classifier”. El servicio web duke classifier, puede ser empleado por cualquier persona que desee integrarlo a su blog, microblogging, red social, etc. O estudiado por otros investigadores que estén interesados en el tema.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).