Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos

Descripción del Articulo

El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agr...

Descripción completa

Detalles Bibliográficos
Autor: Jimenez Palomino, Rosmery
Formato: tesis de grado
Fecha de Publicación:2018
Institución:Universidad Nacional José María Arguedas
Repositorio:UNAJMA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unajma.edu.pe:20.500.14168/323
Enlace del recurso:https://hdl.handle.net/20.500.14168/323
Nivel de acceso:acceso abierto
Materia:Técnicas de minería de textos
weka
modelo de clasificación
corpus conocimiento
KDD
servicio web
análisis de sentimientos
id UNAJ_e892d5f06606936888b3d8684bc0e533
oai_identifier_str oai:repositorio.unajma.edu.pe:20.500.14168/323
network_acronym_str UNAJ
network_name_str UNAJMA-Institucional
repository_id_str 4841
dc.title.es_ES.fl_str_mv Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
title Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
spellingShingle Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
Jimenez Palomino, Rosmery
Técnicas de minería de textos
weka
modelo de clasificación
corpus conocimiento
KDD
servicio web
análisis de sentimientos
title_short Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
title_full Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
title_fullStr Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
title_full_unstemmed Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
title_sort Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
author Jimenez Palomino, Rosmery
author_facet Jimenez Palomino, Rosmery
author_role author
dc.contributor.advisor.fl_str_mv Huillcen Baca, Herwin Alayn
dc.contributor.author.fl_str_mv Jimenez Palomino, Rosmery
dc.subject.es_ES.fl_str_mv Técnicas de minería de textos
weka
modelo de clasificación
corpus conocimiento
KDD
servicio web
análisis de sentimientos
topic Técnicas de minería de textos
weka
modelo de clasificación
corpus conocimiento
KDD
servicio web
análisis de sentimientos
description El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agresivos. La metodología que se empleó fue KDD (Knowledge Discovery in Databases), esta nos permitió determinar la influencia del corpus de conocimiento (Database) en la clasificación de comentarios de textos agresivos, basados en las técnicas de minería de textos. Las etapas que se desarrollaron fueron: 1) Selección de datos, 2) Procesamiento, 3) Transformación, 4) Data Mining, 5) Interpretación y evaluación. En la primera etapa, se extrajo los comentarios de textos de las redes sociales. En la segunda etapa, se realizó la limpieza de los datos. En la tercera etapa, se convirtió los datos al formato ARFF de la herramienta weka. En la cuarta etapa, se hizo usó de las técnicas y algoritmos de clasificación de weka. En la quinta etapa, se evaluó e interpretó los resultados obtenidos de los algoritmos NaiveBayes, BayesNet, DecisionStump, J48, OneR, PART, SMO, IBK y KStart. El menor Error Absoluto Medio fue de 0.09 adquirido por el algoritmo IBK con una data de 1561 comentarios de textos, teniendo una precisión de clasificación del 89.3%. Con su modelo de clasificación, se implementó un servicio web de clasificación de comentarios de textos agresivos al cual se denominó “duke classifier”. El servicio web duke classifier, puede ser empleado por cualquier persona que desee integrarlo a su blog, microblogging, red social, etc. O estudiado por otros investigadores que estén interesados en el tema.
publishDate 2018
dc.date.accessioned.none.fl_str_mv 2018-06-13T13:30:06Z
dc.date.available.none.fl_str_mv 2018-06-13T13:30:06Z
dc.date.issued.fl_str_mv 2018
dc.type.es_ES.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.14168/323
url https://hdl.handle.net/20.500.14168/323
dc.language.iso.es_ES.fl_str_mv spa
language spa
dc.relation.es_ES.fl_str_mv info:pe-repo/semantics/dataset
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_ES.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_ES.fl_str_mv http://creativecommons.org/licences/by-nc-nd/2.5/pe/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licences/by-nc-nd/2.5/pe/
dc.format.es_ES.fl_str_mv application/pdf
dc.publisher.es_ES.fl_str_mv Universidad Nacional José María Arguedas
dc.source.es_ES.fl_str_mv Universidad Nacional José María Arguedas
Repositorio Institucional - UNAJMA
dc.source.none.fl_str_mv reponame:UNAJMA-Institucional
instname:Universidad Nacional José María Arguedas
instacron:UNAJMA
instname_str Universidad Nacional José María Arguedas
instacron_str UNAJMA
institution UNAJMA
reponame_str UNAJMA-Institucional
collection UNAJMA-Institucional
bitstream.url.fl_str_mv http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/1/2_EPIS_Rosmery_Titulo_2018.pdf
http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/2/license.txt
http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/3/2_EPIS_Rosmery_Titulo_2018.pdf.txt
http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/4/2_EPIS_Rosmery_Titulo_2018.pdf.jpg
bitstream.checksum.fl_str_mv a1d1d2e36a6f58b239e112ba105b6a4b
8a4605be74aa9ea9d79846c1fba20a33
aede695efaf87c01635fa949e993a1a5
d33241df61c6dd9f3c8268c7348a8684
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Universidad Nacional José María Arguedas
repository.mail.fl_str_mv repositorio@unajma.edu.pe
_version_ 1846881215458574336
spelling Huillcen Baca, Herwin AlaynJimenez Palomino, Rosmery2018-06-13T13:30:06Z2018-06-13T13:30:06Z2018https://hdl.handle.net/20.500.14168/323El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agresivos. La metodología que se empleó fue KDD (Knowledge Discovery in Databases), esta nos permitió determinar la influencia del corpus de conocimiento (Database) en la clasificación de comentarios de textos agresivos, basados en las técnicas de minería de textos. Las etapas que se desarrollaron fueron: 1) Selección de datos, 2) Procesamiento, 3) Transformación, 4) Data Mining, 5) Interpretación y evaluación. En la primera etapa, se extrajo los comentarios de textos de las redes sociales. En la segunda etapa, se realizó la limpieza de los datos. En la tercera etapa, se convirtió los datos al formato ARFF de la herramienta weka. En la cuarta etapa, se hizo usó de las técnicas y algoritmos de clasificación de weka. En la quinta etapa, se evaluó e interpretó los resultados obtenidos de los algoritmos NaiveBayes, BayesNet, DecisionStump, J48, OneR, PART, SMO, IBK y KStart. El menor Error Absoluto Medio fue de 0.09 adquirido por el algoritmo IBK con una data de 1561 comentarios de textos, teniendo una precisión de clasificación del 89.3%. Con su modelo de clasificación, se implementó un servicio web de clasificación de comentarios de textos agresivos al cual se denominó “duke classifier”. El servicio web duke classifier, puede ser empleado por cualquier persona que desee integrarlo a su blog, microblogging, red social, etc. O estudiado por otros investigadores que estén interesados en el tema.Tesisapplication/pdfspaUniversidad Nacional José María Arguedasinfo:pe-repo/semantics/datasetSUNEDUinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licences/by-nc-nd/2.5/pe/Universidad Nacional José María ArguedasRepositorio Institucional - UNAJMAreponame:UNAJMA-Institucionalinstname:Universidad Nacional José María Arguedasinstacron:UNAJMATécnicas de minería de textoswekamodelo de clasificacióncorpus conocimientoKDDservicio webanálisis de sentimientosInfluencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivosinfo:eu-repo/semantics/bachelorThesisIngeniero de SistemasUniversidad Nacional José María Arguedas. Facultad de IngenieríaBachillerIngeniería de SistemasPresencialORIGINAL2_EPIS_Rosmery_Titulo_2018.pdf2_EPIS_Rosmery_Titulo_2018.pdfapplication/pdf4406556http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/1/2_EPIS_Rosmery_Titulo_2018.pdfa1d1d2e36a6f58b239e112ba105b6a4bMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXT2_EPIS_Rosmery_Titulo_2018.pdf.txt2_EPIS_Rosmery_Titulo_2018.pdf.txtExtracted texttext/plain172769http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/3/2_EPIS_Rosmery_Titulo_2018.pdf.txtaede695efaf87c01635fa949e993a1a5MD53THUMBNAIL2_EPIS_Rosmery_Titulo_2018.pdf.jpg2_EPIS_Rosmery_Titulo_2018.pdf.jpgGenerated Thumbnailimage/jpeg4628http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/4/2_EPIS_Rosmery_Titulo_2018.pdf.jpgd33241df61c6dd9f3c8268c7348a8684MD5420.500.14168/323oai:repositorio.unajma.edu.pe:20.500.14168/3232022-08-17 22:17:33.69Universidad Nacional José María Arguedasrepositorio@unajma.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 12.636967
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).