Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos
Descripción del Articulo
El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agr...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2018 |
| Institución: | Universidad Nacional José María Arguedas |
| Repositorio: | UNAJMA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unajma.edu.pe:20.500.14168/323 |
| Enlace del recurso: | https://hdl.handle.net/20.500.14168/323 |
| Nivel de acceso: | acceso abierto |
| Materia: | Técnicas de minería de textos weka modelo de clasificación corpus conocimiento KDD servicio web análisis de sentimientos |
| id |
UNAJ_e892d5f06606936888b3d8684bc0e533 |
|---|---|
| oai_identifier_str |
oai:repositorio.unajma.edu.pe:20.500.14168/323 |
| network_acronym_str |
UNAJ |
| network_name_str |
UNAJMA-Institucional |
| repository_id_str |
4841 |
| dc.title.es_ES.fl_str_mv |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| title |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| spellingShingle |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos Jimenez Palomino, Rosmery Técnicas de minería de textos weka modelo de clasificación corpus conocimiento KDD servicio web análisis de sentimientos |
| title_short |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| title_full |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| title_fullStr |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| title_full_unstemmed |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| title_sort |
Influencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivos |
| author |
Jimenez Palomino, Rosmery |
| author_facet |
Jimenez Palomino, Rosmery |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Huillcen Baca, Herwin Alayn |
| dc.contributor.author.fl_str_mv |
Jimenez Palomino, Rosmery |
| dc.subject.es_ES.fl_str_mv |
Técnicas de minería de textos weka modelo de clasificación corpus conocimiento KDD servicio web análisis de sentimientos |
| topic |
Técnicas de minería de textos weka modelo de clasificación corpus conocimiento KDD servicio web análisis de sentimientos |
| description |
El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agresivos. La metodología que se empleó fue KDD (Knowledge Discovery in Databases), esta nos permitió determinar la influencia del corpus de conocimiento (Database) en la clasificación de comentarios de textos agresivos, basados en las técnicas de minería de textos. Las etapas que se desarrollaron fueron: 1) Selección de datos, 2) Procesamiento, 3) Transformación, 4) Data Mining, 5) Interpretación y evaluación. En la primera etapa, se extrajo los comentarios de textos de las redes sociales. En la segunda etapa, se realizó la limpieza de los datos. En la tercera etapa, se convirtió los datos al formato ARFF de la herramienta weka. En la cuarta etapa, se hizo usó de las técnicas y algoritmos de clasificación de weka. En la quinta etapa, se evaluó e interpretó los resultados obtenidos de los algoritmos NaiveBayes, BayesNet, DecisionStump, J48, OneR, PART, SMO, IBK y KStart. El menor Error Absoluto Medio fue de 0.09 adquirido por el algoritmo IBK con una data de 1561 comentarios de textos, teniendo una precisión de clasificación del 89.3%. Con su modelo de clasificación, se implementó un servicio web de clasificación de comentarios de textos agresivos al cual se denominó “duke classifier”. El servicio web duke classifier, puede ser empleado por cualquier persona que desee integrarlo a su blog, microblogging, red social, etc. O estudiado por otros investigadores que estén interesados en el tema. |
| publishDate |
2018 |
| dc.date.accessioned.none.fl_str_mv |
2018-06-13T13:30:06Z |
| dc.date.available.none.fl_str_mv |
2018-06-13T13:30:06Z |
| dc.date.issued.fl_str_mv |
2018 |
| dc.type.es_ES.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.14168/323 |
| url |
https://hdl.handle.net/20.500.14168/323 |
| dc.language.iso.es_ES.fl_str_mv |
spa |
| language |
spa |
| dc.relation.es_ES.fl_str_mv |
info:pe-repo/semantics/dataset |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_ES.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_ES.fl_str_mv |
http://creativecommons.org/licences/by-nc-nd/2.5/pe/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licences/by-nc-nd/2.5/pe/ |
| dc.format.es_ES.fl_str_mv |
application/pdf |
| dc.publisher.es_ES.fl_str_mv |
Universidad Nacional José María Arguedas |
| dc.source.es_ES.fl_str_mv |
Universidad Nacional José María Arguedas Repositorio Institucional - UNAJMA |
| dc.source.none.fl_str_mv |
reponame:UNAJMA-Institucional instname:Universidad Nacional José María Arguedas instacron:UNAJMA |
| instname_str |
Universidad Nacional José María Arguedas |
| instacron_str |
UNAJMA |
| institution |
UNAJMA |
| reponame_str |
UNAJMA-Institucional |
| collection |
UNAJMA-Institucional |
| bitstream.url.fl_str_mv |
http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/1/2_EPIS_Rosmery_Titulo_2018.pdf http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/2/license.txt http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/3/2_EPIS_Rosmery_Titulo_2018.pdf.txt http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/4/2_EPIS_Rosmery_Titulo_2018.pdf.jpg |
| bitstream.checksum.fl_str_mv |
a1d1d2e36a6f58b239e112ba105b6a4b 8a4605be74aa9ea9d79846c1fba20a33 aede695efaf87c01635fa949e993a1a5 d33241df61c6dd9f3c8268c7348a8684 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Universidad Nacional José María Arguedas |
| repository.mail.fl_str_mv |
repositorio@unajma.edu.pe |
| _version_ |
1846881215458574336 |
| spelling |
Huillcen Baca, Herwin AlaynJimenez Palomino, Rosmery2018-06-13T13:30:06Z2018-06-13T13:30:06Z2018https://hdl.handle.net/20.500.14168/323El ciberbullying es problema mundial y nuestro país no es ajeno a ello. Este va incrementado y las personas que son víctimas de ello son cada vez más. El propósito de esta investigación es ayudar a mitigar este problema, para lo cual se propone un modelo de clasificación de comentarios de textos agresivos. La metodología que se empleó fue KDD (Knowledge Discovery in Databases), esta nos permitió determinar la influencia del corpus de conocimiento (Database) en la clasificación de comentarios de textos agresivos, basados en las técnicas de minería de textos. Las etapas que se desarrollaron fueron: 1) Selección de datos, 2) Procesamiento, 3) Transformación, 4) Data Mining, 5) Interpretación y evaluación. En la primera etapa, se extrajo los comentarios de textos de las redes sociales. En la segunda etapa, se realizó la limpieza de los datos. En la tercera etapa, se convirtió los datos al formato ARFF de la herramienta weka. En la cuarta etapa, se hizo usó de las técnicas y algoritmos de clasificación de weka. En la quinta etapa, se evaluó e interpretó los resultados obtenidos de los algoritmos NaiveBayes, BayesNet, DecisionStump, J48, OneR, PART, SMO, IBK y KStart. El menor Error Absoluto Medio fue de 0.09 adquirido por el algoritmo IBK con una data de 1561 comentarios de textos, teniendo una precisión de clasificación del 89.3%. Con su modelo de clasificación, se implementó un servicio web de clasificación de comentarios de textos agresivos al cual se denominó “duke classifier”. El servicio web duke classifier, puede ser empleado por cualquier persona que desee integrarlo a su blog, microblogging, red social, etc. O estudiado por otros investigadores que estén interesados en el tema.Tesisapplication/pdfspaUniversidad Nacional José María Arguedasinfo:pe-repo/semantics/datasetSUNEDUinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licences/by-nc-nd/2.5/pe/Universidad Nacional José María ArguedasRepositorio Institucional - UNAJMAreponame:UNAJMA-Institucionalinstname:Universidad Nacional José María Arguedasinstacron:UNAJMATécnicas de minería de textoswekamodelo de clasificacióncorpus conocimientoKDDservicio webanálisis de sentimientosInfluencia del Aprendizaje Computacional Basado en Técnicas de Minería de Textos en la Clasificación de Comentarios de Textos Agresivosinfo:eu-repo/semantics/bachelorThesisIngeniero de SistemasUniversidad Nacional José María Arguedas. Facultad de IngenieríaBachillerIngeniería de SistemasPresencialORIGINAL2_EPIS_Rosmery_Titulo_2018.pdf2_EPIS_Rosmery_Titulo_2018.pdfapplication/pdf4406556http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/1/2_EPIS_Rosmery_Titulo_2018.pdfa1d1d2e36a6f58b239e112ba105b6a4bMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXT2_EPIS_Rosmery_Titulo_2018.pdf.txt2_EPIS_Rosmery_Titulo_2018.pdf.txtExtracted texttext/plain172769http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/3/2_EPIS_Rosmery_Titulo_2018.pdf.txtaede695efaf87c01635fa949e993a1a5MD53THUMBNAIL2_EPIS_Rosmery_Titulo_2018.pdf.jpg2_EPIS_Rosmery_Titulo_2018.pdf.jpgGenerated Thumbnailimage/jpeg4628http://repositorio.unajma.edu.pe/bitstream/20.500.14168/323/4/2_EPIS_Rosmery_Titulo_2018.pdf.jpgd33241df61c6dd9f3c8268c7348a8684MD5420.500.14168/323oai:repositorio.unajma.edu.pe:20.500.14168/3232022-08-17 22:17:33.69Universidad Nacional José María Arguedasrepositorio@unajma.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| score |
12.636967 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).