Sistema de detección de textos de contenido pedófilo basado en redes neuronales y en el método quasi-Newton
Descripción del Articulo
El problema de la investigación fue: ¿Cuál fue el efecto del uso del sistema en la sensibilidad, especificidad, precisión, exactitud, tiempo de entrenamiento, uso de RAM y uso de CPU para la detección de textos de contenido pedófilo basado en redes neuronales y en el método quasi-Newton? El objetivo...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2022 |
| Institución: | Universidad Cesar Vallejo |
| Repositorio: | UCV-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.ucv.edu.pe:20.500.12692/112855 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12692/112855 |
| Nivel de acceso: | acceso abierto |
| Materia: | Detección de textos Redes neuronales Método quasi-Newton Textos con contenido pedófilo https://purl.org/pe-repo/ocde/ford#2.02.04 |
| Sumario: | El problema de la investigación fue: ¿Cuál fue el efecto del uso del sistema en la sensibilidad, especificidad, precisión, exactitud, tiempo de entrenamiento, uso de RAM y uso de CPU para la detección de textos de contenido pedófilo basado en redes neuronales y en el método quasi-Newton? El objetivo general de la investigación fue determinar el efecto del uso del sistema en la sensibilidad, especificidad, precisión, exactitud, tiempo de entrenamiento, uso de RAM y uso de CPU para la detección de textos de contenido pedófilo basado en redes neuronales y en el método quasi-Newton, por ello se plantea un sistema que sea capaz de detectar conversaciones con contenido pedófilo usando redes neuronales. La investigación realizada fue de tipo aplicada, con un enfoque cuantitativo, el diseño fue experimental y el tipo de diseño fue de preexperimental. Para el estudio se usó 967 conversaciones, las cuales contienen conversaciones con contenido pedófilo obtenidas de perverted-justice y conversaciones sin contenido pedófilo obtenidas de fuentes como IRC Log. Donde se compraron los resultados de la investigación con los algoritmos LR para la sensibilidad y exactitud, XGBoost para la precisión, KNN para el tiempo de entrenamiento y la red neuronal perceptrón multicapa para la especificidad, uso de RAM y uso de CPU. Se obtuvieron los siguientes resultados: un incremento a la sensibilidad de un 74%, una reducción de la especificidad de un 1.98%, incremento de la precisión de un 3.25%, una reducción de la exactitud de un 3.05%, un aumento en el tiempo de entrenamiento de un 59.9%, un aumento de uso de RAM de un 578% y una reducción de uso de CPU de un 98.03%. Finalmente, se recomienda elaborar un corpus de datos de contenido pedófilo en español, ya que no se cuenta con este tipo de conversaciones en este idioma; también se recomienda implementar el uso de frameworks como TensorFlow o PyTorch ya que están especializados para el aprendizaje automático. |
|---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).