Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
Descripción del Articulo
Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias b...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2024 |
Institución: | Universidad Nacional de San Agustín |
Repositorio: | UNSA-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/18791 |
Enlace del recurso: | https://hdl.handle.net/20.500.12773/18791 |
Nivel de acceso: | acceso abierto |
Materia: | Referencias Bibliográficas BERT Clasificación Binaria https://purl.org/pe-repo/ocde/ford#2.02.04 |
Sumario: | Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias bibliográficas. Utilizando técnicas de Inteligencia Artificial esta tarea debe ser de forma automática. Además, se ha detectado que una cita incompleta dificulta o impide el acceso al trabajo referenciado. Este artículo expone dos modelos de predicción de clasificación binaria basados en Bidirectional Encoder Representation from Transformers (BERT) para el análisis y clasificación de referencias bibliográficas en el formato APA. Los dos modelos de predicción propuestos tienen asignado un único conjunto de datos de 16002 referencias bibliográficas. El primer modelo obtenido mediante la técnica de aumento de datos de generación manual alcanzó una puntuación de 0.99 en las métricas de exactitud, puntuación F1 y sensibilidad, mientras que en la métrica precisión obtuvo 0.98. Asimismo, en el modelo de predicción con la técnica de aumento de datos de generación automatizada se obtuvo la puntuación de 0.99 en exactitud, sensibilidad, puntuación F1 y precisión. Los resultados indican que los modelos propuestos están alcanzando un rendimiento mayor en comparación con los modelos de la literatura. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).