Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas

Descripción del Articulo

Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias b...

Descripción completa

Detalles Bibliográficos
Autor: Medina Mamani, Vivian Solange
Formato: tesis de grado
Fecha de Publicación:2024
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/18791
Enlace del recurso:https://hdl.handle.net/20.500.12773/18791
Nivel de acceso:acceso abierto
Materia:Referencias Bibliográficas
BERT
Clasificación Binaria
https://purl.org/pe-repo/ocde/ford#2.02.04
id UNSA_88d0095e310944423b062703c968e939
oai_identifier_str oai:repositorio.unsa.edu.pe:20.500.12773/18791
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
spelling Castro Gutierrez, Eveling GloriaMedina Mamani, Vivian Solange2024-10-22T21:49:31Z2024-10-22T21:49:31Z2024Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias bibliográficas. Utilizando técnicas de Inteligencia Artificial esta tarea debe ser de forma automática. Además, se ha detectado que una cita incompleta dificulta o impide el acceso al trabajo referenciado. Este artículo expone dos modelos de predicción de clasificación binaria basados en Bidirectional Encoder Representation from Transformers (BERT) para el análisis y clasificación de referencias bibliográficas en el formato APA. Los dos modelos de predicción propuestos tienen asignado un único conjunto de datos de 16002 referencias bibliográficas. El primer modelo obtenido mediante la técnica de aumento de datos de generación manual alcanzó una puntuación de 0.99 en las métricas de exactitud, puntuación F1 y sensibilidad, mientras que en la métrica precisión obtuvo 0.98. Asimismo, en el modelo de predicción con la técnica de aumento de datos de generación automatizada se obtuvo la puntuación de 0.99 en exactitud, sensibilidad, puntuación F1 y precisión. Los resultados indican que los modelos propuestos están alcanzando un rendimiento mayor en comparación con los modelos de la literatura.application/pdfhttps://hdl.handle.net/20.500.12773/18791spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAReferencias BibliográficasBERTClasificación Binariahttps://purl.org/pe-repo/ocde/ford#2.02.04Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficasinfo:eu-repo/semantics/bachelorThesisSUNEDU29695284https://orcid.org/0000-0002-0203-041X72221337612076Huertas Niquen, Percy OscarSaire Peralta, Edwar AbrilCastro Gutierrez, Eveling Gloriahttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisIngeniería de SistemasUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosIngeniera de SistemasTHUMBNAILPDF.jpgimage/jpeg42566https://repositorio.unsa.edu.pe/bitstreams/7aa925dc-ba62-4d41-8adb-a2f1e94fe131/downloadeaa4ac57f1dcfae112ab6dd5b8fb68c9MD54ORIGINALTesis.pdfapplication/pdf1252361https://repositorio.unsa.edu.pe/bitstreams/912d8de1-5c4e-4f55-b827-f05a3691dce1/downloadcbcb0c0fab2a2edb8a0b1b3cbd6c58c9MD51Reporte de Similitud.pdfapplication/pdf2738922https://repositorio.unsa.edu.pe/bitstreams/6ec46959-24df-4abb-b54c-c6acf1beb8f7/downloaded8daea9561b8d1b6c11f211014ad073MD52Autorización de Publicación Digital.pdfapplication/pdf87022https://repositorio.unsa.edu.pe/bitstreams/94970e0e-afc2-4149-acd2-32a07ee91b29/download436843d5db490862d6fbef1fa2b55bf5MD5320.500.12773/18791oai:repositorio.unsa.edu.pe:20.500.12773/187912024-10-23 15:12:35.145http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe
dc.title.es_PE.fl_str_mv Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
title Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
spellingShingle Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
Medina Mamani, Vivian Solange
Referencias Bibliográficas
BERT
Clasificación Binaria
https://purl.org/pe-repo/ocde/ford#2.02.04
title_short Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
title_full Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
title_fullStr Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
title_full_unstemmed Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
title_sort Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
author Medina Mamani, Vivian Solange
author_facet Medina Mamani, Vivian Solange
author_role author
dc.contributor.advisor.fl_str_mv Castro Gutierrez, Eveling Gloria
dc.contributor.author.fl_str_mv Medina Mamani, Vivian Solange
dc.subject.es_PE.fl_str_mv Referencias Bibliográficas
BERT
Clasificación Binaria
topic Referencias Bibliográficas
BERT
Clasificación Binaria
https://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#2.02.04
description Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias bibliográficas. Utilizando técnicas de Inteligencia Artificial esta tarea debe ser de forma automática. Además, se ha detectado que una cita incompleta dificulta o impide el acceso al trabajo referenciado. Este artículo expone dos modelos de predicción de clasificación binaria basados en Bidirectional Encoder Representation from Transformers (BERT) para el análisis y clasificación de referencias bibliográficas en el formato APA. Los dos modelos de predicción propuestos tienen asignado un único conjunto de datos de 16002 referencias bibliográficas. El primer modelo obtenido mediante la técnica de aumento de datos de generación manual alcanzó una puntuación de 0.99 en las métricas de exactitud, puntuación F1 y sensibilidad, mientras que en la métrica precisión obtuvo 0.98. Asimismo, en el modelo de predicción con la técnica de aumento de datos de generación automatizada se obtuvo la puntuación de 0.99 en exactitud, sensibilidad, puntuación F1 y precisión. Los resultados indican que los modelos propuestos están alcanzando un rendimiento mayor en comparación con los modelos de la literatura.
publishDate 2024
dc.date.accessioned.none.fl_str_mv 2024-10-22T21:49:31Z
dc.date.available.none.fl_str_mv 2024-10-22T21:49:31Z
dc.date.issued.fl_str_mv 2024
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12773/18791
url https://hdl.handle.net/20.500.12773/18791
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/7aa925dc-ba62-4d41-8adb-a2f1e94fe131/download
https://repositorio.unsa.edu.pe/bitstreams/912d8de1-5c4e-4f55-b827-f05a3691dce1/download
https://repositorio.unsa.edu.pe/bitstreams/6ec46959-24df-4abb-b54c-c6acf1beb8f7/download
https://repositorio.unsa.edu.pe/bitstreams/94970e0e-afc2-4149-acd2-32a07ee91b29/download
bitstream.checksum.fl_str_mv eaa4ac57f1dcfae112ab6dd5b8fb68c9
cbcb0c0fab2a2edb8a0b1b3cbd6c58c9
ed8daea9561b8d1b6c11f211014ad073
436843d5db490862d6fbef1fa2b55bf5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv repositorio@unsa.edu.pe
_version_ 1828763067280785408
score 13.936249
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).