Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas
Descripción del Articulo
Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias b...
| Autor: | |
|---|---|
| Formato: | tesis de grado |
| Fecha de Publicación: | 2024 |
| Institución: | Universidad Nacional de San Agustín |
| Repositorio: | UNSA-Institucional |
| Lenguaje: | español |
| OAI Identifier: | oai:repositorio.unsa.edu.pe:20.500.12773/18791 |
| Enlace del recurso: | https://hdl.handle.net/20.500.12773/18791 |
| Nivel de acceso: | acceso abierto |
| Materia: | Referencias Bibliográficas BERT Clasificación Binaria https://purl.org/pe-repo/ocde/ford#2.02.04 |
| id |
UNSA_88d0095e310944423b062703c968e939 |
|---|---|
| oai_identifier_str |
oai:repositorio.unsa.edu.pe:20.500.12773/18791 |
| network_acronym_str |
UNSA |
| network_name_str |
UNSA-Institucional |
| repository_id_str |
4847 |
| spelling |
Castro Gutierrez, Eveling GloriaMedina Mamani, Vivian Solange2024-10-22T21:49:31Z2024-10-22T21:49:31Z2024Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias bibliográficas. Utilizando técnicas de Inteligencia Artificial esta tarea debe ser de forma automática. Además, se ha detectado que una cita incompleta dificulta o impide el acceso al trabajo referenciado. Este artículo expone dos modelos de predicción de clasificación binaria basados en Bidirectional Encoder Representation from Transformers (BERT) para el análisis y clasificación de referencias bibliográficas en el formato APA. Los dos modelos de predicción propuestos tienen asignado un único conjunto de datos de 16002 referencias bibliográficas. El primer modelo obtenido mediante la técnica de aumento de datos de generación manual alcanzó una puntuación de 0.99 en las métricas de exactitud, puntuación F1 y sensibilidad, mientras que en la métrica precisión obtuvo 0.98. Asimismo, en el modelo de predicción con la técnica de aumento de datos de generación automatizada se obtuvo la puntuación de 0.99 en exactitud, sensibilidad, puntuación F1 y precisión. Los resultados indican que los modelos propuestos están alcanzando un rendimiento mayor en comparación con los modelos de la literatura.application/pdfhttps://hdl.handle.net/20.500.12773/18791spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAReferencias BibliográficasBERTClasificación Binariahttps://purl.org/pe-repo/ocde/ford#2.02.04Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficasinfo:eu-repo/semantics/bachelorThesisSUNEDU29695284https://orcid.org/0000-0002-0203-041X72221337612076Huertas Niquen, Percy OscarSaire Peralta, Edwar AbrilCastro Gutierrez, Eveling Gloriahttps://purl.org/pe-repo/renati/level#tituloProfesionalhttps://purl.org/pe-repo/renati/type#tesisIngeniería de SistemasUniversidad Nacional de San Agustín de Arequipa.Facultad de Ingeniería de Producción y ServiciosIngeniera de SistemasTHUMBNAILPDF.jpgimage/jpeg42566https://repositorio.unsa.edu.pe/bitstreams/7aa925dc-ba62-4d41-8adb-a2f1e94fe131/downloadeaa4ac57f1dcfae112ab6dd5b8fb68c9MD54ORIGINALTesis.pdfapplication/pdf1252361https://repositorio.unsa.edu.pe/bitstreams/912d8de1-5c4e-4f55-b827-f05a3691dce1/downloadcbcb0c0fab2a2edb8a0b1b3cbd6c58c9MD51Reporte de Similitud.pdfapplication/pdf2738922https://repositorio.unsa.edu.pe/bitstreams/6ec46959-24df-4abb-b54c-c6acf1beb8f7/downloaded8daea9561b8d1b6c11f211014ad073MD52Autorización de Publicación Digital.pdfapplication/pdf87022https://repositorio.unsa.edu.pe/bitstreams/94970e0e-afc2-4149-acd2-32a07ee91b29/download436843d5db490862d6fbef1fa2b55bf5MD5320.500.12773/18791oai:repositorio.unsa.edu.pe:20.500.12773/187912024-10-23 15:12:35.145http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.pe |
| dc.title.es_PE.fl_str_mv |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| title |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| spellingShingle |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas Medina Mamani, Vivian Solange Referencias Bibliográficas BERT Clasificación Binaria https://purl.org/pe-repo/ocde/ford#2.02.04 |
| title_short |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| title_full |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| title_fullStr |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| title_full_unstemmed |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| title_sort |
Evaluación y comparación de modelos de predicción basados en BERT para la clasificación de referencias bibliográficas |
| author |
Medina Mamani, Vivian Solange |
| author_facet |
Medina Mamani, Vivian Solange |
| author_role |
author |
| dc.contributor.advisor.fl_str_mv |
Castro Gutierrez, Eveling Gloria |
| dc.contributor.author.fl_str_mv |
Medina Mamani, Vivian Solange |
| dc.subject.es_PE.fl_str_mv |
Referencias Bibliográficas BERT Clasificación Binaria |
| topic |
Referencias Bibliográficas BERT Clasificación Binaria https://purl.org/pe-repo/ocde/ford#2.02.04 |
| dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#2.02.04 |
| description |
Dar crédito a las ideas que no son nuestras a través de las referencias bibliográficas son una parte esencial en la redacción de un trabajo científico y/o académico. Esta tarea es muy tediosa de realizar para el revisor, debido a que existe la necesidad de revisar la completitud de las referencias bibliográficas. Utilizando técnicas de Inteligencia Artificial esta tarea debe ser de forma automática. Además, se ha detectado que una cita incompleta dificulta o impide el acceso al trabajo referenciado. Este artículo expone dos modelos de predicción de clasificación binaria basados en Bidirectional Encoder Representation from Transformers (BERT) para el análisis y clasificación de referencias bibliográficas en el formato APA. Los dos modelos de predicción propuestos tienen asignado un único conjunto de datos de 16002 referencias bibliográficas. El primer modelo obtenido mediante la técnica de aumento de datos de generación manual alcanzó una puntuación de 0.99 en las métricas de exactitud, puntuación F1 y sensibilidad, mientras que en la métrica precisión obtuvo 0.98. Asimismo, en el modelo de predicción con la técnica de aumento de datos de generación automatizada se obtuvo la puntuación de 0.99 en exactitud, sensibilidad, puntuación F1 y precisión. Los resultados indican que los modelos propuestos están alcanzando un rendimiento mayor en comparación con los modelos de la literatura. |
| publishDate |
2024 |
| dc.date.accessioned.none.fl_str_mv |
2024-10-22T21:49:31Z |
| dc.date.available.none.fl_str_mv |
2024-10-22T21:49:31Z |
| dc.date.issued.fl_str_mv |
2024 |
| dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| dc.identifier.uri.none.fl_str_mv |
https://hdl.handle.net/20.500.12773/18791 |
| url |
https://hdl.handle.net/20.500.12773/18791 |
| dc.language.iso.es_PE.fl_str_mv |
spa |
| language |
spa |
| dc.relation.ispartof.fl_str_mv |
SUNEDU |
| dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
| dc.rights.uri.es_PE.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.es_PE.fl_str_mv |
application/pdf |
| dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa |
| dc.publisher.country.es_PE.fl_str_mv |
PE |
| dc.source.es_PE.fl_str_mv |
Universidad Nacional de San Agustín de Arequipa Repositorio Institucional - UNSA |
| dc.source.none.fl_str_mv |
reponame:UNSA-Institucional instname:Universidad Nacional de San Agustín instacron:UNSA |
| instname_str |
Universidad Nacional de San Agustín |
| instacron_str |
UNSA |
| institution |
UNSA |
| reponame_str |
UNSA-Institucional |
| collection |
UNSA-Institucional |
| bitstream.url.fl_str_mv |
https://repositorio.unsa.edu.pe/bitstreams/7aa925dc-ba62-4d41-8adb-a2f1e94fe131/download https://repositorio.unsa.edu.pe/bitstreams/912d8de1-5c4e-4f55-b827-f05a3691dce1/download https://repositorio.unsa.edu.pe/bitstreams/6ec46959-24df-4abb-b54c-c6acf1beb8f7/download https://repositorio.unsa.edu.pe/bitstreams/94970e0e-afc2-4149-acd2-32a07ee91b29/download |
| bitstream.checksum.fl_str_mv |
eaa4ac57f1dcfae112ab6dd5b8fb68c9 cbcb0c0fab2a2edb8a0b1b3cbd6c58c9 ed8daea9561b8d1b6c11f211014ad073 436843d5db490862d6fbef1fa2b55bf5 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositorio Institucional UNSA |
| repository.mail.fl_str_mv |
repositorio@unsa.edu.pe |
| _version_ |
1828763067280785408 |
| score |
13.936249 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).