Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno

Descripción del Articulo

Los Repositorios Institucionales permiten organizar y preservar la producción científica de una Institución, la presente investigación tiene como finalidad optimizar la extracción de metadatos y publicación de documentos de investigación procesos fundamentales para la administración de Repositorios...

Descripción completa

Detalles Bibliográficos
Autor: Herrera Urtiaga, Alain Paul
Formato: tesis de maestría
Fecha de Publicación:2022
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/18923
Enlace del recurso:http://repositorio.unap.edu.pe/handle/20.500.14082/18923
Nivel de acceso:acceso abierto
Materia:Algoritmos
Herramienta
Extracción automática
Metadatos Procesamiento de lenguaje natural
https://purl.org/pe-repo/ocde/ford#1.02.02
id RNAP_ed84d4b5d442e48d712986a50be75bd7
oai_identifier_str oai:https://repositorio.unap.edu.pe:20.500.14082/18923
network_acronym_str RNAP
network_name_str UNAP-Institucional
repository_id_str 9382
dc.title.es_PE.fl_str_mv Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
title Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
spellingShingle Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
Herrera Urtiaga, Alain Paul
Algoritmos
Herramienta
Extracción automática
Metadatos Procesamiento de lenguaje natural
https://purl.org/pe-repo/ocde/ford#1.02.02
title_short Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
title_full Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
title_fullStr Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
title_full_unstemmed Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
title_sort Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Puno
author Herrera Urtiaga, Alain Paul
author_facet Herrera Urtiaga, Alain Paul
author_role author
dc.contributor.advisor.fl_str_mv Mendoza Mollocondo, Charles Ignacio
dc.contributor.author.fl_str_mv Herrera Urtiaga, Alain Paul
dc.subject.es_PE.fl_str_mv Algoritmos
Herramienta
Extracción automática
Metadatos Procesamiento de lenguaje natural
topic Algoritmos
Herramienta
Extracción automática
Metadatos Procesamiento de lenguaje natural
https://purl.org/pe-repo/ocde/ford#1.02.02
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.02
description Los Repositorios Institucionales permiten organizar y preservar la producción científica de una Institución, la presente investigación tiene como finalidad optimizar la extracción de metadatos y publicación de documentos de investigación procesos fundamentales para la administración de Repositorios Institucionales que requieren de tiempo, mediante la implementación del software “E-MeRI”, cuya población se compone por 1518 documentos de investigación. Para el desarrollo del sistema se utilizó la programación por capas y para el contraste de la hipótesis se utilizó prueba t para muestras relacionadas. Con respecto a la extracción automática se elaboró un algoritmo mediante técnicas de procesamiento de lenguaje natural, al cual se determinó la complejidad algorítmica lineal O(n) y demostró ser eficiente en comparación a otras herramientas extractoras. A la misma vez se determinó el nivel de precisión entre 96% y 99% de resultados correctos en base a las métricas Precisión y Recall. De la diferencia del tiempo de extracción, el sistema logra reducir en 5 minutos y 21 segundos por documento y permitió extraer en un minuto 4 documentos. Se concluye que la extracción automática de metadatos y la publicación de documentos de investigación mejoran la administración del Repositorio Institucional de la Universidad Nacional del Altiplano, reduciendo el tiempo de extracción y publicación de forma significativa con un valor p (0.000)< α=0.05, además la evaluación del software basado en la norma ISO 25000 obtuvo un valor de 8.93 de calidad total, logrando un nivel cumple con los requisitos y un grado muy satisfactorio.
publishDate 2022
dc.date.accessioned.none.fl_str_mv 2022-09-09T19:40:57Z
dc.date.available.none.fl_str_mv 2022-09-09T19:40:57Z
dc.date.issued.fl_str_mv 2022-07-22
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.version.es_PE.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.none.fl_str_mv http://repositorio.unap.edu.pe/handle/20.500.14082/18923
url http://repositorio.unap.edu.pe/handle/20.500.14082/18923
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Altiplano. Repositorio Institucional
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional del Altiplano
Repositorio Institucional - UNAP
dc.source.none.fl_str_mv reponame:UNAP-Institucional
instname:Universidad Nacional Del Altiplano
instacron:UNAP
instname_str Universidad Nacional Del Altiplano
instacron_str UNAP
institution UNAP
reponame_str UNAP-Institucional
collection UNAP-Institucional
bitstream.url.fl_str_mv https://repositorio.unap.edu.pe/bitstream/20.500.14082/18923/2/license.txt
https://repositorio.unap.edu.pe/bitstream/20.500.14082/18923/3/Alain_Paul_Herrera_Urtiaga.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
1dfdc98b402370288e829a412ddec927
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositorio institucional de la Universidad Nacional del Altiplano
repository.mail.fl_str_mv dspace-help@myu.edu
_version_ 1819880908764741632
spelling Mendoza Mollocondo, Charles IgnacioHerrera Urtiaga, Alain Paul2022-09-09T19:40:57Z2022-09-09T19:40:57Z2022-07-22http://repositorio.unap.edu.pe/handle/20.500.14082/18923Los Repositorios Institucionales permiten organizar y preservar la producción científica de una Institución, la presente investigación tiene como finalidad optimizar la extracción de metadatos y publicación de documentos de investigación procesos fundamentales para la administración de Repositorios Institucionales que requieren de tiempo, mediante la implementación del software “E-MeRI”, cuya población se compone por 1518 documentos de investigación. Para el desarrollo del sistema se utilizó la programación por capas y para el contraste de la hipótesis se utilizó prueba t para muestras relacionadas. Con respecto a la extracción automática se elaboró un algoritmo mediante técnicas de procesamiento de lenguaje natural, al cual se determinó la complejidad algorítmica lineal O(n) y demostró ser eficiente en comparación a otras herramientas extractoras. A la misma vez se determinó el nivel de precisión entre 96% y 99% de resultados correctos en base a las métricas Precisión y Recall. De la diferencia del tiempo de extracción, el sistema logra reducir en 5 minutos y 21 segundos por documento y permitió extraer en un minuto 4 documentos. Se concluye que la extracción automática de metadatos y la publicación de documentos de investigación mejoran la administración del Repositorio Institucional de la Universidad Nacional del Altiplano, reduciendo el tiempo de extracción y publicación de forma significativa con un valor p (0.000)< α=0.05, además la evaluación del software basado en la norma ISO 25000 obtuvo un valor de 8.93 de calidad total, logrando un nivel cumple con los requisitos y un grado muy satisfactorio.application/pdfspaUniversidad Nacional del Altiplano. Repositorio InstitucionalPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esUniversidad Nacional del AltiplanoRepositorio Institucional - UNAPreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPAlgoritmosHerramientaExtracción automáticaMetadatos Procesamiento de lenguaje naturalhttps://purl.org/pe-repo/ocde/ford#1.02.02Extracción automática de metadatos para la administración del Repositorio Institucional de la Universidad Nacional del Altiplano Punoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionSUNEDUMagister Scientiae en Informática Mención en Gerencia de Tecnologías de Información y ComunicacionesInformática mención en Gerencia de Tecnologías de Información y ComunicacionesUniversidad Nacional del Altiplano. Escuela de Posgradohttps://orcid.org/0000-0002-4766-270101314674https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#maestro612177Paredes Quispe, Juan ReynaldoChoquejahua Acero, RemoVillasante Saravia, Fredy Heric70163154LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unap.edu.pe/bitstream/20.500.14082/18923/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALAlain_Paul_Herrera_Urtiaga.pdfAlain_Paul_Herrera_Urtiaga.pdfapplication/pdf3636499https://repositorio.unap.edu.pe/bitstream/20.500.14082/18923/3/Alain_Paul_Herrera_Urtiaga.pdf1dfdc98b402370288e829a412ddec927MD5320.500.14082/18923oai:https://repositorio.unap.edu.pe:20.500.14082/189232022-11-05 03:09:31.409Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.eduTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.981864
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).