Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
Descripción del Articulo
La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual...
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2021 |
Institución: | Universidad Nacional Del Altiplano |
Repositorio: | UNAP-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:https://repositorio.unap.edu.pe:20.500.14082/16821 |
Enlace del recurso: | http://repositorio.unap.edu.pe/handle/20.500.14082/16821 |
Nivel de acceso: | acceso abierto |
Materia: | Paquetes Recuperación de información Sistema web Scraping Turismo https://purl.org/pe-repo/ocde/ford#1.02.02 |
id |
RNAP_93332ef10ca4d3acb7ce695041ebafa7 |
---|---|
oai_identifier_str |
oai:https://repositorio.unap.edu.pe:20.500.14082/16821 |
network_acronym_str |
RNAP |
network_name_str |
UNAP-Institucional |
repository_id_str |
9382 |
dc.title.es_PE.fl_str_mv |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
title |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
spellingShingle |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping Cauna Huanca, Gerardino Juvenal Paquetes Recuperación de información Sistema web Scraping Turismo https://purl.org/pe-repo/ocde/ford#1.02.02 |
title_short |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
title_full |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
title_fullStr |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
title_full_unstemmed |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
title_sort |
Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping |
author |
Cauna Huanca, Gerardino Juvenal |
author_facet |
Cauna Huanca, Gerardino Juvenal |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Laura Murillo, Ramiro Pedro |
dc.contributor.author.fl_str_mv |
Cauna Huanca, Gerardino Juvenal |
dc.subject.es_PE.fl_str_mv |
Paquetes Recuperación de información Sistema web Scraping Turismo |
topic |
Paquetes Recuperación de información Sistema web Scraping Turismo https://purl.org/pe-repo/ocde/ford#1.02.02 |
dc.subject.ocde.es_PE.fl_str_mv |
https://purl.org/pe-repo/ocde/ford#1.02.02 |
description |
La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual pueda almacenar información de los diferentes paquetes turísticos que son ofertados por las agencias de viaje que operan en la región de Puno utilizando la técnica del web Scraping. La población está conformada por 38 páginas web según inscritas en IPERÚ Puno. Para la elaboración del algoritmo de extracción se utilizó la metodología de desarrollo de software XP y para el contaste de la hipótesis se utilizó prueba de rangos con signo de Wilcoxon. Como resultado, el análisis de la estructura DOM permitió el desarrollo del algoritmo de extracción, haciendo uso de Python como lenguaje de programación, también se puso a prueba la eficiencia del algoritmo, el cual demostró ser eficiente en comparación con la el programa webscraper. Se determinó que la complejidad algorítmica es lineal O(n). Del desempeño de nuestro sitio web según la puntuación global de PageSpeed Insights está en la categoría rápida (97 puntos). La evaluación del sitio web basado en la norma ISO 25000 proporcionó una valoración de 6.96/10 puntos como calidad total, considerado como nivel aceptable y grado satisfactorio. Se concluye que la implementación del sitio web facilita la búsqueda de diferentes paquetes turísticos, reduciendo el tiempo empleado de forma significativa p-valor (0.015)< α(0.05) |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-10-14T18:08:49Z |
dc.date.available.none.fl_str_mv |
2021-10-14T18:08:49Z |
dc.date.issued.fl_str_mv |
2021-07-21 |
dc.type.es_PE.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
dc.identifier.uri.none.fl_str_mv |
http://repositorio.unap.edu.pe/handle/20.500.14082/16821 |
url |
http://repositorio.unap.edu.pe/handle/20.500.14082/16821 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.es_PE.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.es_PE.fl_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
https://creativecommons.org/licenses/by/4.0/deed.es |
dc.format.es_PE.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad Nacional del Altiplano. Repositorio Institucional |
dc.publisher.country.es_PE.fl_str_mv |
PE |
dc.source.es_PE.fl_str_mv |
Universidad Nacional del Altiplano Repositorio Institucional - UNAP |
dc.source.none.fl_str_mv |
reponame:UNAP-Institucional instname:Universidad Nacional Del Altiplano instacron:UNAP |
instname_str |
Universidad Nacional Del Altiplano |
instacron_str |
UNAP |
institution |
UNAP |
reponame_str |
UNAP-Institucional |
collection |
UNAP-Institucional |
bitstream.url.fl_str_mv |
https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/1/Gerardino_Juvenal_Cauna_Huanca.pdf https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/2/license.txt https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/3/Gerardino_Juvenal_Cauna_Huanca.pdf.txt |
bitstream.checksum.fl_str_mv |
ffa7c040396d615443a7cb516cee4c5c c52066b9c50a8f86be96c82978636682 6c9b221ef9675897f89bbd0ab723c7f7 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio institucional de la Universidad Nacional del Altiplano |
repository.mail.fl_str_mv |
dspace-help@myu.edu |
_version_ |
1819880833050214400 |
spelling |
Laura Murillo, Ramiro PedroCauna Huanca, Gerardino Juvenal2021-10-14T18:08:49Z2021-10-14T18:08:49Z2021-07-21http://repositorio.unap.edu.pe/handle/20.500.14082/16821La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual pueda almacenar información de los diferentes paquetes turísticos que son ofertados por las agencias de viaje que operan en la región de Puno utilizando la técnica del web Scraping. La población está conformada por 38 páginas web según inscritas en IPERÚ Puno. Para la elaboración del algoritmo de extracción se utilizó la metodología de desarrollo de software XP y para el contaste de la hipótesis se utilizó prueba de rangos con signo de Wilcoxon. Como resultado, el análisis de la estructura DOM permitió el desarrollo del algoritmo de extracción, haciendo uso de Python como lenguaje de programación, también se puso a prueba la eficiencia del algoritmo, el cual demostró ser eficiente en comparación con la el programa webscraper. Se determinó que la complejidad algorítmica es lineal O(n). Del desempeño de nuestro sitio web según la puntuación global de PageSpeed Insights está en la categoría rápida (97 puntos). La evaluación del sitio web basado en la norma ISO 25000 proporcionó una valoración de 6.96/10 puntos como calidad total, considerado como nivel aceptable y grado satisfactorio. Se concluye que la implementación del sitio web facilita la búsqueda de diferentes paquetes turísticos, reduciendo el tiempo empleado de forma significativa p-valor (0.015)< α(0.05)Tesisapplication/pdfspaUniversidad Nacional del Altiplano. Repositorio InstitucionalPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esUniversidad Nacional del AltiplanoRepositorio Institucional - UNAPreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPPaquetesRecuperación de informaciónSistema webScrapingTurismohttps://purl.org/pe-repo/ocde/ford#1.02.02Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scrapinginfo:eu-repo/semantics/masterThesisSUNEDUMagister Scientiae en Informática mención en Gerencia de Tecnologías de Información y ComunicacionesInformática mención en Gerencia de Tecnologías de Información y ComunicacionesUniversidad Nacional del Altiplano. Escuela de PosgradoMaestríahttps://orcid.org/0000-0003-1837-487141939172https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#maestro612177Huata Panca, PercyChoquejahua Acero, RemoAleman Gonzales, Leonid45537302ORIGINALGerardino_Juvenal_Cauna_Huanca.pdfGerardino_Juvenal_Cauna_Huanca.pdfapplication/pdf4859094https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/1/Gerardino_Juvenal_Cauna_Huanca.pdfffa7c040396d615443a7cb516cee4c5cMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/2/license.txtc52066b9c50a8f86be96c82978636682MD52TEXTGerardino_Juvenal_Cauna_Huanca.pdf.txtGerardino_Juvenal_Cauna_Huanca.pdf.txtExtracted texttext/plain141648https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/3/Gerardino_Juvenal_Cauna_Huanca.pdf.txt6c9b221ef9675897f89bbd0ab723c7f7MD5320.500.14082/16821oai:https://repositorio.unap.edu.pe:20.500.14082/168212022-11-04 19:46:09.24Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.edu77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg== |
score |
13.754011 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).