Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping

Descripción del Articulo

La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual...

Descripción completa

Detalles Bibliográficos
Autor: Cauna Huanca, Gerardino Juvenal
Formato: tesis de maestría
Fecha de Publicación:2021
Institución:Universidad Nacional Del Altiplano
Repositorio:UNAP-Institucional
Lenguaje:español
OAI Identifier:oai:https://repositorio.unap.edu.pe:20.500.14082/16821
Enlace del recurso:http://repositorio.unap.edu.pe/handle/20.500.14082/16821
Nivel de acceso:acceso abierto
Materia:Paquetes
Recuperación de información
Sistema web
Scraping
Turismo
https://purl.org/pe-repo/ocde/ford#1.02.02
id RNAP_93332ef10ca4d3acb7ce695041ebafa7
oai_identifier_str oai:https://repositorio.unap.edu.pe:20.500.14082/16821
network_acronym_str RNAP
network_name_str UNAP-Institucional
repository_id_str 9382
dc.title.es_PE.fl_str_mv Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
title Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
spellingShingle Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
Cauna Huanca, Gerardino Juvenal
Paquetes
Recuperación de información
Sistema web
Scraping
Turismo
https://purl.org/pe-repo/ocde/ford#1.02.02
title_short Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
title_full Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
title_fullStr Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
title_full_unstemmed Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
title_sort Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scraping
author Cauna Huanca, Gerardino Juvenal
author_facet Cauna Huanca, Gerardino Juvenal
author_role author
dc.contributor.advisor.fl_str_mv Laura Murillo, Ramiro Pedro
dc.contributor.author.fl_str_mv Cauna Huanca, Gerardino Juvenal
dc.subject.es_PE.fl_str_mv Paquetes
Recuperación de información
Sistema web
Scraping
Turismo
topic Paquetes
Recuperación de información
Sistema web
Scraping
Turismo
https://purl.org/pe-repo/ocde/ford#1.02.02
dc.subject.ocde.es_PE.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.02
description La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual pueda almacenar información de los diferentes paquetes turísticos que son ofertados por las agencias de viaje que operan en la región de Puno utilizando la técnica del web Scraping. La población está conformada por 38 páginas web según inscritas en IPERÚ Puno. Para la elaboración del algoritmo de extracción se utilizó la metodología de desarrollo de software XP y para el contaste de la hipótesis se utilizó prueba de rangos con signo de Wilcoxon. Como resultado, el análisis de la estructura DOM permitió el desarrollo del algoritmo de extracción, haciendo uso de Python como lenguaje de programación, también se puso a prueba la eficiencia del algoritmo, el cual demostró ser eficiente en comparación con la el programa webscraper. Se determinó que la complejidad algorítmica es lineal O(n). Del desempeño de nuestro sitio web según la puntuación global de PageSpeed Insights está en la categoría rápida (97 puntos). La evaluación del sitio web basado en la norma ISO 25000 proporcionó una valoración de 6.96/10 puntos como calidad total, considerado como nivel aceptable y grado satisfactorio. Se concluye que la implementación del sitio web facilita la búsqueda de diferentes paquetes turísticos, reduciendo el tiempo empleado de forma significativa p-valor (0.015)< α(0.05)
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-10-14T18:08:49Z
dc.date.available.none.fl_str_mv 2021-10-14T18:08:49Z
dc.date.issued.fl_str_mv 2021-07-21
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unap.edu.pe/handle/20.500.14082/16821
url http://repositorio.unap.edu.pe/handle/20.500.14082/16821
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.es_PE.fl_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
eu_rights_str_mv openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/deed.es
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional del Altiplano. Repositorio Institucional
dc.publisher.country.es_PE.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional del Altiplano
Repositorio Institucional - UNAP
dc.source.none.fl_str_mv reponame:UNAP-Institucional
instname:Universidad Nacional Del Altiplano
instacron:UNAP
instname_str Universidad Nacional Del Altiplano
instacron_str UNAP
institution UNAP
reponame_str UNAP-Institucional
collection UNAP-Institucional
bitstream.url.fl_str_mv https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/1/Gerardino_Juvenal_Cauna_Huanca.pdf
https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/2/license.txt
https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/3/Gerardino_Juvenal_Cauna_Huanca.pdf.txt
bitstream.checksum.fl_str_mv ffa7c040396d615443a7cb516cee4c5c
c52066b9c50a8f86be96c82978636682
6c9b221ef9675897f89bbd0ab723c7f7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositorio institucional de la Universidad Nacional del Altiplano
repository.mail.fl_str_mv dspace-help@myu.edu
_version_ 1819880833050214400
spelling Laura Murillo, Ramiro PedroCauna Huanca, Gerardino Juvenal2021-10-14T18:08:49Z2021-10-14T18:08:49Z2021-07-21http://repositorio.unap.edu.pe/handle/20.500.14082/16821La técnica del Web Scraping permite la extracción de contenido de varios sitios web, recabando información de interés para el usuario; a fin de ser presentada de forma ordenada y estructurada para su posterior utilización. El presente proyecto tiene como finalidad desarrollar un sitio web en la cual pueda almacenar información de los diferentes paquetes turísticos que son ofertados por las agencias de viaje que operan en la región de Puno utilizando la técnica del web Scraping. La población está conformada por 38 páginas web según inscritas en IPERÚ Puno. Para la elaboración del algoritmo de extracción se utilizó la metodología de desarrollo de software XP y para el contaste de la hipótesis se utilizó prueba de rangos con signo de Wilcoxon. Como resultado, el análisis de la estructura DOM permitió el desarrollo del algoritmo de extracción, haciendo uso de Python como lenguaje de programación, también se puso a prueba la eficiencia del algoritmo, el cual demostró ser eficiente en comparación con la el programa webscraper. Se determinó que la complejidad algorítmica es lineal O(n). Del desempeño de nuestro sitio web según la puntuación global de PageSpeed Insights está en la categoría rápida (97 puntos). La evaluación del sitio web basado en la norma ISO 25000 proporcionó una valoración de 6.96/10 puntos como calidad total, considerado como nivel aceptable y grado satisfactorio. Se concluye que la implementación del sitio web facilita la búsqueda de diferentes paquetes turísticos, reduciendo el tiempo empleado de forma significativa p-valor (0.015)< α(0.05)Tesisapplication/pdfspaUniversidad Nacional del Altiplano. Repositorio InstitucionalPEinfo:eu-repo/semantics/openAccesshttps://creativecommons.org/licenses/by/4.0/deed.esUniversidad Nacional del AltiplanoRepositorio Institucional - UNAPreponame:UNAP-Institucionalinstname:Universidad Nacional Del Altiplanoinstacron:UNAPPaquetesRecuperación de informaciónSistema webScrapingTurismohttps://purl.org/pe-repo/ocde/ford#1.02.02Indexación de sitios web para optimizar la búsqueda de paquetes turísticos de la región de Puno basado en Web Scrapinginfo:eu-repo/semantics/masterThesisSUNEDUMagister Scientiae en Informática mención en Gerencia de Tecnologías de Información y ComunicacionesInformática mención en Gerencia de Tecnologías de Información y ComunicacionesUniversidad Nacional del Altiplano. Escuela de PosgradoMaestríahttps://orcid.org/0000-0003-1837-487141939172https://purl.org/pe-repo/renati/type#tesishttps://purl.org/pe-repo/renati/nivel#maestro612177Huata Panca, PercyChoquejahua Acero, RemoAleman Gonzales, Leonid45537302ORIGINALGerardino_Juvenal_Cauna_Huanca.pdfGerardino_Juvenal_Cauna_Huanca.pdfapplication/pdf4859094https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/1/Gerardino_Juvenal_Cauna_Huanca.pdfffa7c040396d615443a7cb516cee4c5cMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/2/license.txtc52066b9c50a8f86be96c82978636682MD52TEXTGerardino_Juvenal_Cauna_Huanca.pdf.txtGerardino_Juvenal_Cauna_Huanca.pdf.txtExtracted texttext/plain141648https://repositorio.unap.edu.pe/bitstream/20.500.14082/16821/3/Gerardino_Juvenal_Cauna_Huanca.pdf.txt6c9b221ef9675897f89bbd0ab723c7f7MD5320.500.14082/16821oai:https://repositorio.unap.edu.pe:20.500.14082/168212022-11-04 19:46:09.24Repositorio institucional de la Universidad Nacional del Altiplanodspace-help@myu.edu77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.754011
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).