Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC

Descripción del Articulo

Anticiparse a lo que desea ver un usuario de una página web hoy en día es muy importante, para hacer tangible esta característica se podrían realizar periódicamente desde encuestas hasta cuestionarios complejos de realizar y complicados de consolidar, en el caso de ser esto posible habría un margen...

Descripción completa

Detalles Bibliográficos
Autor: Zamalloa Paro, Willian
Formato: tesis de maestría
Fecha de Publicación:2019
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/4602
Enlace del recurso:http://hdl.handle.net/20.500.12918/4602
Nivel de acceso:acceso abierto
Materia:Minería de datos
Minería web
Minería de uso web
Log
Reglas de asociación
http://purl.org/pe-repo/ocde/ford#1.02.01
id RUNS_fd87d6177ea876e459babe518a8b4b85
oai_identifier_str oai:repositorio.unsaac.edu.pe:20.500.12918/4602
network_acronym_str RUNS
network_name_str UNSAAC-Institucional
repository_id_str
dc.title.es_PE.fl_str_mv Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
title Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
spellingShingle Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
Zamalloa Paro, Willian
Minería de datos
Minería web
Minería de uso web
Log
Reglas de asociación
http://purl.org/pe-repo/ocde/ford#1.02.01
title_short Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
title_full Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
title_fullStr Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
title_full_unstemmed Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
title_sort Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAAC
author Zamalloa Paro, Willian
author_facet Zamalloa Paro, Willian
author_role author
dc.contributor.advisor.fl_str_mv Acurio Usca, Nila Zonia
dc.contributor.author.fl_str_mv Zamalloa Paro, Willian
dc.subject.es_PE.fl_str_mv Minería de datos
Minería web
Minería de uso web
Log
Reglas de asociación
topic Minería de datos
Minería web
Minería de uso web
Log
Reglas de asociación
http://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#1.02.01
description Anticiparse a lo que desea ver un usuario de una página web hoy en día es muy importante, para hacer tangible esta característica se podrían realizar periódicamente desde encuestas hasta cuestionarios complejos de realizar y complicados de consolidar, en el caso de ser esto posible habría un margen de error. Por consiguiente, para el presente proyecto se tiene como objetivo determinar las preferencias de navegación de los usuarios de las páginas web de la UNSAAC en base a los log del servidor web del dominio www.unsaac.edu.pe.Un log es un archivo que almacena toda la interacción de los usuarios o personas que consultan información en una página web la cual guarda todas estas interacciones sin sesgo alguno.Los log utilizados en el presente proyecto fueron facilitados por la RCU (Red de Comunicaciones UNSAAC) los que corresponden al año 2017, el contenido de estos archivos en crudo no están estructurados, además no cuentan con algún tipo de pre procesamiento o procesamiento alguno.El objetivo del proyecto fue determinar las preferencias de navegación para lo cual se pasaron por dos fases, se realizó la preparación de datos y el descubrimiento de patrones, donde se realizó el pre procesamiento de datos mediante un programa de mi autoría se pasaron los log a una base de datos, en esta instancia se realizó una limpieza previa excluyendo a los log accedidos desde la ip 127.0.0.1, seguidamente se creó una base de datos de transacciones donde se realizó la siguiente limpieza en este caso excluyendo logs que contenían archivos de hojas de estilo, javascript, imágenes, bots de google e iconos, seguidamente se realizó la minería de uso web donde se aplicó la minería de reglas de asociación y finalmente la obtención y análisis de patrones.Se seleccionaron muestras significativas en forma aleatoria simple debido a que la cantidad total de logs ascendieron a 94949716 aproximadamente y el tiempo computacional para procesarlos era alto, se tomó el 3.33% haciendo que la muestra fuera de 3797989, para obtener dicha muestra se utilizó un programa que pueda dar lectura a archivos de más de 1 GB, se procedió a dividir cada uno de los 40 archivos log tomando en cuenta que la navegación del ultimo usuario en el log no se pierda, de allí que el porcentaje de la muestra no sea exacto, pero luego de la limpieza y estructuración se obtuvo 32994 transacciones donde están contenidas las preferencias de navegación.Finalmente se obtuvieron 11 reglas de asociación las cuales representan las preferencias de navegación de los usuarios, con un 90% de confianza a las cuales se les realizaron métricas de validación para descartar que dichas preferencias se deban al azar, también se obtuvo los patrones y las secuencias en que se visitan las distintas páginas de la UNSAAC y el orden en el que lo hacen, con estos resultados se demostró que mediante el proceso de minería de uso web se puede estructurar logs, también se pudo identificar las preferencias de navegación de los usuarios en función a los accesos realizados a la página web de la UNSAAC y demostrar que en archivos cercanos al big data hay preferencias ocultas y valiosas para la institución.
publishDate 2019
dc.date.accessioned.none.fl_str_mv 2019-10-29T22:37:52Z
dc.date.available.none.fl_str_mv 2019-10-29T22:37:52Z
dc.date.issued.fl_str_mv 2019
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.other.none.fl_str_mv 253T20191136
M-11/002/2019
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12918/4602
identifier_str_mv 253T20191136
M-11/002/2019
url http://hdl.handle.net/20.500.12918/4602
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.en_US.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0
dc.format.en_US.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
dc.publisher.country.none.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
Repositorio Institucional - UNSAAC
dc.source.none.fl_str_mv reponame:UNSAAC-Institucional
instname:Universidad Nacional de San Antonio Abad del Cusco
instacron:UNSAAC
instname_str Universidad Nacional de San Antonio Abad del Cusco
instacron_str UNSAAC
institution UNSAAC
reponame_str UNSAAC-Institucional
collection UNSAAC-Institucional
bitstream.url.fl_str_mv http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/4602/1/253T20191136_TC.pdf
http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/4602/2/253T20191136_TC.pdf.txt
bitstream.checksum.fl_str_mv 9e474c593980151f0ffc50f97e290151
a7ecf48c83d96aa7ea62747421e55a6a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv DSpace de la UNSAAC
repository.mail.fl_str_mv soporte.repositorio@unsaac.edu.pe
_version_ 1742881458099322880
spelling Acurio Usca, Nila ZoniaZamalloa Paro, Willian2019-10-29T22:37:52Z2019-10-29T22:37:52Z2019253T20191136M-11/002/2019http://hdl.handle.net/20.500.12918/4602Anticiparse a lo que desea ver un usuario de una página web hoy en día es muy importante, para hacer tangible esta característica se podrían realizar periódicamente desde encuestas hasta cuestionarios complejos de realizar y complicados de consolidar, en el caso de ser esto posible habría un margen de error. Por consiguiente, para el presente proyecto se tiene como objetivo determinar las preferencias de navegación de los usuarios de las páginas web de la UNSAAC en base a los log del servidor web del dominio www.unsaac.edu.pe.Un log es un archivo que almacena toda la interacción de los usuarios o personas que consultan información en una página web la cual guarda todas estas interacciones sin sesgo alguno.Los log utilizados en el presente proyecto fueron facilitados por la RCU (Red de Comunicaciones UNSAAC) los que corresponden al año 2017, el contenido de estos archivos en crudo no están estructurados, además no cuentan con algún tipo de pre procesamiento o procesamiento alguno.El objetivo del proyecto fue determinar las preferencias de navegación para lo cual se pasaron por dos fases, se realizó la preparación de datos y el descubrimiento de patrones, donde se realizó el pre procesamiento de datos mediante un programa de mi autoría se pasaron los log a una base de datos, en esta instancia se realizó una limpieza previa excluyendo a los log accedidos desde la ip 127.0.0.1, seguidamente se creó una base de datos de transacciones donde se realizó la siguiente limpieza en este caso excluyendo logs que contenían archivos de hojas de estilo, javascript, imágenes, bots de google e iconos, seguidamente se realizó la minería de uso web donde se aplicó la minería de reglas de asociación y finalmente la obtención y análisis de patrones.Se seleccionaron muestras significativas en forma aleatoria simple debido a que la cantidad total de logs ascendieron a 94949716 aproximadamente y el tiempo computacional para procesarlos era alto, se tomó el 3.33% haciendo que la muestra fuera de 3797989, para obtener dicha muestra se utilizó un programa que pueda dar lectura a archivos de más de 1 GB, se procedió a dividir cada uno de los 40 archivos log tomando en cuenta que la navegación del ultimo usuario en el log no se pierda, de allí que el porcentaje de la muestra no sea exacto, pero luego de la limpieza y estructuración se obtuvo 32994 transacciones donde están contenidas las preferencias de navegación.Finalmente se obtuvieron 11 reglas de asociación las cuales representan las preferencias de navegación de los usuarios, con un 90% de confianza a las cuales se les realizaron métricas de validación para descartar que dichas preferencias se deban al azar, también se obtuvo los patrones y las secuencias en que se visitan las distintas páginas de la UNSAAC y el orden en el que lo hacen, con estos resultados se demostró que mediante el proceso de minería de uso web se puede estructurar logs, también se pudo identificar las preferencias de navegación de los usuarios en función a los accesos realizados a la página web de la UNSAAC y demostrar que en archivos cercanos al big data hay preferencias ocultas y valiosas para la institución.Tesisapplication/pdfspaUniversidad Nacional de San Antonio Abad del CuscoPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0Universidad Nacional de San Antonio Abad del CuscoRepositorio Institucional - UNSAACreponame:UNSAAC-Institucionalinstname:Universidad Nacional de San Antonio Abad del Cuscoinstacron:UNSAACMinería de datosMinería webMinería de uso webLogReglas de asociaciónhttp://purl.org/pe-repo/ocde/ford#1.02.01Minería de uso web para identificar preferencias de navegación en las páginas web de la UNSAACinfo:eu-repo/semantics/masterThesisSUNEDUMaestro en Ciencias mención InformáticaUniversidad Nacional de San Antonio Abad del Cusco. Escuela de PosgradoMaestríaMaestría en Ciencias mención Informática23821762http://purl.org/pe-repo/renati/type#tesishttp://purl.org/pe-repo/renati/nivel#maestro611027ORIGINAL253T20191136_TC.pdfapplication/pdf2591899http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/4602/1/253T20191136_TC.pdf9e474c593980151f0ffc50f97e290151MD51TEXT253T20191136_TC.pdf.txt253T20191136_TC.pdf.txtExtracted texttext/plain205372http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/4602/2/253T20191136_TC.pdf.txta7ecf48c83d96aa7ea62747421e55a6aMD5220.500.12918/4602oai:repositorio.unsaac.edu.pe:20.500.12918/46022021-07-27 21:39:59.295DSpace de la UNSAACsoporte.repositorio@unsaac.edu.pe
score 13.914502
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).