Aproximación matemática y computacional del motor de búsqueda Google

Descripción del Articulo

En el presente proyecto de tesis se presenta al algoritmo de PageRank de forma detallada retomando la teoría de cadena de Markov, contemplando algunas definiciones y propiedades útiles para la compresión del algoritmo, bien como el método de las potencias para la obtención de los valores propios y v...

Descripción completa

Detalles Bibliográficos
Autor: Rojas Tenazoa, Julio Martin
Formato: tesis de grado
Fecha de Publicación:2016
Institución:Universidad Nacional De La Amazonía Peruana
Repositorio:UNAPIquitos-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unapiquitos.edu.pe:20.500.12737/5411
Enlace del recurso:http://repositorio.unapiquitos.edu.pe/handle/20.500.12737/5411
Nivel de acceso:acceso abierto
Materia:Algoritmos computacionales
Sitios web
Tráfico en los sitios web
Navegadores web
http://purl.org/pe-repo/ocde/ford#2.02.04
id UNAP_bd58e3da6c817ecc15a0da49410bead2
oai_identifier_str oai:repositorio.unapiquitos.edu.pe:20.500.12737/5411
network_acronym_str UNAP
network_name_str UNAPIquitos-Institucional
repository_id_str 4362
dc.title.es_PE.fl_str_mv Aproximación matemática y computacional del motor de búsqueda Google
title Aproximación matemática y computacional del motor de búsqueda Google
spellingShingle Aproximación matemática y computacional del motor de búsqueda Google
Rojas Tenazoa, Julio Martin
Algoritmos computacionales
Sitios web
Tráfico en los sitios web
Navegadores web
http://purl.org/pe-repo/ocde/ford#2.02.04
title_short Aproximación matemática y computacional del motor de búsqueda Google
title_full Aproximación matemática y computacional del motor de búsqueda Google
title_fullStr Aproximación matemática y computacional del motor de búsqueda Google
title_full_unstemmed Aproximación matemática y computacional del motor de búsqueda Google
title_sort Aproximación matemática y computacional del motor de búsqueda Google
author Rojas Tenazoa, Julio Martin
author_facet Rojas Tenazoa, Julio Martin
author_role author
dc.contributor.advisor.fl_str_mv García Cortegano, Carlos Alberto
dc.contributor.author.fl_str_mv Rojas Tenazoa, Julio Martin
dc.subject.es_PE.fl_str_mv Algoritmos computacionales
Sitios web
Tráfico en los sitios web
Navegadores web
topic Algoritmos computacionales
Sitios web
Tráfico en los sitios web
Navegadores web
http://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.es_PE.fl_str_mv http://purl.org/pe-repo/ocde/ford#2.02.04
description En el presente proyecto de tesis se presenta al algoritmo de PageRank de forma detallada retomando la teoría de cadena de Markov, contemplando algunas definiciones y propiedades útiles para la compresión del algoritmo, bien como el método de las potencias para la obtención de los valores propios y vectores propios dominantes de una matriz estocástica, así como el teorema de Perron-Frobenius que bajo ciertas condiciones nos asegura la existencia del vector buscado(vector PageRank); con el objetivo de proveer un principio teórico para el entendimiento del algoritmo. Enseguida, a fin de entender las diferentes situaciones que el modelo puede enfrentar, una simulación será presentada en este trabajo. En particular estamos interesados en construir de manera aproximada un buscador tipo Google. En el primer capítulo de esta tesis enunciaremos el cimiento matemático necesario para el entendimiento del algoritmo, explicaremos Cadena de Markov, Norma de vectores, Dependencia e independencia lineal, valores y vectores propios, multiplicidad algebraica y geométrica, matriz diagonizable, teorema de Perron-Frobenius y métodos de las potencias; seguidamente detallaremos definiciones de Web Crawler así como el funcionamiento del mismo, haciendo uso del software OpenWebSpider, luego abordaremos el software PAJEK, que nos permite visualizar nuestro espacio web analizado por el Crawler y finalmente daremos un detalle breve del uso del Matlab, en particular orientado al algebra lineal. En el segundo capítulo detallaremos el algoritmo de ordenación usado por Google y lo aplicaremos matemáticamente, haciendo un planteamiento del modelo. En el tercer capítulo, mediante dos casos de estudios y con dos grafos asociados con una red que consta de 5 y 4 páginas, detallaremos el algoritmo de ordenamiento de Google, empleando las definiciones vistas en los capítulos preliminares. La última parte estará dedicada a la simulación del algoritmo, para ello detallaremos las acciones que realizará el Crawler, seguidamente mediante la integración entre PAJEK y Matlab generemos la matriz de adyacencia, para que finalmente aplicando funciones y comando orientados al algebra lineal en Matlab, simularemos el funcionamiento del motor de búsqueda Google.
publishDate 2016
dc.date.accessioned.none.fl_str_mv 2018-06-18T16:11:03Z
dc.date.available.none.fl_str_mv 2018-06-18T16:11:03Z
dc.date.issued.fl_str_mv 2016
dc.type.es_PE.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.uri.none.fl_str_mv http://repositorio.unapiquitos.edu.pe/handle/20.500.12737/5411
url http://repositorio.unapiquitos.edu.pe/handle/20.500.12737/5411
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.es_PE.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.*.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 United States
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/us/
eu_rights_str_mv openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 United States
http://creativecommons.org/licenses/by-nc-nd/3.0/us/
dc.format.es_PE.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad de la Amazonía Peruana
dc.source.es_PE.fl_str_mv Universidad Nacional de la Amazonía Peruana
Repositorio institucional - UNAP
dc.source.none.fl_str_mv reponame:UNAPIquitos-Institucional
instname:Universidad Nacional De La Amazonía Peruana
instacron:UNAPIquitos
instname_str Universidad Nacional De La Amazonía Peruana
instacron_str UNAPIquitos
institution UNAPIquitos
reponame_str UNAPIquitos-Institucional
collection UNAPIquitos-Institucional
bitstream.url.fl_str_mv https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/7/Julio_Tesis_Titulo_2016.pdf.jpg
https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/1/Julio_Tesis_Titulo_2016.pdf
https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/2/license_rdf
https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/3/license.txt
https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/6/Julio_Tesis_Titulo_2016.pdf.txt
bitstream.checksum.fl_str_mv c4e9012a67e8bf0a2f9b38713c0940f0
28a4a9c7f08aa8d04af91bd6b830ad34
bb87e2fb4674c76d0d2e9ed07fbb9c86
c52066b9c50a8f86be96c82978636682
8d8952e12968eb3bc565a0345b1d2c81
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Digital UNAP
repository.mail.fl_str_mv repositorio.institucional@unapiquitos.edu.pe
_version_ 1841540177041817600
spelling García Cortegano, Carlos AlbertoRojas Tenazoa, Julio Martin2018-06-18T16:11:03Z2018-06-18T16:11:03Z2016http://repositorio.unapiquitos.edu.pe/handle/20.500.12737/5411En el presente proyecto de tesis se presenta al algoritmo de PageRank de forma detallada retomando la teoría de cadena de Markov, contemplando algunas definiciones y propiedades útiles para la compresión del algoritmo, bien como el método de las potencias para la obtención de los valores propios y vectores propios dominantes de una matriz estocástica, así como el teorema de Perron-Frobenius que bajo ciertas condiciones nos asegura la existencia del vector buscado(vector PageRank); con el objetivo de proveer un principio teórico para el entendimiento del algoritmo. Enseguida, a fin de entender las diferentes situaciones que el modelo puede enfrentar, una simulación será presentada en este trabajo. En particular estamos interesados en construir de manera aproximada un buscador tipo Google. En el primer capítulo de esta tesis enunciaremos el cimiento matemático necesario para el entendimiento del algoritmo, explicaremos Cadena de Markov, Norma de vectores, Dependencia e independencia lineal, valores y vectores propios, multiplicidad algebraica y geométrica, matriz diagonizable, teorema de Perron-Frobenius y métodos de las potencias; seguidamente detallaremos definiciones de Web Crawler así como el funcionamiento del mismo, haciendo uso del software OpenWebSpider, luego abordaremos el software PAJEK, que nos permite visualizar nuestro espacio web analizado por el Crawler y finalmente daremos un detalle breve del uso del Matlab, en particular orientado al algebra lineal. En el segundo capítulo detallaremos el algoritmo de ordenación usado por Google y lo aplicaremos matemáticamente, haciendo un planteamiento del modelo. En el tercer capítulo, mediante dos casos de estudios y con dos grafos asociados con una red que consta de 5 y 4 páginas, detallaremos el algoritmo de ordenamiento de Google, empleando las definiciones vistas en los capítulos preliminares. La última parte estará dedicada a la simulación del algoritmo, para ello detallaremos las acciones que realizará el Crawler, seguidamente mediante la integración entre PAJEK y Matlab generemos la matriz de adyacencia, para que finalmente aplicando funciones y comando orientados al algebra lineal en Matlab, simularemos el funcionamiento del motor de búsqueda Google.In the present dissertation project, the PageRank algorithm is presented in detail, retaking the Markov chain theory, considering some definitions and useful properties for the compression of the algorithm, as well as the method of the powers to obtain the eigenvalues and Dominant vectors of a stochastic matrix, as well as the Perron-Frobenius theorem that under certain conditions assures us the existence of the searched vector (PageRank vector); With the aim of providing a theoretical principle for the understanding of the algorithm. Then, in order to understand the different situations that the model may face, a simulation will be presented in this paper. In particular, we are interested in constructing an approximate Google-type search engine. In the first chapter of this thesis we will enunciate the mathematical foundation necessary for the understanding of the algorithm, we will explain Markov Chain, Vector norm, Dependence and linear independence, eigenvalues and eigenvectors, algebraic and geometric multiplicity, diagonizable matrix, Perron-Frobenius theorem And methods of the powers; Then we will detail Web Crawler definitions as well as its operation, making use of the OpenWebSpider software, then we will approach the software PAJEK, which allows us to visualize our web space analyzed by the Crawler and finally we will give a brief detail of the use of Matlab, in Particularly oriented to linear algebra. In the second chapter we will detail the sort algorithm used by Google and apply it mathematically, making a model approach. In the third chapter, through two case studies and two graphs associated with a network consisting of 5 and 4 pages, we will detail the Google ranking algorithm, using the definitions seen in the preliminary chapters. The last part will be dedicated to the simulation of the algorithm, for this we will detail the actions that will perform the Crawler, then through the integration between PAJEK and Matlab we generate the adjacency matrix, so finally applying functions and commands oriented to linear algebra in Matlab, We will simulate the operation of the Google search engine.No presente projeto de teses é apresentado o algoritmo de Pagerank de forma detalhado retomando a teoria de Markov, contemplando algumas definições e propriedades úteis para a compresão de algoritmo, bem como o método das potências para a obtenção de valores próprios e vectores próprios dominantes de uma matriz estocástica, assim como o teorema de Perron-Frobenius que sob as circunstâncias assegura a existência do vetor buscado (PageRank do vetor); Com o objetivo de fornecer um princípio teórico para o entendimento de algoritmo. Enseguida, para fim de entender as diferentes situações que o modelo pode enfrentar, uma simulação será apresentado neste trabalho. Em particular estamos interessados em construir de forma aproximada um buscador tipo Google. Em primeiro capítulo de esta teses enunciaremos o cimento matemático necessário para o entendimento do algoritmo, vamos a explicar Cadeias de Markov, Norma de vetores, a dependência ea independência linear, os valores e os vetores próprios, a multiplicidade algebraica e geometrica, a matriz diagonalizável, o teorema de Perron-Frobenius e método de potências; Seguidamente detalaremos definições de Web Crawler assim como o funcionamento do mesmo, fazendo uso do software OpenWebSpider, depois abordaremos o software PAJEK, o que nos permite visualizar nosso espaço web analizado por o Crawler e finalmente daremos um breve resumo do uso do Matlab, em particular orientado al algebra linear. No segundo capítulo detalharemos o algoritmo de ordenação usado por Google e aplicá-lo matematicamente, fazendo um planejamento do modelo. No terceiro capítulo, por meio de casos de estudos e de análises associadas a uma rede que consta de cinco e quatro paginas, detalharemos o algoritmo de ordenamento do Google, usando as definições vistas nos capítulos preliminares. A última parte será dedicada a uma simulação do algoritmo, detalharemos as ações que realizaram o Crawler, em seguida através da integração entre PAJEK e Matlab generemos a matriz de adjacência finalmente aplicando funções e comandos orientados a álgebra linear em Matlab, simularemos o funcionamento do motor de busca Google.Tesisapplication/pdfspaUniversidad de la Amazonía Peruanainfo:eu-repo/semantics/openAccessAttribution-NonCommercial-NoDerivs 3.0 United Stateshttp://creativecommons.org/licenses/by-nc-nd/3.0/us/Universidad Nacional de la Amazonía PeruanaRepositorio institucional - UNAPreponame:UNAPIquitos-Institucionalinstname:Universidad Nacional De La Amazonía Peruanainstacron:UNAPIquitosAlgoritmos computacionalesSitios webTráfico en los sitios webNavegadores webhttp://purl.org/pe-repo/ocde/ford#2.02.04Aproximación matemática y computacional del motor de búsqueda Googleinfo:eu-repo/semantics/bachelorThesisSUNEDUIngeniería de Sistemas e InformáticaUniversidad Nacional de la Amazonía Peruana. Facultad de Ingeniería de Sistemas e InformáticaTítulo ProfesionalIngeniero en Sistemas e InformáticaRegularTHUMBNAILJulio_Tesis_Titulo_2016.pdf.jpgJulio_Tesis_Titulo_2016.pdf.jpgGenerated Thumbnailimage/jpeg3364https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/7/Julio_Tesis_Titulo_2016.pdf.jpgc4e9012a67e8bf0a2f9b38713c0940f0MD57ORIGINALJulio_Tesis_Titulo_2016.pdfJulio_Tesis_Titulo_2016.pdfTexto Completoapplication/pdf3805192https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/1/Julio_Tesis_Titulo_2016.pdf28a4a9c7f08aa8d04af91bd6b830ad34MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/2/license_rdfbb87e2fb4674c76d0d2e9ed07fbb9c86MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81327https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/3/license.txtc52066b9c50a8f86be96c82978636682MD53TEXTJulio_Tesis_Titulo_2016.pdf.txtJulio_Tesis_Titulo_2016.pdf.txtExtracted texttext/plain189240https://repositorio.unapiquitos.edu.pe/bitstream/20.500.12737/5411/6/Julio_Tesis_Titulo_2016.pdf.txt8d8952e12968eb3bc565a0345b1d2c81MD5620.500.12737/5411oai:repositorio.unapiquitos.edu.pe:20.500.12737/54112022-01-22 19:45:58.194Repositorio Digital UNAPrepositorio.institucional@unapiquitos.edu.pe77u/TGljZW5jaWEgZGUgVXNvCiAKRWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbCwgZGlmdW5kZSBtZWRpYW50ZSBsb3MgdHJhYmFqb3MgZGUgaW52ZXN0aWdhY2nDs24gcHJvZHVjaWRvcyBwb3IgbG9zIG1pZW1icm9zIGRlIGxhIHVuaXZlcnNpZGFkLiBFbCBjb250ZW5pZG8gZGUgbG9zIGRvY3VtZW50b3MgZGlnaXRhbGVzIGVzIGRlIGFjY2VzbyBhYmllcnRvIHBhcmEgdG9kYSBwZXJzb25hIGludGVyZXNhZGEuCgpTZSBhY2VwdGEgbGEgZGlmdXNpw7NuIHDDumJsaWNhIGRlIGxhIG9icmEsIHN1IGNvcGlhIHkgZGlzdHJpYnVjacOzbi4gUGFyYSBlc3RvIGVzIG5lY2VzYXJpbyBxdWUgc2UgY3VtcGxhIGNvbiBsYXMgc2lndWllbnRlcyBjb25kaWNpb25lczoKCkVsIG5lY2VzYXJpbyByZWNvbm9jaW1pZW50byBkZSBsYSBhdXRvcsOtYSBkZSBsYSBvYnJhLCBpZGVudGlmaWNhbmRvIG9wb3J0dW5hIHkgY29ycmVjdGFtZW50ZSBhIGxhIHBlcnNvbmEgcXVlIHBvc2VhIGxvcyBkZXJlY2hvcyBkZSBhdXRvci4KCk5vIGVzdMOhIHBlcm1pdGlkbyBlbCB1c28gaW5kZWJpZG8gZGVsIHRyYWJham8gZGUgaW52ZXN0aWdhY2nDs24gY29uIGZpbmVzIGRlIGx1Y3JvIG8gY3VhbHF1aWVyIHRpcG8gZGUgYWN0aXZpZGFkIHF1ZSBwcm9kdXpjYSBnYW5hbmNpYXMgYSBsYXMgcGVyc29uYXMgcXVlIGxvIGRpZnVuZGVuIHNpbiBlbCBjb25zZW50aW1pZW50byBkZWwgYXV0b3IgKGF1dG9yIGxlZ2FsKS4KCkxvcyBkZXJlY2hvcyBtb3JhbGVzIGRlbCBhdXRvciBubyBzb24gYWZlY3RhZG9zIHBvciBsYSBwcmVzZW50ZSBsaWNlbmNpYSBkZSB1c28uCgpEZXJlY2hvcyBkZSBhdXRvcgoKTGEgdW5pdmVyc2lkYWQgbm8gcG9zZWUgbG9zIGRlcmVjaG9zIGRlIHByb3BpZWRhZCBpbnRlbGVjdHVhbC4gTG9zIGRlcmVjaG9zIGRlIGF1dG9yIHNlIGVuY3VlbnRyYW4gcHJvdGVnaWRvcyBwb3IgbGEgbGVnaXNsYWNpw7NuIHBlcnVhbmE6IExleSBzb2JyZSBlbCBEZXJlY2hvIGRlIEF1dG9yIHByb211bGdhZG8gZW4gMTk5NiAoRC5MLiBOwrA4MjIpLCBMZXkgcXVlIG1vZGlmaWNhIGxvcyBhcnTDrWN1bG9zIDE4OMKwIHkgMTg5wrAgZGVsIGRlY3JldG8gbGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZGVyZWNob3MgZGUgYXV0b3IgcHJvbXVsZ2FkbyBlbiAyMDA1IChMZXkgTsKwMjg1MTcpLCBEZWNyZXRvIExlZ2lzbGF0aXZvIHF1ZSBhcHJ1ZWJhIGxhIG1vZGlmaWNhY2nDs24gZGVsIERlY3JldG8gTGVnaXNsYXRpdm8gTsKwODIyLCBMZXkgc29icmUgZWwgRGVyZWNobyBkZSBBdXRvciBwcm9tdWxnYWRvIGVuIDIwMDggKEQuTC4gTsKwMTA3NikuCg==
score 13.4481325
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).