BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering

Descripción del Articulo

En los últimos años, el modelo de programación MapReduce se ha convertido en una de las herramientas con mayor adopción para el tratamiento de Big Data, sin embargo, el rendimiento de MapReduce puede verse seriamente afectado por las tareas stragglers, las cuales son tareas que tienen un tiempo de e...

Descripción completa

Detalles Bibliográficos
Autor: Apaza Veliz, Ronald Darwin
Formato: tesis de maestría
Fecha de Publicación:2018
Institución:Universidad Nacional de San Agustín
Repositorio:UNSA-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsa.edu.pe:20.500.12773/16348
Enlace del recurso:https://hdl.handle.net/20.500.12773/16348
Nivel de acceso:acceso abierto
Materia:Computacion de alto desempeño
MapReduce
Planificación especulativa
https://purl.org/pe-repo/ocde/ford#1.02.01
id UNSA_34ef4a9d31ce08c4c468b18c92fc7822
oai_identifier_str oai:repositorio.unsa.edu.pe:20.500.12773/16348
network_acronym_str UNSA
network_name_str UNSA-Institucional
repository_id_str 4847
dc.title.none.fl_str_mv BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
title BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
spellingShingle BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
Apaza Veliz, Ronald Darwin
Computacion de alto desempeño
MapReduce
Planificación especulativa
https://purl.org/pe-repo/ocde/ford#1.02.01
title_short BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
title_full BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
title_fullStr BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
title_full_unstemmed BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
title_sort BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clustering
author Apaza Veliz, Ronald Darwin
author_facet Apaza Veliz, Ronald Darwin
author_role author
dc.contributor.advisor.fl_str_mv Mamani Aliaga, Alvaro Henry
dc.contributor.author.fl_str_mv Apaza Veliz, Ronald Darwin
dc.subject.none.fl_str_mv Computacion de alto desempeño
MapReduce
Planificación especulativa
topic Computacion de alto desempeño
MapReduce
Planificación especulativa
https://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.none.fl_str_mv https://purl.org/pe-repo/ocde/ford#1.02.01
description En los últimos años, el modelo de programación MapReduce se ha convertido en una de las herramientas con mayor adopción para el tratamiento de Big Data, sin embargo, el rendimiento de MapReduce puede verse seriamente afectado por las tareas stragglers, las cuales son tareas que tienen un tiempo de ejecución anormalmente prolongado y que podrían ocasionar que se extienda el tiempo de ejecución de toda la aplicación; el mecanismo utilizado por MapReduce para hacer frente a este problema es el planificador especulativo, este se encarga de detectar las tareas stragglers e iniciar copias de estas en nodos distintos al que se está ejecutando la tarea original, sin embargo, herramientas MapReduce como Hadoop, aún presentan un bajo rendimiento en su planificación especulativa y esto se debe a que los planificadores utilizados calculan el progreso de las tareas con mecanismos estáticos, esto ocasiona que se detecten tareas stragglers de forma errónea y que en consecuencia las copias iniciadas para estas tareas solo desperdicien recursos del sistema, mientras que las verdaderas tareas stragglers continuarán prolongando el tiempo de ejecución de toda la aplicación, por este motivo, en este trabajo se propone utilizar técnicas de agrupamiento para mejorar la estimación del progreso de las tareas MapReduce y así lograr que los planificadores especulativos tengan una mayor precisión en la selección de tareas stragglers.
publishDate 2018
dc.date.accessioned.none.fl_str_mv 2023-08-01T15:45:01Z
dc.date.available.none.fl_str_mv 2023-08-01T15:45:01Z
dc.date.issued.fl_str_mv 2018
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.12773/16348
url https://hdl.handle.net/20.500.12773/16348
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.en_US.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.en_US.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
dc.publisher.country.none.fl_str_mv PE
dc.source.es_PE.fl_str_mv Universidad Nacional de San Agustín de Arequipa
Repositorio Institucional - UNSA
dc.source.none.fl_str_mv reponame:UNSA-Institucional
instname:Universidad Nacional de San Agustín
instacron:UNSA
instname_str Universidad Nacional de San Agustín
instacron_str UNSA
institution UNSA
reponame_str UNSA-Institucional
collection UNSA-Institucional
bitstream.url.fl_str_mv https://repositorio.unsa.edu.pe/bitstreams/34bb3657-d1c1-428b-a7aa-6a45a64e2d54/download
https://repositorio.unsa.edu.pe/bitstreams/2e56c3c4-038d-4ea2-b502-8bf99d06c646/download
https://repositorio.unsa.edu.pe/bitstreams/d1dc8b40-f474-4913-bc48-c0faf8e9eb80/download
https://repositorio.unsa.edu.pe/bitstreams/ac019ad3-16f3-45d3-a1da-2048ab57b72d/download
https://repositorio.unsa.edu.pe/bitstreams/75b1955f-aa41-4126-8cec-f364b4b02297/download
bitstream.checksum.fl_str_mv 2fb45f754d0c9bd9bb1571e0e663d3ac
420c7e8d23d9567614023e4ee1e5c4ae
119daf914d3c8706c7e4952ff2f7f3bf
8a4605be74aa9ea9d79846c1fba20a33
eaa4ac57f1dcfae112ab6dd5b8fb68c9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional UNSA
repository.mail.fl_str_mv repositorio@unsa.edu.pe
_version_ 1828763054787002368
spelling Mamani Aliaga, Alvaro HenryApaza Veliz, Ronald Darwin2023-08-01T15:45:01Z2023-08-01T15:45:01Z2018En los últimos años, el modelo de programación MapReduce se ha convertido en una de las herramientas con mayor adopción para el tratamiento de Big Data, sin embargo, el rendimiento de MapReduce puede verse seriamente afectado por las tareas stragglers, las cuales son tareas que tienen un tiempo de ejecución anormalmente prolongado y que podrían ocasionar que se extienda el tiempo de ejecución de toda la aplicación; el mecanismo utilizado por MapReduce para hacer frente a este problema es el planificador especulativo, este se encarga de detectar las tareas stragglers e iniciar copias de estas en nodos distintos al que se está ejecutando la tarea original, sin embargo, herramientas MapReduce como Hadoop, aún presentan un bajo rendimiento en su planificación especulativa y esto se debe a que los planificadores utilizados calculan el progreso de las tareas con mecanismos estáticos, esto ocasiona que se detecten tareas stragglers de forma errónea y que en consecuencia las copias iniciadas para estas tareas solo desperdicien recursos del sistema, mientras que las verdaderas tareas stragglers continuarán prolongando el tiempo de ejecución de toda la aplicación, por este motivo, en este trabajo se propone utilizar técnicas de agrupamiento para mejorar la estimación del progreso de las tareas MapReduce y así lograr que los planificadores especulativos tengan una mayor precisión en la selección de tareas stragglers.application/pdfhttps://hdl.handle.net/20.500.12773/16348spaUniversidad Nacional de San Agustín de ArequipaPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Universidad Nacional de San Agustín de ArequipaRepositorio Institucional - UNSAreponame:UNSA-Institucionalinstname:Universidad Nacional de San Agustíninstacron:UNSAComputacion de alto desempeñoMapReducePlanificación especulativahttps://purl.org/pe-repo/ocde/ford#1.02.01BISAMR: Una mejora al algoritmo autoadaptativo Mapreduce usando Clusteringinfo:eu-repo/semantics/masterThesisSUNEDU41751906https://orcid.org/0000-0003-3321-893045821637Nina Choquehuayta, WilderYari Ramos, Yessenia DeysiMamani Aliaga, Alvaro Henryhttp://purl.org/pe-repo/renati/level#maestrohttp://purl.org/pe-repo/renati/type#tesisMaestría en Ciencias: Informática, con mención en Tecnologías de InformaciónUniversidad Nacional de San Agustín de Arequipa.Unidad de Posgrado.Facultad de Ingeniería de Producción y ServiciosMaestro en Ciencias: Informática, con mención en Tecnologías de InformaciónORIGINALTesis.pdfapplication/pdf3594275https://repositorio.unsa.edu.pe/bitstreams/34bb3657-d1c1-428b-a7aa-6a45a64e2d54/download2fb45f754d0c9bd9bb1571e0e663d3acMD53Reporte de Similitud.pdfapplication/pdf10478687https://repositorio.unsa.edu.pe/bitstreams/2e56c3c4-038d-4ea2-b502-8bf99d06c646/download420c7e8d23d9567614023e4ee1e5c4aeMD54Autorización de Publicación Digital.pdfapplication/pdf2079466https://repositorio.unsa.edu.pe/bitstreams/d1dc8b40-f474-4913-bc48-c0faf8e9eb80/download119daf914d3c8706c7e4952ff2f7f3bfMD55LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://repositorio.unsa.edu.pe/bitstreams/ac019ad3-16f3-45d3-a1da-2048ab57b72d/download8a4605be74aa9ea9d79846c1fba20a33MD52THUMBNAILPDF.jpgimage/jpeg42566https://repositorio.unsa.edu.pe/bitstreams/75b1955f-aa41-4126-8cec-f364b4b02297/downloadeaa4ac57f1dcfae112ab6dd5b8fb68c9MD5620.500.12773/16348oai:repositorio.unsa.edu.pe:20.500.12773/163482024-07-17 12:15:05.904http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccesshttps://repositorio.unsa.edu.peRepositorio Institucional UNSArepositorio@unsa.edu.peTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
score 13.959364
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).