Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering

Descripción del Articulo

La adaptación de las tecnologías digitales y la aplicación de Internet en las organizaciones, personas y dispositivos, generan una cantidad extraordinaria de datos en diversas áreas de la ciencia como por ejemplo: minería de datos, big data, clasificación de patrones, reconocimiento de imágenes, int...

Descripción completa

Detalles Bibliográficos
Autor: Alvarez Mamani, Edwin
Formato: tesis de maestría
Fecha de Publicación:2021
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/6098
Enlace del recurso:http://hdl.handle.net/20.500.12918/6098
Nivel de acceso:acceso abierto
Materia:Algoritmos Bioinspirados
Social Spider Optimization
Algoritmos paralelos
Modelos de Isla
Clustering
http://purl.org/pe-repo/ocde/ford#1.02.01
id RUNS_fa5499887acf195b54ab90467ef78d1d
oai_identifier_str oai:repositorio.unsaac.edu.pe:20.500.12918/6098
network_acronym_str RUNS
network_name_str UNSAAC-Institucional
repository_id_str
spelling Enciso Rodas, LauroAlvarez Mamani, Edwin2021-12-20T22:06:27Z2021-12-20T22:06:27Z2021253T20211066http://hdl.handle.net/20.500.12918/6098La adaptación de las tecnologías digitales y la aplicación de Internet en las organizaciones, personas y dispositivos, generan una cantidad extraordinaria de datos en diversas áreas de la ciencia como por ejemplo: minería de datos, big data, clasificación de patrones, reconocimiento de imágenes, inteligencia de negocios, bioinformática, detección de outliers e IoT. En consecuencia estos datos requieren ser analizados, procesados y almacenados. El proceso de análisis generalmente trae dificultades computacionales como el tiempo de ejecución y la calidad de los resultados. Clustering es una de las técnicas de clasificación mas utilizadas para analizar grandes y pequeños volúmenes de datos. En la literatura se puede hallar algoritmos como por ejemplo: Social Spider Optimization (SSO), K-means, Artificial Bee Colony (ABC), Particle Swarm Optimization (PSO), Genetic Algorithms (GA). En este trabajo se implementa la versión paralela del algoritmo SSO, esta implementación es denominada como Parallel Social Spider Optimization (P-SSO). El objetivo de esta investigación es mejorar la precisión de la métrica y el tiempo de ejecución del algoritmo SSO. Para el desarrollo de la implementación se utilizó el mecanismo de modelo de isla con topologías estáticas y topologías dinámicas. En la etapa experimental los algoritmos propuestos se ejecutaron 50 veces, para lo cual se usó 9 dataset del repositorio UCI Machine Learning Repository. Tambien se realizó un análisis estadístico para comparar el algoritmo SSO con el algoritmo P-SSO. Los resultados muestran que los modelos paralelos del algoritmo P-SSO en promedio son 15 veces más rápido que el algoritmo SSO para clasificar grandes volúmenes de datos y 28 veces más rápido para pequeños volúmenes de datos. Así mismo se verifico que la métrica generada de la suma de las distancias Euclidianas para el algoritmo P-SSO es muy similar a la métrica resultante del algoritmo SSO y para algunos dataset este valor es más óptimo. Finalmente, se verifico que los modelos paralelos del algoritmo P-SSO convergen más lento que el algoritmo SSO. Esto constituye un aporte significativo en mejorar el tiempo de ejecución de estos algoritmos para resolver problemas de clustering, con métricas muy favorables que verifican la solución.Financiado por la UNSAACapplication/pdfspaUniversidad Nacional de San Antonio Abad del CuscoPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Algoritmos BioinspiradosSocial Spider OptimizationAlgoritmos paralelosModelos de IslaClusteringhttp://purl.org/pe-repo/ocde/ford#1.02.01Paralelización del algoritmo basado en el comportamiento social de las arañas para clusteringinfo:eu-repo/semantics/masterThesisreponame:UNSAAC-Institucionalinstname:Universidad Nacional de San Antonio Abad del Cuscoinstacron:UNSAACSUNEDUMaestro en Ciencias mención InformáticaUniversidad Nacional de San Antonio Abad del Cusco. Escuela de PosgradoMaestría en Ciencias mención Informática44421404https://orcid.org/0000-0001-6266-083823853228http://purl.org/pe-repo/renati/type#tesishttp://purl.org/pe-repo/renati/nivel#maestro611027Palomino Olivera, EmilioChullo Llave, BorisRozas Huacho, Javier ArturoOrmeño Ayala, Yeshica IselaORIGINAL253T20211066_TC.pdfapplication/pdf1325302http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/6098/1/253T20211066_TC.pdff535b56f0c4f69ff6d533514cbfb4468MD5120.500.12918/6098oai:repositorio.unsaac.edu.pe:20.500.12918/60982021-12-20 17:14:34.48DSpace de la UNSAACsoporte.repositorio@unsaac.edu.pe
dc.title.es_PE.fl_str_mv Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
title Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
spellingShingle Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
Alvarez Mamani, Edwin
Algoritmos Bioinspirados
Social Spider Optimization
Algoritmos paralelos
Modelos de Isla
Clustering
http://purl.org/pe-repo/ocde/ford#1.02.01
title_short Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
title_full Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
title_fullStr Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
title_full_unstemmed Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
title_sort Paralelización del algoritmo basado en el comportamiento social de las arañas para clustering
author Alvarez Mamani, Edwin
author_facet Alvarez Mamani, Edwin
author_role author
dc.contributor.advisor.fl_str_mv Enciso Rodas, Lauro
dc.contributor.author.fl_str_mv Alvarez Mamani, Edwin
dc.subject.es_PE.fl_str_mv Algoritmos Bioinspirados
Social Spider Optimization
Algoritmos paralelos
Modelos de Isla
Clustering
topic Algoritmos Bioinspirados
Social Spider Optimization
Algoritmos paralelos
Modelos de Isla
Clustering
http://purl.org/pe-repo/ocde/ford#1.02.01
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#1.02.01
description La adaptación de las tecnologías digitales y la aplicación de Internet en las organizaciones, personas y dispositivos, generan una cantidad extraordinaria de datos en diversas áreas de la ciencia como por ejemplo: minería de datos, big data, clasificación de patrones, reconocimiento de imágenes, inteligencia de negocios, bioinformática, detección de outliers e IoT. En consecuencia estos datos requieren ser analizados, procesados y almacenados. El proceso de análisis generalmente trae dificultades computacionales como el tiempo de ejecución y la calidad de los resultados. Clustering es una de las técnicas de clasificación mas utilizadas para analizar grandes y pequeños volúmenes de datos. En la literatura se puede hallar algoritmos como por ejemplo: Social Spider Optimization (SSO), K-means, Artificial Bee Colony (ABC), Particle Swarm Optimization (PSO), Genetic Algorithms (GA). En este trabajo se implementa la versión paralela del algoritmo SSO, esta implementación es denominada como Parallel Social Spider Optimization (P-SSO). El objetivo de esta investigación es mejorar la precisión de la métrica y el tiempo de ejecución del algoritmo SSO. Para el desarrollo de la implementación se utilizó el mecanismo de modelo de isla con topologías estáticas y topologías dinámicas. En la etapa experimental los algoritmos propuestos se ejecutaron 50 veces, para lo cual se usó 9 dataset del repositorio UCI Machine Learning Repository. Tambien se realizó un análisis estadístico para comparar el algoritmo SSO con el algoritmo P-SSO. Los resultados muestran que los modelos paralelos del algoritmo P-SSO en promedio son 15 veces más rápido que el algoritmo SSO para clasificar grandes volúmenes de datos y 28 veces más rápido para pequeños volúmenes de datos. Así mismo se verifico que la métrica generada de la suma de las distancias Euclidianas para el algoritmo P-SSO es muy similar a la métrica resultante del algoritmo SSO y para algunos dataset este valor es más óptimo. Finalmente, se verifico que los modelos paralelos del algoritmo P-SSO convergen más lento que el algoritmo SSO. Esto constituye un aporte significativo en mejorar el tiempo de ejecución de estos algoritmos para resolver problemas de clustering, con métricas muy favorables que verifican la solución.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-12-20T22:06:27Z
dc.date.available.none.fl_str_mv 2021-12-20T22:06:27Z
dc.date.issued.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
dc.identifier.other.none.fl_str_mv 253T20211066
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12918/6098
identifier_str_mv 253T20211066
url http://hdl.handle.net/20.500.12918/6098
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.en_US.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.en_US.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:UNSAAC-Institucional
instname:Universidad Nacional de San Antonio Abad del Cusco
instacron:UNSAAC
instname_str Universidad Nacional de San Antonio Abad del Cusco
instacron_str UNSAAC
institution UNSAAC
reponame_str UNSAAC-Institucional
collection UNSAAC-Institucional
bitstream.url.fl_str_mv http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/6098/1/253T20211066_TC.pdf
bitstream.checksum.fl_str_mv f535b56f0c4f69ff6d533514cbfb4468
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv DSpace de la UNSAAC
repository.mail.fl_str_mv soporte.repositorio@unsaac.edu.pe
_version_ 1742881442071838720
score 13.871978
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).