Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers

Descripción del Articulo

El presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están pla...

Descripción completa

Detalles Bibliográficos
Autor: Campos Ardiles, Isaac
Formato: tesis de grado
Fecha de Publicación:2021
Institución:Universidad Nacional de San Antonio Abad del Cusco
Repositorio:UNSAAC-Institucional
Lenguaje:español
OAI Identifier:oai:repositorio.unsaac.edu.pe:20.500.12918/5702
Enlace del recurso:http://hdl.handle.net/20.500.12918/5702
Nivel de acceso:acceso abierto
Materia:Clustering
Data streaming
Estructura disjoint-set
Feature vector
http://purl.org/pe-repo/ocde/ford#2.02.04
id RUNS_ace31c0c6240ecf32b90cd63e92c11df
oai_identifier_str oai:repositorio.unsaac.edu.pe:20.500.12918/5702
network_acronym_str RUNS
network_name_str UNSAAC-Institucional
repository_id_str
spelling Villafuerte Serna, RonyCampos Ardiles, Isaac2021-06-02T01:35:31Z2021-06-02T01:35:31Z2021253T20210054http://hdl.handle.net/20.500.12918/5702El presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están planteados no pueden resolver el caso particular que será objeto de este estudio. Por ello un nuevo problema llama- do Data Streaming Clustering fue propuesto y fue objeto de investigación de muchos estudios. Este problema está definido como el clustering de un flujo de datos recibidos continuamente. Data Streaming clustering tiene como objetivo encontrar y mantener un conjunto de clusters válidos en un continuo y posiblemente ilimitado flujo de datos. Teniendo en cuenta las limitantes actuales en la tecnología como la capacidad de la memoria o limitaciones en el tiempo computacional. Es importante tener en cuenta que los algoritmos para el problema de clustering no pueden resolver eficientemente el problema en estudio sin una previa modificación, ya que no toman en cuenta estas características. Debido a las características de este problema los algoritmos planteados para resolver el problema de Data Streaming clustering pueden ser usados para minería de datos con características especiales como outliers o ruido en los datos, como grabaciones telefónicas, transacciones bancarias, información de redes sociales. En esta investigación se presenta el diseño e implementación de un algoritmo para Data Streaming Clustering para datasets con clusters irregulares, outliers y sin necesidad de un conocimiento previo del número de clusters, además se realiza un análisis y discusión sobre los resultados.application/pdfspaUniversidad Nacional de San Antonio Abad del CuscoPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/ClusteringData streamingEstructura disjoint-setFeature vectorhttp://purl.org/pe-repo/ocde/ford#2.02.04Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliersinfo:eu-repo/semantics/bachelorThesisreponame:UNSAAC-Institucionalinstname:Universidad Nacional de San Antonio Abad del Cuscoinstacron:UNSAACSUNEDUIngeniero Informático y de SistemasUniversidad Nacional de San Antonio Abad del Cusco. Facultad de Ingeniería Eléctrica, Electrónica, Informática y MecánicaIngeniería Informática y de Sistemas71490146https://orcid.org/0000-0003-4607-522X23957778http://purl.org/pe-repo/renati/type#tesishttp://purl.org/pe-repo/renati/nivel#tituloProfesional612296Gamarra Saldivar, EnriquePalma Ttito, Luis BeltranAlzamora Paredes, Robert WilbertMedrano Valencia, Ivan CesarORIGINAL253T20210054_TC.pdfapplication/pdf1397474http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/5702/1/253T20210054_TC.pdfe956f3dab19c6a275bbaa824a0f37851MD5120.500.12918/5702oai:repositorio.unsaac.edu.pe:20.500.12918/57022021-06-01 20:47:23.147DSpace de la UNSAACsoporte.repositorio@unsaac.edu.pe
dc.title.es_PE.fl_str_mv Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
title Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
spellingShingle Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
Campos Ardiles, Isaac
Clustering
Data streaming
Estructura disjoint-set
Feature vector
http://purl.org/pe-repo/ocde/ford#2.02.04
title_short Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
title_full Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
title_fullStr Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
title_full_unstemmed Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
title_sort Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
author Campos Ardiles, Isaac
author_facet Campos Ardiles, Isaac
author_role author
dc.contributor.advisor.fl_str_mv Villafuerte Serna, Rony
dc.contributor.author.fl_str_mv Campos Ardiles, Isaac
dc.subject.es_PE.fl_str_mv Clustering
Data streaming
Estructura disjoint-set
Feature vector
topic Clustering
Data streaming
Estructura disjoint-set
Feature vector
http://purl.org/pe-repo/ocde/ford#2.02.04
dc.subject.ocde.none.fl_str_mv http://purl.org/pe-repo/ocde/ford#2.02.04
description El presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están planteados no pueden resolver el caso particular que será objeto de este estudio. Por ello un nuevo problema llama- do Data Streaming Clustering fue propuesto y fue objeto de investigación de muchos estudios. Este problema está definido como el clustering de un flujo de datos recibidos continuamente. Data Streaming clustering tiene como objetivo encontrar y mantener un conjunto de clusters válidos en un continuo y posiblemente ilimitado flujo de datos. Teniendo en cuenta las limitantes actuales en la tecnología como la capacidad de la memoria o limitaciones en el tiempo computacional. Es importante tener en cuenta que los algoritmos para el problema de clustering no pueden resolver eficientemente el problema en estudio sin una previa modificación, ya que no toman en cuenta estas características. Debido a las características de este problema los algoritmos planteados para resolver el problema de Data Streaming clustering pueden ser usados para minería de datos con características especiales como outliers o ruido en los datos, como grabaciones telefónicas, transacciones bancarias, información de redes sociales. En esta investigación se presenta el diseño e implementación de un algoritmo para Data Streaming Clustering para datasets con clusters irregulares, outliers y sin necesidad de un conocimiento previo del número de clusters, además se realiza un análisis y discusión sobre los resultados.
publishDate 2021
dc.date.accessioned.none.fl_str_mv 2021-06-02T01:35:31Z
dc.date.available.none.fl_str_mv 2021-06-02T01:35:31Z
dc.date.issued.fl_str_mv 2021
dc.type.none.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
dc.identifier.other.none.fl_str_mv 253T20210054
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12918/5702
identifier_str_mv 253T20210054
url http://hdl.handle.net/20.500.12918/5702
dc.language.iso.es_PE.fl_str_mv spa
language spa
dc.relation.ispartof.fl_str_mv SUNEDU
dc.rights.en_US.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.en_US.fl_str_mv application/pdf
dc.publisher.es_PE.fl_str_mv Universidad Nacional de San Antonio Abad del Cusco
dc.publisher.country.none.fl_str_mv PE
dc.source.none.fl_str_mv reponame:UNSAAC-Institucional
instname:Universidad Nacional de San Antonio Abad del Cusco
instacron:UNSAAC
instname_str Universidad Nacional de San Antonio Abad del Cusco
instacron_str UNSAAC
institution UNSAAC
reponame_str UNSAAC-Institucional
collection UNSAAC-Institucional
bitstream.url.fl_str_mv http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/5702/1/253T20210054_TC.pdf
bitstream.checksum.fl_str_mv e956f3dab19c6a275bbaa824a0f37851
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv DSpace de la UNSAAC
repository.mail.fl_str_mv soporte.repositorio@unsaac.edu.pe
_version_ 1742881428162478080
score 13.814859
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).