Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers
Descripción del Articulo
El presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están pla...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2021 |
Institución: | Universidad Nacional de San Antonio Abad del Cusco |
Repositorio: | UNSAAC-Institucional |
Lenguaje: | español |
OAI Identifier: | oai:repositorio.unsaac.edu.pe:20.500.12918/5702 |
Enlace del recurso: | http://hdl.handle.net/20.500.12918/5702 |
Nivel de acceso: | acceso abierto |
Materia: | Clustering Data streaming Estructura disjoint-set Feature vector http://purl.org/pe-repo/ocde/ford#2.02.04 |
id |
RUNS_ace31c0c6240ecf32b90cd63e92c11df |
---|---|
oai_identifier_str |
oai:repositorio.unsaac.edu.pe:20.500.12918/5702 |
network_acronym_str |
RUNS |
network_name_str |
UNSAAC-Institucional |
repository_id_str |
|
spelling |
Villafuerte Serna, RonyCampos Ardiles, Isaac2021-06-02T01:35:31Z2021-06-02T01:35:31Z2021253T20210054http://hdl.handle.net/20.500.12918/5702El presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están planteados no pueden resolver el caso particular que será objeto de este estudio. Por ello un nuevo problema llama- do Data Streaming Clustering fue propuesto y fue objeto de investigación de muchos estudios. Este problema está definido como el clustering de un flujo de datos recibidos continuamente. Data Streaming clustering tiene como objetivo encontrar y mantener un conjunto de clusters válidos en un continuo y posiblemente ilimitado flujo de datos. Teniendo en cuenta las limitantes actuales en la tecnología como la capacidad de la memoria o limitaciones en el tiempo computacional. Es importante tener en cuenta que los algoritmos para el problema de clustering no pueden resolver eficientemente el problema en estudio sin una previa modificación, ya que no toman en cuenta estas características. Debido a las características de este problema los algoritmos planteados para resolver el problema de Data Streaming clustering pueden ser usados para minería de datos con características especiales como outliers o ruido en los datos, como grabaciones telefónicas, transacciones bancarias, información de redes sociales. En esta investigación se presenta el diseño e implementación de un algoritmo para Data Streaming Clustering para datasets con clusters irregulares, outliers y sin necesidad de un conocimiento previo del número de clusters, además se realiza un análisis y discusión sobre los resultados.application/pdfspaUniversidad Nacional de San Antonio Abad del CuscoPEinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/ClusteringData streamingEstructura disjoint-setFeature vectorhttp://purl.org/pe-repo/ocde/ford#2.02.04Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliersinfo:eu-repo/semantics/bachelorThesisreponame:UNSAAC-Institucionalinstname:Universidad Nacional de San Antonio Abad del Cuscoinstacron:UNSAACSUNEDUIngeniero Informático y de SistemasUniversidad Nacional de San Antonio Abad del Cusco. Facultad de Ingeniería Eléctrica, Electrónica, Informática y MecánicaIngeniería Informática y de Sistemas71490146https://orcid.org/0000-0003-4607-522X23957778http://purl.org/pe-repo/renati/type#tesishttp://purl.org/pe-repo/renati/nivel#tituloProfesional612296Gamarra Saldivar, EnriquePalma Ttito, Luis BeltranAlzamora Paredes, Robert WilbertMedrano Valencia, Ivan CesarORIGINAL253T20210054_TC.pdfapplication/pdf1397474http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/5702/1/253T20210054_TC.pdfe956f3dab19c6a275bbaa824a0f37851MD5120.500.12918/5702oai:repositorio.unsaac.edu.pe:20.500.12918/57022021-06-01 20:47:23.147DSpace de la UNSAACsoporte.repositorio@unsaac.edu.pe |
dc.title.es_PE.fl_str_mv |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
title |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
spellingShingle |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers Campos Ardiles, Isaac Clustering Data streaming Estructura disjoint-set Feature vector http://purl.org/pe-repo/ocde/ford#2.02.04 |
title_short |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
title_full |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
title_fullStr |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
title_full_unstemmed |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
title_sort |
Algoritmo para el problema data streaming clustering para conjuntos amorfos y con outliers |
author |
Campos Ardiles, Isaac |
author_facet |
Campos Ardiles, Isaac |
author_role |
author |
dc.contributor.advisor.fl_str_mv |
Villafuerte Serna, Rony |
dc.contributor.author.fl_str_mv |
Campos Ardiles, Isaac |
dc.subject.es_PE.fl_str_mv |
Clustering Data streaming Estructura disjoint-set Feature vector |
topic |
Clustering Data streaming Estructura disjoint-set Feature vector http://purl.org/pe-repo/ocde/ford#2.02.04 |
dc.subject.ocde.none.fl_str_mv |
http://purl.org/pe-repo/ocde/ford#2.02.04 |
description |
El presente trabajo tiene la finalidad de investigar sobre el tema de Clustering porque es un campo importante dentro de Machine Learning y ha sido ampliamente estudiado durante varios años. Como resultado, se desarrollaron muchos algoritmos que resuelven este problema, los cuales tal como están planteados no pueden resolver el caso particular que será objeto de este estudio. Por ello un nuevo problema llama- do Data Streaming Clustering fue propuesto y fue objeto de investigación de muchos estudios. Este problema está definido como el clustering de un flujo de datos recibidos continuamente. Data Streaming clustering tiene como objetivo encontrar y mantener un conjunto de clusters válidos en un continuo y posiblemente ilimitado flujo de datos. Teniendo en cuenta las limitantes actuales en la tecnología como la capacidad de la memoria o limitaciones en el tiempo computacional. Es importante tener en cuenta que los algoritmos para el problema de clustering no pueden resolver eficientemente el problema en estudio sin una previa modificación, ya que no toman en cuenta estas características. Debido a las características de este problema los algoritmos planteados para resolver el problema de Data Streaming clustering pueden ser usados para minería de datos con características especiales como outliers o ruido en los datos, como grabaciones telefónicas, transacciones bancarias, información de redes sociales. En esta investigación se presenta el diseño e implementación de un algoritmo para Data Streaming Clustering para datasets con clusters irregulares, outliers y sin necesidad de un conocimiento previo del número de clusters, además se realiza un análisis y discusión sobre los resultados. |
publishDate |
2021 |
dc.date.accessioned.none.fl_str_mv |
2021-06-02T01:35:31Z |
dc.date.available.none.fl_str_mv |
2021-06-02T01:35:31Z |
dc.date.issued.fl_str_mv |
2021 |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
dc.identifier.other.none.fl_str_mv |
253T20210054 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12918/5702 |
identifier_str_mv |
253T20210054 |
url |
http://hdl.handle.net/20.500.12918/5702 |
dc.language.iso.es_PE.fl_str_mv |
spa |
language |
spa |
dc.relation.ispartof.fl_str_mv |
SUNEDU |
dc.rights.en_US.fl_str_mv |
info:eu-repo/semantics/openAccess |
dc.rights.uri.*.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
dc.format.en_US.fl_str_mv |
application/pdf |
dc.publisher.es_PE.fl_str_mv |
Universidad Nacional de San Antonio Abad del Cusco |
dc.publisher.country.none.fl_str_mv |
PE |
dc.source.none.fl_str_mv |
reponame:UNSAAC-Institucional instname:Universidad Nacional de San Antonio Abad del Cusco instacron:UNSAAC |
instname_str |
Universidad Nacional de San Antonio Abad del Cusco |
instacron_str |
UNSAAC |
institution |
UNSAAC |
reponame_str |
UNSAAC-Institucional |
collection |
UNSAAC-Institucional |
bitstream.url.fl_str_mv |
http://repositorio.unsaac.edu.pe/bitstream/20.500.12918/5702/1/253T20210054_TC.pdf |
bitstream.checksum.fl_str_mv |
e956f3dab19c6a275bbaa824a0f37851 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
repository.name.fl_str_mv |
DSpace de la UNSAAC |
repository.mail.fl_str_mv |
soporte.repositorio@unsaac.edu.pe |
_version_ |
1742881428162478080 |
score |
13.814859 |
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).