Segmentación de empresas para identificar su tamaño empleando el algoritmo de k-means
Descripción del Articulo
Propone identificar el tamaño en base a cinco variables los ingresos, egresos, activos, pasivos y patrimonio usando información recogida por el Instituto Nacional de Estadística e Informática en la Encuesta Económica Anual ejecutada en el años 2018, donde las empresas registran información del ejerc...
Autor: | |
---|---|
Formato: | tesis de grado |
Fecha de Publicación: | 2022 |
Institución: | Universidad Nacional Mayor de San Marcos |
Repositorio: | UNMSM-Tesis |
Lenguaje: | español |
OAI Identifier: | oai:cybertesis.unmsm.edu.pe:20.500.12672/18631 |
Enlace del recurso: | https://hdl.handle.net/20.500.12672/18631 |
Nivel de acceso: | acceso abierto |
Materia: | Algoritmos - Problemas, ejercicios, etc. Clusters industriales https://purl.org/pe-repo/ocde/ford#1.01.02 https://purl.org/pe-repo/ocde/ford#1.01.03 |
Sumario: | Propone identificar el tamaño en base a cinco variables los ingresos, egresos, activos, pasivos y patrimonio usando información recogida por el Instituto Nacional de Estadística e Informática en la Encuesta Económica Anual ejecutada en el años 2018, donde las empresas registran información del ejercicio económico del año 2017. Con esta premisa estamos ante un problema de segmentación o clustering, en toda problemática se tiene diversas maneras de abordarlo y encontrar una solución adecuada, por ello en este caso se realizará usando la metodología CRISP-DM y para encontrar los clúster se opta el algoritmo k-means que funciona muy bien con variables cuantitativas, pero presenta problemas con la presencia de valores extremos u outliers por ello uno de los primeros pasos a realizar es su detección. Luego de la aplicación del algoritmo se encontraron tres segmentos bien definidos por la pequeña empresa, la mediana empresa y la gran empresa. |
---|
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).