Segmentación de empresas para identificar su tamaño empleando el algoritmo de k-means

Descripción del Articulo

Propone identificar el tamaño en base a cinco variables los ingresos, egresos, activos, pasivos y patrimonio usando información recogida por el Instituto Nacional de Estadística e Informática en la Encuesta Económica Anual ejecutada en el años 2018, donde las empresas registran información del ejerc...

Descripción completa

Detalles Bibliográficos
Autor: Espinoza Ballesteros, Moisés
Formato: tesis de grado
Fecha de Publicación:2022
Institución:Universidad Nacional Mayor de San Marcos
Repositorio:UNMSM-Tesis
Lenguaje:español
OAI Identifier:oai:cybertesis.unmsm.edu.pe:20.500.12672/18631
Enlace del recurso:https://hdl.handle.net/20.500.12672/18631
Nivel de acceso:acceso abierto
Materia:Algoritmos - Problemas, ejercicios, etc.
Clusters industriales
https://purl.org/pe-repo/ocde/ford#1.01.02
https://purl.org/pe-repo/ocde/ford#1.01.03
Descripción
Sumario:Propone identificar el tamaño en base a cinco variables los ingresos, egresos, activos, pasivos y patrimonio usando información recogida por el Instituto Nacional de Estadística e Informática en la Encuesta Económica Anual ejecutada en el años 2018, donde las empresas registran información del ejercicio económico del año 2017. Con esta premisa estamos ante un problema de segmentación o clustering, en toda problemática se tiene diversas maneras de abordarlo y encontrar una solución adecuada, por ello en este caso se realizará usando la metodología CRISP-DM y para encontrar los clúster se opta el algoritmo k-means que funciona muy bien con variables cuantitativas, pero presenta problemas con la presencia de valores extremos u outliers por ello uno de los primeros pasos a realizar es su detección. Luego de la aplicación del algoritmo se encontraron tres segmentos bien definidos por la pequeña empresa, la mediana empresa y la gran empresa.
Nota importante:
La información contenida en este registro es de entera responsabilidad de la institución que gestiona el repositorio institucional donde esta contenido este documento o set de datos. El CONCYTEC no se hace responsable por los contenidos (publicaciones y/o datos) accesibles a través del Repositorio Nacional Digital de Ciencia, Tecnología e Innovación de Acceso Abierto (ALICIA).