Entradas

Mostrando las entradas etiquetadas como cluster analysis

Análisis de Cluster o Cluster Analysis

Imagen
Capítulo 15 del libro Data Minig for Business Analytics: Concepts, Techniques, and Applications with XlMiner, Third Edition, Galit Shmuleli, Peter C. Bruce, and Nitin R. Patel. Este capítulo es acerca de la popular tarea de aprendizaje no-supervisado de clusterización , donde el objetivo es segmentar la data dentro de un conjunto de clusters de observaciones homogéneas con el propósito de generar insights. Separar un conjunto de datos dentro de un cluster de registros homogéneos es también muy útil para mejorar el rendimiento de los métodos supervisados mediante el modelado de cada cluster por separado en vez del total de conjunto de datos heterogéneos. La clusterización es usada en una amplia variedad de aplicaciones de negocio, desde marketing personalizado hasta análisis industrial. Describimos dos populares aproximaciones de clusterización: jerárquica y k-means. En la clusterización jerárquica las observaciones son agrupadas secuencialmente para crear clusters, basad