Medición de distancia entre dos observaciones
Capítulo 15 del libro Data Minig for Business Analytics: Concepts, Techniques, and Applications with XlMiner, Third Edition, Galit Shmuleli, Peter C. Bruce, and Nitin R. Patel. 15.2 Medición de distancia entre dos observaciones Denotamos a dij como una métrica de distancia, o medida de disimilitud, entre las observaciones i y j . Para la observación i tenemos el vector de mediciones (x i1 , x i2 , x i3 ,…,x ip ), mientras que para la observación j tenemos el vector de mediciones (x j1 , x j2 , x j3 ,…,x jp ). Por ejemplo, podemos escribir el vector de medición para el Servicio Público de Arizona como [1.06, 9.2, 151, 54.4, 1.6, 9007, 0,0.628]. Las distancias pueden ser definidas en múltiples formas, pero en general, se requieren las siguientes propiedades: - No Negativa: d ij > 0 - Proximidad misma: d ij = 0 - Simetría: d ij = d ji - Desigualdad triangular: d ij < = d ik + d kj (la distancia entre cualquier par no excede la suma de d