MÉTODO WARD 1. Definición El método de Ward Ward es un procedimiento jerárquico en el cual, en cada etapa, se unen los dos clusters para los cuales se tenga el menor incremento en el valor total de la suma de los cuadrados de las diferencias, dentro de cada clúster, de cada individuo al centroide del clúster. Cabe resaltar que cada individuo evaluado corresponde a un clúster independiente, es decir, si manejamos 10 elementos, entonces se generarán 10 clusters. ara este método se plantea todas las posibles fusiones en cada etapa concreta ! elige la que ma"imi#a la $omogeneidad%
Calcula los centroides de los grupos resultantes de las posibles fusiones & continuaci'n, calcula la distancia al centroide de todas las observaciones del grupo (suma de cuadrados total) *a soluci'n con menor suma de cuadrados total es la elegida.
2. Funcionamiento Ejemplo 1: +eamos +eamos c'mo funciona este procedimiento en el caso de individuos sobre los cuales se miden dos variables. *os datos son los siguientes
Indiiduo A " # D E
!1
!2
10 -0 0 0
-0 10 1
10
Primer paso:
Calculamos el número de combinaciones, partiendo de la idea que el /étodo Ward Ward agrupa clusters por cada iteraci'n.
C- 10 10 comb combina inacio ciones nes (vista (vistass en en la la prim primera era column columnaa del del cuadro cuadro poste posterio rior) r)
2eali#amos las agrupaciones
Es importante detallar lo siguiente% 3
3
E4 a la suma de cuadrados de los errores del clúster k, o sea, la
distancia euclidiana al cuadrado entre cada individuo del clúster k a su centroide. E = la suma de cuadrados de los errores para todos los clusters, o sea, si suponemos que hay h clusters.
Ejemplo Fila1: ara la partici'n% (&, 5), C, 6, E. 7e identific' los siguientes centroides%
(
C AB =
10 + 20 5 + 20 , 2 2
)=(
10, 12.5 )
&$ora $allamos la suma de os cuadrado de los errores%
(
E AB= 10 −15
EC = B = D = 0
2
6e esta manera el E es E 18-. 9 0 9 0 9 0 18-.
#onclu$ión del cuad%o
2
2
=162.5
, !a que el centroide de los valores de un elemento, es el mismo
valor, por ende, no $a! error.
2
) + ( 5−12.5 ) +( 20 −15 ) +( 20−12.5 )
Se deduce que en esta etapa se unen los elementos C y D, ya que presenta el menor E = (12.!. "a con#$uraci%n actual es (C, D!, &, ', E. Segundo Paso
& partir de la con#$uraci%n actual tomamos las C2 = ) com*inaciones posi*les.
6e la misma manera que el primer paso, se deduce que en esta etapa se unen
los elementos & y E. "a con#$uraci%n actual es (&, E!, (C, D!, '. Tercer paso:
& partir de la con#$uraci%n actual tomamos las +C2 = + com*inaciones
posi*les. 7e deduce que en esta etapa se unen los clusters 5 ! (C, 6). *a configuraci'n actual es (&, E), (5, C, 6). Cuarto paso:
Ejemplo 2:
osibles fusiones% (1,-,,:) ! (,8)
osibles fusiones% (,8) ! (; ! <)
Encontrar centroides%
*uego obtenemos%
*uego $allamos la distancia frente el centroide%