analiza cluster

Distanța euclidiană (Distanța)

Distanța euclidiană între două puncte x și y - este cea mai scurtă distanță între ele. Bi- sau cazul tridimensional - o linie dreaptă care leagă aceste puncte. Formula generală pentru n-dimensional (x variabile) este: 1

Acronim dist, la fel ca în formula următoare, distanța corespunde cuvântului. Pentru. Obținem exemplul dat

Pătrat distanța euclidiană

Această opțiune este setată în mod implicit. Datorită cuadraturii în calcul ia în considerare cel mai bun mare diferență. Acest lucru ar trebui să fie întotdeauna utilizate în construcția de clustere folosind centroid și metode mediane și metoda de Ward (Ward-Method) (a se vedea. Sec. 20.5).

Pentru exemplul dat am cfot = (5-4) 2 + (4-10) 2 = 37

Ca și în coeficientul de corelație Pearson, intervalul acestei măsuri se situează între -1 și +1.

Pentru exemplu, avem

În cazul în care gruparea observațiilor efectuate numai pe baza a două variabile, coeficientul de corelație Pearson (vezi secțiunea 15.1 ..) cu valori cuprinse -1-1 nu este potrivit pentru a fi utilizat ca o măsură a similarității; va da numai valorile -1 sau +1.

Diferența dintre două observații este valoarea maximă absolută a diferenței dintre perechile succesive de variabile corespunzătoare acestor observații.

În exemplu, diferența absolută dintre prima valoare variabilă este 1, în timp ce a doua variabilă - 6. Prin urmare, diferența este de 6 Cebîșev.

Această măsură la distanță, de asemenea, numit distanța Manhattan-ului sau o glumă - șofer de taxi la distanță, determinată de suma de perechi de valori absolute diferențe. Pentru spațiul bidimensional nu este liniar distanța euclidiană între două puncte, și calea pe care trebuie să depășească șoferul de taxi din Manhattan pentru a merge de la o casă la alta pe străzi se intersectează în unghiuri drepte.

De exemplu nostru, am dfst = | 5-4 | + | 4-10 | 7 =

distanța Minkowski egală cu rădăcină r lea putere al sumei absolute perechi de valori diferențele luate la gradul r-lea:

SPSS atunci când se calculează această distanță este permisă utilizarea numai rădăcina pătrată, în timp ce gradul de valori de diferență poate fi selectată în intervalul de la 1 la 4. Dacă acest grad luat egal cu 2, apoi obține distanța euclidiană.

Acest exemplu de realizare generalizată a Minkowski distanțelor. Această distanță, numită drept putere la distanță egală de rădăcină r lea putere al sumei diferențelor absolute ale perechilor de valori luate în gradul-p-lea:

Aici, atât rădăcina cât și pentru gradul suma pot alege valori 1 - 4.