▷▶ 비유사성(dissimilarity)의 측정
다차원척도법에서 이용되는 자료의 형태로는 n×n 인 비유사성 행렬(dissimilarity matrix) D = (dij) 또는 유사성 행렬 (similarity matrix) C = (cij)를 들 수 있다. 일반적으로 이 행렬들은 직접 관찰되기도 하지만 대개 자료행렬 X=xir , i=1,…, n ; r=1, …, p 로부터 구해야 한다.
비유사성이라 함은 p-차원 공간의 개체 i와 j의 좌표점 xi=(xi1, … ,xip)t 와 xj=(xj1, … ,xjp)t 의 거리를 나타낸다. 비유사성을 측정하는 거리는 다양하게 제시되어 있지만, 이들은 (1) dij ≥ 0, i ≠ j ; dii = 0 , (2) dij=dji (대칭성), (3) dik+djk ≥ dij (삼각부등식)와 같은 조건을 만족해야 한다. 여기서, (3)은 반드시 필요한 것은 아니다. 왜냐하면, 대부분의 거리들이 이 조건을 만족치 않기 때문이다. 하지만, 유클리드 거리는 모든 조건을 만족한다고 알려져 있다. 자주 사용되는 거리의 공식으로는 다음의 세가지를 들 수 있다.
① 유클리드 거리 (k=2 인 민코스키 거리)
② 민코스키 거리 (Minkowski distance) ;
③ 시티-블록 거리 (city-block distance) (k=1 인 민코스키 거리)
이들 세 거리들은 변수들이 측정단위가 다르거나 상관관계가 있다면 크게 달라진다. 이를 감안한 표준화 거리(standardized distance)는 다음과 같다.
① 피어슨(Person) 거리 혹은 χ2 거리
; sr - 변수 xr의 표준편차, 변수별 표준화를 고려
② 마할라노비스 거리 (Mahalanobis distance)
; S는 표본 분산공분산 행렬 - 변수별 표준화뿐 아니라 변수들간의 상관관계도 고려
③ 가중 유클리드 거리 (weighted Euclidean distance)
; 유클리드 거리와 피어슨 거리의 일반화 (ωr=1 이면 유클리드 거리, ωr=(1/sr)2 이면 피어슨 거리)
'MIS' 카테고리의 다른 글
[SPSS] 다차원척도법 (0) | 2009.11.20 |
---|---|
[SAS] ▷▶ 유사성 계수 ( similarity coefficient ) (1) | 2009.11.20 |
[SAS] ▷▶ 차원의 수 (0) | 2009.11.20 |
[SAS] ▷▶ 스트레스( stress ) (0) | 2009.11.20 |
[SAS] ▷▶ 측정수준(measurement level) (0) | 2009.11.20 |
댓글