본문 바로가기
MIS

[SAS] ▷▶ 비유사성(dissimilarity)의 측정

by 누피짱 2009. 11. 20.

▷▶ 비유사성(dissimilarity)의 측정

다차원척도법에서 이용되는 자료의 형태로는 n×n 인 비유사성 행렬(dissimilarity matrix) D = (dij) 또는 유사성 행렬 (similarity matrix)  C = (cij)를 들 수 있다. 일반적으로 이 행렬들은 직접 관찰되기도 하지만 대개 자료행렬 X=xir , i=1,…, n ; r=1, …, p 로부터 구해야 한다.

비유사성이라 함은 p-차원 공간의 개체 i와 j의 좌표점 xi=(xi1, … ,xip)t 와 xj=(xj1, … ,xjp)t 의 거리를 나타낸다. 비유사성을 측정하는 거리는 다양하게 제시되어 있지만, 이들은 (1) dij ≥ 0, i ≠ j ; dii = 0 , (2) dij=dji (대칭성), (3) dik+djk ≥ dij (삼각부등식)와 같은 조건을 만족해야 한다. 여기서, (3)은 반드시 필요한 것은 아니다. 왜냐하면, 대부분의 거리들이 이 조건을 만족치 않기 때문이다. 하지만, 유클리드 거리는 모든 조건을 만족한다고 알려져 있다. 자주 사용되는 거리의 공식으로는 다음의 세가지를 들 수 있다.


① 유클리드 거리 (k=2 인 민코스키 거리)


② 민코스키 거리 (Minkowski distance) ;  



③ 시티-블록 거리 (city-block distance) (k=1 인 민코스키 거리)


이들 세 거리들은 변수들이 측정단위가 다르거나 상관관계가 있다면 크게 달라진다. 이를 감안한 표준화 거리(standardized distance)는 다음과 같다.


① 피어슨(Person) 거리 혹은 χ2 거리

; sr - 변수 xr의 표준편차, 변수별 표준화를 고려


② 마할라노비스 거리 (Mahalanobis distance)

; S는 표본 분산공분산 행렬 - 변수별 표준화뿐 아니라 변수들간의 상관관계도 고려


③ 가중 유클리드 거리 (weighted Euclidean distance)

; 유클리드 거리와 피어슨 거리의 일반화 (ωr=1 이면 유클리드 거리, ωr=(1/sr)2 이면 피어슨 거리)

'MIS' 카테고리의 다른 글

[SPSS] 다차원척도법  (0) 2009.11.20
[SAS] ▷▶ 유사성 계수 ( similarity coefficient )  (1) 2009.11.20
[SAS] ▷▶ 차원의 수  (0) 2009.11.20
[SAS] ▷▶ 스트레스( stress )  (0) 2009.11.20
[SAS] ▷▶ 측정수준(measurement level)  (0) 2009.11.20

댓글