본문 바로가기
MIS

[SPSS] 다차원척도법

by 누피짱 2009. 11. 20.

연구자들이 관찰대상물을 비교할 때 대상들간의 유사성 또는 선호도 등에 대하여 아무런 기준을 제시하지 않은 채 평가하게 함으로써 평가자가 대상물을 평가하는데 적용하고 있는 기준을 발견해 내고 각 기준에
따라 각 대상물들이 갖는 측정값을 찾아내고자 하는 할 경우가 있다. 이러한 경우에 사용하는 통계분석기법이 다차원축적법이다.

다차원축적법의 가장 기본적인 전제조건은 심리적 공간에서의 개체간의 거리가 개체간의 유사성의 정도와 일치한다는 것이다. 평가시 기준이 되는 차원을 결정하거나 출력자료의 정확도를 평가하기 위해서는 평가자료가 실제 입력자료를 얼마나 잘 재현해 주는가를 나타낸ㄴ 기준치가 필요하며 이것이 곧 스트레스 값의
측정치가 된다.

심리적 평가공간 차원에서 평가대상체들간의 상대적 거리에 대한 정확도를 높이기 위해 다차운공간에서의 조정작업이 적용되며 이것은 거리 정확도의 측면에서 개선의 여지가 없을 때까지 반복적으로 계속되며,
이 조정빈도를 나타내는 값을스트레스 값(stress score)라고 한다. 평가대상들간의 상대적 거리의 정확도를 높이기 위해 다차원 공간에의 위치결정작업은 더 이상의 개선이 어려울 때까지 반복적으로 계속되는데 그 결정작업의 정도를 나타내는 값을 스트레스 값이라고한다. 즉, 스트레스 값은 실제의 거리와 결정된 상태적 거리간의 오차의 정도를 나타내어 주는 것으로서, 이 스트레스 값이 줄어드는 방향으로 여러 번 반복하면 평가대상들의 좌표가 변화되어 간다. 스트레스 값이 크면 클수록 자료가 포함하고 있는 성질이 분석결과에 반영되는 정도가 낮아지며, 스트레스 값이 작을수록 결과에 자료의 성질이 잘 반영된다고 볼 수 있다. 차원의 수가 많아지면 많아질수록 당연히 스트레스 값도 작아지는데 여기에서 주의해야할 사항은 차원의수가
많아지면 분석결과의 제시와 해석이 어려워진다는 사실이다. 따라서 최소의 차원에서 가장 설득력 있는
결과를 찾아내는 것이 다차원척도 분석에서 중요한 과제이다(유사라 1999).

24개 농학분야 웹 사이트들의 상관관계를 분석하기 위하여 SPSS에서 다차원척도 프로그램인 ALSCAL을 이용하여 웹 정보원들의 위치를 2차원 공간상에 점으로 표시한 사이트 맵(site map)을 출력하였다.

[그림14-1]에 의하면 c18과 c16의 상관계수는 1.000이고 다차원척도법에서도 같은 위치에 중첩해서
나타나 있다. c23과 c20의 상관계수는 0.775이고 다차원척도법에서도 매우 가깝게 나타나 위치하고 있다. c19와 c2의 상관계수는 0.744이나 다차원척도법에서는 멀리 떨어져서 위치하고 있다. c13과 c11의 상관계수는 0.742이나 다차원척도법에서는 멀리 떨어져서 위치하고 있다. c24와 c15의 상관계수는 0.999이고 다차원척도업에서도 매우 가깝게 나타나 있다.

c15와 c24의 쌍, c20과 c23의 쌍은 상관계수도 높고, 다차원척도법에서도 매우 가깝게 위치하고 있으나 나머지는 가깝게 위치하고 있지 않다.

다차원척도법에서 적합도 수준을 나타내는 척도인 스트레스(STRESS)는 0과 1 사이의 값을 취하며, 0으로 작아질수록 적합된 모형이 적절하다고 판단한다. 표현된 결과의 적합 정도를 나타내기 위하여 Kruskal은 STRESS의 크기와 표현 결과의 적합성에 대하여 다음과 같은 관계를 제시하였다(박성현 1999).

 STRESS

적합도 수준

0

완벽(perfect)

 0.05 이내

매우 좋음(excellent)

0.05 ~ 0.10

만족(satisfactory)

0.10 ~ 0.15

보통(acceptable, but doubt)

0.15 이상

나쁨(poor)

그런데 SPSS에서 STRESS를 좋게 하면 24개의 웹 사이트들이 하나로 뭉쳐버리기 때문에 적합도 수준이 낮은 다차원 척도법의 지도를 그렸다. 이 실험에서 나온 STRESS는 0.24333이며 표현된 변량 RSQ는 0.72191로 나타나 적합도 수준은 매우 나쁜 편이다.

덴드그램의 군집결과와 다차원척도법에 나타난 상관관계가 반드시 일치하는 것이 아닌 것은 다차원척도법의 STRESS가 나쁘기 때문이라고 생각된다.

14-1) 다차원 척도법이해 분석 샘플

  선정한 경쟁서비스 중에 시장에서 경쟁의 정도가 가장 큰 서비스가 무엇인지 파악하는 것은 위성DMB서비스 사업자  입장에서는 매우 중요한 문제이다. 이를 위해서 먼저 위성DMB서비스와 종합적인 측면에서 가장 유사한 서비스가 무엇 인지를 분석할 필요가 있다.

  위성DMB서비스와 유사성의 정도를 분석하기 위해서 다음과 같은 6개의 비교기준을 정하였다. 첫째, 서비스 제공의  주된 형태가 방송인가?, 둘째, 멀티미디어(비디오, 오디오, 데이터) 컨텐츠를 제공하는가?, 셋째, 이동 중에도 서비스  수신이 가능한가?, 넷째, 다채널 서비스인가?, 다섯째, 전국을 대상으로 서비스를 제공하는가?, 마지막으로 교통정보를 전문적으로 제공하는가이다.


다음으로 위성DMB서비스를 포함하여 7개의 서비스에 대해 6개의 비교기준 별로 평가를 수행하였다. 이를 위해 7개의 서비스 모두에 전문지식을 가지고 있는 국내 대표적인 정보통신 연구기관인 한국전자통신연구원의 전문가들에게 의뢰 하였으며, 그 결과(종합의견)는 표 4-3과 같다. 조사방식으로는 조사대상자들 간의 자유로운 토의를 통해 충분히 서로의 의견을 조율한 후 각 서비스와 각 비교기준 별로 종합점수를 부여하는 방식을 택하였다.

14-2) 다차원 척도법 분석 과정

조사된 6개 비교기준 별 점수를 대표할 수 있는 값을 구하기 위하여 본 논문에서는 다차원척도(MDS: multidimensional scaling)을 이용하였다. 다차원척도법은 다차원의 구조를 가지는 대상을 소수 차원(주로 2차원 이하)의 공간에 기하학적으로 표현하여 시각적으로 대상을 이해하는 것을 도와준다. 특히, 기하학적으로 표현된 그림(포지셔닝 맵)을 통해 분석대상간의 유사성을 판단할 수 있다. 즉, 유사성이 작은 대상끼리는 멀리, 유사성이 큰 대상끼리는 가깝게 위치를 정해 표현한다.


Iteration history for the 2 dimensional solution (in squared istances)

                  Young's S-stress formula 1 is used.

                Iteration     S-stress      Improvement

                    1           .07201
                    2           .06029         .01172
                    3           .05996         .00033

                         Iterations stopped because
                 S-stress improvement is less than   .001000
            Stress and squared correlation (RSQ) in distances

 RSQ values are the proportion of variance of the scaled data
(disparities)

           in the partition (row, matrix, or entire data) which
            is accounted for by their corresponding distances.
             Stress values are Kruskal's stress formula 1.

                For  matrix
    Stress  =   .05171      RSQ =  .98166


(그림 4-8) 다차원척도법 SPSS 출력 결과(2차원)

  조사된 6개 비교기준 별 점수에 다차원척도법을 적용한 결과, 스트레스(stress) 값이 0.05171(>0.5)로서 모형의 적합 정도가 보통이거나 좋은 편이며, RSQ는 0.98166(>0.6)으로서 모형의 설명력이 매우 높다고 할 수 있다(그림 4-8).

  본 고에서는 다차원척도법을 적용하기 위한 통계 소프트웨어로 많은 연구자들이 그 신뢰성을 인정하고
있는 SPSS를  사용하였다.

다차원척도법을 이용하여 2차원 평면에 경쟁서비스를 표현한 것이 그림 4-9이다. Dimension 1의 좌표값이 양수인 쪽에는 지상파, 유선, 위성 각 매체별 방송서비스가 위치하고 있으며, 좌표값이 음수인 쪽에는
위성DMB를 비롯하여 지상파DMB, 이동통신, ITS가 위치하고 있다. 즉, Dimension 1은 전통적인 의미의 멀티미디어 방송의 기준으로 해석할 수 있을 것이다. Dimension 2의 경우 좌표값이 양수인 쪽에는 위성DMB를 비롯하여 위성방송과 이동통신이 위치하고 있고,나머지 서비스들은 좌표값이 음수인 곳에 위치하고 있다. 즉, Dimension 2는 서비스의 광역성이라는 기준으로 해석이 가능하다. 그림 4-9에서 위성DMB서비스와 가깝게 위치하는 서비스는 이동통신과 지상파DMB이다.


Iteration history for the 1 dimensional solution (in squared distances)

                  Young's S-stress formula 1 is used.

                Iteration     S-stress      Improvement

                    1           .20630
                    2           .19802         .00828
                    3           .19797         .00006

                         Iterations stopped because
                 S-stress improvement is less than   .001000
            Stress and squared correlation (RSQ) in distances

 RSQ values are the proportion of variance of the scaled data (disparities)

           in the partition (row, matrix, or entire data) which
            is accounted for by their corresponding distances.

             Stress values are Kruskal's stress formula 1.

                For  matrix    Stress  =   .24872      RSQ =  .78300


(그림 4-10) 다차원척도법 SPSS 출력 결과(1차원)

  다차원척도법으로 7개 경쟁서비스를 1차원에 표현할 결과, 스트레스 값은 0.24872로 모형의 적합도가 나쁜 편이나,RSQ는 0.783(>0.6)으로 모형의 설명력이 좋은 편이라고 할 수 있다(그림 4-10). 포지셔닝 맵(그림 4-11)을 보면 위성DMB와 지상파DMB가 가장 가깝게 위치하고 있는 것을 알 수 있다.

 다차원척도법을 이용한 분석결과를 종합하면, 위성DMB서비스는 지상파DMB서비스 및 이동통신서비스와 유사하며, 이중 지상파DMB서비스와 가장 유사하다고 판단할 수 있다. 또한, 위성DMB서비스와 지상파DMB서비스는 매우 유사하지만, 서비스 영역의 광역성에서 큰 차이를 보여 주고 있는 것을 알 수 있다.

 특히 이 점은 DMB서비스가 차량으로 이동 중인 사용자를 주된 대상으로 정하고 있다는 점을 고려하면
위성DMB서비스의 중요한 경쟁우위 요소이다. 그러므로, 위성DMB 서비스 사업자는 지상파DMB서비스와의 차별성을 부각하여 경쟁우위를 확보하기 위한 전략을 수립하는 것이 무엇보다도 중요하다고 볼 수 있다.

'MIS' 카테고리의 다른 글

Support Vector Machine  (0) 2009.11.20
SVM 개념  (0) 2009.11.20
[SAS] ▷▶ 유사성 계수 ( similarity coefficient )  (1) 2009.11.20
[SAS] ▷▶ 비유사성(dissimilarity)의 측정  (0) 2009.11.20
[SAS] ▷▶ 차원의 수  (0) 2009.11.20

댓글