본문 바로가기

MIS17

[SPSS] 다차원척도법 1. 다차원척도법이란? 2. M.D.S. 분석과정 3. 자료의 측정 4. M.D.S.의 종류 5. STRESS와 적합도 수준 1. 다차원척도법(MDS)이란? 1) 개념 및 정의 MDS는 군집분석과 같이 개체들을 대상으로 변수들을 측정한 후에 개체들사이의 유사성/비유사성을 측정한다. 그러나 MDS에서는 유사성/비유사성 값을 이용하여 개체들을 2차원 공간상에 점으로 표현하는 분석방법이다. 개체들을 2차원 공간상에 점으로 표현하여 개체들 사이의 집단화를 시각적으로 표현하는 분석방법이다. MDS는 군집분석과 같이 여러 개체들을 대상으로 몇 개의 특성변수를 측정한 후에 이 변수들을 이용하여 개체들 사이의 거리 또는 비유사성을 측정하고, 이를 이용하여 개체들을 2차원 또는 3차원 공간상의 점으로 표현하는 통계적 분.. 2009. 11. 21.
Support Vector Machine Support Vector Machine .... Support vector machine (SVM) 은 분류 (classification) 와 회귀 (regression) 에 응용할 수 있는 지도학습 (supervised learning) 의 일종이다 ......... 기본적인 분류를 위한 SVM 은 입력공간에 maximum-margin hyperplane을 만든다. yes 또는 no 값이 주어진 training sample 이 주어지고, 가장 가까이 있는 example (margin) 에서 hyperplane 까지의 거리가 최대가 되도록 training sample 들을 yes 와 no 로 나누게 되며, 그것이 maximum-margin hyperplane 이다. margin 이 최대일 때 최소가 되.. 2009. 11. 20.
SVM 개념 SVM은 상당히 다룰 내용이 많은 learning algorithm이다. 하지만, 아직은 SVM을 제대로 공부한 적이 없는 필자와 같은 상태의 사람들은 논문을 보거나 SVM을 프로젝트에 이용하려 할때 기본 개념을 알고 있을 필요가 있다. SVM(Support vector machine)은 2개의 범주를 분류하는 이진 분류기이다. 다음 그림은 SVM의 개념을 설명하는 것이다. feature들은 그림과 같은 vector공간에 vector로 표시된다. 그림에서 보는 것처럼 하얀 색 vector들을 A그룹에 속하는 white point라고 하고, 그 반대로 검은색 vector들을 B그룹에 속하는 black point라고 하자. 이러한 벡터 가운데 같은 범주를 기준으로 바깥으로 위치한 벡터들의 연결선으로 이루어진.. 2009. 11. 20.
[SPSS] 다차원척도법 연구자들이 관찰대상물을 비교할 때 대상들간의 유사성 또는 선호도 등에 대하여 아무런 기준을 제시하지 않은 채 평가하게 함으로써 평가자가 대상물을 평가하는데 적용하고 있는 기준을 발견해 내고 각 기준에 따라 각 대상물들이 갖는 측정값을 찾아내고자 하는 할 경우가 있다. 이러한 경우에 사용하는 통계분석기법이 다차원축적법이다. 다차원축적법의 가장 기본적인 전제조건은 심리적 공간에서의 개체간의 거리가 개체간의 유사성의 정도와 일치한다는 것이다. 평가시 기준이 되는 차원을 결정하거나 출력자료의 정확도를 평가하기 위해서는 평가자료가 실제 입력자료를 얼마나 잘 재현해 주는가를 나타낸ㄴ 기준치가 필요하며 이것이 곧 스트레스 값의 측정치가 된다. 심리적 평가공간 차원에서 평가대상체들간의 상대적 거리에 대한 정확도를 높이.. 2009. 11. 20.
[SAS] ▷▶ 유사성 계수 ( similarity coefficient ) ▷▶ 유사성 계수 ( similarity coefficient ) ; 유사성 cij를 나타내는 척도 대개 유사성은 비유사성의 조건 1)과 2)의 성질을 갖고 있다. 1) dij ≥ 0, i ≠ j ; dii = 0 2) dij = dji (대칭성) 자료 행렬 X가 양적자료(quantitative data)인 경우 잘 알려진 피어슨의 상관계수(correlation coefficient)가 유사성을 나타낸다. 자료행렬 X가 0과 1로 표현되는 xir (= 1 : 개체 i가 r 번째변수의 성질을 만족한다. / 0 : 그렇지 않다.)인 이진수 자료 (binary data)인 경우에 대한 몇 가지 유사성계수를 알아보자. 이를 위하여 10가지 경제전망 항목에 대해 한국은행과 동서증권 두 개체만을 고려한 다음의 이진.. 2009. 11. 20.
[SAS] ▷▶ 비유사성(dissimilarity)의 측정 ▷▶ 비유사성(dissimilarity)의 측정 다차원척도법에서 이용되는 자료의 형태로는 n×n 인 비유사성 행렬(dissimilarity matrix) D = (dij) 또는 유사성 행렬 (similarity matrix) C = (cij)를 들 수 있다. 일반적으로 이 행렬들은 직접 관찰되기도 하지만 대개 자료행렬 X=xir , i=1,…, n ; r=1, …, p 로부터 구해야 한다. 비유사성이라 함은 p-차원 공간의 개체 i와 j의 좌표점 xi=(xi1, … ,xip)t 와 xj=(xj1, … ,xjp)t 의 거리를 나타낸다. 비유사성을 측정하는 거리는 다양하게 제시되어 있지만, 이들은 (1) dij ≥ 0, i ≠ j ; dii = 0 , (2) dij=dji (대칭성), (3) dik+djk .. 2009. 11. 20.
[SAS] ▷▶ 차원의 수 ▷▶ 차원의 수 일반적으로 n개의 개체가 표현될 저차원의 차원수 k는 궁극적으로 다차원척도 그림의 좌표축의 수를 정하는 문제와 관련이 있다. Kruscal 과 Wish는 스트레스는 차원의 수가 증가하면 감소하므로 스트레스-차원수 그림을 통하여 스트레스가 제일 많이 꺾이는 곳에 대응하는 차원을 정해야 한다고 주장하였고, Chatfield & Collins 는 2, 3 그리고 4차원 정도에서 적절한 차원을 찾아야 한다고 주장했다. Kruscal 이 제시한 스트레스에 따른 판별기준은 다음과 같다. [Kruscal의 판별 기준] 스트레스(%) 0.0 2.5 5.0 10.0 20.0 부적합도 완벽 (perfect) 뛰어남 (excellent) 좋음 (good) 보통 (fair) 나쁨 (poor) 특별히 2차원 좌.. 2009. 11. 20.
[SAS] ▷▶ 스트레스( stress ) ▷▶ 스트레스( stress ) dij와 δij의 관계를 최적화시킬 f(·)를 찾아보자. 잔차제곱합 (RSS) ÷ 척도인자(SC - scale factor) ; 척도변환에 이 잔차제곱합이 불변하도록 척도인자를 나누어 그 결과에 제곱근을 취하면 스트레스가 얻어진다. (1) Stress 산출 공식 a. Kruskal의 스트레스 1 b. Kruskal의 스트레스 2 c. Young의 S-STRESS 공식 1, 2 (SAS/PROC ALSCAL에서 채택) (2) 스트레스 최소화 알고리즘 스트레스를 최소화하는 최적의 f(·)를 찾는 두 단계 [단계 1] dij가 · 구간척도 ( f(δij) = a + bδij) ; 최적의 a와 b를 구하기 - 최소제곱선형회귀 알고리즘 적용 · 비율척도 ( f(δij) = bδij.. 2009. 11. 20.
[SAS] ▷▶ 측정수준(measurement level) ▷▶ 측정수준(measurement level) MDS 란 개체(p-차원의 유클리드 공간에서 나타나는) 간의 거리 dij와 차원축소된 k(≤p)-차원의 공간점 사이의 거리 δij 사이의 관계가 서로 일치되도록 하는 것이다. 이 때, 거리 dij와 δij의 관계는 dij의 측정척도(measurement scale) 에 따라 달라진다. (1) 수준의 분류 측정척도를 측정수준이라 하여 (- Schiffman, et al. Young) 아래와 같이 크게 나눈다. - 명목수준(norminal level) : 측정대상의 특성을 분류하기 위한 척도 (예) 성별, 동물의 성(genus), 사람의 머리카락 색깔, 음식의 맛 - 순서수준(ordinal level) : 측정대상간의 순서를 나타내는 척도 (예) 선호도, 부모.. 2009. 11. 20.
[SAS] ▷▶ 비계랑형 다차원척도법 ▷▶ 비계랑형 다차원척도법 『Kruskal-Shepard 알고리즘』 [단계 1 ( 비대각원소의 순서화 )] 크기가 n×n 인 비유사성행렬 D = (dij) 로부터 m = n (n - 1) / 2개의 비대각원소를 그 크기에 따라 순서화한다. [단계 2] X* ; k-차원의 형상공간 좌표행렬 , D* ; 이에 대응하는 비유사성행렬 ⇒ ; 에 대응되는 값이다. [단계 3 (최소제곱단조회귀)] 와 거의 일치하면서 에 단조관계를 갖는 순위상(rank image)인 을 계산한다. [단계 4 (스트레스 최소화 알고리즘)] Kruscal의 스트레스 공식 을 정의하고 이를 최소화하는 형상공간좌표행렬 을 찾는다. ; ST1의 f(·)의 최적(적합된)값을 의미. [ 알고리즘의 단계 2에서 적절한 차수 k 를 정하는 적합도 .. 2009. 11. 20.
[SAS] 계량형 다차원척도법 ▷▶ 계량형 다차원척도법 계량형 다차원척도법이란 비유사성 dij와 차원 축소된 k차원의 공간점 사이의 거리 δij의 관계가 절대척도·구간척도·비율척도 모형을 만족하도록 하는 다차원척도법을 말한다. (Kruskal and Wish) 이 때 형상공간의 차원과 좌표를 구하기 위해서, 스펙트럴 분해를 이용해 이를 구한 Torgerson의 알고리즘을 요약하면 다음과 같다. [단계1] 비유사성행렬 D로부터 행렬 A = (aij) 를 계산. 여기서 aij = -dij2 / 2 [단계2] 행렬 A로부터 이중-중심화행렬 B = (bij) = HAH 를 계산. 여기서 H = I - J / N 이고 (각각 행렬 A의 i 번째 행의 평균, j번째 열의 평균 그리고 모든 원소의 평균) [단계3] 행렬 B의 스펙트럴 분해는 다음.. 2009. 11. 20.
[SAS] 다차원척도법 - 1 다차원 척도법이란 대상들에 대한 유사성자료나 대상을 설명하고자 하는 속성들에 대한 자료를 이용하여 저차원 공간(형상공간 : configuration space)상에 표현하고자 하는 다변량 그래프적 기법이다. 두 대상간에 유사성 또는 속성에 대한 값들의 척도가 서열자료 또는 등간 자료 이상이 되어야 하므로 잘 알려져 있는 대응분석과는 차이가 있는 기법이다. 일반적으로 n개의 개체간의 비유사성을 나타내는 크기가 n×n 인 비유사성(거리)행렬 D=(dij) i.j=1,…,n 를 분석에 이용한다. D는 대각원소들이 0(동일 개체의 비유사성)인 대칭 행렬이다. 다차원척도법은 비유사성행렬 D를 구성하는 개체간의 비유사성 dij의 측정척도에 따라 다음의 두종류로 나눌 수 있다. (1) 계량형 다차원척도법(metric.. 2009. 11. 20.
다차원척도법 다차원척도법 다차원척도법(MDS)은 상표를 비롯하여 상품이 가지고 있는 속성이나 응답자의 이상점과 같은 자극점들(stimuli)간의 복잡한 다차원 관계를 저차원인 2차원 평면이나 3차원 공간상에 단순한 구도로 시각화하여 나타내주는 기법이다. 다차원척도법은 포지셔닝 등 다양한 소비자의 인지구조르르 시각적으로 나타내줌으로써 마케팅관리자와 고객간의 커뮤니케이션에 매우 효과적인 기법이다. 목적 다차원척도법의 목적은 포지셔닝 등 상표에 대한 소비자의 인지구조를 분석하여 활용함으로써 보다 효과적인 마케팅 커뮤니케이션을 실행하는 데 있다. 다차원척도법을 이용한 마케팅활동은 다음과 같다. 1. 소비자가 상표르르 인지할 때 사용하는 평가차원의 수와 속성의 종류를 파악할 수 있다. 2. 평가차원에서 자사상표의 위치와 경쟁.. 2009. 11. 20.
ADSL 서비스 상용화 10주년 네티즌 ‥ 한국을 바꾼 : ADSL ‥ 상용서비스 ‥ 10주년 1999년 4월 1일은 당시 하나로통신이 전화선을 이용한 초고속인터넷 을 세계 최초로 상용화 한 날로,?한국 IT 역사를 새롭게 써 내려간 시발점이 된 날이기도 하다.10여 년 전까지만 해도 국내 통신시장은 가 100년이 넘도록 독점체제를 구축하고 있던 시기였다. 정부는 통신시장에 본격적인 경쟁체제를 도입하며 1997년 하나로통신을 제2 시내전화사업자로 선정했다.2년 후인 1999년 하나로통신은?초고속인터넷 ADSL 서비스를 선보이며?대한민국에 인터넷 열풍을 일으키게 된다. 사진 설명 : SK브로드밴드는 세계 최초 ADSL을 상용서비스하고 나는 ADSL 이라는 광고를 내세워 선풍적인 인기를 끌었다. 인기폭발이었던 가수 유승준을 모델로 기용.. 2009. 11. 4.
아이폰이 과연 생각만큼 많이 팔렸을까? 애플의 놀라운 3분기 실적 지난주에 플의 실적발표가 있었습니다. 여기서 발표한 놀라운 결과에 의하면 3분기 동안 무려 6,892,000대의 아이폰이 판매되었다고 합니다. 이제 휴대폰 시장에 진출한 지 일년 갓 넘은 기업의 실적이라고는 믿기 힘들정도의 놀라운 성과입니다. 뿐만 아니라 이로 인해 애플은 사상 최고의 실적을 올릴 수 있었습니다. 아이폰 3G가 톡톡히 제 몫을 한 것입니다. 판매량의 세부 수치는.. 하지만, 오늘 Appleinsider 에 올라온 글을 보니, 과연 아이폰이 우리가 알고 있는 만큼 많이 팔렸다고 할 수 있을까 라는 생각이 들었습니다. 이 글에서 분석한 바로는 이번에 애플에서 발표한 689만 2천대의 아이폰 중 1/3이 넘는 35%가 미국내 통신업자인 AT&T를 통해서 판매되었다고 .. 2009. 11. 2.