Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revisionBoth sides next revision | ||
전산물리학:주성분_분석 [2019/05/13 23:52] – [이론] admin | 전산물리학:주성분_분석 [2019/05/14 19:18] – [이론] admin | ||
---|---|---|---|
Line 35: | Line 35: | ||
위의 공분산 행렬을 대각화하였을 때 얻는 고유값 $\lambda_1 \ge \lambda_2 \ge \ldots \ge \lambda_M$이 있고 이에 해당하는 고유 벡터 $\hat{e}_1, \hat{e}_2, \ldots, \hat{e}_M$들이 있는데 이 고유 벡터들이 주축의 방향을 가리킨다. | 위의 공분산 행렬을 대각화하였을 때 얻는 고유값 $\lambda_1 \ge \lambda_2 \ge \ldots \ge \lambda_M$이 있고 이에 해당하는 고유 벡터 $\hat{e}_1, \hat{e}_2, \ldots, \hat{e}_M$들이 있는데 이 고유 벡터들이 주축의 방향을 가리킨다. | ||
- | 다음처럼 예제 코드를 적을 수 있다. sklearn.datasets로부터 iris 데이터를 읽어들여서 이 중 $N=3$인 데이터 $M=100$개를 사용하자. 주성분 분석으로 얻어진 2개의 주축만을 취하고, 모든 데이터를 이 방향으로 사상시켜서 그린다. 이는 원래의 3차원 데이터를 2차원으로 압축하는 것에 해당한다. | + | 다음처럼 예제 코드를 적을 수 있다. sklearn.datasets로부터 iris 데이터를 읽어들여서 이 중 $M(=3)$차원 |
< | < | ||
Line 71: | Line 71: | ||
M, N = 3, 100 | M, N = 3, 100 | ||
R_transpose = iris.data[: | R_transpose = iris.data[: | ||
- | u = R_transpose.mean(axis=0) | + | u = R_transpose.mean(axis=0) |
X_transpose = R_transpose - u | X_transpose = R_transpose - u | ||
Line 80: | Line 80: | ||
V_transpose의 행 벡터들(= V의 열 벡터들)을 바로 그려도 앞의 코드와 정성적으로 같은 결과를 얻는 까닭은, 특이값 분해에서 다음 관계가 성립하기 때문이다: | V_transpose의 행 벡터들(= V의 열 벡터들)을 바로 그려도 앞의 코드와 정성적으로 같은 결과를 얻는 까닭은, 특이값 분해에서 다음 관계가 성립하기 때문이다: | ||
- | $$ X \vec{v}_i = \sigma_i \vec{u}_i.$$ | + | $$ X \hat{v}_i = \sigma_i \hat{u}_i \longleftrightarrow X^T \hat{u}_i = \sigma_i \hat{v}_i.$$ |
Line 86: | Line 86: | ||
======참고문헌====== | ======참고문헌====== | ||
* https:// | * https:// | ||
+ | * https:// | ||
+ | * https:// |