본문 바로가기

vector2

# 11. PCA (Principal Component Analysis) 이론 PCA는 고차원의 데이터의 분포를 유지한채(최대한 중요한 정보를 유지한채) 차원을 낮추기 위한 알고리즘이다. 고차원에서 저차원으로 변환하는 과정에는 초평면 혹은 벡터에 정사영 혹은 투영(projection) 과정이 수행된다. 우선, 고차원 데이터에 대한 데이터의 분포를 파악하는 것이 중요하다. 분포는 데이터가 어느정도 넓게 퍼져있는가를 의미한다. 만약 위와 같은 2차원 파란색 데이터가 존재한다고 가정할 때, 1~3번 선중 어느 선이 가장 데이터를 잘 표현한다고 할 수 있을까? 직관적으로 보았을 때, 데이터가 가장 넓게 분포한 방향으로 기울어진 2번 선을 선택할 수 있을 것이다. 2번 선(벡터)에 대해 사영시키면 빨간점으로 이루어진 데이터들을 볼 수 있다. 이 점들은 하나의 선(1차원)으로 표현되며 .. 2022. 3. 7.
# 4. 선형 조합 (Linear Combination) https://dev-ryuon.tistory.com/45?category=943371 # 0. 선형 시스템 (Linear System) [이론] 중고등학교때 다들 '함수'라는 개념은 익히 알고있을 것이다. 함수는 방정식으로써 표현이 가능하고, 미지수가 적을 경우 수기로도 충분히 해를 구할 수 있다. 하지만, 방대한 양의 데이 dev-ryuon.tistory.com 이 포스트는 선형 시스템에 대해 숙지하고 보시는 것을 추천합니다. 이론 선형 조합을 이해하기 이전에 행렬을 구조적으로 보는 시점이 중요하다. 위 그림과 같이 행렬을 열 벡터의 집합으로 해석할 수 있다. 그 뜻은 행 단위로도 묶어서 해석할 수 있다. 하지만 보통은 열 벡터로 해석한다. 이제, 선형 시스템 Ax를 구조적으로 볼 수 있는 시야를 가.. 2021. 6. 18.