# 9. 앙상블 기법 (Ensemble)

지난 포스트에서는 의사 결정 나무에 대해서 다루었다. 의사 결정 나무는 단 하나의 분류기를 사용하지만, 이번 포스트에서는 여러 분류기들을 결합한 방법인 앙상블 기법에 대해 다룰 것이다. 마치 오케스트라처럼 여러 악기가 모여 화음을 이루듯, 여러 분류기들을 결합하는 것이다.

P.S) 이미지, 영상, 음성과 같은 비정형 데이터의 분류는 딥러닝이, 정형 데이터에서는 앙상블이 좋은 성능을 낸다.

우선 앙상블의 조합 기법 4가지를 간단하게 살펴볼 것이다.

1. Voting 기법

특징 1 : 서로 다른 알고리즘 결합

특징 2 : 전체 데이터 셋을 알고리즘 사이에서 공유

2. Bagging 기법

특징 1 : 같은 알고리즘 결합

특징 2 : 전체 데이터 셋에 대하여 Bootstraping sampling (복원 추출)을 통해 얻은 샘플 데이터셋들을 각각의 분류기에 적용

ex) RandomForest

3. Boosting 기법

특징 1 : 분류기를 순차적으로 학습

특징 2 : 앞에서 분류한 결과가 틀린 데이터에 가중치를 두어 뒤에 있는 분류기가 학습

ex) AdaBoost, GradientBoost, XGBoost, LightGBM

4. Stacking 기법

특징 : 여러 분류기가 도출한 결과값을 학습 데이터로 삼아 다른 분류기에 학습 (메타 모델)

이번에는 Vote의 2가지 방법에 대해 알아볼 것이다.

Hard Voting

하드 보팅은 분류한 클래스의 결과를 다수결로 집계하는 것을 말한다.

Soft Voting

소프트 보팅은 각 분류기가 클래스별로 분류할 확률을 집계하여 결론을 도출하는 것을 말한다.

이미지 출처 : https://vitalflux.com/hard-vs-soft-voting-classifier-python-example/

'[AI] - Machine Learning' 카테고리의 다른 글

# 11. 선형 분류와 선형 회귀 (Linear Classification & Linear Regression) (0)	2021.11.09
# 10. GBM (Gradient Boosting Machine) (0)	2021.11.06
# 8. 의사 결정 나무 (Decision Tree) (0)	2021.10.24
# 7. F1 스코어와 ROC 커브 (0)	2021.10.17
# 6. 정확도와 오차행렬 (Accuracy and Confusion matrix) (0)	2021.10.11

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

뱁새zip

# 9. 앙상블 기법 (Ensemble)

'[AI] - Machine Learning' 카테고리의 다른 글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

# 9. 앙상블 기법 (Ensemble)

'[AI] - Machine Learning' 카테고리의 다른 글

관련글

댓글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역