앙상블 기법 (Ensemble)

2021. 10. 28. 00:18·[AI] - Machine Learning

지난 포스트에서는 의사 결정 나무에 대해서 다루었다. 의사 결정 나무는 단 하나의 분류기를 사용하지만, 이번 포스트에서는 여러 분류기들을 결합한 방법인 앙상블 기법에 대해 다룰 것이다. 마치 오케스트라처럼 여러 악기가 모여 화음을 이루듯, 여러 분류기들을 결합하는 것이다.

 

P.S) 이미지, 영상, 음성과 같은 비정형 데이터의 분류는 딥러닝이, 정형 데이터에서는 앙상블이 좋은 성능을 낸다.

 

우선 앙상블의 조합 기법 4가지를 간단하게 살펴볼 것이다.

 

1. Voting 기법

Voting 기법

특징 1 : 서로 다른 알고리즘 결합

특징 2 : 전체 데이터 셋을 알고리즘 사이에서 공유

 

2. Bagging 기법

Bagging 기법

특징 1 : 같은 알고리즘 결합

특징 2 : 전체 데이터 셋에 대하여 Bootstraping sampling (복원 추출)을 통해 얻은 샘플 데이터셋들을 각각의 분류기에 적용

ex) RandomForest

 

3. Boosting 기법

특징 1 : 분류기를 순차적으로 학습

특징 2 : 앞에서 분류한 결과가 틀린 데이터에 가중치를 두어 뒤에 있는 분류기가 학습

ex) AdaBoost, GradientBoost, XGBoost, LightGBM

 

4. Stacking 기법

특징 : 여러 분류기가 도출한 결과값을 학습 데이터로 삼아 다른 분류기에 학습 (메타 모델)

 

이번에는 Vote의 2가지 방법에 대해 알아볼 것이다.

 

Hard Voting

하드 보팅은 분류한 클래스의 결과를 다수결로 집계하는 것을 말한다.

 

Soft Voting

소프트 보팅은 각 분류기가 클래스별로 분류할 확률을 집계하여 결론을 도출하는 것을 말한다.

 

이미지 출처 : https://vitalflux.com/hard-vs-soft-voting-classifier-python-example/

'[AI] - Machine Learning' 카테고리의 다른 글

선형 분류와 선형 회귀 (Linear Classification & Linear Regression)  (0) 2021.11.09
GBM (Gradient Boosting Machine)  (0) 2021.11.06
의사 결정 나무 (Decision Tree)  (0) 2021.10.24
F1 스코어와 ROC 커브  (0) 2021.10.17
정확도와 오차행렬 (Accuracy and Confusion matrix)  (0) 2021.10.11
'[AI] - Machine Learning' 카테고리의 다른 글
  • 선형 분류와 선형 회귀 (Linear Classification & Linear Regression)
  • GBM (Gradient Boosting Machine)
  • 의사 결정 나무 (Decision Tree)
  • F1 스코어와 ROC 커브
Bebsae
Bebsae
  • Bebsae
    뱁새zip
    Bebsae
  • 전체
    오늘
    어제
    • 분류 전체보기 (108)
      • [DevOps] - Kubernetes (5)
      • [DevOps] - AWS (1)
      • [AI] - Machine Learning (19)
      • [AI] - Neural Network (7)
      • [CS] - Network (2)
      • [CS] - Data Structure (3)
      • [CS] - Design Pattern (6)
      • [Language] - Python (15)
      • [Library] - Numpy (7)
        • Quick Start (5)
        • API (2)
      • [Framework] - Django (3)
      • [Framework] - QGIS (6)
      • [Framework] - PyQT (4)
      • [Mathematics] - Linear Alge.. (14)
      • [Mathematics] - Statistical (2)
      • [ETC] - Python (3)
      • [ETC] - C++ (1)
      • [ETC] - Linux (1)
      • 논문 (5)
      • 회고록 (3)
      • 생산성 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

    • 깃허브
  • 공지사항

  • 인기 글

  • 태그

    Linear
    algebra
    Convolution
    RNN
    Python
    디자인패턴
    분해
    numpy
    파이썬
    decomposition
    DEEPLEARNING
    linearalgebra
    선형대수
    MachineLearning
    QGIS
    교차검증
    머신러닝
    Machine
    신경망
    Learning
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
Bebsae
앙상블 기법 (Ensemble)
상단으로

티스토리툴바