예제 데이터 | sklearn.datasets | 사이킷런에 내장되어 있는 예제 데이터셋 |
피처 처리 | sklearn.preprocessing | 데이터 전처리에 필요한 다양한 가공 기능 제공 (원핫인코딩, 정규화, 스케일링..) |
sklearn.feature_selection | 알고리즘에 큰 영향을 미치는 피처를 우선순위대로 셀렉션 작업을 수행하는 다양한 기능 제공 | |
sklearn.feature_extraction.text sklearn.feature_extraction.image |
텍스트나 이미지 데이터의 벡터화된 피처 추출 ex) 텍스트 데이터의 Count vectorizer, tf-idf vectorizer |
|
피처 처리 & 차원 축소 | sklearn.decomposition | 차원 축소와 관련한 알고리즘 ex) PCA, NMF, Truncated SVD .. |
데이터 분리, 검증 & 파라미터 튜닝 | sklearn.model_selection | 교차 검증을 위한 학습용, 검증용, 테스트용 분리 GridSerarchCV로 하이퍼파라미터 튜닝 |
평가 | sklearn.metrics | 분류, 회귀, 클러스터링, 페어와이즈에 대한 다양한 성능 측정 방법 제공 ex) Accuracy, Precision, Recall, ROC-AUC, RMSE .. |
ML 알고리즘 | sklearn.ensemble | 앙상블 알고리즘 제공 ex) 랜덤 포레스트, 에이다 부스트, 그레디언트 부스팅 .. |
sklearn.linear_model | 선형 알고리즘 제공 ex) 선형 회귀, 릿지, 라소, 로지스틱 회귀, SGD (Stochastic Gradient Descent).. |
|
sklearn.naive_bayes | 나이브 베이즈 알고리즘 제공 ex) 가우시안 NB, 다항분포 NB |
|
sklearn.neighbors | 최근접 이웃 알고리즘 제공 ex) k-NN .. |
|
sklearn.svm | 서포트 벡터 머신 알고리즘 제공 | |
sklearn.tree | 의사 결정 트리 알고리즘 제공 | |
sklearn.cluster | 비지도 클러스터링 알고리즘 제공 ex) k-means, 계층형, DBSCAN .. |
|
유틸리티 | sklearn.pipeline | 피처 처리 등의 변환과 ML 알고리즘 학습, 예측 등을 함계 묶어서 실행할 수 있는 유틸리티 제공 |
'[AI] - Machine Learning' 카테고리의 다른 글
# 5. Feature Scaling and Normalization (StandardScaler, MinMaxScaler) (0) | 2021.04.16 |
---|---|
# 4. Data Preprocessing (Label Encoder, One-Hot Encoder) (0) | 2021.04.13 |
# 3. GridSearchCV (0) | 2021.04.12 |
# 2. Stratified K 폴드 (0) | 2021.04.01 |
# 1. 교차 검증 (K-폴드 교차 검증) (0) | 2021.04.01 |
댓글