이 포스트를 작성시간 기준으로 ImageNet의 서버가 동작하지 않아 다른 방법으로 데이터세트를 얻는 방법을 포스팅한다.
(기존 방법)
Training Set (138GB)
Validation Set (6GB)
(해당 포스트에서 진행하는 방법)
academictorrents.com/collection/imagenet-2012
지금은 토렌트를 사용하여 위 링크에서 데이터 세트를 얻어야 한다. 토렌트로 받은 압축파일 (.tar) 을 압축해제하면 이미지 5만장이 보일것이다. 하지만 클래스별로 폴더로 분리해야 PyTorch에서 데이터세트로 불러올 수 있다.
이 작업을 수행하는 쉘 스크립트는 raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh 에서 받을 수 있다. 해당 사이트에 있는 명령어들을 모두 복사하여 VSCode에서 Script.sh 로 만들었다.
다음으로 해야할 작업은 해당 스크립트 파일을 실행시키는 것이다.
참고
github.com/developer0hye/Setup-for-Imagenet
'[AI] - Neural Network' 카테고리의 다른 글
# 5. Long Short-Term Memory (LSTM) - Theory (0) | 2021.12.09 |
---|---|
# 4. Recurrent Neural Network (RNN) - Code (0) | 2021.12.07 |
# 3. Recurrent Neural Network (RNN) - Theory (0) | 2021.12.07 |
# 2. Convolution Neural Network (CNN) - Code (0) | 2021.05.06 |
# 1. Convolution Neural Network (CNN) - Theory (0) | 2021.05.03 |
댓글