본문 바로가기
[AI] - Neural Network

# 0. ILSVRC 2012 Dataset

by Bebsae 2021. 4. 29.

이 포스트를 작성시간 기준으로 ImageNet의 서버가 동작하지 않아 다른 방법으로 데이터세트를 얻는 방법을 포스팅한다. 

 

(기존 방법)

Training Set (138GB)

Validation Set (6GB)

 

(해당 포스트에서 진행하는 방법)

academictorrents.com/collection/imagenet-2012

지금은 토렌트를 사용하여 위 링크에서 데이터 세트를 얻어야 한다. 토렌트로 받은 압축파일 (.tar) 을 압축해제하면 이미지 5만장이 보일것이다. 하지만 클래스별로 폴더로 분리해야 PyTorch에서 데이터세트로 불러올 수 있다. 

 

이 작업을 수행하는 쉘 스크립트는 raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh 에서 받을 수 있다. 해당 사이트에 있는 명령어들을 모두 복사하여 VSCode에서 Script.sh 로 만들었다.

 

다음으로 해야할 작업은 해당 스크립트 파일을 실행시키는 것이다.

스크립트를 실행시키고 분리하는 과정

 

참고

ndb796.tistory.com/471

 

이미지넷(ImageNet) 데이터셋 소개 및 다운로드하는 방법

이미지넷(ImageNet) 데이터셋은 MNIST, CIFAR 데이터셋과 더불어 굉장히 유명한 데이터셋이다. 일반적으로 MNIST나 CIFAR는 아이디어에 대한 검증 목적으로 사용한다. 최신 컴퓨팅 장치를 기준으로 보았

ndb796.tistory.com

github.com/developer0hye/Setup-for-Imagenet

 

GitHub - developer0hye/Setup-for-Imagenet: Imagenet(for image classification, 2012) 데이터 셋 다운로드 및 정리 방법

Imagenet(for image classification, 2012) 데이터 셋 다운로드 및 정리 방법 정리 - GitHub - developer0hye/Setup-for-Imagenet: Imagenet(for image classification, 2012) 데이터 셋 다운로드 및 정리 방법 정리

github.com

 

댓글