본문 바로가기
[Research] - Motion Prediction

# 0. Waymo Open Dataset Motion

by Bebsae 2021. 12. 6.

Overview

The motion dataset is provided as sharded TFRecord format files containing protocol buffer data. The data are split into training, test, and validation sets with a split of 70% training, 15% testing and 15% validation data.

모션 데이터 세트는 protocol buffer 데이터를 포함한  분할된 TFRecords 포맷의 파일들로 제공된다. 데이터들은 70% 훈련, 15% 검증, 15% 테스트 세트로 나뉜다.

 

The dataset is composed of 103,354 segments each containing 20 seconds of object tracks at 10Hz and map data for the area covered by the segment.

데이터 세트는 103,354 개의 세그먼트로 구성되어 있으며, 각각의 세그먼트들은 오브젝트를 10Hz(초당 10번)로 20초 동안 객체 트래킹을 포함한다. 그리고 해당 세그먼트가 포함된 영역에 대한 맵 데이터로 구성된다.

 

These segments are further broken into 9 second windows (1 second of history and 8 seconds of future data) with 5 second overlap.

이 세그먼트들은 5초씩 중첩되도록 9초의 윈도우들(1초의 기록, 8초의 미래 데이터)로 나뉜다.

 

The data is provided in two forms. The first form is stored as Scenario protocol buffers. The second form converts the Scenario protos into tf.Example protos containing tensors for use in building models. 

데이터는 두 가지의 형태로 제공된다. 첫 번째 형태는 Scenario protocol buffers 형태로 저장되어 있다. 두 번째 형태는 모델 구축을 위해 텐서가 포함된 (Scenario protos를 변환한) tf.Example protos 형태가 있다.

 

To enable the motion prediction challenge, the ground truth future data for the test set is hidden from challenge participants. As such, the test sets contain only 1 second of history data. The training and validation sets contain the ground truth future data for use in model development.

모션 예측 챌린지가 가능하기 위해서 테스트 세트의 실제 미래 데이터는 참가자들에게 숨겨져 있다. 테스트 세트는 1초의 과거 데이터만 포함하고 있다. 훈련과 검증 세트에는 모델 개발을 위해 실제 미래 데이터가 포함되어 있다.

 

In addition, the test and validation sets provide a list of up to 8 object tracks in the scene to be predicted. These are selected to include interesting behavior and a balance of object types.

추가로, 테스트와 검증 세트에는 예측을 위해 장면 안에 8개의 객체 트랙들이 제공된다. 이것들은 흥미로운 행동과 객체 타입의 균형을 포함하도록 선택되었다.

 

Data Sampling

Each 9 second sequence in either the training or validation set contains 1 second of history data, 1 sample for the current time, and 8 senconds of future data at 10 Hz sampling. This corresponds to 10 history samples, 1 current time sample, and 80 future samples for a total of 91 samples. The test set hides the ground truth future data for a total of 11 samples (10 history and 1 current time samples).

  • 학습, 검증 세트 : 91 샘플 (과거 10 샘플 + 현재 1 샘플 + 미래 80 샘플)
  • 테스트 세트 : 11 샘플 (과거 10 샘플 + 현재 1 샘플)

 

Coordinate frames

All coordinates in the dataset are in a global frame with X as East, Y as North and Z as up. The original of the coordinate system changes in each scene. The origin is an arbitrary point and may be far from the objects in the scene. All units are in meters.

데이터 세트의 모든 좌표들은 X는 동쪽, Y는 북쪽, Z는 위로 향한다. 좌표계 원본은 모든 장면마다 변한다. 원점은 임의의 점이고 장면안의 객체들로부터 멀리 떨어져 있을 수 있다. 모든 단위는 미터 단위이다.

 

https://waymo.com/intl/en_us/dataset-motion/

 

Motion – Waymo

The motion dataset is provided as sharded TFRecord format files containing protocol buffer data. The data are split into training, test, and validation sets with a split of 70% training, 15% testing and 15% validation data. The dataset is composed of 103,3

waymo.com

 

댓글