RDX 공식블로그

CVPR 2020에서 소개된 자율주행 오픈소스 데이터셋 TOP5 본문

Tech.News

CVPR 2020에서 소개된 자율주행 오픈소스 데이터셋 TOP5

Redesign X(리디자인엑스) 2020. 7. 14. 11:11

(2020.07.01.) 자율주행 기술은 로봇택시부터 자율주행 트럭까지 앞으로 광범위한 응용이 가능해졌으며 많은 사람의 생명을 구할 수 있는 잠재력을 가지고 있다. 데이터는 지능형 기계의 연료 역할을 하기 때문에 오픈소싱 랜드마크와 자율주행 데이터셋은 자율주행 연구를 가속화할 뿐 아니라 기계 인식 작업에서도 진척도를 높인다.

 

유명 컴퓨터 비전 컨퍼런스인 CVPR 2020에서 5대 자율주행 오픈소스 데이터셋을 선보였다.

 

 

BDD100K: 이기종 멀티태스크 학습을 위한 다양한 드라이빙 데이터셋

 

BDD100K는 가상 주행 장면에 대한 새롭고 다양한 대규모 데이터셋이다. UC 버클리와 외부 연구진들은 주석 처리된 10만 개 이상의 다양한 비디오 클립에 주행 장면의 가장 큰 데이터셋을 수집하고 주석을 달았다. 이 데이터셋의 평가방법은 이미지 태그 지정, 차선 감지, 주행 영역 분할(drivable area segmentation), 도로 객체 감지, 이미지 분할(semantic image segmentation), 인스턴스 분할(instance segmentation), 다중 객체 감지 추적, 다중 객체 분할 추적, 도메인 적응 및 모방 학습의 10가지 작업으로 구성된다. BDD100K는 보다 현실적인 주행 시나리오를 다루며 다양한 환경 영역에서 관심 있는 범주의 위치 배열과 모습 변화를 더 많이 포착한다.

 

 

Google Landmarks Dataset v2 : 인스턴스 레벨 인식 및 검색을 위한 대규모 벤치마크

Google Research 연구진은 인간이 만든 랜드마크 영역에서 대규모의 미세한 인스턴스 인식 및 이미지 검색을 위한 새로운 평가방법인 구글 랜드마크 데이터셋 v2(GLDv2)를 소개했다. GLDv25M 이상의 영상과 20만개의 구분된 인스턴스 라벨을 포함해 현재까지 가장 큰 데이터셋이다. 이 테스트셋은 검색 및 인식 작업을 위해 ground truth 라벨링 도구를 사용했으며 18만개의 이미지로 구성되어 있다. 이 데이터셋은 이전 데이터셋이 고려하지 않았던 롱테일 현상(long-tailed class distribution), 엄청난 양의 영역 외 테스트 사진들과 클래스 내부 분산(intra-class variability) 같은 실험적인 특징들을 가지고 있다.

 

 

Maperial Street-Level Sequence : Lifelong Place 인식을 위한 데이터셋

 

MSLS(Maperial Street-Level Sequence)이미지스퀀스에서 도시 및 교외 장소 인식을 위한 대규모 데이터셋이다. lifelong place 인식은 컴퓨터 비전 분야에서 중요하고 도전적인 과제이다. 이 데이터셋은 강력한 로컬라이제이션과 효율적인 대규모 3D 재구성을 응용해 lifelong learning의 다양성을 보여주기 위해 설계 되었다. MSLS 데이터셋은 Mapillary 협력 매핑 플랫폼에서 추출한 160만개 이상의 영상이 포함되어있다. 이 데이터셋은 6개 대륙 및 30개의 주요 도시 이미지, 서로 다른 관점의 수백대의 카메라 그리고 9년이라는 기간 동안 모든 계절에 걸쳐 수집한 것임을 강조한다. 모든 이미지는 GPS와 나침판으로 위치를 찾아내며 높은 수준의 속성을 특징으로 한다.

 

 

nuScenes: 자율주행을 위한 멀티모달 데이터셋

 

nuTonomy scenes 또는 nuScenes는 자율주행을 위한 대규모 공개 데이터셋이다. 이 데이터셋은 실제 자율주행 자동차의 완전한 센서 세트를 장착해 실험적으로 도시주행 상황을 연구할 수 있다. 360도 시야를 가진 카메라 6, 레이더 5, 라이다 1대 등 완전 자율형 차량 센서 제품군을 탑재한 최초의 데이터셋이다. nuScenes1000개의 장면으로 구성되며, 각 장면의 길이는 20초이고 23개 클래스와 8개 속성에 대해 3D 바운딩박스로 완전히 주석을 달았다.

 

 

자율주행을 위한 인식의 확장: Waymo 오픈 데이터셋

구글 연구진은 1150개의 장면(각각 20초 길이)으로 구성된 대규모의 고품질 데이터셋과 다양한 도시 및 교외 지역에서 캡처된 고품질 LiDAR와 카메라 데이터로 구성된 새로운 데이터 셋을 소개했다. 제시된 지리적 범위 지표에 근거하여 이용할 수 있는 초대형 카메라+LiDAR 데이터셋보다 웨이모 데이터셋의 다양성이 15배 더 높다고 한다. 데이터셋은 2D(카메라 이미지)3D(LiDAR) 바운딩박스에 주석을 더 달았으며, 프레임 전체에 걸쳐 일관된 식별자를 제공하고 3D 검출 및 추적 작업뿐만 아니라 2D에 대한 강력한 기초선(baseline)을 제공한다.

 

 

 

 

[출처]

analyticsindiamag.com/top-5-autonomous-driving-dataset-open-sourced-at-cvpr-2020/

 

Top 5 Autonomous Driving Dataset Open-Sourced At CVPR 2020

According to Google, autonomous driving is expected to enable a wide range of applications that has the potential to save many human lives.

analyticsindiamag.com

Edited by Lucy

Comments