-
Object Detection / Segmentation 주요 데이터셋Deep Learning/vision 2021. 8. 7. 02:20728x90
Dataset
Object Detection과 Sementation 딥러닝 패키지들은 어떤 데이터셋을 사용할까??
대표적으로 Pascal VOC, MS COCO, Googel Open Images가 있다.
1.PASCAL VOC
PASCAL VOC 2012 데이터가 가장 최신의 데이터이고 가장 많이 사용한다. annotation 파일의 포맷은 XML이고 20개의 오브젝트 카테고리를 가지고 있다.
2.MS COCO
80개의 오브젝트 카테고리를 가지고 있고 annotation 파일의 포맷은 json 이다.
300만개의 image들과 1500 개의 object를 가지고있다. 하나의 image에 평균 5개정도의 object 들로 구성되어있다. 다른 데이터 셋에 비해 object가 많아서 난이도가 높은 데이터를 제공한다.
주의할 점이 있는데, object ID는 91까지 있다. ID를 가지고는 있지만 실제 data가 없는 경우가 있어 80개의 object를 가지고있다.
3.Google Open Images
600개의 오브젝트 카테고리를 가지고 있고 annotation 파일의 포맷은 csv 이다.
Annotation
각각의 데이터들은 Annotation 파일을 가지고 있다. Annotation파일은 이미지의 Detection 정보를 가지고 있다. Object의 bounding box 위치, object 이름등의 정보를 가지고있다. 아래는 annotation 파일의 내용이다.
태그에 어떤 파일에대한 정보인지, 태그에 object의 이름, 위치 등의 정보가 담겨져있다.
728x90'Deep Learning > vision' 카테고리의 다른 글
OpenCV | FasterRCNN (0) 2021.08.19 MMDetection | Faster RCNN (1) 2021.08.15 OpenCV 영상 처리 (2) 2021.08.07 Object Detection (0) 2021.08.04