当前位置 博文首页 > 微信号:Custom-Software:coco数据集记录
1 简介
微软发布的 COCO 数据库是一个大型图像数据集, 专为对象检测、分割、人体关键点检测、语义分割和字幕生成而设计。
COCO 数据库的网址是:
COCO API?提供了Matlab, Python和Lua的API接口。该API 接口可以提供完整的图像标签数据的加载, parsing和可视化。此外,网站还提供了数据相关的文章, 教程等。
在使用 COCO 数据库提供的 API 和 demo 之前, 需要首先下载 COCO 的图像和标签数据(类别标志、类别数量区分、像素级的分割等 ):
图像数据下载到?coco/images/?文件夹中;
标签数据下载到?coco/annotations/?文件夹中。
?
MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。?
COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
官网地址:http://cocodataset.org
person(人) ?
bicycle(自行车) ?car(汽车) ?motorbike(摩托车) ?aeroplane(飞机) ?bus(公共汽车) ?train(火车) ?truck(卡车) ?boat(船) ?
traffic light(信号灯) ?fire hydrant(消防栓) ?stop sign(停车标志) ?parking meter(停车计费器) ?bench(长凳) ?
bird(鸟) ?cat(猫) ?dog(狗) ?horse(马) ?sheep(羊) ?cow(牛) ?elephant(大象) ?bear(熊) ?zebra(斑马) ?giraffe(长颈鹿) ?
backpack(背包) ?umbrella(雨伞) ?handbag(手提包) ?tie(领带) ?suitcase(手提箱) ?
frisbee(飞盘) ?skis(滑雪板双脚) ?snowboard(滑雪板) ?sports ball(运动球) ?kite(风筝) baseball bat(棒球棒) ?baseball glove(棒球手套) ?skateboard(滑板) ?surfboard(冲浪板) ?tennis racket(网球拍) ?
bottle(瓶子) ?wine glass(高脚杯) ?cup(茶杯) ?fork(叉子) ?knife(刀)
spoon(勺子) ?bowl(碗) ?
banana(香蕉) ?apple(苹果) ?sandwich(三明治) ?orange(橘子) ?broccoli(西兰花) ?carrot(胡萝卜) ?hot dog(热狗) ?pizza(披萨) ?donut(甜甜圈) ?cake(蛋糕)
chair(椅子) ?sofa(沙发) ?pottedplant(盆栽植物) ?bed(床) ?diningtable(餐桌) ?toilet(厕所) ?tvmonitor(电视机) ?
laptop(笔记本) ?mouse(鼠标) ?remote(遥控器) ?keyboard(键盘) ?cell phone(电话) ?
microwave(微波炉) ?oven(烤箱) ?toaster(烤面包器) ?sink(水槽) ?refrigerator(冰箱)
book(书) ?clock(闹钟) ?vase(花瓶) ?scissors(剪刀) ?teddy bear(泰迪熊) ?hair drier(吹风机) ?toothbrush(牙刷)
? ? ? ? MS COCO的全称是Microsoft Common Objects in Context,起源于是微软于2014年出资标注的Microsoft COCO数据集,与ImageNet 竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。
? ? ? ? 当在ImageNet竞赛停办后,COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。?
? ? ? ? 该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。COCO数据集有91类,虽然比ImageNet和SUN类别少,但是每一类的图像多,这有利于获得更多的每类中位于某种特定场景的能力,对比PASCAL VOC,其有更多类和图像。
1.1、COCO目标检测挑战?
COCO数据集包含20万个图像;
80个类别中有超过50万个目标标注,它是最广泛公开的目标检测数据库;
平均每个图像的目标数为7.2,这些是目标检测挑战的著名数据集。
2、COCO数据集的特点
COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features:
Object segmentation Recognition in context Superpixel stuff segmentation 330K images (>200K labeled) 1.5 million object instances 80 object categories 91 stuff categories 5 captions per image 250,000 people with keypoints | 对象分割; 在上下文中可识别; 超像素分割; 330K图像(>200K标记); 150万个对象实例; 80个对象类别; ?91个类别; 每张图片5个字幕; 有关键点的250,000人; |
3、数据集的大小和版本
大小:25 GB(压缩)
记录数量: 330K图像、80个对象类别、每幅图像有5个标签、25万个关键点。
?? ? ?COCO数据集分两部分发布,前部分于2014年发布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775?testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。
(1)、2014年版本的数据,一共有20G左右的图片和500M左右的标签文件。标签文件标记了每个segmentation的像素精确位置+bounding box的精确坐标,其精度均为小数点后两位。
http://msvocds.blob.core.windows.net/coco2014/train2014.zip
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip
参考文献
https://www.cnblogs.com/q735613050/p/8969452.html
https://blog.csdn.net/qq_41185868/article/details/82939959
?
cs