微信号：Custom-Software：coco数据集记录

当前位置博文首页 > 微信号：Custom-Software：coco数据集记录

最大化缩小

微信号：Custom-Software：coco数据集记录

作者：[db:作者] 时间：2021-07-10 13:07

1 简介

微软发布的 COCO 数据库是一个大型图像数据集, 专为对象检测、分割、人体关键点检测、语义分割和字幕生成而设计。

COCO 数据库的网址是:

MS COCO 数据集主页：http://mscoco.org/
Github 网址：https://github.com/Xinering/cocoapi
关于 API 更多的细节在网站:?http://mscoco.org/dataset/#download

COCO API?提供了Matlab, Python和Lua的API接口。该API 接口可以提供完整的图像标签数据的加载, parsing和可视化。此外,网站还提供了数据相关的文章, 教程等。

在使用 COCO 数据库提供的 API 和 demo 之前, 需要首先下载 COCO 的图像和标签数据（类别标志、类别数量区分、像素级的分割等）：

图像数据下载到?coco/images/?文件夹中；

标签数据下载到?coco/annotations/?文件夹中。

MS COCO的全称是Microsoft Common Objects in Context，起源于微软于2014年出资标注的Microsoft COCO数据集，与ImageNet竞赛一样，被视为是计算机视觉领域最受关注和最权威的比赛之一。?

COCO数据集是一个大型的、丰富的物体检测，分割和字幕数据集。这个数据集以scene understanding为目标，主要从复杂的日常场景中截取，图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标，328,000影像和2,500,000个label。目前为止有语义分割的最大数据集，提供的类别有80 类，有超过33 万张图片，其中20 万张有标注，整个数据集中个体的数目超过150 万个。

官网地址：http://cocodataset.org

0、COCO数据集的80个类别—YoloV3算法采用的数据集

person(人) ?
bicycle(自行车) ?car(汽车) ?motorbike(摩托车) ?aeroplane(飞机) ?bus(公共汽车) ?train(火车) ?truck(卡车) ?boat(船) ?
traffic light(信号灯) ?fire hydrant(消防栓) ?stop sign(停车标志) ?parking meter(停车计费器) ?bench(长凳) ?
bird(鸟) ?cat(猫) ?dog(狗) ?horse(马) ?sheep(羊) ?cow(牛) ?elephant(大象) ?bear(熊) ?zebra(斑马) ?giraffe(长颈鹿) ?
backpack(背包) ?umbrella(雨伞) ?handbag(手提包) ?tie(领带) ?suitcase(手提箱) ?
frisbee(飞盘) ?skis(滑雪板双脚) ?snowboard(滑雪板) ?sports ball(运动球) ?kite(风筝) baseball bat(棒球棒) ?baseball glove(棒球手套) ?skateboard(滑板) ?surfboard(冲浪板) ?tennis racket(网球拍) ?
bottle(瓶子) ?wine glass(高脚杯) ?cup(茶杯) ?fork(叉子) ?knife(刀)
spoon(勺子) ?bowl(碗) ?
banana(香蕉) ?apple(苹果) ?sandwich(三明治) ?orange(橘子) ?broccoli(西兰花) ?carrot(胡萝卜) ?hot dog(热狗) ?pizza(披萨) ?donut(甜甜圈) ?cake(蛋糕)
chair(椅子) ?sofa(沙发) ?pottedplant(盆栽植物) ?bed(床) ?diningtable(餐桌) ?toilet(厕所) ?tvmonitor(电视机) ?
laptop(笔记本) ?mouse(鼠标) ?remote(遥控器) ?keyboard(键盘) ?cell phone(电话) ?
microwave(微波炉) ?oven(烤箱) ?toaster(烤面包器) ?sink(水槽) ?refrigerator(冰箱)
book(书) ?clock(闹钟) ?vase(花瓶) ?scissors(剪刀) ?teddy bear(泰迪熊) ?hair drier(吹风机) ?toothbrush(牙刷)

1、COCO数据集的意义

? ? ? ? MS COCO的全称是Microsoft Common Objects in Context，起源于是微软于2014年出资标注的Microsoft COCO数据集，与ImageNet 竞赛一样，被视为是计算机视觉领域最受关注和最权威的比赛之一。
? ? ? ? 当在ImageNet竞赛停办后，COCO竞赛就成为是当前目标识别、检测等领域的一个最权威、最重要的标杆，也是目前该领域在国际上唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀创新企业共同参与的大赛。?
? ? ? ? 该数据集主要解决3个问题：目标检测，目标之间的上下文关系，目标的2维上的精确定位。COCO数据集有91类，虽然比ImageNet和SUN类别少，但是每一类的图像多，这有利于获得更多的每类中位于某种特定场景的能力，对比PASCAL VOC，其有更多类和图像。

1.1、COCO目标检测挑战?

COCO数据集包含20万个图像；

80个类别中有超过50万个目标标注,它是最广泛公开的目标检测数据库；

平均每个图像的目标数为7.2，这些是目标检测挑战的著名数据集。

2、COCO数据集的特点

COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features:

Object segmentation

Recognition in context

Superpixel stuff segmentation

330K images (>200K labeled)

1.5 million object instances

80 object categories

91 stuff categories

5 captions per image

250,000 people with keypoints

对象分割；

在上下文中可识别；

超像素分割；

330K图像（>200K标记）；

150万个对象实例；

80个对象类别；

?91个类别；

每张图片5个字幕；

有关键点的250,000人；

3、数据集的大小和版本

大小：25 GB（压缩）
记录数量： 330K图像、80个对象类别、每幅图像有5个标签、25万个关键点。
?? ? ?COCO数据集分两部分发布，前部分于2014年发布，后部分于2015年，2014年版本：82,783 training, 40,504 validation, and 40,775?testing images，有270k的segmented people和886k的segmented object；2015年版本：165,482 train, 81,208 val, and 81,434 test images。
(1)、2014年版本的数据，一共有20G左右的图片和500M左右的标签文件。标签文件标记了每个segmentation的像素精确位置+bounding box的精确坐标，其精度均为小数点后两位。

COCO数据集的下载(数据集下载地址)

1、2014年数据集的下载

http://msvocds.blob.core.windows.net/coco2014/train2014.zip

2、2017的数据集的下载

http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip

http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip

http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip

参考文献

https://www.cnblogs.com/q735613050/p/8969452.html

https://blog.csdn.net/qq_41185868/article/details/82939959

上一篇：微信号：Custom-Software：单阶段和双阶段网络模型区别及记录

下一篇：没有了

立即下载 - IIS7 站长工具包