发布网友 发布时间:2024-10-11 02:51
共1个回答
热心网友 时间:8小时前
本文概述了几个计算机视觉领域中常用的权威数据集,包括PASCAL VOC、ImageNet、MS COCO、人脸检测和行人检测等。
PASCAL VOC,作为计算机视觉的奠基之作,由Mark Everingham和Luc van Gool等人创建,包含超过1.7万张图片,涵盖20类对象。它曾举办过8届竞赛,涉及物体分类、目标检测和图像分割等任务。这个数据集的下载地址是http://host.robots.ox.ac.uk/pascal/VOC/,百度云链接及提取码可在文中找到。
ImageNet,由李飞飞教授领导,拥有超过14亿张样本图片,分为27大类和2万多个小类。它与ILSVRC竞赛紧密相关,促进了深度学习算法的发展,如AlexNet、ResNet等。ImageNet的下载地址是http://www.image-net.org/download-imageurls。
由微软出资的MS COCO数据集,是场景理解的重要资源,包含91类目标和大量标注信息。其2014年至2017年的数据集提供训练、验证和测试图像,以及详细的语义分割数据。COCO的官网是http://cocodataset.org,提供了详细的使用指南和评估文档。
早期行人检测数据库如USC行人数据库,包含正面和背面视角的行人图片,用于“HOG+SVM”模型的训练。香港中文大学的数据集则提供了车载摄像头拍摄的行人视频,包含大量行人标注和行为分析信息。