深度学习数据集近 100 个开源数据集

最编程 2024-03-20 14:08:53

...

深度学习开源数据集

Images Analysis 图像分析

数据集	介绍	备注	网址
Flickr30k	图片描述	31,783 images，每张图片5个语句标注	传送门
Microsoft COCO	图片描述	330,000 images,每张图片至少5个语句标注	传送门
ESP Game	多标签定义图像	20,770 images，268 tags，诸如bed, light man,music	传送门
IAPRTC-12	多标签定义图像	19,452 images,291 tags	传送门
NUS-WIDE	多标签定义图像	269,648 images,several tags (2-5 on average) per image	传送门
CUHK-PEDES	以文搜图	34,054 images，每张图片2条描述	传送门
VRD	视觉关系检测	5,000 images, 100目录，37,993对关系	传送门
sVG	视觉关系检测	108,000 images, 998,000对关系	传送门
Visual Genome Dataset	图像属性检测	108,077 images, 5.4 M 区域块，2.8 M 属性，2.3 M 关系	传送门
VQA	问答系统	1,105,904问题，11,059,040 回答	传送门
Visual7W	问答系统	327,939 问答对	传送门
TID2013	图像质量评价	25张参考图像，24个失真类型	传送门
CSIQ	图像质量评价	30张参考图像，6个失真类型	传送门
LIVE	图像质量评价	29张参考图像，5个失真类型	传送门
WATERLOO	图像质量评价	4744张参考图像，20个失真类型	传送门
photo .net	图像美观评价	20,278张图像，打分[0,10]	传送门
DPChallenge .com	图像美观评价	16,509张图像，打分[0,10]	传送门
CUHK	图像美观评价	28,410张图像，只分高质量和低质量	传送门
AVA	图像美观评价	255,500张图像，打分[0,10]	传送门

Image Motion & Tracking 图像运动与跟踪

数据集	介绍	备注	网址
CUHK03	Person re-identification(人重识别)	image num:13164 person num:1360 camera num:10( 5 pairs)	传送门
CUHK02	Person re-identification(人重识别)	image num:7264 person num:1816 camera num:10( 5 pairs)	传送门
CUHK01	Person re-identification(人重识别)	image num:3884 person num:971 camera num: 2	传送门
VIPeR	Person re-identification(人重识别)	image num:1264 person num:632 camera num:2	传送门
ETH1,2,3	Person re-identification(人重识别)	image num:8580 person num:83,35,28 camera num:1	传送门
PRID2011	Person re-identification(人重识别)	image num:24541 person num:934 camera num:2	传送门
MARS	Person re-identification(人重识别)	image num:11910031 person num:1261 camera num:6	传送门
Market1501	Person re-identification(人重识别)	image num:32217 person num:1501 camera num:6	传送门
Epic Fail (EF) dataset	Risk Assessment(风险评估)	video num:3000	传送门
Street Accident (SA) dataset	Risk Assessment(风险评估)	video num:1733	传送门
OTB-50	visual tracking(跟踪)	video num:50	传送门
OTB-100	visual tracking(跟踪)	video num:100	传送门
VOT2015	visual tracking(跟踪)	video num:60	传送门
ALOV300	visual tracking(跟踪)	video num:314	传送门
MOT	visual tracking(跟踪)	video num train:11 test:11	传送门
THUMOS	Temporal action localization(动作定位)	video num:~3K activities class:20 instances:~3K	传送门
ActivityNet	Temporal action localization(动作定位)	video num:20k activities class:200 instances:7.6K	传送门
Mexaction2	Temporal action localization(动作定位)	activities class:2 instances:1975	传送门
FlyingChairs dataset	optical flow(光流)	image pairs：22k	传送门
FlyingThings3D	optical flow(光流)	image pairs：22k	传送门
KITTI benchmark suite	optical flow(光流)	image pairs：1600	传送门
MPI Sintel	optical flow(光流)	image pairs：1064	传送门

Video Analysis & Scene Understanding 影像分析与情景理解

数据集	介绍	备注	网址
UCF101	动作行为识别	13320 video,101类动作，主要是五大类：1)人-物交互；2)肢体运动；3)人-人交互；4)弹奏乐器；5)运动	传送门
HMDB51	动作行为识别	7000 videos,51类，包括人脸表情动作，身体动作，人与人交互等	传送门
Moments-in-Time	动作行为识别	1,000,000 videos,339类	传送门
ActivityNet 1.3	动作行为识别	20,000 videos,200类	传送门
Kinetics	动作行为识别	300,000 videos，400类	传送门
AVA	动作行为识别	57,600 videos，80类	传送门
Collective Activity Dataset	群体活动行为识别	44 videos,穿叉、行走、等待、交谈和排队五类	传送门
Choi’s New Dataset	群体活动行为识别	32 videos，聚会，谈话，分开，一起走，追逐和排队六类	None
ActivityNet 1.3	检测动作事件的起始时间和终止时间	20,000 videos,200类动作的起始时间和终止时间	传送门
THUMOS	检测动作事件的起始时间和终止时间	15,000 videos，101类动作的起始时间和终止时间	传送门
MED	事件检测	32,744 videos,20个事件	传送门
EventNet	事件检测	90,000 videos，500个事件	传送门
Columbia Consumer Video	事件检测	9,317 videos，20个事件	传送门
ADE20K	事件检测	20,210 videos，900个事件	传送门
DAVIS	视频主物体分割	50 videos，分割标注	传送门
FBMS	视频主物体分割	59 videos，分割标注	传送门
IJB-C	视频人脸识别	11,000 videos	传送门
YouTube Faces	视频人脸识别	3,425 videos，1595 人	传送门
MS-Celeb-1M	视频人脸识别	1,000,000 images，21,000人	传送门
MSVD	视频描述	1,970 videos	传送门
MSR-VTT-10K	视频描述	10，000 videos	传送门

3D Computer Vision 3d计算机视觉

数据集	介绍	备注	网址
photoface database	基于光度立体视觉的二维和三维人脸识别数据库	总共7356张图像，包含1839个session和261个subjects	None
NYU Depth V2 dataset	关于RGBD 图像场景理解的数据库	提供1449张深度图片和他们的密集2d点类标注	传送门
SUN RGBD dataset	是上面的NYU Depth V2 dataset的超集，多了3D bounding boxes和room layouts的标注。	有10,000张RGB-D图片，有58,657个3D包围框和146,617 个2d包围框。	传送门
PASCAL3D+	新的三维物体检测和姿态估计数据集，从PASCAL VOC 演化而来，包含图像，注解，和3D CAD模型	总共12个类，平均每个类别有3000多个实例	传送门
IKEA	包含典型室内场景的三维模型的数据库，例如桌子椅子等	包含大约759张图片和219个3D模型	传送门
New Tsukuba Dataset	包含了很多立体物体对的数据库，用于立体物体匹配	总共1800个立体物体对，以及每立体对的立体视差图、遮挡图和不连续图	传送门
Oxford RobotCar Dataset	关于户外自动驾驶的数据集。	包含在驾驶汽车过程从6个摄像头收集的2000w张图片，和当时的激光雷达，GPS和地面实况标注。	传送门
Middlebury V3	包含高分辨率物体立体视差标注的数据库	包含33个类，没有明说每类有多少数据	传送门
ShapeNet	包含3D模型，和3d模型的类别标注的数据集，覆盖了常用的3D数据集PASCAL 3D+。	它涵盖55个常见的对象类别，有大约51,300个3D模型	传送门
MICC dataset	包含了3D人脸扫描和在不同分辨率，条件和缩放级别下的几个视频序列的数据库。	有53个人的立体人脸数据	传送门
CMU MoCap Dataset	包含了3D人体关键点标注和骨架移动标注的数据集。	有6个类别和23个子类别，总共2605个数据。	传送门
DTU dataset	关于3D场景的数据集。	有124个场景，每场景有49/64个位置的RGB图像和结构光标注。	传送门

Analyzing Humans in Images 人类分析形象化

数据集	介绍	备注	网址
MSR-Action3D	包含深度的动作识别数据集，有20个动作，	总共557个序列。	传送门
Florence-3D	包含深度的动作识别数据集，	有9个动作，总共215个动作序列。	传送门
Berkeley MHAD	包含深度的动作识别数据集，	有11个动作，产生660个动作序列。	传送门
Online Action Detection	包含深度的动作识别数据集，	数据集包含59个长序列，包含10种不同的日常生活行为。	传送门
ChaLearn LAP IsoGD Dataset	RGB-D图像的手势识别的数据集。	包括47933个RGB-D手势视频，有249个手势标签。Training有35878视频，Validation有5784个，test有6271个	传送门
MAFA dataset	关于面部遮挡问题的数据集	有30, 811张人脸和35806张有遮挡的脸组成。	传送门
MSRC-12 Kinect Gesture Dataset	手势识别数据集	有4900张图片，包含12个不同手势，	传送门
2013 Chalearn Gesture Challenge dataset	手势识别数据集	有11000张图片，包含20个不同手势，	传送门
WIDER FACE	人脸检测数据集	有 32,203 张图片，标注了393703个人脸。	传送门
FDDB	人脸检测数据集	2845张图片，标注了5171张人脸。	传送门
300-VW dataset	面部表情数据集	包含114个视频和总计218,595帧。	传送门
HMDB51	人类行为识别的数据集	包含51个动作，总共有6766个视频剪辑	传送门
MPII Cooking Activities Dataset	人类行为识别的数据集	包含65个动作，有5609个视频	传送门
UCF101	人类行为识别的数据集	包含101个动作，有13320个视频	传送门
IJB-A dataset	包含视频和图片人脸识别的数据集	包含5712个图像和2085个视频	传送门
YouTube celebrities	视频人脸识别的数据集	包含47位名人的1910个视频	传送门
COX	视频人脸识别的数据集	包含1000个主题的4000个视频	传送门
Human3.6M	人体姿态估计的数据集	360万张3D照片，11名受试者在4个视点下执行15个了不同的动作	传送门
iLIDS	行人重识别的数据集	476 张图像，包含119个人	传送门
VIPeR	行人重识别的数据集	632个行人图片对（由两个相机拍摄）	传送门
CUHK01	行人重识别的数据集	包含971行人, 3884张图片	传送门
CUHK03	行人重识别的数据集	包含1360行人, 13164张图片	传送门
RWTH-PHOENIX-Weather multi-signer 2014	手语识别的数据集	包含了5672个德语手语的句子，有65,227个手语姿势和799,006帧	传送门
AFLW	人类面部关键点的数据集	总共约有25k张脸，每幅图像标注了大约21个位置。	传送门
CMU mocap database	动作识别的数据集	2235个数据，包含144个不同的动作。	传送门
Georgia Tech (GT) database	人脸识别数据库	50个人每人15张人脸。	传送门
ORL	人脸识别数据库	40个人每个人10张图。	传送门

Application 应用

数据集	介绍	备注	网址
DogCentric Activity Dataset	第一视角的狗和人之间的相互行为的数据集（视频）	总共有10类，具体数据量没有明说，y是动作类别	传送门
JPL First-Person Interaction Dataset	第一视角观察动作的数据集	57个视频，8个大类，y是动作类别	传送门
NUS-WIDE	关于图像文本匹配的数据集	269,648个图像和对应的标签	传送门
LabelMe Dataset	关于图像文本匹配的数据集	3825个图像和对应标签	传送门
Pascal Dataset	关于图像文本匹配的数据集	5011张训练图像和4952张测试图像	None
ICDAR 2015	关于文本检测的数据集	1500张训练，1000张测试，y为四边形的四个顶点。	传送门
COCO-Text	关于文本检测的数据集	63686张图片，其中43686张被选为训练集，剩下的2万用于测试。	传送门
MSRA-TD500	关于文本检测的数据集	300个训练，200个测试图像	传送门
Microsoft 7-Scenes Dataset	室内人体运动的数据集	有7种不同室内环境，每包含500-1000张图像视频序列。	传送门
Oxford RobotCar	户外自动驾驶数据集	包含图像，激光扫描结果和GPS数据。	传送门

Low- & Mid-Level Vision 中低水平视觉

数据集	介绍	备注	网址
Deep Video Deblurring for Hand-held Cameras	video/image deblurring(图像去模糊)	video num:71 video time: 3-5s blurry and sharp pair image num:6708	传送门
GOPRO dataset	video/image deblurring(图像去模糊)	blurry and sharp pair image num:3214 train num:2103 test num:1111	传送门
BSD68	image restoration(图像修复)/高斯降噪	image num:68	传送门
BSD100	“image restoration(图像修复)super resolution超分辨率重建”	image num:100	传送门
Set5	“image restoration(图像修复)super resolution超分辨率重建”	image num:5	传送门
Set14	“image restoration(图像修复)super resolution超分辨率重建”	image num:14	传送门
Urban100	“image restoration(图像修复)super resolution超分辨率重建”	image num:100	传送门
NYU v2 dataset	“image restoration(图像修复)depth super resolution深度超分辨率重建”	image num:1449	传送门
Middlebury dataset	“image restoration(图像修复)depth super resolution深度超分辨率重建”	image pair num: 33	传送门
alpha matting benchmark	Natural image matting(抠图)	“train num:27,test num:8”	传送门
real image benchmark	Natural image matting(抠图)	“train num:49300,test num:1000”	传送门
MSRA10K/MSRA-B	Image saliency detection(显著性区域检测)	image num(MSRA10K):10000 image num(MSRA-B):5000	传送门
ECSSD	Image saliency detection(显著性区域检测)	image num:1000	传送门
DUT-OMRON	Image saliency detection(显著性区域检测)	image num:5168	传送门
PASCAL-S	Image saliency detection(显著性区域检测)	image num:850	传送门
HKU-IS	Image saliency detection(显著性区域检测)	image num:4447	传送门
SOD	Image saliency detection(显著性区域检测)	image num:300	传送门
Describable Textures Dataset	texture synthesis(纹理合成)	image num:5640 category num:47 split train:val:test = 1:1:1	传送门
CVPPP leaf segmentation	Instance segmentation(样例分割)	image num: 161 train num: 128 test num: 33	传送门
KITTI car segmentation	Instance segmentation(样例分割)	image num: 3976 train num: 3712 test num: 144 val:120	传送门
Cityscapes	Instance segmentation(样例分割)	image num: 5000 train num: 2975 test num: 1525 val:500	传送门
SYMMAX	Symmetry Detection(对称性检测)	image num: train:200 test:100	传送门
WHSYMMAX	Symmetry Detection(对称性检测)	image num: train:228 test:100 object num: 1	传送门
SK506	Symmetry Detection(对称性检测)	image num: train:300 test:206 object num: 16	传送门
Sym-PASCAL	Symmetry Detection(对称性检测)	image num: train:648 test:787 object num: 14	传送门
Color Checker Dataset	Color constancy(颜色恒定)	image num: 568	传送门
NUS 8-Camera Dataset	Color constancy(颜色恒定)	image num: 1736	传送门

Text 文本

数据集	介绍	备注	网址
Stanford Sentiment Treebank	文本情感分析	11855个句子划分为239231个短语，每个短语有个概率值，越小越负面，越大越正面	传送门
IMDB	文本情感分析	100,000句子，正面负面两类	传送门
Yelp	文本情感分析	无	传送门
Multi-Domain Sentiment Dataset(Amazon product)	文本情感分析	100,000+句子，正面负面2类或强正面、弱正面、中立、弱负面、强负面5类	传送门
SemEval	文本情感分析	20,632句子，三类（正面、负面、中立）	传送门
Sentiment140(STS)	文本情感分析	1,600,000句子,三类（正面、负面、中立）	传送门

情感/观点/评论倾向性分析

数据集	备注	网址
ChnSentiCorp_htl_all	7000 多条酒店评论数据，5000 多条正向评论，2000 多条负向评论	传送门
waimai_10k	某外卖平台收集的用户评价，正向 4000 条，负向约 8000 条	传送门
online_shopping_10_cats	10 个类别，共 6 万多条评论数据，正、负向评论各约 3 万条，包括书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店	传送门
weibo_senti_100k	10 万多条，带情感标注新浪微博，正负向评论约各 5 万条	传送门
simplifyweibo_4_moods	36 万多条，带情感标注新浪微博，包含 4 种情感，其中喜悦约 20 万条，愤怒、厌恶、低落各约 5 万条	传送门
dmsc_v2	28 部电影，超 70 万用户，超 200 万条评分/评论数据	传送门
yf_dianping	24 万家餐馆，54 万用户，440 万条评论/评分数据	传送门
yf_amazon	52 万件商品，1100 多个类目，142 万用户，720 万条评论/评分数据	传送门

更多数据集可前往github搜索“chineseNLP”下载，传送门：

https://github.com/search?utf8=%E2%9C%93&q=chineseNLP&type=

以及大规模数据及：

上一篇：最全面的自动驾驶数据集分享系列 VII | 驾驶行为数据集

下一篇：慕尼黑工业大学开源四季数据集：自动驾驶视觉长期定位

深度学习数据集近 100 个开源数据集

深度学习开源数据集

Images Analysis 图像分析

Image Motion & Tracking 图像运动与跟踪

Video Analysis & Scene Understanding 影像分析与情景理解

3D Computer Vision 3d计算机视觉

Analyzing Humans in Images 人类分析形象化

Application 应用

Low- & Mid-Level Vision 中低水平视觉

Text 文本

情感/观点/评论倾向性分析

[PyTorch 与深度学习] 4、PyTorch 的数据集和数据加载器详细使用教程

[深度学习]YOLOv5，金属表面缺陷检测，GC10-DET 数据集-创建数据集.yaml

有关深度学习图像数据集的关键问题和注意事项

复旦大学团队发布中文医疗保健个人助理，同时开源 47 万个高质量数据集

深度学习 - 植物和作物图像数据集大集合

基于深度学习的常见车辆模型识别系统（网络版 + YOLOv8/v7/v6/v5 代码 + 训练数据集）

NeurIPS 2022 | 首个标有详细解释的多模态科学问答数据集，利用思维链的深度学习模型推理 (1)

NeurIPS 2022 | 首个标有详细解释的多模态科学问答数据集，利用思维链进行深度学习模型推理 (2)

深度学习数据集 近 100 个开源数据集

深度学习开源数据集

Images Analysis 图像分析

Image Motion & Tracking 图像运动与跟踪

Video Analysis & Scene Understanding 影像分析与情景理解

3D Computer Vision 3d计算机视觉

Analyzing Humans in Images 人类分析形象化

Application 应用

Low- & Mid-Level Vision 中低水平视觉

Text 文本

情感/观点/评论 倾向性分析

[PyTorch 与深度学习] 4、PyTorch 的数据集和数据加载器详细使用教程

[深度学习]YOLOv5，金属表面缺陷检测，GC10-DET 数据集-创建数据集.yaml

有关深度学习图像数据集的关键问题和注意事项

复旦大学团队发布中文医疗保健个人助理，同时开源 47 万个高质量数据集

深度学习 - 植物和作物图像数据集大集合

基于深度学习的常见车辆模型识别系统（网络版 + YOLOv8/v7/v6/v5 代码 + 训练数据集）

NeurIPS 2022 | 首个标有详细解释的多模态科学问答数据集，利用思维链的深度学习模型推理 (1)

NeurIPS 2022 | 首个标有详细解释的多模态科学问答数据集，利用思维链进行深度学习模型推理 (2)

深度学习数据集近 100 个开源数据集

情感/观点/评论倾向性分析