自动驾驶数据集 - Argoverse 数据集
Argoverse数据集是由Argo AI、卡内基梅隆大学、佐治亚理工学院发布的用于支持自动驾驶汽车3D Tracking和Motion Forecasting研究的数据集。数据集包括两个部分:Argoverse 3D Tracking与Argoverse Motion Forecasting。
Argoverse数据集包含LiDAR数据、
RGB视频数据、前向双目数据、6 DOF的定位数据以及高精地图的数据,所有的数据都跟高精地图数据进行过配准。
Argoverse是第一个包含高精地图的数据集,它包含了290KM的带有几何形状和语义信息的高精地图数据。
3D visualization of an Argoverse scene
数据收集
Argoverse高精地图
城市 |
覆盖范围 |
路网长度 |
---|---|---|
Miami |
788510 |
204KM |
Pittsburgh |
286104 |
86KM |
204KMPittsburgh286104
86KM
Argoverse高精地图坐标系采用UTM坐标系,UTM将全球分成60个Zone,每个Zone经度方向跨越6度,在UTM基础之上,Argoverse又将坐标系相对于单个城市的固定坐标进行偏移,从而得到最终数据集的地图坐标系。
Argoverse地图包含三个部分:
1) Vector Map of lane centerlines and their attributes
2)Rasterized Map of Ground Height
3)Rasterized Map of driveable area and region of interest (ROI)
高精地图的数据可视化效果如下:
地图车道中心线(Red)和可行驶区域(黄色)
路口数据(紫色)
地图车道的前驱和后继
Argoverse Map的矢量数据(Vector Map)采用扩展的OpenStreetMap(OSM)格式,并提供了Python API用于获取地图数据。
Argoverse Map API
Argoverse Map API(Python实现)
3D Tracking
Argoverse数据的3D Tracking包含如下分类:
Argoverse Tracker从点云数据(LIDAR Data)中跟踪周围车辆的位置和速度,Tracker的工作流程如下:
Segmentation and Detection
分割检测的过程充分利用了Camera和Lidar各自的特性,首先利用DBSCAN根据点云密度对3D Lidar点云数据进行聚类,然后利用Mask RCNN获取像素空间上的Object Mask,最后对比点云聚类和Mask的结果,丢弃掉图像投影不落在任意一个Mask中的Lidar Cluster。
Association
通过Hungarian Algorithm(匈牙利算法)全局优化关联前后两帧检测的Objects。
Tracking
使用ICP(Iterative Closest Point)来估计相同Object在不同帧的相对变换,然后使用Kalman Filter(ICP的结果作为Measurement)来估计车辆的6*度姿态和速度。
运动轨迹预测
运动预测(Motion Forecasting)的baseline包含了三类坐标系:
1)City Coordinate System。就是前面提到的地图坐标系。
2)2D curvilinear coordinate system。
如下图所示,将绝对坐标系转换为沿着曲线方向的纵向距离和偏离曲线的横向距离。
3)Trajectory Normalization
在不使用Map的情况下,对Trajectory做归一化处理,所有Observation的起始位置位于(0,0),结束位置位于x轴上。事实证明,Normalization的效果比Absolute Map Coordinates或者Absolute Orientations的效果好。
Feature提取
Baseline使用距离Agent前后Object的distance来捕获Social Context,使用2D curvilinear coordinate system来捕获Map context。
Baseline模型
基于Social Feature和Map Feature,Argovese提供了一系列的Baseline模型:Constant Velocity, Nearest Neighbor和LSTM Encoder-Decoder模型等。
Prediction Metric
minADE = minimum Average Displacement Error,对于多轨迹线预测,minADE是FDE最小的轨迹的ADE。
minFDE = minimum Final Displacement Error。
minFDE只能评估最好的估计有多好,但不能评估所有轨迹的优劣。为了解决这个问题,论文中提出了新的Metric:Drivable Area Compliance (DAC),假设Model生成了n条未来可能的轨迹,其中m条轨迹超出了Drivable Area的范围,那么DAC = (n - m) / n, DAC的值越大意味着预测的效果越好。
另外论文中也使用了Miss Rate (MR)的Metric,如果有n条轨迹,其中m条轨迹的最后的坐标距离Ground Truth超过2m,那么miss rate=m/n。
Motion Forecasting Errors for different number of prediction
运动预测Baseline的定性结果
上一篇: 阿里云 2025 年春季实习生招聘
下一篇: 一目了然 | 自动驾驶拐角检测数据集
推荐阅读
-
风筝数据集 2260 张(VOC+YOLO 格式
-
基于深度学习的作物叶病检测系统(UI 界面 + YOLOv5 + 训练数据集)
-
如何从捕获一导出图像数据集 - Nuggets
-
宜家 3D 家具组装数据集
-
位、字节、WORD、DWORD 的区别和联系 - Unicode 和 ANSI 的区别就像输入法中 "全宽 "和 "半宽 "的区别一样。 由于不同的 ANSI 编码有不同的标准(不同的字符集),对于给定的多字节字符串,我们必须知道它使用的是哪种字符集,才能知道它包含哪些 "字符"。对于 UNICODE 字符串来说,无论环境如何,它所代表的 "字符 "内容始终是相同的。Unicode 有一个统一的标准,定义了世界上大多数字符的编码,因此拉丁文、数字、简体中文、繁体中文和日文都可以存储在一个编码中。统一码是一个统一的标准,定义了世界上大多数字符的编码。 比特(Bit)和字节(Byte)的区别:例如USB2.0 标准接口的传输速率为 480Mbps,有一些人误认为是每秒 480 兆比特,同样网络带宽为 2MB,就容易误认为是每秒 2 兆比特。其实,480Mbps 应该是 480 兆比特/秒或 480 兆字节/秒,它等于 "60 兆字节/秒";同样,2MB,应该是 256 兆字节/秒。 Bit 和 Byte 译为 "比特",都是数据计量单位,比特="位 "或 "比特"。 Byte = 字节,即 1byte = 8bits,两者的换算关系为 1:8。 Mbps = mega bits per second(兆位/秒)是速率单位,因此 2M 带宽应为 2 兆位/秒,即 2MBps。MB = 兆字节(Megabytes,兆字节)是单位量,1MB/S(兆字节/秒)= 8MBPS(兆字节/秒)。 通常所说的硬盘容量是指 40GB、80GB、100GB,其中的 B 是指 Byte 也称为 "字节"。 1 KB=1024 字节 1 MB=1024 KB=1024*1024 字节 1 GB=1024 MB=1024*1024*1024 字节 例如,以前所谓的 56KB MODEM 转换过来的 56KBps 除以 8 就是 7Kbyte,所以真正从网上下载文件存在硬盘上的速度也是每秒 7Kbyte;也就是说,用 B 表示传输速度一般指 Bit;用 B 表示容量一般指 Byte。比特、字节、WORD、DWORD 的本质。
-
3.文献研究--基于Canvas网络开放数据集的MOOC学习分析--胡红梅 宗洋
-
YOLOv5 入门 (II) 处理自己的数据集(标签统计、数据集分区、数据增强)
-
[PyTorch 与深度学习] 4、PyTorch 的数据集和数据加载器详细使用教程
-
[深度学习]YOLOv5,金属表面缺陷检测,GC10-DET 数据集-创建数据集.yaml
-
scRNA+bulk+MR:动脉粥样硬化五个 GEO 数据集 + GWAS,工作量非常到位 - 小结