欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

在一篇文章中|轨迹预测二十年发展的全面回顾!(基于物理/机器学习/深度学习/强化学习)(顶部) - 基于机器学习的经典方法

最编程 2024-04-02 07:52:04
...


与使用多种物理模型的基于物理的方法不同,基于机器学习的方法应用数据驱动模型来预测轨迹。根据大量文献,基于经典机器学习的AV轨迹预测方法包括高斯过程(GP)、支持向量机(SVM)、隐马尔可夫模型(HMM)、动态贝叶斯网络(DBN)、K最近邻(KNN)、决策树等。由于经典机器学习中最常用的方法是GP、SVM、HMM、DBN,本节将主要介绍这些方法。


A.高斯过程


原型轨迹法是一种基于策略的方法,它将车辆的轨迹划分为几种类型的原型轨迹的集合。该模型测量历史轨迹和原型集之间的相似性,以预测可能的轨迹。高斯过程(GP)[37]是原型轨迹方法[38]–[40]中使用的有效手段。


当GP用于预测轨迹时,轨迹被视为GP的样本,沿时间轴采样。样本由N个离散点表示以映射到N维空间。之后,样本满足N维空间中的N维高斯分布。因此,GP模型在建模阶段的主要任务是通过样本确定GP的参数。在[41]中,HMM用于估计可能的行为,然后GP用于预测轨迹。GP还可以用于建模交互相关因素,Trautman等人[42]使用GP进行关节碰撞避免,以解决冻结机器人问题。Guo等人[43]应用GP和Dirichlet过程(DP)来定义运动过程,并应用非参数贝叶斯网络来提取潜在的运动模式。


对于基于原型轨迹的方法,每个轨迹可以通过训练由原型集表示。因此,这些方法之间的主要区别在于如何构建原型轨迹。Govea等人[44]通过统计计算所有轨迹样本的平均值和方差来获得原型轨迹。Hermes等人[45]将样本轨迹划分为若干子集,并在训练后获得若干原型轨迹,以反映车辆运动变化。然而,很难将这些模型推广到其他场景,因为基于轨迹样本的方法仅针对特定场景进行训练。


B.支持向量机


支持向量机(SVM)可以在复杂环境中学习和识别驾驶员的操作。SVM的关键是找到满足分类要求的支持向量,并确定能够最大化分类数据间隔的最优超平面。当应用于轨迹预测问题时,驾驶机动通常被定义为几类:左转、右转、保持直线等。然后,它使用核函数将输入数据转换为高维,并在空间中进行线性分类,以找到驾驶策略,从而预测轨迹。


Mandalia等人[46]首先将SVM应用于识别车道变化策略,使用方向盘角度、位置和加速度等特征进行识别。由于SVM可以输出分类概率的特征,Kumar等人[47]提出了一种结合SVM和贝叶斯滤波的分层结构方法,以识别变道策略,从而获得更准确的识别结果。在[48],[49]中,SVM用于识别交通参与者的策略。因此,SVM可以识别车辆的策略,但SVM需要提前定义驾驶员的策略,预设的策略也会影响最终的预测结果。


C.隐马尔可夫模型


SVM在分类问题上很有效,但在轨迹预测方面不如隐马尔可夫模型(HMM)有效。HMM是最流行的基于机器学习的轨迹预测方法之一。HMM也是一种使用马尔可夫链的基于策略的方法。马尔可夫链是指一个包含有限事件的过程,系统在时间t+1的状态仅与前一时间t有关,状态转移概率与时间无关。数学表达式为:

640.png

在现实生活中,我们只能观察暴露在表面上的独特状态,但不存在其隐藏状态的直观表示。因此,有必要建立具有隐藏状态的马尔可夫过程,并通过与隐藏状态概率相关的可观察状态集来获得事件的基本状态,这就是所谓的隐马尔可夫模型。HMM由(S,O,A,B,π)[50]表示,如图5所示:

640.png 640.png


当HMM用于轨迹预测时,交通参与者的历史状态由观测序列O表示,HMM求解最可能的未来观测序列。Holger等人[52]使用转向角和全局坐标作为HMM的输入来预测驾驶员的操作。基于HMM,乔等人[53]提出了一种称为HMTP*的算法,该算法自适应地选择参数,以动态变化的速度模拟真实场景。在[51]中,HMM结合模糊逻辑用于驾驶员策略预测。此外,HMM可以集成到决策和规划系统中。在[54]中,HMM用于轨迹预测和风险评估,并将结果输入决策和规划系统。


尽管传统的HMM方法在预测驾驶员操作方面取得了巨大成功,但它们在预测过程中没有考虑交互相关因素的影响,因此其预测结果在实际交通场景中不够准确。Deo等人[55]提出了一种基于HMM和考虑相互作用相关因素的变分高斯混合模型(GMM)的车辆轨迹预测模型。通过找到能量函数的最优解来获得车辆相互作用信息。Zhang等人[56]提出了一种基于博弈论的GMM-HMM策略预测模型,考虑了交互感知因素。


D.动态贝叶斯网络


为了提高轨迹预测的准确性,预测模型应至少考虑车辆状态和交通参与者之间的交互作用。Koller等人[57]提到的动态贝叶斯网络(DBN)可以对这种交互进行建模。DBN是一种基于策略的方法,使用贝叶斯网络并考虑时间序列。DBN的基本概念和概率推理与贝叶斯网络相同。不同的是,贝叶斯网络描述了静态系统,而Kevin等人[58]引入了时间模板的概念来解决概率模型中的时序问题。时间段是指根据DBN具体化的时间模板,它将连续时间离散为具有预设时间粒度的可计数点。


通常,预设的时间粒度应与实际状态采集频率一致,DBN根据传感器采样频率作为时间段进行训练。此外,DBN的推理和学习方法需要转化为贝叶斯网络才能直接应用。贝叶斯网络常用的推理方法包括变量消除法、团树算法和采样算法。贝叶斯网络的学习方法包括最大似然估计、贝叶斯估计、EM算法等。此外,存在用于高复杂度DBN的特殊推理方法,如前向和后向推理方法[65]。


DBN的架构包括行为层、隐藏层和观察层,如图6所示。行为层表示网络的输入信息,观察层表示驾驶员的操作。使用这种架构,Gindele等人[59]对多辆车的驾驶策略进行了建模。输入信息包括所有车辆状态、车辆相互作用关系、道路结构、观察状态等。


Schreier等人[60]应用DBN来判断驾驶策略,并利用与每个驾驶策略相对应的运动学模型来预测轨迹。在[61]中,通过博弈论预测车辆策略,然后通过考虑相互作用相关因素的DBN判断车辆运动。He等人[62]使用DBN识别车辆跟随和变道策略,并预测变道的轨迹。在[63]中,DBN被设计为考虑物理相关因素、道路相关因素和相互作用相关因素。Li等人[64]将DBN与端到端模型相结合来预测行人轨迹,其中DBN用于提取交通参与者的特征和动态信息,端到端的模型将预测问题视为一个时序生成问题来生成预测轨迹。

640.png

当应用于轨迹预测时,DBN对交通参与者之间的交互作用进行建模,并在经典的基于机器学习的方法中表现良好。作为基于策略的方法,DBN模型获得了较高的识别性能,并已在多个真实世界测试中使用[66]。然而,DBN仍然面临从识别策略到生成轨迹的误差问题。许多方法只能判断两到三次策略,如车道保持和变道,模型的泛化能力不强。


E.总结


总之,经典的基于机器学习的方法通过挖掘数据特征来确定概率分布,如表II所示。经典的基于机器学习的方法为轨迹预测提供了新的思路,促进了基于学习的方法的发展。随着需要考虑的因素越来越多,这些方法的准确性不断提高,有助于轨迹预测。这些方法大多是基于策略的方法,可以通过首先判断策略来预测未来的轨迹。在这些方法中,通常需要提前提供或识别相关策略。

640.png