利用內(nèi)省學(xué)習(xí)和推理增強基于柵格的運動規(guī)劃

2023-01-16 11:13:25· 來源：同濟智能汽車研究所

編者按：目前機器學(xué)習(xí)已經(jīng)廣泛的應(yīng)用在自動駕駛規(guī)劃、控制算法的開發(fā)當(dāng)中。但是車輛的工作環(huán)境復(fù)雜多變，具有較高的不確定性，加之建模的誤差、環(huán)境噪聲以及軟件的性能和邏輯漏洞等，這些都對車輛的通行能力、學(xué)習(xí)算法的效率等提出了更高的要求，車輛的實際表

編者按：目前機器學(xué)習(xí)已經(jīng)廣泛的應(yīng)用在自動駕駛規(guī)劃、控制算法的開發(fā)當(dāng)中。但是車輛的工作環(huán)境復(fù)雜多變，具有較高的不確定性，加之建模的誤差、環(huán)境噪聲以及軟件的性能和邏輯漏洞等，這些都對車輛的通行能力、學(xué)習(xí)算法的效率等提出了更高的要求，車輛的實際表現(xiàn)非常有可能超出由建模過程中的假設(shè)條件推導(dǎo)出的車輛運動安全邊界，對行車安全造成很大的威脅。為了最大程度保證行車安全、提升系統(tǒng)的魯棒性，對車輛進行異常監(jiān)測是十分必要的。本文提出了一種對系統(tǒng)的正常狀態(tài)進行學(xué)習(xí)、異常狀態(tài)進行學(xué)習(xí)的方法，可以對算法的適應(yīng)性、安全性等進行不同程度的提升。

本文譯自：

《Enhancing Lattice-based Motion Planning With Introspective Learning and Reasoning 》

文章來源：

IEEE ROBOTICS AND AUTOMATION LETTERS, VOL. 6, NO. 3, JULY 2021

作者：

Mattias Tiger , David Bergstr?m , Andreas Norrstig, and Fredrik Heintz

原文鏈接：https://arxiv.org/abs/2005.07385

摘要：基于柵格的運動規(guī)劃是一種混合規(guī)劃方法，規(guī)劃由離散動作組成，同時也是物理上可行的軌跡。該規(guī)劃同時考慮了離散和連續(xù)的方面，例如動作前提條件和配置空間中的無碰撞動作持續(xù)時間。安全運動規(guī)劃依賴于經(jīng)過良好校準(zhǔn)的安全裕度來進行碰撞檢測。軌跡跟蹤控制器必須進一步能夠在這個安全范圍內(nèi)可靠地執(zhí)行運動，以便保持安全。在這項工作中，我們關(guān)注的是內(nèi)省學(xué)習(xí)和推理對控制器的性能的影響。使用顯式不確定性量化的機器學(xué)習(xí)技術(shù)學(xué)習(xí)不同動作的正?？刂破鲌?zhí)行，以便在安全關(guān)鍵應(yīng)用中安全使用。通過提高模型的精度，可以降低安全邊際，同時保持與以前相同的安全性。推理既可以驗證學(xué)習(xí)到的模型保持安全的性能，也可以使用更準(zhǔn)確的執(zhí)行預(yù)測和更小的安全邊際來在運動規(guī)劃器中提高碰撞檢查的有效性。該方法允許在正常情況下明確感知控制器的性能，并在異常情況下檢測不正確的性能。利用仿真方法對四軸飛行器的三維非線性動力學(xué)進行了評價。

關(guān)鍵詞：運動和路徑規(guī)劃，避免碰撞

Ⅰ 引言
安全的運動規(guī)劃是機器人在動態(tài)、非結(jié)構(gòu)化和人為定制的環(huán)境中導(dǎo)航的必要條件，如在室內(nèi)或城市環(huán)境中。在真實的動態(tài)環(huán)境中操作使內(nèi)省功能變得重要，因為情況可以很容易地改變，超出合理的設(shè)計假設(shè)：硬件退化、建模錯誤、軟件錯誤以及罕見的外部干擾，如極端天氣或來自其他外界的意外對抗性攻擊。從機器人的角度了解正常的運動執(zhí)行是什么樣子，并及時檢測所執(zhí)行的行為何時變得異常是非常重要的?；跂鸥竦倪\動規(guī)劃是自動化車輛實際實現(xiàn)中最常用的運動規(guī)劃技術(shù)之一。它的工作原理是將運動限制在有限數(shù)量的預(yù)先計算的運動基元上，這些運動基元在狀態(tài)格上的點之間移動，并利用圖搜索找到一個物理上可行的軌跡作為兼容的運動基元序列。這是一種適合于動態(tài)環(huán)境的技術(shù)和一種快速搜索方法來尋找可以實時執(zhí)行最優(yōu)軌跡，考慮舒適、安全和車輛約束?；跂鸥竦倪\動規(guī)劃已經(jīng)成功地在各種機器人上實現(xiàn)了。例如，最近的進展是，在實時重新規(guī)劃新的具有多個動態(tài)障礙的無碰撞軌跡的挑戰(zhàn)中。使用像度量時間邏輯(MTL)或者概率信號的時序邏輯(ProbSTL)這樣的正式語言來評價正常行為，用于現(xiàn)代運行時驗證框架，以執(zhí)行運動計劃的執(zhí)行監(jiān)控，是一個非常困難的挑戰(zhàn)。機器學(xué)習(xí)可以用來補充正式的安全要求，學(xué)習(xí)的正常動作執(zhí)行模型，例如機器人操作任務(wù)。

圖1 當(dāng)動作執(zhí)行是安全至關(guān)重要的時候，對于像機器人這樣的自主系統(tǒng)來說，機器人本身知道正常的執(zhí)行是什么樣子的（學(xué)習(xí)）以及當(dāng)前的動作是正常的還是異常的（監(jiān)控）是很重要的。

基于格的運動規(guī)劃提供了一個有效學(xué)習(xí)和監(jiān)控運動動作執(zhí)行的機會，因為已經(jīng)離散和定義良好的運動基元（動作）。在這篇文章中，我們提出了一種用于增強基于柵格的運動規(guī)劃方法的一般方法：（1）正常的運動基元系統(tǒng)執(zhí)行的學(xué)習(xí)模型，（2）使用學(xué)習(xí)的模型，提高碰撞檢測的有效性，（3）有效的監(jiān)控運動基元執(zhí)行的異常情況。
由于碰撞檢查和異常檢測都是安全的關(guān)鍵，學(xué)習(xí)是使用機器學(xué)習(xí)技術(shù)（從貝葉斯機器學(xué)習(xí)的顯式不確定性量化）完成的。對異常的監(jiān)視并實時驗證學(xué)習(xí)到的模型對于運動規(guī)劃器中使用的碰撞檢查仍然有效。第二節(jié)描述了給定動態(tài)障礙的現(xiàn)代基于網(wǎng)格的運動規(guī)劃和控制方法。相關(guān)工作在第三小節(jié)中。我們方法中的學(xué)習(xí)、改進碰撞檢查和監(jiān)測運動原始執(zhí)行的方法在第四節(jié)中提出，結(jié)果在第五節(jié)中，結(jié)論在第六節(jié)中。

Ⅱ 問題構(gòu)造

A.運動規(guī)劃

考慮一個被建模為時常非線性系統(tǒng)的機器人：

其中，代表機器人的狀態(tài)；是控制信號；機器人對其狀態(tài)及其控制信號施加了物理約束。該機器人在2D或3D世界中運行或者。有一些區(qū)域被靜態(tài)和動態(tài)的障礙所占據(jù) ；自由空間是機器人所占據(jù)的區(qū)域由狀態(tài)轉(zhuǎn)換，在時刻沒有與任何障礙物發(fā)生碰撞。

運動規(guī)劃器的目標(biāo)是產(chǎn)生一個可行的參考軌跡，使機器人從開始狀態(tài)移動到目標(biāo)狀態(tài)。同時優(yōu)化一個給定的性能度量，例如，在最小時間和平滑度之間進行權(quán)衡?？紤]到這些障礙，參考軌跡也必須是無碰撞的。這個問題被稱為動態(tài)運動規(guī)劃問題(DMPP)：

B.基于柵格的運動規(guī)劃

基于柵格的運動規(guī)劃是DMPP 問題的一個可處理的近似，其中狀態(tài)空間被離散為一個狀態(tài)柵格，并構(gòu)造了有限數(shù)量的平移不變運動基元（動作），以允許在柵格上的狀態(tài)（節(jié)點）之間的運動。圖搜索技術(shù)，如具有可接受啟發(fā)式的A?，可以用來尋找一個從到的有效的運動基元動作序列。一個運動基元動作是在柵格網(wǎng)格上從一個初始狀態(tài)到一個最終狀態(tài)的規(guī)劃。上述的規(guī)劃滿足如下的條件：

運動基元是利用使用相同的損失函數(shù)的數(shù)值最優(yōu)控制離線生成的，并被分配得到的目標(biāo)函數(shù)值。圖2顯示了一些運動基元。

對DMPP的柵格近似是：

是由狀態(tài)中的位置定義的平移矩陣，是一個在位置維數(shù)上的零對角線矩陣。是規(guī)劃中前個運動基元的結(jié)果平移，是規(guī)劃中的前個運動基元的開始時間。

所得到的規(guī)劃結(jié)果由一系列個運動基元動作組成，，。這個規(guī)劃的結(jié)束時間是。參考軌跡是由平面中運動基元序列的順序時空連接構(gòu)成的?；跂鸥竦倪\動規(guī)劃是完整的解決方案，他在分辨率極限下與DMPP等價。

圖2 在總共104個基元中，26個運動基元的初始速度和最終速度為零。所有開始位置為

由運動規(guī)劃器找到的參考軌跡由軌跡跟蹤控制器執(zhí)行，例如使用非線性模型預(yù)測控制器（MPC）。軌跡跟蹤控制器的目標(biāo)是讓機器人以較小的跟蹤誤差跟蹤期望的參考軌跡，同時保持接近前饋控制信號。

對當(dāng)前時間點求解的連續(xù)時間非線性MPC問題表示為：

其中，設(shè)計參數(shù)、、均為正定權(quán)值矩陣，為預(yù)測范圍。

C.碰撞檢測

機器人占據(jù)了一個區(qū)域，取決于其在時刻的狀態(tài)。我們想要找到一個參考軌跡，它在任何時間點是無碰撞的。

在應(yīng)用的運動規(guī)劃中存在著許多可能的不確定性來源。這些可能是由于例如建模誤差、傳感器噪聲、噪聲控制或其他因素的不可預(yù)測性。不確定性可以分為對狀態(tài)的感知和對未來狀態(tài)的可預(yù)測性，例如由于機器人的行動，機器人和它的環(huán)境。緩解不確定性的一種常見方法是使用安全裕度來減少不確定性引起的碰撞。這種安全裕度邊界在本研究中考慮的是一個相對于機器人坐標(biāo)系的區(qū)域，它擴展了機器人的空間占用率。

其中，是被機器人實際占據(jù)的區(qū)域；區(qū)域上的二進制算符被定義為：

另一種方法是擴展障礙區(qū)域：安全裕度可分為三個主要部分，

從機器人的角度、控制結(jié)果和在其他機器人的行為來反映了世界狀態(tài)的不確定性。在存在不確定性的安全關(guān)鍵應(yīng)用中，為了保證概率分布，必須保證概率安全性和概率可行性。一個安全裕度可以從這樣的表示來構(gòu)造約束碰撞的概率，例如每秒最多為0.01%，在文獻中經(jīng)常被稱為機會約束。

第三個安全邊際的組成部分對于基于柵格的方法很重要，但到目前為止在很大程度上被忽視了。由于建模誤差、噪聲源和硬件的限制，實際上期望軌跡跟蹤控制器會跟蹤參考軌跡是不合理的。即使使用精確的模型和沒有噪聲，精度也取決于運動原元序列，以及設(shè)計參數(shù)、、、的選擇。這種跟蹤誤差往往同時有偏差和協(xié)方差，并直接影響。本文提出了一種系統(tǒng)地確定用于基于柵格的運動規(guī)劃的方法，并且還可以在運行時驗證確實是正確的概率。后者是為了確保在不斷變化的情況下保持安全保障。

Ⅲ 相關(guān)工作

雜亂、復(fù)雜、動態(tài)環(huán)境中的實時運動規(guī)劃問題在文獻中受到越來越多的關(guān)注。

多分辨率柵格等進展使得基于柵格的方法適用于雜亂和復(fù)雜的環(huán)境?；跂鸥竦倪\動規(guī)劃實現(xiàn)了最先進的（SOTA）性能，例如具有多個拖車的卡車，對于四軸飛行器的規(guī)劃和重新規(guī)劃，有動態(tài)和時間，在復(fù)雜的環(huán)境中實時的動態(tài)障礙。我們在第II-A節(jié)和第II-B節(jié)中概述了[3]的一般問題設(shè)置。我們通過提供詳細的上下文來展示如何將我們提出的內(nèi)省能力集成到基于柵格的運動規(guī)劃中，并且我們的工作與[3]中的多分辨率柵格的方法完全兼容。[3]中的多分辨率柵格點方法又是基于[14]，[14]中的軟約束可以包含在損失函數(shù)中。

通常的做法是放松的組成，并選擇一個任意的大區(qū)域作為可能滿足期望的安全約束的。這種方法中最常見的簡化是使用像[15]這樣的球形安全邊際，由單個半徑參數(shù)定義。這種做法雖然計算效率很高，但通常需要一個比實際需要的要大得多的，從而降低了碰撞檢查的有效性。這可能是由于不同方向上的位置不確定性和位置偏差造成的，這兩者都可能在強度和方向上隨著時間的推移而變化（如強風(fēng)）。先前的工作調(diào)查了的不同部分，并提供了概率基于和的方法。

在[16]中，在不確定性下使用基于柵格的運動規(guī)劃，在參考軌跡中明確考慮了狀態(tài)不確定性。其中的一個結(jié)果是，在規(guī)劃期間的每個時間點上，都可以作為概率的基礎(chǔ)。例如，它可以是時間點狀態(tài)的99%概率區(qū)域。就其本身而言，這對應(yīng)于一個安全邊際，即機器人所占據(jù)的區(qū)域在范圍內(nèi)的可能性至少為99%。

如果有一個真實的目標(biāo)域模擬器，它可以用來模擬其他個體的真實行為，以及這些個體與機器人之間的交互。這樣的模擬器可以用于確定的不確定性，并且邊際可以被調(diào)整以滿足例如99.9%的無碰撞的概率。由于是基于其他個體的預(yù)測模型的，因此它適用于各種運動規(guī)劃方法，包括基于柵格的方法。

在其他運動規(guī)劃方法中已經(jīng)考慮了安全裕度部分，比如那些基于快速擴展的隨機樹（RRT），其中過程噪聲用于采樣可能的運動規(guī)劃執(zhí)行。在[16]中，過程噪聲影響參考軌跡周圍的協(xié)方差，但不確定性是無偏的。

我們的貢獻，除了提出的集成到基于柵格的運動規(guī)劃，在基于柵格的范式之外是有用的。學(xué)習(xí)模型和運動基元的異常檢測假設(shè)有一組固定的運動基元，我們可以觀察它們的執(zhí)行，如在SOTA中的四軸飛行器運動規(guī)劃[18]，[19]。碰撞檢查有效性的提高進一步假設(shè)了模型是對執(zhí)行可變性的精確描述，這可能并不總是適用于搜索后的軌跡優(yōu)化[4]，[18]。這將導(dǎo)致我們提出的方法也包括在不同的優(yōu)化結(jié)果的變化。

Ⅳ 內(nèi)省基于柵格的運動規(guī)劃與控制

圖3 學(xué)習(xí)基元的正常執(zhí)行模型的說明。左：所有有效的三個運動基元規(guī)劃，中間是（前一個，下一個）。中心：觀察每個三個運動基元規(guī)劃的執(zhí)行情況。右：單峰分布的平均預(yù)測區(qū)域和95%概率區(qū)域（11），捕獲了正常執(zhí)行的預(yù)期可變性。

A.學(xué)習(xí)正常的基元執(zhí)行

運動基元的執(zhí)行，被機器人感知，是一個離散軌跡，帶有時間點。設(shè)和表示一個關(guān)于的有效的前一個和下一個運動基元，則是一個有效的規(guī)劃。對于每一個，讓表示被觀察到的原始的執(zhí)行，一個表示每個有效的三運動基元序列。所有基元的執(zhí)行都具有相同的時間。請注意，這些時間點將不會被對齊，而數(shù)據(jù)點的數(shù)量可能在不同的執(zhí)行之間略有不同。模型學(xué)習(xí)步驟的說明如圖3所示。

從恢復(fù)執(zhí)行基本的，我們假設(shè)一個具有對角協(xié)方差的非線性加性高斯噪聲回歸模型：

并在函數(shù)之前放一個高斯過程：

高斯過程[20]是一種在函數(shù)上的分布，在許多統(tǒng)計分析和回歸任務(wù)中都非常成功，例如運動模式識別[21]。它是一個貝葉斯非參數(shù)模型，適用于建模軌跡和基于軌跡的運動模式[22]。高斯過程由平均函數(shù)和協(xié)方差函數(shù)定義。通過將GP調(diào)節(jié)在觀察軌跡上，我們得到一個預(yù)測分布，對于每個時間點，

在所有狀態(tài)維度上

其中，使用一個零均值函數(shù)，因為我們可以很容易地從數(shù)據(jù)中減去均值，

,，是一個恒等矩陣。因為是一個標(biāo)量，那么是一個標(biāo)量，是一個列向量，是一個方陣。為了簡單起見，每個輸出維度都被視為獨立的，這相當(dāng)于它們被一個單獨的函數(shù)建模，每個函數(shù)都有一個單獨的高斯過程先驗。

使用(6)，現(xiàn)在可以在相同的時間間隔內(nèi)對齊所有的三聯(lián)基元執(zhí)行。這組執(zhí)行跨越了基元的多樣性，我們期望未來的正常執(zhí)行都與這個集合相似。

運動基元是通過由時間參數(shù)化的nD狀態(tài)空間的一維曲線。因此，我們認為函數(shù)上的單峰分布（如單個GP）是一個合適的模型來表示[22]的執(zhí)行可變性。

我們將運動基元執(zhí)行模型表示為函數(shù)上的單峰分布：

其中，和由[22]給出。

這可以解釋為具有高斯分布噪聲的噪聲樣本的樣本均值和樣本方差。它是高斯過程混合物的高斯近似MoGPs。MoGPs是基于所有具有相同權(quán)重的GPs（每個三聯(lián)基元都被觀察到一次）。高斯近似允許MoGP在個別執(zhí)行之外進行推廣。運動基元狀態(tài)執(zhí)行模型如圖3右邊的第三個圖所示，圖4中的三維位置以及運動基元狀態(tài)軌跡和觀察到的執(zhí)行。

圖4 學(xué)習(xí)了一個運動基元的單峰分布。圖中顯示了殘差w.r.t.減去運動基元的參考狀態(tài)軌跡，即。紅線是觀測結(jié)果的單個高斯過程。單峰分布由藍色區(qū)域定義，顯示其99%概率區(qū)域，藍線為其模態(tài)。

B.碰撞檢測

學(xué)習(xí)到的運動基元模型表示機器人在執(zhí)行運動基元時的狀態(tài)。在高斯過程噪聲假設(shè)下，其模態(tài)平均與運動原始參考狀態(tài)軌跡相同或更準(zhǔn)確。執(zhí)行可變性被明確地表示為狀態(tài)上隨時間變化的概率密度。

對于根據(jù)多元高斯分布分布的隨機變量，將概率為P的中心概率區(qū)域（PR）定義為[23]

是概率的具有個自由度的卡方分位數(shù)函數(shù)。對于一個對角線矩陣簡化為一個軸對準(zhǔn)的橢球體，

每個軸的軸長由給出。設(shè)是運動規(guī)劃(4)中的一個運動基元，對應(yīng)于運動基元和開始時間。設(shè) ，它限制在0和之間。運動基元的模型是一個維的多元分布，在每個時間點處具有對角協(xié)方差矩陣。安全裕度現(xiàn)在可以基于概率給定概率，

C.異常檢測

一旦我們學(xué)習(xí)了運動基元模型，我們就想使用它們來檢測運動基元的異常執(zhí)行?；膱?zhí)行可變性模型上的概率區(qū)域描述了我們期望機器人在給定時間點處于的狀態(tài)。例如，[7]在執(zhí)行監(jiān)控中使用概率間隔來實現(xiàn)機器人的安全。

有幾種可能的方法來使用概率區(qū)域來定義什么是正常的行為。一種簡單的方法是檢查機器人是否離開該區(qū)域，如果離開，將該執(zhí)行定義為異常。然而，由于我們選擇的區(qū)域不包含所有的概率，我們?nèi)匀黄谕麢C器人偶爾離開概率區(qū)域。

更準(zhǔn)確地說，如果我們選擇一個99%的PR，機器人預(yù)計將在1%的時間點上離開這個間隔。如果機器人開始更頻繁地離開概率區(qū)域，這可能是一個錯誤的指示。我們將離開概率區(qū)域的速率定義為失敗率，并將其建模為一個隨機變量。我們將考慮以下參數(shù)：

我們將我們之前關(guān)于的假設(shè)編碼為一個分布，將模式設(shè)置為，例如同時仍然允許一些不確定性：

與和一起使用，其中為先驗強度。

鑒于我們知道，觀察到的失敗的數(shù)量遵循一個二項分布：

因為貝塔分布是二項分布的一個共軛先驗，的后驗也是：

使用的后驗值，有可能評估大于預(yù)期的概率：

其中在大多數(shù)統(tǒng)計庫中都是一個固定時間的標(biāo)準(zhǔn)函數(shù)，

這個故障率高于的概率，然后可以被監(jiān)測和閾值。在這項工作中，我們使用了的概率閾值和的先驗強度，但這些值可以進行微調(diào)，以選擇精度和召回率之間的權(quán)衡。

Ⅴ 實驗和結(jié)果

為了評估我們提出的方法，我們考慮了一個模擬的DJI Matrice 100四軸飛行器（圖5），一個常用的商業(yè)研究平臺。

圖5 模擬了DJI Matrice 100四軸飛行器。

A.運動規(guī)劃和控制

使用了與[3]中相同的DJI Matrice 100中相同的非線性模型。我們使用一個基于[24]中的工作的非線性MPC控制器，并使用ACADO [25]來生成一個有效的實現(xiàn)來求解(5)。使用ACADO（圖2），使用與非線性MPC控制器相同的目標(biāo)，總共生成了104個運動基元。使得運動基元具有初始狀態(tài)和最終狀態(tài)：

運行一組三聯(lián)基元執(zhí)行可能會導(dǎo)致一個三聯(lián)基元執(zhí)行干擾下一個執(zhí)行。為了避免瞬態(tài)噪聲在三聯(lián)體之間傳播，每個三聯(lián)基元規(guī)劃都在三聯(lián)基元之前和之后添加動作，這樣整個規(guī)劃總是從靜止?fàn)顟B(tài)開始。

B.學(xué)習(xí)

對于運動基元模型，采用具有平方指數(shù)協(xié)方差函數(shù)的高斯過程先驗，

其中為每個輸入維具有長度尺度的對角矩陣，為信號方差。這些，連同對角線噪聲協(xié)方差，是這個層次貝葉斯模型的超參數(shù)。

我們通過最大化邊際對數(shù)似然值（經(jīng)驗貝葉斯）來從數(shù)據(jù)中估計超參數(shù)，

其中，被定義為（9-10）中，是一個常數(shù)。

我們研究了學(xué)習(xí)到的運動基元執(zhí)行模型的預(yù)測均值與觀測軌跡的接近程度，并將其與運動基元參考狀態(tài)軌跡與觀測軌跡的接近程度進行了比較。在表I中，第一行顯示了觀察到的執(zhí)行和參考狀態(tài)軌跡或已執(zhí)行的運動基元之間的RMSE。

該表顯示了幾個均方根誤差（RMSE）。第1行：運動基元參考狀態(tài)軌跡與觀察到的同一運動基元執(zhí)行之間的誤差。第2行：運動基元執(zhí)行模型的平均預(yù)測與觀察到的同一運動基元執(zhí)行之間的誤差。第3行：原始參考軌跡與執(zhí)行該運動的模型的平均預(yù)測之間的誤差。

作為執(zhí)行軌跡的點預(yù)測，平均預(yù)測明顯比參考狀態(tài)軌跡更準(zhǔn)確，如下行所示。這樣做的原因是，與學(xué)習(xí)到的模型相比，單個基元的參考狀態(tài)軌跡對執(zhí)行軌跡（跨狀態(tài)，而不是時間）的平均值有更大的偏差。在圖4中可以看到一個示例。表一第三行比較了學(xué)習(xí)到的運動基元模型和基元的參考狀態(tài)軌跡的平均預(yù)測。表一第三行比較了學(xué)習(xí)到的運動基元模型和基元的參考狀態(tài)軌跡的平均預(yù)測。這提供了額外的證據(jù)，表明與運動原模型本身相比，學(xué)習(xí)運動原模型模型是一個系統(tǒng)地更好的執(zhí)行平均預(yù)測器。

C.碰撞檢查

文獻中的標(biāo)準(zhǔn)方法是使用一個球體，捕獲，,的聚合，單個半徑參數(shù)對時間不變。我們使用這個基線，并構(gòu)造了兩個更緊密的邊界，（每個基元不同）和（也隨著時間而變化）。為了與我們提出的變異性模型進行有意義的比較，我們通過假設(shè)以原始參考軌跡為中心的觀測值具有高斯似然性來概率地建立基線。對于、中的，

其中對于各自的基線是：

平均歸一化面積（平均，相當(dāng)于），相對于進行歸一化（對所有維度和所有運動基元使用單一的安全邊際半徑）。

將每個維度和IV-B中定義的分開。安全裕度，給定的概率為

在表Ⅱ中，將基線與學(xué)習(xí)到的運動基元模型進行了比較。是所有基元中最大的99%概率區(qū)域，每個維度，以參考軌跡為中心。是特定于單個基元的，這允許它更小。是時變的，允許在觀測結(jié)果允許的情況下進一步減小半徑。

圖6顯示了一個比較一個運動基元的，和學(xué)習(xí)模型的例子。圖7顯示了圖6在綠色垂直線上的解剖圖。為了仍然確保安全，例如，觀察到的執(zhí)行情況應(yīng)該仍然在以內(nèi)，區(qū)域必須更大，并有更大的偏差。

當(dāng)以平均值為中心時，對稱的安全裕度達到最小值。表Ⅱ顯示，與基線相比，使用學(xué)習(xí)到的變異性模型的面積減少較大。即使與時變半徑相比，當(dāng)使用學(xué)習(xí)模型時，面積也減少了3倍以上。

圖6 （淺灰色包絡(luò)）、（深灰色包絡(luò)）、（藍線和藍色包絡(luò)）和觀察到的單一運動原體i (c.f的執(zhí)行（紅色）的比較。圖4）。和與它們的平均值（參考狀態(tài)軌跡）具有相同的黑線。沒有顯示，以便使其他細節(jié)更精細的可見。

圖7 圖6在處的殘余圖（用垂直的綠線表示）。（黑點和深灰色包絡(luò)）和（藍點和藍色包絡(luò)）與觀察到的單一運動基元i的執(zhí)行（紅點）一起描述。和沒有顯示出來，以使其他元素的更精細的細節(jié)可見。

D.異常檢測

該實驗共使用了104個運動基元。除了圖2中的26個基元外，其他基元的初始速度和/或最終速度均為非零。對于每個基元，執(zhí)行20個隨機但不同的有效三聯(lián)基元組合并進行記錄。每個基元的前10個三聯(lián)基元組合用于學(xué)習(xí)每個基元的模型，即一個訓(xùn)練集。以下10個被用于檢測異常檢測，即測試集。

將異常行為定義為離開概率區(qū)域的樸素方法與所提出的使用后驗的方法進行了比較，使用。

對于方法，先驗參數(shù)被設(shè)置為和。后驗值的計算包括了最后一秒的觀測結(jié)果，這意味著我們設(shè)置了時間窗秒。對于每個時間點，我們計算故障率大于的概率。如果在任何時間點的概率大于的閾值，則整個執(zhí)行被歸類為異常，否則為正常。

兩種方法都使用從訓(xùn)練集學(xué)習(xí)到的運動基元模型給出的概率區(qū)域，然后在測試集上進行測試。圖8顯示了每種方法和數(shù)據(jù)集組合的混淆矩陣。方法的性能略優(yōu)于樸素方法，同時仍然保持著完美的精度。這表明，我們可以通過調(diào)整的閾值和時間窗的大小來提高召回率，而不會損失精度。

圖8 使用中心99.9%-probability體積的所有基元的異常檢測的混淆矩陣。要求所有的觀察結(jié)果都在這個體積內(nèi)，或者使用后驗，要求在1s窗口內(nèi)個體異常小于99.9%的比例可能高于0.01%。第一行：在模型訓(xùn)練集上的性能。第二行：對以前看不見的執(zhí)行的性能，來自相同的基元，但不同的三聯(lián)基元組合。

Ⅵ 結(jié)論和未來工作

在本文中，我們提出了一種用于自動駕駛的在線概率、多模態(tài)、多目標(biāo)跟蹤算法。我們的模型學(xué)習(xí)融合2D相機圖像和3D激光雷達點云特征。然后，這些融合的特征被用于學(xué)習(xí)有效的權(quán)重，以將深度特征距離與Mahalanobis距離相結(jié)合，從而獲得更好的數(shù)據(jù)關(guān)聯(lián)。我們的模型還學(xué)習(xí)以數(shù)據(jù)驅(qū)動的方式管理跟蹤循環(huán)周期。我們在NuScenes [9]和KITTI [10]數(shù)據(jù)集上驗證了我們提出的方法，我們的方法在定量和定性上都優(yōu)于使用相同目標(biāo)檢測器的最先進的基準(zhǔn)方法。

參考文獻

分享到：

微信“掃一掃”
分享到朋友圈

下一篇：扁線電機產(chǎn)品的技術(shù)現(xiàn)狀及未來發(fā)展趨勢
上一篇：自動駕駛車輛的系統(tǒng)架構(gòu)

點贊 0 反對 0 舉報 0 收藏 0 評論 0

汽車測試網(wǎng)V課堂
微信公眾號
汽車測試網(wǎng)手機站

相關(guān)閱讀

0 條相關(guān)評論

• 瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)及測試原理解析	• 為什么 HUD 合規(guī)真正“卡人”的不是參數(shù)，而是證據(jù)鏈
• 輔助駕駛撞扛樹枝老人、撞環(huán)衛(wèi)工人是預(yù)期功能安全應(yīng)該覆蓋	• 大推力直驅(qū)技術(shù)助力EPS安全測試，為你的安全出行 “保駕護
• 單機體積，雙倍效能！激光切割機玩轉(zhuǎn)“降本增效”	• 同步難？空間擠？這款雙出軸電機，是你雙十二的“必囤”硬
• 即刻探索8臺機器人如何解放數(shù)百名工人！	• 考慮驅(qū)動單元性能變化的分布式驅(qū)動智能車輛強化學(xué)習(xí)增強運
• eVTOL/飛行汽車→低噪聲氣動設(shè)計與主動降噪控制策略1/3	• 比亞迪車輛避撞專利公布

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

利用內(nèi)省學(xué)習(xí)和推理增強基于柵格的運動規(guī)劃

微信公眾號

參考文獻

編輯推薦

最新資訊

國內(nèi)首個“路空一體”國家質(zhì)檢中心落戶廣東

全國156個！IAE智行眾維入選！工信部2025年

瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)

是德科技推出適用于AI數(shù)據(jù)中心的Scale-Up驗

“汽車爬坡試驗方法”將有國家標(biāo)準(zhǔn)

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

利用內(nèi)省學(xué)習(xí)和推理增強基于柵格的運動規(guī)劃

微信公眾號

參考文獻

編輯推薦

最新資訊

國內(nèi)首個“路空一體”國家質(zhì)檢中心落戶廣東

全國156個！IAE智行眾維入選！工信部2025年

瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)

是德科技推出適用于AI數(shù)據(jù)中心的Scale-Up驗

“汽車爬坡試驗方法”將有國家標(biāo)準(zhǔn)

全國156個！IAE智行眾維入選！工信部2025年