一種規(guī)劃控制和仿真的交通預(yù)測實時聯(lián)合概率方法 PredictionNet

2022-01-15 08:46:47· 來源：計算機(jī)視覺深度學(xué)習(xí)和自動駕駛作者：黃浴

arXiv上2021年9月23日上傳的論文“PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation“，作者來自Nvidi

arXiv上2021年9月23日上傳的論文“PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation“，作者來自Nvidia美國總部。

預(yù)測交通智體的未來運動對于安全高效的自動駕駛至關(guān)重要。為此，這里提出PredictionNet，一種深度神經(jīng)網(wǎng)絡(luò) (DNN)，可預(yù)測所有周圍交通智體的運動以及自車的運動。所有預(yù)測都是概率性的，允許任意數(shù)量智體采用簡單的頂視光柵化圖像表示。以帶車道信息的多層（multi-layer）地圖為條件，該網(wǎng)絡(luò)一次傳播計算得到包括自車在內(nèi)的所有智體共同輸出的未來位置、速度和回溯向量（backtrace vector），然后在輸出結(jié)果中提取軌跡。

該網(wǎng)絡(luò)可用于模擬真實交通，在流行的基準(zhǔn)測試結(jié)果具有競爭力。更重要的是，將其與運動規(guī)劃/控制子系統(tǒng)相結(jié)合，已成功控制現(xiàn)實世界車輛駕駛數(shù)百公里。該網(wǎng)絡(luò)在嵌入式 GPU 的運行速度超過實時要求，由于選擇了輸入表征方法，系統(tǒng)顯示出良好的泛化性（跨感知模塊及位置）。此外，通過強(qiáng)化學(xué)習(xí) (RL) 擴(kuò)展 DNN，可以更好地處理罕見或不安全的事件，例如激進(jìn)機(jī)動和碰撞現(xiàn)象。

作者想尋求一種系統(tǒng)，可以聯(lián)合預(yù)測所有參與者的運動，不受參與者數(shù)量的限制，與輸入的感知模式無關(guān)，可以實時運行，并能夠處理罕見/不安全事件。

如圖是PredictionNet在自動駕駛應(yīng)用的一個簡化示意圖：

該交通預(yù)測方法依賴于單個深度神經(jīng)網(wǎng)絡(luò)，將當(dāng)前交通場景輸入轉(zhuǎn)換為包括自車的所有交通智體所預(yù)測的未來運動，以及后處理步驟支持提取軌跡，如圖所示：

頂視圖的光柵交通場景，由單獨的系統(tǒng)（攝像頭、雷達(dá)和/或 LiDAR）感知，得到包括自車和周圍所有交通智體的數(shù)據(jù)以及當(dāng)前地圖（例如車道分隔線）。這種方法使得網(wǎng)絡(luò)在沒有任何額外計算情況下，預(yù)測任意數(shù)量交通智體的運動。圖中速度和矢量使用標(biāo)準(zhǔn)光流彩色圖顯示，而占用情況和軌跡的可視化及時從洋紅色過渡到青色。最右側(cè)的黃色框顯示當(dāng)前車輛。

為了總結(jié)過去的觀察并通過單次前向傳播預(yù)測未來，采用一個簡單的 2D CNN 編碼器 - 解碼器，其帶有兩個 RNN，一個用于處理過去的輸入，另一個用于預(yù)測未來。

如圖是網(wǎng)絡(luò)架構(gòu)圖：

輸入表示為圖像，并用 CNN 編碼到潛空間中，該空間由兩個 RNN 序列模型共享。過去的 RNN（黃色）總結(jié)觀察到的速度、占用情況以及地圖。然后，一起推出潛狀態(tài)與未來RNN的當(dāng)前編碼輸入（綠色），估計未來的速度、占用情況以及回溯向量。未來幀的結(jié)果序列用于提取所有車輛的軌跡。以前解碼器（虛線）結(jié)果僅用于訓(xùn)練。

網(wǎng)絡(luò)訓(xùn)練采用端到端監(jiān)督學(xué)習(xí)，其中占用情況采用focal loss，預(yù)測的回溯向量和速度采用L2 loss：

通過輸出張量的后處理提取包括自車在內(nèi)的所有車輛軌跡。從感知系統(tǒng)給定的初始位置和速度開始預(yù)測每個軌跡，用預(yù)測占用情況的張量作為置信信號，并用回溯向量進(jìn)行漂移校正，通過對預(yù)測的速度張量進(jìn)行積分，推出后續(xù)位置和速度估計。

整個計算公式如下：

采用真實世界數(shù)據(jù)進(jìn)行訓(xùn)練后，PredictionNet 可以用作交通仿真模型。用真實數(shù)據(jù)初始化情節(jié)狀態(tài)，用網(wǎng)絡(luò)作為一個步進(jìn)函數(shù)推出一個閉環(huán)離線模擬交通。通過這種方式，網(wǎng)絡(luò)當(dāng)作一個學(xué)習(xí)的狀態(tài)轉(zhuǎn)換動態(tài)函數(shù)，可用于模擬測試規(guī)劃器，并通過強(qiáng)化學(xué)習(xí) (RL) 學(xué)習(xí)策略。

如圖是PredictionNet的RNN潛向量樣本，獲取過去智體交互和地圖集合信息：

PredictionNet加上后處理，即對解碼器輸出擬合一個獨輪車運動模型，然后閉合這個環(huán)。如圖是PredictionNet的交通仿真例子：

綠框表示自車，藍(lán)框是其他參與者，洋紅色線表示預(yù)測。PredictionNet 能夠在具有不同拓?fù)浣Y(jié)構(gòu)的不完整地圖生成真實的交通結(jié)果。

由于 PredictionNet 通過監(jiān)督學(xué)習(xí)進(jìn)行訓(xùn)練，可將其視為一種模仿學(xué)習(xí)。模仿學(xué)習(xí)的一個缺點是無法處理訓(xùn)練數(shù)據(jù)中沒有正確捕獲的罕見/不安全事件，例如可能導(dǎo)致碰撞的切入和猛烈剎車。為了解決這些問題，用基于模型的強(qiáng)化學(xué)習(xí)（RL ）框架，將駕駛問題表述為一個 MDP，以 PredictionNet 作為轉(zhuǎn)換模型。訓(xùn)練一個額外的策略頭來產(chǎn)生自行動，稱為擴(kuò)展版，即PredictionNet-RL。

網(wǎng)絡(luò)架構(gòu)細(xì)節(jié)如下表所示：

在開源數(shù)據(jù)INTERACTION的實驗結(jié)果如下：

這個結(jié)果來自內(nèi)部 LiDAR 感知數(shù)據(jù)生成的數(shù)據(jù)集。該數(shù)據(jù)集是高速公路和城市場景的混合，包含輕載和重載交通，包含 5000 多公里。測試方法優(yōu)于依賴車道跟隨和恒速假設(shè)的分析基準(zhǔn)。

如圖展示的是對上述內(nèi)部激光雷達(dá)數(shù)據(jù)的Final Displacement Error (FDE)性能：

再將 PredictionNet 系統(tǒng)集成到一個驅(qū)動車輛中。用 DNN 預(yù)測未來 3 秒，然后用分析預(yù)測器外推結(jié)果 3 到 5 秒。選擇這種組合是準(zhǔn)確性和性能之間的權(quán)衡：DNN 在 3 秒范圍內(nèi)對重要事件做出反應(yīng)，而分析外推減少了運行延遲。

為了量化性能，假設(shè)好的預(yù)測會導(dǎo)致更好的規(guī)劃避免急剎車或緊急脫離，從而提高駕駛舒適度。這里每條路線都被分成幾段，每段計算平均抖動（加速度的導(dǎo)數(shù)）。根據(jù)人類駕駛員試驗的閾值將每段分類為“舒適”或“不舒適”。最終得分是軌跡的“舒適”路段百分比。

該系統(tǒng)用于華盛頓州和加利福尼亞州一共約 530 公里路線的驅(qū)動。即使是用激光雷達(dá)相關(guān)數(shù)據(jù)進(jìn)行訓(xùn)練的，該網(wǎng)絡(luò)消費來自攝像頭和雷達(dá)的感知輸出。沒有遇到與網(wǎng)絡(luò)相關(guān)的安全脫離現(xiàn)象。

基于包含隨機(jī)地圖丟失的訓(xùn)練程序，DNN 能夠處理現(xiàn)實世界中的非地圖區(qū)域。與分析基準(zhǔn)相比，PredictionNet 將平均舒適度分提高了 15%，并將標(biāo)準(zhǔn)偏差降低了 18%。PredictionNet 的計算效率也非常高。在嵌入的NVIDIA Drive AGX 計算機(jī)上，DNN 推理時間約為 5 毫秒，預(yù)處理/后處理時間為 3 毫秒。如下表是仿真失敗率的比較結(jié)果：

而擴(kuò)展版PredictionNet-RL 使用 Soft Actor Critic (SAC) 算法訓(xùn)練策略和critic頭，同時保持 PredictionNet 主干權(quán)重保持不變。如下表是10個測試情節(jié)的失敗率在切入和緊急剎車的策略學(xué)習(xí)比較結(jié)果：

如圖是量化結(jié)果比較：ACC、PredictionNet-RL 和 PredictionNet。

如圖是學(xué)習(xí)的RL價值函數(shù)比較：四個可能的速度下。

一個基于機(jī)器訓(xùn)練的預(yù)測系統(tǒng)提供了一個有效的數(shù)據(jù)驅(qū)動的交通模擬器，其性能明顯優(yōu)于基于啟發(fā)式的基線。此外，基于 RL 的系統(tǒng)擴(kuò)展實驗表明，對于專家數(shù)據(jù)未捕獲的罕見事件，有顯著的改進(jìn)。

分享到：

微信“掃一掃”
分享到朋友圈

下一篇：你需知道的12點振動疲勞知識
上一篇：ChaoJi充電詳細(xì)解讀

點贊 0 反對 0 舉報 0 收藏 0 評論 0

汽車測試網(wǎng)V課堂
微信公眾號
汽車測試網(wǎng)手機(jī)站

相關(guān)閱讀

0 條相關(guān)評論

• 瓦力大作戰(zhàn)｜輕科普——誤碼儀（BERT）架構(gòu)及測試原理解析	• 為什么 HUD 合規(guī)真正“卡人”的不是參數(shù)，而是證據(jù)鏈
• 輔助駕駛撞扛樹枝老人、撞環(huán)衛(wèi)工人是預(yù)期功能安全應(yīng)該覆蓋	• 大推力直驅(qū)技術(shù)助力EPS安全測試，為你的安全出行 “保駕護(hù)
• 單機(jī)體積，雙倍效能！激光切割機(jī)玩轉(zhuǎn)“降本增效”	• 同步難？空間擠？這款雙出軸電機(jī)，是你雙十二的“必囤”硬
• 即刻探索8臺機(jī)器人如何解放數(shù)百名工人！	• 考慮驅(qū)動單元性能變化的分布式驅(qū)動智能車輛強(qiáng)化學(xué)習(xí)增強(qiáng)運
• eVTOL/飛行汽車→低噪聲氣動設(shè)計與主動降噪控制策略1/3	• 比亞迪車輛避撞專利公布

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

一種規(guī)劃控制和仿真的交通預(yù)測實時聯(lián)合概率方法 PredictionNet

微信公眾號

編輯推薦

最新資訊

聯(lián)合國法規(guī)R60對兩輪車操縱件與指示裝置的

標(biāo)準(zhǔn)立項|《汽車異種材料鉚接接頭拉伸性能

“汽車大角度座椅第1部分：通用要求”將有

“汽車大角度座椅第2部分：可靠性要求”將

電池耐久評價開始從“電池單體性能指標(biāo)”轉(zhuǎn)

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

一種規(guī)劃控制和仿真的交通預(yù)測實時聯(lián)合概率方法 PredictionNet

微信公眾號

編輯推薦

最新資訊

聯(lián)合國法規(guī)R60對兩輪車操縱件與指示裝置的

標(biāo)準(zhǔn)立項|《汽車異種材料鉚接接頭拉伸性能

“汽車大角度座椅 第1部分：通用要求”將有

“汽車大角度座椅 第2部分：可靠性要求”將

電池耐久評價開始從“電池單體性能指標(biāo)”轉(zhuǎn)

“汽車大角度座椅第1部分：通用要求”將有

“汽車大角度座椅第2部分：可靠性要求”將