日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

一種規(guī)劃控制和仿真的交通預(yù)測實時聯(lián)合概率方法 PredictionNet

2022-01-15 08:46:47·  來源:計算機(jī)視覺深度學(xué)習(xí)和自動駕駛  作者:黃浴  
 
arXiv上2021年9月23日上傳的論文“PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation“,作者來自Nvidi
arXiv上2021年9月23日上傳的論文“PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation“,作者來自Nvidia美國總部。
預(yù)測交通智體的未來運動對于安全高效的自動駕駛至關(guān)重要。為此,這里提出PredictionNet,一種深度神經(jīng)網(wǎng)絡(luò) (DNN),可預(yù)測所有周圍交通智體的運動以及自車的運動。所有預(yù)測都是概率性的,允許任意數(shù)量智體采用簡單的頂視光柵化圖像表示。以帶車道信息的多層(multi-layer)地圖為條件,該網(wǎng)絡(luò)一次傳播計算得到包括自車在內(nèi)的所有智體共同輸出的未來位置、速度和回溯向量(backtrace vector),然后在輸出結(jié)果中提取軌跡。
該網(wǎng)絡(luò)可用于模擬真實交通,在流行的基準(zhǔn)測試結(jié)果具有競爭力。更重要的是,將其與運動規(guī)劃/控制子系統(tǒng)相結(jié)合,已成功控制現(xiàn)實世界車輛駕駛數(shù)百公里。該網(wǎng)絡(luò)在嵌入式 GPU 的運行速度超過實時要求,由于選擇了輸入表征方法,系統(tǒng)顯示出良好的泛化性(跨感知模塊及位置)。此外,通過強(qiáng)化學(xué)習(xí) (RL) 擴(kuò)展 DNN,可以更好地處理罕見或不安全的事件,例如激進(jìn)機(jī)動和碰撞現(xiàn)象。
作者想尋求一種系統(tǒng),可以聯(lián)合預(yù)測所有參與者的運動,不受參與者數(shù)量的限制,與輸入的感知模式無關(guān),可以實時運行,并能夠處理罕見/不安全事件。
如圖是PredictionNet在自動駕駛應(yīng)用的一個簡化示意圖:

該交通預(yù)測方法依賴于單個深度神經(jīng)網(wǎng)絡(luò),將當(dāng)前交通場景輸入轉(zhuǎn)換為包括自車的所有交通智體所預(yù)測的未來運動,以及后處理步驟支持提取軌跡,如圖所示:

頂視圖的光柵交通場景,由單獨的系統(tǒng)(攝像頭、雷達(dá)和/或 LiDAR)感知,得到包括自車和周圍所有交通智體的數(shù)據(jù)以及當(dāng)前地圖(例如車道分隔線)。這種方法使得網(wǎng)絡(luò)在沒有任何額外計算情況下,預(yù)測任意數(shù)量交通智體的運動。圖中速度和矢量使用標(biāo)準(zhǔn)光流彩色圖顯示,而占用情況和軌跡的可視化及時從洋紅色過渡到青色。最右側(cè)的黃色框顯示當(dāng)前車輛。
為了總結(jié)過去的觀察并通過單次前向傳播預(yù)測未來,采用一個簡單的 2D CNN 編碼器 - 解碼器,其帶有兩個 RNN,一個用于處理過去的輸入,另一個用于預(yù)測未來。
如圖是網(wǎng)絡(luò)架構(gòu)圖:
輸入表示為圖像,并用 CNN 編碼到潛空間中,該空間由兩個 RNN 序列模型共享。過去的 RNN(黃色)總結(jié)觀察到的速度、占用情況以及地圖。然后,一起推出潛狀態(tài)與未來RNN的當(dāng)前編碼輸入(綠色),估計未來的速度、占用情況以及回溯向量。未來幀的結(jié)果序列用于提取所有車輛的軌跡。以前解碼器(虛線)結(jié)果僅用于訓(xùn)練。
網(wǎng)絡(luò)訓(xùn)練采用端到端監(jiān)督學(xué)習(xí),其中占用情況采用focal loss,預(yù)測的回溯向量和速度采用L2 loss:

通過輸出張量的后處理提取包括自車在內(nèi)的所有車輛軌跡。從感知系統(tǒng)給定的初始位置和速度開始預(yù)測每個軌跡,用預(yù)測占用情況的張量作為置信信號,并用回溯向量進(jìn)行漂移校正,通過對預(yù)測的速度張量進(jìn)行積分,推出后續(xù)位置和速度估計。
整個計算公式如下:

采用真實世界數(shù)據(jù)進(jìn)行訓(xùn)練后,PredictionNet 可以用作交通仿真模型。用真實數(shù)據(jù)初始化情節(jié)狀態(tài),用網(wǎng)絡(luò)作為一個步進(jìn)函數(shù)推出一個閉環(huán)離線模擬交通。通過這種方式,網(wǎng)絡(luò)當(dāng)作一個學(xué)習(xí)的狀態(tài)轉(zhuǎn)換動態(tài)函數(shù),可用于模擬測試規(guī)劃器,并通過強(qiáng)化學(xué)習(xí) (RL) 學(xué)習(xí)策略。
如圖是PredictionNet的RNN潛向量樣本,獲取過去智體交互和地圖集合信息:

PredictionNet加上后處理,即對解碼器輸出擬合一個獨輪車運動模型,然后閉合這個環(huán)。如圖是PredictionNet的交通仿真例子:

綠框表示自車,藍(lán)框是其他參與者,洋紅色線表示預(yù)測。PredictionNet 能夠在具有不同拓?fù)浣Y(jié)構(gòu)的不完整地圖生成真實的交通結(jié)果。
由于 PredictionNet 通過監(jiān)督學(xué)習(xí)進(jìn)行訓(xùn)練,可將其視為一種模仿學(xué)習(xí)。模仿學(xué)習(xí)的一個缺點是無法處理訓(xùn)練數(shù)據(jù)中沒有正確捕獲的罕見/不安全事件,例如可能導(dǎo)致碰撞的切入和猛烈剎車。為了解決這些問題,用基于模型的 強(qiáng)化學(xué)習(xí)(RL )框架,將駕駛問題表述為一個 MDP,以 PredictionNet 作為轉(zhuǎn)換模型。訓(xùn)練一個額外的策略頭來產(chǎn)生自行動,稱為擴(kuò)展版,即PredictionNet-RL。
網(wǎng)絡(luò)架構(gòu)細(xì)節(jié)如下表所示:

在開源數(shù)據(jù)INTERACTION的實驗結(jié)果如下:

這個結(jié)果來自內(nèi)部 LiDAR 感知數(shù)據(jù)生成的數(shù)據(jù)集。該數(shù)據(jù)集是高速公路和城市場景的混合,包含輕載和重載交通,包含 5000 多公里。測試方法優(yōu)于依賴車道跟隨和恒速假設(shè)的分析基準(zhǔn)。

如圖展示的是對上述內(nèi)部激光雷達(dá)數(shù)據(jù)的Final Displacement Error (FDE)性能:

再將 PredictionNet 系統(tǒng)集成到一個驅(qū)動車輛中。用 DNN 預(yù)測未來 3 秒,然后用分析預(yù)測器外推結(jié)果 3 到 5 秒。選擇這種組合是準(zhǔn)確性和性能之間的權(quán)衡:DNN 在 3 秒范圍內(nèi)對重要事件做出反應(yīng),而分析外推減少了運行延遲。
為了量化性能,假設(shè)好的預(yù)測會導(dǎo)致更好的規(guī)劃避免急剎車或緊急脫離,從而提高駕駛舒適度。這里每條路線都被分成幾段,每段計算平均抖動(加速度的導(dǎo)數(shù))。根據(jù)人類駕駛員試驗的閾值將每段分類為“舒適”或“不舒適”。最終得分是軌跡的“舒適”路段百分比。
該系統(tǒng)用于華盛頓州和加利福尼亞州一共約 530 公里路線的驅(qū)動。即使是用激光雷達(dá)相關(guān)數(shù)據(jù)進(jìn)行訓(xùn)練的,該網(wǎng)絡(luò)消費來自攝像頭和雷達(dá)的感知輸出。沒有遇到與網(wǎng)絡(luò)相關(guān)的安全脫離現(xiàn)象。
基于包含隨機(jī)地圖丟失的訓(xùn)練程序,DNN 能夠處理現(xiàn)實世界中的非地圖區(qū)域。與分析基準(zhǔn)相比,PredictionNet 將平均舒適度分提高了 15%,并將標(biāo)準(zhǔn)偏差降低了 18%。PredictionNet 的計算效率也非常高。在嵌入的NVIDIA Drive AGX 計算機(jī)上,DNN 推理時間約為 5 毫秒,預(yù)處理/后處理時間為 3 毫秒。如下表是仿真失敗率的比較結(jié)果:

而擴(kuò)展版PredictionNet-RL 使用 Soft Actor Critic (SAC) 算法訓(xùn)練策略和critic頭,同時保持 PredictionNet 主干權(quán)重保持不變。如下表是10個測試情節(jié)的失敗率在切入和緊急剎車的策略學(xué)習(xí)比較結(jié)果:

如圖是量化結(jié)果比較:ACC、PredictionNet-RL 和 PredictionNet。

如圖是學(xué)習(xí)的RL價值函數(shù)比較:四個可能的速度下。

一個基于機(jī)器訓(xùn)練的預(yù)測系統(tǒng)提供了一個有效的數(shù)據(jù)驅(qū)動的交通模擬器,其性能明顯優(yōu)于基于啟發(fā)式的基線。此外,基于 RL 的系統(tǒng)擴(kuò)展實驗表明,對于專家數(shù)據(jù)未捕獲的罕見事件,有顯著的改進(jìn)。
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25