日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機站
  • 小程序

    汽車測試網

  • 公眾號
    • 汽車測試網

    • 在線課堂

    • 電車測試

安徽大學王曉教授等|智繪軌跡,認知未來:一種考慮駕駛風險認知的軌跡規(guī)劃方法

2024-07-20 19:12:10·  來源:智車科技  
 


01 導讀


自動駕駛車輛在復雜高動態(tài)路口場景的軌跡規(guī)劃是一項充滿挑戰(zhàn)的任務,特別是在與人類駕駛車輛頻繁互動時,需要考慮周邊車輛不確定的駕駛行為所帶來的駕駛風險。為了應對這一挑戰(zhàn),安徽大學王曉教授及其團隊提出了一種社會適應性和安全敏感的軌跡規(guī)劃(S4TP)框架,該方法特別考慮了周圍人類駕駛車輛的駕駛意圖,通過建立一個以自動駕駛車輛為中心的駕駛風險場模型來表示車輛對周圍環(huán)境的主觀風險感知,進一步應對復雜交叉路口場景中其他車輛的不確定性社會互動行為,從而在保證車輛駕駛安全的前提下,實現更加高效的自動駕駛決策。該研究形成了名為“S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles”的論文成果,已被《IEEE Transactions on Intelligent Vehicles》期刊接受并發(fā)表在2024年第9卷第2期。


引用格式:

1. Wang et al. S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles [J]. IEEE Transactions on Intelligent Vehicles, 2024, 9(2):3220- 3231.

2. Wang, Xiao and Tang, Ke and Dai, Xingyuan and Xu, Jintao and Du, Quancheng and Ai, Rui and Wang, Yuxiao and Gu, Weihao. S4TP: Social-Suitable and Safety-Sensitive Trajectory Planning for Autonomous Vehicles [J]. IEEE Transactions on Intelligent Vehicles, 2024, 9(2): 3220- 3231.

全文鏈接:https://ieeexplore.ieee.org/abstract/document/10337798或arxiv版本鏈接:https://arxiv.org/abs/2404.11946。


02  論文介紹


1、研究背景


自動駕駛車輛(AVs)在公共道路上的行駛需要與人類駕駛車輛(HDVs)進行頻繁的社會互動。這些互動因為駕駛員之間不同的社會偏好而引入駕駛不確定性,導致自動駕駛車輛難以感知周圍的駕駛風險場狀況。在復雜的交通場景中,例如無保護左轉路口和超車等,AVs需要全面感知周圍環(huán)境風險方能做出安全有效的決策規(guī)劃。然而,已有工作中所涉及的駕駛風險評估方式存在不足,其忽略了HDV的駕駛意圖對SDV的影響,因而無法有效應對駕駛環(huán)境中的不確定性和多模態(tài)性,進而對自車周圍駕駛風險的評估缺少準確性。例如,傳統(tǒng)的基于軌跡預規(guī)劃的風險研判是一種較為粗粒度的方法,其將軌跡規(guī)劃分成了多模態(tài)軌跡生成與軌跡選擇兩個環(huán)節(jié),該類方法與人類實際駕駛過程存在顯著差異。此外,基于駕駛風險場的軌跡規(guī)劃方法側重于感知靜態(tài)風險,未能有效處理復雜高動態(tài)場景中的駕駛場景,因而導致自動駕駛車輛在軌跡規(guī)劃過程中變得異常困難,并且無法保證自動駕駛車輛在行駛過程中的安全性。


2、框架概覽


本研究提出了一種社會適應性和安全敏感的軌跡規(guī)劃(S4TP)框架,主要用于解決自動駕駛對周圍車輛駕駛風險感知不準確問題,其目標是為了實現自動駕駛車量安全高效的駕駛決策。該方法框架如圖1所示。具體來說,S4TP包括社會感知軌跡預測(SATP)和社會感知駕駛風險場(SADRF)模塊。其中,SATP利用Transformer有效編碼駕駛場景信息,并在預測解碼過程中結合AV的規(guī)劃軌跡。SADRF評估AV與具有不同社會交互特性的HDVs互動期間預期的周圍駕駛風險程度,并以AV為中心的二維熱力圖形式呈現。SADRF模擬周圍HDVs的駕駛意圖,并基于車輛互動的表示預測軌跡。S4TP使用預測的HDVs軌跡作為輸入,通過整合社交感知駕駛風險場,S4TP在低風險區(qū)域內執(zhí)行AV規(guī)劃軌跡的實時在線優(yōu)化,從而提高規(guī)劃軌跡的安全性和可解釋性。通過在SMARTS仿真器中進行的測試,S4TP在無保護左轉路口、并道、巡航和超車等復雜社會交互場景中展現了卓越的性能,實現了100%的通過率,超越了現有的最先進方法。


undefined

圖1S4TP模型架構


3、實驗設計及驗證


3.1 實驗設計


(1)場景編碼器:我們通過Transformer網絡對場景進行編碼處理。在路口場景下,對于自車周圍的所有智能體i,編碼器的輸入數據包括智能體的歷史狀態(tài)$n_{-T_h:0}^i$和本地地圖折線$\Gamma$。此外,我們明確考慮了自車與周圍車輛之間的交互關系,在輸入數據中加入AV的歷史狀態(tài)$n_{-T_h:0}^e$信息以構建完整的交互圖。為了保持張量的固定形狀,我們考慮將歷史軌跡中的缺失的時間步以及地圖折線中的缺失點填充為零。我們的模型在實驗中選用一定數量的靠近AV的智能體(實驗中設置為5個),并在數量不足時進行零填充。原始輸入的地圖折線通過多層感知機(MLP)進行編碼。對于自車周圍其他的智能體的歷史軌跡信息,我們采用基于Transformer的自注意層來進行編碼處理,用于提取歷史軌跡上的時間關系。正如圖中所示,我們使用分層的Transformer模塊對agent-agent以及agent-map的關系進行編碼。具體而言,我們通過將所有agent表示為所構建的交互圖中的節(jié)點形式,并使用自注意力Transformer模塊來處理圖中信息已捕獲圖中agent-agent之間的交互關系。然后結合交叉注意力Transformer層來獲取agent-map之間的關系。其中,query作為智能體的交互特征,key和value作為地圖折線的特征向量表示。最后,對于每個周圍的agent,其歷史特征、交互特征和地圖注意力特征被連接并通過軌跡預測解碼器傳遞,以生成預測的未來軌跡。


2)軌跡預測解碼器:相比其他循環(huán)神經網絡(如RNN或者LSTM),門控循環(huán)單元(GRU)具有更少的參數且不需要顯式的記憶單元,因此在處理長序列時具有更好的表現。我們在模型中使用GRU通過自回歸的方式解碼agent在未來一段時間內的狀態(tài)序列。為了明確建模AV對周圍agent未來動作的影響,我們將自車時刻t的運動狀態(tài)$m_t^e$輸入到GRU中來模擬AV對agent未來狀態(tài)的影響,并做出交互感知預測。具體來說,在將來的每一個時刻,GRU接受上一個時刻的隱藏狀態(tài)以和最后的預測狀態(tài),以及該時刻AV狀態(tài)的聯(lián)合輸入表示。通過對隱藏狀態(tài)進行更新來解碼agent狀態(tài)的變化(包括x坐標、y坐標以及偏航角$\theta$,并將該狀態(tài)信息與上一時刻得狀態(tài)相加,進而得到當前時刻的預測狀態(tài)。為了考慮AV對未處于沖突區(qū)agent的影響,我們通過引入交互門控網絡$\mathbb{G}$ 來建模路口場景下AV與目標agent之間的成對交互關系。


(3)社會感知駕駛風險場:本文構建一種考慮社會偏好的自適應駕駛安全風險場方法。該方法將基于記憶與注意力的全場景表征作為輸入,通過考慮基于社會交互的軌跡預測進一步生成適應于周圍車輛駕駛員社會偏好的風險場。具體來說,我們首先基于交互式預測模塊得到其他車輛多模態(tài)軌跡預測,然后結合自車采樣軌跡和其他車輛多模態(tài)預測軌跡,構建了自適應動態(tài)風險場模型。通過所構建的風險場作為自車規(guī)劃的約束條件。風險場公式如下:


圖片


其中,高斯分布的高度a和寬度σ是弧長s的函數;(x_c,y_c)為上一時刻車輛旋轉中心,R_car是根據車輛軸距L和轉向角δ計算出的軌跡預測半徑,c是風險場模型在自車當前位置的寬度。G(x,y)根據每個(x,y)處的坐標值,將概率分配給下一步中車輛的可能位置。


(4)基于SADRF的軌跡規(guī)劃:通過構建基于駕駛員風險場的軌跡規(guī)劃方法,我們可以將自車周圍的風險因素(如其他車輛、行人、障礙物等)映射到一個二維熱力圖表示的風險場中,并以未來一定時段內的總風險之和作為評價自車軌跡安全性的標準;然后在風險場中搜索最優(yōu)軌跡。相比于傳統(tǒng)的靜態(tài)風險場方法,我們更加細粒度地對自車軌跡規(guī)劃的風險進行建模,直觀地表示出環(huán)境中的風險分布,能夠實現更加安全、魯棒性更強的自車軌跡規(guī)劃效果。


3.2 實驗結果分析


(1)數據集與評價指標:我們在SMARTS模擬器中設計了無保護左轉自動駕駛場景,如圖2中所示的場景。在無信號無保護左轉路口場景中,自動駕駛汽車需要處理交通從不同,并與其他代理協(xié)調以安全高效地通過路口。此外,為了證明我們所提方法的優(yōu)越性,我們還測試了另外三個經典場景:(b)路口并道:自動駕駛車輛在兩條或以上道路交叉口處匯合的情況。(c)道路巡航:自動駕駛車輛沿著已知的道路線路行駛,同時遵守交通規(guī)則和安全法規(guī)。(d) 車道超車:自動駕駛車輛在行駛過程中從后方超過前方行駛的車輛。此外,我們還采用了成功率、時間、類人性作為評估指標來進行實驗結果評估。


圖片

圖2 SMART仿真器中涉及的4種駕駛場景


(2)性能分析


定量結果分析:由表1可知,在無保護左轉場景下,自動駕駛車輛(AV)需要與來自不同方向的人類駕駛車輛(HDV)進行協(xié)調,以安全通過路口。然而,靜態(tài)DRF方法僅基于歷史數據和地理信息進行場景編碼,無法考慮駕駛員的實時感知和特定社會偏好,導致不能動態(tài)的捕捉到真實駕駛環(huán)境中的各種復雜情況和變化,因此成功率較低。SMARTS和Discrete-SAC采用傳統(tǒng)強化學習方法,在一定程度上取得了效果,但由于強化學習方法本身的缺點,模型在復雜交互場景下的泛化能力較差。Safety-Balance方法考慮了周圍HDV的駕駛風格,并使用基于Transformer的編解碼網絡來建模車輛之間的交互。雖然該方法側重于交叉路口場景的交互,在無保護左轉場景下表現不錯,但對比其他三個場景的效果一般。Fanta方法采用監(jiān)督學習和強化學習相結合的方式進行訓練,并結合傳統(tǒng)基于規(guī)則的碰撞檢測模塊進行自車決策規(guī)劃,因此取得了較好的結果。相比之下,我們的方法在Predictive-Decision的基礎上進行改進,在自車的規(guī)劃階段引入了SADRF。這使得我們能夠動態(tài)自適應地對場景中的風險進行建模,并實現對自車周圍駕駛風險的準確評估。我們的方法具有更好的可解釋性和泛化性,因此在與其他方法的比較中實現了最佳結果。此外,對于其他路口場景,我們的方法在評估指標“time” 和“humanness” 上也分別取得了最優(yōu)的實驗結果,這也充分證明了S4TP能夠實現一個更加安全舒適的自動駕駛決策規(guī)劃。


表1多種場景下軌跡規(guī)劃方法實驗對比



定性結果分析:圖2展示了在特定的未保護左轉路口場景中,我們的SADRF方法與 Predictive-Decision和靜態(tài)DRF進行比較的可視化結果。為了更清晰地區(qū)分,軌跡規(guī)劃過程在第3、8、13和18幀進行展示。此外,任何碰撞實例都被強調并清晰標記。其中,Predictive-Decision操作時未添加SADRF,而靜態(tài)DRF則用靜態(tài)風險場替換SADRF。如圖2(a)所示,靜態(tài)DRF生成的策略過于保守,在通過路口時導致決策過程明顯減慢。此外,在重新啟動過程中遇到了重大困難,最終與對向的HDV發(fā)生碰撞。同時,圖2(b)展示了從第8到第18幀的結果,顯而易見的是,在完成軌跡規(guī)劃后,Predictive Decision在實時調整策略時遇到了困難,當面臨侵略性或先前未注意到的車輛(未觀察到或被遮擋的車輛)突然出現在駕駛場景中時,導致與人駕駛車輛發(fā)生碰撞。相比之下,如圖2 (c) 所示,S4TP在規(guī)劃之前為車輛分配了預設邊際,以預見未預料到的情況。與保守策略不同,S4TP動態(tài)地適應實時場景中其他HDV的運動。這可以確保在特定未來時刻避免危險情況,并生成更像人類的駕駛軌跡。值得注意的是,我們的方法結合了一個駕駛風險場模型,使其能夠根據實時的道路條件和車輛狀態(tài)動態(tài)調整駕駛風險場。這種自適應能力可以更好地預測和避免潛在的風險和危險,從而產生更具人類特征的指標。定量結果進一步證實了這一創(chuàng)新特性在真實道路場景中提高了我們方法的適應性,為自動駕駛提供了更高級別的安全保障。


undefined

圖2場景可視化結果分析


4、總結



本文中,我們提出了一種社交適用且安全敏感的軌跡規(guī)劃方法,命名為S4TP。該方法考慮了復雜混合交通環(huán)境中與社交互動相關的風險,確保了自動駕駛車輛(AVs)的軌跡規(guī)劃安全、高效且社交適用。所提出的方法采用基于Transformer的編碼和解碼模塊進行場景表示,并使用交互式建模預測周圍HDVs的未來軌跡?;谶@些預測的多步軌跡,構建了一個SADRF模型,以生成與人類駕駛行為一致的自動駕駛軌跡。我們的方法利用端到端框架中的多任務學習,促進了在模擬駕駛場景中的訓練和評估。結果表明,我們的方法優(yōu)于基準方法。通過SADRF模塊,我們實現了比傳統(tǒng)的靜態(tài)DRF模型或忽略社交互動的軌跡規(guī)劃方法更高的成功率。未來的研究將專注于將風險場模塊納入模型,建立行人-車輛交互關系,準確識別行人位置和運動狀態(tài),并實現安全舒適的軌跡規(guī)劃。

分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25