日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車測(cè)試網(wǎng)

    • 在線課堂

    • 電車測(cè)試

一種針對(duì)不確定多模態(tài)障礙物的魯棒場(chǎng)景MPC方法

2020-10-09 14:13:27·  來(lái)源:同濟(jì)智能汽車研究所  
 
編者按:自動(dòng)駕駛車輛的運(yùn)行與控制架構(gòu)中,決策規(guī)劃層與運(yùn)動(dòng)控制層的聯(lián)系十分緊密:規(guī)劃層根據(jù)來(lái)自于傳感器或網(wǎng)聯(lián)通訊的車輛與道路信息,結(jié)合車輛自身的運(yùn)動(dòng)狀態(tài)
編者按:自動(dòng)駕駛車輛的運(yùn)行與控制架構(gòu)中,決策規(guī)劃層與運(yùn)動(dòng)控制層的聯(lián)系十分緊密:規(guī)劃層根據(jù)來(lái)自于傳感器或網(wǎng)聯(lián)通訊的車輛與道路信息,結(jié)合車輛自身的運(yùn)動(dòng)狀態(tài)與行駛目標(biāo),得到若干條參考行駛軌跡;而控制層的任務(wù)是根據(jù)規(guī)劃層輸出的參考軌跡,結(jié)合車輛自身狀態(tài),通過(guò)控制車輛的縱向速度、車輪轉(zhuǎn)角等參數(shù),實(shí)現(xiàn)對(duì)于目標(biāo)軌跡的實(shí)時(shí)、準(zhǔn)確跟蹤。車輛的縱向控制主要實(shí)現(xiàn)速度的跟蹤,側(cè)向控制則實(shí)現(xiàn)路徑的跟蹤。近年來(lái),模型預(yù)測(cè)控制MPC廣泛應(yīng)用于自動(dòng)駕駛車輛的運(yùn)動(dòng)控制方面,MPC能夠?qū)斎肱c輸出的約束條件進(jìn)行系統(tǒng)性處理,非常適用處理多輸入多輸出控制系統(tǒng)。隨著車載傳感器技術(shù)與車聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,車輛行駛過(guò)程中所產(chǎn)生與接受的數(shù)據(jù)在種類與規(guī)模上都得到了拓展。如何充分而合理的利用這些車輛與交通數(shù)據(jù),將是下一階段智能車輛規(guī)劃與控制的研究重點(diǎn)。
 
本文譯自:
A Robust Scenario MPC Approach for Uncertain Multi-Modal Obstacles
 
文章來(lái)源:
IEEE Control Systems Letters, Vol.5, No.3, pp.947-952
 
作者:
Batkovic Ivo, Rosolia Ugo, Zanon Mario, Falcone Paolo
原文鏈接:
https://ieeexplore.ieee.org/document/9133136
 
摘要:相較于普通車輛,自動(dòng)駕駛車輛對(duì)運(yùn)動(dòng)規(guī)劃與控制算法的安全性提出了更高的要求。通過(guò)考慮其他車輛、行人等交通參與者的未來(lái)運(yùn)動(dòng)情況,可以得到目標(biāo)車輛無(wú)碰撞行駛軌跡的規(guī)劃結(jié)果。本文提出了一種基于包含魯棒約束的模型預(yù)測(cè)控制方法,其中源自于道路交通參與者的約束不確定性是多模態(tài)的。該方法將管模型預(yù)測(cè)控制(tube-based MPC)與場(chǎng)景模型預(yù)測(cè)控制(scenario-based MPC)相結(jié)合,對(duì)期望代價(jià)函數(shù)值進(jìn)行近似,并保證滿足輸入約束與魯棒性。特別的,本文設(shè)計(jì)了一個(gè)基于擾動(dòng)模式函數(shù)的反饋機(jī)制,從而允許控制器采取低保守性的操作。數(shù)值仿真的結(jié)果表明,本文所提出的方法相較于標(biāo)準(zhǔn)魯棒MPC具有更好的性能。
 
關(guān)鍵詞:自動(dòng)駕駛汽車,不確定性系統(tǒng),非線性系統(tǒng)預(yù)測(cè)控制
 
1 前言
自動(dòng)駕駛技術(shù)在提高車輛駕駛的安全性方面展現(xiàn)出了巨大的潛力[1]。盡管自動(dòng)駕駛技術(shù)已逐步在高速公路行駛、低速泊車等場(chǎng)景下得到了應(yīng)用[2],但由于行人、非機(jī)動(dòng)車以及其他機(jī)動(dòng)車的存在,自動(dòng)駕駛技術(shù)在城市道路場(chǎng)景下的實(shí)現(xiàn)仍面臨著巨大的挑戰(zhàn)。應(yīng)對(duì)這些挑戰(zhàn)的關(guān)鍵在于建立人類交通參與者的隨即行為預(yù)測(cè)模型,并設(shè)計(jì)確保無(wú)碰撞安全性的行駛軌跡控制算法。
 
為此我們可以看到,理解并預(yù)測(cè)其他交通參與者的行為是十分重要的。目前已有研究提出了若干方法來(lái)對(duì)上述隨機(jī)行為進(jìn)行建模與預(yù)測(cè),例如有研究利用高斯過(guò)程動(dòng)力學(xué)模型與軌跡匹配方法,實(shí)現(xiàn)了對(duì)行人軌跡的預(yù)測(cè)[3]。也有研究考慮通過(guò)切換動(dòng)態(tài)模型的方式來(lái)進(jìn)行軌跡的短期預(yù)測(cè)[4],或利用混合模型來(lái)描述人類的不同步態(tài)[5]。近來(lái),以馬爾可夫過(guò)程模型[6]為代表的數(shù)據(jù)驅(qū)動(dòng)方法相繼被提出,而環(huán)境信息也以語(yǔ)義地圖的形式被引入到預(yù)測(cè)模型之中[7]。有研究利用反饋控制器,將基于圖的地圖用于軌跡預(yù)測(cè)[8]。也有研究將道路的拓?fù)浣Y(jié)構(gòu)與基于集合的可達(dá)性分析相結(jié)合,實(shí)現(xiàn)軌跡預(yù)測(cè)[9]。為了充分利用周圍個(gè)體與環(huán)境的預(yù)測(cè)結(jié)果,規(guī)劃與控制算法需要在安全性方面具有足夠的魯棒性。有研究在車-車通信的假設(shè)下,通過(guò)基于優(yōu)化的規(guī)劃控制算法,實(shí)現(xiàn)了保證安全性前提下的避障控制[10]。也有研究設(shè)計(jì)了部分可觀測(cè)馬爾可夫決策過(guò)程,用于為其他交通參與者的行為進(jìn)行預(yù)測(cè),并將其用于控制器約束值的確定[11]。有研究基于間隙接受理論解決了行人之間的交互關(guān)系處理問(wèn)題[12],也有研究明確的將行人軌跡預(yù)測(cè)結(jié)果作為動(dòng)態(tài)障礙物信息引入規(guī)劃與控制框架[13],具有一定的前瞻性。安全性始終是自動(dòng)駕駛技術(shù)的首要目標(biāo),因此需要滿足包括道路邊界約束、執(zhí)行器約束、未來(lái)避障約束等約束條件。
 
在本文中,我們?cè)O(shè)計(jì)了一個(gè)反饋機(jī)制,該機(jī)制適用于在約束條件受多模態(tài)不確定性影響時(shí),能夠在有約束的條件下執(zhí)行低保守性的操作。這種多模態(tài)不確定性影響下的場(chǎng)景廣泛存在于如圖1所示的交通場(chǎng)景內(nèi),圖中的行人可能穿過(guò)馬路,也可能繼續(xù)沿道路行走。特別的,我們基于擾動(dòng)模式設(shè)計(jì)了有關(guān)函數(shù),并據(jù)此提出了一個(gè)因果反饋策略,并通過(guò)結(jié)合管模型預(yù)測(cè)控制與場(chǎng)景模型預(yù)測(cè)控制的思想,證明了系統(tǒng)滿足魯棒約束。此外,我們進(jìn)行相應(yīng)的數(shù)值仿真,結(jié)果表明相較于標(biāo)準(zhǔn)管模型預(yù)測(cè)控制,我們所提出控制策略具有更好的性能。 
 
圖1 外部障礙物的兩種運(yùn)動(dòng)預(yù)測(cè)模型
在第二節(jié)定義了本文的最優(yōu)控制問(wèn)題,在第三節(jié)描述了障礙物預(yù)測(cè)模型。在第四節(jié)提出了一種安全而非保守的控制策略,在第五節(jié)展示了兩個(gè)數(shù)值仿真的結(jié)果與分析,并在第六節(jié)給出了本文的結(jié)論。
 
2 問(wèn)題定義
我們考慮如下的離散時(shí)間系統(tǒng):
其中,xk、uk依次為k時(shí)刻的狀態(tài)量與控制量。我們的目標(biāo)是設(shè)計(jì)一個(gè)控制器,在給定初始狀態(tài)時(shí),使得車輛位置偏離參考狀態(tài)軌跡的距離最小,同時(shí)避免與外部障礙物發(fā)生碰撞。理想條件下,我們希望通過(guò)設(shè)計(jì)一個(gè)控制器,來(lái)解決無(wú)限時(shí)域最優(yōu)控制問(wèn)題(OCP),其中障礙物的未來(lái)位置假定先驗(yàn)已知,即:
 
其中約束(2b)(2c)表示初始狀態(tài)與系統(tǒng)動(dòng)力學(xué),而約束(2d)包括狀態(tài)量與控制量的限制等。約束(2e)表示車輛在未來(lái)所有位置與k≥0的時(shí)間內(nèi)均能保證與障礙物ok不發(fā)生碰撞。我們假定階段代價(jià)l(.,.)是連續(xù)正定的,且l(0,0)=0。
 
我們的目標(biāo)則是,在初始集合S中,對(duì)所有的xS保證控制器的安全。正式定義如下:
定義1:如果一個(gè)控制器的控制量U={u0,…u∞}、狀態(tài)量X={x0,x1,…x∞},在初始狀態(tài)屬于集合S、障礙物位置屬于集合O時(shí),滿足約束(2d)(2e),則稱控制器在集合S內(nèi)是安全的。
 
事實(shí)上,在求解式(2)時(shí)具有相當(dāng)?shù)奶魬?zhàn)性:?jiǎn)栴}一是未來(lái)狀態(tài)的確切先驗(yàn)值是無(wú)法得到的;問(wèn)題二是,從數(shù)值求解角度考慮,無(wú)限時(shí)域最優(yōu)控制問(wèn)題的求解具有挑戰(zhàn)性,但對(duì)于線性系統(tǒng)、凸成本與約束等特殊情況,能夠得到方程的準(zhǔn)確解[18];問(wèn)題三則是,我們需要優(yōu)化的反饋策略依賴于障礙物狀態(tài)ok與系統(tǒng)狀態(tài)量xk。
 
我們首先通過(guò)定義時(shí)刻k的預(yù)測(cè)模型來(lái)解決第一個(gè)問(wèn)題;接著對(duì)于問(wèn)題二,通過(guò)設(shè)計(jì)一個(gè)模型預(yù)測(cè)控制策略來(lái)對(duì)無(wú)限時(shí)域最優(yōu)控制問(wèn)題進(jìn)行近似;最后,為了解決問(wèn)題三,我們通過(guò)只求解反饋策略的一個(gè)子集來(lái)對(duì)反饋策略的結(jié)構(gòu)進(jìn)行修改。
 
3 環(huán)境預(yù)測(cè)模型
由于障礙物未來(lái)狀態(tài)量ok的全部先驗(yàn)信息未知,我們使用符號(hào)on|k來(lái)表示已知k時(shí)刻狀態(tài)時(shí)的n時(shí)刻狀態(tài)預(yù)測(cè)值。假定我們得到了障礙物的多模態(tài)預(yù)測(cè)模型,則在k時(shí)刻,第i個(gè)模態(tài)的障礙物狀態(tài)量為:
其中,win|k表示狀態(tài)量的不確定性。我們記βi為第i個(gè)模態(tài)的關(guān)聯(lián)概率,此處的模態(tài)用來(lái)描述障礙物的不同運(yùn)動(dòng)意圖,例如圖1中的橫穿馬路與繼續(xù)直走。
 
為了引入安全約束條件,我們需要預(yù)測(cè)on|k可以取得的可能值。做如下假設(shè):
假設(shè)1:不確定性集合Oin|k是式(3)所給出的魯棒可達(dá)集的外部逼近,即:
 
需要注意的是,對(duì)于每個(gè)模態(tài)i,集合Oin|k能夠?qū)⑾嗤B(tài)的不同實(shí)現(xiàn)進(jìn)行分組,以行人橫穿馬路為例,行人可能以快速、一側(cè)稍慢等多種方式完成橫穿馬路的行為模態(tài)。同時(shí),當(dāng)兩個(gè)模態(tài)的集合不相交時(shí),我們能夠推斷出何種模態(tài)無(wú)法實(shí)現(xiàn),從而允許我們?cè)诘谒墓?jié)中定義因果反饋策略。我們給出命題1如下:
命題1:給定一個(gè)障礙物狀態(tài)序列[opk|k,…, opn|k],總能在n滿足式(4)時(shí),推斷出p=i或是p=j。
 
4 控制器設(shè)計(jì)
在本節(jié)中,我們首先說(shuō)明了管模型預(yù)測(cè)控制是一種求解式(2)的可行策略。然而,當(dāng)預(yù)測(cè)狀態(tài)量on|k存在多模態(tài)時(shí),魯棒管式策略存在過(guò)于保守的問(wèn)題。因此,在本節(jié)的第二部分,我們利用命題1提出了一個(gè)因果反饋策略,該策略將不同場(chǎng)景視為預(yù)測(cè)模型模態(tài)的函數(shù)。如第五節(jié)中所示,相較于標(biāo)準(zhǔn)的管模型預(yù)測(cè)控制策略,我們所提出的策略在同等的計(jì)算成本下,具有更好的平均性能。
 
4.1 管模型預(yù)測(cè)控制近似
首先,求解式(2)的一種直接但保守的方法是使用標(biāo)準(zhǔn)管模型預(yù)測(cè)控制方程對(duì)式(2)進(jìn)行近似,即進(jìn)行控制序列優(yōu)化,而非進(jìn)行策略優(yōu)化。
其中N為預(yù)測(cè)時(shí)域,q、p分別為階段代價(jià)與終端代價(jià),約束(5f)為終端集。我們可以將式(5)寫為k時(shí)刻的集合U*k={u*k|k,…, u*k+N-1|k },其中:
 
 
因此,式(5)在k+1時(shí)刻的狀態(tài)可表示為:使得問(wèn)題退化為滾動(dòng)時(shí)域策略。式(5)是為了滿足魯棒約束的寫出的,但對(duì)于存在多模態(tài)的障礙物狀態(tài)量,這種策略是過(guò)于保守的。因此,為了降低優(yōu)化策略的保守性,我們將在下一部分介紹我們所提出的控制策略。
 
4.2 場(chǎng)景預(yù)測(cè)策略
 
如前所述式(5)的求解方案對(duì)于障礙物未知的所有可能實(shí)現(xiàn)而言都是魯棒的,我們采用命題1的結(jié)果來(lái)設(shè)計(jì)因果時(shí)變反饋策略,它是障礙物行為模態(tài)類型i的函數(shù),設(shè)計(jì)反饋策略時(shí)遵循類似[17]中的原則。此外,該策略允許我們對(duì)預(yù)期代價(jià)進(jìn)行近似,其中預(yù)期代價(jià)取決于障礙物的隨機(jī)位置,從而考慮到閉環(huán)性能的改善。
 
在預(yù)測(cè)時(shí)刻n,如果可以根據(jù)障礙物所處的位置判斷出障礙物的運(yùn)動(dòng)模態(tài)類型,則我們就能允許控制器選擇不同的控制動(dòng)作。我們用uin|k表示已知k時(shí)刻狀態(tài)量的n時(shí)刻狀態(tài)量時(shí),模態(tài)i對(duì)應(yīng)的控制量,當(dāng)不能根據(jù)障礙物歷史位置判斷模態(tài)類型時(shí),我們將不同模態(tài)的預(yù)測(cè)輸入限制為同一值。由此得到的有限時(shí)域最優(yōu)控制問(wèn)題可表示為:
 
我們可以將式(7)的最優(yōu)解寫為U*k={ul*k|k,…, ul*k+N|k },并定義反饋策略為:
在k+1時(shí)刻,我們?cè)跐L動(dòng)時(shí)域求解初始狀態(tài)為,需要注意的是,上述公式并未對(duì)L種場(chǎng)景下的L個(gè)單獨(dú)軌跡進(jìn)行分別優(yōu)化,而是將這L種場(chǎng)景在一個(gè)問(wèn)題中組合起來(lái),控制輸入則通過(guò)約束(7f)將場(chǎng)景與軌跡聯(lián)系在一起。由前可知,βi表示模態(tài)i的關(guān)聯(lián)概率,各模態(tài)關(guān)聯(lián)概率的和為1,因此式(7a)變?yōu)槠谕鷥r(jià)的近似問(wèn)題。因此,式(7)使得期望代價(jià)最小化,并且平均性能優(yōu)于式(5)。對(duì)于每種可能的運(yùn)動(dòng)模態(tài)而言,其代表了該種降低代價(jià)的做法仍能夠保證安全,例如當(dāng)一個(gè)行人很有可能橫穿馬路時(shí),車輛需要確保在非必要的時(shí)候總是能不經(jīng)歷減速而停止。根據(jù)命題1可知,只有當(dāng)障礙物不再處于某個(gè)模態(tài)時(shí),與該模態(tài)關(guān)聯(lián)的避障約束才能從問(wèn)題中去除,也就是說(shuō),一旦行人開始橫穿馬路,他將不能繼續(xù)在原有路線上繼續(xù)直行。
 
 
 
此外,式(7)形式的問(wèn)題無(wú)法簡(jiǎn)便求解,而是通過(guò)收緊約束來(lái)重新表述為一個(gè)魯棒模型預(yù)測(cè)控制問(wèn)題[16]。而這本質(zhì)上需要關(guān)于g在全局最大化的知識(shí),事實(shí)上在一般情況下很難計(jì)算。但在某些情況下,這種計(jì)算可以變得非常高效。在一些研究中提出了精確的行人模型[8][13]。
 
式(7)建立了通向預(yù)期結(jié)果的第一步,即提出了策略(8)這樣的式(2)的優(yōu)化策略近似結(jié)果,并且在平均結(jié)果上具有更低的保守性。然而根據(jù)定義來(lái)看,式(2)始終滿足安全要求,因此我們使用MPC中的標(biāo)準(zhǔn)方法[18][26][27],即假設(shè)存在一個(gè)魯棒不變集。因此,利用以下假設(shè)可證明式(8)滿足安全性要求。
 
假設(shè)2:對(duì)于任意模態(tài)i,總存在模態(tài)j,使得Oin|k⊆Oin|k-1對(duì)任意的n≥k均成立。
假設(shè)3:存在魯棒不變集合Xsafe,使得存在u,滿足:.
 
上述假設(shè)隱含于:
事實(shí)上,我們可以通過(guò)建立預(yù)測(cè)模型來(lái)避免導(dǎo)致控制器不可執(zhí)行的不現(xiàn)實(shí)運(yùn)動(dòng)行為,例如一輛停止的車輛被認(rèn)為是安全的,它不是發(fā)生碰撞的原因。類似的例子有在人-機(jī)環(huán)境中運(yùn)動(dòng)的靜止機(jī)器人關(guān)節(jié)是安全的、被切斷的電路是安全的。給出如下命題:
 
命題2:假設(shè)上述的假設(shè)2與假設(shè)3成立,則對(duì)于式(7),當(dāng)有初始狀態(tài)x0是可行的,則將式(7)的解在滾動(dòng)時(shí)域內(nèi)應(yīng)用于閉環(huán)系統(tǒng)(1)是遞歸可行的。
 
可以證明,當(dāng)假設(shè)式(7)在k=0時(shí)可行時(shí),歸納得出k≥0時(shí)同樣可行。
 
雖然我們只關(guān)注系統(tǒng)的安全性,即式(7)的遞歸可行性,但也可說(shuō)明某種形式的穩(wěn)定性[28]。接下來(lái)我們將通過(guò)數(shù)值仿真結(jié)果來(lái)說(shuō)明我們所提出的策略在平均性能上由于標(biāo)準(zhǔn)魯棒MPC。
5 仿真與結(jié)果分析
在本節(jié)中,我們將通過(guò)兩個(gè)數(shù)值仿真例子來(lái)展示我們所提出策略的性能。我們定義系統(tǒng)的狀態(tài)量與控制量為:狀態(tài)量為位置與速度的標(biāo)量,控制量為加速度。約束為:
 
 
我們已知參考值與參考約束為:
 
 
所有的仿真實(shí)例結(jié)構(gòu)均為標(biāo)準(zhǔn)跟蹤MPC,其階段與終端代價(jià)函數(shù)分別定義為:,我們選擇采樣時(shí)間為ts=0.1秒,預(yù)測(cè)時(shí)域?yàn)镹=90。我們按照[28]中的方法定義安全集,并使用CasADi[29]與IPOPT[30]來(lái)求解MPC。行人模型選用[8]中采用的,其特點(diǎn)是簡(jiǎn)單但準(zhǔn)確。
 
 
5.1 不確定靜態(tài)障礙物
為了展示我們所提出策略的閉環(huán)系統(tǒng)表現(xiàn),我們考慮如下場(chǎng)景:障礙物在k時(shí)刻的初始位置為pobs=20m,假設(shè)障礙物將于6秒后消失,因此我們僅考慮2種模態(tài)。約束函數(shù)可被定義為:
 
 
則預(yù)測(cè)集為:
 
 
如圖2所示為初始狀態(tài)為x0=[-20,5]T的閉環(huán)軌跡。其中,γ=0表示對(duì)模態(tài)1而言,在時(shí)間達(dá)到6秒之前出現(xiàn)約束的概率為0,這使得閉環(huán)軌跡較為激進(jìn),只有在模態(tài)能夠被區(qū)分開來(lái)時(shí)車輛才會(huì)減速;而γ=1時(shí),閉環(huán)軌跡變得偏向保守,平滑的接近障礙物所在的位置,對(duì)應(yīng)標(biāo)準(zhǔn)魯棒MPC的策略;對(duì)于γ=0.5,控制器會(huì)嘗試平衡其他兩種行為的激進(jìn)性與保守性,相較于γ=1時(shí),控制器會(huì)保持更快的速度,而相較于γ=0時(shí)控制器將會(huì)更早的減速。
圖2中的虛線表示當(dāng)模態(tài)2激活時(shí),系統(tǒng)的閉環(huán)行為??梢钥吹剑?gamma;=0時(shí)僅在必要的時(shí)候采取制動(dòng)措施,因此模態(tài)2激活時(shí)車輛速度不變。然而γ>0時(shí)控制器變得更加保守,以相對(duì)低的速度接近約束。從圖3中可以看到同樣的現(xiàn)象,圖3比較了我們所提出方法以及標(biāo)準(zhǔn)管模型預(yù)測(cè)控制策略的預(yù)期代價(jià)。
 
圖2 在p=20m處有障礙物的情況下,所提出的場(chǎng)景MPC策略的閉環(huán)軌跡(虛線為t=6s之后解除約束時(shí)的閉環(huán)行為)
 
圖3 魯棒管模型預(yù)測(cè)控制策略與本文所提出控制策略的預(yù)期代價(jià)比較
5.2.不確定動(dòng)態(tài)障礙物
為了進(jìn)一步比較控制策略的閉環(huán)性能,我們采用了更為復(fù)雜的動(dòng)態(tài)場(chǎng)景,如圖4所示,行人狀態(tài)為:
 
我們假定行人在達(dá)到x=20m的位置時(shí),可能會(huì)橫穿馬路或沿y=-2.75的虛線繼續(xù)直行。
 
圖4 簡(jiǎn)化的行人行走場(chǎng)景
出于測(cè)量的方便,我們使用下式對(duì)兩種模態(tài)進(jìn)行預(yù)測(cè):
 
 
當(dāng)xk<20時(shí),我們定義集合O1n|k與集合O2n|k,進(jìn)而包含了障礙物的所有狀態(tài)??梢钥吹剑@個(gè)模型實(shí)際上是式(13)的非線性逼近。當(dāng)xk<20時(shí),激活的模態(tài)變?yōu)橐阎浚襉1n|k=O2n|k僅包含一個(gè)模態(tài)值。則約束函數(shù)g為:
其中r=1為行人的安全裕度,Δ=1.5m為需要是否將行人納入避障范圍的道路偏移量。與上部分類似,我們引入γ值,有β1=γ,β2=1-γ。
 
使用階段代價(jià)函數(shù),我們對(duì)[0,1]范圍內(nèi)的γ值進(jìn)行仿真,并計(jì)算出其對(duì)應(yīng)的閉環(huán)軌跡期望代價(jià)。我們將所提出的場(chǎng)景MPC與管模型預(yù)測(cè)控制相比較,并選擇已知全約束g先驗(yàn)的MPC作為預(yù)期代價(jià)的下界值。
如圖5所示為三種不同控制策略在初始狀態(tài)為x0=[-20,5]、初始障礙物狀態(tài)為O0=[15,-2.75]時(shí)的預(yù)期代價(jià)。可以看到,由于預(yù)先知道某個(gè)約束在將來(lái)是否會(huì)存在,因此有預(yù)見性的MPC控制器產(chǎn)生了最低的預(yù)期代價(jià)。可以看到,當(dāng)γ值較小時(shí),場(chǎng)景MPC的接近于最優(yōu)的預(yù)見性MPC;然而當(dāng)γ值接近1時(shí),魯棒MPC與場(chǎng)景MPC相差不大;當(dāng)γ=1時(shí),行人始終選擇橫穿馬路,因此所有控制器的解以及期望代價(jià)相等。
 
圖5 不同γ值對(duì)應(yīng)的不同控制策略預(yù)期代價(jià)
 
6 結(jié)論
本文介紹了一種保證了目標(biāo)車輛避免與障礙物發(fā)生碰撞的MPC控制策略,我們?cè)O(shè)計(jì)了一種反饋策略,作為障礙物運(yùn)動(dòng)模態(tài)函數(shù),使得其平均性能能夠至少由于標(biāo)準(zhǔn)魯棒MPC,并能夠規(guī)劃出不考慮障礙物軌跡時(shí)滿足約束的控制序列。我們通過(guò)兩個(gè)數(shù)值仿真實(shí)例對(duì)所提出的控制方案進(jìn)行了評(píng)估,仿真結(jié)果表明我們所提出的策略在預(yù)期代價(jià)方面由于標(biāo)準(zhǔn)魯棒MPC。未來(lái)我們將關(guān)注如何尋找更為合適的近似方式,用于適應(yīng)包含那多障礙物時(shí)增加的計(jì)算復(fù)雜度。
參考文獻(xiàn):
 
 
 
 
 
 
聯(lián)系人:唐老師  
電話:021-69589116
郵箱:20666028@#edu.cn 
分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25