日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車(chē)測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車(chē)測(cè)試網(wǎng)

    • 在線課堂

    • 電車(chē)測(cè)試

詳細(xì)解讀斯坦福大學(xué)最新成果——自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型

2019-04-03 21:07:31·  來(lái)源:智車(chē)科技  
 
斯坦福大學(xué)研究人員研發(fā)的高性能自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型于3月27日被ScienceRobotics收錄。下面我們一起看看他們研究成果吧。簡(jiǎn)介首先,研究人員讓一輛2009年奧迪
斯坦福大學(xué)研究人員研發(fā)的高性能自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型于3月27日被Science Robotics收錄。下面我們一起看看他們研究成果吧。

簡(jiǎn)介
 
首先,研究人員讓一輛2009年奧迪TTS在基于物理的自動(dòng)系統(tǒng)控制下加速,該系統(tǒng)預(yù)裝了相關(guān)條件的固定信息。當(dāng)在同一場(chǎng)地連續(xù)實(shí)驗(yàn)10次后,2009年奧迪TTS和經(jīng)驗(yàn)豐富的業(yè)余車(chē)手產(chǎn)生了差不多的單圈時(shí)間。然后,研究人員用他們的新的神經(jīng)網(wǎng)絡(luò)系統(tǒng)測(cè)試,盡管神經(jīng)網(wǎng)絡(luò)缺乏關(guān)于道路摩擦的明確信息,但這輛車(chē)在運(yùn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)和基于物理的系統(tǒng)時(shí)表現(xiàn)相似。在模擬測(cè)試中,神經(jīng)網(wǎng)絡(luò)系統(tǒng)在高摩擦和低摩擦情況下均優(yōu)于基于物理的系統(tǒng)。在混合高摩擦和低摩擦兩種情景中,該系統(tǒng)表現(xiàn)良好。
  
研究目的
 
自動(dòng)駕駛汽車(chē)自主導(dǎo)航行駛,首先要對(duì)路徑進(jìn)行規(guī)劃設(shè)計(jì),然后沿著安全的軌道行駛。為了證明自動(dòng)駕駛比人類(lèi)駕駛更安全,自動(dòng)駕駛汽車(chē)必須在大范圍的駕駛環(huán)境和危急情況下,表現(xiàn)出同人類(lèi)司機(jī)一樣或更好的駕駛表現(xiàn)。
基于此種想法,斯坦福大學(xué)研究人員設(shè)計(jì)了一個(gè)前饋反饋控制結(jié)構(gòu),結(jié)合一個(gè)簡(jiǎn)單的基于物理的模型,用來(lái)跟蹤業(yè)余組冠軍賽車(chē)手駕駛汽車(chē)時(shí)候的各種路徑的摩擦極限和車(chē)輛的性能。該項(xiàng)研究的關(guān)鍵是擁有合適的模型。盡管基于物理的模型在透明性和直覺(jué)方面很有用,但它們需要圍繞單個(gè)操作點(diǎn)進(jìn)行顯式描述,并且無(wú)法利用自動(dòng)駕駛汽車(chē)生成的大量車(chē)輛數(shù)據(jù)。為了克服這些限制,研究人員提出了一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使用物理模型驅(qū)動(dòng)的一系列過(guò)去狀態(tài)和輸入。在實(shí)驗(yàn)車(chē)輛上采用相同的前饋-反饋控制結(jié)構(gòu)時(shí),神經(jīng)網(wǎng)絡(luò)的性能優(yōu)于物理模型。更值得注意的是,當(dāng)對(duì)來(lái)自干燥路面和雪地的數(shù)據(jù)進(jìn)行組合訓(xùn)練時(shí),該模型能夠?qū)?chē)輛正在行駛的路面做出適當(dāng)?shù)念A(yù)測(cè),而不需要進(jìn)行明確的路面摩擦估計(jì)。這些結(jié)果表明,該網(wǎng)絡(luò)結(jié)構(gòu)值得進(jìn)一步研究。
 
研究現(xiàn)狀
 
雖然已經(jīng)開(kāi)展了大量的工作來(lái)開(kāi)發(fā)自動(dòng)駕駛的控制技術(shù),但是大部分工作都集中在正常駕駛條件下控制車(chē)輛,并且在高摩擦且干燥的路面上進(jìn)行了輕柔的操作。許多相關(guān)文獻(xiàn)[5-6]已經(jīng)闡明,在摩擦極限附近控制車(chē)輛是一個(gè)不容忽視的挑戰(zhàn)。從根本上說(shuō),當(dāng)車(chē)輛接近輪胎-路面摩擦的極限時(shí),它變得不穩(wěn)定(如果后輪胎達(dá)到極限)或不可控制(如果前輪胎達(dá)到極限)。 為了跟蹤車(chē)輛的極限路徑,車(chē)輛的道路-輪胎摩擦系數(shù)的某些估計(jì)對(duì)于軌跡設(shè)計(jì)和確定適當(dāng)?shù)霓D(zhuǎn)向命令是必要的??偟膩?lái)說(shuō),獲得這樣的估計(jì)是具有挑戰(zhàn)性的。由于輪胎-路面摩擦經(jīng)??焖僮兓⑶业缆返囊恍┎糠挚赡苡刹煌谋砻娼M成,使研究過(guò)程進(jìn)一步復(fù)雜化。除了難以估計(jì)該關(guān)鍵參數(shù)之外,開(kāi)發(fā)可用于軌跡生成和在極限處跟隨的精確動(dòng)態(tài)模型是一項(xiàng)艱巨的任務(wù),因?yàn)檫\(yùn)動(dòng)方程是高度非線性的。設(shè)計(jì)者必須進(jìn)一步選擇適當(dāng)?shù)谋U娑?,從而決定是否包括諸如由于加速引起的輪胎重量傳遞或快速轉(zhuǎn)向運(yùn)動(dòng)產(chǎn)生的輪胎力滯后等效應(yīng)。
 
對(duì)于控制系統(tǒng)設(shè)計(jì)人員來(lái)說(shuō),處理極限是一項(xiàng)挑戰(zhàn),而對(duì)于普通駕駛員而言,處理極端情況的極限條件也是一項(xiàng)挑戰(zhàn),并且極端條件下的摩擦不穩(wěn)定是許多事故的罪魁禍?zhǔn)?。只有少部分駕駛能力在業(yè)余水平以上,并且具有賽車(chē)經(jīng)驗(yàn)的駕駛員,能夠在這種路況下安全地控制車(chē)輛。如果自動(dòng)駕駛車(chē)輛想要在危急情況下能夠比經(jīng)驗(yàn)豐富的駕駛員更好地操縱自動(dòng)駕駛車(chē)輛,那么跟蹤控制器性能的標(biāo)準(zhǔn)必須設(shè)置得相當(dāng)高。
 
該項(xiàng)目中,研究人員展示了一個(gè)簡(jiǎn)單的路徑跟蹤架構(gòu),該構(gòu)架可以使自動(dòng)駕駛車(chē)輛準(zhǔn)確地跟蹤路徑,達(dá)到像賽車(chē)手一樣充分利用輪胎-道路的摩擦的能力。該項(xiàng)目的關(guān)鍵是找到恰當(dāng)?shù)哪P?。研究人員使用基于物理的動(dòng)力學(xué)模型進(jìn)行前饋控制,這是一個(gè)簡(jiǎn)單的線性反饋控制器,搭配根據(jù)車(chē)輛建模的摩擦極限設(shè)計(jì)的軌跡,汽車(chē)可以在模擬的摩擦極限下以平均路徑跟蹤誤差低于40厘米的精度行駛。由于該模型僅代表對(duì)真實(shí)極限的估計(jì),因此研究人員將自動(dòng)駕駛汽車(chē)的性能與業(yè)余賽車(chē)手進(jìn)行基準(zhǔn)測(cè)試,并比較賽道上各賽段的單圈時(shí)間。這種新穎的比較方法表明,控制器在模擬摩擦極限下的操作在摩擦利用率方面與經(jīng)驗(yàn)豐富的賽車(chē)賽車(chē)手的能力相當(dāng)。
 
深入研究
 
簡(jiǎn)單模型準(zhǔn)確有效的前提條件是在特定條件,比如特定的溫度、干燥的高摩擦賽道等等。那么,如何為條件不確定的公路自動(dòng)駕駛車(chē)輛開(kāi)發(fā)出可比模型呢?盡管獲得不同車(chē)輛的參數(shù)作為典型開(kāi)發(fā)過(guò)程的一部分是可行的,但是幾個(gè)參數(shù)隨著道路狀況的變化結(jié)果差距很大。盡管研究人員已經(jīng)證明了可以適應(yīng)不斷變化的道路狀況的在線參數(shù)估計(jì),但是這些技術(shù)尚未成熟的運(yùn)用到汽車(chē)的商業(yè)部署或安全關(guān)鍵系統(tǒng);而且,已有研究成果的實(shí)時(shí)估算不會(huì)利用當(dāng)前車(chē)輛產(chǎn)生的大量數(shù)據(jù)。鑒于隨著模型復(fù)雜性的增加,參數(shù)估計(jì)變得更具挑戰(zhàn)性,它也沒(méi)有解決模型保真度的問(wèn)題。理想情況下,模型生成過(guò)程應(yīng)該能夠利用不同摩擦水平的表面數(shù)據(jù),減少先驗(yàn)建模決策的數(shù)量,同時(shí)仍然捕獲針對(duì)特定條件調(diào)整的基于物理的模型的準(zhǔn)確性和性能。
 
這些要求促使人們研究用于車(chē)輛控制的神經(jīng)網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)模型由于具有普遍的函數(shù)逼近特性,近年來(lái)取得了許多成果,如在圖像識(shí)別和圍棋方面的基準(zhǔn)測(cè)試。早期對(duì)神經(jīng)網(wǎng)絡(luò)模型的研究表明,這些模型能夠進(jìn)行車(chē)輛控制和動(dòng)態(tài)模型識(shí)別。神經(jīng)網(wǎng)絡(luò)車(chē)輛模型在從四軸飛行器控制到大規(guī)模拉力賽車(chē)輛控制的眾多機(jī)器人應(yīng)用中取得了成功。以上這些模型已成功地用于車(chē)輛動(dòng)力學(xué)模型識(shí)別,但尚未用于捕捉在多個(gè)摩擦面極限下行駛時(shí)的車(chē)輛動(dòng)力學(xué)變化。此外,神經(jīng)網(wǎng)絡(luò)模型可以使用歷史信息來(lái)捕捉時(shí)變或高階效應(yīng),如模型直升機(jī)和機(jī)器人應(yīng)用程序中所示。
 
研究人員提出了一個(gè)可行性研究:研究人員利用基于物理模型的狀態(tài)和輸入作為指導(dǎo),開(kāi)發(fā)了一個(gè)兩層前饋神經(jīng)網(wǎng)絡(luò),能夠?qū)W習(xí)車(chē)輛在不同表面上的動(dòng)態(tài)行為。該網(wǎng)絡(luò)包含了當(dāng)前測(cè)量值和來(lái)自前三個(gè)時(shí)間步驟的歷史信息的組合。歷史信息使網(wǎng)絡(luò)能夠提供不同摩擦水平下的行為預(yù)測(cè),而不需要顯式的摩擦估計(jì)方案。當(dāng)對(duì)高摩擦和低摩擦數(shù)據(jù)進(jìn)行組合訓(xùn)練時(shí),該模型做出了與歷史信息描述的表面相適應(yīng)的預(yù)測(cè)。通過(guò)上述摩擦估計(jì)步驟,具有歷史信息融合估計(jì)和預(yù)測(cè)能力的神經(jīng)網(wǎng)絡(luò),簡(jiǎn)化了車(chē)輛控制任務(wù)。這種額外的功能并沒(méi)有以性能為代價(jià)。與基于調(diào)優(yōu)物理的模型相比,研究人員在極限處顯示了更好的路徑跟蹤性能。仿真研究表明,該神經(jīng)網(wǎng)絡(luò)模型能夠捕捉到一系列簡(jiǎn)單物理模型所沒(méi)有的動(dòng)態(tài)行為。
 
實(shí)驗(yàn)方法
 
為了研究路徑跟蹤體系結(jié)構(gòu)在車(chē)輛操縱能力極限下的性能,研究人員設(shè)計(jì)了一個(gè)與有經(jīng)驗(yàn)的人類(lèi)駕駛員的實(shí)驗(yàn)比較。在這種情況下,研究人員的自動(dòng)駕駛汽車(chē)的一個(gè)合適的基準(zhǔn)是一個(gè)熟練的人類(lèi)駕駛員,他具有豐富的駕駛和業(yè)余賽車(chē)經(jīng)驗(yàn),并熟悉測(cè)試課程。在本實(shí)驗(yàn)中,研究人員使用了一個(gè)基于物理的前饋反饋控制器(如圖1所示),該控制器實(shí)現(xiàn)在一臺(tái)自動(dòng)化的2009年奧迪TTS (Shelley)上??刂破魍ㄟ^(guò)制動(dòng)、節(jié)流閥和換擋命令跟蹤所需的路徑,而另一個(gè)控制器通過(guò)制動(dòng)、節(jié)流閥和換擋命令匹配所需的車(chē)速。通過(guò)優(yōu)化技術(shù)設(shè)計(jì)路徑和速度剖面,使基于車(chē)輛模型的軌跡驅(qū)動(dòng)所需時(shí)間最小化。
 圖1 簡(jiǎn)單的前饋反饋控制結(jié)構(gòu),用于自動(dòng)車(chē)輛的路徑跟蹤
圖2 Shelly
  
該模型用于前饋控制產(chǎn)生一個(gè)適當(dāng)?shù)霓D(zhuǎn)向角,適用于給定的路徑曲率和車(chē)輛縱向速度。這種輸入的準(zhǔn)確性對(duì)產(chǎn)生的路徑跟蹤誤差和所需的反饋工作都有很大的影響。這里的前饋轉(zhuǎn)向指令是由平面單軌或自行車(chē)模型的運(yùn)動(dòng)方程推導(dǎo)而來(lái)的,平面單軌或自行車(chē)模型是由牛頓物理推導(dǎo)而來(lái)的車(chē)輛動(dòng)力學(xué)共同體中常用的模型。本文所提到的基于物理的模型明確地指的是平面自行車(chē)模型。為了計(jì)算前饋轉(zhuǎn)向輸入從這些運(yùn)動(dòng)方程,研究人員使用穩(wěn)態(tài)運(yùn)行條件來(lái)確定前饋輪胎的力量。
 
隨后,通過(guò)使用基于物理的輪胎模型,將這些穩(wěn)態(tài)輪胎力轉(zhuǎn)換為所需的轉(zhuǎn)向輸入,該模型明確地考慮了輪胎力產(chǎn)生和飽和的影響。為了補(bǔ)償前反饋指令產(chǎn)生的誤差和干擾,研究人員使用一個(gè)簡(jiǎn)單的基于路徑的轉(zhuǎn)向反饋控制器來(lái)跟蹤期望的軌跡。該控制器基于e,即車(chē)輛偏離期望軌跡的橫向偏差DY,即車(chē)輛偏離期望軌跡的航向偏差,如圖1所示。利用非線性最小二乘擬合實(shí)驗(yàn)車(chē)輛數(shù)據(jù),對(duì)基于物理模型的輪胎參數(shù)進(jìn)行擬合。
 
為了比較自動(dòng)化方法和經(jīng)驗(yàn)豐富的司機(jī),研究人員創(chuàng)建了一個(gè)封閉的賽道研究的賽車(chē)性能包括在加利福尼亞州Thunderhill Raceway Park的前五個(gè)轉(zhuǎn)彎。自動(dòng)駕駛汽車(chē)和人類(lèi)參與者都試圖在最短的時(shí)間內(nèi)完成課程(如圖3)。這包括以接近0.95g的加速度駕駛,同時(shí)在輪胎附著的物理極限處跟蹤最短時(shí)間的賽車(chē)軌跡。在這種縱向和橫向加速度的綜合水平下,車(chē)輛能夠在部分賽道上接近95英里每小時(shí)(英里每小時(shí))的速度。自動(dòng)駕駛汽車(chē)和人類(lèi)參與者都參與了10項(xiàng)在封閉賽道上駕駛的試驗(yàn)。測(cè)試是在相同的條件下進(jìn)行的,包括在自動(dòng)駕駛和人工駕駛測(cè)試中,給汽車(chē)壓載以使車(chē)輛的質(zhì)量相等。即使在這些極端的駕駛條件下,控制器也能夠始終跟蹤賽道,平均路徑跟蹤誤差在賽道上的任何位置都低于40cm(如圖4)。 
 圖3 人類(lèi)司機(jī)和Shelley
圖4
為了研究軌跡跟蹤的一致性,研究人員檢驗(yàn)了平均絕對(duì)偏離中值軌跡離散度,這是對(duì)每個(gè)驅(qū)動(dòng)軌跡偏離軌跡中心線的魯棒性度量。經(jīng)驗(yàn)豐富的駕駛員在兩圈之間的平均路徑散布比自動(dòng)駕駛的車(chē)輛要大得多(圖4)。這些數(shù)據(jù)也被表示為在圖3中航跡圖上的投影,其中N表示測(cè)試課程的北方方向??刂破鞯穆窂狡钜恢滦员砻?,該控制方法精度高。利用高精度GPS定位系統(tǒng)跟蹤預(yù)先計(jì)算的軌跡,可以解釋自動(dòng)車(chē)輛的低路徑離散性。正如后面所討論的,人類(lèi)驅(qū)動(dòng)路徑的高度分散性表明,人類(lèi)駕駛員采用的策略與自動(dòng)駕駛車(chē)輛不同。因此,在跟蹤精度或可變性方面,人類(lèi)和自動(dòng)駕駛車(chē)輛無(wú)法進(jìn)行比較。然而,它們可以在時(shí)間方面進(jìn)行比較。
 
研究人員使用分段時(shí)間的度量來(lái)比較自動(dòng)車(chē)輛和人類(lèi)駕駛員,因?yàn)檫@是賽車(chē)駕駛員和自動(dòng)車(chē)輛的期望軌跡都試圖最小化的度量。為了比較研究人員封閉賽程的賽段時(shí)間,研究人員將賽段分為三個(gè)賽段。圖5顯示了在Thunderhill Raceway Park進(jìn)行的人類(lèi)駕駛員和自動(dòng)駕駛車(chē)輛聯(lián)合試驗(yàn)中記錄的分段時(shí)間。Shelley通過(guò)每段賽道的時(shí)間都在人類(lèi)駕駛員的分段時(shí)間范圍內(nèi),這表明基于模型的控制器的性能可以與賽車(chē)駕駛員在Shelley能力的極限下進(jìn)行比較??杀容^的搭接次數(shù)表明,基于物理模型的簡(jiǎn)單前饋反饋控制器的摩擦利用率可比較。相對(duì)于人類(lèi)駕駛員,低路徑分散和可比較的路段時(shí)間是由調(diào)整到特定路面的模型造成的。在建立了一個(gè)相對(duì)于有經(jīng)驗(yàn)的人類(lèi)驅(qū)動(dòng)程序的性能基準(zhǔn)之后,研究人員可以使用這個(gè)控制器性能作為神經(jīng)網(wǎng)絡(luò)模型的基準(zhǔn)。
圖5
在基于物理模型考慮狀態(tài)和控制的激勵(lì)下,研究人員選擇使用前饋神經(jīng)網(wǎng)絡(luò),其輸入如圖6所示。該神經(jīng)網(wǎng)絡(luò)模型由兩個(gè)隱層組成,每層有128個(gè)單元,每個(gè)模型狀態(tài)或控件采用三種延遲輸入狀態(tài)。與基于物理的模型相似,該網(wǎng)絡(luò)預(yù)測(cè)了車(chē)輛的偏航率和橫向速度導(dǎo)數(shù)。該網(wǎng)絡(luò)最初以監(jiān)督的方式進(jìn)行訓(xùn)練,以復(fù)制基于物理的模型。在基于物理模型輸入空間中對(duì)200,000條軌跡進(jìn)行全范圍訓(xùn)練后,研究人員利用在高摩擦和低摩擦測(cè)試中收集的實(shí)驗(yàn)車(chē)輛數(shù)據(jù)更新了神經(jīng)網(wǎng)絡(luò)。在Thunderhill Raceway Park進(jìn)行了高摩擦試驗(yàn),在北極圈附近的試驗(yàn)跑道上對(duì)冰雪混合物進(jìn)行了低摩擦試驗(yàn)。
圖6 神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)模型采用基于物理的輸入設(shè)計(jì)模型
 
雖然神經(jīng)網(wǎng)絡(luò)模型可以用于多種控制方案,但研究人員希望將其與基于物理的前饋反饋控制器提供的基準(zhǔn)進(jìn)行比較。因此,研究人員使用學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型來(lái)生成前饋命令,與基于物理的模型做出相同的穩(wěn)態(tài)假設(shè)。為了生成前饋轉(zhuǎn)向指令,研究人員利用二階非線性?xún)?yōu)化方法建立了神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)模型的平衡點(diǎn)。測(cè)量的速度和路徑曲率作為優(yōu)化的輸入,以指定正確的前饋命令。對(duì)車(chē)輛進(jìn)行在線優(yōu)化,從網(wǎng)絡(luò)中以20hz的速率計(jì)算前饋轉(zhuǎn)向指令。為了補(bǔ)償擾動(dòng)和模型失配,研究人員在兩種情況下都使用了相同的基于簡(jiǎn)單路徑的反饋控制器結(jié)構(gòu)來(lái)進(jìn)行控制器之間的比較。
 
研究人員通過(guò)在一輛自主的大眾GTI(圖7)上實(shí)現(xiàn)這兩種控制器進(jìn)行了比較,研究人員有機(jī)會(huì)使用它來(lái)獲取雪的數(shù)據(jù),因?yàn)檠┦菫樽詣?dòng)駕駛準(zhǔn)備的。圖8顯示了用于評(píng)估兩個(gè)控制器的Thunderhill Raceway Park滑塊上的橢圓軌道。兩種控制方案均采用相同的縱向速度剖面和縱向控制器,并在整車(chē)性能極限下進(jìn)行了試驗(yàn)。對(duì)比發(fā)現(xiàn),圖9中標(biāo)記為1的轉(zhuǎn)彎入口時(shí),神經(jīng)網(wǎng)絡(luò)控制器比基于物理的模型學(xué)會(huì)了更多的轉(zhuǎn)向,從而降低了轉(zhuǎn)彎中段的跟蹤誤差。在轉(zhuǎn)彎中途,跟蹤誤差受道路輪胎摩擦力的影響,負(fù)誤差表明車(chē)輛超過(guò)了抓地力極限。此外,神經(jīng)網(wǎng)絡(luò)控制器在轉(zhuǎn)彎出口(3)的轉(zhuǎn)向指令較少,因?yàn)樗咏谕穆窂?。出口和直線段的峰值受控制器增益、前向距離等轉(zhuǎn)向反饋參數(shù)的影響。研究人員發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)控制器能夠在極限處明顯地實(shí)現(xiàn)不同的橫向誤差分布(圖10)。這些結(jié)果表明,在相同的穩(wěn)態(tài)假設(shè)和控制體系結(jié)構(gòu)下,神經(jīng)網(wǎng)絡(luò)模型比基于物理的模型具有更高的模型保真度。也就是說(shuō),控制器滿足本課程所要求的性能基準(zhǔn)。
圖7
 
圖8
 
圖9
 
圖10
然而,數(shù)據(jù)驅(qū)動(dòng)模型的真正功能不僅僅是提供與基于物理的方法相當(dāng)?shù)男阅?。該神?jīng)網(wǎng)絡(luò)模型還具有融合高階動(dòng)態(tài)效應(yīng)和學(xué)習(xí)不同路面車(chē)輛行為的潛力。為了確定研究人員所學(xué)習(xí)的模型(圖6)是否顯示了這些特性,研究人員在另外兩項(xiàng)研究中檢驗(yàn)了包含高保真度車(chē)輛動(dòng)力學(xué)建模和多個(gè)表面摩擦值的預(yù)測(cè)。
 
相對(duì)于簡(jiǎn)化的基于物理的模型,為了證明網(wǎng)絡(luò)的建模能力,研究人員使用不同保真度的動(dòng)態(tài)模型來(lái)生成基于統(tǒng)一隨機(jī)控制策略的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)既用于訓(xùn)練網(wǎng)絡(luò),又用于為基于物理的模型確定最合適的參數(shù),以便比較它們的預(yù)測(cè)能力。在第一次比較中,基于物理的模型本身生成數(shù)據(jù),因此生成仿真數(shù)據(jù)的基于物理的模型與學(xué)習(xí)到的基于物理的模型之間沒(méi)有模型失配。在這種情況下,沒(méi)有錯(cuò)誤匹配(圖11),基于物理的模型明顯優(yōu)于神經(jīng)網(wǎng)絡(luò)模型,恢復(fù)了用于仿真的參數(shù)集。這是可以理解的,因?yàn)榛谖锢淼哪P痛頂?shù)據(jù)背后的真實(shí)模型形式,而神經(jīng)網(wǎng)絡(luò)試圖學(xué)習(xí)一個(gè)近似模型。
 圖11
然而,當(dāng)不同保真度的模型生成訓(xùn)練數(shù)據(jù)時(shí),情況發(fā)生了變化。研究人員使用基于物理的模型生成模擬數(shù)據(jù),這些模型經(jīng)過(guò)增強(qiáng),包括縱向重量轉(zhuǎn)移、輪胎松弛長(zhǎng)度和多個(gè)路面摩擦值的影響(圖11)。當(dāng)數(shù)據(jù)擬合到簡(jiǎn)單的基于物理的模型時(shí),模型錯(cuò)誤匹配的這些附加效應(yīng)導(dǎo)致了參數(shù)值的偏置。研究人員發(fā)現(xiàn),在所有這些模型失配的情況下,神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)方面都優(yōu)于基于物理的模型(圖11)。此外,研究人員發(fā)現(xiàn)這些結(jié)果擴(kuò)展到仿真數(shù)據(jù)(圖12)。這些結(jié)果與用于設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的物理見(jiàn)解是一致的。例如,在學(xué)習(xí)輪胎松弛效應(yīng)時(shí),網(wǎng)絡(luò)能夠通過(guò)包含多個(gè)狀態(tài)和輸入延遲階段來(lái)捕捉變化的滑移角動(dòng)力學(xué),而基于物理的模型僅使用當(dāng)前輸入和狀態(tài)來(lái)預(yù)測(cè)車(chē)輛的動(dòng)力學(xué)。 
圖12
基于神經(jīng)網(wǎng)絡(luò)在模擬中捕捉大量動(dòng)態(tài)的能力,我們?cè)O(shè)計(jì)了一個(gè)額外的研究來(lái)評(píng)估模型在真實(shí)條件下對(duì)不同路面進(jìn)行預(yù)測(cè)的能力。為此,我們使用Volkswagen GTI平臺(tái)收集了手動(dòng)驅(qū)動(dòng)和自動(dòng)數(shù)據(jù)。此外,我們還收集了干瀝青上的高摩擦驅(qū)動(dòng)和冰雪上的低摩擦驅(qū)動(dòng)的數(shù)據(jù)。為了說(shuō)明神經(jīng)網(wǎng)絡(luò)在低摩擦和高摩擦條件下學(xué)習(xí)動(dòng)力學(xué)模型的能力,我們分別對(duì)每種情況分別訓(xùn)練和驗(yàn)證了模型(圖13)。結(jié)果表明,在高摩擦和低摩擦情況下,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)都優(yōu)于基于物理的模型。這兩種情況的數(shù)據(jù)可以進(jìn)一步結(jié)合起來(lái),用于訓(xùn)練單一的神經(jīng)網(wǎng)絡(luò)和基于物理的模型。我們發(fā)現(xiàn),這導(dǎo)致基于物理模型的訓(xùn)練和測(cè)試誤差最大,原因是它無(wú)法捕捉兩種不同的摩擦條件,如圖13所示。識(shí)別出的基于物理的模型特征近似地表示了路面的平均狀態(tài),而神經(jīng)網(wǎng)絡(luò)模型的隱藏節(jié)點(diǎn)能夠隱式地表示和應(yīng)用不同的條件。結(jié)果表明,該神經(jīng)網(wǎng)絡(luò)在訓(xùn)練和測(cè)試方面均優(yōu)于基于物理的模型一個(gè)數(shù)量級(jí)以上。這些結(jié)果表明,神經(jīng)網(wǎng)絡(luò)模型對(duì)混合路面和孤立路面數(shù)據(jù)均具有較好的預(yù)測(cè)性能,這一特性也可以推廣到圖14所示的空載試驗(yàn)數(shù)據(jù)。
 圖13
圖14
  
實(shí)驗(yàn)結(jié)論
結(jié)果表明,在適當(dāng)?shù)哪P拖?,一個(gè)簡(jiǎn)單的前饋反饋控制器可以在車(chē)輛摩擦能力極限下提供路徑跟蹤性能,其摩擦利用率可與有經(jīng)驗(yàn)的人類(lèi)賽車(chē)手相媲美。此外,我們的可行性研究表明,神經(jīng)網(wǎng)絡(luò)可以為這種方法提供必要的模型,實(shí)現(xiàn)比簡(jiǎn)單但經(jīng)過(guò)仔細(xì)調(diào)優(yōu)的靜態(tài)物理模型更好的性能。最值得注意的是,這樣的模型可以預(yù)測(cè)不同摩擦表面的性能,而無(wú)需顯式地識(shí)別摩擦,并在考慮高保真度車(chē)輛動(dòng)力學(xué)特性時(shí)顯示出魯棒性。實(shí)驗(yàn)結(jié)果表明,這種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是自動(dòng)車(chē)輛動(dòng)力學(xué)模型的有效選擇,值得進(jìn)一步研究。
 
將跟蹤控制器(如本文所示的控制器)與人類(lèi)性能進(jìn)行基準(zhǔn)測(cè)試是一項(xiàng)挑戰(zhàn)。從路徑離散的水平可以看出,人類(lèi)駕駛員并沒(méi)有從精確的路徑跟蹤的角度來(lái)表述這個(gè)問(wèn)題。相反,人類(lèi)駕駛員傾向于在特定的點(diǎn)(比如彎道的頂點(diǎn))上錨定想要的路徑,并專(zhuān)注于將汽車(chē)推到摩擦極限。由于人類(lèi)駕駛員的方法與典型的自動(dòng)化車(chē)輛體系結(jié)構(gòu)有根本的不同,因此分段時(shí)間似乎是這兩種方法中最公平的比較。人類(lèi)和已確定的軌道都是為了盡量縮短時(shí)間而運(yùn)行的??紤]到分段時(shí)間對(duì)摩擦利用的極端敏感性,我們可以從可比時(shí)間推斷出可比的摩擦利用。
 
拓展討論
 
此外,雖然我們的業(yè)余賽車(chē)手速度很快,但專(zhuān)業(yè)車(chē)手的速度更快,這意味著使用摩擦的能力更強(qiáng)。因此,我們已經(jīng)證明了可以與高級(jí)人員相媲美的能力,但是我們還沒(méi)有證明可以超越高級(jí)人員的性能。要做到這一點(diǎn),十有可能需要采取一些人類(lèi)駕駛員愿意偏離路線的做法,以便更充分地利用摩擦力,減少時(shí)間。
 
比較了神經(jīng)網(wǎng)絡(luò)模型和基于物理的模型的控制性能,結(jié)果表明,采用神經(jīng)網(wǎng)絡(luò)模型的控制器在選擇的測(cè)試路徑上具有較好的路徑跟蹤性能。采用基于物理模型的控制器獲得了較大的橫向誤差,在轉(zhuǎn)彎過(guò)程中工作在50厘米左右。然而,在典型的2.7 - 3.6 m車(chē)道寬度和典型的2 m車(chē)道寬度的基礎(chǔ)上,即使在摩擦極限下,兩種控制器也會(huì)使車(chē)輛保持在車(chē)道邊界內(nèi)。這條道路的轉(zhuǎn)彎速度不超過(guò)26英里每小時(shí),所以這個(gè)實(shí)驗(yàn)反映了一個(gè)合理的城市或郊區(qū)駕駛的緊急機(jī)動(dòng)模型。雖然在部署前還需要與其他機(jī)動(dòng)進(jìn)行進(jìn)一步的驗(yàn)證,但這些結(jié)果證明了神經(jīng)網(wǎng)絡(luò)方法在極限條件下用于車(chē)輛控制的可行性。在使用神經(jīng)網(wǎng)絡(luò)模型時(shí),控制器的前饋計(jì)算只使用了模型狀態(tài)空間的一小部分(此時(shí)車(chē)輛處于穩(wěn)態(tài)),而神經(jīng)網(wǎng)絡(luò)模型具有學(xué)習(xí)瞬態(tài)動(dòng)力學(xué)效應(yīng)的能力,預(yù)測(cè)誤差表明了這一點(diǎn)。因此,在這種特殊的控制結(jié)構(gòu)中,還沒(méi)有實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)控制的真正潛力。此外,通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行穩(wěn)態(tài)假設(shè)來(lái)生成命令,必須控制網(wǎng)絡(luò)的狀態(tài)歷史。前饋控制器沒(méi)有充分利用神經(jīng)網(wǎng)絡(luò)的能力來(lái)同時(shí)估計(jì)和預(yù)測(cè)可變摩擦面。其他控制結(jié)構(gòu),如模型預(yù)測(cè)控制,可以利用網(wǎng)絡(luò)的估計(jì)能力,提供了一種簡(jiǎn)單的方法,把同時(shí)進(jìn)行的估計(jì)和控制結(jié)合起來(lái)。同樣,也可以使用更復(fù)雜的物理模型或在線估計(jì)參數(shù)。但是,這一系列的神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)模型、以及人類(lèi)駕駛的對(duì)比,是目前最清晰的對(duì)比基準(zhǔn)。研究人員也表示,還需要進(jìn)一步的研究,來(lái)確定不同的條件下的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的正確編碼。 
分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25