詳細(xì)解讀斯坦福大學(xué)最新成果——自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型

2019-04-03 21:07:31· 來(lái)源：智車(chē)科技

斯坦福大學(xué)研究人員研發(fā)的高性能自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型于3月27日被ScienceRobotics收錄。下面我們一起看看他們研究成果吧。簡(jiǎn)介首先，研究人員讓一輛2009年奧迪

斯坦福大學(xué)研究人員研發(fā)的高性能自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型于3月27日被Science Robotics收錄。下面我們一起看看他們研究成果吧。

簡(jiǎn)介

首先，研究人員讓一輛2009年奧迪TTS在基于物理的自動(dòng)系統(tǒng)控制下加速，該系統(tǒng)預(yù)裝了相關(guān)條件的固定信息。當(dāng)在同一場(chǎng)地連續(xù)實(shí)驗(yàn)10次后，2009年奧迪TTS和經(jīng)驗(yàn)豐富的業(yè)余車(chē)手產(chǎn)生了差不多的單圈時(shí)間。然后，研究人員用他們的新的神經(jīng)網(wǎng)絡(luò)系統(tǒng)測(cè)試，盡管神經(jīng)網(wǎng)絡(luò)缺乏關(guān)于道路摩擦的明確信息，但這輛車(chē)在運(yùn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)和基于物理的系統(tǒng)時(shí)表現(xiàn)相似。在模擬測(cè)試中，神經(jīng)網(wǎng)絡(luò)系統(tǒng)在高摩擦和低摩擦情況下均優(yōu)于基于物理的系統(tǒng)。在混合高摩擦和低摩擦兩種情景中，該系統(tǒng)表現(xiàn)良好。

研究目的

自動(dòng)駕駛汽車(chē)自主導(dǎo)航行駛，首先要對(duì)路徑進(jìn)行規(guī)劃設(shè)計(jì)，然后沿著安全的軌道行駛。為了證明自動(dòng)駕駛比人類(lèi)駕駛更安全，自動(dòng)駕駛汽車(chē)必須在大范圍的駕駛環(huán)境和危急情況下，表現(xiàn)出同人類(lèi)司機(jī)一樣或更好的駕駛表現(xiàn)。

基于此種想法，斯坦福大學(xué)研究人員設(shè)計(jì)了一個(gè)前饋反饋控制結(jié)構(gòu)，結(jié)合一個(gè)簡(jiǎn)單的基于物理的模型，用來(lái)跟蹤業(yè)余組冠軍賽車(chē)手駕駛汽車(chē)時(shí)候的各種路徑的摩擦極限和車(chē)輛的性能。該項(xiàng)研究的關(guān)鍵是擁有合適的模型。盡管基于物理的模型在透明性和直覺(jué)方面很有用，但它們需要圍繞單個(gè)操作點(diǎn)進(jìn)行顯式描述，并且無(wú)法利用自動(dòng)駕駛汽車(chē)生成的大量車(chē)輛數(shù)據(jù)。為了克服這些限制，研究人員提出了一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，使用物理模型驅(qū)動(dòng)的一系列過(guò)去狀態(tài)和輸入。在實(shí)驗(yàn)車(chē)輛上采用相同的前饋-反饋控制結(jié)構(gòu)時(shí)，神經(jīng)網(wǎng)絡(luò)的性能優(yōu)于物理模型。更值得注意的是，當(dāng)對(duì)來(lái)自干燥路面和雪地的數(shù)據(jù)進(jìn)行組合訓(xùn)練時(shí)，該模型能夠?qū)?chē)輛正在行駛的路面做出適當(dāng)?shù)念A(yù)測(cè)，而不需要進(jìn)行明確的路面摩擦估計(jì)。這些結(jié)果表明，該網(wǎng)絡(luò)結(jié)構(gòu)值得進(jìn)一步研究。

研究現(xiàn)狀

雖然已經(jīng)開(kāi)展了大量的工作來(lái)開(kāi)發(fā)自動(dòng)駕駛的控制技術(shù)，但是大部分工作都集中在正常駕駛條件下控制車(chē)輛，并且在高摩擦且干燥的路面上進(jìn)行了輕柔的操作。許多相關(guān)文獻(xiàn)[5-6]已經(jīng)闡明，在摩擦極限附近控制車(chē)輛是一個(gè)不容忽視的挑戰(zhàn)。從根本上說(shuō)，當(dāng)車(chē)輛接近輪胎-路面摩擦的極限時(shí)，它變得不穩(wěn)定（如果后輪胎達(dá)到極限）或不可控制（如果前輪胎達(dá)到極限）。為了跟蹤車(chē)輛的極限路徑，車(chē)輛的道路-輪胎摩擦系數(shù)的某些估計(jì)對(duì)于軌跡設(shè)計(jì)和確定適當(dāng)?shù)霓D(zhuǎn)向命令是必要的?？偟膩?lái)說(shuō)，獲得這樣的估計(jì)是具有挑戰(zhàn)性的。由于輪胎-路面摩擦經(jīng)?？焖僮兓⑶业缆返囊恍┎糠挚赡苡刹煌谋砻娼M成，使研究過(guò)程進(jìn)一步復(fù)雜化。除了難以估計(jì)該關(guān)鍵參數(shù)之外，開(kāi)發(fā)可用于軌跡生成和在極限處跟隨的精確動(dòng)態(tài)模型是一項(xiàng)艱巨的任務(wù)，因?yàn)檫\(yùn)動(dòng)方程是高度非線性的。設(shè)計(jì)者必須進(jìn)一步選擇適當(dāng)?shù)谋Ｕ娑?，從而決定是否包括諸如由于加速引起的輪胎重量傳遞或快速轉(zhuǎn)向運(yùn)動(dòng)產(chǎn)生的輪胎力滯后等效應(yīng)。

對(duì)于控制系統(tǒng)設(shè)計(jì)人員來(lái)說(shuō)，處理極限是一項(xiàng)挑戰(zhàn)，而對(duì)于普通駕駛員而言，處理極端情況的極限條件也是一項(xiàng)挑戰(zhàn)，并且極端條件下的摩擦不穩(wěn)定是許多事故的罪魁禍?zhǔn)?。只有少部分駕駛能力在業(yè)余水平以上，并且具有賽車(chē)經(jīng)驗(yàn)的駕駛員，能夠在這種路況下安全地控制車(chē)輛。如果自動(dòng)駕駛車(chē)輛想要在危急情況下能夠比經(jīng)驗(yàn)豐富的駕駛員更好地操縱自動(dòng)駕駛車(chē)輛，那么跟蹤控制器性能的標(biāo)準(zhǔn)必須設(shè)置得相當(dāng)高。

該項(xiàng)目中，研究人員展示了一個(gè)簡(jiǎn)單的路徑跟蹤架構(gòu)，該構(gòu)架可以使自動(dòng)駕駛車(chē)輛準(zhǔn)確地跟蹤路徑，達(dá)到像賽車(chē)手一樣充分利用輪胎-道路的摩擦的能力。該項(xiàng)目的關(guān)鍵是找到恰當(dāng)?shù)哪Ｐ?。研究人員使用基于物理的動(dòng)力學(xué)模型進(jìn)行前饋控制，這是一個(gè)簡(jiǎn)單的線性反饋控制器，搭配根據(jù)車(chē)輛建模的摩擦極限設(shè)計(jì)的軌跡，汽車(chē)可以在模擬的摩擦極限下以平均路徑跟蹤誤差低于40厘米的精度行駛。由于該模型僅代表對(duì)真實(shí)極限的估計(jì)，因此研究人員將自動(dòng)駕駛汽車(chē)的性能與業(yè)余賽車(chē)手進(jìn)行基準(zhǔn)測(cè)試，并比較賽道上各賽段的單圈時(shí)間。這種新穎的比較方法表明，控制器在模擬摩擦極限下的操作在摩擦利用率方面與經(jīng)驗(yàn)豐富的賽車(chē)賽車(chē)手的能力相當(dāng)。

深入研究

簡(jiǎn)單模型準(zhǔn)確有效的前提條件是在特定條件，比如特定的溫度、干燥的高摩擦賽道等等。那么，如何為條件不確定的公路自動(dòng)駕駛車(chē)輛開(kāi)發(fā)出可比模型呢？盡管獲得不同車(chē)輛的參數(shù)作為典型開(kāi)發(fā)過(guò)程的一部分是可行的，但是幾個(gè)參數(shù)隨著道路狀況的變化結(jié)果差距很大。盡管研究人員已經(jīng)證明了可以適應(yīng)不斷變化的道路狀況的在線參數(shù)估計(jì)，但是這些技術(shù)尚未成熟的運(yùn)用到汽車(chē)的商業(yè)部署或安全關(guān)鍵系統(tǒng)；而且，已有研究成果的實(shí)時(shí)估算不會(huì)利用當(dāng)前車(chē)輛產(chǎn)生的大量數(shù)據(jù)。鑒于隨著模型復(fù)雜性的增加，參數(shù)估計(jì)變得更具挑戰(zhàn)性，它也沒(méi)有解決模型保真度的問(wèn)題。理想情況下，模型生成過(guò)程應(yīng)該能夠利用不同摩擦水平的表面數(shù)據(jù)，減少先驗(yàn)建模決策的數(shù)量，同時(shí)仍然捕獲針對(duì)特定條件調(diào)整的基于物理的模型的準(zhǔn)確性和性能。

這些要求促使人們研究用于車(chē)輛控制的神經(jīng)網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)模型由于具有普遍的函數(shù)逼近特性，近年來(lái)取得了許多成果，如在圖像識(shí)別和圍棋方面的基準(zhǔn)測(cè)試。早期對(duì)神經(jīng)網(wǎng)絡(luò)模型的研究表明，這些模型能夠進(jìn)行車(chē)輛控制和動(dòng)態(tài)模型識(shí)別。神經(jīng)網(wǎng)絡(luò)車(chē)輛模型在從四軸飛行器控制到大規(guī)模拉力賽車(chē)輛控制的眾多機(jī)器人應(yīng)用中取得了成功。以上這些模型已成功地用于車(chē)輛動(dòng)力學(xué)模型識(shí)別，但尚未用于捕捉在多個(gè)摩擦面極限下行駛時(shí)的車(chē)輛動(dòng)力學(xué)變化。此外，神經(jīng)網(wǎng)絡(luò)模型可以使用歷史信息來(lái)捕捉時(shí)變或高階效應(yīng)，如模型直升機(jī)和機(jī)器人應(yīng)用程序中所示。

研究人員提出了一個(gè)可行性研究：研究人員利用基于物理模型的狀態(tài)和輸入作為指導(dǎo)，開(kāi)發(fā)了一個(gè)兩層前饋神經(jīng)網(wǎng)絡(luò)，能夠?qū)W習(xí)車(chē)輛在不同表面上的動(dòng)態(tài)行為。該網(wǎng)絡(luò)包含了當(dāng)前測(cè)量值和來(lái)自前三個(gè)時(shí)間步驟的歷史信息的組合。歷史信息使網(wǎng)絡(luò)能夠提供不同摩擦水平下的行為預(yù)測(cè)，而不需要顯式的摩擦估計(jì)方案。當(dāng)對(duì)高摩擦和低摩擦數(shù)據(jù)進(jìn)行組合訓(xùn)練時(shí)，該模型做出了與歷史信息描述的表面相適應(yīng)的預(yù)測(cè)。通過(guò)上述摩擦估計(jì)步驟，具有歷史信息融合估計(jì)和預(yù)測(cè)能力的神經(jīng)網(wǎng)絡(luò)，簡(jiǎn)化了車(chē)輛控制任務(wù)。這種額外的功能并沒(méi)有以性能為代價(jià)。與基于調(diào)優(yōu)物理的模型相比，研究人員在極限處顯示了更好的路徑跟蹤性能。仿真研究表明，該神經(jīng)網(wǎng)絡(luò)模型能夠捕捉到一系列簡(jiǎn)單物理模型所沒(méi)有的動(dòng)態(tài)行為。

實(shí)驗(yàn)方法

為了研究路徑跟蹤體系結(jié)構(gòu)在車(chē)輛操縱能力極限下的性能，研究人員設(shè)計(jì)了一個(gè)與有經(jīng)驗(yàn)的人類(lèi)駕駛員的實(shí)驗(yàn)比較。在這種情況下，研究人員的自動(dòng)駕駛汽車(chē)的一個(gè)合適的基準(zhǔn)是一個(gè)熟練的人類(lèi)駕駛員，他具有豐富的駕駛和業(yè)余賽車(chē)經(jīng)驗(yàn)，并熟悉測(cè)試課程。在本實(shí)驗(yàn)中，研究人員使用了一個(gè)基于物理的前饋反饋控制器(如圖1所示)，該控制器實(shí)現(xiàn)在一臺(tái)自動(dòng)化的2009年奧迪TTS (Shelley)上?？刂破魍ㄟ^(guò)制動(dòng)、節(jié)流閥和換擋命令跟蹤所需的路徑，而另一個(gè)控制器通過(guò)制動(dòng)、節(jié)流閥和換擋命令匹配所需的車(chē)速。通過(guò)優(yōu)化技術(shù)設(shè)計(jì)路徑和速度剖面，使基于車(chē)輛模型的軌跡驅(qū)動(dòng)所需時(shí)間最小化。

圖1 簡(jiǎn)單的前饋反饋控制結(jié)構(gòu)，用于自動(dòng)車(chē)輛的路徑跟蹤

圖2 Shelly

該模型用于前饋控制產(chǎn)生一個(gè)適當(dāng)?shù)霓D(zhuǎn)向角，適用于給定的路徑曲率和車(chē)輛縱向速度。這種輸入的準(zhǔn)確性對(duì)產(chǎn)生的路徑跟蹤誤差和所需的反饋工作都有很大的影響。這里的前饋轉(zhuǎn)向指令是由平面單軌或自行車(chē)模型的運(yùn)動(dòng)方程推導(dǎo)而來(lái)的，平面單軌或自行車(chē)模型是由牛頓物理推導(dǎo)而來(lái)的車(chē)輛動(dòng)力學(xué)共同體中常用的模型。本文所提到的基于物理的模型明確地指的是平面自行車(chē)模型。為了計(jì)算前饋轉(zhuǎn)向輸入從這些運(yùn)動(dòng)方程，研究人員使用穩(wěn)態(tài)運(yùn)行條件來(lái)確定前饋輪胎的力量。

隨后，通過(guò)使用基于物理的輪胎模型，將這些穩(wěn)態(tài)輪胎力轉(zhuǎn)換為所需的轉(zhuǎn)向輸入，該模型明確地考慮了輪胎力產(chǎn)生和飽和的影響。為了補(bǔ)償前反饋指令產(chǎn)生的誤差和干擾，研究人員使用一個(gè)簡(jiǎn)單的基于路徑的轉(zhuǎn)向反饋控制器來(lái)跟蹤期望的軌跡。該控制器基于e，即車(chē)輛偏離期望軌跡的橫向偏差DY，即車(chē)輛偏離期望軌跡的航向偏差，如圖1所示。利用非線性最小二乘擬合實(shí)驗(yàn)車(chē)輛數(shù)據(jù)，對(duì)基于物理模型的輪胎參數(shù)進(jìn)行擬合。

為了比較自動(dòng)化方法和經(jīng)驗(yàn)豐富的司機(jī)，研究人員創(chuàng)建了一個(gè)封閉的賽道研究的賽車(chē)性能包括在加利福尼亞州Thunderhill Raceway Park的前五個(gè)轉(zhuǎn)彎。自動(dòng)駕駛汽車(chē)和人類(lèi)參與者都試圖在最短的時(shí)間內(nèi)完成課程（如圖3）。這包括以接近0.95g的加速度駕駛，同時(shí)在輪胎附著的物理極限處跟蹤最短時(shí)間的賽車(chē)軌跡。在這種縱向和橫向加速度的綜合水平下，車(chē)輛能夠在部分賽道上接近95英里每小時(shí)(英里每小時(shí))的速度。自動(dòng)駕駛汽車(chē)和人類(lèi)參與者都參與了10項(xiàng)在封閉賽道上駕駛的試驗(yàn)。測(cè)試是在相同的條件下進(jìn)行的，包括在自動(dòng)駕駛和人工駕駛測(cè)試中，給汽車(chē)壓載以使車(chē)輛的質(zhì)量相等。即使在這些極端的駕駛條件下，控制器也能夠始終跟蹤賽道，平均路徑跟蹤誤差在賽道上的任何位置都低于40cm(如圖4)。

圖3 人類(lèi)司機(jī)和Shelley

圖4

為了研究軌跡跟蹤的一致性，研究人員檢驗(yàn)了平均絕對(duì)偏離中值軌跡離散度，這是對(duì)每個(gè)驅(qū)動(dòng)軌跡偏離軌跡中心線的魯棒性度量。經(jīng)驗(yàn)豐富的駕駛員在兩圈之間的平均路徑散布比自動(dòng)駕駛的車(chē)輛要大得多(圖4)。這些數(shù)據(jù)也被表示為在圖3中航跡圖上的投影，其中N表示測(cè)試課程的北方方向?？刂破鞯穆窂狡钜恢滦员砻?，該控制方法精度高。利用高精度GPS定位系統(tǒng)跟蹤預(yù)先計(jì)算的軌跡，可以解釋自動(dòng)車(chē)輛的低路徑離散性。正如后面所討論的，人類(lèi)驅(qū)動(dòng)路徑的高度分散性表明，人類(lèi)駕駛員采用的策略與自動(dòng)駕駛車(chē)輛不同。因此，在跟蹤精度或可變性方面，人類(lèi)和自動(dòng)駕駛車(chē)輛無(wú)法進(jìn)行比較。然而，它們可以在時(shí)間方面進(jìn)行比較。

研究人員使用分段時(shí)間的度量來(lái)比較自動(dòng)車(chē)輛和人類(lèi)駕駛員，因?yàn)檫@是賽車(chē)駕駛員和自動(dòng)車(chē)輛的期望軌跡都試圖最小化的度量。為了比較研究人員封閉賽程的賽段時(shí)間，研究人員將賽段分為三個(gè)賽段。圖5顯示了在Thunderhill Raceway Park進(jìn)行的人類(lèi)駕駛員和自動(dòng)駕駛車(chē)輛聯(lián)合試驗(yàn)中記錄的分段時(shí)間。Shelley通過(guò)每段賽道的時(shí)間都在人類(lèi)駕駛員的分段時(shí)間范圍內(nèi)，這表明基于模型的控制器的性能可以與賽車(chē)駕駛員在Shelley能力的極限下進(jìn)行比較?？杀容^的搭接次數(shù)表明，基于物理模型的簡(jiǎn)單前饋反饋控制器的摩擦利用率可比較。相對(duì)于人類(lèi)駕駛員，低路徑分散和可比較的路段時(shí)間是由調(diào)整到特定路面的模型造成的。在建立了一個(gè)相對(duì)于有經(jīng)驗(yàn)的人類(lèi)驅(qū)動(dòng)程序的性能基準(zhǔn)之后，研究人員可以使用這個(gè)控制器性能作為神經(jīng)網(wǎng)絡(luò)模型的基準(zhǔn)。

圖5

在基于物理模型考慮狀態(tài)和控制的激勵(lì)下，研究人員選擇使用前饋神經(jīng)網(wǎng)絡(luò)，其輸入如圖6所示。該神經(jīng)網(wǎng)絡(luò)模型由兩個(gè)隱層組成，每層有128個(gè)單元，每個(gè)模型狀態(tài)或控件采用三種延遲輸入狀態(tài)。與基于物理的模型相似，該網(wǎng)絡(luò)預(yù)測(cè)了車(chē)輛的偏航率和橫向速度導(dǎo)數(shù)。該網(wǎng)絡(luò)最初以監(jiān)督的方式進(jìn)行訓(xùn)練，以復(fù)制基于物理的模型。在基于物理模型輸入空間中對(duì)200,000條軌跡進(jìn)行全范圍訓(xùn)練后，研究人員利用在高摩擦和低摩擦測(cè)試中收集的實(shí)驗(yàn)車(chē)輛數(shù)據(jù)更新了神經(jīng)網(wǎng)絡(luò)。在Thunderhill Raceway Park進(jìn)行了高摩擦試驗(yàn)，在北極圈附近的試驗(yàn)跑道上對(duì)冰雪混合物進(jìn)行了低摩擦試驗(yàn)。

圖6 神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)模型采用基于物理的輸入設(shè)計(jì)模型

雖然神經(jīng)網(wǎng)絡(luò)模型可以用于多種控制方案，但研究人員希望將其與基于物理的前饋反饋控制器提供的基準(zhǔn)進(jìn)行比較。因此，研究人員使用學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型來(lái)生成前饋命令，與基于物理的模型做出相同的穩(wěn)態(tài)假設(shè)。為了生成前饋轉(zhuǎn)向指令，研究人員利用二階非線性?xún)?yōu)化方法建立了神經(jīng)網(wǎng)絡(luò)動(dòng)力學(xué)模型的平衡點(diǎn)。測(cè)量的速度和路徑曲率作為優(yōu)化的輸入，以指定正確的前饋命令。對(duì)車(chē)輛進(jìn)行在線優(yōu)化，從網(wǎng)絡(luò)中以20hz的速率計(jì)算前饋轉(zhuǎn)向指令。為了補(bǔ)償擾動(dòng)和模型失配，研究人員在兩種情況下都使用了相同的基于簡(jiǎn)單路徑的反饋控制器結(jié)構(gòu)來(lái)進(jìn)行控制器之間的比較。

研究人員通過(guò)在一輛自主的大眾GTI(圖7)上實(shí)現(xiàn)這兩種控制器進(jìn)行了比較，研究人員有機(jī)會(huì)使用它來(lái)獲取雪的數(shù)據(jù)，因?yàn)檠┦菫樽詣?dòng)駕駛準(zhǔn)備的。圖8顯示了用于評(píng)估兩個(gè)控制器的Thunderhill Raceway Park滑塊上的橢圓軌道。兩種控制方案均采用相同的縱向速度剖面和縱向控制器，并在整車(chē)性能極限下進(jìn)行了試驗(yàn)。對(duì)比發(fā)現(xiàn)，圖9中標(biāo)記為1的轉(zhuǎn)彎入口時(shí)，神經(jīng)網(wǎng)絡(luò)控制器比基于物理的模型學(xué)會(huì)了更多的轉(zhuǎn)向，從而降低了轉(zhuǎn)彎中段的跟蹤誤差。在轉(zhuǎn)彎中途，跟蹤誤差受道路輪胎摩擦力的影響，負(fù)誤差表明車(chē)輛超過(guò)了抓地力極限。此外，神經(jīng)網(wǎng)絡(luò)控制器在轉(zhuǎn)彎出口(3)的轉(zhuǎn)向指令較少，因?yàn)樗咏谕穆窂?。出口和直線段的峰值受控制器增益、前向距離等轉(zhuǎn)向反饋參數(shù)的影響。研究人員發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)控制器能夠在極限處明顯地實(shí)現(xiàn)不同的橫向誤差分布(圖10)。這些結(jié)果表明，在相同的穩(wěn)態(tài)假設(shè)和控制體系結(jié)構(gòu)下，神經(jīng)網(wǎng)絡(luò)模型比基于物理的模型具有更高的模型保真度。也就是說(shuō)，控制器滿足本課程所要求的性能基準(zhǔn)。

圖7

圖8

圖9

圖10

然而，數(shù)據(jù)驅(qū)動(dòng)模型的真正功能不僅僅是提供與基于物理的方法相當(dāng)?shù)男阅?。該神?jīng)網(wǎng)絡(luò)模型還具有融合高階動(dòng)態(tài)效應(yīng)和學(xué)習(xí)不同路面車(chē)輛行為的潛力。為了確定研究人員所學(xué)習(xí)的模型(圖6)是否顯示了這些特性，研究人員在另外兩項(xiàng)研究中檢驗(yàn)了包含高保真度車(chē)輛動(dòng)力學(xué)建模和多個(gè)表面摩擦值的預(yù)測(cè)。

相對(duì)于簡(jiǎn)化的基于物理的模型，為了證明網(wǎng)絡(luò)的建模能力，研究人員使用不同保真度的動(dòng)態(tài)模型來(lái)生成基于統(tǒng)一隨機(jī)控制策略的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)既用于訓(xùn)練網(wǎng)絡(luò)，又用于為基于物理的模型確定最合適的參數(shù)，以便比較它們的預(yù)測(cè)能力。在第一次比較中，基于物理的模型本身生成數(shù)據(jù)，因此生成仿真數(shù)據(jù)的基于物理的模型與學(xué)習(xí)到的基于物理的模型之間沒(méi)有模型失配。在這種情況下，沒(méi)有錯(cuò)誤匹配(圖11)，基于物理的模型明顯優(yōu)于神經(jīng)網(wǎng)絡(luò)模型，恢復(fù)了用于仿真的參數(shù)集。這是可以理解的，因?yàn)榛谖锢淼哪Ｐ痛頂?shù)據(jù)背后的真實(shí)模型形式，而神經(jīng)網(wǎng)絡(luò)試圖學(xué)習(xí)一個(gè)近似模型。

圖11

然而，當(dāng)不同保真度的模型生成訓(xùn)練數(shù)據(jù)時(shí)，情況發(fā)生了變化。研究人員使用基于物理的模型生成模擬數(shù)據(jù)，這些模型經(jīng)過(guò)增強(qiáng)，包括縱向重量轉(zhuǎn)移、輪胎松弛長(zhǎng)度和多個(gè)路面摩擦值的影響(圖11)。當(dāng)數(shù)據(jù)擬合到簡(jiǎn)單的基于物理的模型時(shí)，模型錯(cuò)誤匹配的這些附加效應(yīng)導(dǎo)致了參數(shù)值的偏置。研究人員發(fā)現(xiàn)，在所有這些模型失配的情況下，神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)方面都優(yōu)于基于物理的模型(圖11)。此外，研究人員發(fā)現(xiàn)這些結(jié)果擴(kuò)展到仿真數(shù)據(jù)(圖12)。這些結(jié)果與用于設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的物理見(jiàn)解是一致的。例如，在學(xué)習(xí)輪胎松弛效應(yīng)時(shí)，網(wǎng)絡(luò)能夠通過(guò)包含多個(gè)狀態(tài)和輸入延遲階段來(lái)捕捉變化的滑移角動(dòng)力學(xué)，而基于物理的模型僅使用當(dāng)前輸入和狀態(tài)來(lái)預(yù)測(cè)車(chē)輛的動(dòng)力學(xué)。

圖12

基于神經(jīng)網(wǎng)絡(luò)在模擬中捕捉大量動(dòng)態(tài)的能力，我們?cè)O(shè)計(jì)了一個(gè)額外的研究來(lái)評(píng)估模型在真實(shí)條件下對(duì)不同路面進(jìn)行預(yù)測(cè)的能力。為此，我們使用Volkswagen GTI平臺(tái)收集了手動(dòng)驅(qū)動(dòng)和自動(dòng)數(shù)據(jù)。此外，我們還收集了干瀝青上的高摩擦驅(qū)動(dòng)和冰雪上的低摩擦驅(qū)動(dòng)的數(shù)據(jù)。為了說(shuō)明神經(jīng)網(wǎng)絡(luò)在低摩擦和高摩擦條件下學(xué)習(xí)動(dòng)力學(xué)模型的能力，我們分別對(duì)每種情況分別訓(xùn)練和驗(yàn)證了模型(圖13)。結(jié)果表明，在高摩擦和低摩擦情況下，神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)都優(yōu)于基于物理的模型。這兩種情況的數(shù)據(jù)可以進(jìn)一步結(jié)合起來(lái)，用于訓(xùn)練單一的神經(jīng)網(wǎng)絡(luò)和基于物理的模型。我們發(fā)現(xiàn)，這導(dǎo)致基于物理模型的訓(xùn)練和測(cè)試誤差最大，原因是它無(wú)法捕捉兩種不同的摩擦條件，如圖13所示。識(shí)別出的基于物理的模型特征近似地表示了路面的平均狀態(tài)，而神經(jīng)網(wǎng)絡(luò)模型的隱藏節(jié)點(diǎn)能夠隱式地表示和應(yīng)用不同的條件。結(jié)果表明，該神經(jīng)網(wǎng)絡(luò)在訓(xùn)練和測(cè)試方面均優(yōu)于基于物理的模型一個(gè)數(shù)量級(jí)以上。這些結(jié)果表明，神經(jīng)網(wǎng)絡(luò)模型對(duì)混合路面和孤立路面數(shù)據(jù)均具有較好的預(yù)測(cè)性能，這一特性也可以推廣到圖14所示的空載試驗(yàn)數(shù)據(jù)。

圖13

圖14

實(shí)驗(yàn)結(jié)論

結(jié)果表明，在適當(dāng)?shù)哪Ｐ拖?，一個(gè)簡(jiǎn)單的前饋反饋控制器可以在車(chē)輛摩擦能力極限下提供路徑跟蹤性能，其摩擦利用率可與有經(jīng)驗(yàn)的人類(lèi)賽車(chē)手相媲美。此外，我們的可行性研究表明，神經(jīng)網(wǎng)絡(luò)可以為這種方法提供必要的模型，實(shí)現(xiàn)比簡(jiǎn)單但經(jīng)過(guò)仔細(xì)調(diào)優(yōu)的靜態(tài)物理模型更好的性能。最值得注意的是，這樣的模型可以預(yù)測(cè)不同摩擦表面的性能，而無(wú)需顯式地識(shí)別摩擦，并在考慮高保真度車(chē)輛動(dòng)力學(xué)特性時(shí)顯示出魯棒性。實(shí)驗(yàn)結(jié)果表明，這種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是自動(dòng)車(chē)輛動(dòng)力學(xué)模型的有效選擇，值得進(jìn)一步研究。

將跟蹤控制器(如本文所示的控制器)與人類(lèi)性能進(jìn)行基準(zhǔn)測(cè)試是一項(xiàng)挑戰(zhàn)。從路徑離散的水平可以看出，人類(lèi)駕駛員并沒(méi)有從精確的路徑跟蹤的角度來(lái)表述這個(gè)問(wèn)題。相反，人類(lèi)駕駛員傾向于在特定的點(diǎn)(比如彎道的頂點(diǎn))上錨定想要的路徑，并專(zhuān)注于將汽車(chē)推到摩擦極限。由于人類(lèi)駕駛員的方法與典型的自動(dòng)化車(chē)輛體系結(jié)構(gòu)有根本的不同，因此分段時(shí)間似乎是這兩種方法中最公平的比較。人類(lèi)和已確定的軌道都是為了盡量縮短時(shí)間而運(yùn)行的?？紤]到分段時(shí)間對(duì)摩擦利用的極端敏感性，我們可以從可比時(shí)間推斷出可比的摩擦利用。

拓展討論

此外，雖然我們的業(yè)余賽車(chē)手速度很快，但專(zhuān)業(yè)車(chē)手的速度更快，這意味著使用摩擦的能力更強(qiáng)。因此，我們已經(jīng)證明了可以與高級(jí)人員相媲美的能力，但是我們還沒(méi)有證明可以超越高級(jí)人員的性能。要做到這一點(diǎn)，十有可能需要采取一些人類(lèi)駕駛員愿意偏離路線的做法，以便更充分地利用摩擦力，減少時(shí)間。

比較了神經(jīng)網(wǎng)絡(luò)模型和基于物理的模型的控制性能，結(jié)果表明，采用神經(jīng)網(wǎng)絡(luò)模型的控制器在選擇的測(cè)試路徑上具有較好的路徑跟蹤性能。采用基于物理模型的控制器獲得了較大的橫向誤差，在轉(zhuǎn)彎過(guò)程中工作在50厘米左右。然而，在典型的2.7 - 3.6 m車(chē)道寬度和典型的2 m車(chē)道寬度的基礎(chǔ)上，即使在摩擦極限下，兩種控制器也會(huì)使車(chē)輛保持在車(chē)道邊界內(nèi)。這條道路的轉(zhuǎn)彎速度不超過(guò)26英里每小時(shí)，所以這個(gè)實(shí)驗(yàn)反映了一個(gè)合理的城市或郊區(qū)駕駛的緊急機(jī)動(dòng)模型。雖然在部署前還需要與其他機(jī)動(dòng)進(jìn)行進(jìn)一步的驗(yàn)證，但這些結(jié)果證明了神經(jīng)網(wǎng)絡(luò)方法在極限條件下用于車(chē)輛控制的可行性。在使用神經(jīng)網(wǎng)絡(luò)模型時(shí)，控制器的前饋計(jì)算只使用了模型狀態(tài)空間的一小部分(此時(shí)車(chē)輛處于穩(wěn)態(tài))，而神經(jīng)網(wǎng)絡(luò)模型具有學(xué)習(xí)瞬態(tài)動(dòng)力學(xué)效應(yīng)的能力，預(yù)測(cè)誤差表明了這一點(diǎn)。因此，在這種特殊的控制結(jié)構(gòu)中，還沒(méi)有實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)控制的真正潛力。此外，通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行穩(wěn)態(tài)假設(shè)來(lái)生成命令，必須控制網(wǎng)絡(luò)的狀態(tài)歷史。前饋控制器沒(méi)有充分利用神經(jīng)網(wǎng)絡(luò)的能力來(lái)同時(shí)估計(jì)和預(yù)測(cè)可變摩擦面。其他控制結(jié)構(gòu)，如模型預(yù)測(cè)控制，可以利用網(wǎng)絡(luò)的估計(jì)能力，提供了一種簡(jiǎn)單的方法，把同時(shí)進(jìn)行的估計(jì)和控制結(jié)合起來(lái)。同樣，也可以使用更復(fù)雜的物理模型或在線估計(jì)參數(shù)。但是，這一系列的神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)模型、以及人類(lèi)駕駛的對(duì)比，是目前最清晰的對(duì)比基準(zhǔn)。研究人員也表示，還需要進(jìn)一步的研究，來(lái)確定不同的條件下的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的正確編碼。

分享到：

微信“掃一掃”
分享到朋友圈

下一篇：宋MAX被撞后B柱完全撕裂，中保研打臉比亞迪
上一篇：西門(mén)子收購(gòu)Saab Medav的NVH業(yè)務(wù)?

點(diǎn)贊 0 反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0

汽車(chē)測(cè)試網(wǎng)V課堂
微信公眾號(hào)
汽車(chē)測(cè)試網(wǎng)手機(jī)站

相關(guān)閱讀

0 條相關(guān)評(píng)論

• 為什么 HUD 合規(guī)真正“卡人”的不是參數(shù)，而是證據(jù)鏈	• 輔助駕駛撞扛樹(shù)枝老人、撞環(huán)衛(wèi)工人是預(yù)期功能安全應(yīng)該覆蓋
• 大推力直驅(qū)技術(shù)助力EPS安全測(cè)試，為你的安全出行 “保駕護(hù)	• 單機(jī)體積，雙倍效能！激光切割機(jī)玩轉(zhuǎn)“降本增效”
• 同步難？空間擠？這款雙出軸電機(jī)，是你雙十二的“必囤”硬	• 即刻探索8臺(tái)機(jī)器人如何解放數(shù)百名工人！
• 考慮驅(qū)動(dòng)單元性能變化的分布式驅(qū)動(dòng)智能車(chē)輛強(qiáng)化學(xué)習(xí)增強(qiáng)運(yùn)	• eVTOL/飛行汽車(chē)→低噪聲氣動(dòng)設(shè)計(jì)與主動(dòng)降噪控制策略1/3
• 比亞迪車(chē)輛避撞專(zhuān)利公布	• 全球首個(gè)！電動(dòng)汽車(chē)電耗限值強(qiáng)制新規(guī)來(lái)了：標(biāo)準(zhǔn)更嚴(yán),明年

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

詳細(xì)解讀斯坦福大學(xué)最新成果——自動(dòng)駕駛的神經(jīng)網(wǎng)絡(luò)模型

微信公眾號(hào)

編輯推薦

最新資訊

“汽車(chē)爬坡試驗(yàn)方法”將有國(guó)家標(biāo)準(zhǔn)

十年耐久監(jiān)管時(shí)代：電池系統(tǒng)開(kāi)發(fā)策略將如何

聯(lián)合國(guó)法規(guī)R59對(duì)機(jī)動(dòng)車(chē)備用消聲系統(tǒng)的工程

聯(lián)合國(guó)法規(guī)R58對(duì)后下部防護(hù)裝置的工程化約

聯(lián)合國(guó)法規(guī)R57對(duì)摩托車(chē)前照燈配光性能的工