日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

LMDrive:基于LLM的自動駕駛系統(tǒng)的訓(xùn)練與微調(diào)

2023-12-14 17:20:32·  來源:汽車測試網(wǎng)  
 

自動駕駛技術(shù)一直是人工智能領(lǐng)域的研究熱點之一。近年來,隨著大規(guī)模預(yù)訓(xùn)練語言模型(LLM)的崛起,其在自動駕駛系統(tǒng)中的應(yīng)用逐漸引起關(guān)注。本文介紹了一種名為LMDrive的自動駕駛系統(tǒng),該系統(tǒng)利用LLM進(jìn)行動作預(yù)測,并通過兩個MLP適配器對未來路點進(jìn)行預(yù)測。為了提高監(jiān)督信號,訓(xùn)練過程中對歷史幀進(jìn)行預(yù)測。在推理時,系統(tǒng)僅執(zhí)行最新幀的預(yù)測。最終的控制信號通過兩個PID控制器實現(xiàn)橫向和縱向控制,按照LBC的方法來跟蹤預(yù)測航路點的航向和速度。本文將深入探討LMDrive的訓(xùn)練目標(biāo)和兩個關(guān)鍵階段:視覺編碼器的預(yù)訓(xùn)練和指令微調(diào)。


LMDrive的動作預(yù)測與微調(diào)


LMDrive的核心在于利用LLM進(jìn)行動作預(yù)測。在接收到指令和視覺tokens序列后,系統(tǒng)通過LLM預(yù)測動作tokens。為了提高監(jiān)督信號,系統(tǒng)在訓(xùn)練期間對每個歷史幀進(jìn)行預(yù)測,而在推理時僅考慮最新幀。此外,為了更準(zhǔn)確地預(yù)測未來路點,LMDrive使用兩層MLP適配器。這個適配器不僅提高了對未來路點的準(zhǔn)確性,還通過一個標(biāo)志表明給定指令是否已完成。這一設(shè)計使得LMDrive能夠更靈活地應(yīng)對不同駕駛情境,從而提高系統(tǒng)的魯棒性。


訓(xùn)練目標(biāo)與損失項


在微調(diào)LLM及其相關(guān)組件時,LMDrive考慮兩個關(guān)鍵的損失項。首先是L1航路點損失,這個損失項確保系統(tǒng)對預(yù)測航路點的準(zhǔn)確性有著高度的敏感性。其次是分類損失(交叉熵),用于確定當(dāng)前幀是否完成了給定的指令。通過這兩個損失項的結(jié)合,LMDrive在訓(xùn)練過程中能夠更好地理解并適應(yīng)駕駛?cè)蝿?wù),從而提高系統(tǒng)的性能。


LMDrive的訓(xùn)練階段


LMDrive的訓(xùn)練分為兩個關(guān)鍵階段。首先是視覺編碼器的預(yù)訓(xùn)練階段,該階段旨在通過LLM對駕駛場景進(jìn)行深度學(xué)習(xí)表示的學(xué)習(xí)。這一步為系統(tǒng)提供了對復(fù)雜環(huán)境的抽象理解。第二階段是指令微調(diào)階段,系統(tǒng)在這一階段通過與控制信號的對齊來微調(diào)LLM,以更好地適應(yīng)具體的駕駛指令。這兩個階段的有機(jī)結(jié)合使得LMDrive在不同環(huán)境和任務(wù)下都能夠表現(xiàn)出色。


LMDrive作為基于LLM的自動駕駛系統(tǒng),通過動作預(yù)測和微調(diào)兩個關(guān)鍵步驟,取得了顯著的性能提升。未來,我們期待在該領(lǐng)域看到更多基于大規(guī)模預(yù)訓(xùn)練語言模型的創(chuàng)新應(yīng)用,為自動駕駛技術(shù)的發(fā)展帶來更多的可能性。LMDrive的成功經(jīng)驗為未來自動駕駛系統(tǒng)的設(shè)計和優(yōu)化提供了有益的啟示。

分享到:
 
反對 0 舉報 0 收藏 0
滬ICP備11026917號-25