混合視覺(jué)語(yǔ)言模型與傳統(tǒng)自動(dòng)駕駛系統(tǒng)的融合

2024-02-26 09:50:13· 來(lái)源：汽車測(cè)試網(wǎng)

自動(dòng)駕駛技術(shù)在近年來(lái)取得了長(zhǎng)足的進(jìn)步，然而，在城市環(huán)境中，其面臨的挑戰(zhàn)依然嚴(yán)峻。理解復(fù)雜而長(zhǎng)尾的場(chǎng)景、挑戰(zhàn)性的路況以及微妙的人類行為是自動(dòng)駕駛系統(tǒng)必須克服的主要障礙之一。為了增強(qiáng)自動(dòng)駕駛系統(tǒng)的場(chǎng)景理解和規(guī)劃能力，一種新的方法：利用視覺(jué)語(yǔ)言模型（VLM）的自動(dòng)駕駛系統(tǒng)，其中包括DriveVLM和其改進(jìn)版DriveVLM Dual。

利用視覺(jué)語(yǔ)言模型（VLM）的自動(dòng)駕駛系統(tǒng)是一種新興的技術(shù)，旨在通過(guò)結(jié)合計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理的方法，提高自動(dòng)駕駛系統(tǒng)對(duì)復(fù)雜場(chǎng)景的理解能力和決策能力。這種系統(tǒng)的核心思想是利用深度學(xué)習(xí)模型對(duì)駕駛場(chǎng)景進(jìn)行感知，并通過(guò)自然語(yǔ)言處理技術(shù)將感知到的信息轉(zhuǎn)化為語(yǔ)義化的描述，從而使得系統(tǒng)能夠更好地理解場(chǎng)景并做出相應(yīng)的規(guī)劃決策。

具體來(lái)說(shuō)，利用VLM的自動(dòng)駕駛系統(tǒng)通常包括以下幾個(gè)關(guān)鍵步驟：

圖像感知：系統(tǒng)首先通過(guò)搭載攝像頭等傳感器設(shè)備來(lái)獲取駕駛場(chǎng)景的圖像信息。這些圖像可能包含道路、車輛、行人、交通標(biāo)志等各種元素。

特征提?。航酉聛?lái)，系統(tǒng)利用深度學(xué)習(xí)技術(shù)對(duì)獲取的圖像進(jìn)行特征提取，將圖像信息轉(zhuǎn)化為高維的特征向量表示。這些特征向量包含了場(chǎng)景的豐富信息，如物體的位置、大小、形狀等。

視覺(jué)語(yǔ)言模型（VLM）處理：得到圖像的特征向量后，系統(tǒng)將這些特征向量輸入到視覺(jué)語(yǔ)言模型（VLM）中進(jìn)行處理。VLM是一種能夠?qū)D像與自然語(yǔ)言之間建立聯(lián)系的深度學(xué)習(xí)模型，通常采用Transformer等結(jié)構(gòu)。通過(guò)VLM，系統(tǒng)能夠?qū)D像信息轉(zhuǎn)化為語(yǔ)義化的描述，描述場(chǎng)景中的物體、位置關(guān)系、動(dòng)作等。

場(chǎng)景理解與規(guī)劃：最后，系統(tǒng)利用VLM生成的語(yǔ)義化描述，結(jié)合實(shí)時(shí)感知到的駕駛場(chǎng)景信息，進(jìn)行場(chǎng)景理解和規(guī)劃。這包括對(duì)道路狀況、車輛行駛狀態(tài)、交通標(biāo)志等進(jìn)行分析，并做出相應(yīng)的駕駛決策，如車輛行駛軌跡規(guī)劃、速度控制、交通規(guī)則遵守等。

然而，DriveVLM也存在一些局限性，特別是在空間推理和計(jì)算效率方面的表現(xiàn)并不理想。

為了克服這些局限性，研究者提出了DriveVLM Dual，它是DriveVLM的改進(jìn)版，將VLM與傳統(tǒng)的自動(dòng)駕駛流水線相結(jié)合。DriveVLM Dual不僅集成了VLM的優(yōu)勢(shì)，還融合了傳統(tǒng)的3D感知和軌跡規(guī)劃模塊，從而實(shí)現(xiàn)了更強(qiáng)大的空間理解能力和實(shí)時(shí)推斷速度。這一混合系統(tǒng)的出現(xiàn)，極大地提升了自動(dòng)駕駛系統(tǒng)在復(fù)雜和不可預(yù)測(cè)的駕駛條件下的性能表現(xiàn)。

為了驗(yàn)證DriveVLM和DriveVLM Dual的效果，研究者進(jìn)行了大量實(shí)驗(yàn)，使用了nuScenes數(shù)據(jù)集和SUP-AD數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明，這兩種系統(tǒng)在復(fù)雜和不可預(yù)測(cè)的駕駛條件下均超過(guò)了現(xiàn)有的方法。DriveVLM在場(chǎng)景理解和規(guī)劃能力上表現(xiàn)出色，而DriveVLM Dual在空間推理和實(shí)時(shí)軌跡規(guī)劃方面更具優(yōu)勢(shì)。

總的來(lái)說(shuō)，DriveVLM和DriveVLM Dual代表了自動(dòng)駕駛技術(shù)領(lǐng)域的最新進(jìn)展，它們的出現(xiàn)為自動(dòng)駕駛系統(tǒng)的發(fā)展帶來(lái)了新的思路和方法。隨著技術(shù)的不斷進(jìn)步和研究的深入，相信這些方法將進(jìn)一步提升自動(dòng)駕駛系統(tǒng)的性能，使其更好地適應(yīng)各種復(fù)雜的駕駛場(chǎng)景。

分享到：

微信“掃一掃”
分享到朋友圈

點(diǎn)贊 0 反對(duì) 0 舉報(bào) 0 收藏 0

汽車測(cè)試網(wǎng)V課堂
微信公眾號(hào)
汽車測(cè)試網(wǎng)手機(jī)站

相關(guān)閱讀

• 基于AUTOSAR架構(gòu)的車規(guī)MCU軟件開(kāi)發(fā)探討	• 新能源汽車中基于車載以太網(wǎng)的LIN物理層、數(shù)據(jù)鏈路層、網(wǎng)
• 新能源汽車中基于車載以太網(wǎng)的CAN物理層、數(shù)據(jù)鏈路層、交	• 新能源汽車中基于車載以太網(wǎng)的刷寫(xiě)、路由及網(wǎng)絡(luò)配置測(cè)試
• 新能源汽車中基于車載以太網(wǎng)的UDPNM測(cè)試	• 新能源汽車中基于車載以太網(wǎng)的DoIP測(cè)試方法詳解
• 新能源汽車中基于車載以太網(wǎng)的SOME/IP協(xié)議測(cè)試	• 新能源汽車中基于車載以太網(wǎng)的AVB/TSN協(xié)議一致性測(cè)試
• 新能源汽車中基于車載以太網(wǎng)的TCP/IP協(xié)議一致性測(cè)試	• 新能源汽車中基于車載以太網(wǎng)的交換機(jī)功能和性能測(cè)試

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

混合視覺(jué)語(yǔ)言模型與傳統(tǒng)自動(dòng)駕駛系統(tǒng)的融合

微信公眾號(hào)

編輯推薦

最新資訊

新能源汽車鋰離子電池的熱失控防護(hù)措施及材

新能源汽車三電系統(tǒng)產(chǎn)品開(kāi)發(fā)中的虛實(shí)結(jié)合試

汽車底盤產(chǎn)品系統(tǒng)開(kāi)發(fā)與驗(yàn)證的虛實(shí)結(jié)合試驗(yàn)

汽車?yán)梅抡婕夹g(shù)輔助的多合一電驅(qū)系統(tǒng)的臺(tái)

汽車多合一電驅(qū)系統(tǒng)載荷的失效關(guān)聯(lián)測(cè)試