自動駕駛車輛的社會交互：回顧與展望

2022-10-28 23:25:17· 來源：智能運載裝備研究所作者：王文碩劉暢流等

一、概述本文詳細(xì)討論道路車輛(人類駕駛車輛和/或自動駕駛汽車)與自動駕駛汽車之間的交互機制，不包括行人、騎單車的人。重點探討以下四個問題：1）道路交通場景中社會交互是什么樣的？2）如何測量與評估社會交互？3）如何建模與揭示社會交互過程？4）在社會

一、概述
本文詳細(xì)討論道路車輛(人類駕駛車輛和/或自動駕駛汽車)與自動駕駛汽車之間的交互機制，不包括行人、騎單車的人。重點探討以下四個問題：1）道路交通場景中社會交互是什么樣的？2）如何測量與評估社會交互？3）如何建模與揭示社會交互過程？

4）在社會交互中，人類駕駛員如何達(dá)成隱式一致、順利進(jìn)行協(xié)商？

本文描述了各種建模和學(xué)習(xí)人類駕駛員間社會交互的方法，從優(yōu)化理論、深度學(xué)習(xí)、圖模型到社會場論和行為認(rèn)知科學(xué)領(lǐng)域，最后還強調(diào)了未來研究的一些新方向、關(guān)鍵挑戰(zhàn)和開放性問題。本文主要介紹社會交互的定義、社會交互的建模與學(xué)習(xí)方法相關(guān)內(nèi)容。

理解復(fù)雜交通場景中人類駕駛員間動態(tài)交互的原理和規(guī)則有助于：1）利用對其他車輛動作或反應(yīng)的信念和期望，生成不同的社會駕駛行為；2）預(yù)測含有移動物體的場景的未來狀態(tài)，這對建立具備行為預(yù)測和潛在碰撞檢測功能的安全智能車來說至關(guān)重要；3）搭建現(xiàn)實可行的的駕駛模擬器。然而，由于駕駛交互過程中會出現(xiàn)各種社會因素，包括社會動機、社會感知、社會控制，使得理解復(fù)雜交通場景中人類駕駛員間動態(tài)交互的原理和規(guī)則并非易事。（1 社會動機指驅(qū)使人們采取行動與其他人交互的因素。動機強調(diào)了執(zhí)行行動的原因和欲望，而社會動機通常需要與其他人類智能體進(jìn)行交互。2 社會感知指一個人通過其他人的行為去理解和推理他們的動機、態(tài)度、價值觀的過程。不同于物體感知，社會感知通常包括遠(yuǎn)超觀測數(shù)據(jù)的復(fù)雜的推論。3 社會控制指規(guī)則和標(biāo)準(zhǔn)集，其將個體約束在某一特定的要求下，使個體行為與既定規(guī)范一致。）

通常，人類駕駛行為由人類駕駛員間的社會交互和他們與環(huán)境的物理交互決定。人類駕駛員通過隱式、顯式交流可實現(xiàn)與周圍其他駕駛員的社會交互。物理環(huán)境中的靜態(tài)物理障礙物（如停泊的車輛、道路邊界）、動態(tài)物理信息（如交通燈、指示牌）會影響人類駕駛員在交互過程中的決策和運動。社會交互比物理交互更難理解，這是因為在社會交互中人類智能體間形成連續(xù)閉環(huán)反饋，且交互中存在不確定性。社會交互可能需要簡單的決策，即直接將人類感知映射到動作中，無需具體的推理和規(guī)劃（如反應(yīng)式交互、跟車）；也可能需要復(fù)雜的決策，即通過預(yù)測其他智能體的行為和評估所有可能選擇的影響、在眾多選擇中謹(jǐn)慎地決定一個動作（如讓車或不讓車）。另外一方面，人類駕駛員可以通過顯示交流（如手勢、轉(zhuǎn)向燈）與其他駕駛員交互。然而，明確的交流方式在實際駕駛中并不總是有效的或最有效的。更多時候，人類駕駛員更傾向使用隱式交流在交互場景中完成駕駛?cè)蝿?wù)。

所以，本文主要從測量方法、建模方法、未來挑戰(zhàn)三方面討論人類駕駛員間復(fù)雜的、隱式社會交互。

二、社會交互的定義

在交通領(lǐng)域，Markkula et al.統(tǒng)一定義了各類道路使用者間的交互，即‘A situation where the behavior of at least two road users can be interpreted as being influenced by the possibility that they are both intending to occupy the same region of space at the same time in the near future.’至少兩位道路使用者的行為受道路使用者在未來同一時間占用同一空間區(qū)域的可能性影響的情況。該定義為辨別交通場景是否是交互的提供了明確的標(biāo)準(zhǔn)，其指出交互應(yīng)該由至少3個基本元素組成：

至少兩個智能體參與其中
智能體間彼此影響
智能體間有潛在的時空沖突

Duvall定義社會交互是一種試圖影響或解釋彼此主觀經(jīng)驗或意圖的行為。Markkula等人對車間交互的定義指出了交互包含的對象及交互將發(fā)生的時間，卻無法解釋交互的內(nèi)在動態(tài)過程，如一個智能體應(yīng)該如何考慮其他智能體動作和反應(yīng)的影響。交通心理學(xué)家Wilde從概念上認(rèn)為，自然交通中的社會交往過程具有社會習(xí)慣和價值取向、社會期望、社會交互模態(tài)等特征。Wang et al.在綜述中為道路交通中的社會交互提出一個可量化的定義，即‘... a dynamic sequence of acts that mutually consider the actions and reactions of individuals through an information exchange process between two or more agents to maximize benefits and minimize costs.’在兩個或更多智能體間的信息交換過程中互相考慮個體行為和反應(yīng)，以使收益最大或代價最小的動態(tài)動作序列。該定義指出社會交互具有3個重要屬性：動態(tài)性（多智能體間的閉環(huán)反饋）、可測量性（信息交換）、決策性（效用最大化）。

動態(tài)性：每個智能體考慮其他周圍智能體的未來動作和反應(yīng)，形成一個連續(xù)多智能體閉環(huán)反饋系統(tǒng)。在該系統(tǒng)中，每個道路使用者都對交通系統(tǒng)的總動態(tài)作出貢獻(xiàn)，并受到總動態(tài)的影響。可測量性：道路使用者可能具有不同的社會駕駛特征，如駕駛意圖、駕駛風(fēng)格、駕駛偏好，使其產(chǎn)生不同的動作和反應(yīng)。為了實現(xiàn)有效、安全的社會交互，每個道路使用者都需要傳遞他們的社會線索并能識別其他人的社會線索，形成一個信息交互過程。

決策性：基于動態(tài)性和可測量性，處于交互中的人類駕駛員理性地尋求效用最大化。

這種對社會交互的定義為心理學(xué)和機器人的連接提供了一個計算框架。

三、從人類間的交互到人類-自動駕駛汽車間的交互

1．人類駕駛員間的社會交互

人類是自然的社會溝通者，能與其他智能體安全、高效地協(xié)商，形成一個交互密集的多智能體系統(tǒng)。通常，人類駕駛行為由兩種規(guī)范決定：法律規(guī)范和社會規(guī)范。但在實際交通中，人類駕駛員并不總是嚴(yán)格、刻板地按交通法規(guī)要求行駛，反之會根據(jù)隱式的社會規(guī)范行駛，以實現(xiàn)安全、高效的道路行為。現(xiàn)有研究也解釋了根據(jù)非法律規(guī)范（如社會規(guī)范）采取行動可以使行為對其他人類智能體來說是可識別、可預(yù)測的，進(jìn)而減少了交互不確定性、促成每個智能體的決策。所以，僅通過法律規(guī)范來理解和推斷他人的駕駛行為可能是無效的，原因如下：

在一些場景下，交規(guī)并不總能指定駕駛行為。
人類駕駛員并非嚴(yán)格遵守交通規(guī)則。如下圖所示，在現(xiàn)實生活中頻繁發(fā)生的交叉路口的場景。前方藍(lán)色車輛正在交叉口前等待左轉(zhuǎn)，經(jīng)驗豐富的駕駛員（紅色）可以從右側(cè)越過白色實線以節(jié)省通勤時間。雖然輕微違反交通規(guī)則，但是可以改善交通流效率。

圖1 交叉路口場景

因此，使自動駕駛汽車具備理解人類間動態(tài)交互的能力，可以使它們在充滿人類駕駛汽車的環(huán)境中行駛時做出明智且社會兼容的決定。

注：并非鼓勵A(yù)Vs為了像人類駕駛員一樣行駛而違反交通規(guī)則，主張的是學(xué)習(xí)和理解人類遵守的社會規(guī)范有助于更高效、更安全的交互。

2．自動駕駛汽車的社會行為

在人類駕駛汽車與自動駕駛汽車共存的交通環(huán)境中，自動駕駛汽車應(yīng)該具備無縫融入道路的能力，達(dá)到人類水平的交互水平。然而，人類駕駛員和自動駕駛汽車遵循的規(guī)范之間存在著很大的差距，如圖2所示。為了更有效、高效的溝通，自動駕駛汽車需要模仿類人駕駛，這就需要它們具備以下兩點能力：

理解并適應(yīng)他人的社會和動作線索。自動駕駛汽車被視為信息接收器，從而保持自身功能安全和高效。

提供可識別的、有信息含量的社會和動作線索。自動駕駛汽車被視為信息發(fā)送者，使其他人類駕駛員能夠感知和理解自動駕駛汽車的行為，進(jìn)而做出安全和有效的動作。

圖2 從社會規(guī)范和法律規(guī)范角度闡釋人類駕駛員、社會自動駕駛汽車、非社會自動駕駛汽車間的區(qū)別

圖3解釋了兩個智能體之間的動態(tài)交流過程，每個智能體在信息交換過程中扮演兩個角色：信息發(fā)送方和信息接收方。例如，智能體A作為信息發(fā)送者“告訴”智能體B它的意圖。同時，智能體B感知和理解智能體A傳遞的信息，然后通過傳遞可識別的、有用的信息采取一些動作來回應(yīng)或適應(yīng)智能體A。賦予自動駕駛汽車以人類社交能力進(jìn)而提高復(fù)雜交通場景下的交互性能的研究已經(jīng)取得了顯著進(jìn)展。如利用計算認(rèn)知模型定量評估交互過程中人類的社會偏好（如利他主義、親社會主義、利己主義和競爭主義）和合作水平。

圖3 對兩個智能體間閉環(huán)交互體系的闡釋

四、道路交通中的交互——When/Who? How?

先解決三個基本問題：‘when does interaction occur, and who is involved?’and‘how to quantify (social) interaction?’ 交互何時發(fā)生、與誰發(fā)生？如何量化社會交互？

1.交互何時發(fā)生、與誰發(fā)生？

在大部分駕駛?cè)蝿?wù)中（如車道保持、信號交叉口受保護左轉(zhuǎn)），人類駕駛員都是獨自駕駛，僅對物理環(huán)境做出反應(yīng)，并不直接與其他道路使用者發(fā)生交互?？梢圆捎萌N常用的方法來確定交互何時發(fā)生、與誰發(fā)生，分別為潛在沖突檢測、感興趣區(qū)域設(shè)置、以任務(wù)為主的智能體選擇。

(1) 潛在沖突檢測

檢查人類駕駛員其他人駕駛員的未來路徑是否沖突，如果路徑?jīng)_突、那么他們之間就會發(fā)生交互。Wang和Hu等人假設(shè)只有會發(fā)生潛在沖突的車輛才能相互交互，簡化了交互場景，這與人類在日常駕駛過程中的直覺是一致的。人類駕駛員可以利用道路幾何形狀和交通規(guī)則相關(guān)信息來檢查與他車的潛在沖突。此外，人類駕駛員還利用線索及對他人意圖、動作和運動的社會推理來識別潛在的沖突點。

(2)感興趣區(qū)域（ROI）設(shè)置

交互發(fā)生于同時占據(jù)RoI的任何一對智能體之間，一旦其中任何一個智能體行駛到RoI外，交互就會消失。這種方法通常用于研究本智能體與周圍智能體的交互行為，如高速換道行為。設(shè)置ROI通常是面向應(yīng)用的，可根據(jù)以下兩種方法設(shè)計：

以場景為中心：把RoI固定在地圖上，將該區(qū)域的所有人類駕駛員視為交互智能體。該方法通常用于預(yù)測和分析特定交通區(qū)域內(nèi)的多智能體駕駛行為，如城市交叉口和環(huán)形交叉口。
以智能體為中心：把RoI附加在感興趣的智能體上，RoI的形狀可以有多種。

有些研究將兩種方法混合使用，如Hu等人在高速公路路段設(shè)置RoI后，進(jìn)一步計算智能體之間的距離，以確定交互是否存在。RoI方法需要人為制定規(guī)則，其評估性能受RoI的配置影響，RoI越大、包含的智能體越多，便會估計出過多的交互。為了克服這個問題，可以根據(jù)駕駛?cè)蝿?wù)主動選擇交互智能體。

(3) 面向任務(wù)的智能體選擇

人類駕駛員會根據(jù)具體的駕駛?cè)蝿?wù)，有選擇地決定應(yīng)該更加注意哪些智能體、以及何時注意。受此啟發(fā)，研究人員根據(jù)經(jīng)驗為特定任務(wù)選擇智能體。例如，在向左變道任務(wù)中，研究者假設(shè)本車只與當(dāng)前車道上的前車和左側(cè)目標(biāo)車道上的前車、后車相互作用。該假設(shè)與人類駕駛經(jīng)驗一致，只關(guān)注與任務(wù)相關(guān)的智能體，可以簡化交互問題。然而，它需要具有特定領(lǐng)域知識的人為規(guī)則，并且可能無法捕捉到個體在‘如何關(guān)注’方面的差異。

上述三種方法已被廣泛使用，但可能高估或低估了人類駕駛員之間的交互。在駕駛過程中的一些社會互動并不是來自潛在的沖突，而是來自社會凝聚力。例如，在十字路口遇到黃燈時，激進(jìn)的司機會模仿前車的行為，采取機會主義的動作、繼續(xù)向前行駛。在這種情況下，基于潛在沖突的方法不會將其視為一種交互。如果假設(shè)所有占據(jù)RoI的智能體之間都有交互作用，那么RoI方法會高估交互。此外，RoI的大小通常也很難設(shè)置，因為它與任務(wù)和環(huán)境相關(guān)。面向任務(wù)的智能體選擇方法是模擬人類駕駛員之間交互的理想方法。然而，因為交互過程的信息很少是先驗的，使得很難建立這種類型的模型。此外，人類在決策過程中的選擇性關(guān)注是動態(tài)和隨機的，這就需要模型具有時間適應(yīng)性的特點。

上述方法將交互簡化為二元事件，即存在交互和不存在交互?；谠摷僭O(shè)，可以用現(xiàn)成的方法建立模型。然而，它們可能無法揭示人類駕駛員可以直接或間接地影響他們。在多智能體系統(tǒng)中，人類的駕駛行為可能會受到他人在空間和時間上的間接影響，而間接影響可從條件概率角度建模。

2.如何量化社會交互？

常用的兩類量化方法為基于模型的顯式方法和數(shù)據(jù)驅(qū)動的隱式方法。最常用的顯式量化交互的方法是構(gòu)建一個交互模型，用傳感器感知到的數(shù)據(jù)估計一些參數(shù)，來量化智能體間的社會交互強度。基于不同的假設(shè)，交互模型又可分為四種：基于效用的模型、概率生成模型、勢場模型、認(rèn)知模型，如圖4所示。在實際應(yīng)用中，可以直觀地假設(shè)交互強度與交通場景中智能體的相對距離及其變異(如相對速度和加速度)有關(guān)。例如，距離較近的人類司機會被直觀地視為彼此之間有更大的交互影響。

圖4 基于四種假設(shè)的顯式建模交互方法

(1)基于理性效用的模型

基于效用的模型：人類駕駛行為或動作是使環(huán)境中某個效用函數(shù)最大化的最優(yōu)結(jié)果。研究者將與物理距離相關(guān)的信息整合到目標(biāo)/代價函數(shù)中，進(jìn)而把人類駕駛員之間的交互問題構(gòu)建為最優(yōu)化問題，采用現(xiàn)有的動態(tài)和線性規(guī)劃算法即可實現(xiàn)求解。通常，代價函數(shù)是研究者根據(jù)交通法規(guī)和駕駛?cè)蝿?wù)這類先驗知識自己設(shè)計的。通常，基于效用的模型通過仔細(xì)的參數(shù)調(diào)優(yōu)能在類似的場景中達(dá)到預(yù)期性能，但在未見過的場景中泛化能力低。常見的典型模型有最優(yōu)群、博弈論模型、模仿學(xué)習(xí)、馬爾科夫過程。

分享到：

微信“掃一掃”
分享到朋友圈

下一篇：基于多項式的智能車輛換道軌跡規(guī)劃
上一篇：磷酸鐵鋰軟包與鋁殼電池性能比較

點贊 0 反對 0 舉報 0 收藏 0 評論 0

汽車測試網(wǎng)V課堂
微信公眾號
汽車測試網(wǎng)手機站

相關(guān)閱讀

0 條相關(guān)評論

• 為什么 HUD 合規(guī)真正“卡人”的不是參數(shù)，而是證據(jù)鏈	• 輔助駕駛撞扛樹枝老人、撞環(huán)衛(wèi)工人是預(yù)期功能安全應(yīng)該覆蓋
• 大推力直驅(qū)技術(shù)助力EPS安全測試，為你的安全出行 “保駕護	• 單機體積，雙倍效能！激光切割機玩轉(zhuǎn)“降本增效”
• 同步難？空間擠？這款雙出軸電機，是你雙十二的“必囤”硬	• 即刻探索8臺機器人如何解放數(shù)百名工人！
• 考慮驅(qū)動單元性能變化的分布式驅(qū)動智能車輛強化學(xué)習(xí)增強運	• eVTOL/飛行汽車→低噪聲氣動設(shè)計與主動降噪控制策略1/3
• 比亞迪車輛避撞專利公布	• 全球首個！電動汽車電耗限值強制新規(guī)來了：標(biāo)準(zhǔn)更嚴(yán),明年

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

自動駕駛車輛的社會交互：回顧與展望

微信公眾號

編輯推薦

最新資訊

“汽車爬坡試驗方法”將有國家標(biāo)準(zhǔn)

十年耐久監(jiān)管時代：電池系統(tǒng)開發(fā)策略將如何

聯(lián)合國法規(guī)R59對機動車備用消聲系統(tǒng)的工程

聯(lián)合國法規(guī)R58對后下部防護裝置的工程化約

聯(lián)合國法規(guī)R57對摩托車前照燈配光性能的工