日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號(hào)
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

面向自動(dòng)駕駛系統(tǒng)的人工智能數(shù)據(jù)集評(píng)估建議

2025-11-03 21:20:59·  來源:智駕小強(qiáng)  
 

1. 背景

2. 挑戰(zhàn)

3. 引入OASISS:理解數(shù)據(jù)“完整性”與數(shù)據(jù)“代表性”

4. 后續(xù)工作

1. 背景

人工智能(AI)是當(dāng)前及未來自動(dòng)駕駛系統(tǒng)ADS的關(guān)鍵基石。隨著 AI 越來越多地應(yīng)用在自動(dòng)駕駛這樣的安全關(guān)鍵功能,制造商、監(jiān)管機(jī)構(gòu)和認(rèn)證機(jī)構(gòu)必須確保這些功能的安全執(zhí)行。

關(guān)于自動(dòng)駕駛系統(tǒng)的聯(lián)合國法規(guī)(UNR)和全球技術(shù)法規(guī)(GTR)的制定正在推進(jìn),以按計(jì)劃在2026年中完成,但這兩份文件對(duì)AI開發(fā)和保障的要求關(guān)注有限。

WP.29(聯(lián)合國世界車輛法規(guī)協(xié)調(diào)論壇)已認(rèn)識(shí)到這一點(diǎn),隨后于2025年8月召開了首次會(huì)議,啟動(dòng)了一個(gè)新的關(guān)于AI的非正式工作組(IWG)。然而,該AI IWG的范圍比自動(dòng)駕駛更廣,涵蓋了汽車領(lǐng)域更廣泛的AI應(yīng)用。標(biāo)準(zhǔn)化論壇也啟動(dòng)了相關(guān)活動(dòng),近期發(fā)布了ISO PAS 8800標(biāo)準(zhǔn)。

2. 挑戰(zhàn)


然而,這些活動(dòng)未能為監(jiān)管機(jī)構(gòu)評(píng)估ADS中所用AI的性能適當(dāng)性提供工程層面的指導(dǎo)或可衡量的原則。隨著多種AI架構(gòu)和方法(例如,大語言模型、端到端AI、模塊化AI等)在ADS生態(tài)系統(tǒng)中被廣泛使用,任何關(guān)于AI開發(fā)和保障的指南都需要與技術(shù)無關(guān)。
每個(gè)基于AI的系統(tǒng)都將包含以下開發(fā)階段:

1) 模型創(chuàng)建;

2) 模型訓(xùn)練;

3) 模型測試。

模型訓(xùn)練和測試需要使用“訓(xùn)練”數(shù)據(jù)和“測試”數(shù)據(jù),這是所有AI架構(gòu)或方法共有的開發(fā)需求。

本文檔的重點(diǎn)是解決核心問題:“AI系統(tǒng)的訓(xùn)練和測試數(shù)據(jù)/場景是否充分?”。

通過引入OASISS概念,評(píng)估兩個(gè)關(guān)鍵屬性來回答這個(gè)問題:完整性和代表性。

3. 引入OASISS:理解數(shù)據(jù)“完整性”與數(shù)據(jù)“代表性”

基于ODD的自動(dòng)駕駛系統(tǒng)中的人工智能安全OASISS(ODD-based AI Safety In autonomouS Systems),旨在支持更廣泛的ADS安全保障框架,特別是AI系統(tǒng)的安全保證。

其核心是一種新穎的、與系統(tǒng)無關(guān)的評(píng)分機(jī)制,用于評(píng)估訓(xùn)練和測試數(shù)據(jù)集對(duì)于特定目標(biāo)運(yùn)行域(TOD)(或稱預(yù)期運(yùn)行條件)及系統(tǒng)運(yùn)行設(shè)計(jì)域(ODD)的充分性。該框架包含三個(gè)核心組成部分,如下圖所示。


圖片



· 完整性評(píng)估
· 代表性評(píng)估· 可接受性論證

OASISS方法的另一個(gè)優(yōu)勢(shì)是其與ISO PAS 8800(該標(biāo)準(zhǔn)為道路車輛中執(zhí)行安全相關(guān)功能的AI系統(tǒng)的開發(fā)提供指導(dǎo))保持一致。OASISS采納了該標(biāo)準(zhǔn)概述的原則,并通過提供一種實(shí)用的方法論來實(shí)施這些原則,從而擴(kuò)展了其適用性,特別是在數(shù)據(jù)集充分性方面。

完整性評(píng)估訓(xùn)練和測試數(shù)據(jù)集是否包含了預(yù)期的粒度水平,并考慮了可能的運(yùn)行條件。然而,即使是“完整”的數(shù)據(jù)集也不足以保證AI系統(tǒng)訓(xùn)練和測試的充分性。還必須檢查數(shù)據(jù)集的代表性,看其是否反映了現(xiàn)實(shí)世界的趨勢(shì),確保數(shù)據(jù)集中的場景與現(xiàn)實(shí)中可能遇到的場景相匹配。

為了評(píng)估這兩個(gè)屬性,使用運(yùn)行設(shè)計(jì)域(ODD)來確定哪些在系統(tǒng)能力范圍內(nèi)、哪些在范圍外,并對(duì)照目標(biāo)運(yùn)行域(TOD)(也稱為預(yù)期運(yùn)行條件)進(jìn)行評(píng)估。通過此評(píng)估,OASISS提供了一種結(jié)構(gòu)化方法,基于構(gòu)成每個(gè)數(shù)據(jù)集的場景集合,來確定訓(xùn)練和測試是否真正充分。

OASISS框架圖展示了該框架的核心組成部分。前兩個(gè)部分——完整性和代表性,是對(duì)數(shù)據(jù)集的客觀評(píng)估??山邮苄哉撟C則用于證明在完整性和代表性評(píng)估中發(fā)現(xiàn)的任何缺陷是合理的。由于OASISS是一個(gè)與模型無關(guān)的框架,此規(guī)定至關(guān)重要,旨在供監(jiān)管或認(rèn)證機(jī)構(gòu)進(jìn)行客觀評(píng)估。

3.1 完整性

通過完整性屬性,OASISS旨在評(píng)估訓(xùn)練和測試場景集是否能解決以下問題——“系統(tǒng)在其TOD內(nèi)的表現(xiàn)如何?”以及“系統(tǒng)在其ODD之外的表現(xiàn)如何?”

因此,“一個(gè)場景集若包含了其部署區(qū)域內(nèi)會(huì)發(fā)生的所有運(yùn)行條件,以及超出系統(tǒng)運(yùn)行能力的那些條件,則該場景集對(duì)于該系統(tǒng)的部署區(qū)域而言是完整的?!?

OASISS中的完整性組成部分將焦點(diǎn)從這些場景集中的純粹場景數(shù)量轉(zhuǎn)移開,轉(zhuǎn)而使用一個(gè)擴(kuò)展的本體論,對(duì)照一個(gè)結(jié)構(gòu)化的現(xiàn)實(shí)世界表征來系統(tǒng)地評(píng)估該場景集。該本體論投射了現(xiàn)實(shí)世界的屬性,這些屬性是場景集根據(jù)系統(tǒng)的TOD預(yù)期應(yīng)包含的,以及超出其ODD的條件。數(shù)據(jù)集根據(jù)此本體論進(jìn)行評(píng)分,分?jǐn)?shù)反映了其在多大程度上解決了上面列出的兩個(gè)關(guān)鍵問題。

對(duì)于“超出系統(tǒng)運(yùn)行能力”的條件,評(píng)估期望有一組有限的ODD外場景(非所有可能條件),以驗(yàn)證系統(tǒng)是否被適當(dāng)?shù)赝浦疗銸DD邊界以評(píng)估其響應(yīng),例如發(fā)出接管請(qǐng)求或執(zhí)行最小風(fēng)險(xiǎn)操作(MRM)。如下圖所示,完整性評(píng)分方法遵循分層方法,在以下層面展開:


圖片



· 場景層面:場景元素(例如,弱勢(shì)道路使用者VRU)、動(dòng)態(tài)參與者的行為(例如,車輛變道)和時(shí)間轉(zhuǎn)換(從ODD內(nèi)條件移動(dòng)到ODD外條件)


· 價(jià)值層面:場景元素的價(jià)值(例如,對(duì)于VRU:行人、騎行者、摩托車手等)


· 微參數(shù)層面:通常不屬于場景描述部分的影響屬性(例如,對(duì)于行人:衣物類型、身體屬性、輪椅、拐杖等)

3.2 代表性
代表性屬性確保真實(shí)世界的各個(gè)方面,直至微參數(shù)層面,都在場景集中得到體現(xiàn)。例如,考慮一個(gè)已在所有天氣條件(大風(fēng)、雨、雪、霧)下測試過的系統(tǒng)。然而,仔細(xì)檢查后,我們發(fā)現(xiàn)大部分測試包含雨天條件,而其他天氣條件的測試很少。如果TOD地區(qū)主要下雪,與其他天氣條件相比,這就對(duì)模型處理各種雪天場景的能力提出了疑問。

這涉及比較場景集中給定運(yùn)行條件的頻率與在TOD中觀察到的這些條件的頻率。因此,“如果場景集內(nèi)的場景在單個(gè)元素層面和組合元素層面都展現(xiàn)出與該區(qū)域內(nèi)記錄的真實(shí)世界事件相同或相似的分布,則該場景集代表了系統(tǒng)的部署區(qū)域?!?br />
· 單一分布:比較單一元素之間的分布(例如,TOD中的降雨 vs. 場景集中的降雨)

· 組合分布:比較多個(gè)元素之間的分布(例如,TOD中夜間降雨 vs. 場景集中夜間降雨)


圖片


評(píng)估組合分布的代表性依賴于此類組合數(shù)據(jù)的存在。真實(shí)世界試驗(yàn)和事故數(shù)據(jù)庫的記錄是此類信息的樣本來源,可以從中提取多個(gè)參數(shù)的出現(xiàn)頻率。

有了數(shù)據(jù)之后,面臨的問題是必須評(píng)估哪些參數(shù)組合。為了將看似無限的組合減少到有限集合,我們依賴領(lǐng)域?qū)<抑R(shí)。通過分析記錄的數(shù)據(jù)來識(shí)別高概率組合,可以增強(qiáng)檢測這些組合的過程。此過程也提供了驗(yàn)證專家認(rèn)為必要的組合是否被數(shù)據(jù)集捕獲的機(jī)會(huì)。如果沒有,則會(huì)促使調(diào)查數(shù)據(jù)集是否缺少某些組合,并鼓勵(lì)審查如何更新數(shù)據(jù)集以捕獲這些額外的組合。

3.3 可接受性論證
可接受性論證是一個(gè)將安全論證聯(lián)系在一起的組成部分,用以證明系統(tǒng)能夠處理其預(yù)期部署區(qū)域內(nèi)真實(shí)世界的運(yùn)行條件。

OASISS框架認(rèn)識(shí)到每個(gè)AI模型都是根據(jù)其自身的性能要求和能力進(jìn)行訓(xùn)練的。因此,該框架允許TOD定義的要求與訓(xùn)練數(shù)據(jù)集滿足的要求之間存在偏差。任何此類偏差都必須經(jīng)過充分論證,以加強(qiáng)安全論證,旨在彌補(bǔ)場景集與TOD相比所觀察到的任何缺陷。

區(qū)分此處評(píng)估的場景集類型非常重要。訓(xùn)練場景預(yù)期應(yīng)更針對(duì)AI模型的要求,這可能導(dǎo)致偏離真實(shí)世界,這將自動(dòng)導(dǎo)致代表性得分較低。

雖然訓(xùn)練集中的這種偏差只要在可接受性論證中得到令人信服的證明是可以接受的,但這并不適用于為驗(yàn)收測試構(gòu)建的場景集。測試集的場景分布必須與TOD的分布緊密一致,以證明測試足以讓AI模型部署在所考慮的TOD中。

4. 后續(xù)步驟

OASISS框架貢獻(xiàn)了最佳實(shí)踐,制造商可用其支持更廣泛的ADS安全保障框架,并提供了一種潛在的方法論,用以聲明訓(xùn)練和測試數(shù)據(jù)集足以確保AI模型(作為ADS的一部分)在其目標(biāo)運(yùn)行區(qū)域內(nèi)的安全部署。

OASISS評(píng)估的結(jié)果可以指導(dǎo)開發(fā)人員識(shí)別系統(tǒng)訓(xùn)練和測試相對(duì)于其目標(biāo)運(yùn)行區(qū)域可能被認(rèn)為不足的領(lǐng)域,同時(shí)也為監(jiān)管和認(rèn)證機(jī)構(gòu)提供了關(guān)于系統(tǒng)在該區(qū)域內(nèi)運(yùn)行可信度的量化洞察。

引用:Jeyachandran et. al. (2025) Introducing OASISS : ODD-based AI Safety In autonomouS Systems. In: The IEEE International Conference on Intelligent Transportation Systems (ITSC), Gold Coast, Australia, 18-21 Nov 2025 (In Press)

分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25