日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

硬件與軟件:軀體與靈魂

2020-11-18 22:46:21·  來源:汽車電子與軟件  作者:cao sir  
 
前言:前一段時間特斯拉可付費(fèi)在線激活后排座椅加熱功能又叒叕上了全網(wǎng)熱搜,許多人都稱之為軟件定義汽車的又一次科普。軟件定義汽車這個論斷已經(jīng)開始深入人心!
前言:
前一段時間特斯拉可付費(fèi)在線激活后排座椅加熱功能又叒叕上了全網(wǎng)熱搜,許多人都稱之為軟件定義汽車的又一次科普。軟件定義汽車這個論斷已經(jīng)開始深入人心!
那么未來汽車真的會由軟件來定義嗎?或者說未來汽車真的只由軟件來定義就夠了么?
 
1、硬件與軟件---皮之不存毛將焉附?
軟件與硬件從來都是唇齒相依的共生關(guān)系,硬件是軟件的載體,軟件是硬件的表達(dá),軟件決定了硬件的操控水平,硬件決定了軟件的功能邊界。
以消費(fèi)電子的頭部網(wǎng)紅美國蘋果公司為例,這家以手機(jī)操作系統(tǒng)為核心競爭力的軟件生態(tài)公司,卻出人意外地在每場新品發(fā)布會上用大篇幅時間介紹其產(chǎn)品在硬件方面的黑科技。其實在我們的生活中也有這種感受,用一臺老電腦玩最新的大型游戲完全帶不動,用老手機(jī)裝新系統(tǒng)卡頓得讓人懷疑人生。所以軟件在前面大放異彩,少不了硬件在背后默默地支持。
 
蘋果公司2020年的秋季發(fā)布會上介紹A14蘋果芯片
 
2、自動駕駛落地需要硬件(AI芯片)的算力支持
自動駕駛的實現(xiàn),需要依賴感知傳感器對道路環(huán)境的信息進(jìn)行采集,包括超聲波、攝像頭、毫米波雷達(dá)、激光雷達(dá)等,采集的數(shù)據(jù)需要傳送到汽車中央處理器進(jìn)行處理,用來識別障礙物、可行道路等,最后依據(jù)識別的結(jié)果,規(guī)劃路徑、制定速度,自動驅(qū)使汽車行駛。整個過程需要在瞬時完成,延時必須要控制在毫秒甚至微秒級別,才能保證自動駕駛的行駛安全。要完成瞬時處理、反饋、決策規(guī)劃、執(zhí)行的效果,對中央處理器的算力要求非常高。最直觀的體現(xiàn),便是用于感知道路環(huán)境的攝像頭,通常密布車身,數(shù)量在12個左右,為了識別障礙物,處理器需要對多路攝像頭實時拍攝的數(shù)據(jù)進(jìn)行解析,而單顆1080P的高清攝像頭每秒可以產(chǎn)生超過1G的數(shù)據(jù),數(shù)據(jù)量不可謂不大。而為了準(zhǔn)確識別圖像、視頻中的有效信息,業(yè)內(nèi)多采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
 
深度學(xué)習(xí)由訓(xùn)練和推理兩個部分組成
深度學(xué)習(xí)的根本思想就是把任何事物轉(zhuǎn)化成高維空間的向量,而強(qiáng)大無比的神經(jīng)網(wǎng)絡(luò)則是無數(shù)的矩陣運(yùn)算和簡單的非線性變換的結(jié)合。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的實質(zhì)就是將分析過程抽象成乘法的乘積結(jié)果和累加器的值相加,再存入累加器的乘法累積計算。深度學(xué)習(xí)的關(guān)鍵理論是線性代數(shù)和概率論,剩下的就是蠻力計算,因此深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)尤其是幾百上千層的神經(jīng)網(wǎng)絡(luò)對高性能計算要求非常高!因為算力越高在一定時間內(nèi)就可以處理更多的信息,決策的準(zhǔn)確性就會越高!研究表明自動駕駛等級每提高一級,算力就得增加一個數(shù)量級,L2 級別只需2TOPS(TOPS:萬億次浮點指令每秒)算力,但L5則需4000多TOPS算力。
如果說傳統(tǒng)燃油車的性能好壞很大一部分由發(fā)動機(jī)功來決定,那么未來自動駕駛汽車的好壞很大一部分由AI芯片這個數(shù)字引擎的來決定!
 
3、自動駕駛硬件(AI芯片)的架構(gòu)分類
由于自動駕駛高算力和低功耗的強(qiáng)烈需求,傳統(tǒng)單獨(dú)依靠CPU控制芯片已不能滿足該領(lǐng)域的應(yīng)用需求。CPU最大的優(yōu)勢是靈活性。通過馮諾依曼架構(gòu),我們可以為數(shù)百萬的不同應(yīng)用加載任何軟件。但是由于CPU非常靈活,硬件無法一直了解下一個計算是什么,直到它讀取了軟件的下一個指令。CPU必須在內(nèi)部將每次計算的結(jié)果保存到內(nèi)存中(也被稱為寄存器或 L1 緩存)。內(nèi)存訪問成為CPU架構(gòu)的短板,被稱為馮諾依曼瓶頸。雖然神經(jīng)網(wǎng)絡(luò)的大規(guī)模運(yùn)算中的每一步都是完全可預(yù)測的,每一個CPU的算術(shù)邏輯單元(ALU,控制乘法器和加法器的組件)都只能一個接一個地執(zhí)行它們,每一次都需要訪問內(nèi)存,限制了總體吞吐量,并需要大量的能耗。總而言之CPU雖然能夠非常高效地處理各種計算任務(wù),但CPU的局限是一次只能處理相對來說很少量的任務(wù),因此其計算速度要求無法滿足深度學(xué)習(xí)這種需要出色的并行矩陣計算能力的應(yīng)用場景需求!
 
CPU已經(jīng)不能滿足未來自動駕駛芯片的要求
目前,應(yīng)用于L3 以上自動駕駛領(lǐng)域的主控制芯片按照技術(shù)架構(gòu)主要分為三大類:
一、以英偉達(dá)公司的DRIVE PX平臺為代表的圖像處理單元GPU(Graphics Processing Unit)。GPU在執(zhí)行單個任務(wù)時效率較低,而且所能處理的任務(wù)范圍更小。不過GPU 的強(qiáng)大之處在于它們能夠同時執(zhí)行許多任務(wù),因此GPU對處理復(fù)雜運(yùn)算擁有天然的優(yōu)勢。例如,如果你需要乘3個浮點數(shù),CPU會強(qiáng)過GPU;但如果你需要做100萬次3個浮點數(shù)的乘法,那么GPU會碾壓CPU。實踐證明GPU對于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類都可以提供顯著的加速效果。
 
但是GPU在應(yīng)用于深度學(xué)習(xí)算法時仍然有四個方面的局限性:
1,應(yīng)用過程中無法充分發(fā)揮并行計算優(yōu)勢。深度學(xué)習(xí)包含訓(xùn)練和推斷兩個計算環(huán)節(jié),GPU 在深度學(xué)習(xí)算法訓(xùn)練上非常高效,但對于單一輸入進(jìn)行推斷的場合,并行度的優(yōu)勢不能完全發(fā)揮;
2,無法靈活配置硬件結(jié)構(gòu)。GPU 采用 SIMT 計算模式,硬件結(jié)構(gòu)相對固定。目前深度學(xué)習(xí)算法還未完全穩(wěn)定,若深度學(xué)習(xí)算法發(fā)生大的變化,GPU 無法靈活的配置硬件結(jié)構(gòu);
3,GPU仍然是一種通用的處理器,這又把我們帶回到了基礎(chǔ)的問題-馮諾依曼瓶頸。在每次幾千個ALU的計算中,GPU 都需要訪問寄存器或共享內(nèi)存來讀取和保存中間計算結(jié)果。因此GPU若想在其 ALU上執(zhí)行更多的并行計算,它也會成比例地耗費(fèi)更多的能量來訪問內(nèi)存,同時也因為復(fù)雜的線路而增加 GPU 的物理空間占用。因此為了提升運(yùn)行速度,GPU選擇堆砌內(nèi)核,導(dǎo)致尺寸不具有優(yōu)勢;
4,GPU功耗巨大。NVIDIA 的 Drive PX 以及 Xavier 性能雖強(qiáng),但整體功耗達(dá)到了250w,這會對汽車的電力系統(tǒng)造成一定壓力。一般狀態(tài)下的汽油車是只有引擎發(fā)動時才能發(fā)電帶動功耗較大的設(shè)備功能,比如說冷氣,如果自動駕駛的控制核心就必須消耗上百瓦的功耗,雖然理論上可以在怠速時關(guān)閉大部分針對自動駕駛的計算功能來節(jié)省功耗,但對于燃油汽車的傳統(tǒng)電池仍會造成相當(dāng)大的壓力。就算是電動車,如果非馬達(dá)部件需要消耗這么大的電力,那對于行駛里程也將有一定的減損。且如果開啟自動駕駛,這些控制核心為了對外圍環(huán)境進(jìn)行計算、掌握變化,并隨時針對駕駛情境進(jìn)行反應(yīng),理論上都是要不間斷、滿負(fù)荷工作,根本沒有機(jī)會進(jìn)入可以降低功耗的休息模式。
 
自動駕駛的芯片需要實時統(tǒng)合龐大的數(shù)據(jù),從而判斷出駕駛環(huán)境并決定駕駛策略
二、以地平線公司的征程系列為代表專用集成電ASIC(Application Specific Integrated Circuit)。ASIC芯片的計算能力和計算效率都直接根據(jù)特定的算法的需要進(jìn)行定制的,所以其可以實現(xiàn)體積小、功耗低、高可靠性、保密性強(qiáng)、計算性能高、計算效率高等優(yōu)勢。所以,在其所針對的特定的應(yīng)用領(lǐng)域,ASIC芯片的能效表現(xiàn)要遠(yuǎn)超CPU、GPU等通用型芯片以及半定制的FPGA。
 
地平線征程3芯片算力達(dá)到5TOPS,功耗僅有2.5W
以蔚來ES8上使用的Mobileye EyeQ4芯片為例,其最高運(yùn)算速率為2.5TOPS,功耗僅為3W。奧迪A8、沃爾沃XC90、特斯拉Model S等自動駕駛車型上搭載了Mobileye EyeQ3芯片,最高運(yùn)算速率為0.256TOPS,功耗為2.5W,也可滿足自動駕駛L2~L3級所需的計算能力。
除了地平線征程系列、Mobileye的EyeQ系列以外,谷歌的TPU系列、寒武紀(jì)的Cambricon1M系列也都屬于ASIC芯片。
 
當(dāng)然,ASIC芯片的缺點也很明顯,因為其是針對特定算法設(shè)計的,一旦芯片設(shè)計完畢,其所適應(yīng)的算法就是固定的,所以一旦算法發(fā)生變化就可能將會無法使用。但是,隨著自動駕駛軟件、算法越來越成熟和穩(wěn)定,車企們都將會選擇自主開發(fā)匹配自己技術(shù)方案的自動駕駛專用芯片ASIC。
 
不同體系結(jié)構(gòu)性能和靈活性的比較
三、以Xilinx公司的ZYNQ 系列為代表的現(xiàn)場可編程門陣列FPGA(Field-Pro?grammable Gate Array)。FPGA 是在 PAL、GAL、CPLD 等可編程器件基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物,可以通過燒入 FPGA 配置文件來定義這些門電路以及存儲器之間的連線從而實現(xiàn)功能。FPGA可同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算,可以實現(xiàn)比 GPU 更高的并發(fā)處理。在密集處理和高并發(fā)上能力上占優(yōu),而且功耗比 CPU、GPU低。盡管FPGA備受看好,但其畢竟不是專門為了深度學(xué)習(xí)算法而研發(fā),在實際應(yīng)用中也存在諸多局限:
1、基本單元的計算能力有限。為了實現(xiàn)可重構(gòu)特性,F(xiàn)PGA 內(nèi)部有大量極細(xì)粒度的基本單元,但是每個單元的計算能力(主要依靠 LUT 查找表)都遠(yuǎn)遠(yuǎn)低于 CPU 和 GPU 中的 ALU模塊;
2、計算資源占比相對較低。為實現(xiàn)可重構(gòu)特性,F(xiàn)PGA 內(nèi)部大量資源被用于可配置的片上路由與連線;
3、速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距;
4、FPGA 價格比起 ASIC 較為昂貴,在規(guī)模放量的情況下單塊 FPGA 的成本要遠(yuǎn)高于專用定制芯片ASIC。
 
賽林思ZYNQ系列自動駕駛芯片
 
4、硬件與軟件---軀體與靈魂
如果把軟件比作未來汽車的靈魂,那么搭載軟件的硬件則是靈魂所依靠的軀體。
靈魂與軀體之間是是密不可分,軟件與硬件同樣是一種融合共生的關(guān)系。
沒有高性能的硬件,軟件無法發(fā)揮自己的優(yōu)勢,軟件不夠優(yōu)化,再強(qiáng)大的硬件也無處施展自己的性能,聰明的軟件配合強(qiáng)大的硬件才能讓自動駕駛技術(shù)最終落地為人類服務(wù)。
而未來汽車必將是一個擁有強(qiáng)健體魄和聰明大腦的有機(jī)體!
 
聰明的汽車是軟件與硬件的有機(jī)體
現(xiàn)在回到開頭的問題:
未來汽車會由軟件來定義嗎?
  • 答案是肯定的,因為軟件是未來汽車非常重要的一部分!
  • 答案顯然是否定的,因為未來汽車由軟件來定義,它同樣也由硬件來定義!
軟件定義汽車,硬件決定軟件!
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25