日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機(jī)站
  • 小程序

    汽車(chē)測(cè)試網(wǎng)

  • 公眾號(hào)
    • 汽車(chē)測(cè)試網(wǎng)

    • 在線課堂

    • 電車(chē)測(cè)試

自動(dòng)駕駛基礎(chǔ)(十五)之SLAM 簡(jiǎn)介

2018-07-11 10:43:33·  來(lái)源:模擬世界  
 
前文講述自動(dòng)駕駛的環(huán)境感知和實(shí)時(shí)定位時(shí)提到了SLAM,今天就具體學(xué)習(xí)一下SLAM的基本原理和技術(shù)方向。
前文講述自動(dòng)駕駛的環(huán)境感知和實(shí)時(shí)定位時(shí)提到了SLAM,今天就具體學(xué)習(xí)一下SLAM的基本原理和技術(shù)方向。

SLAM是Simultaneous Localization and Mapping的縮寫(xiě),意為“同時(shí)定位與建圖 (同步定位與地圖構(gòu)建)”,是業(yè)界公認(rèn)視覺(jué)領(lǐng)域空間定位技術(shù)的前沿方向。它是指運(yùn)動(dòng)物體自身位置不確定的條件下,根據(jù)傳感器的信息,一邊計(jì)算自身位置,一邊構(gòu)建環(huán)境地圖的過(guò)程,同時(shí)利用地圖進(jìn)行自主定位和導(dǎo)航。它主要用于解決機(jī)器人在未知環(huán)境運(yùn)動(dòng)時(shí),如何通過(guò)對(duì)環(huán)境的觀測(cè)確定自身的定位和運(yùn)動(dòng)軌跡,同時(shí)構(gòu)建出周?chē)h(huán)境的地圖。



機(jī)器人從一個(gè)未知的位置出發(fā), 在一個(gè)分布著人造或者自然路標(biāo)(或稱為特征) 的未知環(huán)境中運(yùn)動(dòng)。機(jī)器人根據(jù)己知的運(yùn)動(dòng)學(xué)模型或者里程計(jì)信息推定自己的位置(Dead Reckoning),同時(shí)利用自身安裝的傳感器測(cè)量其附近的路標(biāo)相對(duì)于自己的位置,同時(shí)建造增量式地圖。SLAM 技術(shù)的目標(biāo)就是在實(shí)現(xiàn)機(jī)器人全局定位的同時(shí), 根據(jù)觀測(cè)到的環(huán)境路標(biāo)遞增地建立機(jī)器人的導(dǎo)航地圖。



目前,SLAM的應(yīng)用領(lǐng)域主要有機(jī)器人、汽車(chē)自動(dòng)駕駛、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)。其用途包括傳感器自身的定位,以及后續(xù)的路徑規(guī)劃、場(chǎng)景理解。

那么為什么SLAM技術(shù)這么重要呢?無(wú)論是一個(gè)機(jī)器人也好,還是無(wú)人駕駛汽車(chē)也好,要在一個(gè)未知環(huán)境中,實(shí)現(xiàn)智能化行動(dòng),其中最核心,最根本的問(wèn)題有四個(gè),定位技術(shù)(Localization), 第二個(gè)是建圖(Mapping), 第三個(gè)是導(dǎo)航(Navigation)包括路徑規(guī)劃技術(shù)(Path Planning)和跟蹤技術(shù)(Tracking), 第四個(gè)就是控制執(zhí)行技術(shù)(Controlling)。 而這四個(gè)問(wèn)題中的前三個(gè),SLAM都扮演了最核心的功能。 其意義,打個(gè)比方,就像移動(dòng)互聯(lián)網(wǎng)時(shí)代中,WIFI和3/4G數(shù)據(jù)傳輸技術(shù)對(duì)手機(jī)的意義,是一樣的。扮演一個(gè)最核心,也是最不可或缺的角色。

一個(gè)成熟可用的SLAM系統(tǒng), 必須包括四個(gè)基本方面:
1. 如何進(jìn)行環(huán)境描述,即環(huán)境地圖的表示方法;比如dense和sparse都是它的不同表達(dá)方式,這個(gè)需要根據(jù)實(shí)際場(chǎng)景需求去抉擇。
2. 怎樣獲得環(huán)境信息,機(jī)器人在環(huán)境中漫游并記錄傳感器的感知數(shù)據(jù),這涉及到機(jī)器人的定位與環(huán)境特征提取問(wèn)題;需要考慮如何全面的感知這個(gè)環(huán)境,RGBD攝像頭FOV通常比較小,但激光雷達(dá)比較大。
3. 怎樣表示獲得的環(huán)境信息,并根據(jù)環(huán)境信息更新地圖,這需要解決對(duì)不確定信息的描述和處理方法;不同的sensor的數(shù)據(jù)類型、時(shí)間戳、坐標(biāo)系表達(dá)方式各有不同,需要統(tǒng)一處理。
4. 發(fā)展穩(wěn)定、可靠的SLAM方法。這里面涉及到很多數(shù)學(xué)問(wèn)題,物理模型建立,狀態(tài)估計(jì)和優(yōu)化。

針對(duì)環(huán)境的描述(地圖),目前各國(guó)研究者已經(jīng)提出了多種表示法,大致可分為三類:柵格表示、幾何信息表示和拓?fù)鋱D表示,每種方法都有自己的優(yōu)缺點(diǎn)。

柵格地圖表示法即將整個(gè)環(huán)境分為若干相同大小的柵格,對(duì)于每個(gè)柵格,各自指出其中是否存在障礙物。這種方法最早由Elfes和Moravec提出,而后Elfes進(jìn)行了進(jìn)一步的研究。優(yōu)點(diǎn)是:(1)創(chuàng)建和維護(hù)容易, (2) 盡量保留了整個(gè)環(huán)境的各種信息, (3)借助于該地圖,可以方便地進(jìn)行自定位和路徑規(guī)劃。而缺點(diǎn)在于:當(dāng)柵格數(shù)量增大時(shí)(在大規(guī)模環(huán)境或?qū)Νh(huán)境劃分比較詳細(xì)時(shí)),對(duì)地圖的維護(hù)行為將變得困難,同時(shí)定位過(guò)程中搜索空間很大,如果沒(méi)有較好的簡(jiǎn)化算法,實(shí)現(xiàn)實(shí)時(shí)應(yīng)用比較困難。

幾何信息地圖表示法是指機(jī)器人收集對(duì)環(huán)境的感知信息,從中提取更為抽象的幾何特征,例如線段或曲線,使用這些幾何信息描述環(huán)境。該表示法更為緊湊,且便于位置估計(jì)和目標(biāo)識(shí)別。幾何方法利用卡爾曼濾波在局部區(qū)域內(nèi)可獲得較高精度,且計(jì)算量小,但在廣域環(huán)境中卻難以維持精確的坐標(biāo)信息。幾何信息的提取需要對(duì)感知信息作額外處理,且需要一定數(shù)量的感知數(shù)據(jù)才能得到結(jié)果。

拓?fù)涞貓D抽象度高,特別在環(huán)境大而簡(jiǎn)單時(shí)。這種方法將環(huán)境表示為一張拓?fù)湟饬x中的圖(Graph),圖中的節(jié)點(diǎn)對(duì)應(yīng)于環(huán)境中的一個(gè)特征狀態(tài)、地點(diǎn)。如果節(jié)點(diǎn)間存在直接連接的路徑則相當(dāng)于圖中連接節(jié)點(diǎn)的弧。優(yōu)點(diǎn)是:(1)有利于進(jìn)一步的路徑和任務(wù)規(guī)劃,(2)存儲(chǔ)和搜索空間都比較小,計(jì)算效率高,(3)可以使用很多現(xiàn)有成熟、高效的搜索和推理算法。缺點(diǎn)在于對(duì)拓?fù)鋱D的使用是建立在對(duì)拓?fù)涔?jié)點(diǎn)的識(shí)別匹配基礎(chǔ)上的,如當(dāng)環(huán)境中存在兩個(gè)很相似的地方時(shí),拓?fù)鋱D方法將很難確定這是否為同一點(diǎn)。

SLAM中定位與環(huán)境特征提取:移動(dòng)機(jī)器人自定位與環(huán)境建模問(wèn)題是緊密相關(guān)的。環(huán)境模型的準(zhǔn)確性依賴于定位精度,而定位的實(shí)現(xiàn)又離不開(kāi)環(huán)境模型。在未知環(huán)境中,機(jī)器人沒(méi)有什么參照物,只能依靠自己并不十分準(zhǔn)確的傳感器來(lái)獲取外界信息,如同一個(gè)盲人在一個(gè)陌生環(huán)境中摸索的情況。這種情況下,定位是比較困難的。有地圖的定位和有定位的地圖創(chuàng)建都是容易解決的,但無(wú)地圖的定位和未解決定位的地圖創(chuàng)建如同"雞--蛋"問(wèn)題,無(wú)從下手。已有的研究中對(duì)這類問(wèn)題的解決方法可分為兩類:一類利用自身攜帶的多種內(nèi)部傳感器(包括里程儀、羅盤(pán)、加速度計(jì)等),通過(guò)多種傳感信息的融合減少定位的誤差,使用的融合算法多為基于卡爾曼濾波的方法。

這類方法由于沒(méi)有參考外部信息,在長(zhǎng)時(shí)間的漫游后誤差的積累會(huì)比較大。另一類方法在依靠?jī)?nèi)部傳感器估計(jì)自身運(yùn)動(dòng)的同時(shí),使用外部傳感器(如激光測(cè)距儀、視覺(jué)等)感知環(huán)境,對(duì)獲得的信息進(jìn)行分析提取環(huán)境特征并保存,在下一步通過(guò)對(duì)環(huán)境特征的比較對(duì)自身位置進(jìn)行校正。但這種方法依賴于能夠取得環(huán)境特征。

環(huán)境特征提取的方法有:
Hough transform,是一類基于灰度圖探察直線和其他曲線的方法。該方法需要一簇能被搜索的預(yù)準(zhǔn)備的特定曲線,并根據(jù)顯示的灰度圖中一簇曲線產(chǎn)生曲線參數(shù)。

Clustering分析是一種數(shù)據(jù)探測(cè)工具,對(duì)于未分類樣例是有效的,同時(shí),它的目標(biāo)就是把所針對(duì)對(duì)象分組成自然類別或基于相似性或距離的簇類。在被提取對(duì)象類別未知的情況中,簇技術(shù)是一類比Hough Transform更有效的技術(shù)。簇類應(yīng)是以"凝聚"為中心,而不是支離破碎的、不相交的。而環(huán)境特征有時(shí)是很難提取出的,例如:
·環(huán)境特征不夠明顯時(shí);
·傳感器信息比較少,難以從一次感知信息中獲得環(huán)境特征。
在未知環(huán)境中,環(huán)境信息的不確定性尤為明顯。對(duì)于不確定信息的描述和處理方法,研究人員已經(jīng)提出了多種用來(lái)處理不確定性的度量方法,如模糊度量、概率度量、信任度量、可能性度量、證據(jù)理論度量等等。目前在SLAM中使用較多的主要是模糊度量和概率度量的方法。

以概率描述信息的不確定性,其優(yōu)點(diǎn)在于:適應(yīng)不確定模型,對(duì)于性能差的傳感器也適用,在實(shí)際應(yīng)用中魯棒性較好,在很多實(shí)現(xiàn)中得到應(yīng)用。缺點(diǎn)是計(jì)算量較大,算法建立在一定假設(shè)條件上,而假設(shè)的合理性有爭(zhēng)議。因此,有些學(xué)者認(rèn)為使用模糊度的描述方法更適合于該任務(wù)。他們認(rèn)為模糊邏輯(fuzzy logic)提供了一個(gè)關(guān)于處理不確定信息更自然的框架,是一個(gè)更為魯棒且有效的工具(尤其對(duì)于聲納感知過(guò)程引起的不確定性)。同時(shí),在對(duì)多種不確定性信息進(jìn)行建模和融合時(shí)有更多的操作符供選擇。



SLAM研究自1988年提出以來(lái),已經(jīng)過(guò)了近三十年。早期SLAM研究側(cè)重于使用濾波器理論。目前SLAM方法大致可分為兩類:一類為基于概率模型的方法,另一類為非概率模型方法。許多基于卡爾曼濾波的SLAM方法如完全SLAM、壓縮濾波、Fast SLAM就屬于概率模型方法。非概率模型方法有SM-SLAM、掃描匹配、數(shù)據(jù)融合(data association)、基于模糊邏輯等。
下圖是一個(gè)典型的卡爾曼濾波的SLAM方法的框圖:



狀態(tài)估計(jì)是卡爾曼濾波的重要組成部分。一般來(lái)說(shuō),根據(jù)觀測(cè)數(shù)據(jù)對(duì)隨機(jī)量進(jìn)行定量推斷就是估計(jì)問(wèn)題,特別是對(duì)動(dòng)態(tài)行為的狀態(tài)估計(jì),它能實(shí)現(xiàn)實(shí)時(shí)運(yùn)行狀態(tài)的估計(jì)和預(yù)測(cè)功能。比如對(duì)飛行器狀態(tài)估計(jì)。狀態(tài)估計(jì)對(duì)于了解和控制一個(gè)系統(tǒng)具有重要意義,所應(yīng)用的方法屬于統(tǒng)計(jì)學(xué)中的估計(jì)理論。最常用的是最小二乘估計(jì),線性最小方差估計(jì)、最小方差估計(jì)、遞推最小二乘估計(jì)等。其他如風(fēng)險(xiǎn)準(zhǔn)則的貝葉斯估計(jì)、最大似然估計(jì)、隨機(jī)逼近等方法也都有應(yīng)用。

受噪聲干擾的狀態(tài)量是個(gè)隨機(jī)量,不可能測(cè)得精確值,但可對(duì)它進(jìn)行一系列觀測(cè),并依據(jù)一組觀測(cè)值,按某種統(tǒng)計(jì)觀點(diǎn)對(duì)它進(jìn)行估計(jì)。使估計(jì)值盡可能準(zhǔn)確地接近真實(shí)值,這就是最優(yōu)估計(jì)。真實(shí)值與估計(jì)值之差稱為估計(jì)誤差。若估計(jì)值的數(shù)學(xué)期望與真實(shí)值相等,這種估計(jì)稱為無(wú)偏估計(jì)??柭岢龅倪f推最優(yōu)估計(jì)理論,采用狀態(tài)空間描述法,在算法采用遞推形式,卡爾曼濾波能處理多維和非平穩(wěn)的隨機(jī)過(guò)程。

卡爾曼濾波理論的提出,克服了威納濾波理論的局限性使其在工程上得到了廣泛的應(yīng)用,尤其在控制、制導(dǎo)、導(dǎo)航、通訊等現(xiàn)代工程方面。



SLAM 技術(shù)涵蓋的范圍非常廣,按照不同的傳感器、應(yīng)用場(chǎng)景、核心算法,SLAM 有很多種分類方法。如果按照傳感器的不同,則可以分為基于激光雷達(dá)的 2D/3D SLAM、基于深度相機(jī)的 RGBD SLAM、基于視覺(jué)傳感器的 visual SLAM(以下簡(jiǎn)稱 vSLAM)、基于視覺(jué)傳感器和慣性單元的 visual inertial odometry(以下簡(jiǎn)稱 VIO)。

基于激光雷達(dá)的 2D SLAM 相對(duì)成熟,早在 2005 年,Sebastian Thrun 等人的經(jīng)典著作《概率機(jī)器人學(xué)》將 2D SLAM 研究和總結(jié)得非常透徹,基本確定了激光雷達(dá) SLAM 的框架。目前常用的 Grid Mapping 方法也已經(jīng)有 10 余年的歷史。2016 年,Google 開(kāi)源了激光雷達(dá) SLAM 程序 Cartographer,可以融合 IMU 信息,統(tǒng)一處理 2D 與 3D SLAM 。目前 2D SLAM 已經(jīng)成功地應(yīng)用于掃地機(jī)器人中。
下圖是2006 年使用激光雷達(dá)生成的某實(shí)驗(yàn)室地圖:



基于深度相機(jī)的 RGBD SLAM 過(guò)去幾年也發(fā)展迅速。自微軟的 Kinect 推出以來(lái),掀起了一波 RGBD SLAM 的研究熱潮,短短幾年時(shí)間內(nèi)相繼出現(xiàn)了幾種重要算法,例如 Kinect Fusion、Kintinuous、Voxel Hashing、Dynamic Fusion 等。微軟的 Hololens 應(yīng)該集成了 RGBD SLAM,在深度傳感器可以工作的場(chǎng)合,它可以達(dá)到非常好的效果。

視覺(jué)傳感器包括單目相機(jī)、雙目相機(jī)、魚(yú)眼相機(jī)等。由于視覺(jué)傳感器價(jià)格便宜,在室內(nèi)室外均可以使用,因此 vSLAM 是研究的一大熱點(diǎn)。早期的 vSLAM 如 monoSLAM 更多的是延續(xù)機(jī)器人領(lǐng)域的濾波方法。現(xiàn)在使用更多的是計(jì)算機(jī)視覺(jué)領(lǐng)域的優(yōu)化方法,具體來(lái)說(shuō),是運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(structure-from-motion)中的光束法平差(bundle adjustment)。在 vSLAM 中,按照視覺(jué)特征的提取方式,又可以分為特征法、直接法。當(dāng)前 vSLAM 的代表算法有 ORB-SLAM、SVO、DSO 等。

視覺(jué)傳感器對(duì)于無(wú)紋理的區(qū)域是沒(méi)有辦法工作的。慣性測(cè)量單元(IMU)通過(guò)內(nèi)置的陀螺儀和加速度計(jì)可以測(cè)量角速度和加速度,進(jìn)而推算相機(jī)的姿態(tài),不過(guò)推算的姿態(tài)存在累計(jì)誤差。視覺(jué)傳感器和 IMU 存在很大的互補(bǔ)性,因此將二者測(cè)量信息進(jìn)行融合的 VIO 也是一個(gè)研究熱點(diǎn)。按照信息融合方式的不同,VIO 又可以分為基于濾波的方法、基于優(yōu)化的方法。VIO 的代表算法有 EKF、MSCKF、preintegration、OKVIS 等。Google 的 Tango 平板就實(shí)現(xiàn)了效果不錯(cuò) VIO。

激光雷達(dá)優(yōu)點(diǎn)是可視范圍廣,但是缺點(diǎn)性價(jià)比低,低成本的雷達(dá)角分辨率不夠高,影響到建模精度。vSLAM的話,缺點(diǎn)就是FOV通常不大,只有50-60 degree,這樣高速旋轉(zhuǎn)時(shí)就容易丟,解決方案就是,做vSLAM跟雷達(dá)還有IMU的組合。總的來(lái)說(shuō),相比于基于激光雷達(dá)和基于深度相機(jī)的 SLAM,基于視覺(jué)傳感器的 vSLAM 和 VIO 還不夠成熟,操作比較難,通常需要融合其他傳感器或者在一些受控的環(huán)境中使用。

我們通過(guò)分析傳感器的測(cè)量信息做個(gè)定性的分析。激光雷達(dá)或者 RGBD 相機(jī)可以直接獲取環(huán)境的點(diǎn)云。對(duì)于點(diǎn)云中的一個(gè)點(diǎn),它告訴我們?cè)谀硞€(gè)方位和距離上存在一個(gè)障礙點(diǎn)。而視覺(jué)傳感器獲取的是灰度圖像或者彩色圖像。對(duì)于圖像中的一個(gè)像素,它只能告訴我們?cè)谀硞€(gè)方位有障礙點(diǎn)、障礙點(diǎn)周?chē)谋碛^(local appearance)如何,但它不能告訴我們這個(gè)障礙點(diǎn)的距離。要想計(jì)算該點(diǎn)的距離,需要把相機(jī)挪動(dòng)一個(gè)位置再對(duì)它觀察一次,然后按照三角測(cè)量的原理進(jìn)行推算。

原理上很清晰,實(shí)際做起來(lái)并不簡(jiǎn)單。首先需要在兩幅圖像中尋找點(diǎn)的對(duì)應(yīng),這涉及到特征點(diǎn)的提取和匹配、或者準(zhǔn)稠密點(diǎn)之間的匹配。計(jì)算機(jī)視覺(jué)發(fā)展到今天,其實(shí)還不存在性能和速度上很好滿足 vSLAM 的特征提取和匹配算法。常見(jiàn)的特征點(diǎn)提取算法,性能上大致可以認(rèn)為SIFT>SURF>ORB>FAST,效率上可以認(rèn)為FAST>ORB>SURF>SIFT(大于號(hào)左邊代表更優(yōu)。性能主要包括匹配精度、特征點(diǎn)的數(shù)量和空間分布等)。為了在性能和效率上取得折中,通常采用 FAST 或者 ORB,只能舍棄性能更好的 SIFT、SURF 等。

其次,匹配點(diǎn)的圖像坐標(biāo)與空間坐標(biāo)之間的關(guān)系是非線性的,例如 2D-2D 點(diǎn)的對(duì)應(yīng)滿足對(duì)極幾何、2D-3D 點(diǎn)的對(duì)應(yīng)滿足 PnP 約束。這些匹配數(shù)量較多,前后兩幀圖像中一般有幾十至數(shù)百的匹配。這些匹配會(huì)引入眾多約束關(guān)系,使得待估計(jì)變量的關(guān)系錯(cuò)綜復(fù)雜。為了得到一個(gè)較優(yōu)的估計(jì),通常需要建立優(yōu)化問(wèn)題,整體優(yōu)化多個(gè)變量。說(shuō)起來(lái)這無(wú)非是一個(gè)非線性最小二乘優(yōu)化問(wèn)題,但實(shí)現(xiàn)起來(lái)并不簡(jiǎn)單,因?yàn)榇嬖诜蔷€性約束、約束數(shù)量很多、存在誤差和野值點(diǎn),并且要將計(jì)算時(shí)間控制在允許范圍。目前廣泛采用關(guān)鍵幀技術(shù),并且通過(guò)很多方法來(lái)控制問(wèn)題規(guī)模、保持問(wèn)題的稀疏性等。

非線性優(yōu)化問(wèn)題可以用下圖來(lái)形象闡述。圓餅代表待優(yōu)化的變量(相機(jī)姿態(tài)、特征點(diǎn)的空間坐標(biāo)),桿子代表約束(對(duì)線幾何、PnP 等)。



前面分析了 vSLAM 的兩個(gè)困難。前者導(dǎo)致了前端的特征跟蹤不易,后者導(dǎo)致了后端的優(yōu)化不易。想做出一個(gè)高效率、魯棒的 vSLAM 系統(tǒng)還是一個(gè)非常有挑戰(zhàn)的任務(wù)。效率方面,SLAM 必須是實(shí)時(shí)運(yùn)行的。如果不能做到實(shí)時(shí),就不能稱作 SLAM。不考慮實(shí)時(shí)性,采用從運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)(structure-from-motion)效果會(huì)更好。魯棒性方面,一個(gè)脆弱的系統(tǒng)會(huì)導(dǎo)致用戶體驗(yàn)很差,功能有限。
下圖是使用structure-from-motion 對(duì)玲瓏塔進(jìn)行三維重建的示例圖:



vSLAM 的核心算法在預(yù)備階段,主要包括傳感器的選型和各種標(biāo)定。Visual SLAM 自 PTAM 算法以來(lái),框架基本趨于固定。通常包括 3 個(gè)線程,前端 tracking 線程、后端 mapping 優(yōu)化線程、閉環(huán)檢測(cè)(loop closure)線程。前端 tracking 線程主要涉及到:特征的提取、特征的匹配;多視圖幾何的知識(shí),包括對(duì)極幾何、PnP、剛體運(yùn)動(dòng)、李代數(shù)等。而后端優(yōu)化線程則涉及到非線性最小二乘優(yōu)化,屬于數(shù)值優(yōu)化的內(nèi)容。閉環(huán)檢測(cè)線程涉及到地點(diǎn)識(shí)別,本質(zhì)上是圖像檢索問(wèn)題。對(duì)于 VIO,還涉及到濾波算法、狀態(tài)估計(jì)等內(nèi)容。

將 SLAM 算法拆解了看,用到的技術(shù)是偏傳統(tǒng)的。與當(dāng)前大熱的深度學(xué)習(xí)「黑箱模型」不同,SLAM 的各個(gè)環(huán)節(jié)基本都是白箱,能夠解釋得非常清楚。但 SLAM 算法并不是上述各種算法的簡(jiǎn)單疊加,而是一個(gè)系統(tǒng)工程,里面有很多 tradeoff。如果僅僅跑跑開(kāi)源程序,沒(méi)有什么核心競(jìng)爭(zhēng)力。不論是做產(chǎn)品還是做學(xué)術(shù)研究,都應(yīng)當(dāng)熟悉各種技術(shù),才能有所創(chuàng)造。

VSLAM 的發(fā)展目前來(lái)看,感覺(jué)是中規(guī)中矩,各個(gè)環(huán)節(jié)在前人的基礎(chǔ)上一點(diǎn)點(diǎn)優(yōu)化,同時(shí)不斷吸收其他方向的最新成果。短期內(nèi)肯定會(huì)在現(xiàn)有框架下不停地改進(jìn)。至于長(zhǎng)遠(yuǎn)一些的趨勢(shì),IEEE TRO 2016 有一篇綜述文章 Past, present,and future of SLAM: Towards the robust-perception age。幾位有聲望的學(xué)者在文中對(duì) SLAM 的趨勢(shì)做了非常好的總結(jié)。

新型傳感器的出現(xiàn)會(huì)不停地為 SLAM 注入活力。如果我們能夠直接獲取高質(zhì)量的原始信息,SLAM 的運(yùn)算壓力就可以減輕很多。舉例來(lái)說(shuō),近幾年在 SLAM 中逐漸有使用低功耗、高幀率的 event camera(又稱 dynamic vision system, DVS)。如果這類傳感器的成本能降下來(lái),會(huì)給 SLAM 的技術(shù)格局帶來(lái)許多變化。

自從深度學(xué)習(xí)在諸多領(lǐng)域所向披靡,不少研究者試圖用深度學(xué)習(xí)中 end-to-end 的思想重構(gòu) SLAM 的流程。目前有些工作試圖把 SLAM 的某些環(huán)節(jié)用深度學(xué)習(xí)代替。不過(guò)這些方法沒(méi)有體現(xiàn)出壓倒性優(yōu)勢(shì),傳統(tǒng)的幾何方法依然是主流。在深度學(xué)習(xí)的熱潮之下,SLAM 涉及的各個(gè)環(huán)節(jié)應(yīng)該會(huì)逐漸吸收深度學(xué)習(xí)的成果,精度和魯棒性也會(huì)因此提升。也許將來(lái) SLAM 的某些環(huán)節(jié)會(huì)整體被深度學(xué)習(xí)取代,形成一個(gè)新的框架。

SLAM 原本只關(guān)注環(huán)境的幾何信息,未來(lái)跟語(yǔ)義信息應(yīng)該有更多的結(jié)合。借助于深度學(xué)習(xí)技術(shù),當(dāng)前的物體檢測(cè)、語(yǔ)義分割的技術(shù)發(fā)展很快,可以從圖像中可以獲得豐富的語(yǔ)義信息。這些語(yǔ)義信息是可以輔助推斷幾何信息的,例如已知物體的尺寸就是一個(gè)重要的幾何線索。

因?yàn)橛?jì)算機(jī)視覺(jué)技術(shù)的快速發(fā)展,攝像頭和激光雷達(dá)成本的降低,SLAM正在AR、機(jī)器人、無(wú)人機(jī)、無(wú)人駕駛等領(lǐng)域火速入侵,用夸張點(diǎn)的說(shuō)法,就像移動(dòng)互聯(lián)網(wǎng)時(shí)代的手機(jī)地圖定位一樣,只要是跟位置相關(guān)的應(yīng)用,誰(shuí)拋棄了這張地圖,誰(shuí)將拋棄了自己的未來(lái)。
1. 無(wú)人駕駛汽車(chē)
因?yàn)镚oogle無(wú)人駕駛車(chē)的科普,很多人都知道了基于激光雷達(dá)技術(shù)的Lidar Slam。Lidar Slam是指利用激光雷達(dá)作為外部傳感器,獲取地圖數(shù)據(jù),使機(jī)器人實(shí)現(xiàn)同步定位與地圖構(gòu)建。雖然成本高昂,但目前為止是最穩(wěn)定、最可靠、高性能的SLAM方式。



自動(dòng)(無(wú)人)駕駛一般用組合定位,首先本體感受傳感器如里程計(jì)(Odometry)、陀螺儀(Gyroscopes)等,通過(guò)給定初始位姿,來(lái)測(cè)量相對(duì)于機(jī)器人初始位姿的距離和方向來(lái)確定當(dāng)前機(jī)器人的位姿,也叫做航跡推測(cè)。然后用激光雷達(dá)或視覺(jué)感知環(huán)境,用主動(dòng)或被動(dòng)標(biāo)識(shí)、地圖匹配、GPS、或?qū)Ш叫艠?biāo)進(jìn)行定位。位置的計(jì)算方法包括有三角測(cè)量法、三邊測(cè)量法和模型匹配算法等。從這個(gè)角度而言,IMU也是自動(dòng)駕駛必備的部件。

2. 室內(nèi)機(jī)器人
掃地機(jī)要算機(jī)器人里最早用到SLAM技術(shù)這一批了,國(guó)內(nèi)的科沃斯、塔米掃地機(jī)通過(guò)用SLAM算法結(jié)合激光雷達(dá)或者攝像頭的方法,讓掃地機(jī)可以高效繪制室內(nèi)地圖,智能分析和規(guī)劃掃地環(huán)境,從而成功讓自己步入了智能導(dǎo)航的陣列。



3. AR/VR
目前基于SLAM技術(shù)開(kāi)發(fā)的代表性產(chǎn)品有微軟的Hololens,谷歌的Project Tango以及同樣有名的Magic Leap,很多VR應(yīng)用需要用到SLAM技術(shù),定位只是一個(gè)feature,路徑記錄、3D重構(gòu)、地圖構(gòu)建都可以是SLAM技術(shù)的輸出。根據(jù) SLAM 得到地圖和當(dāng)前視角對(duì)疊加虛擬物體做相應(yīng)渲染,這樣做可以使得疊加的虛擬物體看起來(lái)比較真實(shí),沒(méi)有違和感。

4. 無(wú)人機(jī)
國(guó)內(nèi)大家非常熟悉的大疆精靈四避障用的雙目視覺(jué)+超聲波。P4里面呈現(xiàn)的主動(dòng)避障功能就是一種非常非常典型的Slam的弱應(yīng)用,可以使用 SLAM 構(gòu)建局部地圖,輔助無(wú)人機(jī)進(jìn)行自主避障、規(guī)劃路徑。無(wú)人機(jī)只需要知道障礙物在哪,就可以進(jìn)行Planning,并且繞開(kāi)障礙物。當(dāng)然Slam能做的事情遠(yuǎn)遠(yuǎn)不止這些,包括災(zāi)區(qū)救援,包括探洞,包括人機(jī)配合甚至集群,所有的關(guān)于無(wú)人機(jī)的夢(mèng)想都建立在Slam之上,這是無(wú)人機(jī)能飛(具有定位,姿態(tài)確定以后)的時(shí)代以后,無(wú)人機(jī)最核心的技術(shù)。


分享到:
 
反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0
滬ICP備11026917號(hào)-25