蓋世汽車訊 自動(dòng)駕駛汽車激光雷達(dá)傳感器的工作原理是發(fā)送紅外光脈沖,并測量它們從物體反射回來所需的時(shí)間,從而創(chuàng)建3D點(diǎn)地圖,作為汽車周圍環(huán)境的圖像。
(圖片來源:MIT Computer Science & Artificial Intelligence Lab)
激光雷達(dá)的缺點(diǎn)之一是其3D數(shù)據(jù)量巨大,而且是計(jì)算密集型的。例如,典型的64通道傳感器每秒產(chǎn)生超過200萬個(gè)點(diǎn)。與2D圖像相比,在進(jìn)行推斷時(shí),由于額外的空間維度,最先進(jìn)的3D模型需要多14倍的計(jì)算,因此,為了有效地導(dǎo)航,工程師必須首先將數(shù)據(jù)分解為2D,但此種方法會(huì)導(dǎo)致大量信息丟失。
據(jù)外媒報(bào)道,麻省理工學(xué)院的團(tuán)隊(duì)一直在研究使用機(jī)器學(xué)習(xí)的自動(dòng)駕駛系統(tǒng),旨在無需進(jìn)行自定義手動(dòng)調(diào)節(jié)。研究人員開發(fā)的新的端到端框架僅使用原始的3D點(diǎn)云數(shù)據(jù)和低分辨率GPS地圖,就能自動(dòng)導(dǎo)航,類似于目前智能手機(jī)中的功能。
由于涉及到為計(jì)算機(jī)提供大量豐富的感知信息來學(xué)習(xí)如何駕駛,因此根據(jù)原始激光雷達(dá)數(shù)據(jù)進(jìn)行端到端學(xué)習(xí)是一個(gè)計(jì)算密集型的過程。為此,該團(tuán)隊(duì)必須設(shè)計(jì)新的深度學(xué)習(xí)組件,更有效地利用現(xiàn)代GPU(圖形處理單元)硬件,以便實(shí)時(shí)控制車輛。
博士生Zhijian Liu表示,“我們從算法和系統(tǒng)方面優(yōu)化了我們的解決方案,與現(xiàn)有的3D激光雷達(dá)方法相比,達(dá)到了大約9倍的累積加速?!睖y試顯示,新系統(tǒng)減少了人類駕駛員從機(jī)器上接管控制權(quán)的頻率,甚至可以承受嚴(yán)重的傳感器故障。
人們開車穿過隧道,然后出現(xiàn)在陽光下,一瞬間,人眼可能會(huì)因?yàn)閺?qiáng)光而看不清。自動(dòng)駕駛汽車攝像頭,以及天氣條件較差時(shí),自動(dòng)駕駛系統(tǒng)的激光雷達(dá)傳感器都會(huì)出現(xiàn)類似的問題。針對這一問題,麻省理工學(xué)院團(tuán)隊(duì)的系統(tǒng)可以估計(jì)其對任何給定預(yù)測的確定程度,因此在制定決策時(shí),可以權(quán)衡該預(yù)測。(在從隧道出來的情況下,該系統(tǒng)基本上會(huì)無視由于傳感器數(shù)據(jù)不準(zhǔn)確而導(dǎo)致的不可信的預(yù)測。)
該團(tuán)隊(duì)稱其方法為“混合證據(jù)融合”,因?yàn)樗鼘⒉煌目刂祁A(yù)測融合在一起,從而得出運(yùn)動(dòng)規(guī)劃選項(xiàng)。麻省理工學(xué)院教授Daniela Rus稱,“根據(jù)模型的不確定性,融合控制預(yù)測,系統(tǒng)可以適應(yīng)意外事件?!?/p>
在很多方面,該系統(tǒng)本身是麻省理工學(xué)院此前的三個(gè)項(xiàng)目的融合:
MapLite:手動(dòng)調(diào)整框架,用于在沒有高清3D地圖的情況下駕駛;
variational end-to-end navigation可變端到端導(dǎo)航:機(jī)器學(xué)習(xí)系統(tǒng),使用人類駕駛數(shù)據(jù)進(jìn)行訓(xùn)練,學(xué)習(xí)如何從零開始導(dǎo)航;
SPVNAS:高效的3D深度學(xué)習(xí)解決方案,優(yōu)化了神經(jīng)架構(gòu)和推理庫。
研究人員Alexander Amini表示,“我們利用無地圖駕駛的優(yōu)勢,并將其與端到端機(jī)器學(xué)習(xí)相結(jié)合,因此不需要專業(yè)程序員手動(dòng)調(diào)整系統(tǒng)?!毕乱徊?,該團(tuán)隊(duì)計(jì)劃繼續(xù)擴(kuò)展該系統(tǒng),增加現(xiàn)實(shí)世界的復(fù)雜性,包括不利的天氣條件,以及與其他車輛的動(dòng)態(tài)交互。