7月1日—2日,由蓋世汽車主辦的“2021第四屆全球自動(dòng)駕駛論壇” 于上海隆重召開(kāi)。本次論壇主要聚焦自動(dòng)駕駛關(guān)鍵技術(shù),如自動(dòng)駕駛感知、智能駕駛域控制器、芯片、計(jì)算平臺(tái)、無(wú)人駕駛不同的落地場(chǎng)景等話題展開(kāi)討論,以促進(jìn)自動(dòng)駕駛相關(guān)技術(shù)進(jìn)一步發(fā)展、完善。下面是滴滴自動(dòng)駕駛公司首席技術(shù)官 韋峻青在本次大會(huì)上的發(fā)言。
滴滴自動(dòng)駕駛公司首席技術(shù)官韋峻青
非常感謝周總和蓋世汽車的邀請(qǐng),今天很高興有機(jī)會(huì)跟大家分享一下滴滴自動(dòng)駕駛最近的進(jìn)展以及思考。
剛才鄭總從總攬方面指出了我們自動(dòng)駕駛還是很有希望的,當(dāng)然也指出了落地的挑戰(zhàn)和困難,其實(shí)滴滴為了應(yīng)對(duì)這些挑戰(zhàn)和困難,做了一些技術(shù)的儲(chǔ)備,以及從總軟件到硬件的規(guī)劃。
首先我們認(rèn)為自動(dòng)駕駛確實(shí)是一個(gè)非常非常難的工程。我們已經(jīng)完成了99%的工作,可能還有99%的工作要做。首先非常難的點(diǎn)是我國(guó)長(zhǎng)尾問(wèn)題或者邊緣場(chǎng)景,對(duì)于單個(gè)司機(jī)來(lái)說(shuō),這些場(chǎng)景可能遇到幾率并不高,可能一年就遇到一次,但是滴滴的網(wǎng)絡(luò)有百萬(wàn)輛車,將來(lái)自動(dòng)駕駛到來(lái)的時(shí)候,大量車輛會(huì)是自動(dòng)化的,在這個(gè)情況下,我們的車隊(duì)遇到這些場(chǎng)景的概率就很高了,而且我們需要對(duì)這些場(chǎng)景進(jìn)行安全的處理,這就為我們就提出了一個(gè)數(shù)據(jù)的挑戰(zhàn)以及場(chǎng)景的挑戰(zhàn)。
另外我們?cè)谙?,現(xiàn)在的算法能不能應(yīng)對(duì)這些場(chǎng)景?比如說(shuō)PT公開(kāi)的數(shù)據(jù),大家在車輛檢測(cè)方向上檢測(cè)模型精度有多少誤檢,有多少漏檢。大家可以看到距離比較遠(yuǎn)或者遮擋比較多的情況下能做到75-80%檢測(cè)精度就已經(jīng)非常不錯(cuò)了,對(duì)于自動(dòng)駕駛車來(lái)說(shuō),只有70%能檢測(cè)到它,那怎么能做到更準(zhǔn)確的判斷和更安全的駕駛,這是一個(gè)非常難的挑戰(zhàn)。
總結(jié)下來(lái),最終從有安全員的自動(dòng)駕駛到無(wú)安全員的自動(dòng)駕駛,之間還有很長(zhǎng)的路要走,尤其對(duì)無(wú)安全員自動(dòng)駕駛的量產(chǎn),這是一個(gè)有挑戰(zhàn)性的話題,當(dāng)然這個(gè)市場(chǎng)挑戰(zhàn)也很大,包括滴滴在內(nèi)我們都在持續(xù)加大這方面的投入,希望有所突破。
今天主要講兩個(gè)方面,一方面是從人工智能角度怎么提升算法(Improve AI),這是一個(gè)人才的競(jìng)爭(zhēng),也是方法論數(shù)據(jù)的競(jìng)爭(zhēng)。另一方面是怎么從硬件角度以及系統(tǒng)設(shè)計(jì)角度把自動(dòng)駕駛的問(wèn)題相對(duì)降維來(lái)解決,能夠加速自動(dòng)駕駛量產(chǎn)落地。
首先從AI角度看,自動(dòng)駕駛最核心的是場(chǎng)景庫(kù),我們?cè)跍y(cè)試中發(fā)現(xiàn)很多基礎(chǔ)的素材。比如說(shuō)我們遇到一些逆行的車輛需要躲避,通過(guò)感知的算法可以把它三維重構(gòu)成一個(gè)虛擬場(chǎng)景,我們用這個(gè)場(chǎng)景編輯器和基于AI泛化功能加入到驗(yàn)證自動(dòng)駕駛算法的工具鏈里面,現(xiàn)在這套體系在滴滴自動(dòng)駕駛完全打通。比如說(shuō)這個(gè)工程師專門針對(duì)躲避這一個(gè)場(chǎng)景,它會(huì)有更詳細(xì)的仿真列表,有幾萬(wàn)到10萬(wàn)的案例都是基于路上實(shí)際情況進(jìn)行泛化。
另外我想跟大家探討的是DIDI Gemini(雙子星平臺(tái))。在AI提升比較線性的條件下,能夠指數(shù)性提升自動(dòng)駕駛安全性,所以滴滴在上海車展跟沃爾沃一起發(fā)布了基于XC90的雙子星滴滴自動(dòng)駕駛系統(tǒng),包含升級(jí)的硬件系統(tǒng)架構(gòu)以及在上面搭載滴滴自動(dòng)駕駛軟件,大家很快會(huì)在上海安亭看到搭載這套平臺(tái)的新車輛,也會(huì)作為滴滴未來(lái)一兩年主力研發(fā)自動(dòng)駕駛的平臺(tái)。其中有三點(diǎn)布局:硬件升級(jí),安全層,人車交互。
從硬件升級(jí)的角度,我們希望通過(guò)新一代硬件大幅提升算法的表現(xiàn)。另外一個(gè)想法是因?yàn)長(zhǎng)3廣泛的部署,高性能量級(jí)價(jià)格在下降,在這個(gè)情況下,我們覺(jué)得硬件升級(jí)比我們現(xiàn)在速度快很多,對(duì)未來(lái)預(yù)測(cè)硬件性能也會(huì)有量級(jí)上的上升,成本會(huì)有量級(jí)的下降。
從感知能力上來(lái)講,我們覺(jué)得感知能力很久沒(méi)有突破了,就一直穩(wěn)定在75%的準(zhǔn)確率,怎么辦呢?我們同時(shí)比較了一下,藍(lán)色線是公開(kāi)數(shù)據(jù)集的數(shù)字,這是Hard的案例,如果變成Easy,比如說(shuō)看到激光雷達(dá)點(diǎn)更多,那明顯它的錯(cuò)誤率就可能從25%降到10%,所以我們覺(jué)得硬件提升很直觀可以帶來(lái)自動(dòng)駕駛感知性能的提升。感知性能提升又會(huì)帶來(lái)預(yù)測(cè)的提升。
我們?cè)诓季值臅r(shí)候希望這個(gè)車首先可以在非常近的最小探測(cè)距離保證沒(méi)有盲區(qū),即使是一個(gè)磚頭或者一個(gè)球在車下面也可以檢測(cè)到。另外我們希望能看到很遠(yuǎn)的物體,比如說(shuō)兩三百米外靜止的卡車,這樣可以讓車很早作出更聰明的決策
最主要是升級(jí)我們的激光雷達(dá),配備128線激光雷達(dá),它的分辨率是0.1×0.1,比其大部分自動(dòng)駕駛公司目前所使用的激光雷達(dá)提升了大概6倍分辨率,對(duì)我們算法來(lái)講,如果在150米外有一個(gè)車,之前我們只能看到5個(gè)像素點(diǎn),現(xiàn)在能看到30個(gè),那我們是能夠分辨這個(gè)車,并且在近距離進(jìn)行了補(bǔ)盲,所以可以看到離車非常非常近的物體。
我們使用了800萬(wàn)象素的攝像頭,而且我們用了12個(gè)800萬(wàn)象素色相,首先有對(duì)車360度全覆蓋,另外在非常重要的角度,比如說(shuō)前向180還用了更窄角度的鏡頭,對(duì)于特殊的場(chǎng)景,比如說(shuō)紅綠燈,將來(lái)對(duì)于人類臉的朝向和手勢(shì)都能進(jìn)行識(shí)別,這樣為我們將來(lái)預(yù)測(cè)這個(gè)人的行為是什么樣提供了數(shù)據(jù)輸入。只有有了這些信息,AI才能夠利用這些信息輔助自動(dòng)駕駛決策,提升它的安全性。
兩點(diǎn)提升,分辨率提升是非常明顯的,比如說(shuō)在100米外之前對(duì)紅綠燈的識(shí)別準(zhǔn)確率是99.9%,主要原因是,有時(shí)候在非常遠(yuǎn)的距離,看到像素點(diǎn)比較少所以很容易跟其他的東西,比如說(shuō)光線受這些遮擋的影響。現(xiàn)在在同樣距離可以看到的信息量多很多,所以對(duì)于YI算法來(lái)說(shuō)其實(shí)是容易了很多,并且安全性也提升了很多,冗余性也提升了很多,哪怕它被遮擋,我們也知道它被遮擋,而不是因?yàn)槠渌脑颉?/p>
另外在相機(jī)領(lǐng)域,因?yàn)槲覀円肓烁咝阅艿膫鞲衅?,所以逆光、夜間條件下的性能都會(huì)提升很多。比如說(shuō)三四年前使用的工業(yè)級(jí)相機(jī)夜間看得是很模糊的,現(xiàn)在相機(jī)有了SDR技術(shù),不管是逆光,還是夜間都能夠非常清晰看到這些圖像。只有看到這些圖像感知算法才能夠得到提升。另外就是算力,現(xiàn)在大家都在講GPU算力,我們用了英偉達(dá)的平臺(tái),提供了700TOPS GPU算力。對(duì)于無(wú)人駕駛出租車來(lái)說(shuō),另外一點(diǎn)關(guān)注的是CPU算力,因?yàn)榇罅繑?shù)據(jù)需要CPU處理,我們有很多算法并行了很多CPU線程在跑,所以會(huì)有2-3倍的提升。怎么把這些數(shù)據(jù)都接入,這里有每秒40Gb傳感器數(shù)據(jù)接入,并且用水冷方案,這也為自動(dòng)駕駛提供了最高可行的算力。
這么高算力的平臺(tái)怎么量產(chǎn)呢?我們認(rèn)為在未來(lái)兩三年這套平臺(tái)算力會(huì)提升3-5倍,但是價(jià)格會(huì)下降到小幾千美元量級(jí),我們也和供應(yīng)商一起探討溝通認(rèn)為這個(gè)是完全可行的,主要因?yàn)長(zhǎng)3快速的發(fā)展,加速了高算力平臺(tái)產(chǎn)品化。
我們還在這里部署了很多小的系統(tǒng),這里講的是傳感器清潔系統(tǒng),所有攝像機(jī)、傳感雷達(dá)都有噴水解決方案用于清潔,我們也在研究對(duì)于攝像頭持續(xù)性的一直噴氣,使其表面形成一層膜,這樣水滴不容易落上去,還有對(duì)水冷系統(tǒng)的加熱及冷卻,我們都做了非常深入的研究。
滴滴除了在軟件和AI方面有了比較深入的規(guī)劃和研究,我們也覺(jué)得硬件能夠加入自動(dòng)駕駛量產(chǎn)化和安全的落地。另外對(duì)于仿真、對(duì)于地圖、對(duì)于軟件和開(kāi)發(fā)工具、管理工具、遠(yuǎn)程協(xié)助基礎(chǔ)模塊開(kāi)發(fā),至少有一半精力投入在這里。
下面跟大家介紹一下新引入的自動(dòng)駕駛安全層概念。我們覺(jué)得自動(dòng)駕駛到最后落地非常值得參考的就是航空系統(tǒng)的安全設(shè)計(jì)。當(dāng)然已經(jīng)有一些功能安全的標(biāo)準(zhǔn)覆蓋了這方面的內(nèi)容。從飛機(jī)來(lái)講,比如說(shuō)液壓/燃油/電氣/引擎都是有冗余的,同時(shí)決策系統(tǒng)機(jī)長(zhǎng)和副駕駛也是有冗余的,所以我們建立了安全漏洞模型,希望面對(duì)非常少見(jiàn),但是又重要的危險(xiǎn)場(chǎng)景,我們能夠在三個(gè)方向上有布局。
1、系統(tǒng)異常,它對(duì)應(yīng)的是車載行業(yè)的功能安全,主要應(yīng)對(duì)的是硬件故障和傳播故障。2、中間著重研究的是跟場(chǎng)景相關(guān)叫做預(yù)期功能安全,如果我的車設(shè)計(jì)在小雨天氣可以駕駛,現(xiàn)在忽然下了大雨怎么辦?它有超出我設(shè)計(jì)算法的情況。3、怎么應(yīng)對(duì)在自動(dòng)駕駛到來(lái)之后的網(wǎng)絡(luò)攻擊。
首先在主系統(tǒng)里面,自動(dòng)駕駛感知決策能處理99.99%系統(tǒng)里面有相應(yīng)的冗余,比如說(shuō)一個(gè)攝像頭故障或者遮擋,整個(gè)系統(tǒng)功能不應(yīng)該受到影響,如果受到影響我們就會(huì)降級(jí),降級(jí)到用冗余系統(tǒng)來(lái)處理,冗余系統(tǒng)讓它靠邊停車或者減速,它是獨(dú)立于主系統(tǒng)的。再往下是在執(zhí)行機(jī)構(gòu)上,包括緊急剎車方向上做到了執(zhí)行器的冗余,這樣保證在絕大部分場(chǎng)景,可以安全的把車停下來(lái)。在停下來(lái)之后有遠(yuǎn)程協(xié)助和遠(yuǎn)程控制的功能幫助這個(gè)車脫困,這個(gè)我們叫遠(yuǎn)程護(hù)航。對(duì)于滴滴的網(wǎng)絡(luò),如果說(shuō)出現(xiàn)了遠(yuǎn)程協(xié)助也沒(méi)法解決的困難,比如說(shuō)車的輪胎爆了,那么我們也會(huì)部署道路救援。
感知系統(tǒng)冗余,剛才我們講了我們有激光雷達(dá),毫米波雷達(dá)和攝像頭三種方式。舉個(gè)例子,我們?cè)谶@一套雙子星平臺(tái)上,前向最重要的區(qū)域如果有一個(gè)行人,我們有12個(gè)傳感器可以看到這個(gè)行人,包括多個(gè)激光雷達(dá),多個(gè)攝像頭,多個(gè)毫米波雷達(dá),并且有一套完全獨(dú)立于主系統(tǒng)的感知。在決策方面,如果主系統(tǒng)確實(shí)遇到了一些挑戰(zhàn),比如說(shuō)所有激光雷達(dá)都失效了,或者被覆蓋或者下了很大的雨,這種情況下,功能范圍更強(qiáng)的冗余系統(tǒng)會(huì)接入相對(duì)安全的把車帶到一個(gè)最小的風(fēng)險(xiǎn)狀態(tài),比如說(shuō)減速式停車,它是完全獨(dú)立的傳感器和控制器,并且配備車的執(zhí)行系統(tǒng),有很多實(shí)時(shí)故障的檢測(cè),包括轉(zhuǎn)向,通過(guò)功能安全拆解都要達(dá)到最高級(jí)SOD標(biāo)準(zhǔn)。
除了系統(tǒng)級(jí)的冗余,在里面我們也部署了跟遠(yuǎn)程的接口,剛才說(shuō)了這個(gè)車可以安全的停下來(lái),停下來(lái)之后自動(dòng)駕駛會(huì)提供遠(yuǎn)程操作中心,幫助車輛脫困。這里有兩種幫助方式,一種是人類遠(yuǎn)程操縱者判斷情形,比如說(shuō)要不要超車?如果是警車,我們可以判斷警察的意圖,遠(yuǎn)程人類輔助判斷。第二種是低速狀態(tài)下的遠(yuǎn)程駕駛,通過(guò)人工智能來(lái)幫助自動(dòng)駕駛;最后是道路救援。
第三個(gè)是人車交互。這是我們?cè)谶@一代車?yán)锩娌渴鹑藱C(jī)交互的系統(tǒng),首先它的功能是可以提示用戶,自動(dòng)駕駛車來(lái)了。它還可以告訴周圍的駕駛員,比如說(shuō)車在緩慢行駛繞過(guò)一些障礙物的時(shí)候,可以告訴他們,為什么我們要減速?尤其對(duì)于行人在人行道,有時(shí)候人類司機(jī)會(huì)閃雙閃或者打手勢(shì)。最后我們也可以告訴大家我們的行駛狀態(tài),通過(guò)這個(gè)可以降低自動(dòng)駕駛?cè)谌肴祟愸{駛為主車流的難度。
最后我們滴滴認(rèn)為“安全是合規(guī)量產(chǎn)的基石”,我們會(huì)持續(xù)在這里面布局,我們覺(jué)得自動(dòng)駕駛安全落地的能力包括三個(gè)主要的領(lǐng)域:技術(shù),安全,運(yùn)營(yíng)。它包含了在什么地方部署自動(dòng)駕駛是安全的,在什么地方部署是有商業(yè)價(jià)值的,通過(guò)滴滴運(yùn)營(yíng)數(shù)據(jù)可以了解到。對(duì)于自動(dòng)駕駛來(lái)說(shuō),哪些區(qū)域遮擋更厲害,哪些區(qū)域左轉(zhuǎn)比較多,把這三張地圖疊加在一起,選擇最適合自動(dòng)駕駛的區(qū)域和路線,配合它的混合派單模式,一個(gè)客戶不可能先去看這個(gè)區(qū)域適不適合自動(dòng)駕駛再叫車,所以滴滴把自動(dòng)駕駛和人工接駕混合派單。他們的體驗(yàn)就是如果你叫一個(gè)自動(dòng)駕駛車,也可以正常打滴滴的車,如果這路線有自動(dòng)駕駛車服務(wù),并且沒(méi)有雨雪冰雹天氣就可以派一個(gè)自動(dòng)駕駛車接駁,如果超出這個(gè)區(qū)域就會(huì)用人類駕駛車接駁。我們現(xiàn)在有40輛車在測(cè)試區(qū)域運(yùn)行超過(guò)530公里,測(cè)試時(shí)間每天12.5小時(shí)。
其實(shí)自動(dòng)駕駛還是一個(gè)對(duì)社會(huì)有很大正面影響,但非常難的工程,所以需要幾方面的配合。作為自動(dòng)駕駛技術(shù)公司和滴滴出行網(wǎng)絡(luò),我們也希望和一些車企和供應(yīng)商深度合作,目前我們也和清華大學(xué)成立了聯(lián)合實(shí)驗(yàn)室,在研究一些前瞻性的話題,最后我們也希望有法律法規(guī)盡快的落地,這樣能夠保證大家在未來(lái)幾年體驗(yàn)到真正無(wú)人化量產(chǎn)的落地。
今天跟大家分享的就是這些,謝謝。