中外企業(yè)均在搶占自動(dòng)駕駛各層面技術(shù)的標(biāo)準(zhǔn)制定和話語權(quán)。
“現(xiàn)在自動(dòng)駕駛很火,火到什么程度?簡(jiǎn)單來說就是燒錢。”
根據(jù)The Information發(fā)布最新研究稱,投入自動(dòng)駕駛戰(zhàn)場(chǎng)的各家公司已經(jīng)累計(jì)花掉了約160億美元。需要注意的是,這160億美元還沒算上為了自動(dòng)駕駛布局而發(fā)生的并購(gòu)。舉例來說,英特爾買下Mobileye花掉的153億美元就不算在其中。
眾所周知,自動(dòng)駕駛技術(shù)相當(dāng)復(fù)雜,想要實(shí)現(xiàn)商用,花費(fèi)的時(shí)間和成本對(duì)于任何一家車企或者科技公司來說都是巨大的,這些投資想要得到回報(bào)則需要更長(zhǎng)的時(shí)間。而且自動(dòng)駕駛所謂的商業(yè)化,還在探索當(dāng)中。無論是推出RoboTaxi服務(wù)的Waymo One,或者是Nuro與Kroger合作的生鮮配送,又或者是安波福和Lyft推出的乘車服務(wù)等等。
那么,為了打破各家企業(yè)各自為戰(zhàn)的局面,一些企業(yè)彼此開始嘗試開放有價(jià)值的自動(dòng)駕駛數(shù)據(jù)集,以加快自動(dòng)駕駛技術(shù)的提升,從而推動(dòng)自動(dòng)駕駛行業(yè)的發(fā)展。去年,谷歌母公司Alphabet旗下自動(dòng)駕駛公司W(wǎng)aymo公開了一部分開放數(shù)據(jù)集Waymo Open Dataset;近期福特也悄悄發(fā)布了其自動(dòng)駕駛汽車數(shù)據(jù)集。
這兩家自動(dòng)駕駛公司,是目前公認(rèn)的在全球自動(dòng)駕駛研究排名前列的企業(yè)。對(duì)于自動(dòng)駕駛行業(yè)其他從業(yè)者而言,有了公開的數(shù)據(jù)集,他們能在一定程度上免去重復(fù)的資源投入。研發(fā)人員可以利用這些數(shù)據(jù)集來幫助開發(fā)自動(dòng)駕駛汽車的感知算法,有助于推動(dòng)其研發(fā)進(jìn)程。實(shí)際上,這也是一場(chǎng)自動(dòng)駕駛行業(yè)領(lǐng)導(dǎo)者地位的爭(zhēng)奪。
什么樣的數(shù)據(jù)有價(jià)值?
自動(dòng)駕駛汽車每天可以收集4TB或更多的原始傳感器數(shù)據(jù),直到現(xiàn)在,自動(dòng)駕駛公司收集的數(shù)據(jù)還是公司的高度機(jī)密。但是近幾年,自動(dòng)駕駛領(lǐng)域的各路參與者,在開源數(shù)據(jù)集共享這件事上頗為“大方”。
在福特的自動(dòng)駕駛數(shù)據(jù)集發(fā)布之前,Lyft 此前也開源了自己的數(shù)據(jù)集用于自動(dòng)駕駛汽車開發(fā)。其他開放此類的數(shù)據(jù)還包括nuScenes、Mapillary Vistas的街道圖像集、加拿大不利駕駛條件(CADC)、KITTI用于自動(dòng)駕駛的研究;以及戴姆勒、馬克斯·普朗克(Max Planck)信息學(xué)研究所和達(dá)姆施塔特工業(yè)大學(xué)(TU Darmstadt)視覺推斷小組開發(fā)和維護(hù)的Cityscapes數(shù)據(jù)集。
不過問題在于,過去相關(guān)研究人員創(chuàng)建和發(fā)布的數(shù)據(jù)集相對(duì)較小,通常僅限于攝像頭數(shù)據(jù)。雖然,安波福發(fā)布的NuScenes數(shù)據(jù)集除圖像外還包括激光雷達(dá)的雷達(dá)數(shù)據(jù),Waymo和Argo發(fā)布的版本會(huì)更進(jìn)一步。Waymo聲稱擁有3,000個(gè)場(chǎng)景,是NuScenes提供的場(chǎng)景的三倍,并且攝像頭和激光雷達(dá)信息之間的同步更好。
雖然由自動(dòng)駕駛測(cè)試生成的所有數(shù)據(jù)對(duì)于車輛感知其周圍環(huán)境,并在整個(gè)過程中都是有用的,但實(shí)際上只有其中的特定部分對(duì)開發(fā)和改進(jìn)系統(tǒng)有用。比如在典型城市街道上一天的測(cè)試中,車輛中的工程師和技術(shù)人員會(huì)選擇性的記錄發(fā)生細(xì)微變化或具有挑戰(zhàn)性的場(chǎng)景。也就是說自動(dòng)駕駛數(shù)據(jù)集需要更加多樣和精細(xì)化,對(duì)從業(yè)人員來說才有利用價(jià)值。
福特此次公開的自動(dòng)駕駛數(shù)據(jù)集,是工程師駕駛配備了四個(gè)四核英特爾i7處理器和16GB RAM的汽車,往返底特律大都會(huì)機(jī)場(chǎng)、密歇根大學(xué)迪爾伯恩分校、高速公路、市中心和郊區(qū)等地區(qū)共行駛了約66公里。其數(shù)據(jù)主要由4個(gè)激光雷達(dá)傳感器、6個(gè)130萬像素?cái)z像頭、1個(gè)500萬像素?cái)z像頭和1個(gè)慣性測(cè)量單元,通過路況的細(xì)微變化來捕獲多樣化的數(shù)據(jù)。
一般而言,在測(cè)試結(jié)束時(shí),所有數(shù)據(jù)都將從車輛中提取到數(shù)據(jù)中心,并對(duì)有益的數(shù)據(jù)進(jìn)行分析和標(biāo)記。原始數(shù)據(jù)本身對(duì)于處理器系統(tǒng)核心的學(xué)習(xí)系統(tǒng)沒有多大價(jià)值,數(shù)據(jù)中感興趣的對(duì)象包括行人、騎自行車的人、動(dòng)物、交通信號(hào)燈等變量。在將傳感器數(shù)據(jù)用于訓(xùn)練或測(cè)試AI系統(tǒng)之前,所有這些目標(biāo)都需要進(jìn)行手工標(biāo)記和注釋,以便系統(tǒng)可以理解其“所見”。
研究人員根據(jù)傳感器的讀數(shù)生成地圖和行人姿態(tài)數(shù)據(jù),包括3D地面反射率地圖、3D點(diǎn)云地圖、六自由度地面真實(shí)姿態(tài)和局部姿態(tài)傳感器信息。這些反映了季節(jié)差異(數(shù)據(jù)是在晴天、下雪和多云的情況下以及在秋季期間捕獲),并且涵蓋了多種駕駛環(huán)境,包括高速公路、立交橋、橋梁、隧道、建筑區(qū)域和植被覆蓋區(qū)。
如今,大多數(shù)感知系統(tǒng)都嚴(yán)重依賴機(jī)器學(xué)習(xí)或深度核心算法,感知系統(tǒng)處理傳感器信號(hào)并嘗試對(duì)車輛周圍的物體進(jìn)行分類。為了能夠完成此任務(wù),必須使用經(jīng)過徹底標(biāo)記和注釋標(biāo)識(shí)所有道路的相關(guān)數(shù)據(jù),才能更好的發(fā)揮出數(shù)據(jù)的價(jià)值。值得注意的是,標(biāo)記過程可能比原始數(shù)據(jù)收集還要耗時(shí)。
福特指出,福特自動(dòng)駕駛汽車數(shù)據(jù)集中的每個(gè)日志均帶有時(shí)間水印,并包含來自傳感器的原始數(shù)據(jù)、校準(zhǔn)值、姿態(tài)軌跡、地面真實(shí)姿態(tài)和3D地圖。它具有ROS bag文件格式,可使用開源機(jī)器人操作系統(tǒng)(ROS)對(duì)其進(jìn)行可視化、修改和應(yīng)用。
實(shí)際上是話語權(quán)的爭(zhēng)奪
在自動(dòng)駕駛汽車上投入了大量資金,福特仍然向研究人員免費(fèi)提供它的自動(dòng)駕駛汽車數(shù)據(jù)集,但實(shí)際上也有所保留。此次福特公開的包括Argo正在使用的所有九臺(tái)攝像頭的視圖,以及兩個(gè)帶有10,000多個(gè)帶注釋目標(biāo)的數(shù)據(jù),但它僅涵蓋邁阿密和匹茲堡記錄的113個(gè)場(chǎng)景。
在自動(dòng)駕駛技術(shù)發(fā)展的初期,企業(yè)對(duì)數(shù)據(jù)的所有權(quán)非常謹(jǐn)慎,各家收集的數(shù)據(jù)代表著它們的用戶、資源和技術(shù)。技術(shù)壟斷雖然能夠最大限度地強(qiáng)化自己的優(yōu)勢(shì),但同時(shí)也阻礙了技術(shù)的進(jìn)步。雖然自動(dòng)駕駛車輛數(shù)據(jù)共享的重要性得到了整個(gè)行業(yè)的認(rèn)可,但出于行業(yè)競(jìng)爭(zhēng)、產(chǎn)權(quán)保護(hù)等等方面的考慮,企業(yè)之間大概不會(huì)無私貢獻(xiàn)所有數(shù)據(jù)。
事實(shí)上,開放數(shù)據(jù)集確實(shí)是在幫助別人,但企業(yè)自身也能獲益。自動(dòng)駕駛數(shù)據(jù)采集是一個(gè)周期長(zhǎng),地域廣的長(zhǎng)時(shí)間項(xiàng)目,如果各家都將自己的采集數(shù)據(jù)共享的話,就可以共同減少數(shù)據(jù)采集時(shí)間,從而促進(jìn)行業(yè)的整體發(fā)展,促進(jìn)商業(yè)化。
但實(shí)際情況是,在技術(shù)層面,對(duì)于一般研究而言,得到新的分類和預(yù)測(cè)算法可能具有巨大的價(jià)值。但由于具體數(shù)據(jù)取決于傳感器規(guī)格及其在車輛上的位置,還有很多實(shí)際原因?qū)е轮T多數(shù)據(jù)無法獲得。除非有人使用與捕獲數(shù)據(jù)的原始車輛完全相同的配置,否則如果不對(duì)視差進(jìn)行調(diào)整,它對(duì)于訓(xùn)練特定的自動(dòng)駕駛系統(tǒng)可能沒有用。
毫無疑問,公開數(shù)據(jù)集,可以吸引更多企業(yè)和開發(fā)者利用并補(bǔ)充數(shù)據(jù)集。如果某一家的數(shù)據(jù)或者代碼被競(jìng)爭(zhēng)對(duì)手采用,相當(dāng)于這家公司為自動(dòng)駕駛汽車制定了一個(gè)非正式的標(biāo)準(zhǔn),有助于該企業(yè)的發(fā)展和地位的加強(qiáng)。這一開放數(shù)據(jù)的企業(yè)也可以將其他公司收購(gòu),或者收取利益許可其他企業(yè)使用該平臺(tái)。
當(dāng)前全球所有車企都將智能化轉(zhuǎn)型作為戰(zhàn)略來搶占技術(shù)的制高點(diǎn),中國(guó)也不例外。2月份出臺(tái)的《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》,對(duì)中國(guó)的自動(dòng)駕駛來說具有重大利好。但是在回過頭來看國(guó)外公司開放的自動(dòng)駕駛數(shù)據(jù)集,主要針對(duì)底特律、波士頓、新加坡等地的環(huán)境解析。對(duì)于道路、交通、環(huán)境差別迥異的國(guó)內(nèi)駕駛環(huán)境來說,是否有用還有待商榷。
不過國(guó)內(nèi)的百度“Apollo”自動(dòng)駕駛平臺(tái),也是通過開源代碼,聯(lián)合諸多車企達(dá)成合作。此外,小馬智行和華為等中國(guó)公司,也在快速搶占自動(dòng)駕駛市場(chǎng)的份額。2019年自動(dòng)駕駛汽車脫離數(shù)據(jù)報(bào)告中,排名前十的企業(yè)中有四家來自于中國(guó)。由此可見,中外企業(yè)均在搶占自動(dòng)駕駛各層面技術(shù)的標(biāo)準(zhǔn)制定和話語權(quán)。
隨著“新四化”的不斷深入,未來,可能還會(huì)有更多的玩家加入到自動(dòng)駕駛的戰(zhàn)場(chǎng)。歷史也表明,未來也將是一個(gè)開放、合作、同時(shí)又相互競(jìng)爭(zhēng)的局面。無論是傳統(tǒng)車廠還是科技企業(yè),無論是國(guó)內(nèi)企業(yè)還是國(guó)外公司,這場(chǎng)承載著人類未來出行的偉大夢(mèng)想,正在一步步走近。