7月1日—2日,由蓋世汽車主辦的“2021第四屆全球自動駕駛論壇” 于上海隆重召開。本次論壇主要聚焦自動駕駛關鍵技術,如自動駕駛感知、智能駕駛域控制器、芯片、計算平臺、無人駕駛不同的落地場景等話題展開討論,以促進自動駕駛相關技術進一步發(fā)展、完善。下面是智駕科技MAXIEYE CTO郭恩慶在本次大會上的發(fā)言。
智駕科技MAXIEYE CTO郭恩慶
大家好,我們是一家年輕的科技創(chuàng)業(yè)公司,主要做L3及以下的智能駕駛產(chǎn)品和解決方案。我本人是從2007年(前德爾福/安波福中國區(qū)主動安全總工程師)開始做到現(xiàn)在,見證了國內(nèi)ADAS產(chǎn)業(yè)的發(fā)展和成長。我今天將分享四個方面的內(nèi)容:回顧我們過去十年,ADAS經(jīng)歷了什么?我們接下來要怎么做?作為年輕的科技企業(yè)如何在產(chǎn)業(yè)轉型中適應新的合作方式?如何在這個賽道上勝出?
首先講第一點:以十年為周期,思考中國自動駕駛的產(chǎn)業(yè)變局。(德爾福)從2007年開始陸陸續(xù)續(xù)在國內(nèi)引入ADAS,當然主要是基礎的控制,包括ACC,還不能做全速ACC,橫向只是報警。從2011年開始國內(nèi)車廠嘗試去做,到2015年是導入期,雷達視覺方案已經(jīng)有了基礎的應用,主要是雙預警或者基礎的縱向控制。2015年開始出現(xiàn)數(shù)據(jù)融合的產(chǎn)品,1R1V數(shù)據(jù)融合。2020年處在一個爆發(fā)期,如果看2019年之前的數(shù)據(jù),整車廠ADAS裝配率是不高的,2021年又出現(xiàn)一些新的趨勢。隨著大算力平臺的出現(xiàn),單單做低速(場景)或者單單做高速(場景),對大算力運力平臺都是一種浪費,所以就要求大家在大算力平臺上多裝入一些東西,同時硬件和軟件深度解耦,主機廠有更多的參與度來主導整個系統(tǒng)集成。
如果我們回過頭看之前我們做的那些L1、L2系統(tǒng),很多主機廠使用的是一種完整解決方案。但是我們再看一些新的造車勢力,比如說Tesla或者小鵬,他們是把硬件裝上,把這個采回來,采用數(shù)據(jù)迭代。所以我們敏銳的感覺到在接下來的時間,一個是軟硬解耦,一個是數(shù)據(jù)迭代,是推動ADAS向前邁進的風火輪。
我們看一組數(shù)據(jù),這是工信部統(tǒng)計的2020年市場滲透率在15%左右,也就是說實際上沒有那么樂觀,但是已經(jīng)開始規(guī)?;涞?,開始大規(guī)模的預裝。比如說我知道有一個主機廠以前裝配率大概在10%以內(nèi),去年下半年由于競爭壓力裝配率提高到45-50%,當然不是說所有車型了。
我們再看一下2020年智能網(wǎng)聯(lián)汽車的技術路線圖,到2025年L2要達到50%,L3也要達到50%,也就是說從15%到50%還有一個很大的成長空間,這也是我們真正要落地的地方。另外到2030年要達到70%,也就是說在這里面沒有提到L4,我們理解L4和L5主要是從運營和部署角度來講,相對于大部分車廠規(guī)?;瘧脕碇v,我們還是更傾向于說到L3或者L2++。
根據(jù)高工智能數(shù)據(jù),目前中國的車裝配率相對國外來講也不是很高,主要集中在10-15萬車型范圍內(nèi)。也就是說,L2生長空間是非常大的,同時這個點上面臨著轉型。就是傳統(tǒng)的交鑰匙方式完全自上而下,有一個大的tier-1整裝方式不利于向L3邁進。
L2十年了,為什么到現(xiàn)在裝配率只有百分之十幾?比如急彎的穩(wěn)定性,有些時候能保持住,有些時候保持不住,那你讓用戶去猜,或者用戶在這個彎道上膽戰(zhàn)心驚的,系統(tǒng)開的比人開的還累。還有車輛Cut-in識別比較晚。我們系統(tǒng)開發(fā)的目標是要不停地提高處理能力。
但是有些場景,系統(tǒng)處理不了,你要能告訴我系統(tǒng)處理不了,用戶也不會時時刻刻去擔心,去猜這個系統(tǒng)的行為,我們這里分為兩種,系統(tǒng)感知邊界,警告駕駛員。
大家看看這些瓶子,前面三張照片是啤酒瓶子,雪和石頭,現(xiàn)在它能感知到,但是它不能識別是雪,還是石頭,還是啤酒瓶子。那如果這個路口封了,你可能是減速或者請求駕駛員接管,但問題是這個雪是可以過去的,實際上停住風險可能比過去風險更大。我們在嘗試擴大系統(tǒng)能力的前提下,還要把邊界鎖清楚,現(xiàn)在L2最大問題是邊界不清楚,需要你去猜、去測試、去體會。
還有高速公路上所謂的L3,這個Tesla沒少被懟,還有突然遇到水把路給淹了,這些場景讓我們覺得,真正做到一個穩(wěn)定的L3或者把L3邊界定義清楚還有挺長的路要走。隨著L2的普及,我們在L2這個節(jié)點上應該做什么事情?就是說L2實際上它的普及是給大家在數(shù)據(jù)的回歸上提供了非常好的機遇,但是這個機遇就要求大家必須要全棧式研發(fā),深度挖掘傳感器的能力。
那我們可不可以跳過L2,直接做L4,L5?這是一個問題,今天我沒有答案。我們以視覺為前提分析了一下,感知系統(tǒng)包括前視,后視,側前視,側后視在所有功能中的作用,大家可以看到,前視在其中發(fā)揮得作用非常大,也就是說我們僅僅靠硬件累計,不深度挖掘傳感器能力,這個性價比會慢慢降下來,如果依靠堆砌傳感器來試圖提高系統(tǒng)能力,那么系統(tǒng)在集成所有傳感器的優(yōu)勢同時,實際上也耦合了所有傳感器的短板,比如說下暴雨的時候所有激光雷達失效,原來基于激光雷達的缺點都凸現(xiàn)出來。所以我們認為應該不斷挖掘傳感器的能力,我們認為這是一個正確的發(fā)展方向。
那么是否要跳過L2,直接做L3呢?這個其實沒有答案,但是我們認為L2是基礎。如我剛才說的這些場景,所有你的訓練,所有的深度學習都是以歷史數(shù)據(jù)為基礎的,你不知道會發(fā)生什么,只有真正跑一段時間之后以數(shù)據(jù)說話,所以在L2基礎上軟硬解耦,數(shù)據(jù)回歸是關系到主機廠與科技創(chuàng)新企業(yè)合作的一個非常關鍵的點。
十年了,L2只有15%的普及率,我們主機廠拿到了什么東西?我理解主機廠主要得到的是集成經(jīng)驗、應用經(jīng)驗,但對處理感知下一步是我們急需補充的。相對來講L2沒有拿到這個數(shù)據(jù),你想把L3這個東西做好,結合我們剛才講的特殊情況,你有信心把這個東西交出來嗎?我們說可以OTA,OTA不是對安全的妥協(xié),你不能說拿這個東西去以犧牲用戶的安全為代價來做OTA。我們覺得L2相對來講比較成熟可用,但是我們有優(yōu)化的空間,在優(yōu)化的同時積極探索L3邊界,逐步向L3邁進。
那想想我們自己怎么辦,我們新科技公司如何在這場變革當中更好的與主機廠合作?我們要開發(fā)一個更好的L2(系統(tǒng)),挖掘L2(系統(tǒng))的潛力,挖掘感知的潛力。首先從消費者視角來講,我們要保證這個系統(tǒng)安全舒適,有相匹配的購買預算,我們極其不贊成疊加硬件,就是系統(tǒng)應該就是這個樣子,車廠角度來講就是安全,有持續(xù)獲利空間,包括(降低)成本。從技術供應商角度來講就是技術挖掘,功能體驗,前瞻技術與工程落地的平衡,持續(xù)的價值成長。因為作為軟件供應商或者算法供應商,在中國軟件一直不太受到特別的重視,我們也需要與主機廠找到一種長期共贏的方式。這里得出一句話:人人共享,那必須就要用得起,我們反對堆砌硬件。愿意用,就是我們要把系統(tǒng)做到它應該有的樣子。
針對這個目標,我們花了大力氣在三點上。1、全棧式開發(fā)。你要做到什么程度?挖掘到什么樣的數(shù)據(jù)?比如說檢測率,漏檢率,誤差精度,我們只有做全棧式研發(fā),才能把感知和規(guī)控高效協(xié)同起來。如果主機廠愿意去做一些控制,我們這個研發(fā)是可以和主機廠一起合作的。2、極致化體驗,我們充分挖掘傳感器能力,增加系統(tǒng)能力SCOPE,明確系統(tǒng)邊界。3、規(guī)?;瘧?。
L2是基礎,要全棧,極致,規(guī)模化,這里給大家舉幾個例子。有人做1R1V的融合,為什么要做1R1V融合?就是因為單傳感器可能會有漏檢誤檢的情況。
可以看一下圖,左邊是傳統(tǒng)融合,右邊是視頻檢測,底下還有一個線,也就是說傳統(tǒng)基于外觀的,看這個車像車就把它看作是車,但是容易誤檢。那我們用另外一個是接地線,用兩種特征對這個物體進行冗余性檢測,這樣可以使你的視覺系統(tǒng)更可靠更穩(wěn)定。
另外一個就是Cut-in的問題,左圖可以看到車頭剛露一半,Bonding box形成之前,Heading angle還不穩(wěn)定,根據(jù)車輛的lane assignment,進行圖像級別檢測。
大家可能也有過這種情況,就是S彎,三階曲線在比較遠的地方,小S彎識別不好,我們就針對小S彎用分段解釋,而且我們用了一個優(yōu)化的思想,很多人開著小S彎并不是沿著車道中心線走。
大家可以看前面的路,向左的分岔也是這樣,根本拐不過去,或者到前面攝像頭檢測到了(方向盤)猛打一下,讓人覺得挺嚇人。我們是分段擬合,分段擬合之后重新生成軌跡。
還有分岔路,我們發(fā)現(xiàn)右側的線不會斷,我們的系統(tǒng)每次都會順著這條線走過去。
這個路是不對齊,普通的L2都過不去,但Tesla可以過得去。那我們怎么做的呢?我們會提前分段表示,我們會按照當前穩(wěn)態(tài)情況下保持車輛穩(wěn)定最小的軌跡去做,以后這個系統(tǒng)過這種彎,70米之內(nèi)都不會退出,也不會給你猛打。
這是基于純視覺,一個攝像頭挖掘的東西。左邊攝像頭分岔點有一個小黃點,這個對地圖定位非常有好處。也就是說我們現(xiàn)在對車道線檢測不單單檢測一根兩根車道線,讓你順著車道線走,我們會把車道線脫鋪圖都給做出來,方便地圖定位,方便我選擇哪個線之后立即控制,幾乎所有的線路都能檢測出來,當然它對算力有一定的要求。也就是說,在充分挖掘的情況下可以做到性價比最高。
我們講工程化與性價比的平衡落地,我們不想堆砌硬件,我們是想深度挖掘傳感器感知的能力。另外,大家都在提落地,大家想想,如果我能解決從北京到上海,上到高速,點到點不需要接管,可以花1萬塊錢搞定,還是5萬塊錢你去開L5之類車,你選擇哪個?沒有一致的答案。但是短期之內(nèi)第一個比較靠譜一點。
簡單介紹一下智駕科技,(視頻上)我們所有傳感器都是裝了,有時候裝它不是為了裝上它而是去掉它。裝上它是想探索系統(tǒng)邊界,因為有些車撞了都不知道,它沒有意識到危險,我們可以通過這個來做差異化,數(shù)據(jù)回歸。
這是我們深度學習的路徑,公司規(guī)模不大,但是我們在國內(nèi)做深度感知時間還是比較早,目前主流產(chǎn)品是IFVS-500,2020年商用重卡出貨10萬臺。另外我們現(xiàn)在也在規(guī)劃多R多V的方案。
卡車目前是我們很大的業(yè)務,但是卡車車頭跟小轎車不一樣,導致盲區(qū)很大,所以我們公司自己開拓了150度和50幾度攝像頭可以最大幅度地覆蓋盲區(qū)。
同時今年也會有(乘用車)量產(chǎn)項目,開始數(shù)據(jù)回傳打通這個鏈路,包括場景和系統(tǒng)測試數(shù)據(jù),和駕駛行為數(shù)據(jù),高精度地圖采集點的數(shù)據(jù)。
我們認為感知和規(guī)劃必須統(tǒng)一,這個統(tǒng)一并不是一定由一家公司來做,而是深度合作。也就是說ADAS十年做到這個模式,無論是市場成熟度,還是技術成熟度都使得我們給客戶的合作模式已經(jīng)不簡簡單單是交鑰匙模式,而是深度的合作,共同進行迭代。這是從L2真正邁向L3,而且做出來極致舒適的L3的基礎。
歡迎關注我們公司,謝謝大家。