去年年底,有消息稱特斯拉收購了一家專為自動駕駛汽車研發(fā)“深度神經(jīng)網(wǎng)絡(luò)”(DNN)的初創(chuàng)公司DeepScale,不過未披露收購金額。該公司所關(guān)注的計算節(jié)能型深度學習系統(tǒng)也是特斯拉所關(guān)注的一個領(lǐng)域,而特斯拉決定自主研發(fā)計算機芯片,為其自動駕駛軟件提供支持。就在特斯拉于2019年10月收購DeepScale幾天之后,特斯拉就申請了一項專利,專利申請人就包括DeepScale公司的三名成員:Matthew Cooper、Paras Jain和Harsimran Singh Sidhu。
(圖片來源:electrek.co)
據(jù)外媒報道,該項專利名為“利用增強型數(shù)據(jù)訓練機器模型的系統(tǒng)和方法”(Systems and Methods for Training Machine Models with Augmented Data),于當?shù)貢r間4月17日被正式公布。
特斯拉汽車都配備了一組攝像頭,能夠為車輛提供覆蓋360度視野的圖像。在專利文件中,特斯拉表示,用于訓練神經(jīng)網(wǎng)絡(luò)的圖像通常由不同的傳感器捕獲,而此類傳感器有時會具有不同的特征。例如,在特斯拉的三個前置攝像頭中,每個攝像頭的視場和探測距離都不同。
不過,特斯拉在最新專利中提出了一個系統(tǒng),可以讓該公司采用優(yōu)化方法處理此類圖像,即通過增強型數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)進行靈活且廣泛的訓練,即使配備了不同規(guī)格攝像頭的車輛都可做到。
(圖片來源:electrek.co)
特斯拉表示:“增強型數(shù)據(jù)能夠使模型預(yù)測普遍化,并提升模型預(yù)測的性能,特別是在圖像有暗影、被遮擋或者無法提供被探測物體的清晰視圖的情況下,而此類方法特別適用于物體探測和自動駕駛汽車。此外,在其他場景中,如果有很多設(shè)備配置了相同攝像頭也非常有用。由于此類設(shè)備可能配備了面向特定方向的特定傳感器套件,可能會收集既定配置的訓練數(shù)據(jù),一個模型可能會利用收集而來的訓練數(shù)據(jù)的增強版進行訓練,而已經(jīng)得到訓練的模型可能會部署至有相同配置的設(shè)備上。”
該項專利最引人注目的一點是采用“剪貼”(cutouts)法,能夠讓特斯拉的神經(jīng)網(wǎng)絡(luò)利用經(jīng)過優(yōu)化的一組圖像進行訓練。特斯拉Autopilot前工程師Eshak Mir曾暗示,特斯拉正在重寫Autopilot,將有助于讓車輛所有攝像頭的圖像呈現(xiàn)在“一個視圖中”。該過程有助于特斯拉進行3D標記,特別是用于圖像是拼貼在一起的神經(jīng)網(wǎng)絡(luò)訓練。
專利文件中表示:“此類圖像可能會用“剪貼”功能得到增強,該功能會刪除原始圖像中的一部分,然后利用其他圖像內(nèi)容,如指定的顏色、模糊的內(nèi)容、噪聲或另一幅圖像的內(nèi)容來取代該部分。剪貼掉的圖像內(nèi)容數(shù)量、大小、區(qū)域和替換的內(nèi)容會各種各樣,可能會基于圖像的標簽(如圖像中感興趣區(qū)域或者物體的邊界框)等進行剪貼?!?/p>
特斯拉的目標是盡快推出功能齊全的全自動駕駛套件(FSD),盡管該公司推遲了原定于2019年底推出的計劃,該公司首席執(zhí)行官埃隆馬斯克(Elon Musk)仍對該計劃非常樂觀。不過,馬斯克也確實表示特斯拉正在對Autopilot進行基礎(chǔ)重寫,重寫工作的一個重要部分涉及到重寫Autopilot核心基礎(chǔ)代碼以及推出3D標簽。