在自動駕駛中,基于立體視覺的深度估計技術(shù)可以準確地估計出障礙物與車輛的距離,該技術(shù)對于車輛正確規(guī)劃路徑也至關(guān)重要。
(圖片來源:SIAT)
立體深度估計已經(jīng)變成配備卷積神經(jīng)網(wǎng)絡(luò)的深度學習模型,不過,此類模型后續(xù)需要進行大量的處理,對不適定的區(qū)域或新場景沒有很強的適應能力。此外,由于在真實情況下,很難標記真實的地面深度,該系統(tǒng)的訓練數(shù)據(jù)也很有限。
據(jù)外媒報道,中國科學院深圳先進技術(shù)研究所(SIAT)的Zhang Qieshi博士領(lǐng)導了一個研究小組,提出一種新型技術(shù)解決方案,以解決目前自動駕駛中存在的深度估計問題。
研究人員提出了一種自我改進金字塔立體網(wǎng)絡(luò),后續(xù)無需復雜處理就可直接復原差距,而且在不適定的區(qū)域,該網(wǎng)絡(luò)也展現(xiàn)了較強的魯棒性。
此外,通過在線學習,該模型不僅解決了數(shù)據(jù)局限性問題,還在實際應用中節(jié)省了培訓時間和硬件資源。同時,面對新場景,具備自我改進的能力,能夠根據(jù)測試數(shù)據(jù)及時快速調(diào)整,以提高預測的準確性。
研究人員進行了實驗以及基準測試,結(jié)果表明,新提出的網(wǎng)絡(luò)能夠?qū)崿F(xiàn)深度估計功能,而且錯誤率僅為8.3%。