電裝集團(Denso)開發(fā)出了利用單眼攝像頭,快速實時識別行人的身體朝向、身高以及與汽車的距離等多種信息的技術。已通過實驗確認,在模擬車載設備的演示環(huán)境下,處理時間只需56毫秒。電裝打算將該技術應用于汽車的ADAS(高級駕駛輔助系統(tǒng))。
識別多種特征時,處理的數(shù)據(jù)量龐大,因此采用原來的方法難以進行實時處理。電裝此次通過調整圖像數(shù)據(jù)的處理方法縮短了計算時間。同時,計算量也降至原來的1/10左右,在計算能力有限的車載半導體上也可使用。
調整DNN 滿足ADAS的要求
該技術由電裝的子公司Denso IT Laboratory開發(fā)。圖像識別算法采用了深度學習的一種——DNN(Deep Neural Network,深度神經(jīng)網(wǎng)絡)。
以前進行圖像處理時采用的是方向梯度直方圖(HOG)和線性支持向量機(SVM)相組合的算法,但只能做出圖像中有沒有人這種簡單判斷。不能并行求出多個特征量,因此無法確定行人朝向、與車輛的距離等行人的狀態(tài)和屬性。
新開發(fā)的圖像識別方法利用DNN并行處理圖像中的多種不同信息。改進了名為“圖像金字塔”的方法,提高了處理速度。原來的圖像識別通過反復進行20-30次左右的“縮小分辨率-識別”過程,確保識別精度。此次,通過將循環(huán)次數(shù)減少到2-3次,減少了計算量。
該公司研究開發(fā)部研究員佐藤育郎介紹說,“能夠以16-17幀/秒的速度(幀率)處理影像”。應用于汽車ADAS時,通常要求影像的幀率達到“10-15幀/秒左右”,此次的技術滿足了這一要求。
行人檢測以及基于攜帶手機等圖像特征的處理通過圖像識別進行分類。行人與汽車之間的距離可通過確定行人站立位置,根據(jù)函數(shù)求出。身體朝向可根據(jù) 角度的數(shù)值信息進行判斷。電裝在2016年8月25日召開的記者說明會上進行了演示,表明通過采用該技術,可實時判斷行人朝向、身高及與汽車的距離。
佐藤說,采用該技術,“甚至可以推測出年齡段及是否攜帶手機”。不過,做任何判斷都必須要有用于深度學習的“正確數(shù)據(jù)”。電裝集團尚未建立起年齡段及有無手機等狀態(tài)的正確數(shù)據(jù),今后將建立這些數(shù)據(jù)。