從醫(yī)學(xué)診斷到自動駕駛汽車,再到面部識別,圖像分析在當(dāng)代技術(shù)中無處不在。而使用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(CNN)這種圖象處理算法層的計算機(jī)已徹底改變了計算機(jī)視覺。
(圖片來源:https://techxplore.com/)
但CNN通過學(xué)習(xí)之前訓(xùn)練過的數(shù)據(jù)來對圖像進(jìn)行分類,通常是憑借記憶或生成刻板印象。而且CNN也容易受到對抗性攻擊,這種攻擊以微小的、幾乎察覺不到的形式出現(xiàn)在圖象中,從而導(dǎo)致錯誤的決定。這些缺點(diǎn)限制了CNN的實用性。此外,人們越來越意識到,像CNN這類深度學(xué)習(xí)算法還會產(chǎn)生過高的碳足跡。
提高圖像處理算法能效和可靠性的一種方法是將傳統(tǒng)的計算機(jī)視覺與光學(xué)預(yù)處理相結(jié)合,這種混合系統(tǒng)只需極少的電子硬件。由于光可在預(yù)處理階段完成數(shù)學(xué)功能而不消耗能量,因此混合計算機(jī)視覺系統(tǒng)可以顯著節(jié)省時間和能耗。這種新興的方法可以克服深度學(xué)習(xí)的缺點(diǎn),并利用光學(xué)和電子學(xué)的優(yōu)勢。
據(jù)外媒報道,加州大學(xué)河濱分校機(jī)械工程教授Luat Vuong和博士生Baurzhan Muminov通過應(yīng)用光學(xué)渦旋,證明了混合計算機(jī)視覺系統(tǒng)的可行性。這種渦旋光波有一個黑暗的中心點(diǎn),漩渦可以比作光繞著邊緣和角落移動時產(chǎn)生的流體動力漩渦。
渦旋的知識可以擴(kuò)展,用于理解任意波型。當(dāng)產(chǎn)生光學(xué)渦旋時,光學(xué)圖像數(shù)據(jù)會以突顯并混合光學(xué)圖像不同部分的方式傳播。Muminov和Vuong表明,使用僅需運(yùn)行幾層算法的淺層“小型大腦”神經(jīng)網(wǎng)絡(luò)進(jìn)行漩渦圖像預(yù)處理,可能取代CNN的功能。
Vuong解釋稱,“光渦旋的獨(dú)特優(yōu)勢在于其數(shù)學(xué)性邊緣增強(qiáng)功能。我們展示了光學(xué)渦旋編碼器生成物體強(qiáng)度數(shù)據(jù)的方式,使得小型大腦神經(jīng)網(wǎng)絡(luò)可以根據(jù)光學(xué)預(yù)處理模式快速重建原始圖像?!?/p>
光學(xué)預(yù)處理可降低圖像計算功耗,而電子設(shè)備中的數(shù)字信號可識別相關(guān)性,提供優(yōu)化,并快速計算可靠的決策閾值。借助混合計算機(jī)視覺,光學(xué)具有速度和低功耗計算的優(yōu)勢,并將CNN的時間成本降低了兩個數(shù)量級。通過圖像壓縮,可以在存儲和計算復(fù)雜性兩方面大幅減少電子后端硬件。
Vuong表示,“我們關(guān)于渦旋編碼器的演示表明,光學(xué)預(yù)處理可以取代CNN,比CNN更穩(wěn)健,并且能夠總結(jié)逆問題解決方案。例如,我們證明,當(dāng)混合神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)手寫數(shù)字的形狀時,隨后就能重建以前沒有見過的阿拉伯或日語字符?!?/p>
Vuong和Muminov的論文還表明,將圖像縮減為更少的高強(qiáng)度像素,能夠?qū)崿F(xiàn)極低光線的圖像處理。該項研究為光子學(xué)在構(gòu)建通用的小腦混合神經(jīng)網(wǎng)絡(luò),以及開發(fā)用于大數(shù)據(jù)分析的實時硬件方面的作用提供了新見解。