據(jù)外媒報(bào)道,英國半導(dǎo)體與軟件設(shè)計(jì)公司Imagination Technologies宣布推出新一代神經(jīng)網(wǎng)絡(luò)加速器(NNA)——IMG Series4,可應(yīng)用于高級駕駛輔助系統(tǒng)(ADAS)和自動駕駛。Series4的目標(biāo)客戶是汽車行業(yè)內(nèi)領(lǐng)先的顛覆者以及一級供應(yīng)商、原始設(shè)備制造商(OEM)以及汽車半導(dǎo)體片上系統(tǒng)(SoC)制造商。
(圖片來源:Imagination Technologies)
Series4具備新型多核架構(gòu),運(yùn)算能力超高,達(dá)到600 TOPS及以上,可為大型神經(jīng)網(wǎng)絡(luò)工作負(fù)載提供低帶寬以及超低延遲性能。
汽車行業(yè)一直在進(jìn)行一場革命,自動駕駛汽車和自動駕駛出租車等新用例都要求人工智能(AI)技術(shù)的性能達(dá)到全新水平。為此,Imagination與汽車行業(yè)以及重視功能安全的其他行業(yè)的領(lǐng)導(dǎo)者和創(chuàng)新者合作。目前,Series4已經(jīng)獲得許可證,將于2020年12月上市。
Imagination的低功耗NNA架構(gòu)旨在用于運(yùn)行全網(wǎng)絡(luò)推斷,同時(shí)也能滿足功能安全要求,可一次性執(zhí)行多個(gè)操作,以最大限度地提高性能功耗比,提供業(yè)內(nèi)領(lǐng)先的能源效率。
Series4包括:
1、 多核架構(gòu)可擴(kuò)展性與靈活性:多核架構(gòu)使其能夠跨核靈活分配和同步工作負(fù)載,Imagination的軟件具備精細(xì)控制能力,可通過分批處理、分割以及調(diào)度多個(gè)工作負(fù)載增加靈活性,而且可在任意數(shù)量的核上使用,每個(gè)集群有2、4、6或8核配置。
2、 超高性能:Series4每核的算力達(dá)12.5 TOPS,能耗卻低于1瓦特。例如8核配置的集群算力可達(dá)100 TOPS,因而6×100的解決方案算力可達(dá)600 TOPS。在AI推理方面,Series4 NNA的性能比嵌入式GPU快200倍,比嵌入式CPU快1000倍。
3、 超低延遲:通過將所有核合并到2、4、6或8核集群中,所有核都可用于專門執(zhí)行單個(gè)任務(wù),通過相應(yīng)的倍數(shù)減少延遲,從而減少響應(yīng)時(shí)間。例如,對于8核集群而言,就是8倍。
4、 大大節(jié)省帶寬:Imagination的Tensor Tiling(ITT)是Series4的新功能,是一項(xiàng)正在申請專利的技術(shù),能夠通過將輸入的數(shù)據(jù)張量分割成多個(gè)塊,以更高效地處理數(shù)據(jù),從而解決帶寬效率問題。ITT利用本地?cái)?shù)據(jù)的依賴關(guān)系,將中間數(shù)據(jù)存儲在芯片存儲器中,最大限度地減少將數(shù)據(jù)輸入到外部存儲器中,將帶寬減少90%。ITT是一種可擴(kuò)展的算法,在具有大輸入數(shù)據(jù)量的網(wǎng)絡(luò)上具有很大的優(yōu)勢。
5、 汽車安全:Series4包括IP級別的安全功能以及符合ISO 26262的設(shè)計(jì)流程,可幫助客戶獲得認(rèn)證。ISO 26262是汽車電子產(chǎn)品風(fēng)險(xiǎn)的行業(yè)安全標(biāo)準(zhǔn),Series4能夠讓神經(jīng)網(wǎng)絡(luò)安全推理,且不會影響到性能。硬件安全機(jī)制可以保護(hù)已編譯的網(wǎng)絡(luò)、網(wǎng)絡(luò)執(zhí)行和數(shù)據(jù)處理管道。