我國(guó)人工智能芯片重大突破


來(lái)源:中國(guó)電子報(bào)   作者:趙晨    時(shí)間:2016-07-08





  6月20日,記者從中星微“數(shù)字多媒體芯片技術(shù)”國(guó)家重點(diǎn)實(shí)驗(yàn)室獲悉,經(jīng)過五年多的攻堅(jiān)克難和不懈努力,中國(guó)首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片已于今年3月6日實(shí)現(xiàn)量產(chǎn),這標(biāo)志著我國(guó)在神經(jīng)網(wǎng)絡(luò)處理器領(lǐng)域的研究和開發(fā)上取得了重大突破,在基于“數(shù)據(jù)驅(qū)動(dòng)并行計(jì)算”架構(gòu)的人工智能深度學(xué)習(xí)領(lǐng)域達(dá)到國(guó)際先進(jìn)水平。


  顛覆馮諾依曼架構(gòu)NPU為人工智能而生


  “目前已成功在視頻監(jiān)控領(lǐng)域?qū)崿F(xiàn)產(chǎn)業(yè)化,下一步將廣泛應(yīng)用于智能駕駛輔助、無(wú)人機(jī)、機(jī)器人等嵌入式機(jī)器視覺領(lǐng)域?!敝行俏ⅰ皵?shù)字多媒體芯片技術(shù)”國(guó)家重點(diǎn)實(shí)驗(yàn)室執(zhí)行主任、中星微電子集團(tuán)首席技術(shù)官?gòu)堩崠|向《中國(guó)電子報(bào)》記者透露,“現(xiàn)在的出貨量已經(jīng)超過了10萬(wàn)顆?!?/br>


  從時(shí)間上看,幾個(gè)月前的3月9日,人工智能AlphaGo與李世石的第一場(chǎng)圍棋大戰(zhàn)才剛剛拉開帷幕。


  而就在3天前的3月6日,具有人工智能深度學(xué)習(xí)功能的中國(guó)首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片“星光智能一號(hào)”已成功量產(chǎn)。AlphaGo要運(yùn)行在一個(gè)龐大的服務(wù)器集群上,下一盤棋僅花費(fèi)的電費(fèi)就高達(dá)3000美元。而指甲蓋大小的“星光智能一號(hào)”卻實(shí)現(xiàn)了人工智能深度學(xué)習(xí)系統(tǒng)的低功率和小型化,并能夠應(yīng)用于嵌入式系統(tǒng)之中。


  在不久前的人機(jī)大戰(zhàn)中,AlphaGo依靠模仿人腦生物機(jī)理的深度學(xué)習(xí)算法而擊敗李世石。深度學(xué)習(xí),是源于對(duì)生物人腦機(jī)理的仿生學(xué)研究而形成的一種人工智能算法。作為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的一種,卷積神經(jīng)網(wǎng)絡(luò)CNN(ConvolutionalNeuralNetwork)算法,已成為當(dāng)前人工智能機(jī)器視覺領(lǐng)域的研究熱點(diǎn)。


  CNN算法模型的特性可以概括為海量的輸入數(shù)據(jù)、大規(guī)模的MAC運(yùn)算、稀疏的權(quán)值矩陣、靈活的數(shù)據(jù)位寬和多樣的網(wǎng)絡(luò)拓?fù)涞忍匦?。?duì)于傳統(tǒng)馮諾依曼結(jié)構(gòu)的CPU而言,其串行執(zhí)行方式實(shí)在無(wú)法高效處理大量并行性運(yùn)算,所以執(zhí)行CNN算法的效率非常低下。


  相當(dāng)于CPU,GPU的高度并行化運(yùn)算單元,相對(duì)更適合神經(jīng)網(wǎng)絡(luò)的大量并行運(yùn)算方式。但是,GPU的設(shè)計(jì)初衷是為了進(jìn)行3D圖形處理,不僅功耗大、價(jià)格高,而且并不適合嵌入式環(huán)境。同理,DSP、FPGA等主流處理器也并不適合CNN。


  為此,國(guó)內(nèi)外主流企業(yè)和機(jī)構(gòu)也都在針對(duì)CNN算法的處理器上下很了大工夫,研制自家的CNN處理器。如IBM公司的TrueNorth,高通公司的Zeroth,Google公司的TPU,KnuEdge公司的KnuPath和中國(guó)科學(xué)院的寒武紀(jì)等。


  而中星微的NPU是針對(duì)CNN的算法模型特性專門設(shè)計(jì)的一款神經(jīng)網(wǎng)絡(luò)處理器。據(jù)張韻東介紹,NPU采用了“數(shù)據(jù)驅(qū)動(dòng)并行計(jì)算”的架構(gòu),徹底顛覆了傳統(tǒng)的馮諾依曼架構(gòu)。這種數(shù)據(jù)流(Dataflow)類型的處理器,極大地提升了計(jì)算能力與功耗的比例,特別擅長(zhǎng)處理視頻、圖像類的海量多媒體數(shù)據(jù),使得人工智能在嵌入式機(jī)器視覺應(yīng)用中可以大顯身手。


  據(jù)了解,每個(gè)NPU處理器具有4個(gè)內(nèi)核(NPUCore),每個(gè)內(nèi)核有兩個(gè)數(shù)據(jù)流處理器(DataflowProcessor),每個(gè)數(shù)據(jù)流處理器具有8個(gè)長(zhǎng)位寬或16個(gè)短位寬的SIMD(單指令多數(shù)據(jù))運(yùn)算單元。在一個(gè)時(shí)鐘周期內(nèi)可同時(shí)完成64個(gè)長(zhǎng)位寬MAC運(yùn)算或者128個(gè)短位寬MAC運(yùn)算。每個(gè)NPU核具有38GOps的長(zhǎng)位寬處理能力或者76GOps的短位寬處理能力。NPU的處理性能可以組成多核陣列來(lái)提升,也可以通過多芯片級(jí)聯(lián)的方式進(jìn)一步擴(kuò)展,以滿足更復(fù)雜的CNN網(wǎng)絡(luò)運(yùn)算的性能需求。


  “每個(gè)NPU核還具有256kBLevel-2Cache,以及整塊數(shù)據(jù)搬移(BlockDataAccess),片內(nèi)數(shù)據(jù)共享(Data-sharingBetweenProcessorUnits),提升數(shù)據(jù)流的吞吐效率?!睆堩崠|表示,“在軟件方面,利用了稀疏數(shù)據(jù)優(yōu)化(OptimizationforSparseData)等特性提高計(jì)算效率。NPU可以支持Caffe、TensorFlow等多種神經(jīng)網(wǎng)絡(luò)框架,支持AlexNet、GoogleNet等各類神經(jīng)網(wǎng)絡(luò)。”


  國(guó)家重點(diǎn)實(shí)驗(yàn)學(xué)術(shù)委員會(huì)主任楊曉東表示,星光智能一號(hào)芯片集成了NPU處理器內(nèi)核以及國(guó)家標(biāo)準(zhǔn)的音視頻編解碼器(SVACCodec),是全球首顆具備人工智能深度學(xué)習(xí)能力的嵌入式視頻采集壓縮編碼系統(tǒng)級(jí)芯片。


  記者了解到,目前,中星微NPU芯片的代工生產(chǎn)在臺(tái)積電,下一步有望轉(zhuǎn)由大陸企業(yè)生產(chǎn)。


  NPU只是“智能摩爾之路”的第一步


  隨著星光智能一號(hào)在視頻監(jiān)控領(lǐng)域的應(yīng)用,監(jiān)控系統(tǒng)可以通過高清視頻的采集和編碼,對(duì)人員、車輛進(jìn)行基于深度學(xué)習(xí)的智能化目標(biāo)識(shí)別,實(shí)現(xiàn)視頻的結(jié)構(gòu)化描述,關(guān)聯(lián)視頻和標(biāo)簽,并接入公安平臺(tái)保存錄像和索引信息。在接到報(bào)案信息后,刑偵人員可以通過搜索結(jié)構(gòu)化描述標(biāo)簽,直接定位視頻,獲取現(xiàn)場(chǎng)圖像,從而確認(rèn)嫌疑人。


  說得通俗些,以后我們可以直接用藍(lán)白條紋T恤、黑褲子、男性這樣的關(guān)鍵詞對(duì)視頻中的內(nèi)容進(jìn)行搜索。同理,如果在商品展示櫥窗中設(shè)置NPU視頻智能監(jiān)控系統(tǒng),我們將很容易得知被展示的產(chǎn)品吸引了多少人的目光,以及這些人的性別、外貌等具體特征,配合大數(shù)據(jù)分析,又將有多少傳統(tǒng)行業(yè)會(huì)被顛覆?


  人工智能的好戲才剛剛揭開序幕。除了視頻監(jiān)控領(lǐng)域,NPU很快會(huì)在智能駕駛輔助、無(wú)人機(jī)、機(jī)器人等領(lǐng)域帶給我們更多驚喜。


  未來(lái),對(duì)信息處理性能的需求還將不斷提升,如何才能找到一條后摩爾定律時(shí)代的創(chuàng)新之路?對(duì)此,業(yè)界有兩種觀點(diǎn):一是繼續(xù)推進(jìn)摩爾定律(MoreMoore),即繼續(xù)在新型材料、工藝制程和器件結(jié)構(gòu)上努力,將摩爾定律再推進(jìn)一步。二是超越摩爾定律(MorethanMoore),即通過SoC將數(shù)字電路、模擬存儲(chǔ)器甚至射頻電路集成在一顆芯片里以實(shí)現(xiàn)更多功能,或者通過SIP采用多芯片堆疊的方式,將多顆裸芯片封裝在一起。


  “正如業(yè)界所言,隨著逐步逼近香農(nóng)定理、摩爾定律的極限,面對(duì)大流量、低延時(shí)的理論還未創(chuàng)造出來(lái),大家感到前途茫茫,找不到方向?!睆堩崠|說,“而NPU正是一塊引玉之磚。”


  面對(duì)摩爾定律的盡頭,中星微給出了全新的技術(shù)路線——智能摩爾之路(IntelligentMoore)。其內(nèi)涵是,雖然物理層面和信號(hào)層面都受到物理規(guī)律的制約,但在信息層面的技術(shù)創(chuàng)新還遠(yuǎn)沒有達(dá)到極限。如何進(jìn)一步借鑒人腦智慧機(jī)制,研究新型人工智能計(jì)算方法,進(jìn)一步提升信息處理的性能功耗價(jià)格比,可能是下一次信息革命的關(guān)鍵。


  張韻東表示,中星微國(guó)家重點(diǎn)實(shí)驗(yàn)室在未來(lái)的五年中,會(huì)持續(xù)開展新型“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算架構(gòu)的研究工作,采用更加接近生物人腦的工作機(jī)理的方式,推出更低功耗更高運(yùn)算性能的下一代神經(jīng)網(wǎng)絡(luò)處理器,在摩爾定律的盡頭探索一條繼續(xù)提升信息處理效率的前行之路。(本報(bào)記者趙晨)



  版權(quán)及免責(zé)聲明:凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章,不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。

延伸閱讀

熱點(diǎn)視頻

第六屆中國(guó)報(bào)業(yè)黨建工作座談會(huì)(1) 第六屆中國(guó)報(bào)業(yè)黨建工作座談會(huì)(1)

熱點(diǎn)新聞

熱點(diǎn)輿情

特色小鎮(zhèn)

版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502003583