原創(chuàng) 要聞 證券 基金 保險 銀行 上市公司 IPO 科創(chuàng)板 汽車 新三板 科技 房地產(chǎn)

英特爾大數(shù)據(jù)技術(shù)全球CTO戴金權(quán):人工智能和大數(shù)據(jù)是數(shù)字經(jīng)濟的基石


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2022-03-31





人工智能已經(jīng)走過了60多年的歷程,當前正處于第三次發(fā)展浪潮之中。各類科技企業(yè)、互聯(lián)網(wǎng)巨頭、初創(chuàng)公司等都紛紛投入人工智能產(chǎn)業(yè)之中,也吸引了大量資本的涌入。但在人工智能的熱潮之下,同樣需要冷思考。

近日,英特爾院士、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)接受了《科創(chuàng)板日報》記者的專訪,探討人工智能和大數(shù)據(jù)的應用瓶頸、拓展方向以及數(shù)字經(jīng)濟所帶來的機遇。

他表示,人工智能當前還處于一個比較早期的階段,從開發(fā)者和實驗室走到現(xiàn)實的生產(chǎn)環(huán)境,在這個過程中存在一定的脫節(jié)。如何針對不同的場景做適配,以及如何實現(xiàn)整個端到端的流水線打通,都有比較大的挑戰(zhàn)。

但戴金權(quán)依然對人工智能未來表示看好。他認為,除了安防外, AI在制造業(yè)、數(shù)據(jù)中心智能運維、互聯(lián)網(wǎng)業(yè)務(wù)等領(lǐng)域都有很大的應用空間。

在談到數(shù)字經(jīng)濟的機遇時,戴金權(quán)認為,人工智能和大數(shù)據(jù)是數(shù)字經(jīng)濟的基石。在數(shù)字化之后,必然會產(chǎn)生大量的數(shù)據(jù)。首當其沖的是需要對這些數(shù)據(jù)進行管理。其次,在擁有大量的數(shù)據(jù)資產(chǎn)后,便可以利用大數(shù)據(jù)、AI技術(shù)對其進行分析,并以此來進行一些預測,甚至幫助人們做出決策。

以下是《科創(chuàng)板日報》整理的專訪實錄:

人工智能尚處于早期階段

《科創(chuàng)板日報》:當前,AI賦能各行各業(yè)的時候遇到了很多難點,例如,AI在中長尾場景的應用非常碎片化,這意味著需求大量的定制化,較難實現(xiàn)大規(guī)模應用,不知道您如何看待這個問題?

戴金權(quán):我同意你的說法,今天AI還處于比較早期的階段,雖然我們看到在實驗室里、研究環(huán)境里有很多的創(chuàng)新成果出來。但這些技術(shù)要落到現(xiàn)實的應用里,仍舊存在許多挑戰(zhàn)。

比如,從數(shù)據(jù)到處理再到AI模型,怎么實現(xiàn)整個端到端的流水線打通;AI模型能否更好地針對各種場景進行優(yōu)化,以及AI依賴于定制化的軟硬件平臺難以擴展,如何做到普適化,讓更多人方便地應用AI。這些都是目前我們所遇到的難點。

雖說挑戰(zhàn)很多,但是我們依然很有信心。AI是一種技術(shù),也是一個產(chǎn)業(yè)發(fā)展的方向,在未來必定大有可為。

《科創(chuàng)板日報》:國內(nèi)企業(yè)正在研發(fā)預訓練大模型,試圖解決上述問題,您多年在英特爾從事全球性技術(shù)研發(fā)工作,從全球角度來看,大家會有哪些應對舉措?

戴金權(quán):這取決于不同的技術(shù)路線。比如您剛剛提到的預訓練大模型,這是最近兩三年大家非常關(guān)注的一個方向——首先利用像Transformer這樣的新模型架構(gòu),在大量的模型上進行預訓練,之后再在下游的任務(wù)上進行適配和調(diào)優(yōu)。目前無論是國內(nèi)還是國外,大家都在做很多這方面的探索,其范圍涵蓋了自然語言處理領(lǐng)域、計算機視覺領(lǐng)域等。

去年,我們和漢堡王有一個合作,利用Transformer架構(gòu)做了推薦系統(tǒng)上的一些嘗試,也達到了很好的效果。當然,這其中存在技術(shù)難點。當模型越來越大,所需要的數(shù)據(jù)量和對計算的需求也越來越大。除此之外,在進行部署的時候,對資源和計算速度的高要求都造成很大挑戰(zhàn)。

為此,英特爾對模型進行了各種各樣的優(yōu)化。例如把浮點數(shù)運算轉(zhuǎn)換為整型運算,并且利用諸如VNNI、DL Boost等加速指令來幫助模型進行量化,以提高它的速度;對模型進行稀疏化等,使其在各種不同的硬件平臺上,從筆記本到嵌入系統(tǒng),到邊緣服務(wù)器,再到云端的大算力,都能夠很好地進行部署,真正拓寬其應用。我們希望,通過硬件的加速,訓練模型架構(gòu)上的創(chuàng)新,以及軟件的優(yōu)化,綜合起來達到更好的效果。

從實驗室走向產(chǎn)業(yè)應用存在脫節(jié)

《科創(chuàng)板日報》:在碎片化的AI應用場景,數(shù)據(jù)量比較少,是導致模型訓練存在困難的原因,您對此怎么看?

戴金權(quán):這其實存在兩個問題,一是數(shù)據(jù)量不多,我們可以通過預訓練,或者通過遷移學習、多任務(wù)學習、元學習等各種方法來解決。

二是,有數(shù)據(jù)但沒有標簽,這是經(jīng)常會遇到的情況。我們和合作伙伴工作的過程中會發(fā)現(xiàn)有數(shù)據(jù),但給數(shù)據(jù)打標簽本身的代價非常高。迄今為止,我們本質(zhì)上還處于“監(jiān)督學習”,仍舊需要在標簽上做更多努力。

目前有很多探索方向,比如大家都在積極探索的“無監(jiān)督學習”、“自監(jiān)督學習”等技術(shù)。至于是否到了非常成熟的階段呢?可能還沒有,但是我們?nèi)耘f認為這個方向是大有可為的。

《科創(chuàng)板日報》:除了碎片化需求, AI在落地和實施方面還存在哪些痛點?

戴金權(quán):從開發(fā)人員的角度來看,在開發(fā)機上完成開發(fā)后,要在大規(guī)模的數(shù)據(jù)集群上試驗,進行生產(chǎn)化部署,整個過程在今天來說還是有非常大的瓶頸。

特別是很多的開發(fā)人員,就是一個數(shù)據(jù)科學家,并非專門做高性能計算、分布式計算的開發(fā)人員。為了把AI成功應用到生產(chǎn)環(huán)境當中,這些數(shù)據(jù)科學家就需要在分布式大規(guī)模的場景上進行實際的部署,在整個過程中是有一些脫節(jié)的。

在這方面我們做了一些初步的工作,包括推出開源大數(shù)據(jù)項目BigDL 2.0。通過構(gòu)建“數(shù)據(jù)+AI”的可擴展平臺,把AI應用或者流水線,能從筆記本無縫地擴展到分布式大規(guī)模的云集群當中去,做到在筆記本開發(fā)和在云上開發(fā)是一樣的體驗。

這樣,數(shù)據(jù)科學家可以更加集中在自己想做的模型、算法的創(chuàng)新上,而不用管底層大規(guī)模分布式如何進行,也不用管怎么從筆記本遷移到云里。

數(shù)據(jù)是數(shù)字經(jīng)濟發(fā)展的關(guān)鍵要素

《科創(chuàng)板日報》:中國正在大力發(fā)展數(shù)字經(jīng)濟,今年兩會的政府工作報告上也提出要培育人工智能等數(shù)字產(chǎn)業(yè)。近年來,AI主要在安防、公共安全等領(lǐng)域有一定應用,大量的公司也都集中在這個領(lǐng)域競爭。您是否看到,AI在其他行業(yè)有新的機會?

戴金權(quán):安防當然是非常重要的一塊。英特爾也有物聯(lián)網(wǎng)事業(yè)部,在智能攝像頭、智能攝像機方面做了非常多的工作。

同時,中國是一個制造業(yè)強國,如何將這些AI計算機視覺技術(shù)應用到制造業(yè)之中,比如在缺陷檢測等方面,存在較大的發(fā)展空間。

此外,在電信運營商和數(shù)據(jù)中心領(lǐng)域,無論是基站還是數(shù)據(jù)中心的時序數(shù)據(jù),都可以利用時序分析對其進行智能運維;在通訊網(wǎng)絡(luò)或者數(shù)據(jù)中心里,通過AI預測負載變化來省電,進行更合理的資源調(diào)度和任務(wù)分配等;在互聯(lián)網(wǎng)業(yè)務(wù)或者是在線服務(wù)當中,則可以利用AI進行各種各樣的推薦以及內(nèi)容挖掘。這些都是非常重要的應用舞臺。

在我看來, AI開始把大量的數(shù)據(jù)處理分析和深度學習、機器學習技術(shù)結(jié)合在一起,對場景進行適配或應用,的確帶來很多不同的新應用機會。不管是針對更精準的匹配,還是更好的質(zhì)量檢測,或是想要更加綠色、環(huán)保、節(jié)能的發(fā)展,AI都有著很多的可能性。

大數(shù)據(jù)分析也是應用非常廣泛的技術(shù),無論在國內(nèi)還是國外,各行各業(yè)都有非常廣泛的應用。從某種意義來說,大數(shù)據(jù)分析也是今天數(shù)字經(jīng)濟的一個基石。

《科創(chuàng)板日報》:您剛剛講到,大數(shù)據(jù)和AI技術(shù)都是數(shù)字經(jīng)濟的基石?,F(xiàn)在大家都很關(guān)注數(shù)字經(jīng)濟領(lǐng)域的機會。不知道您如何看待數(shù)字經(jīng)濟所涵蓋的上下游產(chǎn)業(yè)鏈,以及哪些技術(shù)應用更為核心關(guān)鍵?

戴金權(quán):首先,無論是資產(chǎn)、運作、還是生產(chǎn)活動,都在越來越多地進行數(shù)字化。而數(shù)字化之后必然會產(chǎn)生大量的數(shù)據(jù)。比如一個大城市,會擁有幾十萬、上百萬的基站,這些基站中的設(shè)備每隔幾秒鐘就會產(chǎn)生大量的數(shù)據(jù)。首當其沖的便是如何對這些數(shù)據(jù)進行管理,包括存儲、處理等。

第二,在擁有數(shù)據(jù)資產(chǎn)之后,利用大數(shù)據(jù)技術(shù),結(jié)合機器學習、深度學習的技術(shù)進行挖掘,得到所謂的“洞見”,即我們說的“有什么趨勢、模型是什么樣的”。在此基礎(chǔ)上我們便可以做預測,甚至幫助人們做一些決策。

像在電信行業(yè),隨著5G網(wǎng)絡(luò)的發(fā)展,對網(wǎng)絡(luò)運維的要求越來越高,如何更好地分配帶寬和頻譜?對于5G網(wǎng)絡(luò)的功耗問題,如何通過智能調(diào)整來進行節(jié)能省電?這些都是在網(wǎng)絡(luò)數(shù)字化的基礎(chǔ)上可以做的事。

《科創(chuàng)板日報》:當下,人工智能算力需求的增長速度大大超過了芯片算力的進步,算力不足成為普遍現(xiàn)象,驅(qū)動計算架構(gòu)從單一通用架構(gòu)(CPU+GPU)到混合異構(gòu)架構(gòu)(CPU+GPU+FPGA+XPU),您對此的看法是?

戴金權(quán):英特爾的策略是XPU。這是一個超異構(gòu)的架構(gòu),包括像CPU的標量計算、GPU的矢量計算、FPGA這樣的空間計算以及各種各樣的加速器。英特爾已經(jīng)做了相應的技術(shù)規(guī)劃,在XPU超異構(gòu)的架構(gòu)上提供不同的計算架構(gòu)來支撐不同的計算應用。

但是,當存在很多不同的異構(gòu)架構(gòu)時,對軟件開發(fā)人員來說是一個非常大的挑戰(zhàn)。所以,我們提出了oneAPI策略,希望從軟件層幫助用戶在跨不同架構(gòu)時,都能進行同樣的編程。通過oneAPI這樣的工具加上底層的計算庫等,提供一個非常無縫的編程體驗。然后在上層,能夠在XPU硬件架構(gòu)以及oneAPI的軟件支持下,構(gòu)建一個可擴展的“數(shù)據(jù)+AI”的平臺,給用戶帶來計算效率、開發(fā)體驗、開發(fā)效率的多維度提升。



  轉(zhuǎn)自:科創(chuàng)板日報

  【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點視頻

前兩個月工業(yè)經(jīng)濟穩(wěn)定恢復,企業(yè)利潤同比繼續(xù)保持增長 前兩個月工業(yè)經(jīng)濟穩(wěn)定恢復,企業(yè)利潤同比繼續(xù)保持增長

熱點新聞

熱點輿情

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964