原創(chuàng) 要聞 證券 基金 保險 銀行 上市公司 IPO 科創(chuàng)板 汽車 新三板 科技 房地產(chǎn)

虛擬人盛宴亟待釜底加薪 人工智能技術(shù)頭角崢嶸


中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時間:2022-02-16





  北京冬奧會上,虛擬人熱度有點高。開賽前夕,央視首位AI手語主播正式亮相,為聽障人士提供專業(yè)賽事解說。近日,有觀眾發(fā)現(xiàn)會場的實時氣象主播,也是一位AI虛擬主持人。

  “虛擬人的應(yīng)用場景很廣闊,未來其口碑和商業(yè)化雙重認(rèn)證,都會給傳統(tǒng)的商業(yè)模式帶來變革?!憋L(fēng)語筑副總經(jīng)理張樹玉表示,“樂觀預(yù)期,未來一年里,每個人都可能在虛擬世界擁有自己的數(shù)字身份?!?/p>

  近日,上海證券報記者走訪多家虛擬人相關(guān)企業(yè)了解到,虛擬人頻繁上鏡的背后,是人工智能產(chǎn)業(yè)多年發(fā)展的水到渠成。當(dāng)數(shù)字經(jīng)濟(jì)浪潮來襲,不斷拓展商用邊界的人工智能技術(shù)已然嶄露頭角。

  硬核技術(shù)“畫皮畫骨”

  在技術(shù)層面,虛擬人并不是新鮮事物。1982年,動畫作品《超時空要塞》中的女主角林明美,憑借動人的歌聲與純真的人設(shè)走紅,成為全球首個虛擬歌手。如今,隨著人工智能技術(shù)不斷迭代,虛擬人正從平面動畫走向廣闊天地。

  “解構(gòu)虛擬人的概念可以發(fā)現(xiàn),它的核心在于身份和資產(chǎn)。”民生證券元宇宙首席分析師馬天詣表示,虛擬人的各種應(yīng)用場景,本質(zhì)上是圍繞這兩個核心概念展開,“具體可以分為三種,第一種是真人的分身,比如明星的虛擬形象;第二種是大眾重構(gòu)的虛擬身份,比如大家各種游戲里的角色;第三種是作為一種商業(yè)資產(chǎn)的虛擬偶像?!?/p>

  萬變不離其宗,人工智能技術(shù)毫無疑問是支撐起虛擬人發(fā)展的關(guān)鍵,背后是新一輪數(shù)字經(jīng)濟(jì)浪潮滾滾而來。

  “虛擬人至少要具備一個獨一無二的形象,還有一定的交互功能,后者就涉及自然語言學(xué)習(xí)等方面?!币晃粯I(yè)內(nèi)人士透露,盡管經(jīng)歷了近40年的迭代,虛擬人的制作成本不斷下降,但是單個制作成本依然在百萬元級別。

  這么高的造價,虛擬人究竟貴在哪里?

  風(fēng)語筑虛擬人項目負(fù)責(zé)人陳云翔解釋稱,人物需要大量的毛發(fā)建模,這背后是算力渲染支持。正常成年人一般有10萬根左右的頭發(fā),許多虛擬人為了達(dá)到更高的建模要求,頭發(fā)數(shù)量會達(dá)到20萬至30萬根。

  “我們之前一段動畫CG中,一個核心角色及其服裝的建模面數(shù)就達(dá)到400萬,精細(xì)到服飾上的水晶珠寶,這些不同立面還會與光影環(huán)境交互,運算量也隨之大幅增加?!悲B紙科技相關(guān)負(fù)責(zé)人透露,公司一段2分鐘的CG動畫《雙城奇遇記》,最終耗時4個月才完成。

  此外,動作捕捉也是技術(shù)難點,一位業(yè)內(nèi)人士表示,由于人眼可以在毫秒級別的動作中,判斷出對象是否為真人,因此虛擬人的動作要足夠自然流暢,才能“騙”過人眼。這些都需要強(qiáng)勁的硬件設(shè)備、優(yōu)異的人工智能算法。

  為了應(yīng)對未來更大規(guī)模的虛擬人創(chuàng)造,讓人工智能“更聰明”也是行業(yè)需要解決的核心問題。

  一個典型的例子便是虛擬人“捏臉”?!昂每词且粋€很主觀的事情,很難直接告訴人工智能如何去做。”談到自動生成外貌,網(wǎng)易瑤臺工程師晚豐表示,目前人工智能訓(xùn)練中主要手段仍是特征量化,在大量訓(xùn)練之后,美術(shù)的意見依然至關(guān)重要。“比如,我們將面部的一處細(xì)節(jié)調(diào)整幅度設(shè)定為1至11,人工智能就會隨機(jī)在區(qū)間調(diào)整,但它是不會考慮整體氣質(zhì)的問題,因為氣質(zhì)無法量化?!?/p>

  “替代真人”恐難實現(xiàn)

  今年初,萬科首位虛擬人員工“崔筱盼”獲評2021年萬科年度最佳新人獎的消息,一度引發(fā)熱議,也讓部分網(wǎng)友擔(dān)心,未來虛擬人是否取代人類的工作。

  清華大學(xué)新聞學(xué)院教授沈陽認(rèn)為,這種擔(dān)憂有些多余。虛擬人要完全替代人,有賴于人工智能技術(shù)的進(jìn)步,短期內(nèi)還不可能實現(xiàn),至少還要幾十年。

  畫衣畫皮難畫骨,即使在“人工智能”火爆的今日,虛擬人還遠(yuǎn)遠(yuǎn)無法比肩自然人,具體來看可以歸納為兩點:談吐與氣質(zhì)。

  作為人工智能領(lǐng)域的核心技術(shù),自然語言學(xué)習(xí)一直是各大技術(shù)巨頭力求攻克的難點。經(jīng)過近10年發(fā)展,在機(jī)器學(xué)習(xí)已取得長足進(jìn)步的今日,自然語言學(xué)習(xí)已初現(xiàn)曙光。顯卡龍頭英偉達(dá)的CEO黃仁勛在此前的一次演講中,推出了一個無所不知的“Q版黃仁勛”――Toy-Me。演示中,Toy-Me可實現(xiàn)和人的自然語言交流。

  “自然人之間的交流,話語間隔的推理時間基本在半秒以內(nèi),這要求計算機(jī)在半秒內(nèi)理解自然語義,然后生成最為合適的回答?!鼻笆鰳I(yè)內(nèi)人士表示,這要求虛擬人有巨大的語料庫。英偉達(dá)披露,Toy-Me使用的預(yù)訓(xùn)練自然語言處理模型Megatron 530B,目前為業(yè)內(nèi)規(guī)模最大,通過達(dá)萬億參數(shù)級別的語言模型訓(xùn)練,在11天時間里,讓AI實現(xiàn)GPT-3(第三代生成式預(yù)訓(xùn)練)的水平。

  該業(yè)內(nèi)人士表示,這種技術(shù)距離商業(yè)化依然遙遠(yuǎn),“這個級別的訓(xùn)練成本接近500萬美元,其依托的語料數(shù)據(jù)接近300TB?!蹦壳埃瑖鴥?nèi)大部分虛擬人還不具備實時語言交互功能,相關(guān)技術(shù)還有很長的路要走。各類虛擬人更接近于影視工業(yè)化的創(chuàng)作小樣,依托的還是已有的影視技術(shù)。

  如果說“談吐”還能通過大數(shù)據(jù)深度學(xué)習(xí)模擬,“氣質(zhì)”則完全無法用現(xiàn)有技術(shù)復(fù)刻,這也是許多游戲行業(yè)人士的共識。

  “‘暖暖’作為系列游戲的主角,對我們而言,更多時候是一個活生生的人,有著自己的思想和生活態(tài)度。”疊紙科技相關(guān)負(fù)責(zé)人表示,從游戲開發(fā)的角度看,這些角色的內(nèi)在氣質(zhì)需要文案師精心把控。在他看來,交互的背后是人物對于所處環(huán)境、所遇事件產(chǎn)生的想法和觀點,這些既跟角色設(shè)定有關(guān),又必須考慮隨時出現(xiàn)的變量??紤]到這些因素,盡管“暖暖”已經(jīng)擁有了不亞于任何虛擬人的3D形象,甚至還有自己的CG短片、MV歌曲,但疊紙科技AI技術(shù)的產(chǎn)出應(yīng)用短期內(nèi)還處于探索階段。



  轉(zhuǎn)自:上海證券報

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點視頻

突破6萬億美元 2021年我國外貿(mào)進(jìn)出口規(guī)模再創(chuàng)歷史新高 突破6萬億美元 2021年我國外貿(mào)進(jìn)出口規(guī)模再創(chuàng)歷史新高

熱點新聞

熱點輿情

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964