GITEX GLOBAL2024開展,Soul 最新多模態(tài)大模型引關(guān)注


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2024-10-19





  如今的 AI 看起來已經(jīng)無所不能,不僅能夠勝任感知、學(xué)習(xí)、推理、決策等不同層面的任務(wù),甚至可以打造虛擬數(shù)字分析,為人類帶來多模態(tài)AI交互體驗。近日, 新型社交平臺Soul App 在GITEX GLOBAL海灣信息技術(shù)博覽會上展出了其最新自研的多模態(tài)大模型,該模型具備多模態(tài)理解、真實擬人、文字對話、語音通話、多語種等特性,實現(xiàn)打破次元壁的互動,讓現(xiàn)場的觀眾們驚艷不已。

  3D數(shù)字孿生,虛擬與現(xiàn)實的創(chuàng)新交互

  Soul作為國內(nèi)較早將AI引入社交關(guān)系的互聯(lián)網(wǎng)平臺代表之一,此次攜最新自研的多模態(tài)大模型參展GITEX GLOBAL 2024,向世界展現(xiàn)了中國企業(yè)在社交領(lǐng)域的最新應(yīng)用實踐和數(shù)字娛樂的創(chuàng)新方案。此次是Soul首次亮相國際大型展會,其自研的多模態(tài)大模型集合文字、語音、動作交互等多模態(tài)方向,實現(xiàn)更接近人類模式的互動體驗和更高效、自然、豐富維度的信息傳遞。

  大會上,現(xiàn)場觀眾可以實現(xiàn)高相似度的3D虛擬人的AI建模,通過包含人臉的90余個形狀參數(shù)和6個屬性參數(shù),于幾秒鐘內(nèi),快速在3D世界精細化還原真實人臉的特征 ,打造專屬的虛擬化身。同時,基于實時的人體動作識別、數(shù)字還原以及多模態(tài)對話交互能力,實現(xiàn)3D虛擬人與真人的沉浸式互動。

  多模態(tài)端到端大模型,超擬人的情感體驗

  事實上,自成立以來Soul便一直聚焦于多模態(tài)大模型方向持續(xù)深耕。

  在推出智能推薦引擎“靈犀”、以AI算法助力社交關(guān)系的發(fā)現(xiàn)沉淀環(huán)節(jié)后,2020年,Soul正式啟動對AIGC的技術(shù)研發(fā)工作,系統(tǒng)推進在智能對話、語音技術(shù)、3D虛擬人等AIGC關(guān)鍵技術(shù)能力研發(fā)工作,并推動AI能力在社交場景的快速落地。

  目前,Soul已先后上線了自研語言大模型Soul X,以及語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力。今年6月,Soul還在社交行業(yè)中較早推出了自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風(fēng)格語言,實現(xiàn)更接近生活日常的交互對話和“類真人”的情感陪伴體驗。

  多模態(tài)端到端大模型的推出標(biāo)志著Soul對人機交互體驗的創(chuàng)新突破,同時,從文字、語音到視覺的模態(tài)升級,也意味著交互方式的顛覆式改變。在未來,Soul將持續(xù)加大對AI技術(shù)的投入,致力于通過AI技術(shù)更好地幫助用戶進行社交破冰,助力人設(shè)搭建和認知決策,提升社交溝通效率。


  轉(zhuǎn)自:中國網(wǎng)

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

?

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964