云知聲上市穩(wěn)健推進,山海多模態(tài)大模型帶來多模態(tài)擬人交互體驗


中國產業(yè)經濟信息網   時間:2024-09-04





  2022年底,ChatGPT橫空出世。市場玩家蜂擁而上,希望能從這個風口上分得一杯羹。國內的硬科技賽道、企業(yè)服務和數字化服務賽道等多個行業(yè)也都在積極部署大模型,后半年甚至上演了轟轟烈烈的“百模大戰(zhàn)”。但時至今日,實現大模型商業(yè)化的玩家并不多見,云知聲卻尋找到了自己的答案,自推出山海大模型,始終堅持商業(yè)化之路,深入各個行業(yè)應用,并在不久前上線山海多模態(tài)大模型,繼續(xù)朝AGI邁進。

  云知聲積極布局大模型,賦能各行業(yè)智能化轉型

  云知聲是較早部署大模型的玩家之一。

  早在2017年,云知聲就在Transformer算法上取得了突破。2018年,在BERT算法上又有了新成果。云知聲依據其在自然語言處理上的積累,以及在交互式AI方面的研發(fā)能力,率先推出基于BERT的大語言模型Unicore,作為云知聲的中心技術平臺云大腦的初始核心算法模型。

  在Unicore不斷演進和迭代中,云知聲在2023年推出了擁有600億個參數的自有大模型產品山海大模型。與Unicore大模型相比,山海大模型有更大的數據規(guī)模、強大的多語言知識能力、指令調優(yōu)和人類反饋強化,最終通過MaaS適配醫(yī)療、酒店、交通等諸多場景。尤其在云知聲主營的智慧生活和智慧醫(yī)療場景中,很好地賦能企業(yè)客戶提高質量和效率,降低成本和失誤。

  邁向AGI關鍵一步,云知聲推出山海多模態(tài)大模型

  2024年8月,云知聲再次發(fā)力大模型領域,推出山海多模態(tài)大模型,迎來“Her時代”。通過整合跨模態(tài)信息,山海多模態(tài)大模型能夠接收文本、音頻、圖像等多種形式作為輸入,并實時生成文本、音頻和圖像的任意組合輸出,帶來實時多模態(tài)擬人交互體驗。

  山海多模態(tài)大模型更加能聽會說,帶來智能化的語音交互,實現了實時秒回和自由插話的功能,使得語音交互與現實對話中的響應時間相似,用戶幾乎感知不到延遲。同時,它還具備感知和表達情緒的能力,能夠通過語音文本和語氣、節(jié)奏、音調等微妙變化來準確感知用戶的情緒狀態(tài),并給予適當的情感反饋。此外,山海還支持音色自由切換,可以根據用戶的個性化需求來打造專屬聲音,增強對話的生動性和趣味性。

  山海多模態(tài)大模型看得見讀得懂,擁有更直覺的視覺交互。它能夠通過攝像頭看見周圍環(huán)境,實現所見即所得的精準識別,從場景理解分析到物體信息描述都能精準拿捏。同時,山海還具備圖像創(chuàng)意生成的能力,可以根據用戶指令快速創(chuàng)建視覺內容,并提供符合個性化需求的定制畫面。

  云知聲在AI領域的持續(xù)探索和創(chuàng)新,特別是在大模型及多模態(tài)交互技術方面的突破,展現了其深厚的技術積累和市場洞察力。山海多模態(tài)大模型的推出,更是云知聲邁向AGI關鍵一步的重要標志,也為不同行業(yè)帶來了全新的交互體驗和應用可能性,為用戶帶來更加智能、便捷和人性化的交互體驗!


  轉自:中國網

  【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業(yè)經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。

延伸閱讀

?

版權所有:中國產業(yè)經濟信息網京ICP備11041399號-2京公網安備11010502035964