當前位置首頁 > 行業(yè) > 通信 >

中國移動攜手央企及產(chǎn)業(yè)各方發(fā)布通用大模型評測標準

中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng) 時間：2024-10-14

　　10月12日，在2024中國移動全球合作伙伴大會期間，中國移動攜手央企及產(chǎn)業(yè)各方共同發(fā)布大模型評測體系建設的重要成果《通用大模型評測標準》，為產(chǎn)業(yè)界遴選優(yōu)質(zhì)大模型提供重要參考依據(jù)。

　　大模型評測是助力人工智能賦能行業(yè)應用的重要一環(huán)。當前眾多企業(yè)已啟動大模型建設，亟需建立配套的通用大模型和行業(yè)大模型評測體系。

　　為發(fā)揮大模型評測領(lǐng)域的引領(lǐng)作用，中國移動聯(lián)合電子標準院及16家重點央企共同開展大模型評測體系建設工作。第一階段將圍繞通用領(lǐng)域和4個重點行業(yè)領(lǐng)域，從評測標準制定、評測基地建設、評測試點應用等方面開展工作。

　　目前，中國移動攜手央企及產(chǎn)業(yè)各方遵循“確保評測權(quán)威、加強業(yè)界協(xié)同、解決實際問題、保持開放態(tài)度”的原則，初步完成通用大模型評測標準制定，得到行業(yè)龍頭央企、業(yè)界頭部公司、知名高校及科研機構(gòu)充分認可，為后續(xù)試點評測等工作奠定了堅實基礎(chǔ)。

　　通用大模型評測標準基于“2-4-6”框架?！?”代表兩類評測視角，以重點行業(yè)實際使用需求為導向，與國標對模型能力要求拉齊，將評測任務劃分為理解和生成兩類視角?！?”代表四類評測要素，從評測全生命周期中提取出評測工具、評測數(shù)據(jù)、評測方式和評測指標四類關(guān)鍵要素，確保評測工作可實施性。“6”代表六大評測維度，綜合考慮大模型應用過程中的核心能力，設定功能性、準確性、可靠性、安全性、交互性和應用性六大維度。該標準廣泛吸納產(chǎn)學研用各方意見，并結(jié)合行業(yè)特色場景需求，可為通用大模型全面評估提供客觀依據(jù)，為AI賦能千行百業(yè)提供保障。

　　未來，中國移動將聯(lián)合行業(yè)龍頭企業(yè)、業(yè)界頭部公司、知名高校和科研機構(gòu)，深入挖掘石油、電力、交通和物流等重點行業(yè)應用需求，持續(xù)打造并完善通用及行業(yè)大模型評測體系，積極建設大模型評測基地，廣泛征集各中央企業(yè)及頭部民企積極參與大模型評測，打造落地應用最佳實踐，為提升AI+行業(yè)新質(zhì)生產(chǎn)力，保障國產(chǎn)大模型高質(zhì)量發(fā)展，貢獻央企力量。（記者李方）

　　轉(zhuǎn)自：中國經(jīng)濟網(wǎng)

返回產(chǎn)經(jīng)網(wǎng)首頁 >>

　　【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品，轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”，違者本網(wǎng)將保留追究其相關(guān)法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊，僅代表作者個人觀點，不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系：010-65363056。

延伸閱讀

熱點視頻

上半年汽車工業(yè)多項經(jīng)濟指標創(chuàng)新高

熱點新聞

熱點輿情

中國移動攜手央企及產(chǎn)業(yè)各方發(fā)布通用大模型評測標準

熱點視頻

熱點新聞

熱點輿情

微信公眾號