10月12日,在2024中國移動(dòng)全球合作伙伴大會(huì)期間,中國移動(dòng)攜手央企及產(chǎn)業(yè)各方共同發(fā)布大模型評測體系建設(shè)的重要成果《通用大模型評測標(biāo)準(zhǔn)》,為產(chǎn)業(yè)界遴選優(yōu)質(zhì)大模型提供重要參考依據(jù)。
業(yè)內(nèi)人士認(rèn)為,大模型評測是助力人工智能賦能行業(yè)應(yīng)用的重要一環(huán)。當(dāng)前眾多企業(yè)已啟動(dòng)大模型建設(shè),亟須建立配套的通用大模型和行業(yè)大模型評測體系。
據(jù)介紹,為發(fā)揮大模型評測領(lǐng)域的引領(lǐng)作用,中國移動(dòng)聯(lián)合電子標(biāo)準(zhǔn)院及16家重點(diǎn)央企共同開展大模型評測體系建設(shè)工作。第一階段將圍繞通用領(lǐng)域和4個(gè)重點(diǎn)行業(yè)領(lǐng)域,從評測標(biāo)準(zhǔn)制定、評測基地建設(shè)、評測試點(diǎn)應(yīng)用等方面開展工作。
目前,中國移動(dòng)攜手央企及產(chǎn)業(yè)各方遵循“確保評測權(quán)威、加強(qiáng)業(yè)界協(xié)同、解決實(shí)際問題、保持開放態(tài)度”的原則,初步完成通用大模型評測標(biāo)準(zhǔn)制定,得到行業(yè)龍頭央企、業(yè)界頭部公司、知名高校及科研機(jī)構(gòu)充分認(rèn)可,為后續(xù)試點(diǎn)評測等工作奠定了堅(jiān)實(shí)基礎(chǔ)。
通用大模型評測標(biāo)準(zhǔn)基于“2-4-6”框架?!?”代表兩類評測視角,以重點(diǎn)行業(yè)實(shí)際使用需求為導(dǎo)向,與國標(biāo)對模型能力要求拉齊,將評測任務(wù)劃分為理解和生成兩類視角?!?”代表四類評測要素,從評測全生命周期中提取出評測工具、評測數(shù)據(jù)、評測方式和評測指標(biāo)四類關(guān)鍵要素,確保評測工作可實(shí)施性?!?”代表六大評測維度,綜合考慮大模型應(yīng)用過程中的核心能力,設(shè)定功能性、準(zhǔn)確性、可靠性、安全性、交互性和應(yīng)用性六大維度。該標(biāo)準(zhǔn)廣泛吸納產(chǎn)學(xué)研用各方意見,并結(jié)合行業(yè)特色場景需求,可為通用大模型全面評估提供客觀依據(jù),為AI賦能千行百業(yè)提供保障。
據(jù)悉,中國移動(dòng)將聯(lián)合行業(yè)龍頭企業(yè)、業(yè)界頭部公司、知名高校和科研機(jī)構(gòu),深入挖掘石油、電力、交通和物流等重點(diǎn)行業(yè)應(yīng)用需求,持續(xù)打造并完善通用及行業(yè)大模型評測體系,積極建設(shè)大模型評測基地,廣泛征集各中央企業(yè)及頭部民企積極參與大模型評測,打造落地應(yīng)用最佳實(shí)踐。(記者 郭倩)
轉(zhuǎn)自:經(jīng)濟(jì)參考網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀
版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964