中國移動研究院發(fā)布通用大模型評測體系白皮書


中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時間:2023-07-24





  7月17日,中國移動研究院、中國移動技術(shù)能力評測中心主辦“2023年大模型評測及應(yīng)用研討會”,旨在共同探討大模型評測體系、應(yīng)用實(shí)踐、產(chǎn)業(yè)標(biāo)準(zhǔn)及合作生態(tài)等議題,推動大模型技術(shù)的廣泛應(yīng)用和發(fā)展。中國中文信息學(xué)會副理事長馬少平、中國移動研究院副院長段曉東出席會議并致辭。


  會上,中國移動研究院聯(lián)合北京郵電大學(xué)、中國科學(xué)院計(jì)算技術(shù)研究所、北京市科學(xué)技術(shù)研究院、科大訊飛、百度、武漢大學(xué)和重慶理工大學(xué)等知名高校、科研機(jī)構(gòu)和頭部企業(yè)聯(lián)合發(fā)布了《“弈衡”通用大模型評測體系白皮書》。該白皮書是行業(yè)中首個大模型評測領(lǐng)域白皮書,基于客觀全面、公平公正和用戶視角的三大原則,創(chuàng)新性地提出了“2-4-6”的“弈衡”通用大模型評測體系。該體系將評估場景劃分為基礎(chǔ)任務(wù)和應(yīng)用任務(wù),明確四項(xiàng)主要評測要素,并制定涵蓋六大維度的50余個評測指標(biāo)。“弈衡”評測體系可對國內(nèi)外大模型開展有效評測分析,充分揭示大模型在應(yīng)用中的固有問題,客觀反映各模型在準(zhǔn)確性、可靠性以及安全性等方面的差異,為大模型的評測實(shí)踐和產(chǎn)業(yè)應(yīng)用提供指導(dǎo)。


  來自中國移動、北京郵電大學(xué)、中國科學(xué)院計(jì)算技術(shù)研究所、信通院、科大訊飛、百度等多家單位的領(lǐng)導(dǎo)和專家,圍繞運(yùn)營商大模型發(fā)展思路、CV大模型前沿技術(shù)、國內(nèi)優(yōu)秀大模型發(fā)展?fàn)顩r、大模型基礎(chǔ)設(shè)施和生態(tài)、行業(yè)評測標(biāo)準(zhǔn)等主題,在會上發(fā)表了精彩演講,為推動大模型技術(shù)發(fā)展奉獻(xiàn)了一場知識盛宴,引起了線上線下與會觀眾的熱烈反響。


  此外,會上正式成立CCIR大模型評測工作組,并發(fā)布“2023 CCIR全國信息檢索挑戰(zhàn)杯”中國移動賽道賽題。


  轉(zhuǎn)自:C114通信網(wǎng)

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964