記者從中國移動集團獲悉,10月12日,在2024中國移動全球合作伙伴大會期間,中國移動攜手工信部中國電子技術(shù)標(biāo)準(zhǔn)化研究院、中國電信、國家電網(wǎng)、中國石油、科大訊飛等產(chǎn)業(yè)各方共同發(fā)布了大模型評測體系建設(shè)的新成果——《通用大模型評測標(biāo)準(zhǔn)》,為產(chǎn)業(yè)界遴選優(yōu)質(zhì)AI大模型提供重要參考依據(jù)。
中國移動董事長楊杰在大會上表示,當(dāng)今,以數(shù)智化為主要特征的新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,數(shù)據(jù)、算力、人工智能成為新質(zhì)生產(chǎn)力的重要驅(qū)動因素。AI加速發(fā)展,為千行百業(yè)、千家萬戶注智賦能,將有力推動融合創(chuàng)新、信息消費不斷躍升,引領(lǐng)經(jīng)濟社會從“互聯(lián)網(wǎng)+”“5G+”邁向“AI+”。
據(jù)了解,大模型評測是助力人工智能賦能行業(yè)應(yīng)用的重要一環(huán)。當(dāng)前眾多企業(yè)已啟動大模型建設(shè),亟需建立配套的通用大模型和行業(yè)大模型評測體系。中國移動聯(lián)合電子標(biāo)準(zhǔn)院、央企及產(chǎn)業(yè)各方初步完成通用大模型評測標(biāo)準(zhǔn)制定。
據(jù)介紹,此次發(fā)布的評測標(biāo)準(zhǔn)基于“2-4-6”框架:“2”代表兩類評測視角,以重點行業(yè)實際使用需求為導(dǎo)向,將評測任務(wù)劃分為理解和生成兩類視角;“4”代表四類評測要素,從評測全生命周期中提取出評測工具、評測數(shù)據(jù)、評測方式和評測指標(biāo)四類關(guān)鍵要素;“6”代表六大評測維度,綜合考慮大模型應(yīng)用過程中的核心能力。該標(biāo)準(zhǔn)廣泛吸納產(chǎn)學(xué)研用各方意見,并結(jié)合行業(yè)特色場景需求,可為通用大模型全面評估提供客觀依據(jù)和重要參考。
下一步,中國移動將聯(lián)合產(chǎn)學(xué)研用各方,深入挖掘石油、電力、交通和物流等重點行業(yè)應(yīng)用需求,持續(xù)打造并完善通用及行業(yè)大模型評測體系,助力國產(chǎn)大模型高質(zhì)量發(fā)展。
來源 |新華網(wǎng)
轉(zhuǎn)自:中國標(biāo)準(zhǔn)化