《通用大模型評測標準》發佈
記者從中國移動集團獲悉,10月12日,在2024中國移動全球合作伙伴大會期間,中國移動攜手工信部中國電子技術標準化研究院、中國電信、國家電網、中國石油、科大訊飛等產業各方共同發佈了大模型評測體系建設的新成果——《通用大模型評測標準》,爲產業界遴選優質AI大模型提供重要參考依據。
中國移動董事長楊傑在大會上表示,當今,以數智化爲主要特徵的新一輪科技革命和產業變革深入發展,數據、算力、人工智能成爲新質生產力的重要驅動因素。AI加速發展,爲千行百業、千家萬戶注智賦能,將有力推動融合創新、信息消費不斷躍升,引領經濟社會從“互聯網+”“5G+”邁向“AI+”。
據瞭解,大模型評測是助力人工智能賦能行業應用的重要一環。當前衆多企業已啓動大模型建設,亟需建立配套的通用大模型和行業大模型評測體系。中國移動聯合電子標準院、央企及產業各方初步完成通用大模型評測標準制定。
據介紹,此次發佈的評測標準基於“2-4-6”框架:“2”代表兩類評測視角,以重點行業實際使用需求爲導向,將評測任務劃分爲理解和生成兩類視角;“4”代表四類評測要素,從評測全生命週期中提取出評測工具、評測數據、評測方式和評測指標四類關鍵要素;“6”代表六大評測維度,綜合考慮大模型應用過程中的核心能力。該標準廣泛吸納產學研用各方意見,並結合行業特色場景需求,可爲通用大模型全面評估提供客觀依據和重要參考。
下一步,中國移動將聯合產學研用各方,深入挖掘石油、電力、交通和物流等重點行業應用需求,持續打造並完善通用及行業大模型評測體系,助力國產大模型高質量發展。(記者高亢)