黃鐵軍:AI產業應從“大煉模型”邁向“煉大模型”

新京報貝殼財經訊(記者 羅亦丹)3月20日,北京智源人工智能研究院發佈了包括中文、多模態、認知、蛋白質預測在內的超大規模智能模型“悟道1.0”。智源研究院院長,北京大學信息科學技術學院教授黃鐵軍表示,近年來人工智能的發展,已經從“大煉模型”逐步邁向了“煉大模型”階段。

“過去五年多,全球研究人工智能研究者最重要的就是訓練各種各樣的模型,這幾年有一點‘千村萬戶煉模型’的狀態。不論大小公司還是學校,都是拿一個開源的框架,收集一批數據,然後拿着這個模型去解決問題。雖然這是可以成功的,但作爲一個現代化產業,近年來人工智能的發展應該從家家戶戶‘大煉模型’的狀態逐漸變爲把資源匯聚起來,訓練超大規模模型的階段,通過設計先進的算法,整合儘可能多的數據,匯聚大量算力,集約化地訓練大模型,供大量企業使用,這是必然趨勢。”黃鐵軍表示。

智源研究院學術副院長唐傑介紹,“悟道1.0”先期啓動了4個大模型的研發,包括面向中文的預訓練語言模型、首個公開的中文通用圖文多模態預訓練模型、我國首個具有認知能力的超大規模預訓練模型以及超大規模蛋白質序列預測預訓練模型。

新京報貝殼財經記者瞭解到,以其中文通用圖文多模態預訓練模型爲例,該模型參數量達10億,基於從公開來源收集到的5000萬個圖文進行訓練,是首個公開的中文通用圖文多模態預訓練模型。目前,該模型已經落地了可以爲用戶上傳照片配文,以及利用圖片和歌詞相關性爲用戶上傳照片搭配音樂的小程序及應用。

新京報貝殼財經記者 羅亦丹 編輯 嶽彩周 校對 趙琳

來源:新京報