百川智能發佈2代開源大模型,王小川:已超越LLaMA 2

經濟觀察網 記者 任曉寧

9月6日下午,百川智能在北京發佈Baichuan 2系列開源大模型,這些模型可免費商用,百川智能創始人兼CEO王小川說,其開源模型已經全面超越了LLaMA2的性能。

LLaMA2發佈於今年7月19日,由美國互聯網大廠Meta推出,當時在全球引起轟動,外界評價說,LLaMA2的開源將可能影響大模型最終格局。

Baichuan 2開源大模型主要包括Baichuan2-7B和Baichuan2-13B,二者分別爲70億參數和130億參數。王小川說,其70億參數模型在英文評測級上,已經能夠齊平LLaMA2的130億參數模型,能夠做到“以小博大”。

同爲大模型創業者的瀾舟科技創始人兼CEO周明也來到百川智能發佈會,周明說,國外開源模型更多是支持英文爲主的西方語言,對中文的支持要麼不足,要麼不太友好。他認爲,Baichuan2兩款模型,對中文用戶的支持非常友好,而且它的性能在很多方面都超越了英文同等尺寸模型,因此是對中國大模型領域研究和應用的利好消息。

Baichuan 2大模型建立在上一代產品基礎上,王小川解釋說,跟第一代相比,新產品文科、理科能力均得到提升,此外,其代碼能力、安全能力、邏輯、語義理解也有明顯的提升。

百川智能上一代大模型開源後下載量超過500萬次,有200多家企業申請試用百川開源模型,包括雲廠商、科技製造公司、消費公司等。在百川智能列出的名單裡,阿里雲、蔚來汽車、美的集團都是合作伙伴。

百川智能成立於今年4月10日,4個月時間內已發佈了3款大模型產品,也是國內首批通過《生成式人工智能服務管理暫行辦法》備案的8家大模型公司之一。此次百川智能又快速推出了2代產品,王小川解釋說,因爲百川智能之前有搜索基因,因此天然懂得如何從萬億網頁中間去精選最好的頁面,可以做到去重、反垃圾。在數據處理中,百川智能也借鑑了之前搜索的經驗,能小時級完成千億數據的清洗和去重工作。

版權聲明:以上內容爲《經濟觀察報》社原創作品,版權歸《經濟觀察報》社所有。未經《經濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行爲主體的法律責任。版權合作請致電:【010-60910566-1260】。

任曉寧經濟觀察報記者

TMT新聞部資深記者關注並報道TMT(科技、傳媒、通信)領域重大事件,擅長行業分析、深度報道。聯繫郵箱:renxiaoning@eeo.com.cn微信號:tangtangxiaomo