☰

看不見的大模型，看得見的生產力

在大模型領域，智源是全球唯一沒有背靠大廠的非企業研究機構，也是國內最早系統佈局大模型技術研發、開源生態建設、人才培養和企業培育的新型研究機構。“過去每次科技平權都能催生重大產業機會”，既有企業從業經驗又有研究機構背景的新任智源院長王仲遠，對科技賦能產業的體會更深。國家對人工智能的定義也更加具體：人工智能是發展新質生產力的重要引擎。

功夫下在風口之前

一次兩次，月之暗面CEO楊植麟在2024北京智源大會現場被參會者圍了至少三次，一年前OpenAI創始人山姆·奧特曼在智源大會視頻發言時，現場的躁動同樣明顯。

2023—2024年，AI科學家、科技大廠CEO、明星初創企業創始人聚在各種場面爲大模型佈道，臺上的不管是不是技術咖，或多或少都聽過智源的名號，不少還直接參與過智源當年的大模型研究項目。百度CTO王海峰曾擔任智源理事、智譜AI創始人唐傑曾任智源副院長、楊植麟參與過悟道的研發。

這些AI弄潮兒不是當下才與智源結緣，智源也不是在大模型風起後才投身其中。

2019年，智源開始佈局大模型，2020年組建悟道攻關團隊、啓動大模型研發。2021年3月首發悟道1.0大模型，6月又拿出了悟道2.0，智源用1.75萬億的參數創造了當時“世界最大”大模型紀錄，是OpenAI彼時最先進的大模型GPT-3參數量的10倍。

科研講究體感，要提出問題，作出判斷。“人工智能大模型時代即將到來”的判斷，給了智源毫無保留的勇氣，就連“大模型”這個中文詞彙，都是智源最先提出的。

何爲大模型？智源研究院理事長黃鐵軍認爲要具備三個條件：規模要大，參數達百億規模以上；涌現性，能夠產生預料之外的新能力；通用性，不限於專門問題或領域，能夠處理多種不同的任務。

2023年大模型進入公衆視野，悟道系列模型已升級到3.0版本，涵蓋語言、視覺、多模態等基礎大模型，並全面開源。當時斯坦福大學關於基礎模型的討論中，智源與Google、微軟、Facebook（現Meta）等科技巨頭並列，成爲世界大模型研究的代表性機構。

“歷史上多數研究成果的出現是偶然事件，沒人能規劃出來，所有努力都是爲了提升概率——匯聚優秀的研究人員，爲他們提供能夠碰撞思想、發現問題、尋找協作夥伴的社區環境。”智源研究院創始理事長張宏江給圖靈獎獲得者Yann LeCun自傳寫的序言，更像智源後發先至的原因。

要做系統工程

2018年初，北京市出臺《北京市支持建設世界一流新型研發機構實施辦法》，進行科技體制的飛躍式改革。12月，在科技部和北京市委市政府的指導和支持下，智源正式成立。

此前，科研管理流程複雜，從立項建議到指南發佈再到經費申請、評審通過，週期漫長，難以適應強競爭環境下日新月異的科研需求。按照這種體制，研究機構2020年10月提出立項建議，最快2022年才能正式展開大模型研究。智源模式從立項到推出大模型，只用了不到5個月。

這是一種介於大學和企業的新型研發機構。新在不以論文爲最終評價指標，不以產品爲評價指標，而是要做創新性系統；新在把清華、北大、Facebook人工智能實驗室、百度等不同機構以及企業的學者聚在一起辦大事；新在瞄向大問題，保持對重大科學問題的敏銳眼光，進行前瞻佈局。

“高校模式已經運行了幾十年，較難有組織、有規模、跨團隊地做系統性研發。企業也會投入做研發，但更傾向於研發與業務強相關的。智源會做3—5年甚至更長時間才能看到成果的研究項目。”王仲遠在接受北京商報記者專訪時表示。

當下，智源的信心還在於國家對人工智能的篤定。2024年3月，中共中央政治局常委、國務院總理李強在北京調研時明確：人工智能是發展新質生產力的重要引擎。

新質生產力是創新起主導作用，擺脫傳統經濟增長方式、生產力發展路徑，具有高科技、高效能、高質量特徵，符合新發展理念的先進生產力質態。它由技術革命性突破、生產要素創新性配置、產業深度轉型升級而催生。“過去每次科技平權都能夠催生重大產業機會，大模型可以帶來新的科技平權。”王仲遠堅信。

打個比方，大模型是“智力”的載體，以AI爲中心的浪潮是智力運營，最底層是技術軟硬件系統，最上層是AI應用，大模型處於兩者中間，扮演“樹幹”的角色。大模型的意義是將“智力”變成像水、電、網一樣的公共服務，通過雲計算向大量企業或個人提供AI服務。

這是一個系統工程，“需要集中投入資源、集中人力，不能很多人在做但各做一攤，而是要形成一個技術體系”。黃鐵軍舉例。“發展人工智能就如同鍊鋼和發電，需要一整套技術體系來保證生產出高質量的鋼、以比較低的成本穩定地發電等。”黃鐵軍說。

要比產業走得更超前

智源搭建的技術體系包括：大模型全家桶、大模型操作系統、數據集、訓練框架、算子庫等。這些成績和智源的願景目標等一起掛在智源大廈一樓的牆上。

願景目標分成機制體制、產業發展等五大板塊，總結起來就是創新。“智源要做最前沿的人工智能技術的研發，去引領和預判人工智能的發展，要比產業走得更超前。”王仲遠詳細解釋，“智源會做高校做不了、企業不願做的研發，做3—5年甚至更長時間才能看到成果的研究項目。”在他看來，當大模型技術能力達到一定程度後，會分出兩大方向，“一個方向去跟產品結合，推動應用，發揮商業化價值。另一方面，有少量的幾家機構持續做最頂尖的大模型的迭代和優化。不管企業還是研究機構，應該繼續去攻堅技術”。

比如多模態，國內絕大部分的企業都選擇DiT架構進行研發。“這是因爲DiT是已經被驗證的路線，智源希望把不同模態的信息，比如文字、圖像、視頻、語音，從一開始就放在一個模型裡訓練。”王仲遠用人腦比喻，“這種多模態大模型能夠看到世界、理解和推理。未來，大模型跟硬件結合，也就是具身智能,能夠進入物理世界服務人類。”

企業貼近市場，向上找場景，研發機構聚焦核心技術突破，向下做加持，智源屬於第二種，和應用與場景離得較遠，卻用開源的方式做產業界的後盾。

“人工智能不等同於大模型，它只是人工智能的一個流派。”王仲遠向北京商報記者解釋。當下的智源也對類腦研究、數字心臟等其他人工智能技術全力以赴，這意味着人工智能在其他產業的想象空間沒有上限。

北京商報記者魏蔚

看不見的大模型，看得見的生產力

相關資訊