AI大模型“開閉源”論戰再起,商業價值決定路線選擇丨GAI進化論

21世紀經濟報道記者張梓桐 上海報道

近日,Meta發佈了其最新版本的開源大模型Llama 3,引起開源AI社區“地震”。衆多業內人士將其稱之爲“迄今爲止功能最強的開源LLM(大語言模型)”。

但與技術變革相伴而生的,是又一輪“開源閉源”的爭議浪潮。

4月27日,在人工智能行業從業六年,美國最爲知名的AI創業者之一的Arsenii Shatokhin在一場採訪中直言,企業自己運行開源大模型效率低於閉源,在他公司的客戶中只有一兩個有足夠資源,來精調或運行700億參數的Llama開源模型。

而與其持有同樣觀點的還有百度創始人李彥宏,日前他在Create 2024百度AI開發者大會上直言:“開源模型會越來越落後,Llama 3比之前發佈的任何開源模型都大得多,對他的客戶而言,使用這款開源大模型,反而不如閉源的商業大模型效率高。”

此言一出立刻引起了AI業界的爭辯浪潮,“開源忠實信徒”周鴻禕便在公開場合發表觀點稱,“我是一直相信開源的,至於說網上有些名人胡說八道,你們別被忽悠了,他說開源不如閉源好?連說這話的公司自己都是藉助了開源的力量才成長到今天。”

對此,銜遠科技COO、創始合夥人王曉波在接受21世紀經濟報道記者採訪時表示,選擇走通用人工智能之路的基座大模型路線核心特點是“贏者通吃”。

“這個行業可能會有很多玩家入局、但最後活下來的可能只有幾家。而使用開源大模型路線的公司在業務開展速度方面有着明顯優勢,但缺點是較易被替代。”王曉波說道。

開源閉源之爭

自OpenAI橫空出世以來,開源和閉源的選擇一直是大模型領域的熱點話題,OpenAI的GPT-4模型就是採用閉源模式,微軟則開源了WizardLM-2。國內,百川智能、智源都是開源的支持者,通義千問亦有開源,而華爲盤古大模型則堅定選擇不開源。

縱覽衆多公司的不同選擇,背後的出發點仍然是商業價值的差異。

在李彥宏看來,閉源,是有真正商業模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、人才。閉源在成本上反而是有優勢的,只要是同等能力,閉源模型的推理成本一定更低,響應速度一定更快。“閉源模型在能力上會持續領先,而不是一時領先;模型開源也不是一個衆人拾柴火焰高的情況。這跟傳統的軟件開源——比如Linux、安卓等很不一樣。”

此外,李彥宏提到,無論中美,當前最強的基礎模型都是閉源的。通過基礎模型降維做出來的模型也是更好的,這使得閉源在成本、效率上更有優勢。對於AI創業者來說,核心競爭力本就不應該是模型本身,這太耗資源了,而且需要長時間的堅持才能跑出來。

後來周鴻禕又解釋稱,“自己說開源好,不是針對李廠長,只是從產業發展的角度來看開源和閉源。”

從長期的視角來看,的確有越來越多的從業者開始警惕使用開源大模型而帶來的被替代性風險。

2023年5月,谷歌內部泄露的文件《我們沒有護城河,OpenAI也沒有》在SemiAnalysis網站上傳播,其中的觀點包括,比起開源社區需要谷歌,谷歌更需要開源社區等等。文章作者指出,不同開源模型所組成的生態系統永遠是OpenAI的潛在競爭對手,與開源AI競爭的結果必然是失敗。

創業公司的選擇

無論選擇哪條路線,對於當前國內AI大模型生態來說,最關鍵的是尋找到一個合適的落地場景以及商業化路徑。

李彥宏日前在一場內部演講中表示,一些做模型的創業公司所謂的“雙輪驅動”不是一個好模式,既做模型又做應用,勢必會分散精力。創業公司的精力和資源都是有限的,當資源有限時更應該專注,而不是去搞所謂的“雙輪驅動”。

在他看來,市面上有大量模型,大的、小的、開源的、閉源的,在特定應用當中如何使用這些模型的組合是有技巧的,這是創業者可以乾的事兒,是可以提供價值增益的。

清華大學電子工程系長聘教授、銜遠科技創始人周伯文同樣持有類似的觀點。

近日,周伯文在MODI摹小仙AI營銷大腦(以下簡稱MODI)發佈現場表示,要讓人工智能快速落地,實現AGI,需在保持泛化性的基礎上解決專業化問題。通專融合的新架構,即交互式持續學習框架。通用大模型與專業小模型協同生成框架,大模型提供高階推理能力來指導內容框架的生成,專業化小模型進行知識填充與個性化內容生成。

“AGI的通專融合泛化能力不是一個算法,需要系統化的設計和思考,所以我和我的科研團隊,我們一起提出來AGI之路多層次依賴的新的架構,這裡面會包括基礎模型智能,這個基礎模型是大模型智能,具有通用到專業能力的迭代。在算法協同上需要完成泛化和專業性的結合,具備專業通用的系統,它通向AGI的必由之路,在場景下能夠自主探索、迭代、強化學習,這三層是互相作用的,未來AGI需要具備協同,需要具備交付的一種智能。在三個模型的方法研究下是可以互相互動的,不是一個簡單的線性的依存關係,每一層的提升同時也是對其他兩層的幫助。”周伯文說道。

與此同時,周伯文表示,在基礎模型基礎上,需要更多的在通用能力上的數據飛輪,也包括專業能力上的數據增強,包括領域的深層檢索,從通用能力到專業基礎模型增強,還需要具備多功能專業模型的融合機制,當然也包括快模型和慢模型的展開,還需要學習和交付能力,不同模型和不同專業度上的協同,能夠有效檢測到一個模型在什麼情況下產生幻覺。據他透露,目前,MODI已開放測試申請,預計五月下旬正式上線。