李彥宏重申文心大模型不開源:閉源模型能力會持續領先丨GAI進化論⑨

21世紀經濟報道記者楊清清 北京報道

針對持續火熱的AI大模型行業,百度公司董事長兼CEO李彥宏再度發聲。

近日,李彥宏的一場內部講話流出,涉及對大模型開源與閉源的路線選擇、AI創業者應專注模型還是應用等焦點話題。

本次內部講話流出的時間節點,恰好是2024百度Create AI開發者大會前夕。

在4月16日即將舉辦的大會上,李彥宏將發表2024年首場公開演講,主題爲“人人都是創造者”。因此,本次內部講話的曝光,無疑是大會演講內容的預熱,亦可一窺百度和李彥宏今年大模型佈局方面的態度。

“一年前文心剛剛發佈的時候,我們內部是有過非常激烈的討論的,最後當然大家也知道這個結果,我們的決定是不開源。”談及開源閉源之爭,李彥宏直言道,一方面市場上開源模型衆多,不缺百度一家;另一方面,閉源模型能力更優,且具備真正的商業模式及成本優勢。

至於李彥宏此前多次談到的AI創業者話題,他再度重申了自己的立場。

在他看來,對於AI模型創業者而言,“雙輪驅動”並非好的模式,既做模型又做應用會分散精力,“創業者真正的優勢應該是在某一個領域的知識、數據。”

同時,李彥宏強調,基礎模型不會通吃AI應用。“外界擔心如果用了文心或者閉源模型,做得好了它就抄你,就把你的飯吃掉了,實際上這種擔心也是沒有任何道理的。”

模型開閉源之爭

自AI大模型火爆之後,行業內也出現了開源、閉源之爭。

所謂大模型的開源與否,是指模型的源代碼和訓練數據是否公開。諸如OpenAI的GPT4屬於典型的閉源模型,其源代碼和訓練數據不公開,只有OpenAI自己才能進行代碼數據的使用和修改。

目前在市面上,開源大模型並不鮮見。2023年7月,Meta發佈開源大模型LLaMA2,並宣佈可免費用於研究及商業,從而引發了業界的廣泛關注。而就在上個月,馬斯克的AI初創企業xAI正式發佈大模型Grok-1,並以3140億參數量成爲當前市面上最大的開源大預言模型。

除此之外,包括被視爲“歐洲版OpenAI”的Mistral AI、阿里巴巴的通義千問等企業,均選擇了開源路線。根據《中國人工智能大模型地圖研究報告》,截至2023年5月28日,我國大模型數量已達79個,超半數已開源,如清華大學的ChatGLM-6B、復旦大學的MOSS。

不過,李彥宏則給開源大模型潑了冷水,“我們的決定是不開源。”

李彥宏透露,選擇模型閉源的背後,經過了激烈討論與深思熟慮。一方面,當前市面上擁有衆多開源大模型,“這個市場上不缺我們一家開源的模型。我們開源還得自己去維護一套開源的版本,這是不划算的。”

除此之外,李彥宏認爲,閉源模型在能力上會持續領先。在他看來,模型開源的意義其實不是很大,“這些開源模型都是在外頭零零散散小規模地去做各種各樣的驗證應用,它沒有經過大算力的驗證。”

同時,有別於軟件開源,模型開源並不能實現“衆人拾柴火焰高”的局面,大模型的主導開發者依然是模型所屬的企業,並非真正由參與各方協同開發的產品。

“就模型效果來看,閉源模型一定是比開源模型要好的。”一位大模型從業人士告訴21世紀經濟報道記者,“閉源模型要想實現產品化和商業閉環,這就對模型效果本身提出了更高的要求。”

閉源更具商業性

目前,閉源模型具備較爲清晰的商業模式。李彥宏也提到,相較於開源模型而言,閉源模型“是能夠賺到錢的”。

事實上,閉源大模型具備較爲清晰的報價體系。如果是直接調用大模型能力,通常會衡量千token的費用。比如,GPT 3.5-turbo的收費標準是0.002美元/千tokens,文心大模型ERNIE-4.0-8K的收費標準爲0.12元/千tokens。

除了按調用收費外,也有一些閉源大模型提供私有化服務。如智譜提供雲端與本地私有化服務,不同產品的報價從每年25萬元到3960萬元不等。

在李彥宏看來,在具備自身造血能力的基礎上,閉源模型也就更具備聚集算力、吸納人才的能力。百度2023年財報顯示,2023年公司總營收達1345.98億元,歸屬於百度公司的淨利潤爲287億元,同比增速達39%。彼時李彥宏透露,百度已經從文心一言中獲得增量收入,預計2024年相關增量收入將增長至數十億元。

需要注意的是,除了對於企業而言,選擇模型閉源更有希望跑通商業模式之外,針對用戶,閉源模型也具備自身的特點。

李彥宏認爲,有別於傳統觀念所認爲的開源免費、具備成本優勢的思路,閉源模型更具備成本優勢。“只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的,反過來,同等參數的情況下,閉源模型的能力也是更強的。”

同時,李彥宏還強調,通過大模型降維訓練出的各式各樣的小模型效果更佳,這也會導致閉源模型在訓練成本及效率上更具優勢。

有行業人士向21世紀經濟報道記者指出,企業在使用開源大模型時確實需要考慮二次開發成本,因此也對企業自身的技術能力要求更高,需要具備自然語言處理等專業能力。相較之下,閉源大模型會提供相對完整的工具包,通過調用接口即可獲得相關技術能力。

“不過從其他角度而言,開源大模型確實能夠更快推動技術的發展,促進整個AI生態的發展和繁榮,也更容易被個性化定製和適應不同的應用場景,”前述行業人士指出。

因此,對於開發者和用戶而言,考慮使用開源模型或是閉源模型,通常需要結合自身預算進行成本綜合考慮。通常而言,開源模型更適用於研究者和擁有二次開發專業能力的中小開發者,閉源模型則更商業化,適用於普通用戶。

AI創業者無需“雙輪驅動”

除了開閉源模型路線之外,李彥宏本次同樣喊話了AI創業者。

早在2023年,李彥宏多次呼籲,相較於“卷”AI大模型而言,“卷”AI原生應用更有價值。“不斷地重複開發基礎大模型是對社會資源的極大浪費。”“AI原生時代,我們需要100萬量級的AI原生應用,但是不需要100個大模型。”

本次,李彥宏再度指出,對於大模型創業公司而言,在精力和資源有限的前提下,既做模型又做應用的“雙輪驅動”並非好的模式。

“創業者真正的優勢應該是在某一個領域的知識、數據,”李彥宏表示,“市面上有這麼多模型,大的、小的、開源的、閉源的,在特定應用當中怎麼樣使用這些模型的組合,是有技巧的,這是創業者可以乾的事兒,是可以提供價值增益的。”

而在這個過程中,百度無疑希望構建自身的大模型生態。近日,百度智能雲公佈了過去一年以來大模型生態建設“成績單”:已有超過8.5萬客戶,開發超過19萬個應用,千帆大模型平臺服務創企及夥伴超過12萬家,活躍調用千帆API的創企和夥伴數量超過5.5萬。

據百度方面透露,對於部分創業者而言,已經開始賺到了“第一桶金”。在接受包括21世紀經濟報道在內的媒體採訪時,百度智能雲渠道生態部總經理陳之若透露,在百度的大模型平臺上已經有廠商“賺到錢了”。

陳之若判斷,考慮到第一波賺錢效應已經開始產生,今年下半年百度大模型夥伴的數量還將提升,到今年年底時第一波賺錢的廠商一定會出現,也會有更多的企業加入類似從0到1的路徑中。

而在選擇模型的過程中,李彥宏則強調,AI創業者無需擔心使用閉源模型後被抄襲或“吃掉”的問題。他舉例稱,移動互聯網時代微信並沒有“吃掉”拼多多,滴滴也沒有變爲騰訊的一部分,“它們都各自提供了自己獨特的價值,有自己非常不一樣的競爭力”。