大智能時代的產業再分工:“無數據,不智能”可以休矣

圖片來源:視覺中國

侯宏/文 炙手可熱的生成式AI或大模型,將如何影響商業史走向?一個可能的思考角度是:大模型的入局將影響整個數字化生產力的分工結構。據此,本文提出大數據時代向大智能時代嬗變的論斷,包括以下三方面命題:首先,大模型的本質是智能的大規模集中供給,是智能的基礎設施化;其次,這一趨勢推動數據與智能的解耦,使得沒有大數據的企業也可接入高質量智能;最後,由此帶來的智能紅利對中小企業尤爲有利,或成爲經濟結構性增長的重要來源。以上挑戰了大數據時代的思維範式,爲相關人士理解數字化變局提供了一個有趣的思考起點。

大模型的本質

是智能的大規模集中供給

生成式AI在諸多方面不同於傳統AI。一方面,顧名思義,生成式AI擅長生成新內容,而傳統AI侷限於解釋現有數據或者做出預測。投資機構a16z的MartinCasado認爲:“微芯片將計算的邊際成本降到了零,互聯網將分發的邊際成本降到了零,大模型則將創作的邊際成本降到零。”另一方面,基於自然語言的人機交互界面,生成式AI具備了技術民主化的特質。正如麥肯錫的LareinaLee所說:“用戶不需要任何數據科學或機器學習專業知識,就能有效地利用生成式AI完成工作。這就好比大型機只有技術專家纔會使用,而個人電腦人人皆可掌握。”

然而,本文強調生成式AI靈活應對多種非預設任務的能力,區別於需根據預設任務進行專門設計的傳統AI。要理解這一點,不妨考慮傳統AI公司面臨的商業模式困境。以AI四小龍爲代表的“傳統”AI公司儘管技術投入巨大,但難以擺脫爲企業客戶提供定製服務的低擴展性模式。這是因爲,要實現AI算法與特定任務情景的匹配,技術供應方不得不提供大量低自動化程度的工程服務,既拉低利潤率又降低可擴展性。相比之下,體驗過的人士不難認同,大模型好似百科全書,幾乎所有領域都應對自如。儘管在專業領域需要模型“微調”,但正如“微調”二字所暗示的,其定製化程度遠低於傳統AI項目,預示着更好的經濟性。

能力通用性和其他兩個經濟屬性一起,成就了大模型的基礎設施地位。一方面,大模型具備規模經濟。衆所周知,極度昂貴的訓練成本,是大模型爲通用性所付出的代價。其規模經濟性體現在,模型參數規模超越某臨界值後,其智能表現隨參數規模增長呈非線性增長。作爲這一規律的提出者和堅定信仰者,OpenAI在擴大模型參數規模的路上矇眼狂奔。另一方面,大模型具備生成性(generativity)。大模型提供者自身並不能充分發揮其價值,但其上可以“長出”各類面向真實用例的應用以實現難以預估的長尾價值。

大模型的本質是智能的集中化供給。作爲基礎設施,“集中供給”並不新鮮,新鮮的是“智能的集中供給”。我們需要區分基礎設施的智能化和智能的基礎設施化。智能手機、智能網絡、智能城市、智能電網等詞彙描述的是給定基礎設施的智能化,指對異質性基礎設施(手機、網絡、城市、電網等)規模經濟的個性化調度和外部性的多樣化開發。智能的基礎設施化則是指智能的生產和供給本身具備了基礎設施屬性。

智能似乎天然與某個聰明的、不可複製的、充滿創意的大腦相關,怎麼可能基礎設施化呢?如果它真的基礎設施化了,又意味着什麼呢?儘管這似乎是人類歷史上第一次,但歷史告訴我們,每次基礎設施集中化過程都深刻地影響當時的生產力與生產關係。正如電力的集中化生產和大規模供給推動了第二次工業革命,智能的大規模集中供給有望把數字化時代推向新高潮。

大模型推動數據與智能的解耦

筆者把這個新高潮命名爲“大智能時代”,以區別於大數據時代。大數據時代,投資人通常問一家公司,你有數據嗎?即便有人意識到有數據的公司不一定能捕獲其價值,但幾乎所有人都認爲沒有數據一定不能夠從智能中獲益。以這種數據-智能緊耦合爲底色的商業思維深刻地影響着商業實踐。相關概念包括曾鳴教授提出的“數據智能”、脫胎自亞馬遜飛輪效應的“數據飛輪”以及移植自平臺經濟學的“數據網絡效應”。

這些概念通常都會援引Google作爲案例。Google經常被美國的反壟斷機構約談,一個原因是所謂的數據網絡效應:搜索引擎的市場份額越大,用戶數據就越多,而數據訓練出來的機器算法就越來越智能,進而進一步提升其用戶體驗,導致更大的市場份額。曾鳴教授更是基於阿里巴巴的類似經驗,提煉出以“數據智能”爲基石的“智能商業”方法論。

Google首席經濟學家HalVarian則認爲,Google的地位不是來自數據資源本身,而應歸功於其卓越的數據科學與工程能力更好地釋放了數據資源的價值。能力優勢和數據網絡效應都能帶來競爭優勢和份額,但前者是稀缺性創造的李嘉圖租,後者是市場地位創造的壟斷租。他的潛臺詞是,你不能培養出卓越能力是你的事兒,不要給我扣壟斷的帽子。不少人或嗤之以鼻,認爲是Hal屁股決定腦袋。但OpenAI的異軍突起表明,他可能是對的。ChatGPT對Google搜索的挑戰並不依靠數據優勢。GPT3.0之前的所有訓練數據都來公開數據,但不妨礙OpenAI在大模型能力方面走在Google前面,威脅到其搜索業務。

真正重要的不是OpenAI比Google厲害,而是它這麼厲害還能對外開放,而非像Google那樣獨家用於自家服務。當然,這方面更厲害的是Meta(即Facebook),開源了模型的參數且免費支持商用。大模型好似中央電廠,它持續提煉幾乎人類的所有知識(數據),然後對大衆輸出,使得智能不需要在低水平重複開發。這挑戰了大數據時代“無數據,不智能”的圭臬——企業的智能商業不一定以自身數據整合爲前提。基於大模型的底層參數,企業只需要小數據去微調這個模型,便有可能開展“智能商業”。

值得強調的是,“數據與智能的解耦”並不意味着數據不重要,而意味着數據重要性在產業不同環節並非均勻分佈。數據作爲智能原料的地位無可撼動。變化在於,大模型使用這種原料上的效率遠超其他,以至於有志於“智能商業”的企業構建自身數據飛輪可能喪失經濟性。數據飛輪或者數據網絡效應的邏輯仍然成立,但問題是:當所有企業都試圖轉起自己的數據飛輪,憑什麼是你脫穎而出呢?國家電網能夠穩定輸出電力時,爲什麼要在工廠旁邊自建一個小發電廠呢?當然可能存在備份或補充的需要,但那是另一個邏輯。

釋放智能紅利,驅動經濟結構性增長

數據與智能解耦帶來的經濟性被我稱爲智能紅利。Martin所強調的創造內容邊際成本爲0是消費者側的紅利。比較一下傳統的內容創造過程和基於生成式AI的內容創造過程,便不難理解。然而,經濟發展主要靠企業生產率的提升。智能紅利在這方面體現在:企業原本需要精心構建、維護自身數據供應鏈才能實現 “智能商業”所需的“數據智能”,而智能大規模的集中供給可能大大節省這一過程所需的投資、時間、精力,使得企業可以專注於業務創新。

上述智能紅利是促進數字經濟結構性增長的利器。中國經濟發展面臨諸多挑戰,而其持續增長的一個潛在來源是挖掘區域、行業發展不均背後的結構性潛力。衆所周知,小微企業受制於較爲落後的IT基礎設施、孱弱的數據基礎和有限的預算,數字化轉型進程落後於大中型企業。那麼,要實現數字經濟結構性增長,有必要思考如何彌補上述企業側的數字化鴻溝。

相對於其他數字化技術,生成式AI在實現這一目標方面得天獨厚。一方面,生成式AI應用對企業自身的數字化準備程度要求相對較低。如果消費者都能使用,有什麼理由小微企業不能呢?另一方面,在採納生成式AI應用方面,小微企業具有“光腳的不怕穿鞋的”優勢。諸多阻礙大中型企業採納生成式AI的因素(如數據泄密)可能對小微企業影響甚微。並且,大中型企業需要解決新舊IT之間融合的問題,小微企業也沒有這方面的負擔。總之,智能紅利不是大中型企業的專屬,而是小微企業能夠站在同一智能起跑線上的歷史性機遇。

接入生成式AI應用有兩種方式。一是企業首先微調出自己獨有的大模型,然後在私有或混合環境下爲自身各類應用賦能;二是直接利用現有的大模型提供商的API(如基於GPT)開發生成式AI應用,供自己使用或者作爲服務售賣給客戶。兩者都受益於智能的集中供給,但小微企業更可能通過後者獲取智能紅利,其中也蘊含着應用開發者的創業機遇。

結語

生成式AI和大模型的誕生純屬偶然。它好似從天而降的隕石,蠻不講理地改變了原有產業格局和歷史脈絡。筆者作爲數字化產業的參與者、觀察者和研究者,勾勒了改變發生的一種可能。按照這一邏輯往下推演,可以得到對當下一些熱門話題的不同觀點,留待後續。

(作者系北京大學國家發展研究院助理教授)

版權聲明:以上內容爲《經濟觀察報》社原創作品,版權歸《經濟觀察報》社所有。未經《經濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行爲主體的法律責任。版權合作請致電:【010-60910566-1260】。