價格戰迷霧下,大模型創業者只能被動挨打?

如果說2023年是大模型的資格賽,融資額度決定了能否晉級,2024年已然快進到了淘汰賽的階段。

字節跳動、阿里雲、百度智能雲、騰訊雲等先後在5月中下旬加入“價格戰”,輕量級模型直接免費,主力模型的API價格普遍下調了90%以上。曾經以“燒錢”著稱的大模型,迅速進入到“白菜價”時代。

當時就有人提出這樣的問題:大廠選擇“燒錢狂飆”,大模型創業公司怎麼辦?

時間過去半個多月,幾家獨角獸級的大模型創業者紛紛表明了態度:智譜AI果斷跟進,一個月裡兩次下調價格;MiniMax悄然啓動了註冊認證贈送1億tokens,以及TPM擴容不收費的活動;百川智能創始人王小川公開表態不會跟風降價;零一萬物CEO李開復直言“國內大模型市場瘋狂降價是雙輸的打法”。

作爲大模型行業真正意義上的“第一戰”,大廠們不計成本的拼價格,到底會對初創企業產生什麼樣的影響?

三種可能的結果

截止到目前,大模型降價潮還在蔓延中,市場格局的變化至少需要半年乃至更長時間。但在故事塵埃落定前,並不難揣測一些可能的結局。

第一種比較理想化的結果:大模型降價利好開發者,AI原生應用加速爆發,逐漸從量變引發質變。

目前大多數中小企業和個人開發者是通過API接口來調用大模型能力的,瘋狂降價前的價格普遍在0.02元/千tokens上下,對於缺少盈利模式的開發者來說,算力成本儼然是一座沉重的大山。

大模型降價甚至免費,意味着開發者的成本曲線將大幅下降,促使開發者更低成本進行開發、試錯,進而打造出更多的AI原生應用,讓大模型能力滲透到更多場景中。也許當下的應用仍存在同質化,主要以智能助手和情感陪伴爲主,卻不乏從量變引發質變,孕育出超級應用的可能。

可以佐證的是,百度宣佈ERNIESpeed和ERNIELite免費開放使用後,兩款模型的日調用量翻了10倍。有點像移動互聯網早期的一幕,因爲運營商下調了流量費,用戶開始嘗試各種新奇應用,最終迎來了百花齊放的繁榮景象。而在一個生機勃勃的生態裡,每個大模型廠商都將是受益者。

第二種更符合現實的結果:部分缺少“護城河”的大模型廠商被淘汰,算力、人才和資本越來越集中。

一種較爲流行的觀點是:誰的用戶多,產生的數據就越豐富,投餵給大模型的“飼料”就越多,越有可能訓練出更好的AI。大模型廠商降價的目的,是爲了吸引更多人使用,將用戶的真實使用數據反哺給大模型,然後進行訓練迭代。

資本市場的謹慎態度,讓“百模大戰”的局面曇花一現,但不少拿到了融資的中腰部創業者,仍在煉模型這件事上苦苦掙扎。頭部玩家們打出的價格牌,有望讓部分搖擺的創業者放棄自研大模型,將注意力轉移到應用層或其他領域,避免大模型在底層硬件、軟件等方面的重複建設,推動整個行業朝同一個方向發力。

不管是出於什麼樣的考量,行業集中度的提升都不是什麼壞消息。大模型屬於極限考驗算力資源和人才密度的賽道,即使“百模大戰”沒有上演,活躍的大模型廠商仍然多達兩位數,還需要進一步優勝劣汰。

第三種相對悲觀的結果:價格戰是同質化的表現,當價格成爲市場的主導力量,將上演“圈地運動”。

網約車、外賣、社區團購等移動互聯網時期的經典戰役,無不經歷了價格戰的階段,且或多或少是同質化競爭導致的。倘若大模型卷性能帶來的收益越來越低,而且能力大同小異的時候,價格無疑是攻城略地的有效手段。

可能在一些人眼中,大模型的關鍵在於效果,比起價格,客戶更在意落地帶來的價值。這樣的觀點沒有錯,卻忽略了價格戰的時機:如果企業已經深入使用了一段時間,價格上的差異很難撬走客戶;如果客戶還處於選型的階段,誰能吸引到更多的客戶,誰就在競爭中拿到了先手棋。

借用智源研究院總工程師林詠華的說法:“大模型的降價潮是一場生態的爭奪戰。當一家企業已經適配了一個模型,他未必還願意再去適配更換另一個,在更換成本客觀存在的前提下,行業企業會希望先通過價格的方式拉攏一批用戶。”沿循這樣的邏輯,大模型的價格戰和網約車、共享單車等並無本質的區別,都是一場有預謀的“圈地運動”,不過是目標對象不同而已。

客觀的說,大模型價格的下降是必然的結果,畢竟推理成本下降了。就像百度創始人李彥宏在 Create 2024 百度 AI 開發者大會上提到的:“相比一年前,文心大模型推理的成本降到了原來的1%。”

問題在於,國內大模型的價格幾乎是斷崖式的,並未給大模型創業者足夠的緩衝時間,尚未找到行之有效的盈利方式。

這場價格戰中最活躍的選手,基本都是雲廠商,降價乃至免費獲取到的客戶,可以通過模型微調、模型部署以及各種配套雲服務對衝成本。而大模型創業者缺少足夠厚的生態,甚至要向雲廠商租賃算力,API的商業模式被“切斷”後,短期內恐怕難以實現“自我造血”。

無論以哪一種結果收場,大模型創業者都是弱勢的一方。

怎麼才能活下來

歷史經驗告訴我們,在充滿不確定的賽道里,從來都沒有穩操勝券的戰局。大模型的背後是一場萬億級的資本盛宴,比起場上的幾家雲廠商,初創企業的想象空間更大,總有人希望他們可以留在牌桌上。

雲廠商推波助瀾的價格戰,無疑會加重大模型初創企業的危機感,但並不意味着沒有破局的可能。

對策一:技術側破局,在大模型性能上搶先打破天花板,或者在大模型的落地部署上找到最優解。

按照獵豹移動董事長傅盛的說法:“短期來看,大模型的性能遇到了瓶頸。誰也甩不開誰,誰也拿不出撒手鐗,降低推理成本、降低售價成了現在每一家的高優先級任務”。撥開價格戰迷霧最好的方式,正是在大模型性能上甩開對手。面對不明晰的技術路線,不乏“運氣”的成分,但初創企業往往更有“賭”的勇氣。

即使不能在性能上拉開太大差距,提升大模型工程化能力也是一個可行方向。目前API調用的是“標準版模型”,想要將大模型能力和場景深度融合的企業類用戶,仍需要對大模型進行精調或本地化部署。如果能夠進一步降低大模型的落地門檻和成本,不無對衝“價格戰”衝擊的可能。

這也是一些大模型創業者正在嘗試的應對方案。比如智譜AI在MaaS 2.0大模型開放平臺上推出的一鍵微調功能,用戶僅需準備訓練數據,不需要代碼即可完成一個“私有大模型”的訓練。

對策二:專注提升大模型的差異化能力,做雲廠商的“ISV服務商”,低姿態熬過大模型浪潮的淘汰賽。

鑑於隱私、安全、性能等種種因素,行業內一直存在“模型混用”的現象,即在不同場景調用不同的大模型。在各家模型能力水平相近、價格不相上下的情況下,打造某一塊的“比較優勢”,同樣是一種活法。

況且阿里雲、百度智能雲等雲廠商,也在“拉攏”大模型創業者:一方面在算力資源上和大模型廠商綁定,比如阿里雲對MiniMax、月之暗面的投資,都將一部分資金限定用於購買阿里雲服務;另一方面積極佈局一站式大模型開發及服務運行平臺,比如百度智能雲千帆大模型平臺,用戶可以同時調用不同大模型的能力。至少就現階段而言,沒有云廠商願意爲了大模型的“芝麻”,丟了雲服務的“西瓜”。

就像許多行業曾出現的,價格戰常常是行業進入“大混戰”的標誌。對於那些沒有拿到鉅額融資的大模型創業者,以ISV服務商的身份“苟活”,熬過大模型浪潮的淘汰賽,何嘗不是一種生存哲學。

對策三:繞過或弱化在To B市場的競爭壓力,選擇To C作爲突圍方向,試圖成爲下一個時代的行業巨頭。

王小川不摻和“價格戰”的理由是:“在國內的商業環境裡,To B的市場比To C小十倍。”百川智能同步發佈了AI助手“百小應”,開啓“超級模型+超級應用”雙輪驅動模式,希望能夠和雲廠商進行錯位競爭。

有相似想法的不只有王小川。MiniMax先後孵化出了星野、海螺AI等多款日活超過百萬的產品;月之暗面一開始就專注於To C路線,推出了Kimi智能助手;對價格戰詬病連連的李開復,出任零一萬物旗下AI助手“萬知”的“首席體驗官”;就連To B佈局最深的智譜AI,也開始加碼推廣AI助手智譜清言。

踏足To C賽道就能避免內捲了嗎?正如前面所提到的,目前To C應用以智能助手和情感陪伴爲主,大模型初創企業尚未給出更好的產品形態,同樣集中在陪聊、提效等場景,功能大同小異。不過,相較於To B價格戰的被動性,To C承載了大模型創業者的希望。

創業從來都是九死一生,所有的成功之路都充滿荊棘,沒有人能提前知道哪種對策是正確的選項。

至少就目前而言,情況遠沒有到糟糕的程度。字節跳動放出的降價“大招”,並未影響智譜AI、月之暗面的新一輪融資,且估值均已超過30億美元;佈局多模態通用大模型的生數科技,憑藉對標OpenAI Sora的視頻大模型Vidu,日前完成了百度領投的數億元Pre-A輪融資......

然而,並非所有的創業者都這麼“幸運”。前微軟(亞洲)互聯網工程院副院長簡仁賢創辦的竹間智能,已經在現金流壓力下停工了6個月;憑開源模型Stable Diffusion走紅的Stability AI,傳出了尋求被收購的消息......

突如其來的大模型價格戰,某種程度上爲行業敲響了警鐘,在信息差越來越小的語境下,像互聯網時代那樣照搬國外的商業模式,抑或是踩着時間窗口和紅利窗口“一步登天”,已經沒有生存的土壤。