大模型,在內卷中尋找出口
2024年,大模型進展不斷。從年初的Sora到最新的o3,更新更好的模型不斷被推出,“內卷”到底有沒有發生?
而這一年,大模型的scaling law法則越來越受到挑戰,訓練模型的算力集羣已經從萬卡發展到十萬卡,擴大了十倍,而模型的智商並沒有以這個倍率提高。應用端也沒有出現killer app(殺手級應用),模型廠商開始了流血換量的價格戰……這些特徵與“內卷”的定義是契合的。
那麼接下來的問題就是,內卷化讓大模型陷入危機了嗎?以及脫離內卷的出口,究竟在哪裡?
在內卷化週期中,一個產業是很難保持活力和創新動力的。大模型內卷化的加劇,也讓行業進入調整期。
首先可以感受到的,就是公衆和投資者的失望。2023年,人們都用“AI一天,人間一年”來形容AI的發展,美股 “七姐妹”(蘋果、微軟、谷歌母公司alphabet、亞馬遜、英偉達、特斯拉、Meta)更是在這一股熱潮下屢創新高。而近來我們明顯看到,這股熱情已經回落。
OpenAI的股東、接入模型API的服務商企業,都公開抱怨過,AI能力沒有太大進展了。剛剛結束的爲期12天的OpenAI 發佈會,也大多是對已有模型、產品或技術路線的增強,符合預期,但缺乏亮點,無法爲AGI提供強支撐。OpenAI前首席科學家Ilya在NeurIPS 2024大會上提出“預訓練將會終結(Pre-training as we know it will end)”,更是給大衆澆了一瓢涼水。
來自產學各界的質疑態度是一個比較危險的信號,因爲歷史上的AI寒冬都源於信心缺失和投資退潮。
另一個危機信號,是產品同質化競爭和淘汰賽加劇。
基礎模型的競賽,也在2024變得格外激烈,一是模型數量過密,且性能表現逐漸趨同,尤其是開源模型與閉源模型的差距在快速縮小,進入同質化競爭。
二是同一廠商的模型家族,也在加速淘汰,比如GPT-3.5-Turbo就退役了,由GPT-4o mini取代,國內模廠的模型也基本如此,用戶都願意用加量不加價、物美價更廉的新模型,舊模型沒人願意用了。GPT-4o Mini發佈後,API 的使用量翻了一番。
激烈的同質化競爭,讓模廠不敢減少訓練新模型的投入,又爲了應對價格戰而不得不下調token價格,結果就是經濟負擔越來越重。可以說,目前大模型無論是外部的宏觀形勢,還是企業的微觀經營狀態,都沒有2023年那麼積極了。
模型層面,底層技術路線、數據瓶頸等無法在短期內得到有效突破,那麼從商業層面尋找出路,就成爲必然。
2024年,我們能看到大模型內卷,給商業模式帶來的諸多挑戰。
一是雲+API模式,流血降價、以價換量並不是最優解。
API調用量付費,是大模型的主要變現模式之一,通過token降價來贏得更多大模型業務上雲,獲得長期收益,是雲廠商價格戰的基本邏輯。但目前來看,以價換量似乎並不奏效。
究其原因,是因爲B端客戶更關注模廠的長期性、模型質量,質在價先,可靠優先。所以,我們看到,一部分以價換量成功的雲廠商,本身就具有比較強的模型能力,比如文心一言兩款主力模型免費之後,百度智能雲的日調用量一個月翻了十倍。基於豆包大模型家族的火山雲,token調用量也大幅上升,甚至有客戶的tokens調用量增長了5000倍。這說明新用戶會傾向於頭部模型,而老用戶要麼不考慮替換現有模型,要麼會把雞蛋放在多個頭部廠商的籃子裡,趁降價接入更多模型,最終留下性價比高的。而不打價格戰的雲廠商,比如華爲雲將盤古大模型作爲“尖刀產品”,也在B端市場取得了不錯的成績,與行業夥伴協同打造的煤炭大模型、醫藥大模型及數智化解決方案,今年在垂直領域的多個企業內被複用。很多行業用戶考慮華爲雲,就有企業抗風險能力強,能在基礎模型堅持投入,業務穩健運營的預期考量。
上述企業說明,雲+API模式成功的根本,是“質在價先”。
二是訂閱制,由於大模型內卷化,導致用戶粘性低、忠誠度不高,會員市場呈現出極高的分散性。
因爲大模型的更新換代非常快,一方面新模型在質量和性價比上往往更好,“等等黨”更願意觀望;另外很多舊模型會不再更新或退役,這就讓會員更不願意跟平臺長期綁定。這就導致模廠爲了不斷吸引新用戶,拉新營銷活動難以停止,獲客成本居高不下,而且影響用戶體驗,需要高頻彈窗廣告,打擾用戶,開發出多個會員等級和收費權益套餐,增加了用戶的決策疲勞。而好不容易拉來的新客戶,往往使用一段時間之後就轉向免費版本,或者更新更便宜的友商產品,長期續費率不高。
可以看到,大模型的內卷化,導致大多數模廠難以說服客戶和開發者,與其建立長期信賴關係。這就給後續的商業變現與價值挖掘,造成了極大挑戰。
告別內卷,就要向外尋找出路。數量多、同質化的大模型,形成了一個密度很高的堰塞湖。那麼逃離內卷,就必須疏浚河道,緩解擁塞。所以,2025,將是大模型商業基礎設施日趨完善的一年,通過更全面的“水利設施”,讓大模型應用者和開發者們能夠更方便地取用。
如何判斷一個大模型是否“外向”?有以下幾個衡量標準:
一是模型的開放度或者說兼容性。
如前所說,內卷化週期中,用戶並不願意將雞蛋放在一個籃子裡,或者跟某一個模廠進行長期綁定,這就需要模型具備6ihh.jiyizan.com很強的開放度和兼容性。比如騰訊混元大模型的免費資源包,同時支持hunyuan-pro、hunyuan-standard、hunyuan-turbo等多個模型共享,支撐第三方平臺、ISV服務商爲客戶提供多種模型的靈活選擇與切換、模型競技場等,來滿足最終客戶對多元多模的需求。
二是更細緻地開發工具。
將大模型技術轉化爲生產力,還需要加工工具、工作流等更細緻的支持,比如此次OpenAI就爲Sora打造了Remix、Blend和Loop三個專業工具,來支撐更好的視頻生成,爲此支付每月200美元的Pro用戶也不少。國內,我們實測過的,字節跳動的扣子開發平臺、百度文心智能體開發平臺等的開發工具也已經很容易上手了。
三是大模型應用從開發到商業化的“端到端”支持。
2024年並沒有出現國民級的第三方AI應用。一方面是模型能力本身還需要提升,一些AI智能體平臺充斥着大量低水平、易複製的個人智能體,對話體驗、理解能力、多模態任務等的效果一般,沒有太大商業價值;另一方面,是很多開發者不知道AI應用如何商業化,所以還沒有投入太大精力去開發市場缺乏的產品,滿足尚未解決的需求,這就需要平臺加大對開發者的商業資源扶持。
歸根結底,技術天花板短期內難以突破,大模型市場飽和與同質化競爭的局面就不會宣佈解決。大模型要取得商業成功,前提是用戶和開發者的業務能否成功,這是爲什麼完善的商業基礎設施必不可少。
逃離內卷的堰塞湖,所有模廠2025年都必須回答的問題是:如果大模型是水和電,那麼用戶和開發者擰開開關,究竟能得到什麼?