搶奪資金、人才、用戶 AI“六小虎”進入“破局時刻”
一石激起千層浪。當DeepSeek 以迅猛之勢攪亂 AI 江湖的原有格局之後,之前獨領風騷的AI “六小虎” 正面臨“破局”的關鍵時刻。
某央企技術負責人對《科創板日報》記者表示,“DeepSeek給業界指了“一條明路”:使用以GRPO爲代表的強化學習,加上高質量Long CoT數據,理論上可令任意通用大模型顯著提升其推理能力;在部分細分領域,哪怕1.5參數量的模型,經訓練後也可打到媲美o1的效果,這使得大模型訓練與推理的算力資源成本大大降低。”
最新消息顯示,字節CEO樑汝波已反思Deepseek,稱跟進速度不夠,今年要追求智能上限。OpenAl首席執行官SamAltman也宣佈GPT 4o升智,智力要達到o3 pro水平,並表示更新後的GPT 4o還是最好的AI搜索產品。
這意味着2025年大模型領域,將迎來一場全方位的競爭。然而,面對單次預訓練300萬美元的燒錢門檻、8位數年薪的人才爭奪戰、以及用戶留存與投流成本的剪刀差,以及DeepSeek的攪局、大廠的追擊,在資金儲備、人才密度與用戶增速的路上,AI“六小虎”亟需自行探明。
DeepSeek來了,Kimi首當其衝?
在DeepSeek崛起之前,AI“六小虎”在大模型領域嶄露頭角,吸引了大量資本注入。
財聯社創投通數據顯示,2024年AI“六小虎”融資火爆。其中,月之暗面先後完成超13億美元融資,投後估值高達33億美元,約220億元;智譜同樣表現亮眼,2024年完成三輪融資,累計融資額保守估計超40億元,估值水平也躋身200億元水平。
但高昂的訓練成本,對於資金相對薄弱的AI “六小虎”而言,仍是巨大挑戰;另一方面,爲搶佔用戶心智的鉅額投流,也讓C端營銷成本不斷攀升。
一位投資人告訴《科創板日報》記者,由於月之暗面的Kimi與DeepSeek均涉及國內to C領域大語言模型,且在技術路徑上,Kimi與DeepSeek完全不同。因此,在這波衝擊中,Kimi尤爲受到關注。
《科創板日報》記者瞭解到,在技術路線上,智譜、百川智能、零一萬物、MiniMax、階躍星辰,與DeepSeek一樣,都採用了MoE(混合專家)模型,進行訓練。
在C端產品對壘中,DeepSeek-R1模型發佈的同一天,1月20日Kimi也發佈了Kimi k1.5,並強調超長邏輯鏈能力,將強化學習的上下文窗口擴展到128k。
一位不願具名的投資人向《科創板日報》記者分析,“128k是指模型‘窗口’的大小,雖然含義是12.8萬個token,但考慮到輸出性能,比如背後調用多少算力,且每家模型的token計費邏輯不同。在DeepSeek開源情況下,對應Kimi的投流,Kimi k1.5的總體成本應該高於DeepSeek。”
“此外,DeepSeek的‘思考’部分很長,在用戶提出同樣問題時,DeepSeek的輸出長度可能是別人的好幾倍。這也可能使得Kimi即便投流,依然陷入獲客成本很高的境地。”
用戶活躍度上,Kimi的C端領域標杆產品,月活已受到衝擊。第三方榜單顯示,1月份,豆包以7861萬MAU位列大模型C端產品榜首;第二名則是DeepSeek,爲3370萬MAU;Kimi則位列第三,MAU爲1943萬。
或許正因如此,在原金沙江投資人、月之暗面聯合創始人張予彤也做出發聲。
近日,她在朋友中圈稱,很高興Kimi新版本上線後用戶量又創新高:一是長文本+推理,讓搜索問答更全面,及時、準確;二是多模態能力,文字+圖像輸入,讓Kimi能看懂現實世界的複雜問題。
“創新基礎模型架構”打響人才、資金之爭
在各公司紛紛接入DeepSeek之時,對於大模型創業公司來說,逼迫“基礎模型架構創新”的時刻已到來。
多位投資人告訴《科創板日報》記者,大模型的核心依然是技術創新。“這需要加大研發投入,探索多模態融合、強化學習等新技術路徑,以提升模型性能和智能化水平。”
歸根結底,這是一場“人才”的競爭。某產業機構投資人士表示,人才的價值,一是在於能及時調整和優化模型,尋找新的架構方向。此次字節這麼快推出全新模型架構,依賴的也是人才的壁壘,讓企業“跑得更快”;二是,面向應用端的有效落地,比如AI for Science、AI陪伴,AI視頻等,頂尖人才的匯聚,能夠在高價值領域快速構建價值產品,實現商業模式快速驗證與直接創收。
字節得以迅速推出的稀疏架構,很大程度上也得以於它在AI人才上的積累。2024年,張一鳴已親自下場挖人,包括原阿里通義千問大模型技術負責人周暢加入字節,年薪高達8位數。此外,零一萬物原聯合創始人和預訓練負責人黃文灝也選擇加入;智譜AI等公司中多名頂尖AI工程師和研究人員也被傳已跳槽至字節。
引領當前行業風潮的DeepSeek,更是以擅於挖掘人才著稱,並且仍在以百萬年薪“招兵買馬”**。而DeepSeek創始人樑文峰,本身也是浙大“學霸”,爲“極致技術理想主義者”。
此外,傳統大廠龐大的研發團隊、海量數據資源,也讓“六小虎”感到壓力。“尤其是,大廠們不斷推出AI新產品和服務的能力,以及在基礎設施建設、產學研合作等方面優勢明顯,讓行業競爭加劇。”上述產業機構投資人士認爲。
與此同時,資金實力也是不下“牌桌”的關鍵一環。
李開復曾公開透露,一次預訓練成本約三四百萬美元,即便是成本更低的Yi-Lightning,在訓練時也用了2000張GPU,耗時一個半月,花費三百多萬美元。這意味着在大模型預訓練上,燒錢是公認的事實。
在這方面,相較於“六小虎”而言,大廠、DeepSeek均實力雄厚。多位投資人表示,“由於有了成本比較,大模型創業公司的後續融資,或許與預期算力消耗有關”。
雙重夾擊下的“破局”時刻
DeepSeek、大廠的雙重夾擊,讓AI “六小虎”不得不尋找“破局”之法。
零一萬物已做出選擇。在年初回應部分團隊併入阿里的消息的採訪中,李開復表示,去年5月發佈Yi-Large模型時,團隊已經意識到,模型在速度和性價比上存在不足,並在當時就決定放棄了原計劃開發的超大杯模型Yi-X-Large。
隨着進入B端市場,李開復認爲,零一萬物2025年的機會是挖掘 To B 大模型的PMF。
智譜CEO張鵬在回覆《科創板日報》記者採訪時稱,“將All in AGI,其他的都是路徑。而在路徑上,智譜AI每天都在優化。”
MiniMax方面,1月15日,其已發佈並開源新一代01系列模型,相比Kimi k1.5的12.8萬個token,01系列模型支持最多400萬個token的上下文輸入;百川智能則專注於大模型在醫療領域的應用落地,近期其與國家兒童醫學中心北京兒童醫院簽署戰略合作協議,雙方計劃共同推出“一大四小”共5款AI醫療產品。
某央企技術負責人在接受《科創板日報》記者採訪時表示,“DeepSeek的模型架構和訓練模式,證明了大模型在推理過程中,可生成大量高質量訓練數據,這再次印證了行業對‘合成數據’的價值共識,即構建的模型越被使用,高質量數據越多。”
“因此,誰擁有更多用戶,誰就將擁有更多高質量的數據,實現‘左腳踩右腳’式的模型迭代。”該央企技術負責人稱,也正是這種“自我強化”飛輪效應,使得DeepSeek實現了“正循環”,並以相對優勢持續突破技術天花板。
在融資上,另有投資機構人士對《科創板日報》記者表示,面對DeepSeek技術、開源的優勢,AI‘六小虎’亟需證明自己的產品,特別是“用戶數”和“留存用戶數”兩個關鍵指標。如果沒有規模增長用戶留存數,其產品、技術、模型能力可能受到質疑,爲後續融資埋下隱患。
另一產業機構投資人告訴《科創板日報》記者,大模型的“特色價值”是關鍵:“估值的下限是企業實力與影響力。對大模型企業而言,一定要從最基礎、最本質的模型下手,提升模型效果,使得其在高價值場景的具有突出能力、牢固佔據板塊,擁有穩定的市場基本盤(即用戶數),而這通常要求企業有強大的資金儲備或融資能力,且與成本優化、人才隊伍及企業願景息息相關。”
“大模型公司估值的上限,則是企業服務的應用領域。大模型本身不是創收與壁壘的高地,只有聚焦高價值應用場景,比如醫藥領域AI For Science等,並在市場形成穩固的產品與業務壁壘,纔是獲取資本信任與長期價值的關鍵。”
在這方面,智譜、百川智能已在採取進一步行動,除了在自身業務上聚焦外,這兩家公司還紛紛成立投資基金,以帶動產業鏈上下游,以推進應用場景的落地。
本文源自:科創板日報