對話月之暗面楊植麟:年初已聚焦Kimi AI不變關鍵詞是“Scaling”

雷遞網 雷建平 11月17日

2024年以來,月之暗面創始人、CEO楊植麟炙手可熱,公司估值持續走高,超過30億美元,甚至鬧出被投資人起訴的風波。

今日,楊植麟公開露面,不過,並未公開回應網上風波,而是發佈新一代數學推理模型 k0-math。這是Kimi推出的首款推理能力強化模型。Kimi稱,在多項基準能力測試中,k0-math的數學能力可對標全球領先的 OpenAI o1 系列可公開使用的兩個模型:o1-mini和o1-preview。

2024年11月16日是Kimi智能助手全面開放的一週年紀念日。數據顯示,2024年10月Kimi智能助手在PC網頁、手機APP、小程序等全平臺的月度活躍用戶已超過3600萬。

楊植麟在演講中稱,從月之暗面開始創業到如今 ,整個行業發生了很多變化,而整個行業依然有一些不變的東西,一直堅持下去。對AI來講不變一個關鍵詞是“Scaling”,這是支撐AI技術在過去幾年發生的進展。

“Scaling並不是簡單的把模型做得更大就好,核心是找到有效的方法去Scale,比如說你需要有更好的數據和方法。本質上所有AI的算法或是AI技術在解決的問題都是怎麼能夠讓更多的算力投入之後會產生好的作用。”

楊植麟還說,從2024年3,4月開始,公司就開始聚焦到Kimi業務,創業本身得做減法,而不是瘋狂的做加法,這一方面是基於對美國市場的判斷,另一方面是基於自身的觀察。

Kimi數學模型 k0-math 對標o1系列

Kimi此番發佈的k0-math模型採用了全新的強化學習和思維鏈推理技術,稱帶來更強的數學推理能力,通過模擬人腦的思考和反思過程,提升瞭解決數學難題的能力,可以幫助用戶完成更具挑戰性的數學任務 。

新的強化學習技術範式帶來的推理能力提升,也將會泛化到更多日常任務上。10月中旬上線的Kimi探索版,將推理能力運用到AI搜索任務上,通過模擬人類的推理思考過程,多級分解複雜問題,執行深度搜索,並即時反思改進結果,幫助用戶更高效地完成複雜的搜索調研任務。

最近,Kimi 探索版運用強化學習技術創新搜索體驗,在三大推理能力上實現突破:意圖增強、信源分析和鏈式思考。

楊植麟認爲,最適合讓AI鍛鍊思考的能力,是數學場景。數學也可以作爲一個更廣泛的應用場景去使用。“我們希望不斷用強化學習的方式去逼近這種更強的鏈路思考,如果我們持續的做強化學習的Scaling,應該能夠在更多的場景去完成長鏈路的鏈式的思考,複雜的推理。”

未遭遇人才迴流大廠現象

大模型行業在經歷2023年的瘋狂成長後,在2024年出現了一些調整,一些公司出現了人才迴流大廠的現象。

楊植麟說,行業發展進入了一個新階段,從一開始有很多公司在做,變成現在少一點的公司在做,接下來大家做的東西會逐漸不一樣,有一些公司可能做不下去了,就會產生人才迴流大廠等問題,這是行業發展的規律。

“我們今年主動選擇做了業務減法,也是我們過去一年比較大的‘lesson’,應該聚焦一些重要的事,才能做好。”楊植麟指出,在這幾個大模型創業公司裡,月之暗面始終保持人數最少,不希望團隊擴那麼大,一擴那麼大對創新會有致命性的傷害。如果想把團隊保持在一定的規模,最好的方式是業務上做一些減法。

“我們一開始也嘗試過幾個產品一塊做,這個在一定時期內有可能是有效的,到後來發現還是要聚焦,把一個產品做好,把它做到極致是最重要的。因爲砍業務本質上也是在控制人數,不希望人數長得特別猛。比如說現在三個業務一起做,我就活生生把自己變成大廠,我就沒有任何的優勢。”

美國市場的情況,會給月之暗面很多啓示,月之暗面也會根據美國市場的情況,判斷哪個業務做得最大的概率更高。"有個問題是講Super app,已經出現了。ChatGpt已經超過5億的月活,至少算半個超級應用,這個問題已經很大程度上被驗證了。”

楊植麟認爲,Character.ai這種產品一開始用戶量很多,後面也很難破圈。因此,月之暗面的策略是聚焦,聚焦到公司認爲上限最高的事情,而且跟公司的AIG的misson也最匹配。通過這種方式去控制業務,真正聚焦把核心的創新能力做好。

避談與豆包的競爭 但在字節投放廣告多

大模型行業的技術正日新月異的在發展,OpenAI已推出了Sora產品,月之暗面也有幾個多模態的能力在內測。

楊植麟說,AI接下來最重要的是思考和交互這兩個能力。思考的重要性遠大於交互,並非交互不重要,而是思考會決定上限,如果沒有vision的能力就沒法做交互。因此多模態肯定是必要的,但思考決定它的上限。

Kimi雖然用戶數據量已經有幾千萬,但依然面臨巨大挑戰,尤其是字節跳動旗下的豆包虎視眈眈,體現出了更強的發展勢頭。

對此,楊植麟認爲,月之暗面不希望過多的去關注競爭本身,因爲競爭本身並不產生價值。月之暗面更希望關注在怎麼能給用戶真正價值上,diliver更好的技術和產品,給用戶創造更大的價值,纔是現在最核心的問題。“我們會更聚焦在怎麼提升模型的思考推理能力,就是做正確的事情,而不專門去做不一樣的事情。我覺得只要能有人實現AGI,都是非常好的結果。”

有趣的是,月之暗面燒錢很厲害,一年投放了數億的廣告,大部分是視頻廣告,主要的平臺也從上半年的騰訊轉到下半年字節的巨量廣告。

楊植麟對這個問題並未直接回答,只是稱這裡面很多數據不準確,對月之暗面來講,最核心的是把留存和getting growth做好。適當的投放是需要的,但需要平衡好留存和getting growth的關係。

剛遭遇原有投資人仲裁:要求補償1億美元

據悉,楊植麟是一個90後,1992年出生,是廣東汕頭人,2011年畢業於汕頭市金山中學。高中時期,沒有任何編程基礎的楊植麟被選拔進信息學奧林匹克競賽培訓班,之後在全國青少年信息學奧林匹克聯賽中奪得廣東賽區一等獎,獲得清華大學保送生資格。

2011年,楊植麟被清華大學熱能工程系錄取,大二轉專業進入計算機系。2019年博士畢業於美國卡內基梅隆大學,師從蘋果AI研究負責人Ruslan Salakhutdinov、谷歌首席科學家William Cohen。

在2024年初,阿里投資月之暗面8億美元,讓月之暗面迅速躥紅。2024年8月,月之暗面再次獲得騰訊、高榕創投等在內的新一輪投資,估值達到33億美元。

當然,楊植麟並非是“創業菜鳥”,早在2016年,楊植麟、張宇韜、陳麒聰一起成立了循環智能,先後拿到了來自金沙江創投、華山資本、靖亞資本、真格基金、紅杉中國、萬物資本、博裕資本的投資,公司估值一度超過2億美元。

這次的創業,也給月之暗面留下隱患,楊植麟、張宇韜近期遭遇到了當年部分循環智能投資人的起訴,核心原因也是,月之暗面估值上漲過快,Kimi智能助手用戶增長迅猛,顛覆了部分投了循環智能但沒有跟着投資月之暗面的投資方起初的判斷,甚至有意見了,併發起仲裁,仲裁發起方要求的金額補償近一億美元。

有消息稱,循環智能最早的天使投資人——前金沙江創投管理合夥人張予彤對月之暗面後來的成立到融資都起到了很大的主導作用,甚至傳聞張予彤年初離開金沙江創投後,已加入月之暗面,還曾被金沙江創投一位主管合夥人“內涵”。

對此,一家律所近期則表示,已接受楊植麟、張宇韜委託,關注到相關仲裁事項。“我們認爲該事項既缺乏法律依據,也不具備事實基礎,本所將依法提出抗辯。”

雷遞由媒體人雷建平創辦,若轉載請寫明來源。