融資超10億美金,AI公司「月之暗面」獲紅杉、小紅書、美團、阿里新一輪投資 | 36氪獨家
36氪獨家獲悉,AI創業公司「月之暗面」近期已完成新一輪超10億美金融資,投資方包括紅杉中國、小紅書、美團、阿里,老股東跟投。
月之暗面的上一輪融資爲2023年獲得的超2億美金融資,投資方包括紅杉中國、真格基金等。本輪融資後,月之暗面估值已達約25億美金,爲國內大模型領域的頭部企業之一。
自ChatGPT掀起全球浪潮以來,這也是國內AI大模型公司迄今獲得的單輪最大金額融資。
36氪就上述消息向月之暗面求證,月之暗面表示,對具體融資消息暫不方便評論。
月之暗面(Moonshot AI)成立於2023年3月,是國內大模型領域的關鍵玩家。其核心團隊曾參與到Google Gemini、Google Bard、盤古NLP、悟道等多個大模型的研發中——這是一支在大模型道路上已探索多年的隊伍。36氪瞭解到,目前月之暗麪糰隊人數已超80人。
月之暗面的創始人楊植麟,爲中國35歲以下NLP領域引用最高的研究者,Transformer-XL和XLNet兩篇論文的第一作者——兩者均爲大語言模型領域的核心技術;另外兩位聯合創始人周昕宇和吳育昕,則有超過10000+的Google Scholar引用。
自2023年成立以來,月之暗面在不到一年的時間裡,完成了從通用大模型到上層應用的佈局。在大模型層,月之暗面已訓練了千億級別的自研通用大模型。
而在應用層,2023年10月,月之暗面正式推出首個面向C端的產品“Kimi智能助手”,這是月之暗面做To C超級應用的第一次嘗試。Kimi智能助手支持20萬漢字的長文本輸入,主打無損記憶。
“長文本(Long Context)”是月之暗面當前主打的技術之一,這來源於團隊希望突破大模型的落地瓶頸——大模型的智慧之所以能“涌現”,主要是因爲通過擴大參數規模,突破到了千億級別。
但當前大模型落地的瓶頸,不僅有參數規模大小(即模型計算能力),還有模型的“內存”大小,即記憶力。每輪對話能處理多少上下文信息,決定着AI應用的體驗好壞。
值得一提的是,推出Kimi智能助手後,月之暗面可以說引起了一場關於“長文本技術”的小競賽——隨後,國內衆多創業公司也相繼推出了長文本相關的技術更新,而OpenAI和Anthropic在2023年11月也發佈了長文本相關的新進展。
從國內的AI競賽來看,通用大模型領域的第一梯隊也已經清晰展現。據當前公開信息,除月之暗面以外,包括智譜AI、MiniMax、百川智能、零一萬物在內的創業公司,估值都已達10億美金後。
而月之暗面本輪融資,以及近期大模型公司的融資情況也顯示出,國內通用大模型層的下注者有所變化——相較2023年,通用大模型層尚有VC的活躍身影,到了今年,大廠戰略投資開始頻頻現身。
各個大廠都採取廣投賽道,而非站隊策略——阿里已投資包括智譜AI、百川智能、零一萬物在內的創業公司;騰訊也投資了智譜AI、百川智能、MiniMax等公司。
儘管過去一年大模型的算法優化、模型訓練成本有大幅下降,但大模型依然是極其昂貴的遊戲。據36氪瞭解,當前頭部的大模型公司的融資窗口仍在開放,“軍備競賽”還未告一段落。
大模型創業公司的估值水漲船高,迅速將參與門檻推到極高。一位投資人對36氪表示:“現階段,通用大模型領域當前已經不是大多數VC的遊戲,往後的投資人更多是政府和戰投。”
另一方面,對現在的大模型創業公司而言,多模態模型是近期的核心競爭點。就在北京時間2月16日凌晨,谷歌重磅發佈了最新的多模態模型Gemini Pro 1.5。幾個小時後,OpenAI馬上發佈了首個AI視頻模型Sora,可以生成超過60秒的視頻,再次引發全球轟動。
比起以文本爲主的大語言模型,以圖像、視頻爲主的多模態模型,訓練成本更高,未來將會需要更巨量的資金和人才——國內大模型公司當前爭取更多融資,也意在爲此做準備。
36氪也瞭解到,月之暗面當前已經在秘密研發通用多模態模型,預計今年內將推出。月之暗面在多模態相關技術上多有儲備,團隊成員曾發明了包括基於對比學習的視覺預訓練範式MoCo、最高效的視覺網絡結構之一ShuffleNet等,也有團隊成員主導開發了detectron2,後者是一個被廣泛使用的視覺開源項目,曾被集成到Meta全線VR/AR產品中。