王小川:有信心年底發佈國內最好的語言大模型
文/閆妍
“從ChatGPT—3.5發佈到現在,4個月像過了兩年一樣。”王小川感概,每天撲面而來的新進展、新突破,都感覺無比興奮。
前一天,他凌晨4點才睡下,爲籌備新公司的首次發聲。4月10日,搜狐網絡大廈二層,王小川正式官宣入場大模型創業,和前搜狗COO茹立雲聯合創立人工智能公司——百川智能,要做的事情是打造中國版的Open AI基礎大模型及顛覆性上層應用。
王小川講,“有信心在年底發佈國內最好的語言大模型。”“我很看好搜索、多模態、教育和醫療等方面的增強,希望能夠幫助大衆輕鬆普惠獲得知識和專業服務。”
開年以來,在中國做類ChatGPT產品,組建中國版OpenAI,這個無與倫比的“性感故事”,引燃了互聯網大廠和科技大佬的創業熱情。自2月份王小川表達了迴歸創業做AI大模型的意願後,這位同時擁有深厚技術背景和管理經驗的科技大佬,就在這場AI 2.0“諸神之戰”中備受矚目。
ChatGPT讓王小川看到了一個更廣闊的未來。但這次讓他迴歸創業最動心的是,能和一羣有理想的人,用極致的技術驅動創造出顛覆性的智能產品。項目初期,不僅頂級高校、頂級資本都在向他拋來橄欖枝,過去搜狗時代吸引不來的AI人才,如今都在向他聚攏。
王小川向本站科技《態℃》欄目透露,公司早前已獲得5000萬美元啓動資金,主要來自他本人以及業內好友的個人支持。“預計在4月底將打造一隻50人規模的精英團隊,這裡面有AI大拿主動申請參與組隊,甚至直接帶資進組,下半個月我還會去趟美國薅人,快速對齊世界領先水平。”
他相信通用人工智能時代已經開啓。“生活在二十一世紀初是如此幸運,波瀾壯闊的互聯網革命還沒有謝幕,通用人工智能時代又呼嘯而來。”
“王小川式速度”
Q:公司名字爲什麼定下“百川智能”?
王小川:百川本意是衆多的河流匯集奔赴海洋,象徵着衆多數據、行業知識匯聚成爲一個強大的智能體系,生生不息。因爲大模型其實就是以語言爲核心,把天下知識都匯聚並進行學習的一個過程。
Q:而且把自己的名字也押進去了?
王小川:是的。啓動資金目前是朋友們在支持,一些老團隊也回來了。你可以理解“百川”既是跟世界連接,也是跟我之前的團隊和資源深度地連接在一起。
Q:公司目前融資情況如何?
王小川:2月份我有這個想法的時候,就有好多朋友找過來說支持,要投資錢進來。當時除了自己投錢還拉了幾個朋友,大概啓動資金有5000萬美金,前期足夠了,面向機構的融資會再近期啓動。
Q:公司目前的整體進展如何?
王小川:搜索是距離大模型特別近的業務,我們已經有了一個500億的參數的模型在訓練了,目前評價和進展效果都非常好。同事們都很興奮。跟清華的老師們去聊的時候,他們很驚訝我們的進展。
Q:百川智能創始團隊構成是怎樣的?聽說你在招搜狗舊部回來?
王小川:我的合夥人茹立雲,以前是搜狗COO,跟我一塊配合了15年。團隊大概搜狗的人佔了一半,剩下是來自百度、華爲、微軟、字節、騰訊等公司以及其他創業公司核心成員在內的數十位頂尖AI人才,月底將打造一隻50人規模的精英團隊。
Q:國內能做語言大模型的人才很有限,國內大廠和大模型創業團隊都在爭搶,在人才方面要怎麼去競爭?
王小川:我的觀點是,不能靠拼團隊,去收幾個公司,然後拼在一塊。這個東西是資本喜歡聽的故事,就是去把明星(企業)拼在一起。但其實一個公司就是一個生命,需要把它們深度的融合,基因的交融,硬要去拼的話,其實新團隊的速度反而會變得很慢。
我想在早期啓動的過程中,技術人才要發揮非常重要的作用。我在搜狗期間,參與共建了清華大學天工智能計算研究院,推動搜狗和清華大學等學術機構合作。所以這次創業,公司也得到清華相關院系及多位院士和教授的支持,建立合作突破通用人工智能基礎科學問題,並吸引清華人才加入。
中國在AI人才這塊的積累,跟美國還是會有一些差距。我可能下半個月就到美國去了,也得去薅人。我們的人才團隊在國內來看一定是相對好的,但你要繼續追趕世界的水平,得往後走,得速度快,需要引進人才快速對齊世界領先水平。
“年底做出對標GPT-3.5的大模型”
Q:大概什麼時候能夠追上GPT-3.5水平?
王小川:追上ChatGPT 3.5水平,我覺得今年內可能就能夠實現,但對於ChatGPT-4或者ChatGPT-5,我認爲可能需要3年左右的時間,應該不會低於兩年。
Q:現在大概每個大廠都會做一個這樣的產品,對比大廠你們的優勢是什麼?
王小川:我覺得大廠做這件事的話,很容易是爲他自己的業務目標服務,你讓他們提一個創新性的東西,一個從沒見過的東西,從上到下都很難去做一個決定,慣性很難改變,所以大廠很難做出大的變革,反而機會是在創新公司。
另外一個就是人才,反而創新公司能夠從股權等維度去激勵,大家形成一股繩,大廠的人才還是挺分散的,其實很難形成合力。大模型就是需要時間長一點,認真一點,錢不是唯一重要的,好多大公司反而被自己複雜的人事困住了。
Q:中美最近新發大模型的公司,谷歌、百度、360等,其實都是有搜索背景的,是不是搜索公司去做這件事天然有一些優勢?
王小川:因爲今天首先是語言模型,搜索公司做語言確實有先天優勢。而且搜索公司的經驗是比較完整的,從數據清洗、轉化成模型,到最後上線提供服務、甚至在數據安全這一塊的經驗,都是基本功,我們都幹過,所以學起來也很快。
Q:AI大模型方向,既有微軟、Google、Meta、百度等科技巨頭你追我趕,也不斷有新的挑戰者入局,現在這種競速,每個大廠都在發類似的產品,等你們的產品到年底發佈,這件事會不會就不那麼“性感了”?
王小川:我只說我年底會發國內最好的語言大模型,並不代表中間我沒有其他計劃,不代表我們中間沒有產品發出來。今年內對於搜索增強,在幾個垂直領域裡面,可能會讓用戶體驗到新的知識服務。
Q:算力會不會成爲“卡脖子”的問題?
王小川:對於我們來說,都不會有太大問題。而且在幾年後,我跟中國做芯片的幾個大佬聊,他們都覺得會做出一個突破,其實特別有信心。
Q:這次創業和之前做搜狗CEO,在心態上發生了什麼變化?
王小川:我最近也在做這個反思,以前搜狗做CEO的時候,我們的人才很充分了,我們的事情想得很清楚了,我們事也幹得很漂亮,不斷傳遞的是完美的狀態。
但從我創業時發現不是這樣,你還有很多不足的地方,並且要保持這種認知,就是我們現在還有各種不足需要大家幫忙,這樣的一個心態。我自己其實從搜狗出來以後,包括這段時間,都做了這樣的一個調整,我覺得對自己來說是挺進步的一件事情。
Q:目前還有很多企業家也開始進行AI方向的創業,在這一波AI創業浪潮中,要具備什麼樣的特質才能走到終局,成爲最後的贏家?
王小川:首先,(創業團隊的)一號位得懂技術,因爲接下來技術還會快速地變化迭代,一號位一定是對技術本身有充分的認識、有遠見的;其次,需要能組織規模不小的團隊,能夠管理相對複雜的技術團隊;另外,最後還是要做產品服務的,要具備產品商業化的能力,這也會有很大的幫助。