對話戴文淵:大模型價格戰不解決核心問題

本站科技重磅推出系列對話欄目《態度AGI》。過去三年,AI變革風起雲涌,全球科技秩序正在重構,通往AGI的道路或許正在悄然臨近。本欄目以AGI爲題,將對話100位AI專家、企業家、投資人,試圖撥開雲霧,與大家一道見證AGI時代的到來。第三期對話第四範式公司創始人、CEO 戴文淵。

出品|本站科技《態度AGI》欄目

作者|薛世軒

編輯|丁廣勝

在大模型商業化如此卷的當下,第四範式彷彿清流一般的存在。

他們專注在自己的“三駕馬車”,即先知AI平臺、SHIFT智能解決方案、式說AIGS服務。

第四範式公司創始人、CEO 戴文淵的思考是,所謂通用的大語言模型,或者相關的多模態大模型,並不解決企業核心問題。我們需要知道,正在能產生價值的點在哪裡。

近期,第四範式發佈2024年第一季度財報,實現營收8.28億元,同比增長28.5%,毛利潤3.41億元,同比增長21.1%。

第四範式已經遵循自己的方法論,靠大模型賺到了錢。

談及價格戰,戴文淵淡然表態,現在絕大多數的價格戰是一個通用大語言模型的價格戰,這來自於同質化的競爭。

“其實並不需要去關注價格戰本身,期望是隨着整個市場越來越趨於理性迴歸到價值,讓市場更加關注到生產力能夠更好的作用於什麼場景。”

戴文淵表示,我們先不要太多的關注所謂的競爭。我們存在的價值不是爲了打敗別人,我們存在的價值是爲了去創造價值。

以下爲對話戴文淵精華內容(經整理):

一、價格戰不是關注重點

問:先知AI5.0業務開展情況如何?落地在什麼場景?

戴文淵:我們的定位和你在市面上看到的絕大多數的大模型不太一樣,我們致力於用生成式AI幫助企業打造它的場景所專屬的基礎大模型,你在市面上看到的絕大多數的是所謂的通用的大語言模型。我們現在看到的絕大多數的市面上通用的大模型,並不解決企業核心問題。

其實我們看到絕大多數的企業核心問題,其實需要解決的是基於一個企業的專屬場景下的模態,比如說以風控場景爲例,我們生成的不是一段文字或者一張圖片,而是要生成一個客戶在下個月或者下兩個月的報告,對於一個慢病管理的場景,生成的可能是未來三到五年內的體檢報告,同樣不是文字和圖片。先知AI5.0解決的是對於任意模態,都要能夠基於這個場景下的該模態數據,幫助企業構建它的基礎大模型,從而解決它的核心問題。

再回到您說的落地在哪些場景,除了我介紹的金融風險的場景、慢病管理,也嘗試在一些製造業,比如說設備故障場景,我們都可以基於他們的這些場景的模態數據,幫助他們去解決這些場景問題。

問:您對近期大模型價格戰怎麼看?

戴文淵:實際上我認爲我們並不需要去關注價格戰本身,因爲價格戰其實是來自於同質化的競爭。今天看到絕大多數的價格戰是一個通用大語言模型的價格戰,而我們絕大多數的問題不在這方面,針對大模型我們是具有核心的優勢以及壁壘的。

問:第四範式的技術優勢有哪些?

戴文淵:我們和市面上絕大多數的大模型公司面臨的主要區別是,他們要解決幾個模型,集中全部的力量做好一個大語言模型,集中全部力量做好一個視頻的模型,我們需要的是各行各業萬級、十萬級的大模型構建問題。所以,爲什麼我們會非常強調一個技術是自動機器學習,是因爲我們做一個模型,一個優秀的幾百個科學家團隊做一個模型,把一個模型做好就行了。但是如果你要做一百萬個模型,不可能招那麼多科學家去做一個模型,全世界也沒有那麼多科學家。

所以,我們需要能夠讓這些普通的開發者在平臺上把大模型做出來,自動機器學習要解決的問題是讓不同的開發者在平臺上把模型做出來。在自動機器學習領域,我們已經深耕了將近十年,在業界處於一個領先位置。同時,我們非常關注一些能夠讓企業用的起的技術,如果關注我們3月份發佈的推理框架,能夠大概把推理的性能提升五到六倍,這些都是我們非常注重去投入的。

獲取AI成本比較高的,我們希望能夠通過不斷的科技投入,讓我們的客戶用的起,讓普通的開發者可以構建AI,讓客戶以越來越低的成本獲得AI。

我們期望的是隨着整個市場越來越趨於理性迴歸到價值,讓市場更加關注到AI作爲生產力能夠更好的作用於什麼場景。

問:先知平臺已經經歷了第五個版本的迭代,客戶在使用先知平臺或者相關的生成式AI的應用,它在使用門檻包括價格成本方面,是不是已經有一些直觀的數據可以分享一下。

戴文淵:實話實說,每一代都有每一代做到的成績,也有每一代的遺憾,所以爲什麼不斷的推出新的模型,比如說先知2.0的時候,在那個時候絕大多數的客戶使用先知平臺的門檻很高,只有最優秀的一些科技人員能夠和先知平臺做出比較大的模型,絕大多數的客戶使用先知平臺的門檻比較高。

然後是開源的框架,從2.0開始推出自動機器學習這樣的技術,致力於把門檻下降。3.0、4.0、5.0一直以來我們的方向是不變的,3.0是打通端到端,從數據到上線的平臺,4.0希望讓AI能夠更好的服務於企業核心競爭力。

再到5.0我們希望把先知打造成一個做垂類的生成式AI大模型平臺。其實都在不斷的下降企業獲得大模型的門檻,同時我們每一代都在不斷的優化獲得大模型的成本,優勢在於我們在軟件端,我們也可以知道軟件如何和硬件做規劃,軟件能夠獲得五到十倍的提升,這是我們堅持在算力端提升的核心價值。

二、要讓AI作用在有價值的地方

問:業界有一些擔憂,微軟、蘋果整合後的AI大模型操作系統在市場端將會對中國形成碾壓的優勢。國內缺乏底層創新,這種通用的大模型已經毫無疑義,所以業內纔會卷垂直領域的大模型,有一種觀點就認爲我們的底層創新都不行,我們去卷產業大模型、卷垂直領域的大模型有什麼意義呢?您是怎麼去看待這種觀點呢?

戴文淵:我覺得這個事情我們還是迴歸到價值本身,沒有價值的就沒有意義,如果算的出價值爲什麼不去選擇呢?

我們算一算中國企業創造的總值有多少,如果AI都是作用在它的核心競爭力的地方,人工智能哪怕能夠幫企業提升1%的業績,所有的企業業績都提升1%,這是多大的一個價值。現在更多的其實不要去擔心人工智能創造價值的能力,擔心的是我們到底用不用人工智能作用在了有價值的地方。

問:您覺得現在國內的人工智能和國外的差距有多大?

戴文淵:芯片限制是一個層面,但是對人工智能來說不是光看芯片。另外一個是數據,數據代表是人工智能努力的程度,看了越多的數據,就看了越多的書本,前提是這些數據是高質量的。如果看的這些書是一些不好的書,看的越多就越差。

今天你有機器人,這個機器人的智商有一點差距,你要做一個更好的成果出來,你怎麼做呢?應該更努力一點,勤能補拙。怎麼更努力一點呢?你要找到我們在數據上有優勢,我們比別人看更多的書,最後我的能力就比你好。我們什麼地方更有優勢?我們國家有很多的產業不一定是世界上最領先,但世界上規模最大。

世界上規模最大的產業,意味着數據量是世界上最大,意味着獲取數據的成本是世界上最低的。

就像慢病管理的合作,我們合作的這家醫療機構所獲取的數據量就是全世界最大的,並且他們獲取數據的成本比海外很多國家有兩個數量級以上的成本優勢。在這個地方,我們就是有機會做出世界上最好的成果,並且價值也非常大。

所以,我們先不要太多的關注所謂的競爭。其實我們作爲科技從業者,我們存在的價值不是爲了打敗別人,我們存在的價值是爲了去創造價值。我們在這邊有什麼樣的市場和什麼樣的價值,我們有什麼樣的客觀優勢,把這些優勢發揮出來,做出好的東西傳遞給市場做出價值,這是我們最大的價值。

問:接觸C端大模型的時候,他們會提到遇到訓練數據優質數據短缺,或者質量參差的一個問題。第四範式做行業大模型,或者落地行業的時候,對於數據這一塊是怎樣的業務感知?是不是也會面臨這樣的問題?

戴文淵:這個問題一定都會遇到,C端我理解的是大語言模型,實際上很多時候構建大語言模型的時候,要做的是減數據,不是加數據。把一些劣質的數據從數據集裡拿掉以後,這個模型會更好。同時,場景數據也是一樣的,我們經常和客戶交流的時候,讓客戶放棄什麼東西,很多客戶歷史上的數據質量不好,這些數據訓練出的垂直模型,從開始的時候有一些不好的數據,有的時候做減法更好,我們經常引導客戶先要想清楚這個場景的優質數據是什麼,我們去獲取和整理這個優勢的數據,最後再爲這些模型獲得優質大模型的產出。其實,每個模型都是類似的,在C端或者大語言模型看到的,所有的大模型都是一樣的。

問:您覺得人工智能+會形成怎樣的產業生態呢?中國的人工智能到底要走怎樣的道路呢?

戴文淵:產業生態毫無疑問從終端的消費者到產業再到技術的提供方,然後再到算力的提供方,再到能源的提供方,這是一整個產業。其實整個AI從最終的消費者開始帶動,其實是可以帶動一個巨大的產業鏈升級。

中國的人工智能,確確實實它的優勢是在產業端,因爲中國有很多的產業都是全世界最大的,並且中國的這些產業,不僅是產業規模大,市場規模也大,兩端大代表的是我們數據上有優勢,客觀上來講我們在這些產業上面AI比別人要努力一點。這些產業我們優化了以後,它所帶來的價值也是巨大的。所以這兩個方面來看,中國AI的機會確實在產業生態是更大的。

本文爲本站科技系列對話欄目《態度AGI》第三期,更多內容,關注我們。

《態度AGI》第一期:對話李開復:大模型創業狂奔一年 中美差距縮小 我十年不套現

《態度AGI》第二期:對話王小川:我們不跟進大模型價格戰