對話宇樹創始人兼CEO王興興:通用機器人的iPhone時刻還需要3-4年

出品|本站科技《態度AGI》對話欄目

作者|崔玉賢

編輯|丁廣勝

“我認爲,機器人目前最大的問題還是機器人AI沒有突破一個臨界點,所以現在的機器人看上去還是有點笨拙。”

宇樹創始人兼CEO王興興接受本站科技等媒體採訪時如此評價道。

2024世界機器人大會期間,宇樹拋出一款炸裂的產品:人形機器人G1,售價僅爲9.9萬元,而且還是量產版。產品剛發佈就引來了英偉達科學家Erwin Coumans的轉發,並稱迫不及待要整來一臺做實驗了。

宇樹的人形機器人G1成功將雙足人形機器人的價格捲到了10萬元以內,要知道行業內其他企業的人形機器人售價還在15萬-20萬,或更高的價格。

對於G1的定價,王興興表示,宇樹還是希望有更多的人能把(人形機器人)用起來,能夠在全球範圍內推動行業進步,讓更多人蔘與到這個行業進來。

“我們還是希望價格相對合理些,不希望帶頭把行業做爛了,明後年如果整個出貨量更加提升,機器人的能力也會越來越強,我覺得價格還有更好的調整。”王興興的言下之意,目前G1的定價並沒有擊穿行業底線。

對於機器人的判斷,王興興思考的很務實。

他認爲,機器人首要的是要能夠幹活。單純的語言大模型還是不夠的,而是需要機器人AI大模型。“比如把圖像的數據,包括機器人的關節指令數據,激光雷達或者別的數據加在裡面。大家最近應該也聽到了,像特斯拉在招數據採集的工人,他們直接招人去採集數據去做訓練。這部分訓練其實跟大語音模型沒多大關係,更多的是一些模仿學習,而且這個模型結構跟大語言模型結構也會偏差比較大。所以這個方向是目前大家已經看到了。”

王興興認爲,這一點(機器人AI能力)恰恰是目前整個機器人行業最大的一個限制。他認爲機器人AI與通用AI相比落後了差不多10年的時間,機器人AI的能力需要突破一個臨界點,這個臨界點有點像ChatGPT的出現。

王興興認爲,今年年底之前,至少全球有一家公司或有個實驗室能把通用型的機器人AI模型給做出來。

但這並不意味是機器人領域的iPhone時刻。“因爲iPhone時刻大家還是希望在比如工業或服務業能真正有終端產品的出現,而且標誌着行業出貨量暴增的節點,我覺得iPhone時刻還需要再遠一點,可能還是要在3年或4年的時間,但是不會超過5年。”王興興認爲。

以下爲本站科技整理的宇樹創始人兼CEO王興興對話的部分內容:

具身智能最重要的事情是能幹活

問題:今天向機器人瘋狂涌來的關注,背後都帶着AI帶來的機器人進步的判斷,但是其實忽視了機器人本身的技術進步,今天宇樹在機械和動力等方面的重要突破有哪些?

王興興:目前這一波機器人的浪潮,最主要就是AI帶來的,因爲AI大語言模型出來以後,大家覺得在信息領域已經做得非常好了,可以對話,可以語音交互。但真正解放AI的能力,還需要物理的機器人讓它真的去幹活,幹活是大家首要期待的一件事情,這帶來了大家對機器人的想象空間提升。

所以現在階段,我一直認爲對機器人行業最大的一個限制,還是AI不太夠——AI模型、AI的訓練數據集、AI場景的落地部署,都完全遠遠不夠。

從硬件的層面來說,目前也是不夠的,但是它沒有理論上的門檻,它是工程上的問題,就是工程上要把成本做得更低,可以做得更好,外觀更加極致,功能更加豐富,它的時間是可以預估的,可以這麼說,如果哪一天有人把AI機器人的模型做出來,找我們定製機器人,我們可以保證年底之前直接給他做10萬個人形機器人。只要加大產能,或加大投入研發的效率,甚至可以通宵,這完全都沒問題。所以,目前最大的問題還是機器人的AI能力還沒有足夠突破。

當然硬件要做得更好,比如說這個電機的扭矩做得更大,減速器的壽命可以做得更長,負載能力更好,靈巧操作精度更高,視覺感知的分辨率更高,執行速度可以更快,這些方面當然要繼續完善,但硬件不是一個最大的限制。

很多人對我們公司的印象是硬件公司,我個人還挺喜歡這個標籤的,因爲這也是代表大家認可我們公司的硬件。我們的機器狗在全球範圍內出貨量一直還是挺不錯的,再加上我們也在自己的硬件上做了一部分軟件,大家可能想象不到,像我們去年的go2這款機器狗,就集成了Open AI的大語言模型接口,你可以跟它對話,它把識別的對話發送到Open AI的服務器上,然後把結果反饋給機器狗,讓它去執行底層預設的功能,就是讓整個任務的編排和執行的操作權放在了Open AI的接口上。

像比如說向前走、機器人拍個照是底層的一些硬件,已經留了一些接口,有點類似授權給大語言模型接口,讓它調用底層的一些功能。去年差不多八九月份,這個功能我們就可以用了,包括我們還整合了Open AI的多模態接口,你甚至(可以)問他前面有什麼東西,他都能給你回答出來。

這是用外部的一些接口,我們機器人本身的一些運動控制的強化學習也是我們自己搞的。我們在AI方面也做了不少的事情,當然我們肯定不是說跟一些純粹的AI公司去比,我們的AI投入跟他們比起來肯定是比較少一些。

我們還是希望真正是能把產品做得更好,最終能在工廠裡、服務業、家用等場景真正產生價值。

問題:從目前人形機器人研發的角度看,大模型可重點解決哪些技術問題?主要應用在哪些方向?還請問大模型和人工智能的應用有望降低研發成本嗎?

王興興:目前大家說大模型的時候,一般在說大語言模型或者多模態模型,這些部分肯定是可以給機器人用的,但實際上真正的機器人大模型發展下去,單純的大語言模型還是不夠的。你可能會它是其中的一部分,比如說你要跟機器人去溝通的時候,肯定是要語言部分,但我個人認爲機器人的AI模型,跟語言大模型還是會有很大的區別。語言模型是機器人模型的一部分,但它不是全部,舉個最直觀的例子,比如在工廠裡做事的機器人,他完全可以不說話,比如說給他一個任務,給他看一張照片,或者敲一個數字進去,讓他幹活,他只要能幹活就行了,我並不需要讓他說話。

我覺得對於機器人或具生智能來說,最重要的還是讓他能幹活,這是我覺得最主要的一件事,而不是說在家裡的時候聽你的嘮叨或者對話,因爲如果單純只是對話的話,可能一個手機就可以做得很好了,我覺得幹活是最主要的點。

而對於幹活這個點,目前大語言模型的技術肯定是要用一部分,所以更多的要做一個機器人的模型出來,比如把圖像的數據,包括機器人的關節指令數據,激光雷達或者別的數據加在裡面。大家最近應該也聽到了,像特斯拉在招數據採集的工人,他們直接招人去採集數據去做訓練。

這部分訓練其實跟大語音模型沒多大關係,更多的是一些模仿學習,而且這個模型結構跟大語言模型結構也會偏差比較大。所以這個方向是目前大家已經看到了。

但是目前整個體系沒有那麼成熟,不像大語言模型,整個的風格結構,數據應該怎麼對齊或者做一些什麼東西都是比較清晰的。

問題:除了大模型AI技術之外,今年相較於過去它在產研和銷售一線與過去發生哪些改變?比如說去年可能行業裡有一些裁員或者說規模縮量,但今年感覺在一線情況觀察來看的話,相較於過去有哪一些不同?

王興興:我感覺最近一兩年,新的AI和機器人浪潮跟過去幾十年完全是兩個世界,因爲技術和整個的社會認可度、資本的熱度跟以前是完全不一樣的。現在機器人和AI已經變成全球公認的一個事情,包括美國的幾家大公司,國內的大公司,包括中央企業,地方政府對這個事情都非常關注,我覺得跟上一個幾十年已經完全一個新的時代。

目前機器人AI大家還是覺得不太滿意,就只能做一些固定的事情,比如說做訓練,在一些地方可以做,但如果換個場景他就做不了,發言權不太夠。所以我認爲機器人AI與通用AI的發展相比,落後了差不多有10年左右。

但是我覺得會趕上來,原因很簡單,就是這個行業越來越熱了,有更多的聰明人,更多的錢在這個行業,有更多人去參與了以後,這個行業就會越來越好。

早些年因爲純AI的門檻比較低,整個行業內有大量的搞純AI和傳統AI的,可能比搞機器人的至少多有100倍甚至1000倍的人,所以導致這個行業發展比較快。

但是現在機器人行業最近一兩年熱了非常多,大家有更多的人蔘與,整個行業都拉起來,所以我覺得未來整個機器人的發展速度會比較快,如果還是按過去的那種AI機器人AI的進度,我覺得十幾年或二十年都等不到,現在大家參與的人更多了,聰明人也更多。

通用機器人的iPhone時刻可能還需要3-4年

問題:您判斷通用機器人領域什麼時候會出現一個iPhone時刻?AI大模型爲機器人領域帶來了哪些明顯的能力的提升,然後目前還存在哪些挑戰?

王興興:通用機器人的iPhone時刻是大家非常關注的點,也是非常重要的一個時間節點。但是離iPhone時刻我覺得其實還有距離。

目前在具身智能或者機器人AI領域,大家還覺得機器人有點笨拙,只能幹一些固定的活。今年年初的時候,我個人相對還是比較樂觀的。我覺得在今年年底之前,至少全球有一家公司或有個實驗室能把通用型的機器人AI模型給做出來,但是這個時間點,我覺得可能也不是AI iPhone時刻,因爲iPhone時刻大家還是希望在比如工業或服務業能真正有終端產品的出現,而且標誌着行業出貨量暴增的節點,我覺得iPhone時刻還需要再遠一點,可能還是要在3年或4年的時間,但是不會超過5年。

問題:在您看來目前人形機器人發展最大的瓶頸是什麼?您個人比較看好哪個應用領域?

王興興:我個人一直感覺當下的所有機器人最大的瓶頸,包括人形機器人和四足或者清潔機器人最大的瓶頸還是基層AI的能力,在全球範圍內都沒有達到一個像初代GPT或者初代通用AI的能力,這是目前整個行業最大的問題。

目前機器人本身比如雙臂機器人或者一個工業機器人,如果加了AI以後,它產生的人效比人低,比如速度比較慢,精度比較差,能幹的活比較少,它其實很難替代工業上面人的價值,整個商業閉環沒辦法跑通。

所以我一直感覺就是如果機器人AI的能力能突破一個臨界點,工廠裡基本上一些工序能跑起來了,而且它的效率是比較高的,機器人價格也比較便宜,無論本體還是算力比較便宜,真正能產生比人效率更高,可以商業閉環,可以大規模推廣起來的時候,我覺得是最有價值的。

當然目前可能硬件還是有些問題,比如硬件的機械臂的負載能力不夠,精度不太夠,成本有點高,但實際上這只是說是工程上的問題。

剛纔也提到過,如果現在機器人AI哪家公司能做一個突破,我們年底前在硬件上可以直接給推出10萬個機器人。

所以最大的問題我覺得還是整個機器人AI還是沒有突破一個臨界點,就有點像ChatGPT出來前一兩年,大家可能現在看上去的機器人AI還是有點笨拙。

問題:作爲一個業界人士,對未來機器人真的能幫助人幹活,這個事兒有沒有什麼具體的期待?包括您剛剛也提到說目前是 AI還不到這個臨界點,您覺得讓機器人真的能幹活或者更像人,需要從比如說是軟件AI大腦還是說在機械力度去發力?

王興興:確實幹活這個也是分好幾個階段的,我覺得目前的AI,比如一些模仿學習,如果是固定工位的,這個技術目前全球其實很多公司都能基本都能做,而且成功率基本上可以接近100%,針對固定的一個工位的工序的特殊的大量的數據訓練,這是完全能行。

但如果稍微換件事情,他就要有新的數據去做新的訓練,這樣的事情目前當下已經能做了,而且也能做一些簡單的商業化,可能商業價值不是特別大,做的事情比較簡單一點,然後更進一步的話還是希望他能在工廠裡面做更復雜的事情。比如說把一些零部件更好的裝在一起,或者把一些零部件給拆了,或者做一些農業上的事情,他能做的事情更復雜,而不是非常簡單的抓取動作,我覺得是可能明、後年是基本可以做了。

更往前一步的話希望真的是非常通用,比如說我隨便拿一個機器人,只要給他看一張照片或者給他說一下,他就可以把這個產品給裝起來,或者把這個桌子給整理一下;或者把一個機器人帶到你家裡,他也不知道你家原本什麼樣子,他就知道把房間給整理好,洗衣做飯,這種我覺得是第三個級別的事情。

最主要的還是AI軟件去發力。剛纔說目前最大的卡點還是AI軟件,這個卡點沒有突破,你哪怕把硬件做得再好也不行,你如果硬件做得再好,就變成傳統的自動化行業去了。

最近到自動化工廠裡面,機械臂其實用了很多,我其實有個感覺,就是我們現在做新機器人的公司,大家剋制一下,不要把自己做着變成一家傳統自動化公司。因爲如果AI目前臨界點不夠的話,就會用一些傳統自動化的技術去做一些事情。大家還是希望能把AI做好以後,做一些更大的傳統機器人做不到的事情,這樣更有價值。不然的話如果去跟自動化行業卷效率真的是卷不過的,人形機器人跟自動化設備減效率完全卷不過,因爲自動化設備很多時候真的是你一秒鐘可以幹幾十次,所以說人形還是做更相對複雜一點,就傳統自動化做不到的事情,更有價值點。

創業公司要保持對前沿技術的敏感度

問題:您如何看待現在智能機器人的行業的競爭格局?因爲現在比如說像馬斯克或者小米,他們其實都在這一塊投入,同時他們在AI這一塊的投入也是非常大的,在這種情況下,您覺得中小公司的機會在哪?

王興興:中小公司競爭這個問題也是我一直在考慮的問題。

我們公司也成立8年時間了,如果在2016、2017年的時候我可能沒辦法回答這個問題,回答的有點不夠透徹,但是過去幾年我們也跟大公司也接觸過不少,包括國內的幾家大公司,海外的幾家大公司,我覺得中小公司目前最大的點就是得保持足夠的前沿技術的敏感度,你得看到未來,你得足夠靈活,如果能預估未來1年2年,甚至是5年以後的整個技術路線,產品格局,世界格局是什麼樣子的,你提前做佈局去做,你肯定死不了,能不能做第一不太清楚,但至少可以做前期還是非常有可能的事。

而這方面的話其實大公司其實有點難,因爲大公司內部的流程,內部團隊的相互競爭,然後他的資源和溝通的順暢性,哪怕甚至有時候大公司招人都沒有小公司招人方便,因爲它有內部的整個流程體系做限制,所以這方面其實要做的事情很多,而且另外一方面你得真正把握技術和產品的未來的路徑方向,這樣肯定是可以成功的。

問題:關於成本這個問題,其實G1這個價格,其實市場反應還是蠻大的,想問一下通過自研爲什麼能夠做到一個這麼大幅度的降本?現在很多公司的觀點是覺得說現階段可能降本並不是最重要的事情,隨着供應鏈的進步,但您之前也說通過成本、通過量來降本,其實是一場巨大的幻覺,所以想請您還能不能具體講一講降本這個事情?

王興興:我們一直還是希望有更合理的架構提供產品給客戶,因爲大家也知道很多情況,產品有人買,前提是價格還是相對比較友好的,如果太貴了就買的人比較少。所以我們還是希望因爲大家在全球範圍內要推動整個行業進步,有好的硬件本體是非常重要的,就有更多的人蔘與進來這個行業裡面。

我們一直希望有更多的人,哪怕現在功能不是特別多,有更多的人能用起來。我們的價格相對來說目前比較競爭力,原因也比較簡單,因爲大家也知道我們做四足機器人已經做了很多年了,所以我們對機械,比如說關節電機的生產,整體機械結構,傳感器,整個電控系統芯片怎麼用更便宜的芯片,有比較多的經驗心得,四足機器人和人形機器人,它其實很多的設計都是非常類似的,大家也知道我們機器狗一臺最便宜賣到9000多塊錢人民幣。

對比一下人形機器還是有點貴的,因爲目前的量不夠。目前人形機器人整個體量還沒有完全起來,如果我們價格定的太低,可能對所有人都不是好事,對我們公司也不是好事,對整個行業不是好事,我們不希望帶頭把行業做爛了,還是希望價格相對合理,如果後續整個的體量,比如到明年後年整個出貨量會更加提升,然後機器人的能力也會越來越強,我覺得價格還是可以有更好的一些調整。

降本的原因也比較多,把所有的零部件,哪怕一個螺絲釘各種方面設計的比較極致,然後生產上做到極致,這個是非常耗時間的。另外剛剛提到有量就降成本,確實量大了可以降成本,這是毋庸置疑的一件事情。

某種程度上大家公認的事情,不是最有競爭的點,其實最大的點是在設計階段就要這樣做降成本的準備,每個零部件要做的更加簡化一點,要考慮一下能不能材料用成本更低的一些材料或者零部件能不能本來用兩個零部件,能不能用一個零部件,這樣的細節要考慮的東西還是非常多的一些事情。包括汽車也一樣,大家像比亞迪成本管控比較好,基本上是公認的,目前新能源汽車裡面成本管控最好,而且是利潤比較好的,這是非常值得學習的地方。

問題:今年國內很多人形機器人宣佈了進廠打工,雖然大多其實不具備一個實際操作,其實已經進入到工廠內去訓練他的能力。目前您怎麼看這個現象?然後宇樹人形機器人的落地現狀和未來規劃是怎樣的?

王興興:這是一個趨勢,最早的話,像埃隆·馬斯克最早提出的時候是需要他的汽車工廠有人去使用,所以這個也是目前像汽車工廠在這塊是比較熱衷的,像我們過去幾個月跟比如蔚來的汽車工廠有合作,就現場部署了我們人形機器人去做現場的搬運,包括國內的別的一些人形機器人也跟汽車工廠有些合作。

目前基本上還是處於試點階段,大家覺得這個方向有價值,共同推進一下去落地部署。但我覺得目前還沒有到真正商業閉環,比如說一臺機器人它產生的商業價值是正向的,就比人可能還更降低成本,我覺得目前還沒有到這個階段。

我們公司主要是賣本體,某種程度上並不是說我們一定要做工業,比如做科研教育、AI公司或者個人買來玩,我們也完全歡迎。

工業領域我們也在推進,比如說我們希望能不能去工廠裡面去幫忙做一些簡單的生產裝配,或者做一些簡單的搬運,我們也在推進這個事情,但可能推進的速度和效率沒有那麼快,我們公司對行業還是比較有耐心的,不是說一定要今年或者說明年一定要在工廠裡要部署多少臺,其實沒有給自己定目標或者逼迫那麼緊,我們還是尊重整個的市場反應。

問題:四足機器人在整個的品類當中,它的應用佔比大概是什麼樣一個水平?隨着人形機器人的快速發展,對於四足機器人來說是機遇還是挑戰?這兩個品類之間,您覺得可能會是一種什麼樣的促進作用?

王興興:對四足機器人的話像消費端、科研教育端還有行業端都有做。消費端的話,因爲去年我們的產品單價更低了,所以今年的話整個消費端的增長速度還挺快的,因爲有更多的客戶使用,然後出貨量其實增長速度還非常快,所以目前消費端可能佔了大概整個機器狗裡面的1/3左右,營收1/3左右,但具體的數據我也不太清楚。

但如果從出貨的數量角度說,消費端的機器狗數量是最多的,因爲它比較便宜,所以光淘寶上就賣了不少Go2。另外,你剛剛提到在人形機器人的加速下,四足機器人有哪些機遇,其實這也是非常有意思的點。

大家可能一直覺得我們公司做了人形機器人,會不會四足機器人顧不過來之類的問題,但實際上我們是整個團隊,包括四足和人形機器人,其實很多人員是公用的,因爲四足機器人以及它的硬件、電控系統、軟件、OTA升級平臺、後臺 、AI算法等共用的地方非常多,所以我們一直堅持的觀點是能共用的地方儘量共用了,包括整個AI體系,我們現在做的AI,不僅希望在人形上能用,機器狗上也能用。我覺得也正好就是通過人形機器人把四足機器人整個行業可以做得更好一點,因爲原本我們沒有足夠的人力去把機器人的軟件做得更好,但是現在爲了給人形機器人做更好的軟件,所以我們順帶把四足機器人軟件也做好了。

還有包括比如說爲什麼我們人形機器人上有些方面,比如說我們現在人形機器人也支持遠程升級,原因是什麼,因爲我把四足機器人系統遠程升級的東西拿過來用了,所以這個也是現成的一些技術的共用。

關於《態度AGI》

本站科技重磅推出系列對話欄目《態度AGI》。過去三年,AI變革風起雲涌,全球科技秩序正在重構,通往AGI的道路或許正在悄然臨近。本欄目以AGI爲題,將對話100位AI專家、企業家、投資人,試圖撥開雲霧,與大家一道見證AGI時代的到來。第十三期對話宇樹創始人兼CEO王興興。

往期回顧:

《態度AGI》第一期:對話李開復:大模型創業狂奔一年 中美差距縮小 我十年不套現

《態度AGI》第二期:對話王小川:我們不跟進大模型價格戰

《態度AGI》第三期:對話戴文淵:大模型價格戰不解決核心問題

《態度AGI》第四期:智源研究院院長王仲遠:GPT4不是國內大模型的盡頭

《態度AGI》第五期:對話朱嘯虎:5年後將沒有獨立的大模型公司存在,因爲沒有商業模式

《態度AGI》第六期:對話梅花創投吳世春:“中國大模型五虎”想要跑出來非常難

《態度AGI》第七期:對話躍然創新CEO李勇:做大模型應用 如何和巨頭錯位競爭

《態度AGI》第八期:對話智譜AI CEO張鵬:視頻生成是AGI必經之路,超級App將在“不知不覺”中到來

《態度AGI》第九期:對話科大訊飛副總裁、研究院院長劉聰:中國大模型已從追趕對標走向自主原創

《態度AGI》第十期:對話360周鴻禕:魔法對付魔法,大模型安全問題得靠大模型

《態度AGI》第十一期:對話彩雲科技CEO袁行遠:超越ChatGPT,需要打開“黑盒”

《態度AGI》第十二期:對話傅盛:不看好雙足機器人商業化,三五年都沒戲