人形機器人井噴前夜|星動紀元陳建宇:產業有可能以超預期速度發展
8月19日,星動紀元官宣發佈新一代人形機器人——星動STAR 1。但這並非該團隊第一代研發的機器人。
早在2022年,星動紀元團隊完成了第一代人形機器人的研發,之後不到兩年時間裡,他們的人形機器人進行了6次迭代。
星動紀元創始人、清華大學交叉信息研究院助理教授陳建宇在機器人領域已經有10餘年研發經驗,曾經涉足四足機器人、機械臂、無人車等。
他在接受紅星資本局等媒體採訪時表示,未來人形機器人的具身智能如何去做,仍有最大的不確定性。如何實現通用的具身智能,目前最前沿的學術界都還很難回答這一問題。
但是他也指出,在數據驅動的時代,整個產業有了階躍式發展的可能。人形機器人完全有可能以超出大家預期的速度發展。
他告訴紅星資本局,去年國內佈局人形機器人的企業並不多,但今年包括整機和零部件企業至少涌現了幾十家,同時還帶來了不少新品。可以看到整個行業都在快速發展着。
人形機器人最大瓶頸:
依然在具身智能
今年,人形機器人已經開始進入小批量量產階段,部分企業還給出了下半年時間表以及產品售價。但對於量產一事,陳建宇認爲當下還無需過於關注。
“現在人形機器人真正的問題不是量產。是否真的有這麼大客戶需求在,以及技術能否達到,這些纔是規模化量產的前置條件。”陳建宇認爲,現在的人形機器人還不足以能完成一些特別複雜的事情,這是它的最大卡點。
“人形機器人現在最大的技術瓶頸依然在具身智能。硬件決定了人形機器人應用落地能力的上限,但是目前人形機器人產業擁有的硬件基礎支撐起來的應用上限,具身智能算法還暫時沒有達到。”
他指出,人形機器人的硬件基礎本身能夠支撐它完成的一些任務,由於現有AI算法的能力不足,目前的人形機器人還無法真正實現這樣的產品力。
在陳建宇看來,當前現狀是大家還沒有真正找到一個引爆需求點的場景,正在賣的人形機器人也並不是爲了滿足真實市場需求而做的,更多是爲一些早期嚐鮮者提供,由此產生的銷量不會很大。一定要解決諸如工業場景這樣足夠大的場景中的某些需求、能夠提供一個非常有價值的解決方案,才能推動人形機器人實現規模化量產。
在量產推進方面,特斯拉是否會先人一步?陳建宇認爲,特斯拉的優勢在於場景,自家的車廠可以完全開放去收集數據和訓練,推進速度可能會快些。“馬斯克的資源足夠豐富,他可以做的更大膽。但一些技術難點還是需要有時間成本。”
對於星動紀元自己的商業計劃,陳建宇表示會先從靈巧手開始商業化,會逐步根據市場需求進行後續的產品迭代。陳建宇強調了性能的重要性。“需要它真正能幹活,甚至是人幹不了的活,這對力量、效率都有比較高的要求。”
人形機器人迭代速度正越來越快
人形機器人的落地應用,到底是缺少剛需場景,還是技術不夠成熟?陳建宇認爲兩者都存在。“人形機器人還是個全新的產品品類,需求雖然客觀存在,但大家還要找到匹配的需求點,這個仍在探索。”而在技術方面,陳建宇認爲還需要再有一定程度的發展,比如力量要做全,還包括執行能力、行走能力等。要讓它逐步的“越走越快,越走越穩”。
不過陳建宇對整體產業發展是樂觀的。“很多人看到的是人形機器人現在能做什麼,這些能力距離他們心中理想的人形機器人形態還有多遠,但我看到的是以後人形機器人會發展成什麼樣。”
陳建宇表示,現在人形機器人技術發展非常快,以往人形機器人的研究方法,是以線性增長的趨勢推動整個產業發展,現在在數據驅動的時代,整個產業有了階躍式發展的可能。是以超出大家預期的速度在發展着。
以星動紀元自己爲例,陳建宇表示,在人形機器人研發過程中他們積累了很多通用的技術,將這些技術能力逐步進行模塊化後,研發新產品時,很多模塊是直接從之前產品中複用而來。“我們平均一代人形機器人產品幾個月就能迭代完成,而且這個迭代速度還在越來越快。”
同時大模型的加持也在助力人形機器人的發展。陳建宇表示,用大語言模型、ChatGPT直接接入就可以在任務規劃、感知識別、語音理解等方面直接幫助機器人,同時要做一款機器人大模型,也可以比較多去借鑑大語言模型的底層技術。
“我們研究了人形機器人的操作大模型,基於語言和視覺信號的輸入,通過操作大模型讓人形機器人直接輸出動作,相較而言,這是一個端到端的語言-視覺-動作大模型。”
團隊在實驗中觀察到,通過大量的數據訓練,操作大模型具備較好的泛化性,這使得人形機器人有了舉一反三的能力——在進入到一個新的任務場景中,人形機器人只需要少量數據就能學會相關技能。
“在一個新的任務場景中,只對人形機器人進行了幾個簡單物品的操作訓練,之後我們發現,人形機器人在面對更復雜的環境和物體時,在沒有進行鍼對性訓練的情況下就能夠準確地進行相應的操作,這就讓人形機器人具備了泛化性。”
紅星新聞記者 王田
編輯 楊程