“硬科技”涌現 大模型加速落地應用

視頻生成模型“一鍵創作”高清動畫,AI編程新範式逐步改變傳統的編程模式,人形機器人徒手開瓶、製作咖啡……在9月19日開幕的2024雲棲大會上,一批新產品和解決方案集中亮相,展現了人工智能正加快前沿技術創新迭代,面向產業的大模型正加速落地。

在對話框中輸入一句話或添加一張照片,點擊“生成視頻”按鈕,不到一分鐘,一條8秒左右的短視頻生成。大會展館內,通義萬相、Vidu、智譜等多個視頻大模型產品吸引與會者體驗。

今年初,文生視頻大模型Sora在全球人工智能業內外引發廣泛關注。近期,多箇中國科技企業自主研發的視頻生成產品加速上線和升級。“我們通過集成多項創新技術,有效解決畫面表現力和大幅度運動等視頻生成技術難題,可應用於影視創作、動畫設計等領域。”通義萬相現場工作人員一邊介紹,一邊在對話框輸入“穿着滑冰鞋的小兔子在冰面上靈活移動的可愛場景”,隨即一段高清、逼真的動畫視頻呈現在眼前。

與會人士認爲,當前大模型已經具備文本、語音、視覺的多模態能力,能夠開始完成複雜指令,技術快速迭代使其可用性大幅提升。

在此趨勢下,面向人形機器人、汽車、製造、交通等多個領域,多項基於大模型最新應用加速落地應用。

大模型加持下,人形機器人擁有了聰慧的“大腦”、敏捷的“小腦”、靈活的“肢體”。展區內,星動紀元自研的人形機器人小星MAX全身擁有54個自由度,可以猜拳、按摩、穩定行走。“我們研究了人形機器人的操作大模型,基於語言和視覺信號的輸入,通過操作大模型讓人形機器人直接輸出動作,這使得人形機器人有了舉一反三的能力,可以只需要少量數據就能學會相關技能。”清華大學交叉信息研究院助理教授、星動紀元創始人陳建宇說。

在出行領域,“端到端”大模型是當下備受關注的自動駕駛解決方案。小鵬汽車董事長何小鵬介紹,過去2年,小鵬汽車與阿里雲共建的AI算力規模提升超四倍,有了大模型的加持,自動駕駛試驗車轉向、變道像人開車一樣流暢。

“之前的自動駕駛技術,是靠人來寫算法規則,幾十萬行代碼,仍然無法窮盡所有的駕駛場景。採用‘端到端’大模型技術訓練後,AI模型可直接學習海量人類駕駛視覺數據。”阿里巴巴集團CEO吳泳銘說。

數據顯示,我國完成備案並上線、能爲公衆提供服務的生成式人工智能服務大模型已達190多個,註冊用戶超過6億。與會人士表示,下一步,行業大模型研發將帶動企業級市場更加專業化細分化。應結合技術的特點和各個應用方向,提前做好前後端貫穿的機制設計,規劃好技術路線,同時,在安全合規發展的前提下,持續推動產品的更快速迭代,創造更優的用戶體驗。

編輯/範輝