☰

“硬科技”涌現大模型加速落地應用

視頻生成模型“一鍵創作”高清動畫，AI編程新範式逐步改變傳統的編程模式，人形機器人徒手開瓶、製作咖啡……在9月19日開幕的2024雲棲大會上，一批新產品和解決方案集中亮相，展現了人工智能正加快前沿技術創新迭代，面向產業的大模型正加速落地。

在對話框中輸入一句話或添加一張照片，點擊“生成視頻”按鈕，不到一分鐘，一條8秒左右的短視頻生成。大會展館內，通義萬相、Vidu、智譜等多個視頻大模型產品吸引與會者體驗。

今年初，文生視頻大模型Sora在全球人工智能業內外引發廣泛關注。近期，多箇中國科技企業自主研發的視頻生成產品加速上線和升級。“我們通過集成多項創新技術，有效解決畫面表現力和大幅度運動等視頻生成技術難題，可應用於影視創作、動畫設計等領域。”通義萬相現場工作人員一邊介紹，一邊在對話框輸入“穿着滑冰鞋的小兔子在冰面上靈活移動的可愛場景”，隨即一段高清、逼真的動畫視頻呈現在眼前。

與會人士認爲，當前大模型已經具備文本、語音、視覺的多模態能力，能夠開始完成複雜指令，技術快速迭代使其可用性大幅提升。

在此趨勢下，面向人形機器人、汽車、製造、交通等多個領域，多項基於大模型最新應用加速落地應用。

大模型加持下，人形機器人擁有了聰慧的“大腦”、敏捷的“小腦”、靈活的“肢體”。展區內，星動紀元自研的人形機器人小星MAX全身擁有54個自由度，可以猜拳、按摩、穩定行走。“我們研究了人形機器人的操作大模型，基於語言和視覺信號的輸入，通過操作大模型讓人形機器人直接輸出動作，這使得人形機器人有了舉一反三的能力，可以只需要少量數據就能學會相關技能。”清華大學交叉信息研究院助理教授、星動紀元創始人陳建宇說。

在出行領域，“端到端”大模型是當下備受關注的自動駕駛解決方案。小鵬汽車董事長何小鵬介紹，過去2年，小鵬汽車與阿里雲共建的AI算力規模提升超四倍，有了大模型的加持，自動駕駛試驗車轉向、變道像人開車一樣流暢。

“之前的自動駕駛技術，是靠人來寫算法規則，幾十萬行代碼，仍然無法窮盡所有的駕駛場景。採用‘端到端’大模型技術訓練後，AI模型可直接學習海量人類駕駛視覺數據。”阿里巴巴集團CEO吳泳銘說。

數據顯示，我國完成備案並上線、能爲公衆提供服務的生成式人工智能服務大模型已達190多個，註冊用戶超過6億。與會人士表示，下一步，行業大模型研發將帶動企業級市場更加專業化細分化。應結合技術的特點和各個應用方向，提前做好前後端貫穿的機制設計，規劃好技術路線，同時，在安全合規發展的前提下，持續推動產品的更快速迭代，創造更優的用戶體驗。

編輯/範輝

“硬科技”涌現 大模型加速落地應用

相關資訊

“硬科技”涌現大模型加速落地應用