“智譜AI CEO張鵬用AI給你發了一個紅包”
AI Agent正在變得更像一個人類,不僅可以查百科、點外賣,還可以幫你發紅包、發文件和點贊朋友圈了。
“幫我面對面建一個羣,數字是1129,並將羣聊名字改成智譜開放日。”11月29日上午十點左右,在Agent OpenDay現場,智譜AI CEO張鵬對着手裡的一臺榮耀手機說道。
很快,這個微信羣成立,並且迅速滿員到無法再加入。隨即,張鵬再次發出語音指令,“幫我在智譜開放日的羣聊裡發個兩萬的紅包,數量爲一百個,名字爲‘AI給你發的第一個紅包’。”
就這樣,人類歷史上第一個由AI發出的微信紅包被拆開。
這就是智譜AI在今天要展示的AutoGLM能力,一個具備App、Web、PC端三種形態的助手:AutoGLM可以自主執行超過50步的長步驟操作,也可以跨app執行任務。它同時開啓了“全自動”上網體驗,支持等數十個網站的“無人駕駛”。另外,基於計算機操作的GLM-PC同步啓動內測。
在演示片中,用戶可以讓它先去小紅書查詢火鍋需要的食材,再去外賣平臺自行下單。也可以對它說出“幫我給XX微信羣裡每個人的第一條朋友圈點贊”,接着就可以在微信羣每個用戶頭像之間,看見手機屏幕從點進朋友圈到點贊再到退出的一連套循環操作。
超長任務、跨App和短口令,是AutoGLM目前最突出的能力,這直接決定了用戶對於AI Agent的使用場景豐富度和可操作性。另外,智譜爲其加入了“隨便模式”,例如只說出“點咖啡”,AI可以幫忙進行一個盲選決策。
目前在PC端,智譜推出的GLM-PC開放了第一階段內測場景,包括幫忙預訂和參與會議併發送會議總結的會議替身,以及文檔處理,網頁搜索與總結,遠程和定時操作,還有在用戶工作時可自主完成工作的隱形屏幕。
不過,由於PC操作的複雜程度,智譜方面坦率表達了現有大模型能力距離真正代替大家辦公還有一定距離。GLM-PC在當前版本下,用戶仍需要輸入非常精準的指令。
“時至今天,我想大家都已經認識到大模型不只是chatbot,其本質在於對世界的‘理解’能力以及預測能力。”張鵬表示。
與GenAI(生成式)不同,Agent是目標驅動型的,能夠完全執行工作流程,適應、學習、迭代、與其他系統和人類協作,並端到端地完成任務。在張鵬看來,Agent可以看作是大模型通用操作系統LLM-OS的雛形。
這使得AI Agent已經成爲衆多科技巨頭的共同戰場。例如蘋果的Apple Intelligence、Anthropic的Computer Use、谷歌的Jarvis,以及OpenAI的Operator,這些企業已經將Agent作爲產品層面的重要關注點。
至此,有行業觀點認爲,2025年將是Agent爆發之年。Gartner近期將agentic AI(智能體AI)列爲2025年十大技術趨勢之一,並預測2028年至少有15%的日常工作決策將由agentic AI自主完成,而這一數字在2024年爲0。
但正如智譜自身所指出的,目前複雜操作的Agent能力還受限於模型性能,它真正的流暢度和智能程度也要等待用戶實測後的反饋。但在AI大模型自身技術發展和衆多終端廠商的共同推進下,張鵬眼中的“LLM-OS”有機會逐步成爲下一代人機交互的主流方式。
回看移動互聯網與智能手機的共創時代,這背後大概率暗藏一個C端(用戶端)的入口級機會。無論現階段軟硬件協同程度和市場普及度如何,接下來,這片戰場的競爭只會愈演愈烈。