AI 工作同事來臨:技術巨頭爭霸 2025
OpenAI 一直善於吸引媒體關注。他們的公告常常伴隨着大膽的宣言。比如,他們宣佈 GPT-2 太危險不能發佈,或者他們的"聖誕 12 天"活動,每天展示一個新產品持續 12 天。
最近,Sam Altman 分享了他對去年的看法,聚焦於圍繞他被解僱和復職的戲劇性董事會內幕。他還做出了一個大膽預測:
"我們現在知道如何構建通常理解的 AGI 了。我們認爲到 2025 年,AI 代理將加入勞動力大軍,改變公司的工作方式。"
AGI (通用人工智能) 指創造一個像人類一樣聰明和通用的 AI。與爲特定任務(如翻譯語言、下棋或人臉識別)構建的狹義 AI 不同,AGI 可以處理任何智力任務並適應不同領域。雖然我不認爲"AGI 即將到來",但我確實相信 AI 將加入勞動力大軍 - 不過可能不會像 Altman 想象的那樣。
AGI 近在咫尺?不,至少不是我們(或 Sam)想象的那種 AGI
2025 年 AGI 到來似乎非常不可能。今天的 AI,如 ChatGPT,通過識別模式和做出預測工作 - 而不是真正理解。例如,用"巧克力"完成短語"生活就像一盒..."依賴於概率,而不是推理。
我不相信 AGI 會在 2025 年實現,許多專家也持相同觀點。我在谷歌共事過的 Demis Hassabis 預測 AGI 可能在 2035 年左右到來。Ray Kurzweil 估計是 2032 年,IDSIA 主任 Jürgen Schmidhuber 認爲接近 2050 年。持懷疑態度的人很多,時間表仍不確定。
具體時間重要嗎?AI 已經很強大了
也許 AGI 何時到來並不那麼重要。就連 Sam Altman 最近也淡化了 AGI 中的"G",說:
"我猜我們會比大多數人想象的更早實現 AGI,但它的重要性會小得多。"
我在某種程度上同意這一點。AI 已經具備令人印象深刻的能力。例如,Netflix 的 AI 比你的伴侶更瞭解你的電影偏好。甚至有人開玩笑說 TikTok 的算法能在人自己意識到之前就識別出某人的性取向。AI 在模式識別方面表現出色 - 在許多情況下,它比人類做得更好。
Sam Altman 看到 AI"加入勞動力大軍"
Sam 備忘錄中更重要的一點是他相信 AI 將"加入勞動力大軍"。我完全同意這一點將會發生。正如我在 AI 代理更新中所寫,AI 要在工作場所取得成功,需要兩個關鍵因素:(1) 獲取工具的權限和 (2) 獲取數據的權限。這些是讓 AI 在企業環境中真正發揮作用的基礎。然而,儘管 Sam 經常將這個想法與 AGI 聯繫在一起,但提供這些 AI 勞動力解決方案的領頭羊可能不會是 OpenAI。
微軟的有利地位 - 用戶訪問權
誰擁有勞動力工具?微軟。微軟。微軟。他們處於有利地位。大多數人已經在使用微軟產品 - 無論他們喜歡與否 - 而 AI 正深度整合到這些工具中,Copilots 無處不在。
2023 年和 2024 年,許多初創公司推出了令人印象深刻的辦公 AI 服務,但很快就被微軟和谷歌等巨頭壓制,這些巨頭可以直接接觸客戶。以 Jasper.ai 爲例 - 這曾是一個備受讚譽的 AI 文本起草工具。正如我在這篇 LinkedIn 帖子中指出的,類似功能現在直接內置於谷歌和微軟產品中,使得小型參與者越來越難以競爭。
數據訪問的力量
AI 需要數據才能真正發揮作用。如果你想了解公司內部流程或文檔洞察,像 ChatGPT 這樣的通用工具是不夠的。我們需要的是能夠閱讀和總結公司文檔的工具,專門爲企業使用而定製。正如我之前所說,2025 年將是搜索之年 - 尤其是企業搜索。能夠回答問題、總結內容並幫助用戶瀏覽複雜信息的工具將成爲遊戲規則改變者。
誰有權訪問這種數據?微軟是一個大玩家,但他們並不孤單。例如,Salesforce 擁有大量寶貴數據 - 客戶互動、討論、流程文檔、營銷策略等。Salesforce 想要 AI 代理來幫助釋放這種潛力嗎?當然。
難怪 Salesforce CEO Marc Benioff 最近抨擊了微軟。他稱他們的 AI 助手 Copilot "令人失望",說"它就是不起作用,也沒有提供任何準確性。"他甚至將其稱爲"Clippy 2.0" - 這是我聽過的最有趣的侮辱 - 然後推出了 Salesforce 自己的 AI 解決方案 Agent Forces。
OpenAI 僅僅是"最聰明的工具"?
OpenAI 沒有像微軟那樣的數據訪問權或消費者覆蓋面,也沒有 Salesforce 那樣豐富的商業數據寶庫。那麼,他們的角度是什麼?他們聲稱是最聰明的工具 - 很可能確實如此,儘管我個人認爲 Anthropic 的 Claude 3.5 目前比 OpenAI 的 GPT-4 更好。
OpenAI 押注於他們能以卓越技術超越所有其他競爭對手。這就是爲什麼 Sam Altman 自信地聲稱我們會看到 AGI。這個大膽聲明背後是什麼?推理 - 或者按照 OpenAI 的說法,Reasoning。
OpenAI 和推理
OpenAI 最近推出了 o1,這是一個旨在通過迭代、自我調用過程展示高級推理能力的模型:
迭代和反思:模型生成輸出,評估或批評它,並在新一輪推理中改進它。
反饋循環:這創造了一個反饋循環,模型重新審視其輸出,批評它們,並進一步改進。
本質上,使用 o1 的 GPT 不僅僅提供答案 - 它還計劃、批評計劃並持續改進。
特別值得注意的是這代表的範式轉變。下一代 AI 模型不是簡單地發佈更大的模型如 GPT-5,而是專注於在推理過程中"思考更長時間"。這種迭代處理能力可能就是 Sam Altman 所說的"我們現在知道如何構建 AGI"。
推理足以成爲理由嗎?
但僅憑"推理"能讓 OpenAI 進入遊戲嗎?OpenAI 仍然需要訪問數據和強大的用戶羣,就像 Salesforce 或微軟一樣。爲了解決這個問題,OpenAI 推出了 macOS 版 ChatGPT 桌面應用。這個應用現在可以直接從面向開發者的工具(如 VS Code、Xcode、TextEdit、Terminal 和 iTerm2)讀取代碼。這意味着開發者不再需要將代碼複製粘貼到 ChatGPT 中 - 這是迄今爲止的常見做法。這是一個非常有用的工具,也是更深入融入開發者工作流程的明智之舉。
與大語言模型對話需要成本
每次調用大語言模型 (LLM) 都需要成本。對於重度 ChatGPT 用戶來說,20 美元的訂閱費可能甚至無法覆蓋他們的使用成本。OpenAI 最近在 E 輪融資中籌集了 66 億美元 - 這是維持運營所需的重要資金。雖然 Agentforce 從客戶那裡獲得了可觀的收入,微軟享有龐大的財務實力,但 OpenAI 仍處於讓企業和用戶支付足夠費用以抵消開發尖端 AI 的鉅額成本的早期階段。
他們每月 200 美元的高級套餐(包括 O1 的擴展版本)就是朝這個方向邁進的一步。但這個價格值得嗎?也許這就是爲什麼 AGI 一直是討論的一部分 - 它有助於證明高端定位的合理性。然而,創造更優秀模型的競賽遠未結束。就連 O1 也可能很快被開源替代品超越,就像我們之前看到 Meta 的 Llama 那樣。
說到 Meta,我相信我們會在 2025 年看到他們嘗試將 AI 模型貨幣化。最終,這些參與者面臨的最大挑戰仍然很明確:在沒有確保穩定可靠收入流的情況下,如何證明鉅額成本的合理性。
Sam 說得對:AI 代理將進入勞動力市場
到 2025 年,我們將看到更多 AI 代理進入勞動力市場,通過簡化、增強和自動化各行業的任務來改變工作流程。這些不會是全面的 AGI 模型,而是爲專門工作流程設計的較小、專業化模型。AI 將逐步擴展和改進流程,結合傳統 AI、上下文檢索和強大的用戶設計,以解決安全性、幻覺和用戶控制等挑戰。
成功將取決於通過集成良好、用戶友好和符合道德設計的解決方案來提供價值,正如我在構建企業就緒 AI 工具的框架中所概述的。對 Sam Altman 來說,關鍵的戰略問題不會是實現 AGI,而是如何爲像微軟或 Salesforce 這樣的企業客戶定價 OpenAI 的基礎模型 - 特別是如果 OpenAI 最終直接與它們競爭。
但我們將如何與這些新的 AI 同事合作?
在爭奪更好的模型、更好的數據和更好的集成方面,企業將成爲贏家。他們的主要焦點應該是培訓員工和客戶如何有效地與新的 AI 同事合作。在我的 eCornell AI 解決方案證書課程中,我親眼目睹了一旦學生學會與 AI 副駕駛溝通,生產力就會飆升。最初,許多人難以取得成果,但一步步指導如何與 AI 互動產生了顯著差異。
爲什麼?因爲即使具備推理和規劃能力,AI 也還沒有真正"通用",無論 Sam Altman 如何炒作。學生必須學會何時依賴 AI,何時運用人類判斷。我相信 2025 年將是公司意識到這一需求並大力投資 AI 教育的一年。