ChatGPT界面大更新,開始卷應用了?這次想滅誰?

作者 | Jessica郵箱 | JessicaZhang@pingwest.com

就在OpenAI宣佈獲得史上最大規模66億美元融資的第二天,又推出了自ChatGPT問世兩年來的首次重大界面更新“canvas(畫布)”。

canvas是一個全新設計的交互界面,專爲寫作和編程任務設計。不再侷限於傳統的聊天模式,而是通過在標準對話框旁開啓的獨立窗口,提供一個用戶與ChatGPT的深度協作空間,共同創建和優化項目。

它基於特別訓練的GPT-4o構建,用戶可以直接在這裡編輯文本或代碼。選定任何需要修改的部分,ChatGPT就會基於上下文環境給出精準的優化建議。系統還提供了包含調整文本長度、更改閱讀水平、代碼審查修復、添加等在內的快捷菜單。此外,通過 “返回”按鈕,用戶可以輕鬆恢復之前的工作版本。

打開canvas很簡單:在模型選擇器中選擇“GPT-4o with canvas”,只需輸入“使用canvas…”或“啓動canvas…”之類的提示,新窗口就會彈出。當ChatGPT檢測到可能有幫助的場景時,無需用戶調用,canvas也會自動打開。

具體來看看它的各項功能。

1

canvas輔助寫作

canvas可以根據指令爲你生成一個項目初稿,供你與AI一起編輯,也可以對現有草稿進行優化。適合長文章、報告、策劃案或電子郵件等內容撰寫。

內置5項實用的寫作快捷功能:

建議編輯:由ChatGPT提供行內建議和反饋。

調整長度:將文檔長度擴充或精簡。

更改閱讀水平:調整閱讀水平,範圍涵蓋從幼兒園、中學、大學到研究生。

最終潤色:全面檢查語法、清晰度和一致性。

添加emoji:添加相關表情符號以增強趣味色彩。

例如以下視頻中,用戶先上傳筆記至canvas生成博客內容,再爲第一段添加舉例讓表述更豐富和潤色題目,最後調至“大學閱讀水平”。不到一分鐘,粗略零散的筆記就變成了一篇完整的結構化博客文章。

硅星人也淺試了一下,在canvas裡讓GPT寫一篇介紹OpenAI本週新聞的文章,然後翻譯爲中文。可以看到中文稿直接覆蓋原英文生成,而不是以問答形式另起對話。

進一步用“建議編輯”補充內容後,分別生成“Graduate School”和“Kindergarten”版本來對比看看差異。

除了AI智能改進之外,還能直接在原文調整字體加粗、斜體、字號等格式。

簡單來說,canvas拓展了一種與ChatGPT的全新交互方式。集成多種工具,讓用戶在聊天和文檔編輯之間無縫轉換,輕鬆將對話中的想法變爲成熟的最終版本。在一個平臺完成全套寫作過程,有效避免了工作流的中斷。

1

用canvas編程

與寫作類似,編程也是一個需要反覆迭代的過程,且對邏輯的嚴密性有更高的要求。爲了幫助開發者更高效完成代碼編寫和調試,canvas 也配備了一些相關的便捷功能,包括:

代碼審查:ChatGPT提供編建議,供用戶批准或拒絕,幫助優化代碼質量。

添加logs:插入print日誌輸出,幫助開發者跟蹤程序運行情況,方便調試。

添加comments:爲代碼添加註釋,便於理解代碼。

修復錯誤:自動檢測並修復代碼中的問題,減少調試時間。

代碼移植:將現有代碼轉換爲不同編程語言,如JavaScript、Python、Java等,便於跨語言開發。

下面的demo展示了在canvas界面生成Rust語言的API Web服務器,並進行代碼優化和全局審查的過程。

1

使用o1-preview輸出的合成數據特別訓練

OpenAI對canvas集成的GPT-4o進行了專門訓練,使其能夠在創作過程中擔任更積極的協作者角色,並且具備更好的上下文感知能力。

爲此,研究團隊開發了“在寫作和編程任務中自動觸發畫布、生成多樣化內容類型、執行有針對性的編輯、重寫文檔、提供內嵌批註與建議”等核心功能。

訓練方法上,應用了他們一直強調的合成數據生成技術,從o1-preview模型中提取輸出,幫助GPT-4o針對目標功能進行後期訓練。這一方法使ChatGPT能夠快速提升寫作質量,並適應新的用戶交互模式,無需依賴人工生成的數據。

(如果擔心自己上傳的內容被OpenAI用於模型訓練,記得到用戶設置裡關閉“數據共享”選項。)

1

canvas集成模型評估

爲了評估模型表現,OpenAI進行了超過20項內部自動化測試。

其中一個關鍵挑戰是定義何時觸發canvas功能。研究團隊教會模型在處理複雜寫作任務時正確觸發畫布,比如“撰寫博客文章”,而避免在類似“幫我做一道晚餐食譜”這樣的簡單問答中過度觸發。經過優化後,GPT-4o在寫作任務中的正確觸發率達到83%,編程任務的正確率更高,達到了94%。

第二個挑戰是模型在canvas被觸發後的編輯行爲。比如在用戶明確選擇特定文本時進行有針對性的編輯(targeted edit),其他情況下則傾向於重寫(rewriting)。結果顯示,特別訓練後的GPT-4o在針對性編輯上的準確率比基線模型提高了18%。

此外,團隊還通過人工評估驗證了模型生成高質量評論的能力。相比零樣本提示的GPT-4o,canvas集成的模型在評論準確性上提升30%,在評論質量上提升16%。

1

OpenAI開始卷應用

可用性方面,canvas測試版已對Plus和Team用戶開放,下週起擴展至教育及企業用戶,最終會讓所有用戶都能免費訪問。

OpenAI表示,canvas目前仍處於早期階段,但他們計劃迅速提升其功能。對於那些需要頻繁編輯和修改的複雜任務,讓canvas成爲傳統聊天界面的有力補充,實現“更自然”的人機協作願景。

Canvas並不算OpenAI掀起的全新交互模式,也離最理想的AI與人類交互形態還很遠。而且,在canvas身上,用戶能看到很多OpenAI對手已經做出來的產品形態的影子。它就像Anthropic的Artifacts工具及AI代碼編輯器Cursor等明星應用產品功能的大雜燴,然後在這些基礎上做了一些細節的升級。

很明顯,卷應用是OpenAI新的發力方向。此前OpenAI其實在應用的交互體驗和細節設計上都有些遲緩,這家公司在GPT模型依然能保持領先的階段,並沒有體現出對產品的重視。現在模型能力的格局已經完全不同,不僅差距縮小,而且當前多家大模型和消費級AI提供商都將可編輯工作空間作爲生成式AI的最新突破點。

除了上面提到的幾款應用,此前谷歌不僅將Gemini集成到Docs,它的NotebookLM近期創新的AI播客功能也大受好評,現在OpenAI也加入了進來。

隨着大量資金仍在流向硅谷的AI公司,消費者在未來一年內可以期待更多基於現有工具的結構性實驗新品推出。只不過這個過程裡,OpenAI變得更像一個追隨者,而非引領者了。