☰

谷歌放出最強大模型狙擊OpenAI，重心轉向AI智能體

繼發佈最強量子芯片之後，谷歌又在AI上作出重要舉動。

北京時間12月12日凌晨，谷歌趕在OpenAI宣佈ChatGPT正式登陸iPhone之前，發佈了全新模型Gemini 2.0。

谷歌CEO桑達爾·皮查伊稱，這是谷歌迄今爲止最強大的模型。憑藉原生圖像和原生音頻的輸出等多模態方面的提升，Gemini 2.0能夠構建新的AI智能體，讓谷歌離構建通用助手的願景更進一步。

需要指出的是，Gemini 2.0主要開放給開發者以及受信任的測試人員。目前，Gemini 2.0 Flash體驗版模型已經面向所有Gemini用戶開放。

Gemini 2.0 Flash是建立在1.5 Flash基礎之上的模型，此前1.5 Flash是谷歌最受開發者歡迎的版本。與1.5 Flash相比，Gemini 2.0 Flash在同樣快速的響應時間下性能進一步增強。谷歌方面稱，2.0 Flash在關鍵基準測試中甚至超越了1.5 Pro，其速度是1.5 Pro的兩倍。

同時2.0 Flash還具有新功能，除了能夠支持圖片、視頻和音頻等多模態輸入，還可以支持多模態輸出，比如可直接生成圖像與文本混合的內容，以及原生生成可控的多語言文本轉語音（TTS）音頻。它還可以原生調用Google Search、代碼執行以及第三方用戶定義的函數等工具。

全球Gemini用戶現在可以在電腦端和移動端體驗基於2.0 Flash優化後的聊天對話，並且該版本將很快在Gemini移動應用中推出。基於這個新模型，用戶還可以體驗到Gemini助手。明年初，谷歌還會將Gemini 2.0擴展到更多產品中。

Gemini 2.0最大的變化在於把重心轉向AI智能體，想要做所有AI智能體的基座模型。基於此，Gemini 2.0開發出了一系列原型，這些原型能夠幫助用戶完成相應的任務。

其中，Project Astra的升級版，用於探索未來通用AI助手能力的研究原型。自從在Google I/O大會上推出Project Astra以來，谷歌一直向那些在Android手機上使用它的受信任的測試人員收集反饋。此次推出的升級版可以實現多種語言和混合語言之間的對話，也可使用 Google Search、Google Lens和Google Map等新工具，能夠記住長達10分鐘的會話內容，並可以近於人類對話的延遲來理解語言。

全新的Project Mariner從瀏覽器入手探索人與智能體交互的未來發展。Project Mariner 使用了Gemini 2.0構建的早期研究原型，能夠理解和推理瀏覽器頁面中的信息，包括像素和文本、代碼、圖像和表單等網頁元素，然後通過實驗性的Chrome擴展程序幫助用戶完成相應任務。此次升級，Project Mariner改進了原來速度較慢的問題。

簡而言之，用戶可以用這項功能讓瀏覽器自己去幫你完成特定任務，例如批量查找某些網站上郵箱地址，從而在一定程度上實現瀏覽器的“自動運行”。

Jules則是面向開發者的編碼智能體，它可以直接集成到GitHub工作流程中來協助開發者完成開發任務。

在谷歌的演示視頻中，演示人員輸入了一長串含有詳細編程問題的提示語，之後Jules會對這些要求進行分析，給出一個三步的編程解決方案，待點擊同意後，模型就會開啓自動編程，生成代碼。這無疑有助於開發者進一步提升工作效率。

去年年底，谷歌發佈了Gemini 1.0模型，主要能力是整合和理解信息。而Gemini 2.0能讓信息變得更加有用。桑達爾·皮查伊表示，Gemini 2.0的進展得益於谷歌長達10年全棧式AI創新研究的投入，基於谷歌定製的硬件第六代TPU Trillium構建而成。

就在谷歌以最強大模型吸睛之時，OpenAI爲期12天的產品發佈活動仍在進行中。同一天，OpenAI對外展示了ChatGPT與蘋果Apple Intelligence的整合，內容略顯平淡。谷歌Gemini 2.0的突然發佈，顯然搶了不少OpenAI的風頭。

在Gemini 2.0的加持下，谷歌一口氣推出三款智能體產品，也意味着其在和微軟綁定OpenAI、亞馬遜與Anthropic的競爭中又邁出了重要一步。

智能體已經成爲大模型領域競爭的核心方向。所謂智能體，是指能夠感知環境、進行決策並採取行動以實現特定目標的系統，被視作大語言模型（LLM）落地應用的關鍵載體。

近兩個月前，微軟曾連發10個AI智能體，面向銷售、運營等場景，隨後又宣佈Copilot Studio平臺已支持用戶構建自主智能體，同時發佈5款預構建的智能體。而在剛剛結束的2024 re:Invent上，亞馬遜一口氣發佈了6款大模型，其中Amazon Nova Premier同樣是多模態大模型，專爲複雜推理任務而生。

無論在消費端還是企業端場景中，AI智能體均有較多想象空間，商業化前景也較爲明確。多位業內人士預計，2025年將是AI智能體商用爆發之年。屆時，谷歌、OpenAI等科技巨頭圍繞智能體的競爭勢必將愈發激烈。

谷歌放出最強大模型狙擊OpenAI，重心轉向AI智能體

相關資訊