谷歌(GOOGL.US)發佈新一代AI模型Gemini 2.0 Flash

智通財經APP獲悉,週三,谷歌(GOOGL.US)發佈了Gemini 2.0系列人工智能模型的第一個版本。該模型被稱爲Gemini 2.0 Flash,其聊天版本可供全球用戶使用,而具有文本到語音和圖像生成功能的實驗多模式版本則可供開發人員使用。

谷歌表示,這是他們迄今爲止最強大的人工智能模型,“專爲智能體時代設計”,並同時介紹了多個智能體應用(AI Agent)。對於Gemini 2.0模型,谷歌表示會先將開放給開發者以及受信任的測試人員,並將其整合到產品中。Gemini 2.0基於谷歌定製的硬件第六代TPUTrillium構建而成。谷歌表示,TPU爲Gemini2.0的訓練和推理提供100%算力支持。

谷歌首席執行官Sundar Pichai在一份聲明中表示:“如果說Gemini 1.0是關於組織和理解信息,那麼Gemini 2.0是關於讓信息變得更有用。”

目前谷歌完全對外開放的新模型是Gemini 2.0 Flash體驗版,這是谷歌的主力模型,具有低延遲特性。與此前的1.5 Flash版本相比,Gemini 2.0 Flash在同樣快速的響應時間下性能進一步增強。谷歌提到,2.0 Flash在關鍵基準測試中甚至超越了此前的旗艦模型1.5 Pro,其速度是1.5 Pro 的兩倍。

同時Gemini 2.0 Flash還具有新功能,除了能夠支持圖片、視頻和音頻等多模態輸入,Gemini 2.0 Flash可以支持多模態輸出,例如可以直接生成圖像與文本混合的內容,以及原生生成可控的多語言文本轉語音(TTS)音頻。它還可以原生調用Google Search、代碼執行以及第三方用戶定義的函數等工具。

作爲提供給開發者的體驗版模型,Gemini 2.0 Flash 現在可以通過Google AI Studio和Vertex AI中的Gemini API獲取,所有開發者均可使用多模態輸入和文本輸出。該產品將於明年1月全面上市,谷歌稱屆時將推出更多型號。

Gemini 2.0系列模型代表了谷歌在科技行業競爭日益激烈的人工智能競賽中的最新努力。其競爭對手包括微軟(MSFT.US)和Meta(META.US),以及OpenAI等初創公司。

值得注意的是,除了最新發布的Gemini 2.0 Flash,在發佈產品的同時,Sundar Pichai在X上着重提到了智能體Project Astra,認爲其“展示了通用AI助手的曙光”。

據悉,Project Astra是谷歌最初在5月的I/O大會上首次對外發布的AI助手,彼時主要是對標OpenAI的GPT-4o,其主要功能包括實時語音和視覺處理,能夠通過手機或谷歌眼鏡進行跨文本、音頻、視頻的多模態實時推理。谷歌在此次的博客中將其稱爲“使用多模態理解現實世界的智能體”。

對於此次正式發佈的Project Astra,谷歌表示,它能夠流暢地在多種語言和混合語言之間進行對話,並且能夠理解不同口音和生僻單詞。此外,藉助Gemini 2.0,Project Astra可以使Google Search、Google Lens和Google Maps,從而在日常生活中發揮助手的作用。

谷歌增強了Project Astra的記憶能力,這一助手目前可以記住長達 10 分鐘的會話內容,並且可以回憶起過去與它進行的更多對話,能提供個性化服務。

谷歌表示,AI智能體在現實中的應用是一個令人振奮且充滿可能性的研究領域,團隊正在探索這個全新的領域,並開發出了一系列原型,幫助人們完成任務。除了Project Astra的升級版,這次谷歌發佈的智能體還包括:完成複雜任務的智能體Project Mariner,能夠幫助開發者的編碼智能體Jules,以及遊戲和其他領域的智能體。

本文源自:智通財經網