AI帝國反擊戰: Google的逆襲 | Gemini2.0+Willow量子芯片

未經許可不得轉載,務必保留原文出處鏈接和公衆號名片

關注本城公衆號並設星標,不錯過最新精彩內容

文:Web3天空之城·城主

【城主說】科技AI圈之所以備受關注,一方面是科技文明屬性爆棚,一方面是有人的地方就有江湖,各種恩怨八卦堪比好萊塢大片。

最近幾天是OpenAI Sam Altman高調宣稱的“十二日”發佈會,每天做一個發佈。實話說,越看越無趣。昨天號稱大招的Sora發出來,第一波無腦吹的媒體文過後,大家發現其實Sora沒有傳說中那麼驚豔。不能說不好,但一定要說比國產的幾個AI視頻生成產品好到哪去,又說不上來。

而今天,是OpenAI十二日發佈會的第五天,居然只有區區10分鐘,去炒了蘋果AI+ChatGPT的冷飯,這種舊聞城主甚至連看完的動力都沒有。

但另外一邊,Google巨頭這兩天連續王炸,昨天發佈了號稱史上最大突破,自從90年代至今首次實現錯誤閾值控制的量子芯片Willow;今天,Google更是推出自家大模型的大版本號升級 Gimini2.0!(關於Google量子芯片和Gimini2.0的主要知識點請見文後)。

昨天左手硬件大招,今天右手軟件大招,谷歌明顯就在狙擊OpenAI,而且非常到位:小道消息稱OpenAI已經緊急調整了發佈計劃,準備把十二日發佈會的真正主菜往前放。

(題外話,屋漏偏逢連夜雨,今天ChatGPT突然宕機了整整4個小時,在一個最不應該宕機的時候。目前看來,這個絕對P0級的事故,給最近風雨飄搖的OpenAI再加了個問號,企業級服務,OpenAI究竟行不行?如果是OpenAI的企業級API出現了4個小時的中斷,那對OpenAI進軍toB雄心的打擊會是毀滅性的。)

衆所周知,OpenAI的初心是爲了阻止Google AI(即當年DeepMind)的一家獨大,儘管現在 OpenAI初心早已不在,爲了變成營利性公司和創始投資人馬斯克撕破了臉皮,但OpenAI和Google對着幹的血脈似乎尚存,過去幾次發佈會,都相當針對的狙擊了Google,搞得科技巨頭灰頭灰臉。

現在距離ChatGPT發佈正好是2年,Google曾經因爲ChaGPT的火速崛起被OpenAI打了個措手不及,早已退休的聯合創始人都不得不迴歸親自帶隊來打AI大戰。時過境遷,Google這兩天的AI發佈頗有逆襲和歸來的意味。兩大重磅消息向世人宣佈,Google依然是AI牌桌上最重要的力量。具備原生多模態能力的Gemini2.0不能說比那個畫餅畫了很多次的GPT5要好,但至少在當下幾個主流AI大模型(OpenAI GPT-4o,Anthropic Claude 3.5 Sonnet,還有馬斯克的xAI Grok...等等)的PK中,完全不輸。而且這自帶的原生多模態,就是一個重要的亮點。

Google以大版本號2.0命名自家新模型版本,在OpenAI造勢的十二日發佈會的七寸時間發出,信號非常明顯。除非OpenAI拿出一個比GPT-4o更牛逼的基礎模型,否則,這一招還真不好接。

所以Google這一次,稱之爲AI界的帝國反擊戰毫不爲過。君子報仇,2年未晚。

最近在AI/大模型圈有一些新的(或許也沒那麼新)反思,按當下基礎大模型訓練所需的巨大耗費,一次訓練都是上億甚至十億的燒錢,很快所有號稱做基礎大模型的創業公司要麼倒閉,要麼是騙子,要麼轉型做應用。基礎大模型牌桌能留下的只有寥寥幾個國內外巨頭。

而在基礎大模型的頂級玩家裡, OpenAI(GPT模型)和Anthropic(Claude模型)算是兩個異類,作爲創業公司,崛起得最快,當下企業級運用也最廣 - 看一下現在顯示所調用API的AI應用,無一例外都默認支持GPT或者Claude。這兩家都拿到了數十億美金的融資,應該足夠支撐完成下一代大模型的訓練。

但然後呢?大模型最大的問題是,現金流收入恐怕無法支撐一代大模型的訓練,更別說一次又一次的訓練迭代了。

只有幾個科技圈巨頭,國外就是Google,亞馬遜,微軟,再加上新入局不差錢的馬斯克xAI,可以不計成本的砸錢投入,因爲巨頭有足夠的資金去燒,巨頭的目標不是現在賺錢,而是砸錢圈下全球市場,十年之後再賺錢都爲時不晚。

當年微軟爲了XBOX遊戲機足足燒了整整十年,纔在XBOX360時代立住腳跟。所以對於關係着科技命脈的AI基礎大模型,如果說各大巨頭沒有燒個十年八年的勇氣,城主是不信的。

回過來看Google,從被OpenAI打得找不到北,到現在一次狠狠的反擊,時間也沒有過太久。當然今天好戲纔開場,諸位看官不妨關注一下後續幾天OpenAI拿出什麼來回應。

只是,沉睡的巨龍們已經甦醒,留給小蝦米們的時間還有幾天?

Google DeepMind 負責人Demis談Gemini2.0

基於代理的 AI 時代已經來臨

在訪談中,Demis Hassabis 多次強調,我們正邁入一個“基於代理的時代”。這意味着未來的 AI 系統將不再是被動地等待指令,而是能夠主動地爲用戶執行任務、進行推理、規劃和行動。這將徹底改變我們與 AI 的互動方式,使其成爲我們日常生活中的得力助手。

Gemini 2.0 是基於代理系統的強大基石

Google DeepMind 最新發布的 Gemini 2.0 模型系列,將爲基於代理的系統提供強大的支持。Gemini 2.0 在性能、成本和延遲方面都取得了顯著的進步,例如 Flash 模型的性能與更大的 1.5 Pro 模型相當,但尺寸和速度保持不變。這將使 AI 代理能夠在更廣泛的設備上運行,並更有效地處理複雜任務。

Project Astra:通用數字助理的未來形態

Project Astra 是基於 Gemini 2.0 的一個重要應用,它代表着 Google DeepMind 對通用數字助理的願景。Astra 能夠實時地看到、聽到和理解用戶的周圍環境,並通過手機或眼鏡等設備提供個性化的幫助。 例如,它可以幫助用戶找到丟失的眼鏡,或者在烹飪時提供食譜建議。

無限上下文和類人記憶

爲了使 Astra 成爲真正有用的助手,它需要擁有強大的上下文窗口和內存能力,以記住用戶曾經見過的一切,並理解用戶的偏好和目標。DeepMind 正在努力實現有效無限的上下文窗口,並從人類記憶中汲取靈感,只記住重要和顯著的事情。

AI 伴侶的倫理挑戰

隨着 AI 系統變得越來越複雜和強大,人們可能會過度依賴 AI 關係,這引發了關於 AI 伴侶社會影響的倫理問題。Hassabis 認爲,我們需要社會科學家、倫理學家等多方共同評估這些影響,並制定相應的規範和指南。

AI 在遊戲領域的巨大潛力

Hassabis 對 AI 在遊戲領域的應用充滿期待。他認爲,AI 不僅可以用於生成整個遊戲,還可以用於創建更智能、更逼真的 AI 角色,自動平衡遊戲難度,以及開發具有學習能力的智能體。 這些應用將爲遊戲行業帶來革命性的變化,創造出更加沉浸式和富有挑戰性的遊戲體驗。

Gemini產品負責人談Gemini2.0

作爲 Gemini 模型產品負責人的 Tulsi Doshi,今天也在Google官方分享了關於 Gemini 2.0 的關鍵信息和 Google 對 AI 發展方向的思考。

Gemini 2.0:更強大的多模態模型

Gemini 2.0 不僅僅是 1.0 的升級版,它體現了 Google 對 AI 模型多模態化和實用化的追求。

多模態能力的飛躍: Gemini 2.0 原生支持多模態輸入和輸出,可以理解和生成圖像、音頻甚至代碼。這使得 AI 應用的可能性大大擴展,例如可以根據圖像內容進行更精準的搜索,或者用 AI 生成不同風格的音樂。

強調實用性和速度: Gemini 2.0 中的 Flash 模型在保持小巧體積和快速響應的同時,性能可與更大的 1.5 Pro 模型媲美。這意味着開發者可以更容易地將 Gemini 2.0 集成到各種應用中,爲用戶提供實時且高效的 AI 體驗。

原生工具調用:通往智能代理的關鍵一步

重點介紹了 Gemini 2.0 的原生工具調用能力,這項技術將 AI 模型與各種工具(如搜索引擎、代碼解釋器等)深度融合,爲構建更智能的 AI 代理鋪平了道路。

提升事實準確性和效率: 通過原生工具調用,模型可以判斷何時需要藉助外部工具來獲取信息或執行特定任務,例如在回答需要實時信息的問題時自動調用搜索引擎。

更流暢的用戶體驗: 用戶無需手動指定使用哪些工具,模型可以根據上下文自動選擇和調用最合適的工具。

構建更復雜的 AI 代理: 原生工具調用讓模型可以組合使用多種工具,實現更復雜的任務,例如結合搜索引擎和代碼解釋器來生成數據圖表。

谷歌官宣量子計算芯片突破Willow

谷歌在官宣和訪談視頻深入探討了量子計算的優勢、量子錯誤糾正技術、量子比特數量以及量子計算的商業應用前景等重要議題。

量子計算的指數級加速

谷歌強調了量子計算機在特定計算任務上的顯著速度優勢。以隨機電路採樣爲例,Willow 芯片只需不到 5 分鐘即可完成的任務,最快的超級計算機卻需要 10 的 25 次方年才能完成。

量子錯誤糾正技術的突破

谷歌詳細介紹了在量子錯誤糾正技術上取得的突破性進展。Willow 芯片的邏輯量子比特操作已低於關鍵量子錯誤糾正閾值,這意味着可以通過量子糾錯技術有效地抑制錯誤,從而提高計算的準確性。

通過增加物理量子比特數量和擴展編碼距離,錯誤率會呈指數級降低。

邏輯量子比特的壽命也顯著延長,甚至超過了構成它們的物理量子比特的壽命。

量子比特數量與質量

Willow 芯片擁有比之前芯片更多的量子比特,並且這些量子比特具有更高的質量,即更長的相干時間和更低的錯誤率。谷歌還強調了量子比特質量的重要性。僅僅增加量子比特數量並不能保證量子計算機的性能提升,高質量的量子比特才能保證更精確和穩定的計算。

商業應用前景廣闊

谷歌展望了量子計算在製藥、電池和聚變能源等領域的潛在應用。

製藥領域: 量子計算可以加速藥物研發過程,幫助尋找新的藥物靶點和設計更有效的藥物。電池領域: 量子計算可以幫助設計更高效、更安全、更持久的電池。聚變能源領域: 量子計算可以模擬聚變反應過程,優化聚變反應堆的設計,加速實現可控核聚變的目標。

谷歌也提到了量子計算在材料科學、金融和人工智能等領域的潛在應用,並指出量子計算技術目前仍處於發展初期,距離大規模商業應用還有一段距離。

量子計算髮展路線圖

谷歌已經制定了實現“擁有 1000 個邏輯量子位的量子計算機”這一目標的路線圖。目前正處於路線圖的第三個里程碑階段,預計在未來幾年內取得更大的進展,並有望在未來五年內看到量子計算的早期商業應用。