黃仁勳對談扎克伯格:Llama 4或將擺脫聊天機器人形態|甲子光年

黃仁勳認爲,Llama 2的發佈是2023年最重要的AI事件。

作者|田思奇

北京時間7月30日清晨,英偉達創始人兼CEO黃仁勳與Meta創始人兼CEO馬克·扎克伯格,在美國丹佛舉行的第50屆SIGGRAPH圖形大會上完成了一場60分鐘的公開對話。

上週剛剛發佈最新開源模型Llama 3.1的Meta已經爬出股價黑洞,成爲AI浪潮中最重要的玩家之一。正如今年剛滿40歲的扎克伯格,已經成功從科技宅男形象轉型爲精心打理捲髮,時刻戴着金鍊子的潮男。

Meta在今年4月發佈了專門爲AI訓練和推理工作設計的自主研發芯片MTIA的最新版本。和許多科技大廠類似,外界認爲Meta也希望藉此降低對英偉達等芯片廠商的依賴。但總體來講,Meta與英偉達保持着密切的聯繫。扎克伯格今年早些時候曾表示,爲了構建自己的AGI,Meta會在年底前採購約35萬塊英偉達H100GPU。

3月底,扎克伯格還在Instagram上發佈了與黃仁勳互換外套的照片。照片中,扎克伯格身穿黃仁勳標誌性的黑色皮夾克,而黃仁勳穿上了扎克伯格此前穿過的棕色外套。這張照片也在對談現場得以重新展示。

本屆SIGGRAPH於7月28日至8月1日舉行,近100家參展商將在大會上展示圖形技術如何引領未來。自 1974 年在科羅拉多州博爾德市首次舉辦以來,SIGGRAPH一直走在創新的最前沿,曾經向全世界展示了“Aspen Movie Map”,這是谷歌街景地圖的前身。SIGGRAPH還是皮克斯首部CG動畫《小檯燈》的首映地之一。

在這場難得的面對面對話上,黃仁勳和扎克伯格共同探討了Meta的開源哲學,同時扎克伯格正式發佈了AIStudio,將允許用戶構建具有自定義個性的虛擬角色和聊天機器人。而Meta最終的願景是讓每個人都能爲自己創建個性化的AI Agent。

儘管兩人的年齡差超過20歲,但作爲科技行業少數仍留在公司一線的資深創始人,黃仁勳與扎克伯格的惺惺相惜貫穿始終。扎克伯格也不忘向黃仁勳吐槽說:“你的頭髮變白了,我的頭髮只是變長了。” 而黃仁勳表示:“你的頭髮明明變捲了。”但扎克伯格澄清說:“我頭髮一直是卷的,只是之前非常短!”

相比於大學本科期間就打造出Facebook並退學創業的扎克伯格,黃仁勳是在30歲才成爲英偉達的聯合創始人。於是他提到:“我要是知道得花這麼長時間才能成功的話……”

“你打從一開始就不會做這些了?”扎克伯格問道。

“不,我會像你一樣從大學輟學然後早點開始。” 黃仁勳表示。

1.信息流推薦的未來

在對談中,黃仁勳肯定了Meta打造的AI框架Pytorch的行業地位,以及Meta過去幾年裡在計算機視覺、語言模型、實時翻譯等方面的成果。他提出的第一個問題是扎克伯格會如何看待Meta在生成式AI方面的進展。

扎克伯格首先回溯了2018年,Meta展示的早期VR功能,以及如何通過打造逼真的形象來推動消費級頭戴設備的發展。同時Meta做了很多研究來保證頭戴設備足夠薄,再加上先進的光學堆棧和顯示系統,這些纔是Meta通常在SIGGRAPH圖形大會上會展示的元宇宙進展。

不過現在的Meta已經離不開人工智能的話題。扎克伯格提到,Meta旗下分別擁有超過十億用戶的Instagram和Facebook擁有大量信息流,因此內容排序及其背後的推薦系統很重要。但和早期Facebook上只刷親朋好友的動態不同,有了生成式人工智能以後,如今Instagram會根據用戶的興趣推薦數百萬其他用戶的內容,構成其信息流的絕大部分,無論他們是否關注過這些用戶。

扎克伯格認爲這纔是推薦系統的未來,要麼是即時創建的內容,要麼是通過現有的不同內容彙集綜合而成的內容。這和當前的生成式人工智能熱潮略有不同。當然它還是基於Transformer和類似的架構,但會越來越通用。

具體來說,過去Meta會爲每種類型的內容建立不同的模型,比如有一個模型用於對視頻進行排序和推薦,另一個模型用於對更長的視頻進行排序和推薦。但更通用的推薦基礎模型可以涵蓋所有內容,當獲取內容的池子越廣,就越容易規避不同池子獲取內容的低效問題。

“我夢想着有一天,你可以把Facebook或Instagram都當成像單一的AI模型,所有不同的內容類型和系統集合在一起,這些內容在不同的時間範圍內有不同的目標,有些只是向你展示你今天想要看到的有趣的內容,但有些是在幫你建立長期的人際網絡。” 扎克伯格表示。

從另一個層面來看,扎克伯格認爲新一代人工智能會讓我們所有的工作流程和產品實現重大升級,每個人都會擁有自己的通用人工智能助手來完成不同的任務。“當我們從Llama 3系列模型轉向Llama 4及更高版本時,我認爲它不會再像聊天機器人那樣,你給它一個提示,它再回應。它會很快進化成:只要你給它一個意圖,它就可以在不同的時間範圍內完成任務,比如有些計算工作可能需要幾周或幾個月的時間,然後結果纔會返回到你這裡,就像世界上其他地方發生了什麼事一樣。”

黃仁勳也給出類似的人類邏輯,指出人工智能的發展方向:今天的人工智能是回合制的。你說一些話,它會回覆你一些話。但當我們思考時,當我們被賦予一個任務或問題時,我們會考慮多種選擇,在腦海中模擬一個決策樹,設想每個決定的不同結果。”

2.個人創建Agent

扎克伯格還提到其他公司在構建中央Agent,但Meta的願景是讓所有用戶都能爲自己創建Agent。“無論是平臺上的數百萬創作者,還是數億中小企業,我們最終都希望能夠收集你們的所有內容,迅速爲你們建立一個業務Agent與你們的客戶互動。”

於是扎克伯格在現場宣佈,Meta將爲人們提供一個名爲AIStudio的工具,用於構建具有自定義個性、特徵和興趣的虛擬角色。創作者還可以用這樣一種數字替身與私信中的粉絲互動。

來源:Meta

Meta在新聞稿表示,AI Studio將從今天開始向Instagram Business帳戶用戶推出,並將在未來幾周內向美國的所有Meta用戶開放。

“每天的時間都不夠用。” 扎克伯格表示。創作者時間有限,所以需要訓練Agent代表自己。很明顯這就不再是和創作者本人互動,但扎克伯格相信這會是另一種有趣的方式,用戶會爲各種不同的用途創建自己的Agent。

扎克伯格注意到,Meta AI的主要應用在於人們會在遇到困難的社交場合使用它。比如“我想問我的經理我該如何獲得晉升或加薪?或者我和朋友吵架了,或者我和女朋友遇到了什麼困難,這場談話該如何進行等等”。但問題在於,很多人不想只與同一個Agent互動,無論是Meta AI,ChatGPT還是其他應用。用戶想創造自己的東西,這就是AI Studio的目標。

“就像每個企業都有電子郵件地址、網站和社交媒體賬戶一樣,未來每個企業都會有一個與客戶互動的Agent。而消費者如果買到的東西有問題,也只是想找到一個地方解決問題,通過Agent以不同的方式與企業互動。我認爲這也適用於創作者。” 扎克伯格表示。

3.開源哲學來自微軟

在對談中,黃仁勳不忘吹捧Meta稱:“我認爲Llama 2可能是去年人工智能領域最重要的事件。” 而扎克伯格迴應稱:我還以爲(最重要的事件)是H100。”

黃仁勳認爲,Llama 2激活了所有行業。突然之間,每個大中小公司都在開發人工智能。所以他向扎克伯格詢問,Meta的開源哲學來自何處。

扎克伯格首先承認,Meta構建分佈式計算基礎設施和數據中心的時間比其他科技公司晚:“當我們建造這些東西的時候,它已經沒有競爭優勢了。好吧,那我們不如把它開放,這樣我們將受益於周邊生態系統。”

而Meta參與的最大項目就是Open Compute Project:“通過讓它成爲某種行業標準,所有的供應鏈基本上都圍繞它組織起來了,這樣做的好處是爲每個人省錢,基本上可以節省數十億美元。”

在Facebook創立二十週年之際,扎克伯格認爲,過去 20 年裡最困難的事情之一就是必須通過競爭對手的移動平臺來發布應用,並且他以隱晦地方式批評了蘋果的封閉系統。“每個人認爲這應該是封閉的生態系統,因爲蘋果基本上是唯一一家(主導)。當然市場上有更多安卓手機,但蘋果基本擁有整個市場和所有利潤,安卓在開發方面基本上是跟隨蘋果的。所以我認爲蘋果顯然贏得了這一代的競爭。”

然而回到上一個時代,微軟雖然不是完全開放的公司,但Windows系統可以在不同的軟硬件上運行,是更加開放並且領先的生態系統。也就是說從PC時代開始,開放的生態系統就一直存在。“對於整個行業正在構建的計算平臺來說,如果軟件是開放的,它的價值會很大,這塑造了我的哲學。我很樂觀地認爲,下一個時代,開放的生態系統會獲勝。”扎克伯格表示。

同時他承認,Meta這樣做並不是因爲他們是利他主義者,而在於這的確會讓Meta打造的成果受益於強大的生態系統。黃仁勳也附和稱,僅英偉達內就有數百人致力於讓Meta的PyTorch變得更好。但他也提出溫和的異議:“我可能不想自己製作這件夾克,我更喜歡讓別人爲我做這件夾克。皮革可以開源這件事對我來說不是有用的概念。當然你仍然可以擁有令人難以置信的開放的服務。”

針對模型的多樣化,扎克伯格進一步提出,幫助人們從大模型中提取自己的模型將會成爲非常有價值的新事物。“不會存在一個模型或者一個Agent供所有人使用。人們會在多大程度上僅僅使用更大、更復雜的模型,還是訓練自己的模型自己使用?我敢打賭,它們將會是不同模型的大量擴散版本。”

黃仁勳也贊同稱,如果僱傭AI做芯片設計,每小時大概需要 10 美元。如果與一羣工程師共享這個人工智能,每個工程師可能都有專屬的人工智能陪伴他們,這個人工智能的成本並不高,而付給工程師的錢卻很多。所以對英偉達來說,每小時花幾美元就能放大一個人的能力將會非常具有經濟潛力。

4.人工智能進入虛擬世界

這場對談中的另一項重磅發佈是Meta的SAM2,也就是新一代Meta Segment Anything Model,它能夠在不需要任何標註的情況下,對任何圖像中的任何物體進行分割。

扎克伯格在現場也展示了SAM2的功能,並且“凡爾賽”地表示:“它可以識別並跟蹤奶牛,製作很多有趣的效果。順便提一句,這些都是我家夏威夷牧場的牛。”

顯然,它也是開源的。扎克伯格表示,科學家可以利用SAM2研究珊瑚礁和自然棲息地以及景觀的演變等,並且在視頻中做到這一點,人們可以與它進行交互,告訴它你想要跟蹤什麼。

在工業應用中,黃仁勳表示:“例如你有一個倉庫,裡面有一大堆攝像頭,倉庫人工智能正在監視一切。假設有一堆箱子掉下來了,或者有人把水灑在地上,人工智能都會識別並生成文本,派人過來幫忙。這是使用它的一種方式。如果發生事故,它不會記錄所有內容,而是開始記錄每納秒的視頻,回溯並檢索那一刻。它只記錄重要的東西,因爲它知道自己在看什麼。”

對談中的最後一個主要話題是頗受市場歡迎的智能眼鏡,由Meta和雷朋眼鏡合作開發。扎克伯格表示:“如果你五年前問我,我們會在人工智能之前獲得全息AR嗎?我會說應該是吧。但真正的突破發生在大語言模型上。在全息AR出現之前,我們現在已經擁有非常高質量的人工智能,而且進步速度非常快。這是一種我沒想到的逆轉。”

至於未來的眼鏡市場,扎克伯格認爲最終會產生一系列不同價位,採用不同技術水平的智能眼鏡產品,其中300美元價位的智能眼鏡將成爲最受歡迎的一款,有望迎來數億消費者。不過眼鏡作爲一種可穿戴的時尚單品也有自己的煩惱:“它不像手錶或手機,人們不想看起來都一樣。” 已經成爲硅谷潮男的扎克伯格指出。

最後,黃仁勳表示,看着扎克伯格把Meta的業務從桌面電腦轉向移動設備,再涉足虛擬現實和人工智能等等,他知道這些轉型有多難。“這些年來,我們倆都遭受了很多挫折,但這就是成爲先驅和創新者所需要的。祝賀你們取得的成果。而且你現在可是時尚偶像了。”

對此,扎克伯格謙虛地表示:“還在早期階段”。隨後他轉身掏出一個盒子,裡面是爲黃仁勳新買的一件毛領黑夾克。而黃仁勳也把自己爲SIGGRAPH新準備的皮夾克交換給了扎克伯格穿,再一次完成兩人親密無間的互換外套活動。

(封面圖及未說明來源:英偉達)