挑戰英偉達!科技巨頭成立聯盟,制定AI加速器連接標準

英特爾、谷歌、微軟、Meta以及其他科技巨頭週四宣佈成立一個新的行業組織——“Ultra Accelerator Link (UALink) 推廣組”,意在制定行業標準,領導數據中心中AI加速器芯片之間連接組件的發展,挑戰英偉達在AI加速器一家獨大的地位。

聯合制定AI加速器連接標準,挑戰英偉達

除以上公司外,該組織成員還包括AMD、惠普企業、博通和思科等,Arm尚未參加。UALink推廣組正在提出一項新的行業標準,以連接日益增多的服務器中的AI加速器芯片。

“行業需要一個可以快速推進的開放標準,這種標準允許多家公司爲整個生態系統增加價值,”AMD數據中心解決方案總經理Forrest Norrod表示。“行業需要一個允許創新快速進行且不受任何單一公司限制的標準。”

廣義上講,AI加速器是指GPU及其他定製設計的解決方案,用於加速AI模型的訓練、微調和運行的芯片。UALink提議的標準版本一,UALink 1.0,將連接多達1024個GPU AI加速器,組成一個計算“集羣”(pod),意指服務器中的一個或多個機架。根據UALink推廣組的說法,基於包括AMD的Infinity Fabric在內的“開放標準”,UALink 1.0將允許AI加速器所附帶的內存之間的直接加載和存儲,並且與現有互連規範相比,總體上將提高速度,同時降低數據傳輸延遲,。

該組織表示,將在第三季度創建一個名爲UALink的聯盟,以監督UALink規範的發展。UALink 1.0將在同一時間段內向加入聯盟的公司提供,而帶有更高帶寬的迭代版規範UALink 1.1,預計將在2024年第四季度推出。Norrod表示,第一批UALink產品將在“未來幾年內”推出。

英偉達:不想參加,也沒必要

分析認爲,由於明顯缺少了當今最大的AI加速器生產商英偉達,該組織的成立就是爲了挑戰英偉達在AI領域一家獨大的地位。目前,英偉達AI加速器的市場佔有率估計在80%到95%。

目前英偉達對此事未予置評,但很明顯,該公司並不熱衷於支持UALink。分析認爲,英偉達已經爲數據中心服務器內的GPU鏈接提供了自己的專有互連技術,所以可能不太願意支持基於競爭對手技術的規範。

而且,英偉達在AI領域的地位和影響力非常強大。在最近一個財季,英偉達的數據中心銷售額(包括AI芯片銷售)同比增長超過400%。如果繼續保持當前的軌跡,英偉達今年將有可能超越蘋果,成爲全球市值第二高的公司。

因此,英偉達不想參與,也不必參與UALink。

而另一個尚未加入的大公司則是亞馬遜。分析認爲,亞馬遜可能處於“觀望”模式,因爲該公司也在不斷髮展自己的內部加速器硬件努力。AWS也可能認爲,與供應其客戶大量GPU的英偉達對抗沒有太大的戰略意義。

微軟、Meta、谷歌最有動力

分析認爲,除了AMD和英特爾,UALink的最大受益者似乎是微軟、Meta和谷歌,這三家公司總計已經花費了數十億美元購買英偉達的GPU,以支持其雲服務並訓練其不斷增長的AI模型。它們都希望擺脫英偉達作爲AI硬件生態系統供應商過於強勢的局面。

在最近的一份報告中,Gartner估計,今年服務器中使用的AI加速器的價值將達到210億美元,到2028年將增加到330億美元。與此同時,Gartner預計,到2025年AI芯片的收入將達到334億美元。

谷歌有用於訓練和運行AI模型的定製芯片——TPU和Axion。亞馬遜擁有幾個AI芯片家族。微軟去年也加入了這場競爭,推出了Maia和Cobalt。而Meta則在不斷完善自己的加速器產品線。

此外,據報道,微軟及其密切合作夥伴OpenAI計劃在超級計算機上投資1000億美元,用於訓練配備未來版本的Cobalt和Maia芯片的AI模型。而這些芯片需要某種方式連接——也許這就是UALink的用途。