IBM將在其公共雲中提供英特爾Gaudi 3人工智能芯片

來源:至頂網

Gaudi 3的定位是替代英偉達公司最暢銷的H100圖形處理器。直到今年3月,在最新的GPU Blackwell B200推出之前,H100一直是英偉達的旗艦AI加速器。英特爾表示,Gaudi 3的推理效能可以達到H100的2.3倍,可以讓一些大型語言模型的訓練時間更短。

英特爾於2019年收購初創公司,以此獲得了人工智能處理器,Gaudi 3是該系列的第三次迭代。該芯片使用了臺積電5納米節點。Gaudi 3的處理能力由兩塊板載計算模塊提供,分別爲MME 和 TPC,它們分別針對不同任務進行了優化。

芯片的MME模塊設計用於執行矩陣乘法運算。矩陣乘法是對按行和列排列的數字集合進行的數學計算,類似於電子表格中的字段。人工智能模型利用這種計算將輸入數據轉化爲決策。

某些人工智能模型,如用於物體識別任務的模型,其大部分處理過程都是通過矩陣乘法完成的。大型語言模型等更高級的人工智能也使用其他類型的計算。Gaudi 3的 TPC 模塊(該芯片包含的第二類計算電路)針對這些其他計算進行了優化。

TPC基於所謂的超長指令字架構。這是一種經過優化的芯片設計,可並行執行多個計算。由於並行執行計算比逐個完成計算更快,Gaudi 3的TPC 有助於加快人工智能模型的性能。

Gaudi 3包含64個TPC,幾乎是前代產品的三倍。此外,MME(針對矩陣乘法進行優化的計算模塊)的數量也是前者的四倍。芯片的邏輯電路配備了120GB內存池,其時鐘速度高於英特爾上一代人工智能處理器的RAM。

該公司表示,Gaudi 3中引入的升級將其處理BF16數據的最高速度提高到了1,835 TFLOPS,即每秒萬億次計算。BF16是一種人工智能模型常用的信息存儲數據格式。

性能的提升並不是Gaudi 3唯一的賣點。它還有一個板載以太網模塊,可將人工智能服務器中的Gaudi 3處理器連接在一起,也可將多個此類服務器連接在一起。英特爾將芯片中單個以太網網絡連接的帶寬提高了一倍,達到每秒200Gb。

IBM 計劃明年初在 IBM Cloud Virtual Servers for VPC 中提供 Gaudi 3。這是該公司在其公共雲平臺中提供的計算實例。IBM 還將在其 watsonx 產品套件中添加對 Gaudi 3 的支持,該套件包括軟件工具,企業可利用這些工具構建人工智能模型、在生產中部署這些模型並執行相關任務。