英特爾發表新一代AI解決方案Xeon 6和Gaudi 3
英特爾發表次世代AI解決方案Xeon 6 伺服器晶片。圖/英特爾提供
因應AI需求攀升,英特爾24日推出搭載效能核心(P-core)的Xeon 6和Gaudi 3 AI加速器,強化公司致力於提供具備每瓦最佳效能且降低總持有成本(TCO)的強大AI系統的承諾。
英特爾並宣佈與領導OEM夥伴合作包括戴爾和美超微,開發共同設計的系統,以滿足客戶在有效AI佈署的特定需求。戴爾與英特爾正共同設計適用於Gaudi 3和Xeon 6且以檢索增強生成(RAG)爲基礎的解決方案。
英特爾執行副總裁暨資料中心與AI解決方案總經理Justin Hotard指出,AI需求帶動資料中心大規模轉型,產業因此開始在軟硬體和開發工具上尋求更多選擇。
英特爾發表全新Intel Xeon 6搭載效能核心(P-core),是款專爲處理運算密集型的工作負載而設計,併兼顧優異效率的AI伺服器晶片。相較於上一代處理器,Xeon 6提供2倍的效能提升,不僅核心數增加、記憶體頻寬加倍,更將AI加速功能嵌入每個核心。英特爾此款處理器,專爲滿足邊緣到資料中心和雲端環境的AI效能需求而打造。
至於新一代Intel Gaudi 3 AI加速器,特別爲大規模生成式AI最佳化的設計,具備64個張量處理器核心(TPC)和8個矩陣乘法引擎(MME),能加速深度神經網路運算。此外,還包括用於訓練與推論的128 GB HBM2e記憶體,以及用於可擴充網路的24個200 Gb乙太網路連接埠。Gaudi 3提供了與PyTorch框架、先進的Hugging Face Transformer模型和diffuser模型無縫的相容性。英特爾近期宣佈與IBM合作,將英特爾Gaudi 3 AI加速器做爲服務佈署至IBM Cloud上,期待透過這項合作,客戶在使用AI與擴充AI規模時,能同時強化效能與降低總持有成本(TCO)。
大規模部署AI涉及各種考量因素,包括靈活彈性佈署的選項、具競爭力的價格效能比,以及可用的AI技術等。英特爾強大的x86架構與廣泛的開放生態系,使其能夠支援企業建構具備最佳化總持有成本(TCO)及每瓦效能的高價值AI系統。值得一提的是,市場上高達73%的GPU加速伺服器是使用Intel Xeon系列處理器作爲伺服器處理器(host CPU)3。
英特爾發表次世代AI解決方案Gaudi 3 AI加速器。圖/英特爾提供