英特爾披露5nm“中國特供版”AI 芯片,性能或暴降92%,最快6月推出|硅基世界

英特爾Gaudi 3 AI芯片(圖片來源:Intel官網)

關於英特爾Gaudi 3的“中國特供版” AI 芯片有了新進展。

鈦媒體App 4月15日消息,芯片巨頭英特爾(Intel)日前在官網發佈一份24頁的“Gaudi 3 AI加速器白皮書”中披露,英特爾將推出Gaudi 3在中國發售的兩款“特供版”AI 芯片產品。

具體包括兩種硬件形態加速卡:一款型號爲HL-328的OAM兼容夾層卡(Mezzanine Card),預計將於今年6月24日推出;另一款是型號爲HL-388的PCle加速卡,預計將於今年9月24日推出。而基於內核數量、工作頻率、TDP等參數估算,相比Gaudi 3國際版,“中國特供版”HL-328芯片性能或降低約92%左右。

早前4月9日舉行的美國Intel Vision 2024會議上,英特爾發佈新一代Gaudi 3 AI 加速芯片,採用臺積電5nm工藝,帶來4倍(400%)的BF16 AI計算能力提升。同時,相比英偉達H100 GPU,英特爾Gaudi 3 AI芯片的模型訓練速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本卻僅爲H100的一小部分。

對於Gaudi 3中國特供版消息,鈦媒體App已向英特爾美國總部發送郵件詢問更多詳細信息,但截至發稿前,英特爾方面並未回覆。

據悉,過去一段時間,美國政府不斷升級對華半導體、AI 芯片等領域的出口管制。

2022年8月9日,美國總統拜登簽署總額高達2800億美元的《芯片和科學法案》(以下簡稱“芯片法案”),通過527億美元的鉅額產業補貼和遏制競爭的條款,推動芯片製造“迴流”美國本土。該法案禁止獲得補貼的美國及其盟友夥伴的企業10年內在中國和其他關切的國家新建或擴大先進製程芯片廠。

2022年10月7日、2023年10月17日,美國商務部工業和安全局(BIS)連續兩次發佈對中國的先進半導體和計算設備的出口管制,旨在阻止中國進口 AI 半導體產品。同時,英偉達、AMD、英特爾的多款GPU和 AI 芯片產品已不能再出口到中國,就連高端遊戲顯卡RTX 4090都受到了限制。

2023年12月,美國商務部BIS宣佈啓動對成熟製程節點的半導體供應鏈展開調查,劍指中國芯片半導體產業。

2024年3月29日,BIS更新出口限制措施,其中包括美國對中國出口的 AI 半導體產品將採取“逐案審查”(case-by-case review)政策規則,包括技術級別、客戶身份、合規計劃等信息全面查驗,以及部分 AI PC 芯片或納入到出口管制措施當中,更大範圍限制英偉達、AMD等先進 AI 芯片和半導體設備向中國銷售,4月4日全面生效。

4月11日,美國商務部在“聯合公報”(Federal Register)上更新了最新的實體清單(Entity List),將6家中國企業列入“實體清單”,其中包括英偉達在中國的最大 AI 芯片經銷商思騰合力(天津)科技有限公司(SITONHOLY (Tianjin) Co., Ltd.)。

事實上,在美國BIS第一輪出口管制下,早在2023年7月,英特爾就曾發佈基於7nm製程的“中國特供版”AI芯片Gaudi2。相比國際版Gaudi2,面向中國市場推出的加速卡在性能上差別不大,而集成以太網RDMA端口數量從24個端口減到21個,以符合美國芯片出口管制規定。(詳見鈦媒體App前文:《英特爾發佈中國特供版7nm AI芯片Gaudi2,減少RDMA接口以符合出口管制規定》)

然而,鈦媒體App瞭解到,英特爾Gaudi 2中國特供版僅銷售幾十張OAM產品。自去年BIS 1017新規更新後,由於英特爾Gaudi 2“中國特供版”產品性能高於出口管制措施,最終導致其產品再也沒能繼續銷往中國市場。

基於此,去年12月前後,英特爾曾嘗試研發Gaudi 2 HL-225B變體,內部稱Gaudi 2C AI芯片,希望重新獲得銷往中國大陸的許可,但最後卻等到今年3月BIS公佈更新出口限制措施。

4月10日發佈Gaudi 3之後,英特爾重新研發特供版產品,希望讓5nm Gaudi 3 AI芯片未來全力爭奪中國市場,旨在爲 AI 和雲客戶提供英偉達產品的“替代選擇”。

具體硬件規格方面,中國特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內存, 128GB HBM2e高帶寬內存,帶寬爲 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標準。但是,由於美國對於AI芯片的出口管制規則限制,使得這類高性能AI的綜合運算性能(TPP)需要低於4800才能出口到中國, 這意味中國特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。

相比Gaudi 3 國際版達到的1835 TFLOPS(FP16/BF16),中國特供版Gaudi 3 需要大幅削減內核數量和工作頻率,最終可能需要其AI性能降低約92%,才能符合美國的出口管制要求。

同時,由於中國特供版Gaudi 3產品的AI性能降低,這也將使得其TDP(熱設計功耗)大幅降低,預計OAM卡和PCIe卡的TDP均爲450瓦,而原版PCIe卡(HL-338)的TDP高達600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高達900瓦。

整體來說,英特爾專爲中國市場推出的“特供版”Gaudi 3兩款產品的 AI 性能,或將與英偉達“中國特供版”AI 加速卡H20水平相當,後者比H100的整體性能降低80%左右,達148 TFLOPS的FP16/BF16性能,略低於出口管制的150 TFLOPS的限制。

目前,英偉達H20 AI芯片已經向中國大陸客戶送樣,但國內百度、阿里等 AI 龍頭對其反響平平。有行業人士對鈦媒體App表示,主要原因是H20性能太低、價格太高,企業購買意願降低了。

美國商務部長雷蒙多(Gina Raimondo)早前在一場公開論壇中表示,美國絕不能讓中國得到這些最尖端的芯片,絕不能讓中國芯片技術趕超美國。美國政府不允許英偉達向中國出售“最複雜、處理能力最高”的 AI 芯片,以防中國有能力訓練前沿 AI 模型。

此外,有消息稱,美國政府還正在制定一份禁止接收關鍵工具的中國先進芯片製造工廠名單,以便美國企業更容易阻止技術流入中國,這份名單可能會在未來幾個月內公佈。同時,美國正向包括荷蘭、日本、德國和韓國在內的盟友施壓加碼,要求它們進一步收緊對中國獲得半導體技術的限制措施。

針對於美方行動,外交部發言人毛寧在4月11日表示,“我們堅決反對美方濫用實體清單等出口管制工具遏制打壓中國企業,敦促美方停止將經貿科技問題政治化、工具化、武器化。中方將採取必要措施堅決維護中國企業的合法權益。”

(本文首發鈦媒體App,作者|林志佳)