中金:政策加碼AI算力基礎設施建設 國產算力迎發展機遇
國產算力及智算中心的發展受到了國家及各地方政府的高度重視,政府及運營商主導的智算中心建設提速;2月19日,國資委召開中央企業人工智能專題推進會,要求央企加速建設智算中心,開展AI+專項行動;此外,貿易摩擦的影響,海外核心雲端AI芯片進入大陸市場受限。中金認爲,在政策加碼及國資智算中心建設加速的情況下,國產算力有望迎來發展窗口期。
摘要
政策加碼AI算力基礎設施建設,國產算力迎發展機遇。2023年以來,國家及地方層面積極推進智算中心及國產算力基礎設施建設,北京、廣東等省市提出了2025年智算算力建設目標並強調國產化能力,成都、貴州、甘肅等地發放算力券支持地方算力資源使用。我們認爲,在服務器核心部件側,國產CPU的能力構建逐步完善,安全可靠名錄及等級的細化有望加速服務器CPU國產化進程;國產AI加速芯片雖然仍與全球領先水平存在一定差距,但受貿易摩擦影響,國產替代迫切性高,有望迎來發展窗口期。
政府加快推進智算中心建設,運營商逐步基於國產算力構建AI基礎設施。我們看到,政府側的智算中心自2023年以來明顯提速,2020年-2023年間已投運政府智算中心單期算力建設規模一般在500P以下,而2023年下半年之後建設與投運的智算中心出現較多1000P以上算力規模,以升騰爲代表的國產AI芯片成爲重要算力基石。此外,運營商在加碼智算中心建設的同時,也呈現地域上向中西部傾斜、算力上向國產算力芯片傾斜的趨勢。我們認爲,國資主導的AI算力基礎設施建設提速,在帶動國產AI芯片需求量的同時,也提供了難得的商用機會和及時的產品反饋,對於硬件性能、系統生態的迭代具有正向作用,幫助國產產品從“能用”走向“好用”並有望在更加商業化的市場逐步滲透。
風險
貿易摩擦導致供應鏈風險;行業競爭加劇;智算中心建設不及預期。
正文
Scaling law驅動智算中心需求,國產算力硬件大有可爲
Scaling law推動算力需求提升,主權算力成爲需求新範式
Scaling law驅動人工智能對算力的需求持續增長。Scaling Law(規模定律)主要是指對於計算量、參數量、數據量三要素,當不受其他兩個因素制約時,提升某一要素對模型性能的增益效果明顯。我們看到,爲追求Scaling law帶來的涌現效應,在位廠商模型訓練的算力規模不斷擴大,對AI算力基礎設施的需求形成支撐。根據中國信通院《中國算力發展白皮書(2023)》,GPT-3的模型參數約爲1,746億個,訓練一次需要的總算力約爲3,640 PF-days,即以每秒一千萬億次計算,需要運行3,640天;2023年推出的GPT-4參數量可能達到1.8萬億個,訓練算力需求上升至GPT-3的68倍,在2.5萬個A100上需訓練90-100天。
圖表:Scaling law驅動模型迭代,算力需求持續增長
資料來源:《Compute Trends Across Three Eras of Machine Learning[1]》,中金公司研究部
各國加碼建設AI基礎設施,主權算力成爲需求新範式。2024年年初,英偉達創始人黃仁勳提出了“主權AI”的概念[2],強調了一個國家對其數據及其產生的見解應擁有所有權,並強調基礎設施的重要性。我們觀察到,算力成爲各國搶佔AI發展主導權的重要路徑,主權算力成爲需求新範式。
圖表:主權算力成爲需求新範式
資料來源:中國政府官網,新加坡政府官網,人民網,韓聯社,中國科學院,C114通信網,印度政府官網,Bloomberg,財聯社,自然資源部,中金公司研究部
政府積極發力智算中心建設,國產算力迎發展機遇
2023年以來,國產算力及智算中心的發展受到了國家及地方政府的高度重視,一系列政策文件相繼出臺,旨在推動算力基礎設施的高質量發展,加快智算中心的建設,並推動國產算力的發展。
2023年10月六部門聯合發佈的《算力基礎設施高質量發展行動計劃》明確了全國算力在未來三年的建設節奏。2024年2月國資委召開“AI賦能產業煥新”中央企業人工智能專題推進會,強調央企要把發展人工智能放在全局工作中統籌謀劃,深入推進產業煥新,加快佈局和發展人工智能產業;把主要資源集中投入到最需要、最有優勢的領域,加快建設智算中心;開展AI+專項行動,強化需求牽引,加快重點行業賦能,構建一批產業多模態優質數據集,打造從基礎設施、算法工具、智能平臺到解決方案的大模型賦能產業生態[3]。2024年《政府工作報告》提出適度超前建設數字基礎設施,加快形成全國一體化算力體系,培育算力產業生態[4]。
圖表:2023年以來各省市智算及國產算力相關政策梳理
資料來源:北京市人民政府官網,新華網,廣東省通信管理局,江蘇省通信管理局,河南省發改委,貴州省大數據發展管理局,山東省人民政府官網,安徽省人民政府官網,中金公司研究部
在資金支持方面,2023年1月,成都印發了全國首個算力產業專項政策——《成都市圍繞超算智算加快算力產業發展的政策措施》,率先提出算力券發放計劃[5]。此後,北京、貴州、甘肅慶陽、湖北武漢、上海等地陸續出臺資金舉措支持地方算力資源使用。我們認爲,政策持續加碼國內AI相關基礎設施建設及應用落地,國內AI服務器需求有望加速兌現。
AI服務器爲算力核心,國產CPU及AI芯片旭日東昇
CPU及AI芯片作爲AI服務器的核心,國產化大有可爲。AI服務器核心組件包括AI加速芯片、CPU(中央處理器)、DRAM(動態隨機存取存儲器)、SSD(固態硬盤)和RAID卡、網卡、PCB、高速互聯芯片(板內)和散熱模組等,其中GPU與CPU佔到服務器價值量的70%以上[6]。
服務器CPU架構包括X86、ARM和MIPS等,x86爲當前服務器CPU主流架構,根據IDC,2023年x86架構服務器佔88%市場份額;x86 CPU的代表性廠商爲Intel和AMD,1Q24市佔率分別爲90.1%和9.9%;海光、兆芯和申威等也參與X86架構CPU的國產化替代。
圖表:服務器CPU芯片的主要架構及參與者
資料來源:PassMark,兆芯官網,海光信息公司公告,高通官網,飛騰官網,龍芯中科公司公告,科技世界網,《Kunpeng 920: The First 7nm Chiplet-Based 64-Core ARM SoC for Cloud Services》[7],IT之家,中國證券報,中金公司研究部
中國信息安全測評中心發佈CPU名錄,服務器國產化進程有望加速。2023年,中國信息安全測評中心發佈《安全可靠測評工作指南(試行)》[8],說明產品供應商可於每年1-2月及7-8月進行測評申報,送測廠商應爲在中國境內註冊的實體,且具有送測產品完備的研發文檔、設計資料、代碼數據和研發環境,擁有送測產品相關的發明專利、商標、著作權等知識產權或授權,具備與送測產品研發設計、生產製造、供應保障、售後維護相匹配的人員隊伍和工作環境,測評結果有效期爲三年,由企業和用戶自主選擇使用。2023年底與2024年5月,中國信息安全測評中心發佈了針對PC和服務器搭載的CPU、操作系統及數據庫等基礎軟硬件產品的兩版安全可靠測評結果[9],其中CPU涉及的廠商包括龍芯、飛騰、海思、兆芯、申威等廠商。
根據財政部及工信部發布的《通用服務器政府採購需求標準(2023年版)》,鄉鎮以上黨政機構、鄉鎮以上黨委和政府直屬事業單位及部門所屬爲機關提供支持保障的事業單位在採購通用服務器時,應當將CPU、操作系統符合安全可靠測評要求納入採購需求[10]。
我們注意到,2024年5月20日發佈的安全可靠測評結果中,安全可靠等級分爲“I級”與“II級”,相較於2023年底進一步細化與完善,我們認爲隨着安全可靠等級、梯隊進一步完善,服務器國產化的進程有望提速。
從AI加速芯片的供應商來看,根據IDC及芯智訊,2022年英偉達在中國AI加速卡市場份額爲85%,國產化率約爲13%-15%;2023年上半年,中國AI服務器芯片國產化率下降到10%左右。我們判斷主要原因在於,ChatGPT驅動的大模型訓練浪潮使得高端訓練服務器的需求增長,國產廠商性能相對薄弱,佔比有所下降。
正如我們在此前發佈的報告《科技硬件:智算未來系列七:國產雲端AI芯片破局,路在何方?》中所述,目前NVIDIA等海外廠商佔據全球AI算力芯片的主導地位,NVIDIA不斷改進芯片架構,從V100到GB200系列芯片在覈心數量、算力水平、工藝製程等方面均有大幅提升,並利用CUDA構建生態優勢;包括寒武紀、華爲升騰、摩爾線程、沐曦等國內AI芯片在表觀數據逐步與國際龍頭靠攏,逐步縮小差距,但在硬件性能、系統生態方面仍與全球領先水平存在一定差距。我們認爲,隨着國產GPU算力的持續提升及生態建設的完善,國產算力的發展空間廣闊。
全球供應鏈面臨不確定性,國產算力迎發展機遇。2023年10月,美國商務部工業與安全局(BIS)發佈一系列針對中國的先進計算和半導體制造物項的出口管制規則,以總處理性能(TPP,total processing performance)和性能密度(PD,performance density)作爲判斷指標,其中,限制出口的芯片包括:TPP≥4800的芯片、TPP≥1600且PD≥5.92的芯片;需通知BIS以取得例外許可的芯片包括:4800>TPP≥2400且5.92>PD≥1.6的芯片、TPP≥1600且5.92>PD≥3.2的芯片[11]。我們認爲,全球供應鏈面臨一定的不確定性,國產算力或迎來發展機遇。
圖表:國產雲端AI芯片技術指標與海外產品對比
資料來源:各公司官網,智東西,海光信息公司公告,新智元,中金公司研究部
中美貿易摩擦大背景下,政策端鼓勵的國產化算力硬件採購給國產算力硬件系統生態快速進步提供了條件。先前,中國算力芯片、硬件系統雖在寬鬆的資本市場環境支持下得以快速發展,但產品並未得到實際檢驗,在新品定義上可能與實際市場需求存在偏差,系統生態薄弱。但面臨當下雲端AI芯片國產化迫切的需求,政府、運營商等客戶可爲算力硬件提供商提供難得的商用機會和及時的產品反饋,對於芯片、算力硬件系統研發迭代具有正向作用,能夠快速幫助國產產品從“能用”走向“好用”,加速實現對美國的追趕。我們將聚焦分析政府及運營商主導的智算中心建設及其中的國產化優勢,認爲國產算力芯片有望在更加商業化的市場逐步滲透。
政府與運營商加碼算力建設,助力國產算力芯片發展
政府智算中心建設規模增長迅速,國產算力芯片獲落地機會
2023年以來,政府智算中心建設的規模與節奏均有顯著提升。通過梳理各地政府官網信息,我們整理了2020年-2024年政府智算中心建設情況,發現:1)2023年以來智算中心建設明顯加速,各省市地方政府均在積極推進智算中心建設;2)2020年-2023年間已投運政府智算中心單期算力建設規模一般在500P以下,而隨着AI帶動算力需求的提升,單個智算中心的體量提升,2023年下半年之後建設與投運的智算中心出現較多1000P以上的算力規模。
圖表:2020-2024年部分政府智算中心建設情況
資料來源:廣東省智能科學與技術研究院,南京市人民政府,陝西省科學技術廳,華爲官網,升騰官網,河南省政府官網,崑山市人民政府,山東省人民政府,成都高新區管委會,廣州市政府,遼寧省政府,重慶市政府,北京市政府,通信產業網,福州市人民政府,長沙晚報網,人民網,瀋陽市人民政府,DTDATA,河北省政府,C114通信網,中國經濟網,新華網,武漢市政府,智算網絡聯盟,深圳市政府,中金公司研究部
華爲升騰、寒武紀等國產AI算力芯片成爲政府主導的智算中心的重要算力基座。北京升騰人工智能計算中心利用“政府引導+市場化運作”平臺建設模式,政府負責頂層設計、政策保障;中關村發展集團負責設施建設、配套服務、提供空間載體,最終使用華爲自主研發的升騰芯片,互利共贏[12]。長沙升騰人工智能創新中心由長沙市政府和湖南湘江新區共同出資建設,採用基於升騰910處理器的兆瀚CA9900 AI集羣硬件,總算力最高可達1024 PFLOPS(FP16)[13]。我們認爲,政府智算中心建設提速,有望進一步拉動國產雲端AI芯片的需求。
運營商持續加碼算力建設,國產化率持續提升
根據三大運營商2024年資本開支指引,運營商投資重心將繼續向算力網絡建設傾斜。具體來看,中國移動計劃2024年在算力網絡領域投資475億元,佔當期資本開支的27.5%,同比增長21.5%;中國電信資本開支在產業數字化方面的投資佔比同比提升2.5ppt至38.5%,絕對額達到370億元,其中公司計劃在雲/算力投入180億元;中國聯通則表示算網數智投資堅持適度超前、加快佈局。
圖表:2022-2024E中國移動資本開支結構
資料來源:中國移動公司公告,中金公司研究部
圖表:2022-2024E中國電信資本開支結構
資料來源:中國電信公司公告,中金公司研究部
三大運營商智算中心建設持續推進。根據2023年度業績發佈會,中國移動計劃2024年加快算力多元供給,累計智算規模規劃超過17 EFLOPS,新部署智算增幅接近70%[14];中國電信持續推進智能算力建設,2023年公司智算算力新增8.1EFLOPS,增幅高達279.3%,累計規模達到11.0 EFLOPS[15],2024年公司預計智算規模將繼續提升10 EFLOPS至21 EFLOPS(FP16)[16];根據公司公告,中國聯通算力中心已覆蓋國家8大樞紐節點和31個省份,數據中心機架規模超40萬架,完成29省千架資源佈局,骨幹雲池城市覆蓋超230城,MEC節點超600個。我們認爲,運營商對智算場景投入的持續加碼有望帶動服務器、網絡設備等算力基礎設施需求節節攀升,在電信雲網設備側具備穩定供應能力的廠商有望充分受益。
圖表:三大電信運營商智算中心建設情況
資料來源:新疆日報,呼和浩特人民政府,DTDATA,人民網,湖北省人民政府,四川省國資委,青島高新區政府,中國電信官網,嘉善縣政府,國資委,武漢市政府,天津網信網,蕪湖市政府,青島市情網,天津市政府,中金公司研究部
運營商智算中心呈現地域上向中西部傾斜、算力上向國產算力芯片傾斜的趨勢。響應“東數西算”的政策,運營商智算中心的建設規劃逐步向中西部地區傾斜,並且中西部地區新建智算中心均規模較大,2024年啓用的中國移動克拉瑪依[17]及呼和浩特智算中心[18],規劃算力規模分別達到2023PFLOPS及6.7EFLOPS,2024年投入運營的中國電信中部智算中心算力達到5000PFLLPS[19]。同時,運營商智算中心的國產化率進一步提升,2024年5月,中國移動正式對外發布了全球運營商最大單體智算中心——2024年3月中國電信天翼雲上海臨港國產萬卡算力池正式啓用,這是國內首個正式投入運營的國產單池萬卡液冷算力集羣[20],中國移動智算中心(呼和浩特)部署AI加速卡約2萬張,AI芯片國產化率超85%[21]。我們認爲,運營商持續加碼大型智算中心建設,並加大國產AI算力芯片的採用力度,在爲國產AI算力芯片需求提供支撐的同時,構建國產AI算力芯片落地及迭代場景,有望加速國產AI算力芯片的發展。
運營商雲網設備集採積極,AI服務器採購數量迅速增加。三大運營商過往主要採購計算型、均衡型、存儲型通用服務器爲主,隨着人工智能的快速發展與智算中心的建設提速,運營商基於部署算力集羣、提供算力服務、訓練自身AI大模型等需求,增加對算力服務器的採購以提供強大的算力支持。我們觀察到,從2020年至2024年,運營商對於AI服務器的集採數量呈現明顯擴容。2023年下半年以來三大運營商陸續啓動大規模AI服務器集採,其中,中國電信(2023-2024年)預計採購4,175臺,中國聯通啓動AI服務器集採(預計採購2,503臺),中國移動啓動2024-2025年新型智算中心集採(預計採購7994臺),並於2024年5月公示了中標廠商,包括河南崑崙、華鯤振宇、寶德計算機、百信信息技術、武漢長江、神州鯤泰、湘江鯤鵬[22]。我們認爲在運營商AI服務器採購和國產化率提升的大背景下,國產AI芯片供應商有望持續受益。
圖表:運營商AI服務器集採項目
資料來源:三大運營商採購官網,C114通信網,中金公司研究部
科技廠商自建智算中心,爲潛在國產算力滲透市場
在中國人工智能大模型領域,以互聯網爲代表的科技廠商爲重要推動者。百度的“文心一言”大模型,擁有超過2600億參數,專注於中文理解和生成任務[23];阿里巴巴的"通義千問"大模型,參數量達到萬億級別[24];騰訊的混元大模型[25]和商湯科技的“日日新SenseNova”大模型[26]同樣在各自的領域內取得了突破,推動了多模態理解和行業應用的發展;而字節跳動於2024年5月正式發佈了豆包大模型[27]。
中國AI大模型仍處於發展早期且Scaling Law 仍在延續,大模型性能表現提升對於算力提出更高需求,以互聯網爲代表的科技廠商自建智算中心,以搶佔AI算力制高點。騰訊、百度、阿里、字節、商湯等企業積極推進智算中心佈局,阿里張北超級智算中心總建設規模達12000PFLOPS[28], 百度與騰訊均已在全國多個地區建立了智算中心,包括廣州、上海、北京等,字節跳動則依託於潤澤科技等進行智算中心相關的IDC投資。
互聯網廠商當前算力構成仍以英偉達爲主。根據TrendForce,中國雲計算廠商目前使用的高端AI芯片中英偉達的芯片佔比約爲80%[29],當前的國產化率水平較低。考慮到貿易摩擦的影響,海外核心高端AI芯片難以進入大陸市場,國產替代需求迫切性高。
國內AI加速芯片廠商把握髮展機遇,有望滲透進入互聯網市場。根據TrendForce,2023年在全球AI服務器採購需求中,字節跳動/百度/騰訊/阿里等中國互聯網廠商採購佔比約8.5%,爲AI服務器的重要需求方。我們認爲隨着AI大模型加速迭代,國內互聯網廠商對於AI服務器需求有望進一步提升,國產AI芯片潛在市場空間廣闊。我們看到,互聯網廠商積極推動與國產算力芯片的合作,根據公司公告,海光DCU支持包括文心一言在內的多個大模型的適配和應用;百度飛槳與海光DCU實現生態兼容性認證[30];而華爲與百度合作推進升騰AI上與飛槳+文心大模型的適配[31]。我們認爲,隨着芯片的性能迭代及生態完善,國產算力芯片在互聯網側的應用有望逐步增加。
圖表:科技廠商自建智算中心
資料來源:新華網,DTDATA,中國新聞網,上海市經信委,市前海管理局,百度智能雲官網,山東省政府,上海市松江區政府,安徽省工業和信息化廳,中金公司研究部
服務器廠商多元佈局國產AI加速芯片,各有側重
服務器廠商多元佈局底層國產AI加速芯片,頭部品牌廠商基本實現大範圍適配。其中,華鯤振宇/神州數碼/長江計算/湘江鯤鵬/崑崙技術等廠商側重於升騰供應鏈;中科曙光與海光信息存在股權協同關係;其餘服務器廠商則與國產AI芯片進行大範圍適配佈局。
1#:升騰生態合作伙伴
升騰計算產業基於升騰系列處理器構建全棧AI計算基礎設施、行業應用及服務,包括升騰系列處理器、系列硬件、CANN、AI計算框架、應用使能、開發工具鏈、管理運維工具、行業應用及服務等全產業鏈[32]。產業生態包括圍繞着升騰計算技術和產品體系所開展的學術、技術、公益及商業活動,產生的知識和產品以及各種合作伙伴,主要包括原始設備製造商OEM、原始設計製造商ODM、 獨立硬件開發商IHV、諮詢與解決方案集成商C&SI、獨立軟件開發商ISV、雲服務提供商XaaS等合作方。
圖表:升騰計算產業生態
資料來源:升騰官網,中金公司研究部
在升騰計算整機硬件方面,升騰通過包括華鯤振宇、崑崙技術、神州數碼、寶德、長江計算等衆多主流的廠商合作,打造適應產業發展的服務器等硬件產品。目前升騰有13個整機硬件合作伙伴,依據資質要求/市場貢獻/產業貢獻/能力要求/綜合要求等將整機硬件合作伙伴分爲戰略級、領先級、優先級和認證級四個等級,其中華鯤振宇、崑崙技術爲戰略型合作伙伴,在中國電信2023-2024 AI服務器(G系列)採購也實現高排位中標。
圖表:升騰整機硬件合作伙伴及其對應層級
資料來源:升騰官網,中金公司研究部
2#:海光生態合作伙伴
海光CPU產品採用國際主流的x86架構,能夠兼容x86指令集以及國際主流操作系統和應用軟件;DCU產品能夠支持全精度模型訓練,實現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等爲代表的大模型的全面應用,與國內包括文心一言等大模型全面適配,達到國內領先水平。
海光的硬件合作伙伴廣泛,根據公司公告,公司與新華三、浪潮信息、聯想等服務器廠商展開合作;下游客戶包括工商銀行、中國銀行等金融領域客戶,中國石油、中國石化等能源化工領域客戶,並在電信運營商的數據中心類業務中得到了廣泛使用。
圖表:海光信息OEM客戶
資料來源:海光信息官網,中金公司研究部
#3寒武紀生態合作伙伴
寒武紀公司自成立以來一直專注於人工智能芯片產品的研發與技術創新,致力於打造人工智能領域的核心處理器芯片,公司的主要產品線包括雲端產品線、邊緣產品線、IP 授權及軟件公司。根據公司公告,思元100芯片是中國首款高峰值雲端智能芯片;思元290芯片是公司首款雲端訓練智能芯片,採用了7nm工藝,在4位和8位定點運算下,理論峰值性分別高達1024TOPS、512TOPS;思元370芯片是公司首款採用 Chiplet技術的AI芯片,是寒武紀第二代雲端推理產品思元270算力的2倍。
根據公司官網,公司與浪潮信息、聯想、寶德、寧暢等服務器整機廠商均有合作[33]。目前,公司智能芯片及加速卡持續在互聯網、金融、運營商、能源等多個重點行業持續落地。
圖表:寒武紀硬件合作伙伴
資料來源:寒武紀官網,中金公司研究部
風險提示
貿易摩擦導致供應鏈風險:部分國家對高端半導體產品實施出口限制,影響其進入國際市場,同時GPU生產依賴於高精度的半導體制造工藝,供應鏈中的任何中斷,如原材料短缺、製造能力不足或物流問題,都可能影響最終產品供應。
行業競爭加劇:國際市場NVIDIA、AMD和Intel等國際巨頭佔據主導地位,國內GPU企業需要在硬件、軟件方面與這些企業競爭。同時國內AI芯片市場批量GPU創企涌入,持續競爭國內市場份額。國內AI芯片企業面臨競爭加劇風險。
智算中心建設不及預期:我們看到2023年以來政府及運營商主導的智算中心建設提速,未來如果AI模型迭代或應用落地節奏不及預期,智算中心落地可能放緩,拖累國產算力的需求不及預期。
本文摘自:中金點睛
朱鏡榆 分析員SAC執證編號:S0080523070002
陳昊 分析員SAC執證編號:S0080520120009 SFC CE Ref:BQS925
成喬升 分析員SAC執證編號:S0080521060004
彭虎 分析員SAC執證編號:S0080521020001 SFC CE Ref:BRE806