騰訊發佈AI基礎設施品牌“騰訊雲智算”,從上架到訓練只需1天

新京報貝殼財經訊(記者 白金蕾)9月5日,在騰訊全球數字生態大會上,騰訊雲正式發佈AI infra(人工智能基礎設施)品牌“騰訊雲智算”。騰訊集團副總裁、雲與智慧產業事業羣COO、騰訊雲總裁邱躍鵬介紹,騰訊雲智算集羣從機器上架到開始訓練可以做到只需1天,相比業界以月爲單位大爲縮短。

邱躍鵬表示,在穩定性和性能上,騰訊雲的集羣千卡單日故障數已經刷新到0.16,是行業水平的三分之一;1分鐘就能完成萬卡checkpoint(指在訓練過程中保存模型當前狀態的快照寫入),數據讀寫效率是業界10倍;千卡集羣的通信時間縮短到6%,是業界一半。

騰訊雲智算是一個集算存網一體的高性能智算底座,整合了騰訊雲高性能計算HCC、高性能網絡IHN星脈、高性能雲存儲、加速框架、容器、向量數據庫、智算套件等騰訊雲優勢產品,能夠爲AI創新輸出多芯兼容、靈活部署的智算產品能力。通過整合軟硬件技術能力,目前,騰訊雲智算也能靈活地支持公有云、私有云以及分佈式雲的輸出。

編輯 丁爽

校對 陳荻雁