中國工程院院士劉韻潔:確定性是下一代網絡必須面對和解決的問題

21世紀經濟報道記者白楊 北京報道

距離ChatGPT上線已經過去500多天,由其掀起的這場新工業革命,正加速改變整個社會。尤其是對算力產業而言,大模型的高歌猛進,對GPU智算、網絡、存儲等算力產業的每個環節都提出了新需求和新挑戰。

在5月21日舉辦的第四屆中國IDC行業DISCOVERY大會上,世紀互聯創始人陳昇指出,通用計算爲主的傳統IDC已走到盡頭,必須加速演進到面向大模型的AIDC。而在AIDC中,70%的投資將指向GPU和網絡。長期來看,現有的網絡體系難以支撐未來百萬倍的加速計算。

在此背景之下,中國工程院院士、紫金山實驗室榮譽主任兼首席科學家劉韻潔表示,確定性是下一代網絡必須面對和解決的關鍵問題,特別是在算力需求激增和網絡帶寬增長不匹配的背景下。

劉韻潔指出,從2012年到2023年,整個算力需求增加了數十萬倍,而最近五年GPU的算力更是增加了90倍。相比之下,整個網絡的帶寬僅增加了10倍,這種差距預示着對網絡帶寬和通信能力的需求將越來越高。

同時,數據要素的確權和利用也成爲了一個重要議題。劉韻潔強調,如何安全地管理和利用數據要素,確保其隱私保護,是實現數據共享和流通的關鍵挑戰。如果在這一方面做得不好,將會阻礙AI的發展。

在中國,算力分佈在不同地區,“東數西算”的佈局旨在利用西部算力處理東部數據。但這個過程中,有一個很大的挑戰,就是如何實現遠距離的無損傳輸。

劉韻潔提出,RDMA(遠程直接內存訪問)技術是解決這一問題的關鍵。他提到,微軟的算力中心有70%都是使用無損協議進行互聯,而華爲的實驗數據顯示,RDMA在100GE環境下的性能是TCP的8倍多。

此外,劉韻潔還提到了美國能源科研網ESnet的案例,其第六代網絡ESnet6在2022年10月開通,號稱全球最快的互聯網,主要爲美國國家實驗室提供數據服務。通常來說,ESnet會在新一代網絡運行三五年後再啓動下一代網絡,但2023年,ESnet就宣佈要做ESnet7,這是因爲他們發現了一些新的需求,其中就包括端到端的確定性。

所以對算力網絡來講,確定性是一個非常重要的基礎,可以爲海量數據遠距離無損傳輸提供關鍵技術支撐。而在確定性技術的研究方面,劉韻潔強調了網絡架構的變革。

“要解決AI的需求,不是單一技術就能解決的,而是整個網絡架構都要系統性地重新設計。”劉韻潔稱,架構調整的主導思路是要從原先的“盡力而爲”變成“確保所需”,如上文所說,如果網絡不能滿足需求,那AI的很多工作都無法繼續開展。

劉韻潔還提出,確定性的網絡技術也要跟光通訊進行融合,因爲未來大模型有各種維度的需求,不同用戶在不同場景需要不同的網絡,他們需要隨時定製,這也是未來AI發展必須提供的一個功能。

談及中國大模型未來的發展,劉韻潔認爲,中國大模型的出路在於行業大模型,因爲中國行業數據的完整性、系統性是非常好的,尤其是在製造業,如果把這些行業數據利用好,通過行業大模型產生價值,這將是會中國發展新質生產力的一個非常好的途徑。