英偉達SC24六大技術亮點,不止加速超算500強
雷峰網消息,當地時間11月18日,TOP500組織於SC24大會(2024年超級計算大會)上正式公佈了最新的全球超級計算機TOP500榜單,在這500個全球最強的計算機系統中有384個採用了英偉達的技術,其中前十名中更是佔據了八個席位。
黃仁勳表示:“自CUDA誕生以來,英偉達將計算成本降低至之前的百萬分之一。對一些人來說,英偉達就像一臺計算顯微鏡,讓他們能夠觀察到極其微小的東西;對另一些人來說則像一臺望遠鏡,讓他們能夠探索難以想象的遙遠星系;對許多人來說,它是一臺時間機器,讓他們能夠在有生之年從事畢生的事業。”
但英偉達的目標不止於此。
SC24大會上,英偉達發佈和開源了多項新產品,包括加快數據處理的cuPyNumeric、生物醫藥開源框架BioNeMo、新材料推理器NVIDIA ALCHEMI NIM微服務、氣候預測平臺Earth-2 NIM、CUDA-Q平臺以及實現數字孿生的Omniverse Blueprint,爲學術界和產業界提供更多支持,推動量子計算、藥物發現以及新材料研究等尖端科研發展。
持續加速最前沿科研和行業應用,讓英偉達保持高性能計算領域的絕對王者 。
加速前沿科研的新選擇
發佈cuPyNumeric,“無痛”加速科研
科學研究需要對大量數據進行處理分析,處理數據的速度越快,科學家們就能越快地針對有前景的數據點、值得研究的趨勢以及實驗調整做出決策。
cuPyNumeric是一個加速計算庫,其發佈爲科研帶來兩個好處:一是通過擴展強大的計算集羣,提高數據處理效能;二是該功能無需修改Python代碼,科研人員不需要掌握計算機科學方面的專業知識,減少學習成本。
此前,許多科學家都在使用NumPy程序,並僅在一個CPU節點上運行,這限制了其算法的吞吐量,無法處理電子顯微鏡、粒子對撞機和射電望遠鏡等儀器收集的日益龐大的數據集。
通過提供一個可擴展到數千個GPU的NumPy替代品,cuPyNumeric從單個GPU擴展到整個超級計算機,可以更快地處理大量數據。
關於計算機專業知識方面,科研人員只需使用熟悉的NumPy界面編寫代碼,或將cuPyNumeric應用於現有代碼,即可體驗到高性能和可擴展性。
SLAC國家加速器實驗室、洛斯阿拉莫斯國家實驗室、澳大利亞國立大學、馬薩諸塞大學波士頓分校、斯坦福大學湍流研究中心和印度國家支付公司等機構的科研人員均集成了cuPyNumeric,從使用體驗來看,顯著地改善了他們的數據分析工作流程。
BioNeMo開源框架,爲藥物研發打上“腎上腺素”
BioNeMo通過結合加速計算以及提供更大的開源數據集,推動生物醫藥產業發展。
加速計算爲研究人員提供趁手的工具,而開源數據集則補足了“原料”。
研究人員需要專門的生物分子模型和數據集來大規模地收集洞察,以便更快地設計治療方案。開源BioNeMo框架提供了一系列加速計算工具,爲生物分子研究提供指數級擴展的AI模型,也爲生物製藥領域帶來新的超級算力水平。
英偉達醫療健康與生命科學總經理兼副總裁Kimberly Powell表示:“最近的諾貝爾化學獎證明了AI、加速計算和日益擴大的數據集的融合爲製藥行業創造了前所未有的機遇。爲了幫助解開生物系統的複雜奧秘,我們推出了BioNeMo開源框架,它將使全球各地的研究人員能夠更快開發出挽救生命的治療方法。”
BioNeMo已被產業及學術界大量採用,包括A Alpha Bio、美國阿貢國家實驗室、Dyno Therapeutics、羅氏集團的成員基因泰克及Ginkgo Bioworks等。
阿貢國家實驗室計算科學小組負責人Arvind Ramanathan表示:“美國阿貢國家實驗室貢獻了數十億參數的生物模型,這些模型需要使用專門的軟件在高性能計算環境中訓練而成。BioNeMo爲美國阿貢國家實驗室和更廣泛的生物技術社羣提供了一個企業級開源解決方案,使研究人員能夠在本來不具備足夠的計算專業知識的實驗室中,輕鬆擴展大型生物基礎模型的訓練規模。”
除此之外,英偉達還發布了適用於BioNeMo的一系列NIM微服務(容器化的GPU加速推理服務,可用於預訓練和自定義AI模型)。這些微服務可以快速、輕鬆地部署在本地或任何數據中心或雲中,使開發人員能夠在各種不同的環境中靈活運行應用,並縮短了生物藥物研發研究中從推理到獲得洞察的時間。
新推出的NIM微服務支持業界領先的模型,包括谷歌的AlphaFold2及麻省理工的DiffDock 2.0。目前已有200多家科技生物公司、大型製藥公司和初創企業用戶將BioNeMo集成到其計算機輔助藥物研發平臺和工作流中。
NVIDIA ALCHEMI讓新材料發現,從「混亂走向秩序」
據國際金融公司(IFC)報告顯示,從洗衣粉、食品包裝等日用品到半導體、電池和太陽能電池板等先進工業零部件,超96%的製成品所依賴的化學物質都無可替代,因此,創造新材料以應對儲能和環境修復問題變得日益嚴峻。
但在探索海量的潛在材料時,會涉及到幾乎無限種的化學物質組合,這使探索過程極複雜且需要耗費大量時間。在傳統實驗室中,通常需要進行費力、反覆的試錯合成和測試才能發現新材料。
AI推理或許是解藥。最近,AI 已經成爲加快化學物質和材料創新的催化劑。
英偉達發佈NVIDIA ALCHEMI NIM微服務,通過優化針對化學模擬的AI推理,加速研究工作,從而催生更高效且可持續發展的材料,從而支持可再生能源轉型。
SES AI是領先的鋰電池開發商,正在使用NVIDIA ALCHEMI NIM微服務和AIMNet2模型,致力於更快地找到製造電動汽車所需的電解質材料。
藉助ALCHEMI,SES AI近期在半天時間內繪製了10萬個分子,而且有望把繪製時間縮短到一小時內。
Earth-2 NIM讓「模擬地球」的速度提高500倍
Earth-2是一個數字孿生雲平臺,用於模擬並可視化呈現天氣和氣候條件。
彭博社報告顯示,2024年上半年,自然災害造成的保險損失約爲620億美元,較近10年平均值高出了70%左右。
SC24大會上,英偉達發佈了兩項基於Earth-2的全新微服務,爲氣候技術應用提供商提供了領先的生成式 AI 驅動的功能,以輔助預測極端天氣事件,且將氣候變化模型的模擬計算速度提高了500倍。
兩項微服務:更高分辨率建模的CorrDiff NIM及使大規模集合預報成爲可能的FourCastNet NIM。
CorrDiff是一種可實現公里尺度超高分辨率的生成式AI模型。CorrDiff基於WRF模型的數值模擬結果進行訓練,可以生成12倍更高分辨率的天氣預報結果。
與使用CPU的傳統高分辨率數值天氣預報相比,CorrDiff NIM微服務的計算速度高出了500倍,能效提升了10000倍。此外,CorrDiff 現在以300倍的更大規模運行,可對整個美國進行超分辨率處理(即提高低分辨率圖像或視頻的分辨率),並能以公里尺度的可見度預測降雪、結冰和冰雹等降水事件。
但並非每個用例都需要高分辨率預報。對某些應用來說,使用粗分辨率的大規模集合預報反而能獲得更好效果。
FourCastNet NIM微服務提供了全球範圍的中期粗分辨率預報。通過使用歐洲中期天氣預報中心或美國國家海洋和大氣管理局等業務氣象中心的初始場,提供商可生成未來兩週的預報,速度比傳統數值天氣模型快5000倍。
這爲氣候技術提供商帶來了新機遇,使其能夠以不同尺度評估極端天氣相關風險,從而預測當前計算工作流對低概率事件發生可能性的遺漏。
與產業巨頭強強聯合
英偉達CUDA-Q攜手谷歌Quantum AI,加速量子計算處理器設計
SC24大會上,英偉達宣佈與谷歌達成合作,谷歌旗下的Quantum AI將採用CUDA-Q平臺進行模擬,以加速下一代量子計算器件的設計工作。
英偉達CUDA-Q是一個開源量子開發平臺,協調了運行大規模量子計算應用程序所需的硬件和軟件。谷歌旗下的Quantum AI致力於構建量子計算機,通過量子計算解決其他方法無法解決的問題。
現階段,量子計算由於存在硬件的侷限性,只能運行一定數量的運算,該現象被研究人員稱爲“噪聲”。
谷歌量子AI正在使用量子-經典混合計算平臺和NVIDIA Eos超級計算機,以模擬其量子處理器的物理特性,這將有助於克服量子計算硬件當前的侷限。
谷歌量子AI研究科學家Guifre Vidal表示:“要想開發出商用的量子計算機,就必須能夠在控制噪聲的情況下擴展量子硬件規模。藉助英偉達加速計算,我們正在探索越來越大的量子芯片設計中噪聲的影響。”
過去,模擬的計算成本非常高。藉助CUDA-Q平臺,谷歌可以在NVIDIA Eos超級計算機上使用1024個NVIDIA Hopper Tensor Core GPU,以低成本進行世界上最大、最快的量子器件動態模擬。
英偉達量子和高性能計算總監Tim Costa表示:“強大的AI超級計算有助於量子計算取得成功。谷歌對CUDA-Q平臺的使用展現了GPU加速的模擬在推進量子計算方面發揮的作用,它將幫助解決許多問題。”
藉助CUDA-Q和Hopper GPU,谷歌可以對包含40個量子比特的器件進行模擬,是同類模擬中規模最大的,噪聲模擬時間從一週縮短到幾分鐘。
實現萬物「數字孿生」的“藍圖”
Omniverse Blueprint是一款物理數字孿生產品,數字孿生是物理實體的精準虛擬模型,通過實時數據採集和仿真分析,爲決策提供支持。
Blueprint是一個包含NVIDIA加速庫、物理AI框架以及基於物理學的交互式渲染的參考工作流,可將仿真和實時可視化速度提高1200倍。
黃仁勳表示:“我們構建Omniverse是爲了讓萬物都能擁有數字孿生。Omniverse Blueprint是打通NVIDIA Omniverse與AI技術的參考管線。藉助該藍圖,領先的CAE軟件開發商能夠構建出開創性的數字孿生工作流,爲全球各大行業實現從設計、製造到運營的工業數字化轉型。”
Altair、Ansys、Cadence、西門子等軟件開發商利用NVIDIA Omniverse Blueprint實現實時計算機輔助工程數字孿生,幫助客戶在降低開發成本和能耗的同時,更快進入市場。
構建實時物理數字孿生系統需要兩項基本功能:實時物理求解器的性能與大規模數據集的實時可視化。
Omniverse Blueprint爲開發者統一三大技術支柱:用於加速求解器的NVIDIA CUDA-X 庫、用於訓練和部署模型以生成流場的NVIDIA Modulus物理AI框架,以及用於3D數據互操作性和RTX支持的實時可視化的NVIDIA Omniverse API來實現上述兩項基本功能。
工程仿真軟件Ansys在Texas Advanced Computing Center的320顆NVIDIA Grace Hopper超級芯片上運行Fluent,僅用六個多小時就完成了25億個單元的汽車仿真,而在2048顆x86 CPU Core上運行這一仿真則需要近一個月的時間。
Ansys總裁兼首席執行官Ajei Gopal表示:“我們通過將NVIDIA Omniverse Blueprint與Ansys軟件集成,使客戶能夠更加快速、準確地進行日益複雜和詳細的仿真,我們的協作正在推動多個行業的工程與設計發展。”
此外,Omniverse Blueprint還可在所有領先的雲平臺上運行,包括亞馬遜雲科技、Google Cloud,Microsoft Azure和Oracle Cloud Infrastructure。
Rescale是一個基於雲的平臺,可以幫助企業加速科學和工程突破。通過使用NVIDIA Omniverse Blueprint,該平臺上的企業只需點擊幾下即可訓練和部署自定義AI模型。
2024年超級計算大會將落幕,但英偉達在加速計算的路上仍在不斷加速。