上海發文支持人工智能發展,算力、語料、行業模型怎麼做?
爲加快建設人工智能“上海高地”,打造人工智能世界級產業集羣,上海發文支持人工智能算力、語料庫建設 。
12月27日,上海市公開了《關於人工智能“模塑申城”的實施方案》(下稱“方案”),提出到2025年底,建成世界級人工智能產業生態,力爭全市智能算力規模突破100EFLOPS,形成50個左右具有顯著成效的行業開放語料庫示範應用成果,建設3-5個大模型創新加速孵化器,建成一批上下游協同的賦能中心和垂直模型訓練場。
方案在強化基礎底座賦能、加快關鍵生產力工具打造、推動重點垂直領域應用、加速創新應用生態構建等方面規劃了22條具體措施。
例如,打造超大規模自主智算集羣。建設自主可控智算支撐底座,支撐全市人工智能創新應用的算力需求。加快通用圖形處理器、專用集成電路、可編程門陣列等自主智算芯片攻關,強化分佈式計算框架、並行訓練框架等自主軟件研發。
構建多層次語料供給體系。建立一批通用和專用語料庫,打造多層次語料體系,支撐基礎大模型研發和垂直應用。聚焦前沿大模型訓練需求,推動打造基礎大模型訓練語料庫。聚焦金融、製造、教育、醫療、文旅、城市治理等行業需求,打造一批行業開放語料庫與測試數據集。
加快行業基座大模型體系創新。加速通用和專用大模型融合創新,打造一批行業基座大模型。
一位人工智能業內人士告訴記者,對於人工智能的發展要關注三要素——算力、算法、數據,數據也就是語料這塊,需要加強行業高質量語料的渠道來源和供給,這僅靠需求牽引是不夠的。而數據產業是人工智能的上游產業,在人工智能1.0時代很壯大,2.0時代打法不一樣,需要這些數據公司的服務能力跟上大模型的需要。“現在很多高質量語料是沒有能力加工,同時也不對外提供,因此中間還是需要有一些政府的引導,慢慢把市場的數據語料產業生態做起來。”
此外,方案還提出構建產業投資基金賦能生態、構建產業孵化培育生態。
例如,發揮市級人工智能先導產業母基金引領作用,加強市級產業資本統籌,支撐本市人工智能戰略領域健康發展。推動成立算力和語料基金,探索算力和語料作價入股等模式,加強創新型企業培育。
方案稱,將遴選專業運營團隊,創新扶持政策,打造大模型創新企業孵化器。依託“模速空間”,深化全要素賦能,加快生成式人工智能創新生態先導區建設。依託“模力社區”,聚焦垂直模型應用,打造垂直模型上下游生態和產業鏈集聚效應。
相關數據顯示,上海市人工智能規上企業已從2018年的183家增長到2023年的348家,產業規模從1340億元增長到超3800億元,居全國前列。全國首個大模型創新生態社區“模速空間”建成,吸引80餘家大模型企業入駐。多層次人才梯隊基本成型,人才規模達到25萬人,佔全國近1/3。今年6月,上海市副市長陳杰透露,上海人工智能產業投資基金累計募資31億元,母基金部分投資了12只子基金,撬動投資規模572億元。