中美大模型競賽「勝負手」:差距擴大還是不相上下?
【編者按】2023年,半導體行業面臨宏觀經濟和地緣政治等多重挑戰。迎接2024年,《集微網》推出回顧展望系列,邀請行業代表企業總結過去一年的產業鏈發展、熱點話題,並展望未來。通過這一系列,爲半導體行業提供有深度的參考,助力企業更好地應對新的發展趨勢。
集微網報導(文/陳興華)隨着全球新一輪產業技術變革加速到來,人工智能作爲這一浪潮中的核心動能已經越來越受到世界各國的高度重視。其中,在國際地緣環境演變和產業鏈逆全球化趨勢擡升等複雜背景下,中國與美國正力爭成爲全球AI大模型領域中的主要領導者併成爲世界矚目的焦點,因爲這不僅是探索引領科技產業變革的全新高地,也事關人類社會經濟發展的未來。
目前,已有政府機搆、行業智庫、媒體學者等對主要科技大國的人工智能戰略等方面進行了研究,但對中美兩國AI大模型的產業政策、技術創新、學術研究、行業應用和市場融資等方面的對比分析相對缺乏。鑑於此,本文通過盤點相關權威機搆及智庫報告、專欄文章和榜單等並提煉要點精華,以期對中國AI大模型產業發展有所參考鏡鑑和促進發展。
2023年11月21日,美國《財富》雜誌首次發佈了「人工智能創新者50強」榜單。在這50家企業中,絕大多數都是美國企業,其中包括OpenAI、Anthropic、英偉達、谷歌、微軟、Meta、IBM、Adobe等美國知名AI及科技公司,以Midjourney、Hugging Face、Adept、Runway、Pinecone、Exscientia和ARC等新興玩家入選。
相比之下,中國僅有一家企業——百度入選該榜單。《財富》在對百度入選的評語中指出,2023年10月,百度發佈了文心一言4.0,並聲稱該模型處理許多中文特定任務的表現優於OpenAI的聊天機器人,以及在複雜度和功能方面可以與ChatGPT相媲美。此外,百度除了在其搜索引擎、雲計算部門和其他產品中使用機器學習外,還在開發自動駕駛算法,並擁有一支無人駕駛的「機器人出租車」車隊。
《財富》表示,50強榜單是一份重要指南,旨在幫助業界瞭解正在創造定義未來技術的公司。該榜單是由《財富》與風險投資家、行業分析師和《財富》人工智能專家團隊進行深入討論並篩選,以確定處於行業前沿的公司。雖然人工智能領域瞬息萬變,但可以確定的一點是:這些公司所做的工作不僅會塑造人工智能的未來,還會影響人們生活的世界。
業內分析指出,從上榜企業數目來看,中美在人工智能綜合創新力方面仍有較大差距。這種差異可能是因爲上榜公司更加註重研究方向與實用性,而國內大部分人工智能公司則僅是爲了跟進市場趨勢,缺乏核心優勢,需要更多投資和研發進一步提高創新能力和競爭力。
2023年9月9日,鈦媒體國際智庫發佈產生一定行業影響力的《2023 AI大模型應用中美比較研究》報告。報告綜合大模型行業滲透度、行業接受程度、行業應用成熟度以及行業融資版圖四個維度,選取了部分AI應用主流行業,分別是AI+辦公、AI+金融、AI+醫療、AI+文娛、AI+教育、AI+交通以及AI+能源,多維展現了中美在AI大模型相關應用領域的現狀及各自的特點、優劣勢比較與分析。
報告指出,當前國內外大模型在金融業的滲透率最高(78%),辦公領域的滲透率也比較可觀,但能源和建築行業的滲透率較低。其中在中美兩國方面,AI+辦公領域:美國巨頭引領潮流,國內廠商奮起直追;AI+金融領域:美國發展較成熟,國內也已進入應用階段;AI+醫療領域:國內由於數據制約滲透緩慢,美國數據優勢明顯,而且青睞研發環節。
另外,AI+文娛領域:美國發展遇阻,中國有望彎道超車;AI+教育領域:美國側重輔助教師,中國側重應試,各有千秋;AI+交通領域:中國具備交通應用優勢,同時中美在智能駕駛方面處於競爭狀態;AI+能源領域:中美兩國滲透率均較低,處於探索時期。
對此,報告總結稱,中美在AI大模型方向領先其他各國,然而雙方的競爭也已經明牌,各方面表現各有勝負,其中以谷歌爲代表的科技巨頭長期投身於基礎理論的研究,使得美國引領者人工智能的發展潮流,依託濃厚的工程師文化在基礎大模型上保持領先優勢。
在一級市場上,美國對AI大模型的投資也比較積極,其中以英偉達、微軟等爲代表的科技巨頭成爲最重要的「獨角獸獵手」,通過大手筆投入爲美國人工智能的發展積蓄了力量。然而,由於大模型對人才、資本和技術的制約,國內一級市場對相關項目的投資並不如美國火熱,投資機搆出手較爲謹慎,而且更傾向於利用龍頭企業的開源模型來做應用落地的創業。
據不完全統計,2023年上半年,美國AIGC一級市場中,矽谷在人工智能領域共完成42起融資,總金額約140億美元,佔世界總融資金額的55%。其平均輪次融資金額爲3.3億美元,是平均融資水平的近13倍之多。同期,國內人工智能領域共發生161起投融資,較2022年同期減少153起,同比下降49%。另外,國內人工智能領域投融資交易事件涉及總金額61.74億元,較2022年同期減少99億元,同比下降62%。
另一方面,美國各個行業整體的信息化水平較高,積累了豐富的結搆化數據,這爲美國的大模型落地打下了基礎,尤其是在醫療研發等方向會繼續保持着先發優勢。相較而言,國內大模型一直扮演着追隨者的角色,但在基礎模型方面中美之間的差距並不大,「重應用輕基礎」的研發理念以及國內龐大的下游需求,讓國內機搆更加專注於落地應用的研究。
因此,在AI大模型的應用上,國內可以說更勝一籌。一方面,國內一級市場更多是關於大模型應用的創業項目;另一方面,各行業較成熟的企業均依託在各自行業的深耕,或外接基礎模型,或利用開源模型自研模型來使所從事的行業用上AI大模型。不過,國內不少行業尚未完成信息化,基礎數據的匱乏使得AI大模型在某些行業寸步難行。此外,算力制約成爲中美AI競爭的一把利刃,努力衝破算力制約是AI發展路上的頭等大事。
ChatGPT在全球範圍內掀起的AIGC熱潮,本質上是作爲一種基於自然語言處理(Natural Language Processing,NLP)技術的大語言模型應用。隨着人工智能深入發展,自然語言處理需求持續提升,市場規模及應用領域也在不斷擴大,同時也將出現更多挑戰。對此,自然語言處理學術的研究成果可以爲產業技術方向提供選擇,爲企業技術創新方向提供指引。
2023年8月,集微諮詢(JW Insights)隆重推出了《ChatGPT掀起AIGC新一輪熱潮的背後:從學術角度分析自然語言處理技術》報告,對自然語言處理領域的全球頂級期刊學術論文在過去二十年發表的趨勢、來源國家/地區、發表機搆、重要學者、資助機搆、出版刊物、熱點主題等進行全方位分析,爲業界提供該領域相應的學術研究成果解讀。
報告顯示,截至2023年4月底,全球發表的自然語言處理論文共有74992篇。在論文發表趨勢上,全球自然語言處理論文發表量在2002年至2012年之間增長趨勢較爲平緩,但自2013年起開始出現較爲迅猛的增長。2017年,生成式預訓練模型Transformer的發表帶動了自然語言處理行業學術研究的新一輪熱潮,令論文發表量進一步直線上升。
從論文的整體區域分佈來看,全球自然語言處理領域的學術研究成果主要集中在中國大陸和美國,論文數量均超1.8萬篇,佔據全球自然語言處理領域學術研究高地。儘管印度、德國、英國和日本等國也有較多的學術研究成果,但與中美兩國相比差距顯著。
至於發表論文的機搆,全球論文發表量排名前十的科研院所中,中、美、法等國的科研院所佔據絕大多數。其中,中國科學院以1971篇論文的數量排名全球第一,遠超第二名美國加州大學近50%,清華大學、北京大學也榜上有名。相比之下,美國除了傳統高校之外,高科技企業對自然語言處理基礎學術研究也高度重視,其中微軟、IBM、谷歌等跨行業巨頭均發表了相當數量的論文。因此,美國在該領域學術研究的這一特點在全球絕無僅有。
從對論文的基金資助來看,主要來源於各國政府層面,如中國自然科學基金、美國國家科學基金、歐盟委員會等。其中,中國自然科學基金會資助的論文量最高,爲8335篇;美國的國家科學基金會、衛生與公衆服務部、國立衛生研究院等機搆合計資助了6000餘篇論文的發表。這顯示出各國政府正在大力支持自然語言處理技術的基礎研究。
此外,集微諮詢(JW Insights)基於文獻撰寫質量、期刊水平、影響力、先進性等多個指標全方位計算學術論文的綜合得分,從自然語言處理學術論文中篩選出實力最強的50篇論文,直觀展示了這50篇論文的文章標題、國家/地區、所屬機搆、研究領域、研究要點,爲企業研發創新提供借鑑。
自然語言處理行業學術論文TOP5
分國家和地區來看,美國在自然語言處理領域的科研實力領先,TOP50中入選論文量達28篇,遠超其他國家和地區,其中有8篇來自谷歌的研究;中國排名第二,但入選論文數量只有6篇;英國排名第三,僅有3篇論文上榜;其他國家則只有零星的高價值學術成果。對比美國,我國自然語言處理學術論文在撰寫質量、影響力和先進性等方面有待進一步加強。
在5月28日舉辦的中關村論壇人工智能大模型發展分論壇上,由中國科學技術信息研究所、科技部新一代人工智能發展研究中心聯合相關研究機搆編寫的《中國人工智能大模型地圖研究報告》正式發佈。該報告藉助大模型地圖的可視化方式分析了中國大模型的發展特徵,公佈了國內大模型實力排行榜,同時也揭示了相關發展中尚存在的問題與不足等。
報告稱,美國谷歌、OpenAI等機搆持續引領大模型技術前沿,同時中國、歐洲、俄羅斯、以色列、韓國等地越來越多國家也在投入大模型的研發。從全球已發佈的大模型分佈來看,中國和美國大幅領先,超過全球總數的80%,但美國在大模型數量方面始終居全球最高。
目前,在AI大模型領域,中國與美國保持同步增長態勢,在自然語言處理、機器視覺和多模態等各技術分支上均在同步跟進、迅速發展,涌現出盤古、悟道、文心一言、通義千問、星火認知等一批具有行業影響力的預訓練大模型,形成了緊跟世界前沿的大模型技術羣。
此外,報告基於公開信息梳理分析了中國已發佈的79個大模型分析結果顯示,中國在14個省市/地區均有團隊在開展大模型研發,其中北京、廣東兩地最多,地域集中度相對較高。從領域分佈來看,自然語言處理仍是目前大模型研發最爲活躍的重點領域,其次是多模態領域,在計算機視覺和智能語音等領域的大模型還較少。同時,國內大學、科研機搆、企業等不同創新主體都在積極參與大模型研發,但學術界與產業界之間的聯合開發相對較少。
此外,報告通過調研全國範圍內的算力基礎設施分佈情況發現,北京、廣東、浙江、上海等地的大模型數量最多,而這四個地方也是近三年人工智能服務器採購數量最高的地區,表現出非常明顯的強相關性,爲大模型研發應用提供了重要支撐。同時,各地也在通過提供公共算力方式補充快速增長的人工智能算力需求,爲大模型研發提供更多算力支撐。
進一步來看,作爲國內最早以及專業性獲業界認可的綜合性測評基準,中文通用大模型基準(SuperCLUE)在上述報告推出後發佈了大模型6月榜單。該榜單由四部分組成,即總排行榜、基礎能力榜單、中文特性榜單、70億參數量級榜單,分別從不同維度評價模型的能力,其中專業能力包括中學、大學與專業考試,涵蓋從數學、物理、地理到社會科學等50多項能力。
業內分析稱,從6月榜單上的測評結果來看,GPT-4的綜合能力和單項能力都表現出色,在各榜單中都是獨佔鰲頭,比第二名GPT-3.5-turbo要強不少;其次是GPT-3.5-turbo、Claude,二者評分旗鼓相當。而國內大模型都屬於跟跑狀態,各方面的表現還有待加強,在與美國的AI大模型競賽中追趕步伐還得加快。值得注意,在SuperCLUE最新發布的11月榜單中,中美AI大模型的評測總分和單項能力方面的差距呈現一定程度擴大趨勢。
2023年5月9日,英國《經濟學人》雜誌刊發專欄文章《中國在生成式AI上有多強?》,文章從論文數、系統數、算力和晶片硬體等幾個基礎層面的圖表對比了中國兩國的AI實力,並指出目前中國大模型落後於美國兩到三年,原因在於兩國在訓練數據、晶片等硬體及科技人才上的距離,但未來兩國可能終將擁有相媲美的AI能力。
文章稱,過去幾年,中國在某些衡量AI實力的指標上領先於美國。2021年,全球26%的AI論文來自中國,而來自美國的佔比只有17%。按AI論文發表量計算,全球排名前十的機搆中有九個在中國。根據一個常用的基準,計算機視覺領域排名前五的實驗室也都在中國。
中美AI相關指標的對比
但在「基礎模型」這種賦予生成式AI智慧的領域,美國的優勢明顯,例如ChatGPT及其背後先進的模型是由美國創業公司OpenAI研發。同時其他美國公司也有自己強大的系統,既有Anthropic或StabilityAI等小公司,也有谷歌、Meta和微軟等科技巨頭。雖然文心一言作爲百度打造對標ChatGPT的產品,但業界普遍認爲它還達不到ChatGPT的智能程度。
中國、美國、歐洲的機器學習系統的數量對比
因此,業內人士得出了這一結論:中國在建立基礎模型方面比美國落後兩到三年。而造成這一差距的原因有三個:第一個原因涉及數據。根據互聯網研究網站W3Techs的數據,全球56%的網站是英文內容,而只有1.5%的網站是中文,這有利於美國的建模者。史丹佛大學博士傅亦沁指出,中國人主要是通過微信和微博等App上網互動,其中大部分內容都沒有在搜索引擎上建立索引,這讓AI模型在訓練時難以吸收這些內容。
第二個原因與硬體有關。2022年,美國對一些AI領域的關鍵技術實施了面向中國的出口管制,其中包括雲計算數據中心所用的微處理器,以及可以讓中國自行製造此類半導體的晶片製造工具,這打擊了中國的大模型研發。英國智庫AI治理中心分析了26箇中國大模型後發現,超過一半模型的晶片都要依賴美國晶片公司英偉達。而中國最大的晶片製造商只能大規模生產臺積電在三四年前量產的晶片。
第三個原因是中國AI公司難以從美國引入的東西是人才。目前,美國對全球科技人才仍然極具吸引力:在期刊上發佈論文的美國AI專家中有三分之二在國外出生,其中華裔工程師佔到這個頂尖羣體的約四分之一。許多中國的AI研究人員曾在美國學習或工作,然後帶着專業知識回國,但中美關係緊張加劇等因素導致這一羣體的人數下降。
《經濟學人》認爲,儘管這些因素對中國AI發展造成了障礙,但是否會在更長時間內阻礙中國的AI雄心則是另一回事。當前,中國政府已經爲建模機搆提供了大量數據集,並表示希望拆除中國App的「圍牆」以釋放出更多數據。同時,中國在硬體方面也在尋找變通辦法,並且可以用開源模型讓缺乏晶片和人才的問題得到一定程度緩解。
因此,中美兩國可能最終將擁有相媲美的AI能力,即使中國在這一過程中會因爲美國的制裁而付出額外代價。但如果雙方大模型的競爭勢均力敵,那麼美國的另一個優勢有可能讓它成爲AI大贏家,那就是它有能力在經濟體系中廣泛應用其尖端科技。
2023年10月12日,中國社會科學院社會學研究所經濟與科技社會學研究室官方公衆號「社計文庫」刊發了由牛津互聯網學院互聯網社會科學碩士艾米·海恩(Emmie Hine)和牛津互聯網學院信息哲學和倫理學教授、牛津互聯網研究所數字倫理實驗室主任盧恰諾·弗洛裡迪(Luciano Floridi)日前聯合撰寫的《中美人工智能政策對比分析》一文。
該文以定量和定性結合方法分析了美國和中國的人工智能發展政策,在梳理兩國政策形成脈絡的同時重點分析了兩國政策制定背後的技術理念、歷史文化傳統差異,從更深層次的維度剖析大國科技競爭背景下的人工智能政策差異,填補了中美人工智能政策比較的內容空白。
艾米·海恩與盧恰諾·弗洛裡迪
文章提及,在政策評估方面,拜登政府的立法和麪向社會的施政舉措融合了歐巴馬政府對打造多樣性的努力和川普政府對美國領導力的關注。一是在拜登政府對良好的人工智能社會的願景中,政府將繼續強調研發中的自由市場原則,但同時也會採取措施重塑該行業。二是美國明確的將中國視爲競爭對手,在強調多樣性和注重道德可信度定義的同時推動多邊倡議,拜登政府將人工智能的受益者重新定義爲所有美國人和美國的盟友,但不包括中國。
目前,中國的中央和地方規劃仍然優先考慮人工智能技術的實際運用而非技術的基礎性研究。根據《發展規劃》,實現全球領先的人工智能發展是中國的首要目標,包括2025年前後實現重大技術突破、制定相關法規,2030前後年開發出世界領先的人工智能併成爲「世界主要人工智能創新中心」。爲了實現這些目標,中國的中央政府正聯合地方政府和私營部門一道共同推進,大量的具體舉措在試圖維護社會穩定的同時,也在鼓勵創新和技術進步。
總體而言,美國的人工智能戰略願景在近三屆政府期間發生了重大轉變。如今,在拜登政府的領導下,美國採取了一種更加親力親爲(即使仍以市場爲導向)的方式,強調美國的領導力和創新力的價值,以及加強與盟友的密切合作。在個體維度的新教職業道德的驅動下,這是一種更廣泛的技術崇高願景,其中也包括與中國的全球合作和競爭。
相比之下,中國的人工智能發展外部願景包括獲得全球領導力,以及基於基本人類價值觀的合作。另外,在內部願景方面,儒家思想仍深刻影響着中國對於「良好人工智能社會」的規劃與實踐。因此,中國的文化傳統和當前政治體制驅使中國試圖找到一種能夠兼顧人工智能創新與維護社會穩定的發展模式。
文章進一步稱,雖然中國與美國的這兩種發展理念都不是僅爲了應對國際技術競爭而形成,但兩國的願景並非水火不容,其中新教倫理更強調個人,儒家更強調社會,兩者都是爲了社會大衆的利益。然而,無論是國內衝突還是國際衝突都不利於實現這一目標,國際合作仍然是實現「良好人工智能社會」的唯一選擇。
各國政府應該超越競爭性地緣政治動態的傳統觀念,採取多元主義的價值立場,在承認存在多種治理方法與模式的基礎上開展有效對話,爲一個良好的全球人工智能社會勾勒出共同價值觀的具體標準。儘管中美兩國的競爭態勢使得這一願景在當下難以實現,但如果雙方能夠互相審視和理解各自的觀點,那麼在兩個大國的和諧合作下,人工智能就有可能成爲人類整體項目的一部分——一個「良好的全球人工智能社會」願景將會實現。