☰

斯坦福大學最新報告：美國 AI 基礎模型數量是中國的5倍｜鈦媒體AGI

AI在多個基準上的表現已經超越了人類，比如圖像分類、視覺推理和英語理解方面。不過在競賽級數字、視覺常識推理和規劃等更爲複雜的任務上，AI依然落後於人類。

2023年，工業界出現了51個具有影響力的機器學習大模型，而學術界只貢獻了15個。產學界也在2023年合作貢獻了21個具有影響力的大模型，數量創下歷史新高。

經估算，最先進的AI大模型訓練成本已經達到前所未有的水平。

其中，OpenAI的GPT-4訓練成本爲7800萬美元，谷歌的Gemini Ultra訓練成本爲1.91億美元。有趣的是，谷歌2017年的Transformer 模型引入了支撐當下幾乎所有大語言模型的架構，訓練費用僅爲930美元。

2023年，美國共出現了61個知名AI大模型，遠超歐盟的21個和中國的15個。

最新研究表明，負責任的AI模型嚴重缺乏標準化。OpenAI、谷歌和Anthropic這些前沿開發者們，按照不同的負責任的AI基準來測試他們的大模型，這種做法使得系統地比較頂級AI大模型的風險和侷限性的努力變得複雜。

AI Index指出，現有的AI深度僞造內容已難辨真假，尤其是政治方面的深度僞造已經影響了世界各地的選舉。

儘管2023年AI私人投資整體有所下降，但對生成式AI的投資金額猛增至252億美元，比2022年增長了近9倍。包括OpenAI、Anthropic、Hugging Face和Inflection AI等企業都獲得了一輪可觀的融資。

2023年，宣佈融資成功的生成式AI初創企業數量爲99家，相比2022年的56家增長了76.79%。

2023年，一些研究表明，AI能幫助人類更快地完成工作任務並提高他們的工作質量。此外，AI還能彌合低技能員工和高技能員工之間的技能差距。不過，也有研究警告說，在沒有適當監督的情況下使用AI會產生性能下降的現象。

2022年，AI開始推動科學發現。2023年出現了更爲重要的與科學相關的AI應用程序——提高算法分揀效率的 AlphaDev和促進材料發現過程的GNoME。

近幾年，AI在MedQA（醫療問答數據集）基準上取得了顯著改進。2023年，GPT-4 Medprompt的準確率已經達到了90.2%，比2022年的最高分提高了22.6%，相比2019年性能足足提升了2倍。

美國與AI相關的法規在過去一年甚至是過去五年都在大幅增加。2023年，美國共出臺了25項與AI相關的法規，同比增長了56.3%，而2016年只有一項。

全球市場調研機構Ipsos的一項調查顯示，去年，人們認爲AI在未來三到五年將極大地影響他們生活的比例從60%上升到了66%。此外，52%的人表示對AI產品和服務感到擔憂，比2022年上升了13個百分點。

皮尤研究中心的數據顯示，美國有52%的人表示對AI的擔憂多於興奮，這一比例高於2022年的37%。

中美AI實力比拼

在AI世界級競賽中，中國與美國是最爲矚目的兩個國家，雙方在AI的不同領域各有優勢。

報告顯示，從AI大模型數量上看，美國2023年共發佈了61個知名AI大模型，遠超歐盟的21個和中國的15個，是全球頂級AI大模型的主要發源地。

美國在基礎模型領域也居於領先地位。在2023年，美國共發佈了109個基礎模型，是中國（20個）的5倍多。

在AI投融資方面，美國優勢也非常明顯。

2023年，美國的AI行業投資額達到672億美元，是第二大投資國中國（78億美元）的8.7倍。自2022年以來，中國和歐盟（包括英國）的AI領域私人投資分別下降了44.2%和14.1%，而美國在同一時間經歷了22.1%的顯著增長。

在2013年—2023年的十年間，美國在AI行業投資總額達到了3352億美元，中國緊隨其後，爲1037億美元。

在生成式AI私人投資中，中美差距更爲明顯。2023年，美國在生成式AI領域的投資總額爲224.6億美元，中國僅爲6.5億美元。

而從AI私人投資的細分領域來看，2023年最受歡迎的三個領域依次爲AI基礎設施/研究/治理（183億美元）、NLP和客戶支持（81億美元）、數據管理和處理（55億美元）。

其中AI基礎設施/研究/治理領域的投資由美國主導，不過在人臉識別領域，2023年中國的投資總額（1.3億美元）超過了美國（9000萬美元）。在半導體領域，中國的投資總額（6.3億美元）與美國（7.9億美元）相差無幾。

2023年，宣佈融資成功的美國AI初創企業數量爲897家，中國是122家。在過去十年時間裡（2013年—2023年），成功融資的美國AI初創企業數量是5509家，是中國（1446家）的3.8倍。

儘管美國在基礎模型研發和AI投融資活躍度上一騎絕塵，但在全球AI專利數量和工業機器人安裝量上，中國佔據了全球主導地位。

從2021年到2022年，全球AI專利授權量大幅增長了62.7%。其中，中國2022年AI專利數量佔據了全球的61.1%，遠超美國的20.9%。

中國對工業機器人的需求量在近十年內急速增長。2013年，中國工業機器人安裝量佔全球總量的20.8%，到2022年這一比例上升到了52.4%，位居全球第一。

數據顯示，2022年中國工業機器人安裝量爲29.03萬臺，是美國（3.95萬臺）的7.4倍。中國工業機器人安裝量最多的行業是電氣/電子行業，其次是汽車行業和金屬/機械行業。

截至2022年，美國在專業服務機器人制造領域處於領先地位，製造商數量爲218家，約爲中國（106家）的2.06倍。

閉源大模型性能優於開源，谷歌大模型數量居行業第一

2023年，全球相關組織發佈了149個基礎大模型，是2022年發佈數量的2倍。這些新發布的大模型中有65.7%是開源的，高於2022年的44.4%。

不過，閉源大模型的性能依然優於開源大模型。在數學推理、編碼能力、代理行爲、多語言理解均值等多項基準測試中，閉源大模型實現了24.2%的中位值性能優勢。在AgentBench 代理任務上，閉源大模型與開源大模型的性能差異高達317.7%。

根據程序員問答網站Stack Overflow統計，2023年最受專業開發人員歡迎的AI開發工具依次爲GitHub Copilot（56.04%）、Tabnine（11.74%）、AWS CodeWhisperer（4.91%）；最受歡迎的AI搜索工具依次爲ChatGPT（83.3%）、Bing AI（18.8%）、WolframAlpha（11.2%）；最受歡迎的雲平臺依次爲Amazon Web Services（53.08%）、Microsoft Azure（27.80%）、Google Cloud（23.59%）。

值得注意的是，隨着AI模型的“百花齊放”，其背後所耗用的算力正呈指數級增長。如，谷歌Gemini Ultra訓練時需要500億PetaFLOPs（1 PetaFLOP等於每秒1千萬億次浮點運算）算力，在所有知名模型中位居第一。

谷歌也是業內發佈大模型數量最多的企業。2023年，谷歌共發佈了包括Gemini和RT-2在內的18個大模型，Meta和微軟緊隨其後，分別發佈了11個和9個。

越來越多的公司利用AI賦能旗下業務。報告顯示，2023年有55%的組織使用了AI，高於2022年的50%和2017年的20%。AI應用場景主要出現在自動化聯絡中心、個性化定製內容與獲取新客戶等業務中。

此外，AI Index還做了一項關於AI態度的全球調查，調查樣本來自31個國家的22816名成年人（16歲至74 歲）。其中，超過一半的人認爲AI將改變他們的工作，而超過三分之一的人認爲AI將會取代他們。

具體來說，66%的Z世代（1995年至2009年之間出生的人）受訪者和46%的嬰兒潮一代（1946至1964年之間出生的人）受訪者認爲，AI將顯著影響他們目前的工作。與此同時，收入較高、受教育程度較高、擔任決策職務的受訪者認爲，AI會對他們的就業產生巨大影響。

分國別來看，針對“AI產品和服務是否會讓你感到緊張”這一問題，有69%的澳大利亞人和65%的英國人回答是。日本對AI產品的擔憂程度最低，爲23%。

儘管AI對就業市場的影響引發了輿論擔憂，但AI Index引述高盛在2023年發佈的一份研報指出，AI將在未來十年內使全球年度生產率增長1.0%~1.5%。

（本文首發鈦媒體App，作者｜任穎文，編輯｜林志佳）

斯坦福大學最新報告：美國 AI 基礎模型數量是中國的5倍｜鈦媒體AGI

相關資訊