斯坦福大學最新報告:美國 AI 基礎模型數量是中國的5倍|鈦媒體AGI

AI在多個基準上的表現已經超越了人類,比如圖像分類、視覺推理和英語理解方面。不過在競賽級數字、視覺常識推理和規劃等更爲複雜的任務上,AI依然落後於人類。

2023年,工業界出現了51個具有影響力的機器學習大模型,而學術界只貢獻了15個。產學界也在2023年合作貢獻了21個具有影響力的大模型,數量創下歷史新高。

經估算,最先進的AI大模型訓練成本已經達到前所未有的水平。

其中,OpenAI的GPT-4訓練成本爲7800萬美元,谷歌的Gemini Ultra訓練成本爲1.91億美元。有趣的是,谷歌2017年的Transformer 模型引入了支撐當下幾乎所有大語言模型的架構,訓練費用僅爲930美元。

2023年,美國共出現了61個知名AI大模型,遠超歐盟的21個和中國的15個。

最新研究表明,負責任的AI模型嚴重缺乏標準化。OpenAI、谷歌和Anthropic這些前沿開發者們,按照不同的負責任的AI基準來測試他們的大模型,這種做法使得系統地比較頂級AI大模型的風險和侷限性的努力變得複雜。

AI Index指出,現有的AI深度僞造內容已難辨真假,尤其是政治方面的深度僞造已經影響了世界各地的選舉。

儘管2023年AI私人投資整體有所下降,但對生成式AI的投資金額猛增至252億美元,比2022年增長了近9倍。包括OpenAI、Anthropic、Hugging Face和Inflection AI等企業都獲得了一輪可觀的融資。

2023年,宣佈融資成功的生成式AI初創企業數量爲99家,相比2022年的56家增長了76.79%。

2023年,一些研究表明,AI能幫助人類更快地完成工作任務並提高他們的工作質量。此外,AI還能彌合低技能員工和高技能員工之間的技能差距。不過,也有研究警告說,在沒有適當監督的情況下使用AI會產生性能下降的現象。

2022年,AI開始推動科學發現。2023年出現了更爲重要的與科學相關的AI應用程序——提高算法分揀效率的 AlphaDev和促進材料發現過程的GNoME。

近幾年,AI在MedQA(醫療問答數據集)基準上取得了顯著改進。2023年,GPT-4 Medprompt的準確率已經達到了90.2%,比2022年的最高分提高了22.6%,相比2019年性能足足提升了2倍。

美國與AI相關的法規在過去一年甚至是過去五年都在大幅增加。2023年,美國共出臺了25項與AI相關的法規,同比增長了56.3%,而2016年只有一項。

全球市場調研機構Ipsos的一項調查顯示,去年,人們認爲AI在未來三到五年將極大地影響他們生活的比例從60%上升到了66%。此外,52%的人表示對AI產品和服務感到擔憂,比2022年上升了13個百分點。

皮尤研究中心的數據顯示,美國有52%的人表示對AI的擔憂多於興奮,這一比例高於2022年的37%。

中美AI實力比拼

在AI世界級競賽中,中國與美國是最爲矚目的兩個國家,雙方在AI的不同領域各有優勢。

報告顯示,從AI大模型數量上看,美國2023年共發佈了61個知名AI大模型,遠超歐盟的21個和中國的15個,是全球頂級AI大模型的主要發源地。

美國在基礎模型領域也居於領先地位。在2023年,美國共發佈了109個基礎模型,是中國(20個)的5倍多。

在AI投融資方面,美國優勢也非常明顯。

2023年,美國的AI行業投資額達到672億美元,是第二大投資國中國(78億美元)的8.7倍。自2022年以來,中國和歐盟(包括英國)的AI領域私人投資分別下降了44.2%和14.1%,而美國在同一時間經歷了22.1%的顯著增長。

在2013年—2023年的十年間,美國在AI行業投資總額達到了3352億美元,中國緊隨其後,爲1037億美元。

在生成式AI私人投資中,中美差距更爲明顯。2023年,美國在生成式AI領域的投資總額爲224.6億美元,中國僅爲6.5億美元。

而從AI私人投資的細分領域來看,2023年最受歡迎的三個領域依次爲AI基礎設施/研究/治理(183億美元)、NLP和客戶支持(81億美元)、數據管理和處理(55億美元)。

其中AI基礎設施/研究/治理領域的投資由美國主導,不過在人臉識別領域,2023年中國的投資總額(1.3億美元)超過了美國(9000萬美元)。在半導體領域,中國的投資總額(6.3億美元)與美國(7.9億美元)相差無幾。

2023年,宣佈融資成功的美國AI初創企業數量爲897家,中國是122家。在過去十年時間裡(2013年—2023年),成功融資的美國AI初創企業數量是5509家,是中國(1446家)的3.8倍。

儘管美國在基礎模型研發和AI投融資活躍度上一騎絕塵,但在全球AI專利數量和工業機器人安裝量上,中國佔據了全球主導地位。

從2021年到2022年,全球AI專利授權量大幅增長了62.7%。其中,中國2022年AI專利數量佔據了全球的61.1%,遠超美國的20.9%。

中國對工業機器人的需求量在近十年內急速增長。2013年,中國工業機器人安裝量佔全球總量的20.8%,到2022年這一比例上升到了52.4%,位居全球第一。

數據顯示,2022年中國工業機器人安裝量爲29.03萬臺,是美國(3.95萬臺)的7.4倍。中國工業機器人安裝量最多的行業是電氣/電子行業,其次是汽車行業和金屬/機械行業。

截至2022年,美國在專業服務機器人制造領域處於領先地位,製造商數量爲218家,約爲中國(106家)的2.06倍。

閉源大模型性能優於開源,谷歌大模型數量居行業第一

2023年,全球相關組織發佈了149個基礎大模型,是2022年發佈數量的2倍。這些新發布的大模型中有65.7%是開源的,高於2022年的44.4%。

不過,閉源大模型的性能依然優於開源大模型。在數學推理、編碼能力、代理行爲、多語言理解均值等多項基準測試中,閉源大模型實現了24.2%的中位值性能優勢。在AgentBench 代理任務上,閉源大模型與開源大模型的性能差異高達317.7%。

根據程序員問答網站Stack Overflow統計,2023年最受專業開發人員歡迎的AI開發工具依次爲GitHub Copilot(56.04%)、Tabnine(11.74%)、AWS CodeWhisperer(4.91%);最受歡迎的AI搜索工具依次爲ChatGPT(83.3%)、Bing AI(18.8%)、WolframAlpha(11.2%);最受歡迎的雲平臺依次爲Amazon Web Services(53.08%)、Microsoft Azure(27.80%)、Google Cloud(23.59%)。

值得注意的是,隨着AI模型的“百花齊放”,其背後所耗用的算力正呈指數級增長。如,谷歌Gemini Ultra訓練時需要500億PetaFLOPs(1 PetaFLOP等於每秒1千萬億次浮點運算)算力,在所有知名模型中位居第一。

谷歌也是業內發佈大模型數量最多的企業。2023年,谷歌共發佈了包括Gemini和RT-2在內的18個大模型,Meta和微軟緊隨其後,分別發佈了11個和9個。

越來越多的公司利用AI賦能旗下業務。報告顯示,2023年有55%的組織使用了AI,高於2022年的50%和2017年的20%。AI應用場景主要出現在自動化聯絡中心、個性化定製內容與獲取新客戶等業務中。

此外,AI Index還做了一項關於AI態度的全球調查,調查樣本來自31個國家的22816名成年人(16歲至74 歲)。其中,超過一半的人認爲AI將改變他們的工作,而超過三分之一的人認爲AI將會取代他們。

具體來說,66%的Z世代(1995年至2009年之間出生的人)受訪者和46%的嬰兒潮一代(1946至1964年之間出生的人)受訪者認爲,AI將顯著影響他們目前的工作。與此同時,收入較高、受教育程度較高、擔任決策職務的受訪者認爲,AI會對他們的就業產生巨大影響。

分國別來看,針對“AI產品和服務是否會讓你感到緊張”這一問題,有69%的澳大利亞人和65%的英國人回答是。日本對AI產品的擔憂程度最低,爲23%。

儘管AI對就業市場的影響引發了輿論擔憂,但AI Index引述高盛在2023年發佈的一份研報指出,AI將在未來十年內使全球年度生產率增長1.0%~1.5%。

(本文首發鈦媒體App,作者|任穎文,編輯|林志佳)