2024 AI年度報告發布,附十大預測:人形機器人熱度下降,英偉達維持霸主地位

新智元報道

編輯:LRS

【新智元導讀】AI技術日新月異,像Netflix這樣的大公司已經開始用AI製作特效,而新的AI模型也在遊戲和科學研究中超越了人類。未來一年,我們可能會看到沒有編程技能的人也能創造熱門應用,甚至AI創作的歌曲也可能登上音樂排行榜前十。

AI發展之勢迅猛,從技術、政策到產品風險,相比從前都有了很大變化。

最近,State of AI發佈了2024產業報告,也是調研團隊發佈的第七份年度報告,從研究進展、行業局勢、現有政策、安全問題、未來預測等角度出發,對人工智能行業的現狀和預期進行了深度分析。

報告鏈接:https://docs.google.com/presentation/d/1GmZmoWOa2O92BPrncRcTKa15xvQGhq7g4I4hJSNlC0M/edit?usp=sharing

報告主要關注以下內容:

1. 前沿實驗室的性能開始趨同,專有模型的優勢逐漸消失,GPT-4與其他模型之間的差距正在縮小。OpenAI的o1模型再次讓實驗室在排行榜上名列前茅,但還能持續多久呢?

2. 規劃和推理在大型語言模型(LLM)研究中佔據了優先地位,各公司正在探索將LLM與強化學習、進化算法和自我改進相結合,以解鎖未來的智能體應用。

3. 基礎模型展示了它們突破語言的能力,支持跨數學、生物學、基因組學、物理科學和神經科學的多模態研究。

4. 美國對中國實驗室實施的制裁對其生產高性能模型的能力影響有限,因爲庫存、獲批硬件、走私和雲訪問的結合使國內能夠構建高性能的(V)LLM,但國內的半導體產業發展仍然較爲混亂。

5. 因爲上市公司經歷了人工智能曝光的牛市,人工智能公司的企業價值已達到9萬億美元。對私營人工智能公司的投資也有所增加,但儘管美國出現了GenAI鉅額融資,增幅卻小了一個數量級。

6. 一些人工智能公司開始產生可觀的收入,包括基礎模型構建者和從事視頻和音頻生成的初創公司。然而,隨着模型作爲企業搶佔市場的一部分而變得更便宜,圍繞長期可持續性的疑問仍未得到解答。

7. 僞收購成爲人工智能公司的一條出路,因爲一些公司難以找到可行的商業模式,因爲保持技術領先的成本很高。

8. OpenAI未遂的政變之後,關於存在風險的討論已經降溫。然而,研究人員一直在深化人們對潛在模型漏洞和濫用的瞭解,並提出了可能的修復措施和保障措施。

研究進展

1. 前沿實驗室的性能正在趨同,但OpenAI在推出o1後保持了其領先地位,規劃和推理成爲主要的研究前沿。

2. 基礎模型展示了它們超越語言的能力,多模態研究推動了數學、生物學、基因組學、物理科學和神經科學的發展。

3. 美國的制裁並沒有阻止中國的大型語言模型(V)LLM在社區排行榜上的崛起。

行業局勢

1. 英偉達(NVIDIA)仍是全球最強大的公司之一,享受着市值達到3萬億美元的輝煌時刻,而監管機構也正在調查生成式人工智能(GenAI)內部的權力集中問題。

2. 更成熟的GenAI公司帶來了數十億美元的收入,而初創公司開始在視頻和音頻生成等領域獲得關注。儘管公司開始從模型轉向產品,但圍繞定價和可持續性長期問題仍未解決。

3. 在公開市場的牛市推動下,人工智能公司的市值達到了9萬億美元,而私營公司的投資水平也在健康增長。

現有政策

1. 雖然全球治理努力陷入僵局,但國家和地區的人工智能監管繼續推進,美國和歐盟通過了幾份有爭議的立法法案。

2. 計算需求的現實迫使大型科技公司面對擴張的現實世界物理限制和排放目標。與此同時,政府自身在建設能力方面的嘗試仍在落後。

3. 預期人工智能對選舉、就業和其他敏感領域的影響尚未實現。

安全問題

1. 隨着之前警告我們人類滅絕即將到來的公司需要增加企業銷售和消費者應用程序的使用,從安全轉向加速的氛圍發生了變化。

2. 世界各地的政府模仿英國在人工智能安全方面建立國家能力,成立研究所並研究關鍵國家基礎設施的潛在漏洞。

3. 每一個提出的破解「修復」方案都失敗了,研究人員開始關注更復雜、長期的攻擊。

2025十大預測

預測覆蓋了人工智能領域的各個方面,從大型投資到無代碼應用的興起,再到數據隱私和人工智能法規的實施,甚至還涉及了開源技術的競爭、市場領導者的挑戰、人形機器人的發展趨勢。

1. 一個主權國家向美國的大型人工智能實驗室投資超過100億美元,引發國家安全審查。

2. 一個完全沒有編碼能力的人創建的應用或網站走紅,比如進入蘋果應用商店前100名。

3. 前沿實驗室在案件開始審判後,對數據收集的實踐方式發生了重大轉變。

4. 早期歐盟人工智能法案的實施結果比預期的要寬鬆,立法者可能會擔心他們做得太過分了。

5. 開源的OpenAI o1替代品在一系列推理基準測試中實現超越。

6. 挑戰者未能在英偉達的市場地位上取得任何有意義的突破。

7. 由於公司難以實現產品市場契合,對人形機器人的投資水平將下降。

8. 蘋果在設備上的研究取得了強勁的成果,加速了圍繞個人設備上人工智能的勢頭。

9. 由人工智能科學家生成的研究論文被一個主要的機器學習會議或研討會接受。

10. 一個以「生成式人工智能」爲元素互動的視頻遊戲將會取得突破性地位。

2023年度報告預測結果

正確預測

1. 好萊塢級別的製作公司開始使用生成式人工智能來製作視覺特效。

證據:雖然大部分效果還不理想,但生成式人工智能視覺特效已經在Netflix和HBO的作品中出現。

2. 美國聯邦貿易委員會(FTC)或英國競爭與市場管理局(CMA)基於競爭理由調查微軟/OpenAI的交易。

證據:兩個監管機構都在調查合作伙伴關係。

3. 在全球人工智能治理方面,進展非常有限,會超出高層次的主動承諾(high-level voluntary commitments)。

證據:是的,來自布萊切利和首爾峰會的承諾仍然是自願和高層次的。

4. 一首由人工智能創作的歌曲進入公告牌Hot 100前10名或Spotify 2024年熱門榜單。

證據:歌曲「Heart on My Sleeve」就是例子,也可以看到一首由人工智能創作的歌曲在德國中位列第27名,並保持了幾天。

5. 隨着推理工作負載和成本的顯著增長,一家大型人工智能公司(例如OpenAI)收購或建立了一個專注於推理的人工智能芯片公司。

證據:據報道Sam Altman正在籌集大量資金來實現,而谷歌、亞馬遜、Meta和微軟等公司也在繼續構建和改進他們自己的人工智能芯片。

錯誤預測

1. 有生成式人工智能媒體公司因其在2024年美國選舉期間的濫用行爲受到調查。

解釋:目前還沒有,但讓子彈飛一會。

2. 自我改進的人工智能智能體在複雜環境中(例如AAA級遊戲、工具使用、科學探索)超越了現有技術的最高水平。

解釋:還沒有,儘管在開放性方面有一些比較有前景的工作,如在遊戲上的強勁表現。

3. 科技IPO市場解凍,至少看到一家以人工智能爲重點的公司上市(例如DBRX)。

解釋:雖然the Magnificent Seven公司已經獲得了強勁的增長,但私營公司仍在等待市場穩定;人工智能芯片公司Cerebras已經申請IPO。

4. 在生成式人工智能的擴展熱潮中,有一個團隊花費超過10億美元來訓練一個大規模模型。

解釋:還沒有完全達到,可以等明年再看看。

5. 金融機構推出GPU債務基金,以取代風險投資股權美元用於計算資金。

解釋:還沒有,一些風險投資基金傳聞提供GPU以換取股權,但還沒見過有人走上債務路線。

參考資料:

https://x.com/nathanbenaich/status/1844263448831758767

https://www.stateof.ai/