性能堪比GPT-4o,DeepSeek-V3刷屏了!算力行業迎來機遇期

來源:光大證券微資訊

根據深度求索官方消息,12月26日,公司全新系列模型DeepSeek-V3重磅發佈並同步開源。

根據專業測評報告,DeepSeek-V3在能力上已經與GPT-4o以及Claude-3.5-Sonnet等主流大模型不相上下,但在訓練成本及訓練效率方面展現出了明顯的優勢。深度求索用了兩個月的時間,花費約558萬美元,實現了較高的訓練效率。

隨着國內AI大模型進一步發展,尤其是AI消費電子產品逐漸成爲熱點,算力產業鏈有望迎來機遇。

1、DeepSeek-V3首個版本正式發佈,AI大模型再成焦點

12月以來,AI行業持續迎來重磅事件,前有OpenAI發佈完全版o1模型、蘋果在國內尋找大模型供應商,後有深度求索(DeepSeek)正式上線並開源全新系列模型 DeepSeek-V3。

儘管深度求索此前並未被市場廣泛關注,但是DeepSeek-V3的綜合表現已經與多個主流AI大模型不相上下。

根據深度求索官方發佈的信息,DeepSeek-V3採用了混合專家架構(MoE),該架構包含了256個專家,每次推理將動態選擇前8個專家來參加計算,這可以提升計算效率。

我們試用了DeepSeek-V3,大模型應答速度較快,並提供了深度思考和聯網搜索兩種模式,任務處理能力較好。

DeepSeek-V3大模型總參數量高達6850億,每次推理將激活370億參數。DeepSeek-V3在14.8萬億token上進行了預訓練,整體訓練效率極高,這顯著降低了訓練成本。

根據DeepSeek透露的數據,DeepSeek-V3大模型訓練僅用了約兩個月的時間,成本約爲558萬美元。

DeepSeek爲大模型訓練打造了一條高速通道,這背後就有很多創新的技術。在框架方面,DeepSeek打造了HAI-LLM框架,可以實現16路流水線、64路專家模塊並行,還創新使用多令牌預測(MTP)。通過設立了MTP訓練目標,DeepSeek突破了傳統大模型訓練的束縛。再加上監督微調與強化學習兩個階段深入的打磨,DeepSeek-V3進一步提升了能力。

根據官方公佈的測評結果,DeepSeek-V3在多項測評均優於Llama-3.1-405B等開源大模型,在性能上已經媲美GPT-4o以及Claude-3.5-Sonnet等主流大模型。

獨立評測網站Artificial Analysis認爲,DeepSeek-V3質量指數達到80,優於平均水平。在價格方面,DeepSeek-V3更具有優勢,每百萬個Token的價格爲0.48美元。

隨着DeepSeek-V3等低成本、高效率大模型展現了強大的競爭力,未來AI大模型將進一步賦能更多的行業。

2、AI應用和AI消費電子產品發展迅速,算力行業迎來機遇

此前國內獨角獸企業智譜AI憑藉出色的智能體AutoGLM,獲得了市場高度關注。用戶只需要對手機說話,便可以實現網絡購物、訂購火車票、點外賣、發微信、搶紅包等功能,公司也已經獲得了淘寶、微信、美團等APP的授權。

智譜AI已經與國內手機廠商展開了深入的合作,其中就包括榮耀。早在今年9月,榮耀CEO趙明便表示,榮耀Magic7將是首款中國消費者可以體驗AI Agent的手機。榮耀此前發佈個人化全場景AI操作系統MagicOS 9.0,宣佈將YOYO助理升級爲智能體,具備“自然語義理解和計算機視覺”、“用戶行爲習慣學習和場景環境感知”、“意圖識別及決策能力”、“應用內及跨應用操作”四大核心能力。

根據界面新聞的報道,蘋果將在中國銷售的iPhone中接入本土AI大模型,目前與騰訊和字節跳動進行洽談。此前財經媒體報道,蘋果與百度達成合作協議,計劃在2025年推出生成式人工智能服務,雙方有望在端側小模型及雲端大模型展開合作。

蘋果接洽騰訊、字節跳動的消息,瞬間成爲資本市場焦點。衆所周知,騰訊和字節跳動均在人工智能大模型領域擁有深厚的技術積累,分別推出了混元大模型和豆包大模型。在2024火山引擎FORCE原動力大會上,字節跳動升級了豆包大模型產品,發佈了視覺理解模型,視覺生成模型也將在2025年1月對外開放。

蘋果近期加速了AI功能落地,這也成爲9月發佈的iPhone 16最強殺手鐗。美國當地時間10月28日,蘋果公司在美國正式推送iOS 18.1正式版,Apple Intelligence集成在iOS 18.1。同時iPadOS 18.1和macOS Sequoia 15.1也對外推送,符合條件的用戶將在iPad、Mac上使用蘋果AI。

隨着AI應用及AI消費電子產品不斷髮展,算力產業鏈將迎來機遇期。

根據iFinD金融數據終端,算力概念股包括:工業富聯、寒武紀、中興通訊、海光信息、科大訊飛、中科曙光、中國移動、光啓技術、紫光股份、浪潮信息、中國能建、寶信軟件、崑崙萬維、中國長城、軟通動力、龍芯中科等。

(本文首發於2024年12月30日)

本文源自:券商研報精選