☰

通義千問發佈首個千億級參數開源模型

觀點網訊：4月28日，通義千問宣佈推出1100億參數模型Qwen1.5-110B，標誌着其成爲全系列中首個達到千億級參數的開源模型。該模型繼續沿用了Qwen1.5系列的Transformer解碼器架構，並採納了分組查詢注意力方法，顯著提高了模型在推理過程中的效率。

此110B模型的一大亮點在於其能夠支持長達32K的上下文長度，並且擁有卓越的多語言處理能力。它能夠兼容包括中文、英語、法語、德語、西班牙語、俄語、日語、韓語、越南語以及阿拉伯語在內的多種語言，這一特性使其在全球化的應用場景中具有顯著優勢。

相關資訊

▣ 通義千問開源千億級參數模型
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 通義千問開源320億參數模型
▣ 阿里通義千問開源首個MoE模型
▣ 阿里通義千問Qwen2大模型發佈並同步開源
▣ 通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
▣ 百川智能發佈千億級參數的大語言模型Baichuan3
▣ 通義千問開源模型下載量突破2000萬
▣ AI早知道｜微軟發佈首個大氣AI基礎模型Aurora；崑崙萬維開源2千億稀疏大模型
▣ AI早知道｜零一萬物發佈千億參數模型；智譜AI上線大模型開放平臺
AI飛速發展陸10億級參數規模以上大模型已發佈79個
▣ 阿里雲通義千問開源
▣ vivo發佈自研藍心大模型：5款大模型覆蓋十億、百億、千億三個量級
▣ 浪潮信息發佈 “源2.0-M32” 開源大模型：對標700億參數的LLaMA3
▣ 數智早參｜蘋果推出開源大模型OpenELM；阿里雲宣佈EMO模型上線通義APP
▣ 「天工大模型3.0」4月17日正式發佈——同步開源4000億參數MoE超級模型，性能超Grok1.0
▣ 中國電信發佈全球首個單體稠密萬億參數語義模型 Tele-FLM-1T
▣ 阿里雲CTO周靖人：通義千問開源模型下載量突破2000萬次
▣ 零一萬物發佈千億參數模型李開復：行業應避免流血燒錢打法
▣ 阿里雲發佈通義千問2.5
▣ 國內首個官方大模型評測結果出爐阿里雲通義千問首批通過評測
▣ 大模型加速“上手機” 聯發科與阿里通義千問實現芯片級適配
▣ 中國電信發佈單體稠密萬億參數語義模型用了普通訓練方案9%的算力資源
參展MWC 華爲發佈通信行業首個AI大模型
▣ 剛剛，全球最強開源大模型 Llama 3 發佈：使用 15T 數據預訓練，最大模型參數將超 4000 億
▣ 英偉達開源3400億參數模型Nemotron-4 340B
▣ 智源發佈全球首個低碳萬億語言模型Tele—FLM
▣ 1760 億參數、大小 281GB，Mixtral 8x22B 開源模型登場

DMCA | PRIVACY | s@bg3.co