多款主力模型再降價 阿里雲重倉AI大基建

本報記者 李立 杭州報道

從持續推進大模型降價到全面升級AI基建,阿里巴巴正在重倉AI。

9月19日,在2024杭州雲棲大會上,阿里雲CTO周靖人宣佈阿里雲通義千問三款主力模型再次大幅降價,最高降幅85%。

針對國內大模型不斷卷價格,持續掀起價格戰的情況,周靖人在現場接受《中國經營報》等媒體記者採訪時迴應稱“不認爲是價格戰”。“相對於龐大的應用,(價格)還是太貴了。”

關於降價初衷,周靖人稱是把計算、技術的紅利讓利給企業級客戶,希望推進整個社區、產業的發展。

當天在雲棲大會上,阿里巴巴集團CEO、阿里雲智能集團董事長兼CEO吳泳銘在主題演講時也特別談到,一年來,通義千問API在阿里雲百鍊上的調用價格下降了97%,百萬Tokens調用花費最低已經降到了5毛錢。“推理成本是應用爆發的關鍵問題,阿里雲會努力把成本繼續降下去。”吳泳銘說。

降價經過深思熟慮

繼5月首次大幅降價後,阿里雲百鍊平臺上的三款通義千問主力模型再次降價,引發關注。

據現場公佈的信息,Qwen-Turbo價格直降85%,低至百萬tokens 0.3元,Qwen-Plus和Qwen-Max分別再降價80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應用於複雜任務,是效果、速度及成本均衡的優選,降價後,Qwen-Plus性價比優勢明顯,同等規模較行業價格低84%。同時,阿里雲百鍊平臺還爲所有新用戶免費贈送超5000萬tokens及4500張圖片生成額度。

“每一次降價都是一個非常嚴肅的過程。要從整個產業發展,開發者、企業用戶的反饋等各方進行權衡。”周靖人稱。

“降價主要通過技術優化。通過提升模型推理的效率,將模型推理成本進一步降下來。希望把技術紅利給到企業級用戶以及開發者。”周靖人解釋稱,需要有效推動整個AI行業的發展。只有這樣,才能更有效推廣各種各樣AI的應用。

“使用量大,才能打磨出好模型,大幅降低模型推理的單位成本。”此前火山引擎總裁譚待曾表示,大模型從以分計價到以釐計價,將助力企業以更低成本加速業務創新。業內人士認爲,面對業內百模大戰,卷價格仍是爭奪客戶和市場規模的有效利器。

據瞭解,自首次宣佈降價後,阿里雲百鍊付費客戶數較上一個季度增長超過200%,大批企業和開發者放棄私有化部署,選擇直接在百鍊上調用各類AI大模型。

談到市場具體變化,此前通義千問大模型業務總經理徐棟接受記者採訪時透露,越來越多的客戶開始放量使用模型。“一類是大模型已經改變了其原有核心商業模式的客戶,遊戲、社交、短視頻、直播、硬件廠商等,過去會糾結成本相對比較高、精度有沒有滿足等的問題;另一類是企業級客戶,開始用公共雲的方式去使用模型,垂直應用場景開始規模化應用。”

有關數據顯示,截至目前,阿里雲百鍊已服務超30萬個客戶,包括一汽、金山、獵聘、哈囉、國家天文臺等衆多知名企業和機構。阿里雲希望通過本次通義千問的第二輪降價,繼續提升AI在各行各業的滲透率。

致力於打造最強AI基建

記者在現場注意到,大模型降價只是阿里雲在AI時代競速的一個側面,阿里雲更大的決心是全面升級AI基建。

不同於傳統IT時代,AI時代對基礎設施的性能、效率要求更高,CPU主導的計算體系已快速向GPU主導的AI計算體系轉移。阿里雲正以AI爲中心,全面重構底層硬件、計算、存儲、網絡、數據庫、大數據,並與AI場景有機適配、融合,加速模型的開發和應用,打造一個AI時代的最強AI基建。

大會現場,通義大模型迎來了年度重磅發佈。據阿里雲方面介紹,基礎模型升級,性能媲美GPT-4o,發佈最強開源模型Qwen2.5系列,同時上架語言、音頻、視覺等100多款全模態模型,通義開源模型累計下載量已經突破4000萬次,通義原生模型和衍生模型總數超過5萬個,成爲僅次於美國Llama的世界級模型羣。

周靖人在現場還展示了AI驅動的阿里雲全系列產品家族升級。包括最新上線的磐久AI服務器,支持單機16卡、顯存1.5T,並提供AI算法預測GPU故障,準確率達92%;阿里雲ACS首次推出GPU容器算力,通過拓撲感知調度,實現計算親和度和性能的提升;爲AI設計的高性能網絡架構HPN7.0,可穩定連接超過10萬個GPU,模型端到端訓練性能提升10%以上等等。

談到基礎設施的不斷更新,周靖人表示,模型更新離不開基礎設施,AI技術變革是系統化的技術變革,如果沒有這個底層相關能力的支持,模型的研發、迭代等方方面面都沒有承載,兩者彼此是相輔相成、承上啓下的關係。

值得注意的是,在當天的主題演講中,吳泳銘透露,阿里雲正以前所未有的強度投入AI技術研發和基礎設施建設。“單網絡集羣已拓展至十萬卡級別,正在從芯片、服務器、網絡、存儲到散熱、供電、數據中心等方方面面,重新打造面向未來的AI先進基礎設施。”

“我們總體判斷,現在的AI相當於1996年前後的互聯網,當年的BBS時代。當時上網資費還很貴,互聯網、移動互聯網發展,運營商大力搞基建。現在我們也在瘋狂搞AI大基建,把資費降下來,纔有可能談未來應用爆發。”阿里雲副總裁張啓表示,“長遠目標纔是考慮更多的事情,而不是今天一定要算一個賬,馬上就能夠賺多少錢、到什麼樣的目標。”

(編輯:吳清 審覈:李正豪 校對:顏京寧)