☰

字節發佈豆包實時語音模型國內AI應用有望迎井噴式發展

豆包即將發佈最新實時語音大模型，並將基於此模型全量上線豆包App實時語音通話功能。目前，豆包APP已小範圍測試最新能力，部分用戶在豆包App的實時通話界面已更新。此前，業內就曾有消息稱豆包將上線最新情感語音大模型，測試效果超過GPT-4o。據瞭解，該傳言提及模型即爲上述實時語音模型。最新模型通過面向語音生成和理解進行統一建模，區別於此前的ASR+LLM+TTS級聯方式，在對話效果上有大幅提升，實時交互上不僅低延時，也能流暢打斷。

根據火山引擎2024冬季force原動力大會披露的數據，豆包大模型的日均調用量在高速增長，2024年5月豆包大模型的日均tokens調用量爲1200億，7月增長到5000億，9月達1.3萬億，截止2024年12月15日已經突破了4萬億，在7個月的時間裡增長超過33倍。中信證券表示，豆包大模型表現超預期，體現字節跳動在AI的投入形成正反饋，國內AI產業追趕海外的效果開始體現，國內龍頭公司有望加速在AI領域的投入。

據財聯社主題庫顯示，相關上市公司中：

海天瑞聲在互動平臺回覆稱，字節跳動一直以來是公司的重要客戶，公司爲其提供智能語音、計算機視覺以及自然語言等各類數據產品或服務。

樂鑫科技在投資者關係活動上表示，公司聯合推廣豆包大模型落地在IoT設備的相關應用方案。

字節發佈豆包實時語音模型 國內AI應用有望迎井噴式發展

相關資訊

字節發佈豆包實時語音模型國內AI應用有望迎井噴式發展