字節發佈豆包實時語音模型 國內AI應用有望迎井噴式發展

豆包即將發佈最新實時語音大模型,並將基於此模型全量上線豆包App實時語音通話功能。目前,豆包APP已小範圍測試最新能力,部分用戶在豆包App的實時通話界面已更新。此前,業內就曾有消息稱豆包將上線最新情感語音大模型,測試效果超過GPT-4o。據瞭解,該傳言提及模型即爲上述實時語音模型。最新模型通過面向語音生成和理解進行統一建模,區別於此前的ASR+LLM+TTS級聯方式,在對話效果上有大幅提升,實時交互上不僅低延時,也能流暢打斷。

根據火山引擎2024冬季force原動力大會披露的數據,豆包大模型的日均調用量在高速增長,2024年5月豆包大模型的日均tokens調用量爲1200億,7月增長到5000億,9月達1.3萬億,截止2024年12月15日已經突破了4萬億,在7個月的時間裡增長超過33倍。中信證券表示,豆包大模型表現超預期,體現字節跳動在AI的投入形成正反饋,國內AI產業追趕海外的效果開始體現,國內龍頭公司有望加速在AI領域的投入。

據財聯社主題庫顯示,相關上市公司中:

海天瑞聲在互動平臺回覆稱,字節跳動一直以來是公司的重要客戶,公司爲其提供智能語音、計算機視覺以及自然語言等各類數據產品或服務。

樂鑫科技在投資者關係活動上表示,公司聯合推廣豆包大模型落地在IoT設備的相關應用方案。