再逐硬件夢 字節跳動入局AI耳機

本報記者 李靜 北京報道

字節跳動借力大模型,正式殺入AI智能硬件市場。

近日,字節跳動旗下豆包發佈了首款 AI 智能體耳機 Ola Friend。介紹顯示,該款耳機接入豆包大模型,並與豆包App深度結合。用戶戴上耳機後,無須打開手機,便能通過語音喚起豆包進行對話。

自ChatGPT於2022年11月30日正式發佈後,國內大模型市場在近兩年也是風起雲涌,衆多企業紛紛投入研發,力求在這個新興市場中佔據一席之地。目前,國內已經有很多基礎大模型、垂類大模型,在B端市場,大模型逐步融入日常業務和工作流程中,加速賦能醫療、金融、製造等各個行業;在C端市場,聊天機器人、搜索、內容生成類應用逐漸普及。

其實,大模型除了在軟件應用方面快速發展之外,不少企業也在探索大模型和硬件的結合。

一些PC廠商已經推出了AI PC產品,手機廠商們也在研發AI手機,還有不少企業在探索AI和可穿戴設備的結合。去年年底,Meta發佈內置Llama大模型的智能眼鏡Ray-Ban Meta。蘋果、Midjourney等公司也在探索頭顯與AI的結合。國內市場,科大訊飛已經發布了幾款AI耳機。

對於此次發佈的首款AI智能體耳機Ola Friend,豆包相關負責人表示:“這款耳機是豆包在AI場景的一個探索和嘗試,希望Ola Friend能成爲隨時陪伴用戶耳邊的朋友。豆包的各種能力也會在後續持續迭代,爲用戶在生活中各個場景提供幫助。”

耳機如何AI?

從啓動耳機的AI功能來看,傳統的大模型AI對話產品,用戶往往需要藉助手機或者電腦進行輸入。而字節跳動此次發佈的AI智能體耳機Ola Friend,用戶在佩戴Ola Friend耳機後,只需直接觸摸耳機或者說出喚醒詞“豆包豆包”,就能夠通過語音,調用手機上的豆包App進行交流。

豆包相關負責人介紹,在耳機用戶測試中,不少用戶反饋,由於Ola Friend非常輕便,佩戴舒適,在接入豆包後又擁有了通用智能,因此在旅遊、英語學習、聊天等場景中體驗不錯。比如遊覽博物館、藝術館時,用戶可以向它詢問展品、藝術品的由來及背景,它還能延展至朝代變遷、藝術家理念等話題,一定程度上充當了導遊角色,非常便捷。此外,針對一些“突發奇想”的閒聊和情緒表達,比如“有個重要的演講,我有點緊張怎麼辦?”“剛吃到了八寶飯,好像回到了小時候”,它的回覆也非常親切。

此外,Ola Friend還做了一些優化,讓用戶能夠像和朋友聊天一樣與AI交流。耳機裡,豆包說話的語氣能夠表現出高興、意外等情緒。並且,用戶在溝通時可以“邊聽邊說、隨時打斷”,還能隨時切換話題。

據介紹,相比智能音箱等產品,耳機的使用環境更加複雜。爲做好語音識別,Ola Friend耳機接入了字節豆包大模型的Seed-ASR(語音識別)技術模型,該模型可以高精度識別中英文、口音,甚至能通過上下文,“聰明”地識別各類信息。

從Ola Friend耳機整體的AI功能來看,更偏向於消費者個人生活場景下進行使用。今年4月,智能聲學品牌Cleer也發佈了全球首款開放式AI耳機CleerARC3音弧,面向的也是消費者的個人生活場景,耳機中內置了AI運動算法,可幫助用戶實時監控運動生理數據;在交互上集成了出門問問的語音控制技術,升級了AI語音控制,無須提示詞喚醒語音助手,使用“下一首”“接聽電話”等快捷口令即可進行相應操作;另外還實現了AI降噪效果。

科大訊飛近兩年推出的AI耳機,則主要面向個人消費者的辦公場景。在2023年和2024年,科大訊飛連續推出了具備實時轉錄、多語言轉寫、文本處理的數款AI會議耳機。

從價格上來看,無論是字節跳動的Ola Friend耳機,還是Cleer ARC3,以及科大訊飛的AI耳機,定價都在1000元以上,屬於中高端產品。

IDC中國研究總監潘雪菲對記者表示:“AI大模型和耳機的結合目前主要帶動的是藍牙耳機的中高端市場發展,如果通過具體場景的有效切入,是能夠找到並且觸達目標用戶人羣和解決一定痛點的。”

爲什麼從耳機入局?

隨着AI大模型的發展,加上AMD、英特爾、高通、聯發科等陸續發佈終端AI芯片,AI的發展轉向硬件+軟件並行驅動,衆多廠商紛紛探索AI與硬件設備的結合。

在PC側,聯想、惠普、戴爾等品牌的AI PC正在陸續出貨。在手機側,三星Galaxy S24系列和小米14等旗艦機型都集成了AI功能,如通話即時翻譯、AI拍照等。在可穿戴硬件設備側,去年年底,Meta發佈內置Llama大模型的智能眼鏡Ray-Ban Meta,不久前,美國智能眼鏡公司Solos稱將推出全球首款集成GPT-4o的智能眼鏡AirGo Vision,蘋果、Midjourney等公司也在探索頭顯與AI的結合;另外還有前文提到的AI耳機等。

從產品上可以看到,生產AI PC和AI手機的主力軍仍然是傳統的PC廠商和手機廠商,而像Meta、字節跳動等互聯網廠商則更多地集中在AI可穿戴設備領域。

爲什麼字節跳動豆包大模型會選擇以AI耳機作爲切入口?

西南證券研究發展中心的報告中指出,相較於PC、手機和VR/AR頭顯等端側設備,耳機在邊緣側AI終端中的便攜性優勢明顯。目前耳機主要通過藍牙連接,需要藉助手機或PC連接至雲端進行交互。在未來,耳機可能會向Wi-Fi連接發展,將可以隨時隨地地訪問邊緣側AI大模型。

從增量市場的角度來看,藍牙耳機的增量市場較PC和手機相對也多一些。華鑫證券報告指出,2023年智能手機出貨量同比下滑3.3%,分季度來看,全球智能手機出貨量在2023年前三季度同降幅逐季收窄,2023年四季度同比變動轉正。背後的原因來自兩個方面,一方面是手機硬件缺乏創新,發達經濟體以及中國5G週期結束後,消費者換機週期拉長;另一方面,2022年之後,消費者需求疲軟。

而無線耳機方面,根據海關出口數據顯示,2023年以來呈現復甦趨勢,全年自2023年2月以來,無線耳機月度出貨量同比增幅持續爲正,且自2023年9月以來同比增幅持續擴大。

“因爲無線耳機技術已經充分成熟,相對於手機消費,無線耳機普及還有空間,隨着無線耳機傳感器的增多,產品體驗感會更加出色,疊加價值量相對手機較小,換機週期會顯著快於手機。”華鑫證券認爲,隨着國內的開放和經濟復甦,繼續看好無線耳機類可穿戴設備的成長。

“隨着消費者對智能化服務的需求不斷增加,AI耳機作爲一種新興的智能硬件產品,市場需求旺盛。國內大模型廠商通過推出AI耳機,可以滿足市場需求並拓展新的市場空間。”北京社科院副研究員王鵬還對記者指出,相對於其他可穿戴設備或硬件設備而言,我國在耳機上的技術成熟度較高、產業鏈完整。國內大模型廠商在AI技術方面積累了豐富的經驗,可以將AI技術與耳機硬件相結合,打造出具有競爭力的AI耳機產品。

字節跳動的硬件夢

互聯網大廠或多或少都有一些做硬件的夢想,字節跳動也不例外。雖然字節跳動旗下已經有今日頭條、抖音、飛書等知名軟件產品,但至今還沒有比較有市場佔有率的硬件產品。

2018年年底,字節跳動以上億元的價格收購錘子科技手機業務和部分專利使用權,並組建了新石實驗室,由錘子科技堅果前手機負責人吳德周擔任總裁。收購後,新石實驗室發佈了兩代堅果手機、TNT顯示器新品以及音箱等周邊產品。

2020年,字節跳動成立“大力教育”品牌,開始佈局教育場景下的檯燈產品。到了2021年1月,新石實驗室被併入教育硬件團隊,放棄手機業務,聚集教育硬件。這背後的原因,一方面是當時手機市場的集中度進一步提高,另一方面是受疫情和在線教育爆發影響,教育硬件的市場規模正在擴大。當時據多鯨資本教育研究院預測,到2022年,僅K12智能教育硬件的市場規模就可能達到570億元。

可惜的是,2022年8月,由於受到國家“雙減”政策和“三孩”政策的影響,大力教育開始裁員,部分人員轉崗或投入新項目。字節跳動的教育硬件產品也被擱置了下來。

2021 年9月,字節跳動還以90億元的價格收購頭顯廠商Pico。儘管字節跳動對Pico寄予厚望,併爲其投入了大量資金,但Pico的市場表現並未達到預期。2023年,字節跳動對Pico進行了組織架構調整,大幅裁員,並下調了銷售預期。Pico仍在繼續推出新產品,例如2024年發佈的PICO 4 Ultra MR混合現實一體機。但整體來看,Pico在字節跳動的戰略中已經逐漸邊緣化。

如今,字節跳動在硬件上的探索,更多地放在了AI領域。據瞭解,字節跳動AI硬件方向的探索,在內部分爲兩條產品線:一條產品線代號爲“D線”,重點偏向帶有AI能力的可穿戴設備;另一條產品線爲“O線”,重點是研究手持類AI硬件設備。手持類設備還沒有成型的形態出來。

目前,定位於中高端市場的Ola Friend智能體耳機已經上線各大電商平臺,從10月17日開始正式發貨,售價爲1199元。目前,在京東平臺,Ola Friend京東自營旗艦店的耳機銷量已經有500多;在天貓平臺,Ola Friend智能體耳機銷量已經有1000多,且位於天貓榜單300元以上骨傳導耳機熱銷榜第2名。未來能否獲得更多消費者的喜歡,仍然有待觀察。

潘雪菲對記者指出:“目前大模型和硬件的結合,仍然以接入形式爲主,如果要做到端側,一方面在體積和人體工學設計上對芯片體積和空間設計要求較高,另一方面對電池體積和續航能力要求也極高,目前這些方面仍然面臨較大的挑戰。”

(編輯:張靖超 審覈:李正豪 校對:翟軍)