手機 AI 2.0 時代,OriginOS 5 找到了哪些「成功密碼」?
提供最豐富功能的同時,減少用戶負擔,保持高效,是未來智能手機系統「好用」的關鍵。
作者 | Jesse編輯| 靖宇
手機 AI 浪潮的 2.0 時代來了。
自去年安卓廠商紛紛接入大模型,推出第一批主打AI 功能的手機之後,手機與 AI 的融合進程就切換到了快車道。上個月,蘋果甚至在 AI 功能還未正式推出時,就將它作爲 iPhone 16 的主打功能進行宣傳,足見競爭形勢的激烈。而現在,安卓陣營這邊的第二代手機 AI 產品也紛紛蓄勢待發。
必須承認,要將 AI 大模型能力融入手機,廠商所面臨的問題依然嚴峻。這裡並不完全是模型性能的問題,而更在於產品設計。當下「AI + 手機」產品的自動化、便捷化的程度不足,相關功能滲透率依然不高,遠沒有「出圈」。
想要打造真正好用的「手機 AI 」,不只是要做出好的 AI 功能,而是要從系統層出發,對系統內整體的交互邏輯進行重構,使它變得更智能。
2024 vivo 開發者大會上,vivo 推出煥新升級的 OriginOS 5。這代新系統不只是 AI 功能更強大、更智慧,系統全局的各項能力也都再次迭代。vivo 的目標,是讓 OriginOS 成爲 AI 時代最好用的手機系統。
01
以「便捷」爲核心的設計
過去一年,大部分手機廠商做AI 功能的思路,都是先圍繞「聊天」式的交互展開。
以「聊天」爲起點很合理,因爲「智能語音助手」已經是手機上存在了十年以上的功能,AI 大模型的應用落地也是從 ChatGPT 等「聊天機器人」開始的。
問題也正出在這裡。對普通用戶來說,要完整地組織語言發出一條指令,編寫一條prompt,是一個成本很高的行爲。智能手機相比 ChatGPT 這種沒有任何數據基礎的 AI 應用,最大的優勢在於,很多數據其實已經在手機上了,不應該再讓用戶手動輸入。
但在這個過程中,也有兩個問題要解決。一是要將 App 內各種各樣的數據轉化爲 AI 能夠理解的格式,其次則是在授權的層面要做出清晰界定,防止隱私泄漏和數據污染的問題。
這就是 OriginOS 5 最核心的 AI 功能升級,Jovi 語音助手與「藍心小 V」深度融合,藍心小 V 不再是一個單純的語音助手,而是擁有了更全面的功能。用戶現在可以長按導航條喚醒藍心小 V,喚醒之後,不只是可以語音、文字輸入指令,而是可以直接框選當前屏幕上的內容,輸入給藍心小 V,進行搜索等後續處理。
這一設計非常巧妙,因爲大部分時候我們想要搜索、處理,就是我們眼前正在看到的內容,通過「圈搜」的方式,最大程度降低了輸入的負擔,也避免了 App 適配和兼容的問題,可以覆蓋手機內一切場景,還保證了隱私的邊界。
小 V 圈搜的用法覆蓋了各種場景。比如看到一篇小紅書筆記,可以圈搜圖片上人物的相關資料、相關商品;圈出一段聊天記錄、機票火車票訂單來創建日程;截取一段電子書、文章、工作材料進行翻譯、生成一篇備忘筆記……
更重要的是,用戶在框選內容之後,依然可以主動輸入指令,進行各種不同的處理,而如果這個「視覺識別」的邏輯拓寬到攝像頭,用戶可以拍攝現實中的任何內容輸入給 AI,進一步將藍心小 V 的可能性拓寬到無限大。 這個功能在目前已在 OriginOS 5 裡落地,是以「vivo 看見」的形式存在,主要聚焦於視障人羣,幫助他們理解周圍的環境。 藉助 AI 大模型的理解、檢索、生成能力,這個功能的外沿還有被進一步拓寬的空間。
基於同樣的「讀屏」邏輯,vivo 還對輸入法進行了優化,推出了小 V 寫作功能。在各種聊天界面、電商評價、朋友圈發佈界面,都可以基於當前手機屏上顯示的內容,自動生成內容,輔助用戶進行文字編寫。
這一切都並不是模型層面的革命,而是單純的產品創新。但它帶來的體驗優化顯而易見。想通過 AI 助手 App 實現類似的「智能回覆聊天」功能,用戶需要在聊天界面截圖、裁切,在 AI App 裡編寫 prompt,得到迴應,再將回應的內容複製到聊天框,而現在則只需要點擊按鈕就可以實現。
除了讀屏之外,OriginOS 5 還加強了各種場景下,多模態數據的「自動處理轉換」能力。 新的小 V 電話助手、小 V 幫記可以將電話、線上會議的音頻實時轉成文字,顯示字幕,並進一步實現「智能生成摘要」、「同聲傳譯」等功能。 這個功能的用法已經很成熟,我們今天大部分電話會議都會有錄音,以及轉寫的文字版。 但在手機系統內植入這一功能的最大優勢在於,它可以將不同協作平臺、不同場景下的電話、會議記錄集合到一起,更易於管理。
大模型AI 是一個覆蓋面極爲廣泛,但也因此很抽象的技術,難以進行具體的功能定義。大部分廠商,都把這個問題化作一個開放的輸入框,丟給用戶去思考。最終導致了 AI 產品的邏輯並不複雜,就是一個聊天界面,但用戶實際依然不知道它有什麼用,要怎麼用。
可以說,OriginOS 5 開啓了一次「便捷化」革命,將手機上的數據,送到離 AI 大模型接口更近的地方,方便用戶更容易觸達。這是 AI 2.0 時代最重要的主題。
02
幫AI建立「長期記憶」
除便捷化之外,當下所有大模型AI 產品,面臨的另一大難題是「記憶」:幾乎所有大模型產品,都無法對用戶進行深入瞭解。在和用戶對話的過程中,之前內容的權重會被迅速稀釋。也就是說,AI 特別「健忘」,很多時候用戶要重複輸入同一指令,來保證 AI 還記得之前的要求。
對手機來說,問題也是類似的。我們進入移動互聯網時代已經超過十年了,很多人手機上、雲端儲存的,是十年跨度的數據,這些數據淤積在手機裡,檢索起來變得非常困難。
這裡最典型的場景是相冊。很多人相冊裡都儲存了上萬張照片,要從中迅速找到一張特定的老照片,變得非常困難。所以過去幾年每個手機廠商都在做相冊的自然語言檢索,依據位置、人物等等標籤進行分類……
但在相冊之外,如何讓手機真正成爲我們的「人生數據庫、回憶錄」,依然是一個更大的問題,而這又恰好是大模型 AI 能夠發揮作用的一個場景。
vivo在 OriginOS 5 的相冊里加入了「時光剪影」功能,不只是幫用戶迅速找到想要的照片,而是對照片進行二次組織、加工。它可以自動篩選出一段時間裡的照片,通過大模型理解這段回憶,進行智能剪輯、配文、配樂,其中還新增了支持生成 AI 人聲音樂的功能。
這是全行業的大趨勢。過去我們在計算機上處理的數據都是「文件」,是以「數據庫」的邏輯進行組織的。但在智能手機時代,這些數據是我們自己拍的照片、寫的筆記、與他人聊天的記錄,是非常具體的經歷和回憶,完全可以用一種更貼合人腦思維的方式,以富文本、視頻的形式,進行多模態的組織。
在 OriginOS 5上,最能體現這一思路的功能是「小 V 記憶」。功能上,目前小 V 記憶很像一個「日記本」,能夠把不同模態的數據整合在一起,以類似手帳的方式呈現出來,其中包括圖片、視頻、文本、網頁……
而在「小 V 記憶」的「圖譜」功能裡,它把用戶本機的文件數據全部進行了標籤化處理,按照語言邏輯,生成了一張圖譜,藉此將不同的文件串聯在一起。而這些數據,明顯有成爲 AI 知識庫的潛力。就是說,未來用戶可能可以利用 AI 助手,來快速挖掘自己手機上的所有文件信息,以及信息之間的關係。
而更重要的是,AI 也可以藉助這一套私人知識庫,建立起對用戶的深入、長期理解,來滿足個性化的需求。也就是說,未來我們在和 AI 交互的時候,很多具體的需求,不需要在指令裡詳細說明,AI 就能「心領神會」。
在實現輸入的便利化,建立起長期記憶和私密知識庫之後,手機與 AI 結合的未來,還有巨大的想象空間等待着探索。
這次vivo 放出的新功能中的「訂座助手」,就能讓我們稍微一睹這樣的未來。它基於大模型的理解和生成能力,在用戶輸入用餐需求後,會自動查找餐廳、獲取商家聯繫方式,撥打過去並代替用戶與商家進行訂座溝通,最後返回結果,臨近預約時間,用戶會收到提醒,之後可以一鍵導航到餐廳。
聽起來可能有點太超前,甚至像科幻小說的情節。但它的確展示出,當 AI 充分利用了手機的各項功能之後,能便捷地實現多麼複雜的任務。
03
智能手機系統的
下一步是做「減法」
儘管AI 是 OriginOS 5 最重要的迭代更新方向,但我們應當意識到,AI 只是手段,它背後隱含的更重要的時代背景,是智能手機的「減法革命」。
過去十年,智能手機迭代的大方向是做「加法」。屏幕越來越大,儲存越來越高,伴隨着通信技術和帶寬的提升,可以說,智能手機終結了信息匱乏。
但現在,越來越多用戶面臨的問題是信息過載。我們生活中的設備越來越多,App 越來越多,爲搶奪用戶注意力的過度設計也越來越多。買一張機票有 4 個 App 推送通知,很多內容看完就忘了在哪看過,各種菜單的層級、選項,多到眼花繚亂。即便用了這麼多年的智能手機,也常常找不到自己想要的功能在哪。
所以,智能手機下一步的發展方向,特別是軟件層面的迭代,就是要解決這個問題。
OriginOS 5上,另一個很重要的功能更新是「原子島」。表面上,它的產品邏輯和 iPhone 的「靈動島」非常相似,後者是爲了適應 iPhone 硬件變化推出的功能。但「原子島」不太一樣,它不只是利用屏幕的一塊區域顯示點什麼,更重要的是,它還具備「預測、建議、信息流轉」的能力。
比如,「原子島」會基於日程事件、用戶習慣,主動提供 AI 服務建議。比如用戶複製了一行地址,拖到「原子島」區域,就能快速跳轉到地圖;複製圖片,就會優先出現「發送到微信」等分享選項。複製航班代碼,原子島就會自動彈出查詢航班信息的按鈕。
過去,智能手機的功能都被封裝在 App 裡,不同 App 之間缺乏協調機制,導致了信息的重複問題。 而「原子島」、「小 V 建議」的出現,就是要利用更少的 UI 元素,實現更多的功能服務。 過程中通過 AI 能力來預判用戶的需求,從龐雜的信息中濃縮、總結出重要的部分,幫助用戶「消化信息」。 這也是 AI 大模型與手機結合的重要意義。
智能手機系統上一次類似的革命,是UI 設計從擬物走向扁平化,凸顯出信息,降低用戶的視覺負擔。這一點上 OriginOS 5 依然在持續優化,統一了很多視覺動效,增強了界面之間的空間關係效果,並強調「數字化設計」,增強關鍵信息的呈現。
最後,OriginOS 5 也對最基礎的流暢性、續航、網絡信號等性能進行了升級優化。通過「Ledger 儲存賬本」對內存進行底層統一調度,減少了 App 長時間前臺使用時,過度佔用內存的問題,減輕了 App 負載帶來的卡頓。還對動畫流暢度、能效續航、抗老化能力分別進行了針對性優化。
實際上,無論是基礎的流暢性能優化,界面交互上的創新,還是最前沿的大模型AI功能,它們最終都指向了同一個目標,即如何在提供最豐富功能的同時,最大程度減少用戶的負擔,保持操作系統的高效。這是未來智能手機操作系統「好用」的關鍵。OriginOS 5 通過一系列的便捷化設計,AI 功能創新,性能優化,已經成爲 AI 時代最好用的國產手機 OS 之一。
找到正確的方向路徑,通過與 AI 能力更深入地結合,OriginOS 的未來也因此變得更值得期待。
*頭圖來源:vivo
本文爲極客公園原創文章,轉載請聯繫極客君微信 geekparkGO
極客一問
你對 OriginOS 有哪些期待?
馬斯克:警惕信息繭房,別讓社交媒體操縱了你。
點贊關注極客公園視頻號,