AI 功能早已進入手機,比如拍攝優化、面部識別、語音助手等。2024年被手機廠商宣稱為“AI手機元年”,主要是指AI大模型進入手機,可能引起交互與體驗的變革,如語音交互能否取代觸屏,個人智能助理成為重要的用戶價值等。相應地,手機操作系統、芯片、內存等需升級換代,手機廠商認為這將驅動手機進入繼功能機、智能手機之后的第三階段,AI手機階段。
對于消費者來說,AI手機價值不在于硬件堆疊,而是基于AI大模型的應用。IDC和OPPO聯合發布的《AI手機白皮書》提出“AI手機的用戶價值,是自在交互、智能隨心、專屬陪伴、安全可信的個人化助理。”實際上,大模型的出現(LLM為主),智能個人助理(Assistant)可以擴展為更為自主的個人智能代理(Agent),深度參與到個人數據中,提供個性化服務。手機廠商2023年下半年起,逐步推出搭載大模型的手機,標配生成式AI應用與個人Agent,但都還處于早期階段。本文基于個人AI Agent將成為個人智能應用核心模式的判斷,從個人AI Agent核心組件及實現出發,討論AI手機的現狀與未來,以及運營商可為的布局。
個人AI Agent將成為智能應用的核心模式,重塑終端與應用生態
一是大模型具備增強智能助理擴展性和可用性的潛力。Siri、谷歌助手、華為、百度的智能助手等早已進入智能手機與智能家居,它們基于預定義的規則和較小的專用語言模型,執行具體定向的任務,如設定提醒、播放音樂、獲取天氣預報等,但擴展性不足,對用戶意圖理解力也不夠。大模型(LLM為主)展現出很強的自然語言理解、內容生成、邏輯推理等能力,以大模型驅動的個人AI Agent,具備把目標分解成子任務,并調用工具來完成的潛力,預期可以做更泛化場景的任務。
二是APP與智能終端積累個人軌跡數據,使行為智能成為可能。互聯網時代網站崛起,人類實現廣泛的信息共享交流,積累豐富的知識內容,為大模型訓練提供了內容基礎。移動互聯網時代,人類生活逐步線上化,即時通訊、購物、健身、出行等APP匯聚用戶行為軌跡數據,為個人行為預測訓練提供了基礎。智能化時代,真正智能的個人Agent成為可能,從“幫你做事”到主動預測“代你做事”(代理性程度不一),Agent有望成為智能時代的核心應用載體,行為智能是本質特點。

圖1 Agents可能成為個人智能應用的核心載體
三是從個人AI Agent應用模式出發,會重構智能終端與應用生態。個人AI Agent的終極目標是理解用戶并完成任務,具備響應性技能和主動性技能(圖2)。即響應用戶需求的能力,如問題答復、天氣查詢等,與在用戶沒有明確命令的情況下,提供主動服務的能力,如活動推薦及執行等。從應用目標出發,個人AI Agent需要:(1)更廣泛的個人數據采集,包括來自APP等“軟終端”與各類傳感器、智能硬終端的信息監測;(2)用戶歷史記憶檔案與當前狀態信息(環境、位置等)的組合,體現個性化、即時服務特點;(3)多樣的工具調用能力,包括不同專業Agent的協同;(4)基礎AI模型是核心,連接調度Agent的功能組件。結合現有進展,我們預計將會出現:(1)新一波監測類智能終端創新,類似Limitless錄音吊墜、Galaxy Ring運動睡眠等監測;(2)新一波智能Agent應用創新,個人綜合Agent與專屬Agent(如健康助理)等;(3)新一波承載Agent應用的終端創新,類似Rabbit R1、AI Pin、Ray-Ban Meta,當然包括AI手機;(4)新的操作系統內核,大模型為核心,支持多工具、多Agent調用等;(5)個人隱私保護技術創新及應用,加密與可信環境等。

圖2 個人AI Agent的主要組件
來源:《PERSONAL LLM AGENTS: INSIGHTS AND SURVEY ABOUT THE APABILITY, EFFICIENCY AND SECURITY》
現階段AI手機以生成式應用為主,“行為智能”尚處探索階段
綜合當前各方對AI手機的界定,AI手機可以概括為包含端側大模型、具備NPU的SoC芯片(IDC要求NPU性能在30到45 TOPS之間)、端側實現GenAI并向個人Agent發展等。下表是手機廠商目前推出的AI手機及特征總結:

表3 主流廠商當前AI手機推出情況
可以看出,現階段AI手機端側模型以7B為主流,并與云端協同,大模型開始與操作系統融合。但受硬件與技術限制,AI手機應用以內容生成處理類場景為主,多是云端大模型應用的移植,個人AI Agent尚未真正發揮“行為智能”的特點,所以用戶感覺沒有明顯的差異化,不夠顛覆性。具體而言:
(1) 主打內容生成處理,體現一定特色。以端側AI在圖像和文本處理的深化為主,如文本和圖片生成、AIGC 消除與背景補充、文件和本地通話摘要等。差異化來自某類場景的專注提升,如小米專注“影像”,VIVO文檔提煉更加高效等。
(2) 個人AI Agent處于探索階段。智能助手在識別用戶意圖,對手機的資源、性能、業務應用進行調度方面開始探索,如:榮耀YOYO提供“任意門”功能,宣稱實現意圖識別、信息跨應用跨設備流轉,VIVO小V自然語言操控手機APP等。
(3) 注重跨終端融合與智能應用生態打造。如小米“人車家全生態”布局,小愛能學習用戶的使用習慣,實現跨終端自動控制。應用生態方面,一是利用成熟生態,如三星與Google的大模型及生態合作;二是建新生態,如OPPO“1+N智能體生態”,即小布助手+開發者和用戶Agents,榮耀發起“百模生態計劃”,手機端自有AI大模型為中控,調度云端模型生態等。
AI手機適應新應用模式的未來關鍵方向分析
新范式催生新終端形式,重構應用生態,AI Pin是無屏幕交互Agent,Rabbit R1是直接操作APP的 Agent,Limitless的愿景也是個人 Agent,AI及Agent模式還會持續帶來智能眼鏡、耳機、家居等終端創新。面對原生AI終端與AI應用,AI化的手機的定位及形態面臨升級,或需重新定義的局面。具體來說,有以下幾個值得關注的問題和方向:
(1) AI手機還能否整合AI終端保持中心設備的位置:本質上就是AI手機能否成為個人AI Agent的集成調度中心,AI終端成為手機的補充,或者作為新的功能組件的問題。目前專項AI硬件,如Limitless吊墜、Ploud錄音機,包括主打音頻和拍攝的Ray-Ban Meta初步獲得市場認可,也與手機配合,而偏綜合的,甚至宣稱取代手機的AI Pin、Rabbit R1低于預期,高開低走。AI手機成為個人AI Agent的集成調度中心,核心優勢是本地算力和存儲,能夠承載端側模型和個人隱私數據,是當下的最佳載體。未來不排除某類更隨身輕靈的AI原生穿戴設備,借助云端+網絡+可信數據空間等成為新中心,產生更移動化場景的Agent應用生態。
(2) 行為數據孤島下如何協調建立用戶的個人記憶:用戶行為軌跡數據分散終端及在各大APP中,后者未必愿意開放API。探索的方向是:①Agent學習APP操作方法,通過UI界面模擬完成任務,如Rabbit R1,以及APPAgent框架等,但不是最有效率的方案;②系統級個人Agent、專項Agent(如購物、旅游)之間協同調用,彌補數據孤島劣勢;③大廠廣泛布局智能終端,構建用戶記憶檔案,比如小米、蘋果、華為、三星等向智能可穿戴、智能家居擴展等。
(3) 手機廠商APP Store能否升級為“Agent” Store:APP Store是手機廠商的重要營收渠道,引入Agent面臨:①大模型不是手機廠商包括蘋果的強項,主導權在Open AI 、Google等手中;② Agent模式向下擠壓原APP,甚至跳過APP,利益鏈條被打破;③Agent Store需要新的平臺插件、功能組件與商業模式等。可能的方向:一是建立大模型生態,如榮耀“百模生態計劃”以及蘋果尋求多方合作;二是探索新商業模式,如系統級Agent、專項Agent及APP數據交換與協同合作,平臺架構設立面向B端的Agent組合調用層,按量/訂閱收費分成等;三是建立或參與建立數據集成平臺(如可信數據空間),匯集用戶行為數據,統一格式與隱私管理,為Agent提供開發運營基礎等。
(4) 個人數據安全如何有效保障:在AI手機等本地端保存處理,被認為是最安全的方式,但對內存挑戰大,推理成本也比較高。云邊協作是另一種處理方式,隱私保護技術主要是數據屏蔽、數據加密、可信執行環境等。總的來說,現有隱私保護技術還不足以支持高水平個人AI Agent運作,需要手機廠商等提出創新性解決方案,贏得用戶信任。
(5) AI手機軟硬件持續升級:一是端側模型及OS效率改進,蘋果OpenELM 、微軟Phi-3、Octopus V2等端側模型在語⾔、推理、編碼等方面有良好表現,蘋果即將發布的iOS 18是其展開AI競爭的主要平臺;二是端側硬件持續升級,將采用3nm等更先進制程,推理能力及手機內存加速提升等。
運營商可以做什么布局
面對AI終端與應用模式變革趨勢,電信運營商一是可把握新一波AI終端云端聯網的流量需求,帶動流量卡號銷售;二是優化網絡質量與套餐服務,Agent端云實時的數據處理交互,對網絡速度和穩定性的需求增加,因個人數據更加完整,運營商可以與應用方合作,提供個性化的套餐服務;三是布局個人、家庭Agent特色智能服務,如健康管理服務、智能家庭服務、緊急響應服務等;四是參與用戶數據隱私保護技術開發與可信數據空間建設,提供加密技術保護用戶Agent數據,積極布局個人、家庭可信數據空間基礎設施建設等。