飛象網原創(高靖宇/文)數字科技的2024年,人工智能(AI)無疑是當之無愧的主角。這一年,AI的發展呈現出一系列令人矚目的態勢。
從技術演進來看,大模型在海量數據和強大算力的支撐下實現了從單任務到多任務智能的重大跨越,在語言處理、圖像識別等多方面能力持續進化。在產業層面,AI成為推動各行各業變革的核心引擎,AI在各行業的賦能進入新階段。
在2025中國信通院深度觀察報告會上,人工智能再次成為焦點議題,各領域專家從不同的視角出發,就人工智能及大模型技術未來發展趨勢展開了深度探討與解讀。
智能體引領終端革命
在2024年,智能體正逐步成為引領終端革命的重要力量。隨著端側大模型技術的迅猛發展,智能體不僅在技術上實現了突破,更在生活場景中展現出強大的應用潛力。
vivo推出的PhoneGPT,它不僅能夠識別手機界面內容,還能在復雜的場景中自動完成訂餐、訂票等任務。OPPO 的ColorOS 15通過引入系統級的AI交互,擁有強大的屏幕內容識別與指令處理能力。例如,在小紅書中,小布助手能識別屏幕內容,一鍵生成旅游路線。榮耀最新個人化全場景AI操作系統MagicOS 9.0,用戶只需要簡單一句話,語音助手YoYo就可以自動檢查支付寶和微信的自動續費項目,一鍵關閉自動續費。
在大會上,中國工程院院士鄔賀銓指出,端側大模型與智能體的結合將引發通信終端模式的深刻變革。首先,終端形態將多樣化,涵蓋手機、PC、可穿戴設備、傳感器、機器人和網聯車等多種形式。其次,終端功能將智能化,從傳統的智能終端發展為具備AI能力的智能體,支持離線使用。此外,人機交互方式將變得多模化,涵蓋自然語言、觸摸、手勢等,APP的獨立性將被削弱,轉而作為系統的服務工具。
鄔賀銓強調,這一變革將對網絡技術產生重大影響,包括對上行能力的提升和云邊端協同的需求。隨著5G技術的普及,需采用大上行技術以適應更高的帶寬需求。同時,云與端之間需要實現低時延、高可靠的傳輸,以支持模型參數的高效上傳與更新。
中國信通院泰爾實驗室副主任果敢表示,新一代智能終端呈現出新交互、新應用、新服務、新場景“四新”特征。新交互從“單一模態交互”走向“多模態交互”,新應用衍生出應用+AI、AI原生應用兩類代表性應用,新服務由“以用戶指令為驅動”轉變為“以用戶意圖為導向”,新場景從“萬物互聯”進入“萬物智聯”。果敢強調,AI重構操作系統是未來趨勢,生成式AI能力與操作系統融合將是下一階段重點。
智能網聯汽車開啟下半場競爭
隨著特斯拉在智能駕駛系統中率先開啟“端到端大模型”架構演進,2024年“端到端大模型”成為幾乎所有汽車廠商和自動駕駛解決方案提供商探索的焦點,蔚小理等主機廠以及華為、Momenta、商湯、元戎等供應商均在積極跟進。
對此,中國信通院技術與標準研究所主任葛雨明認為:“本質上來講是自動駕駛研發由規則驅動向數據驅動的一次技術變革,但同時也對高質量數據和智算能力提出了更高需求。盡管企業對“端到端”研發范式形成共識,但在感知硬件選擇方面,仍然存在“激光、毫米波雷達、視覺等多傳感器融合”和“純視覺”兩種不同方案,一方面是考慮保障環境感知的可靠性和穩定性,另一方面是延續且充分利用既有車型數據,基于各自在算法、算力等方面的研究和基礎資源。”
“在大力突破單車智能的基礎上,要更好發揮網聯賦能作用。” 葛雨明指出。截至2024年10月底,我國路側通信基礎設施(RSU)部署超過11000臺,5G基站總數達414.1萬個,依托車聯網的通信連接能力,不僅可以將路端、云端等外界感知信息補充給車輛,還可將路端、云端的計算等資源用于單車業務需求,在自動駕駛算法訓練、拓展自動駕駛功能運行范圍、自動駕駛技術演進等方面發揮著必不可少的支撐和賦能作用。
葛雨明主任表示,汽車產業已經進入到了智能網聯競爭的下半場。智能網聯汽車與信息通信、交通運輸等行業的深度融合是必然趨勢。我國智能網聯新能源汽車發展勢頭強勁,用戶側和數據側的智能化水平不斷提升。葛雨明強調,加快汽車智能網聯應用的基礎設施建設至關重要,需要政策法規、標準規范、基礎資源的共同謀劃布局。
人工智能為實現通用機器人打開大門
近兩年來,產業界對機器人的關注熱度高漲,具身智能和人形機器人這兩個詞匯出現的頻率很高。谷歌、特斯拉、OpenAI等國外頭部科技企業,以及國內企業銀河通用、智元、小米、小鵬等都在積極布局人形機器人。
人形機器人需要具備高度的自主性和智能性,能夠識別環境、理解指令、規劃行動,并在執行任務時做出合理的決策。而人工智能技術的發展,正是實現這一目標的關鍵。
中國信通院副總工程師許志遠認為,人工智能技術突破性發展,為實現通用機器人打開了大門,其核心是增強了機器人的認知與交互能力,并賦予機器人在物理世界中執行任務的強大泛化能力。
“人形機器人仍然不夠成熟。”許志遠指出,硬件方面,頭部公司的人形機器人產品除手部以外,全身只有50多個自由度,如果在復雜的環境中行走需要更強大的運動控制能力。除硬件以外,軟件其實是機器人落地的更大挑戰。大模型的本質是數據驅動,只有基于龐大的數據量來訓練,才能實現智能的涌現。而機器人大模型與這兩年成熟的大語言模型不一樣,語言模型的數據可以來自龐大的互聯網,機器人還需要物理世界中高精度操作數據,這些數據是互聯網沒有的。只有解決了這些問題,機器人才能大規模走入我們的生活。