今年年初,中國(guó)AI公司DeepSeek模型的橫空出世在AI領(lǐng)域掀起巨浪,R1模型因其高效推理能力和低成本訓(xùn)練受到全球關(guān)注,也對(duì)英偉達(dá)等芯片企業(yè)形成了前所未有的沖擊。
英偉達(dá)公司年度開發(fā)者大會(huì)于3月17日至21日在美國(guó)加利福尼亞州圣何塞召開。公司首席執(zhí)行官黃仁勛在主題演講中說,隨著AI行業(yè)在模型訓(xùn)練上的整體需求放緩,再加上DeepSeek在模型推理上所作的創(chuàng)新,AI推理時(shí)代即將到來,當(dāng)前AI正從“生成式AI”邁向“代理式AI”時(shí)代。
相較于生成式AI主要以語(yǔ)言大模型與聊天機(jī)器人的形式呈現(xiàn)、聚焦生成文本和圖像內(nèi)容等,代理式AI更進(jìn)一步,能理解任務(wù)、進(jìn)行復(fù)雜推理、制定計(jì)劃并自主執(zhí)行多步驟操作,業(yè)內(nèi)熱議的智能體即為相關(guān)應(yīng)用。由于代理式AI解決復(fù)雜問題、分解任務(wù)每一步的邏輯思考過程都需要用到模型推理,因此推理將成為AI新階段的核心動(dòng)力。
3月25日,美國(guó)谷歌公司發(fā)布了號(hào)稱最強(qiáng)推理模型的雙子座 2.5 Pro。據(jù)介紹,它是谷歌旗下最先進(jìn)的復(fù)雜任務(wù)模型,展示了強(qiáng)大的推理和代碼能力,并擁有雙子座系列此前各模型所具有的全部功能。
同一天,OpenAI也正式推出基于GPT-4o模型的原生圖像生成功能,能夠直接從文本提示生成圖像,同時(shí)支持多輪迭代優(yōu)化圖像時(shí)保持角色形象一致。
作為AI領(lǐng)域的新興競(jìng)爭(zhēng)者,DeepSeek在3月也推出了其最新的DeepSeek V3-0324模型。據(jù)介紹,本次更新旨在增強(qiáng)推理和編碼能力,使AI更穩(wěn)健地處理復(fù)雜任務(wù),為用戶提供更高效的解決方案。
除了技術(shù)突破以外,AI技術(shù)革新浪潮在多個(gè)領(lǐng)域廣泛應(yīng)用,推動(dòng)了產(chǎn)業(yè)升級(jí)。
“在AI技術(shù)井噴的浪潮下,2025年將是AI應(yīng)用大規(guī)模落地的元年。”創(chuàng)新工場(chǎng)董事長(zhǎng)兼零一萬物首席執(zhí)行官李開復(fù)3月底在北京舉行的2025中關(guān)村論壇年會(huì)上說。
得益于AI大模型的不斷發(fā)展,具身智能也在今年進(jìn)入了迅猛發(fā)展期。具身智能是一種將AI融入機(jī)器人等物理實(shí)體的AI技術(shù),目的是使其具備從環(huán)境中感知和學(xué)習(xí)并與環(huán)境進(jìn)行動(dòng)態(tài)交互的能力。這一概念使智能技術(shù)從數(shù)字世界進(jìn)入現(xiàn)實(shí)場(chǎng)景,推動(dòng)機(jī)器人、自動(dòng)駕駛、人機(jī)交互等前沿技術(shù)發(fā)展。
3月10日,斯坦福大學(xué)李飛飛團(tuán)隊(duì)公布了具身智能領(lǐng)域最新研究成果——行為機(jī)器人套件框架,并公布了搭載該框架的保姆型人形機(jī)器人實(shí)操畫面。視頻中,具備雙臂、輪式底盤以及靈活軀干的機(jī)器人能完成倒垃圾、刷馬桶、整理衣物等多樣化家務(wù)任務(wù)。據(jù)介紹,團(tuán)隊(duì)通過兩大核心創(chuàng)新解決了硬件和學(xué)習(xí)難題,即用于數(shù)據(jù)收集的高效全身遙操作界面和用于學(xué)習(xí)全身視覺運(yùn)動(dòng)策略的創(chuàng)新算法。
醫(yī)療也是新一輪AI浪潮中的核心應(yīng)用場(chǎng)景之一。3月20日,國(guó)家兒童醫(yī)學(xué)中心、首都醫(yī)科大學(xué)附屬北京兒童醫(yī)院正式發(fā)布“福棠·百川”兒科醫(yī)學(xué)大模型,同時(shí)發(fā)布AI兒科醫(yī)生基層版和專家版。據(jù)介紹,未來北京兒童醫(yī)院將積極推進(jìn)“AI兒科醫(yī)生”的應(yīng)用,助力基層兒科服務(wù)能力的提升。