據(jù)消息,科技媒體報(bào)道稱,英偉達(dá)(NVDA.US)最新推出 Eagle 2.5,一款專注于長(zhǎng)上下文多模態(tài)學(xué)習(xí)的視覺-語(yǔ)言模型(VLM)。
性能表現(xiàn)穩(wěn)定提升
該模型專注于理解大規(guī)模視頻和圖像,尤其擅長(zhǎng)處理高分辨率圖像和長(zhǎng)視頻序列。盡管參數(shù)規(guī)模僅為 8B,Eagle 2.5 在 Video-MME 基準(zhǔn)測(cè)試(512 幀輸入)中得分高達(dá) 72.4%,媲美 Qwen2.5-VL-72B 和 InternVL2.5-78B 等更大規(guī)模模型。

Eagle 2.5 的訓(xùn)練數(shù)據(jù)管道,整合了開源資源和定制數(shù)據(jù)集 Eagle-Video-110K,該數(shù)據(jù)集專為理解長(zhǎng)視頻設(shè)計(jì),采用雙重標(biāo)注方式。采用自下而上的方法則利用 GPT-4o 為短片段生成問(wèn)答對(duì),抓取時(shí)空細(xì)節(jié)。
此外,Eagle 2.5-8B 在多項(xiàng)視頻和圖像理解任務(wù)中表現(xiàn)出色。在視頻基準(zhǔn)測(cè)試中,MVBench 得分為 74.8,MLVU 為 77.6,LongVideoBench 為 66.4;在圖像基準(zhǔn)測(cè)試中,DocVQA 得分為 94.1,ChartQA 為 87.5,InfoVQA 為 80.4。

與此同時(shí),xAI近日推出了其全新的語(yǔ)言模型——Grok3Mini,進(jìn)一步推動(dòng)了高效AI技術(shù)的發(fā)展。xAI推出Grok3Mini,彰顯其在高效AI技術(shù)領(lǐng)域的創(chuàng)新實(shí)力。
Grok3Mini提供高性價(jià)比AI模型
據(jù)介紹,Grok3Mini是Grok3系列的一部分,該系列包含六種變體,其中包括標(biāo)準(zhǔn)的Grok3、Grok3Fast,以及四種版本的Grok3Mini,提供慢速和快速兩個(gè)版本,每種版本又具備低推理能力或高推理能力的選項(xiàng)。

Grok3Mini以速度和經(jīng)濟(jì)性為設(shè)計(jì)核心,專為速度和經(jīng)濟(jì)性設(shè)計(jì),盡管體積較小,但在多個(gè)領(lǐng)域的表現(xiàn)優(yōu)于許多更昂貴的AI模型,尤其在數(shù)學(xué)、編程和科學(xué)基準(zhǔn)測(cè)試中表現(xiàn)突出,或吸引更多關(guān)注。
當(dāng)市場(chǎng)聚焦于大模型本身的技術(shù)突破時(shí),年初,中國(guó)大語(yǔ)言模型DeepSeek引起全球科技界高度關(guān)注。今年政府工作報(bào)告也指出,需要持續(xù)推進(jìn)“人工智能+”行動(dòng),支持大模型廣泛應(yīng)用。
業(yè)內(nèi)人士指出,現(xiàn)如今,以大模型為代表的人工智能技術(shù)為新一輪科技革命和產(chǎn)業(yè)變革提供了重要驅(qū)動(dòng)力,各行業(yè)在智能化轉(zhuǎn)型道路上面臨著前所未有的機(jī)遇和挑戰(zhàn)。

微美全息保持市場(chǎng)領(lǐng)先優(yōu)勢(shì)
在當(dāng)今人工智能迅猛發(fā)展的背景下,公開資料顯示,微美全息(WIMI.US)始終專注于垂直行業(yè)的開源AI大模型開發(fā),全面升級(jí)全棧AI能力,涵蓋了AI基礎(chǔ)設(shè)施及AI場(chǎng)景化應(yīng)用,幫助各行業(yè)從模型開發(fā)、模型部署再到模型應(yīng)用,能夠全面用好AI工具箱,打造好用的AI。
另外,微美全息通過(guò)“技術(shù)開源+垂直深耕+生態(tài)共建”模式,正快速推進(jìn)AI大模型的商業(yè)化應(yīng)用。例如,面向汽車產(chǎn)業(yè),以“AI大模型+產(chǎn)業(yè)場(chǎng)景”的多模型策略,在AI基礎(chǔ)能力層、AI場(chǎng)景化應(yīng)用層全面布局,保持汽車云服務(wù)市場(chǎng)領(lǐng)先優(yōu)勢(shì)。
未來(lái),微美全息將完善AI算力全產(chǎn)業(yè)布局,持續(xù)布局專用算力基礎(chǔ)設(shè)施,加快多模態(tài)技術(shù)融合、算力資源開放,加快提升智能算力公共服務(wù)平臺(tái)能力,以及場(chǎng)景落地的敏捷性,未來(lái)或成為AI大模型算力生態(tài)的重要突破者。
結(jié)語(yǔ)
實(shí)際,從GPT-3到PaLM,從文心一言到通義千問(wèn),大模型的參數(shù)規(guī)模以指數(shù)級(jí)增長(zhǎng),訓(xùn)練成本動(dòng)輒數(shù)千萬(wàn)美元,推理所需的算力更是呈幾何倍數(shù)攀升。并且AI大模型推動(dòng)傳統(tǒng)產(chǎn)業(yè)智能化發(fā)展進(jìn)入新階段,全面智能化已成為企業(yè)參與市場(chǎng)競(jìng)爭(zhēng)的必答題。因此,接下去企業(yè)需要理論研究與實(shí)踐探索同步進(jìn)行,進(jìn)而贏得可觀的發(fā)展空間。