韩国三级一区-韩国三级香港三级日本三级la-韩国三级香港三级日本三级-韩国三级视频网站-日韩欧美一及在线播放-日韩欧美一二三区

首頁|必讀|視頻|專訪|運營|制造|監管|芯片|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|大數據|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能 >> 正文

AMD、高通宣布旗下硬件支持 OpenAI gpt-oss 開放推理模型

2025年8月6日 16:26  IT之家  作 者:溯波

OpenAI 當地時間昨日以 Apache 2.0 許可證的形式推出了兩款 gpt-oss 系列開放推理模型,其中參數規模較小的 gpt-oss-20b 模型可在僅配備 16GB 內存的邊緣設備上運行、參數更多的 gpt-oss-120b 則能在單個 80GB GPU 上高效運行。

AMD 與高通均宣布旗下硬件支持 gpt-oss 系列開放模型,具體是 AMD 銳龍 AI Max+ 395 處理器支持 gpt-oss-120b、AMD Radeon RX 9070 16GB 顯卡支持 gpt-oss-20b、高通旗艦驍龍平臺支持 gpt-oss-20b。

AMD 宣稱銳龍 AI Max+ 395 是全球首款能運行 gpt-oss-120b 模型的消費級 AI PC 處理器:采用 GGML 框架轉換的 MXFP4 格式 gpt-oss-120b 大約需要 61GB 顯存,而 "Strix Halo" 平臺在 128GB 統一內存下支持將 96GB 分配給 GPU,輕松滿足這一需求。

銳龍 AI Max+ 395 在 gpt-oss-120b 上有 30 Token / s 的輸出速率,同時支持該模型的 MCP 模型上下文協議實現。

而 Radeon RX 9070 16GB 顯卡則能在 gpt-oss-20b 上實現出色的首 Token 輸出時間 (TTFT) 和每秒 Token 輸出數量表現。

高通表示根據早期測試 gpt-oss-20b 可在端側實現出色思維鏈推理表現,開發者可通過 Hugging Face 和 Ollama 等熱門平臺在搭載驍龍芯片的設備上訪問 gpt-oss-20b 模型并充分發揮其功能。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦新聞              
 
人物
中國電信柯瑞文:星辰智惠 共治共享
精彩視頻
華為史振鈺:智能體從辦公走向生產,AI成為生產力
俄羅斯工程院外籍院士孫立寧:構建具身智能的免疫系統,從安全服務到人機共生的新范式
廣汽副總經理閤先慶:安全是智能網聯汽車的基石
IDC中國副總裁鐘振山:未來的市場趨勢是從單一智能體產品逐步轉向智能體集群
精彩專題
2025世界人工智能大會暨人工智能全球治理高級別會議
2025中國聯通合作伙伴大會
2025 MWC 上海
2025工業互聯網大會
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像