英特爾宣布實(shí)現(xiàn) MLPerf Client 0.6 基準(zhǔn)測(cè)試首個(gè)全 NPU 支持
5 月 7 日消息,當(dāng)?shù)貢r(shí)間 5 月 5 日,英特爾宣布成為唯一在 MLPerf Client v0.6 基準(zhǔn)測(cè)試中實(shí)現(xiàn)全 NPU 支持的企業(yè)。
本文引用地址:http://www.ljygm.com/article/202505/470141.htm英特爾表示,該結(jié)果標(biāo)志著行業(yè)首個(gè)針對(duì)客戶(hù)端 NPU 的大語(yǔ)言模型(LLM)性能標(biāo)準(zhǔn)化評(píng)估。測(cè)試數(shù)據(jù)顯示,英特爾酷睿 Ultra 200 處理器在 GPU 和 NPU 上的輸出速度遠(yuǎn)超人類(lèi)平均閱讀速度。
英特爾客戶(hù)端 PC 產(chǎn)品營(yíng)銷(xiāo)副總裁兼總經(jīng)理丹尼爾?羅杰斯(Daniel Rogers)表示,“我們很榮幸能夠引領(lǐng)行業(yè),實(shí)現(xiàn)客戶(hù)端 PC 平臺(tái)的全 NPU 加速和領(lǐng)先 GPU 性能。”
測(cè)試配置
AMD英特爾平臺(tái)華碩 Zenbook S 16華碩 Zenbook S 14型號(hào)UM5606WAUX5406SACPUAMD 銳龍 AI HX 370酷睿 Ultra 9 288VBIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日BIOS 版本UM5606WA.317UX5406SA.306內(nèi)存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz顯卡AMD Radeon 890M英特爾 Arc 140V存儲(chǔ)1TB1TB操作系統(tǒng)Windows 11 專(zhuān)業(yè)版 x64
英特爾表示,在基于 Llama 2 7B 模型的四項(xiàng)內(nèi)容生成與摘要測(cè)試中,英特爾在 NPU 和內(nèi)置 Arc GPU 上均展現(xiàn)領(lǐng)先性能:
· 創(chuàng) NPU 最快響應(yīng)速度,首個(gè)詞元生成僅需 1.09 秒(首 token 延遲)
· 實(shí)現(xiàn) NPU 最高吞吐量 18.55 tokens / 秒
· GPU 首 token 生成速度超越競(jìng)品
MLPerf Client 由 MLCommons 聯(lián)盟成員(含英特爾、AMD、微軟、英偉達(dá)、高通)聯(lián)合開(kāi)發(fā),首次突破以 GPU 為核心的測(cè)試模式,新增專(zhuān)用 NPU 基準(zhǔn)評(píng)估。
評(píng)論