圖形處理單元(GPU)、中央處理單元(CPU)、定制人工智能專用集成電路(ASIC)以及其他人工智能加速器,涵蓋參與者分析、技術(shù)、趨勢、供應(yīng)鏈和預(yù)測
前沿人工智能吸引了全球數(shù)千億美元的投資,各國政府和超大規(guī)模云服務(wù)提供商競相在藥物發(fā)現(xiàn)和自主基礎(chǔ)設(shè)施等領(lǐng)域取得領(lǐng)先地位。圖形處理單元(GPU)和其他人工智能芯片在推動(dòng)人工智能增長方面發(fā)揮了重要作用,為數(shù)據(jù)中心和云計(jì)算基礎(chǔ)設(shè)施中的深度學(xué)習(xí)提供了所需的計(jì)算能力。GPU在提供計(jì)算能力方面發(fā)揮了關(guān)鍵作用,是大型語言模型(LLM)和生成式人工智能浪潮下的主導(dǎo)力量。然而,隨著對更高效計(jì)算、更低成本、更高性能、大規(guī)模可擴(kuò)展系統(tǒng)、更快推理和特定領(lǐng)域計(jì)算的需求增加,其他人工智能芯片也有機(jī)會(huì)在流行度上增長。
本文引用地址:http://www.ljygm.com/article/202505/470102.htm隨著人工智能芯片的格局從僅限于GPU擴(kuò)展到更多新型架構(gòu)實(shí)現(xiàn)大規(guī)模商業(yè)化,IDTechEx的報(bào)告《2025-2035數(shù)據(jù)中心和云計(jì)算中的人工智能芯片:技術(shù)、市場、預(yù)測》提供了對數(shù)據(jù)中心和云計(jì)算中人工智能芯片市場的獨(dú)立分析。這包括對當(dāng)前和新興技術(shù)的基準(zhǔn)測試、技術(shù)分解和關(guān)鍵趨勢的分析,涵蓋了當(dāng)前和新興的硬件架構(gòu)、先進(jìn)節(jié)點(diǎn)技術(shù)和先進(jìn)半導(dǎo)體封裝,以及供應(yīng)鏈、投資和政策方面的信息。報(bào)告提供了2025年至2035年數(shù)據(jù)中心和云計(jì)算人工智能芯片市場的詳細(xì)收入預(yù)測,按人工智能芯片類型劃分,包括GPU、超大規(guī)模云服務(wù)提供商和云服務(wù)提供商(CSP)使用的定制人工智能專用集成電路(ASIC)、具備人工智能能力的中央處理單元(CPU)以及其他由人工智能芯片初創(chuàng)公司和大型供應(yīng)商開發(fā)的人工智能ASIC。
圖形處理單元(GPU)
人工智能最大的系統(tǒng)是大規(guī)模擴(kuò)展的高性能計(jì)算(HPC)和人工智能系統(tǒng)——這些系統(tǒng)大量使用GPU。這些通常是超大規(guī)模人工智能數(shù)據(jù)中心和超級計(jì)算機(jī),它們都可以提供每秒千萬億次浮點(diǎn)運(yùn)算(exaFLOPS)的性能,無論是本地部署還是通過分布式網(wǎng)絡(luò)。近年來,NVIDIA憑借其Hopper(H100/H200)芯片取得了顯著成功,并最近發(fā)布了Blackwell(B200/B300)芯片。AMD也憑借其MI300系列處理器(MI300X/MI325X)創(chuàng)建了具有競爭力的芯片。由于美國對先進(jìn)芯片的制裁,中國參與者也在開發(fā)解決方案。這些高性能GPU繼續(xù)采用最先進(jìn)的半導(dǎo)體技術(shù)。一個(gè)例子是增加芯片上內(nèi)存容量,頂級芯片擁有超過250GB的高帶寬內(nèi)存(HBM),使具有更多參數(shù)的更大人工智能模型能夠在這些GPU上運(yùn)行。這些芯片還采用了最先進(jìn)的半導(dǎo)體封裝解決方案,如臺(tái)積電的CoWoS-L封裝、小芯片和多芯片GPU,以及最先進(jìn)的工藝節(jié)點(diǎn)(5納米及以下)。報(bào)告中詳細(xì)探討了所有這些趨勢和市場活動(dòng)。
超大規(guī)模云服務(wù)提供商和云服務(wù)提供商使用的定制人工智能芯片
GPU一直是訓(xùn)練人工智能模型的基礎(chǔ),但存在局限性,例如高總擁有成本(TCO)、供應(yīng)商鎖定風(fēng)險(xiǎn)、特定人工智能操作的低利用率,以及對于特定推理工作負(fù)載可能過于強(qiáng)大。超大規(guī)模云服務(wù)提供商采用的一種新興策略是使用基于脈動(dòng)陣列的定制人工智能ASIC。這些芯片為人工智能工作負(fù)載設(shè)計(jì)了專用核心,每個(gè)操作的成本更低,針對特定系統(tǒng)(例如,變換器、推薦系統(tǒng)等)進(jìn)行了優(yōu)化,提供了高效的推理,并為超大規(guī)模云服務(wù)提供商和云服務(wù)提供商提供了在不犧牲性能的情況下實(shí)現(xiàn)全棧控制和差異化的機(jī)會(huì)。報(bào)告提供了潛在風(fēng)險(xiǎn)評估、關(guān)鍵合作伙伴關(guān)系、參與者活動(dòng)、基準(zhǔn)測試和技術(shù)概述。
其他人工智能芯片
其他人工智能芯片正在被商業(yè)化以顛覆GPU,具有類似和新穎的計(jì)算架構(gòu)。一些大型芯片供應(yīng)商,如英特爾、華為和高通,設(shè)計(jì)了人工智能加速器(例如,Gaudi、Ascend 910、Cloud AI 100),使用類似于GPU的異構(gòu)計(jì)算單元陣列,但專門用于加速人工智能工作負(fù)載。這些芯片在性能、能效和特定應(yīng)用領(lǐng)域的靈活性之間取得了平衡。通常,這些芯片包含矩陣引擎和張量核心,這些核心被設(shè)計(jì)為以高吞吐量執(zhí)行密集的線性代數(shù)運(yùn)算,如GEMM(通用矩陣乘法)和BMM(批量矩陣乘法)。
專注于人工智能芯片的初創(chuàng)公司通常采用不同的方法,部署前沿架構(gòu)和制造技術(shù),如數(shù)據(jù)流控制處理器、晶圓級封裝、空間人工智能加速器、內(nèi)存中處理(PIM)技術(shù)和粗粒度可重構(gòu)陣列(CGRAs)。許多公司已成功推出這些系統(tǒng)(Cerebras、Groq、Graphcore、SambaNova、Untether AI等),用于數(shù)據(jù)中心和云計(jì)算,通常開發(fā)機(jī)架級解決方案以便于企業(yè)部署,或在其自己的云平臺(tái)上提供使用。這些系統(tǒng)在擴(kuò)展環(huán)境中表現(xiàn)卓越。IDTechEx的報(bào)告提供了全面的基準(zhǔn)測試、比較、關(guān)鍵趨勢、技術(shù)分解和參與者活動(dòng)。
設(shè)計(jì)人工智能芯片和供應(yīng)鏈
開發(fā)具有競爭力吞吐量的人工智能芯片,用于訓(xùn)練(訓(xùn)練時(shí)間)和推理(每秒令牌數(shù)),高能效(TOPS/瓦特)以及相關(guān)的軟件支持,對所有芯片設(shè)計(jì)者來說都是一個(gè)嚴(yán)格的挑戰(zhàn)。這個(gè)過程涉及到許多步驟的精細(xì)平衡,包括選擇編程和執(zhí)行模型、設(shè)計(jì)優(yōu)化的硬件和內(nèi)存架構(gòu),以及使用先進(jìn)工藝節(jié)點(diǎn)和先進(jìn)半導(dǎo)體封裝進(jìn)行制造。例如,數(shù)據(jù)中心芯片正在采用臺(tái)積電、英特爾代工和三星代工的最先進(jìn)工藝節(jié)點(diǎn),使用ASML的極紫外(EUV)光刻技術(shù)。這些代工廠正在推動(dòng)晶體管技術(shù)從5納米技術(shù)發(fā)展到使用FinFET(Fin場效應(yīng)晶體管)的2納米節(jié)點(diǎn)以下,使用GAAFET(環(huán)繞柵極FET)和背面供電。報(bào)告中包含了最近的制造發(fā)展、設(shè)備要求、硬件架構(gòu)分解、先進(jìn)半導(dǎo)體封裝細(xì)節(jié)、供應(yīng)鏈以及編程模型比較。
設(shè)計(jì)和制造中涉及的各種技術(shù)為整個(gè)半導(dǎo)體行業(yè)供應(yīng)鏈的未來技術(shù)創(chuàng)新提供了廣泛的空間。政府政策和大量投資顯示出推動(dòng)前沿人工智能達(dá)到新高度的普遍興趣,這將需要在人工智能數(shù)據(jù)中心中使用大量的人工智能芯片來滿足這一需求。IDTechEx預(yù)測,從2025年到2030年,這一市場將以14%的年復(fù)合增長率增長,收入超過4000億美元。
評論