市場(chǎng)缺口超10萬張,國(guó)內(nèi)GPU市場(chǎng)將在這些賽道“上分”!
GPU Utils 發(fā)布了一份關(guān)于英偉達(dá)GPU——主要是H100的研究報(bào)告,試圖梳理有關(guān)GPU供應(yīng)和需求的相關(guān)問題。在這篇主要針對(duì)美國(guó)市場(chǎng)的報(bào)告中,我們看到了目前阻礙大模型和人工智能發(fā)展的關(guān)鍵瓶頸GPU短缺是如何形成和發(fā)展的。
總的來說,GPU瓶頸的出現(xiàn)原因是多方面的,環(huán)環(huán)相扣的復(fù)雜工藝制造流程,半導(dǎo)體周期,對(duì)稀缺資源的搶占與恐慌乃至未曾預(yù)料到的人工智能的突然爆發(fā),都讓GPU算力變得無比緊張。
樂觀地看,2024年這一瓶頸或許會(huì)有所緩解。
數(shù)十萬張缺口,一百五十億需求
每個(gè)想要在人工智能爆發(fā)中分一杯羹的人都需要GPU。準(zhǔn)確地說,是英偉達(dá)的A100和H100,它們?cè)谟?xùn)練和推理大模型中扮演關(guān)鍵角色。如果要想要從頭訓(xùn)練大模型,至少需要上千張A100或H100,而推理和微調(diào)大模型也至少需要儲(chǔ)存100張。
具體到每家的數(shù)量上,報(bào)告匯總了一些數(shù)據(jù):GPT4在1萬到2.5萬塊A100上訓(xùn)練,Meta有2.1萬塊A100,特斯拉有7000塊,Stability AI有5000塊,谷歌云大概有2.5萬塊H100,微軟Azure 有1萬到4萬塊,甲骨文可能也有同樣多的H100。值得一提的是,Azure的GPU基本都用來供應(yīng)OpenAI的訓(xùn)練了。
而根據(jù)馬斯克的說法,GPT5的訓(xùn)練可能會(huì)用到3萬到5萬張H100,因此對(duì)未來的估計(jì)上,報(bào)告指出OpenAI可能需要5萬張H100,Meta至少需要2.5萬張(也有人說實(shí)際上需要10萬乃至更多),所有的云服務(wù)廠商,微軟、谷歌云和亞馬遜云以及甲骨文各需要3萬張,私有云服務(wù)商,比如剛剛?cè)谫Y的CoreWeave等總需求是10萬張,而像Claude的開發(fā)者Anthropic這樣的初創(chuàng)公司也都至少需要1萬張GPU。
另外,一些金融公司比如JP Morgan等也在部署A100或H100,因此總體上看,對(duì)H100的需求超過了43萬張。
這還是不算中國(guó)市場(chǎng)的情況,由于制裁原因,字節(jié)跳動(dòng)、百度、騰訊和阿里巴巴只能大量購(gòu)買A100和H100的替代產(chǎn)品A800與H800,這一部分的需求沒有列入其中,根據(jù)《金融時(shí)報(bào)》的說法,其總額高達(dá)50億美金。
如果將這些數(shù)字相加,這就是目前英偉達(dá)面對(duì)的,總計(jì)規(guī)模高達(dá)200億美元的GPU需求。
GPU 短缺阻礙ChatGPT進(jìn)步速度
據(jù)《財(cái)富》雜志報(bào)道,OpenAI 公司 CEO 山姆奧特曼在一場(chǎng)非公開會(huì)議上透露,GPU 的嚴(yán)重短缺阻礙了 ChatGPT 的進(jìn)步。
報(bào)道稱,奧特曼于 5 月會(huì)見了多位 App 開發(fā)者和初創(chuàng)公司的管理者。倫敦 AI 初創(chuàng)公司 Humanloop 的 CEO 拉扎哈比卜在一則推文中稱,奧特曼認(rèn)為 OpenAI 缺少足夠的 GPU,這導(dǎo)致許多優(yōu)化 ChatGPT 的工作被迫推遲。
哈比卜的會(huì)議記錄顯示,客戶對(duì) ChatGPT 最大的抱怨是 API 界面的速度和可靠性。奧特曼對(duì)此表示理解,并解釋稱主要原因是 GPU 嚴(yán)重不足。
會(huì)議記錄公開后不久,OpenAI 聯(lián)系了哈比卜,表示該活動(dòng)不便公開發(fā)布。隨后哈比卜刪除了這則推文。據(jù)介紹,奧特曼抱怨了 GPU 短缺導(dǎo)致算力不足,OpenAI 無法擴(kuò)大 ChatGPT 的對(duì)話框列表。這影響了 ChatGPT 在回答用戶問題時(shí)可以處理的信息量,限制了 ChatGPT 的“記憶力”,如過往提問記錄等。此外,ChatGPT 由于算力不足也無法完成更繁瑣的任務(wù),例如寫出復(fù)雜的程序代碼等。
算力租賃正在興起
近期各AI廠商紛紛拿出大模型“秀肌肉”之時(shí),多位觀察人士告訴財(cái)聯(lián)社記者,大數(shù)據(jù)、人工智能等領(lǐng)域的快速發(fā)展推動(dòng)算力需求(特別是大模型和行業(yè)應(yīng)用等方面)迅速增長(zhǎng)。據(jù)了解,GPU需求旺盛并已陷入供應(yīng)短缺。
“不像消費(fèi)顯卡,很多商家會(huì)有庫存,它本來存貨就很少,整個(gè)供應(yīng)鏈上的貨不超過三四千片,GPT熱度起來以后就被互聯(lián)網(wǎng)大廠全部鎖完了,今年3月后市場(chǎng)上基本沒有存貨了,部分大廠開始直接從國(guó)外渠道找一些貨回來,現(xiàn)在50%以上的訂單基本都是互聯(lián)網(wǎng)大廠下的?!睆垇喼拊诮邮茇?cái)聯(lián)社記者采訪時(shí)表示。
張亞洲告訴記者,包括微軟、英特爾等海外大廠一邊自研、一邊也在對(duì)外采購(gòu),他們前期訂的一部分(GPU訂單),可能用于大規(guī)模訓(xùn)練,對(duì)于推理還是不夠的?;旧蠌S商低于一個(gè)億的訂單,也許渠道商都不愿搭理,發(fā)郵件都不回?!盙PU的火爆程度由此可見一斑。
而從價(jià)格層面看,多款GPU價(jià)格從3、4月至今漲幅接近50%。張亞洲稱,“4月份的時(shí)候(訂單)大概還能排到10月份,現(xiàn)在已經(jīng)到明年上半年了?!?/span>
鯨平臺(tái)專家、鑒片工場(chǎng)創(chuàng)始人張力卜告訴財(cái)聯(lián)社記者,“很多企業(yè)和個(gè)人都需要用到高性能的GPU來進(jìn)行深度學(xué)習(xí)的訓(xùn)練和應(yīng)用,但自己購(gòu)買服務(wù)器建設(shè)數(shù)據(jù)中心的成本又很高,所以選擇租賃云算力平臺(tái)是比較劃算和靈活的方式?!被谶@一邏輯,租用計(jì)算資源的算力租賃模式當(dāng)前正在興起。
國(guó)內(nèi)GPU應(yīng)用三大市場(chǎng)
GPU應(yīng)用場(chǎng)景不斷擴(kuò)大拉動(dòng)GPU市場(chǎng)空間迅猛增長(zhǎng),根據(jù)VerifiedMarket Research預(yù)測(cè),2027年中國(guó)GPU市場(chǎng)規(guī)模將會(huì)增長(zhǎng)至345.57億美元。
GPU市場(chǎng)主要應(yīng)用場(chǎng)景可概括為:AI&數(shù)據(jù)中心、智能汽車、游戲。
I&數(shù)據(jù)中心:新一輪AI對(duì)算力需求遠(yuǎn)超以往:ChatGPT類語言大模型底層是2017年出現(xiàn)的Transformer架構(gòu),該架構(gòu)相比傳統(tǒng)的CNN/RNN為基礎(chǔ)的AI模型,參數(shù)量達(dá)到數(shù)千億,對(duì)算力消耗巨大,對(duì)算力硬件有大量需求。隨著對(duì)商業(yè)數(shù)據(jù)和大數(shù)據(jù)處理要求算力的不斷提高,GPU的通用計(jì)算能力正在越來越廣泛地被應(yīng)用與數(shù)據(jù)中心和國(guó)家超算中心的建設(shè)。
智能汽車:智能汽車方興未艾,自動(dòng)駕駛和智慧座艙是智能汽車發(fā)展的主要方向,均需大量使用GPU。
游戲:游戲業(yè)務(wù)是GPU應(yīng)用的傳統(tǒng)領(lǐng)域,對(duì)游戲畫面進(jìn)行3D渲染,英偉達(dá)的游戲業(yè)務(wù)穩(wěn)中有進(jìn)。
1、AI:數(shù)據(jù)中心和終端場(chǎng)景不斷落地對(duì)計(jì)算芯片提出更多更高需求
依據(jù)部署位置劃分,AI芯片可以細(xì)分為終端芯片和云端芯片,云端芯片市場(chǎng)空間越為終端芯片的2-3倍。
云端芯片:云端芯片應(yīng)用于云端服務(wù)器,可以進(jìn)一步細(xì)分為推理芯片和訓(xùn)練芯片。根據(jù)甲子光年數(shù)據(jù),2018年中國(guó)云端芯片市場(chǎng)約46.1億元,該機(jī)構(gòu)預(yù)計(jì)2023年增長(zhǎng)至384.6億元。
終端芯片:應(yīng)用于嵌入式、移動(dòng)終端、智能制造、智能家居等領(lǐng)域的AI芯片,終端芯片需要低功耗和更高的能效比,但是對(duì)算力的需求也相對(duì)較低,主要應(yīng)用與AI推理。根據(jù)甲子光年數(shù)據(jù),2018年中國(guó)終端芯片市場(chǎng)約15億元,該機(jī)構(gòu)預(yù)計(jì)2023年增長(zhǎng)至173億元。
AI芯片總市場(chǎng)232億元,其中云端芯片市場(chǎng)空間更大,預(yù)計(jì)終端芯片將隨著AI在多行業(yè)落地將進(jìn)一步放量。甲子光年預(yù)測(cè),中國(guó)AI芯片市場(chǎng)規(guī)模將從2021年232億元增長(zhǎng)至2023年的500億元左右,對(duì)應(yīng)中國(guó)云端芯片市場(chǎng)的復(fù)合增長(zhǎng)率為52.8%;終端芯片市場(chǎng)規(guī)模相對(duì)較小,但由于人工智能在汽車、安防、智能家居等行業(yè)滲透,屆時(shí)市場(chǎng)規(guī)模增長(zhǎng)率達(dá)到62.2%。
2、汽車智能化浪潮下汽車GPU市場(chǎng)前景廣闊
自動(dòng)駕駛
汽車智能化浪潮下,自動(dòng)駕駛和智能座艙是最具有發(fā)展前景的兩個(gè)方向,GPU應(yīng)用于二者的域控制器,智能汽車主流的域控制器采用SoC與MCU結(jié)合的方案,SoC(片上系統(tǒng))由GPU、CPU、AI引擎、DPU等組成。GPU在自動(dòng)駕駛中的作用表現(xiàn)在圖形處理和并行計(jì)算,ADAS平臺(tái)可以利用GPU的并行計(jì)算能力實(shí)時(shí)分析來自激光雷達(dá)、雷達(dá)和紅外攝像頭的傳感器數(shù)據(jù)。
蓋世汽車預(yù)計(jì)到2025年中國(guó)自動(dòng)駕駛域控制器出貨量達(dá)到432萬臺(tái),自動(dòng)駕駛域控制器與SoC之比在1:1到1:4之間,市場(chǎng)份額較高的SoC通常搭載一片GPU。
智能座艙
GPU虛擬化技術(shù)助力智能座艙一芯多屏化發(fā)展,智能座艙芯片主要為SoC(片上系統(tǒng)),SoC由GPU、CPU、AI引擎、DPU等組成。智能座艙向著一芯多屏的形態(tài)發(fā)展,這對(duì)芯片并行計(jì)算的要求不斷提高,GPU硬件虛擬化技術(shù)在智能座艙中有著無可替代的優(yōu)勢(shì)。在智能座艙屏幕、儀表盤、車載與各系統(tǒng)中均需要使用GPU。
蓋世汽車預(yù)計(jì)2025年中國(guó)智能座艙域控制器出貨量達(dá)到528萬臺(tái),智能座艙一臺(tái)域控制器內(nèi)置一個(gè)SoC,位于汽車的中央顯示屏內(nèi),一個(gè)SoC通常搭載一片GPU。
3、游戲玩家人數(shù)持續(xù)增長(zhǎng),游戲GPU市場(chǎng)規(guī)模穩(wěn)中有升
游戲市場(chǎng)是傳統(tǒng)意義上GPU最關(guān)鍵的市場(chǎng),隨著千禧一代游戲需求的進(jìn)一步提升,全球游戲玩家數(shù)量穩(wěn)增,相應(yīng)地?cái)U(kuò)展了游戲GPU市場(chǎng)規(guī)模。NewzooExpert預(yù)計(jì)2020-2025年全球游戲玩家人數(shù)復(fù)合年增率為4.2%。
游戲GPU的主要分類:根據(jù)現(xiàn)行市場(chǎng)上的主要產(chǎn)品可劃分為四類:1)游戲機(jī)、2)PC端主機(jī)游戲、3)控制臺(tái)、4)VR&AR。根據(jù)JonPeddie Research統(tǒng)計(jì),2021年Q4全球PCGPU出貨量(包括集成和獨(dú)立顯卡)高達(dá)11000萬片。受到俄烏沖突、天然氣供應(yīng)等沖擊性全球事件影響,2022年Q1、Q2,全球PCGPU出貨量略有下降。
由于PC正常運(yùn)行必須要求硬件上同時(shí)具備CPU和GPU,因此每臺(tái)PC至少需要一張集成顯卡或獨(dú)立顯卡,此外,根據(jù)需求可再增購(gòu)獨(dú)立顯卡。根據(jù)JPR統(tǒng)計(jì),全球GPU與PC配售比在2022Q1達(dá)到了129%。
