市場(chǎng)缺口超10萬張，國(guó)內(nèi)GPU市場(chǎng)將在這些賽道“上分”！

2023-08-14 來源：賢集網(wǎng)

1537

GPU Utils 發(fā)布了一份關(guān)于英偉達(dá)GPU——主要是H100的研究報(bào)告，試圖梳理有關(guān)GPU供應(yīng)和需求的相關(guān)問題。在這篇主要針對(duì)美國(guó)市場(chǎng)的報(bào)告中，我們看到了目前阻礙大模型和人工智能發(fā)展的關(guān)鍵瓶頸GPU短缺是如何形成和發(fā)展的。

總的來說，GPU瓶頸的出現(xiàn)原因是多方面的，環(huán)環(huán)相扣的復(fù)雜工藝制造流程，半導(dǎo)體周期，對(duì)稀缺資源的搶占與恐慌乃至未曾預(yù)料到的人工智能的突然爆發(fā)，都讓GPU算力變得無比緊張。

樂觀地看，2024年這一瓶頸或許會(huì)有所緩解。

數(shù)十萬張缺口，一百五十億需求

每個(gè)想要在人工智能爆發(fā)中分一杯羹的人都需要GPU。準(zhǔn)確地說，是英偉達(dá)的A100和H100，它們?cè)谟?xùn)練和推理大模型中扮演關(guān)鍵角色。如果要想要從頭訓(xùn)練大模型，至少需要上千張A100或H100，而推理和微調(diào)大模型也至少需要儲(chǔ)存100張。

具體到每家的數(shù)量上，報(bào)告匯總了一些數(shù)據(jù)：GPT4在1萬到2.5萬塊A100上訓(xùn)練，Meta有2.1萬塊A100，特斯拉有7000塊，Stability AI有5000塊，谷歌云大概有2.5萬塊H100，微軟Azure 有1萬到4萬塊，甲骨文可能也有同樣多的H100。值得一提的是，Azure的GPU基本都用來供應(yīng)OpenAI的訓(xùn)練了。

而根據(jù)馬斯克的說法，GPT5的訓(xùn)練可能會(huì)用到3萬到5萬張H100，因此對(duì)未來的估計(jì)上，報(bào)告指出OpenAI可能需要5萬張H100，Meta至少需要2.5萬張（也有人說實(shí)際上需要10萬乃至更多），所有的云服務(wù)廠商，微軟、谷歌云和亞馬遜云以及甲骨文各需要3萬張，私有云服務(wù)商，比如剛剛?cè)谫Y的CoreWeave等總需求是10萬張，而像Claude的開發(fā)者Anthropic這樣的初創(chuàng)公司也都至少需要1萬張GPU。

另外，一些金融公司比如JP Morgan等也在部署A100或H100，因此總體上看，對(duì)H100的需求超過了43萬張。

這還是不算中國(guó)市場(chǎng)的情況，由于制裁原因，字節(jié)跳動(dòng)、百度、騰訊和阿里巴巴只能大量購(gòu)買A100和H100的替代產(chǎn)品A800與H800，這一部分的需求沒有列入其中，根據(jù)《金融時(shí)報(bào)》的說法，其總額高達(dá)50億美金。

如果將這些數(shù)字相加，這就是目前英偉達(dá)面對(duì)的，總計(jì)規(guī)模高達(dá)200億美元的GPU需求。

GPU 短缺阻礙ChatGPT進(jìn)步速度

據(jù)《財(cái)富》雜志報(bào)道，OpenAI 公司 CEO 山姆奧特曼在一場(chǎng)非公開會(huì)議上透露，GPU 的嚴(yán)重短缺阻礙了 ChatGPT 的進(jìn)步。

報(bào)道稱，奧特曼于 5 月會(huì)見了多位 App 開發(fā)者和初創(chuàng)公司的管理者。倫敦 AI 初創(chuàng)公司 Humanloop 的 CEO 拉扎哈比卜在一則推文中稱，奧特曼認(rèn)為 OpenAI 缺少足夠的 GPU，這導(dǎo)致許多優(yōu)化 ChatGPT 的工作被迫推遲。

哈比卜的會(huì)議記錄顯示，客戶對(duì) ChatGPT 最大的抱怨是 API 界面的速度和可靠性。奧特曼對(duì)此表示理解，并解釋稱主要原因是 GPU 嚴(yán)重不足。

會(huì)議記錄公開后不久，OpenAI 聯(lián)系了哈比卜，表示該活動(dòng)不便公開發(fā)布。隨后哈比卜刪除了這則推文。據(jù)介紹，奧特曼抱怨了 GPU 短缺導(dǎo)致算力不足，OpenAI 無法擴(kuò)大 ChatGPT 的對(duì)話框列表。這影響了 ChatGPT 在回答用戶問題時(shí)可以處理的信息量，限制了 ChatGPT 的“記憶力”，如過往提問記錄等。此外，ChatGPT 由于算力不足也無法完成更繁瑣的任務(wù)，例如寫出復(fù)雜的程序代碼等。

算力租賃正在興起

近期各AI廠商紛紛拿出大模型“秀肌肉”之時(shí)，多位觀察人士告訴財(cái)聯(lián)社記者，大數(shù)據(jù)、人工智能等領(lǐng)域的快速發(fā)展推動(dòng)算力需求（特別是大模型和行業(yè)應(yīng)用等方面）迅速增長(zhǎng)。據(jù)了解，GPU需求旺盛并已陷入供應(yīng)短缺。

“不像消費(fèi)顯卡，很多商家會(huì)有庫存，它本來存貨就很少，整個(gè)供應(yīng)鏈上的貨不超過三四千片，GPT熱度起來以后就被互聯(lián)網(wǎng)大廠全部鎖完了，今年3月后市場(chǎng)上基本沒有存貨了，部分大廠開始直接從國(guó)外渠道找一些貨回來，現(xiàn)在50%以上的訂單基本都是互聯(lián)網(wǎng)大廠下的?！睆垇喼拊诮邮茇?cái)聯(lián)社記者采訪時(shí)表示。

張亞洲告訴記者，包括微軟、英特爾等海外大廠一邊自研、一邊也在對(duì)外采購(gòu)，他們前期訂的一部分（GPU訂單），可能用于大規(guī)模訓(xùn)練，對(duì)于推理還是不夠的?；旧蠌S商低于一個(gè)億的訂單，也許渠道商都不愿搭理，發(fā)郵件都不回?！盙PU的火爆程度由此可見一斑。

而從價(jià)格層面看，多款GPU價(jià)格從3、4月至今漲幅接近50%。張亞洲稱，“4月份的時(shí)候（訂單）大概還能排到10月份，現(xiàn)在已經(jīng)到明年上半年了?！?/span>

鯨平臺(tái)專家、鑒片工場(chǎng)創(chuàng)始人張力卜告訴財(cái)聯(lián)社記者，“很多企業(yè)和個(gè)人都需要用到高性能的GPU來進(jìn)行深度學(xué)習(xí)的訓(xùn)練和應(yīng)用，但自己購(gòu)買服務(wù)器建設(shè)數(shù)據(jù)中心的成本又很高，所以選擇租賃云算力平臺(tái)是比較劃算和靈活的方式?！被谶@一邏輯，租用計(jì)算資源的算力租賃模式當(dāng)前正在興起。

國(guó)內(nèi)GPU應(yīng)用三大市場(chǎng)

GPU應(yīng)用場(chǎng)景不斷擴(kuò)大拉動(dòng)GPU市場(chǎng)空間迅猛增長(zhǎng)，根據(jù)VerifiedMarket Research預(yù)測(cè)，2027年中國(guó)GPU市場(chǎng)規(guī)模將會(huì)增長(zhǎng)至345.57億美元。

GPU市場(chǎng)主要應(yīng)用場(chǎng)景可概括為：AI&數(shù)據(jù)中心、智能汽車、游戲。

I&數(shù)據(jù)中心：新一輪AI對(duì)算力需求遠(yuǎn)超以往：ChatGPT類語言大模型底層是2017年出現(xiàn)的Transformer架構(gòu)，該架構(gòu)相比傳統(tǒng)的CNN/RNN為基礎(chǔ)的AI模型，參數(shù)量達(dá)到數(shù)千億，對(duì)算力消耗巨大，對(duì)算力硬件有大量需求。隨著對(duì)商業(yè)數(shù)據(jù)和大數(shù)據(jù)處理要求算力的不斷提高，GPU的通用計(jì)算能力正在越來越廣泛地被應(yīng)用與數(shù)據(jù)中心和國(guó)家超算中心的建設(shè)。

智能汽車：智能汽車方興未艾，自動(dòng)駕駛和智慧座艙是智能汽車發(fā)展的主要方向，均需大量使用GPU。

游戲：游戲業(yè)務(wù)是GPU應(yīng)用的傳統(tǒng)領(lǐng)域，對(duì)游戲畫面進(jìn)行3D渲染，英偉達(dá)的游戲業(yè)務(wù)穩(wěn)中有進(jìn)。

1、AI：數(shù)據(jù)中心和終端場(chǎng)景不斷落地對(duì)計(jì)算芯片提出更多更高需求

依據(jù)部署位置劃分，AI芯片可以細(xì)分為終端芯片和云端芯片，云端芯片市場(chǎng)空間越為終端芯片的2-3倍。

云端芯片：云端芯片應(yīng)用于云端服務(wù)器，可以進(jìn)一步細(xì)分為推理芯片和訓(xùn)練芯片。根據(jù)甲子光年數(shù)據(jù)，2018年中國(guó)云端芯片市場(chǎng)約46.1億元，該機(jī)構(gòu)預(yù)計(jì)2023年增長(zhǎng)至384.6億元。

終端芯片：應(yīng)用于嵌入式、移動(dòng)終端、智能制造、智能家居等領(lǐng)域的AI芯片，終端芯片需要低功耗和更高的能效比，但是對(duì)算力的需求也相對(duì)較低，主要應(yīng)用與AI推理。根據(jù)甲子光年數(shù)據(jù)，2018年中國(guó)終端芯片市場(chǎng)約15億元，該機(jī)構(gòu)預(yù)計(jì)2023年增長(zhǎng)至173億元。

AI芯片總市場(chǎng)232億元，其中云端芯片市場(chǎng)空間更大，預(yù)計(jì)終端芯片將隨著AI在多行業(yè)落地將進(jìn)一步放量。甲子光年預(yù)測(cè)，中國(guó)AI芯片市場(chǎng)規(guī)模將從2021年232億元增長(zhǎng)至2023年的500億元左右，對(duì)應(yīng)中國(guó)云端芯片市場(chǎng)的復(fù)合增長(zhǎng)率為52.8%；終端芯片市場(chǎng)規(guī)模相對(duì)較小，但由于人工智能在汽車、安防、智能家居等行業(yè)滲透，屆時(shí)市場(chǎng)規(guī)模增長(zhǎng)率達(dá)到62.2%。

2、汽車智能化浪潮下汽車GPU市場(chǎng)前景廣闊

自動(dòng)駕駛

汽車智能化浪潮下，自動(dòng)駕駛和智能座艙是最具有發(fā)展前景的兩個(gè)方向，GPU應(yīng)用于二者的域控制器，智能汽車主流的域控制器采用SoC與MCU結(jié)合的方案，SoC（片上系統(tǒng)）由GPU、CPU、AI引擎、DPU等組成。GPU在自動(dòng)駕駛中的作用表現(xiàn)在圖形處理和并行計(jì)算，ADAS平臺(tái)可以利用GPU的并行計(jì)算能力實(shí)時(shí)分析來自激光雷達(dá)、雷達(dá)和紅外攝像頭的傳感器數(shù)據(jù)。

蓋世汽車預(yù)計(jì)到2025年中國(guó)自動(dòng)駕駛域控制器出貨量達(dá)到432萬臺(tái)，自動(dòng)駕駛域控制器與SoC之比在1:1到1:4之間，市場(chǎng)份額較高的SoC通常搭載一片GPU。

智能座艙

GPU虛擬化技術(shù)助力智能座艙一芯多屏化發(fā)展，智能座艙芯片主要為SoC（片上系統(tǒng)），SoC由GPU、CPU、AI引擎、DPU等組成。智能座艙向著一芯多屏的形態(tài)發(fā)展，這對(duì)芯片并行計(jì)算的要求不斷提高，GPU硬件虛擬化技術(shù)在智能座艙中有著無可替代的優(yōu)勢(shì)。在智能座艙屏幕、儀表盤、車載與各系統(tǒng)中均需要使用GPU。

蓋世汽車預(yù)計(jì)2025年中國(guó)智能座艙域控制器出貨量達(dá)到528萬臺(tái)，智能座艙一臺(tái)域控制器內(nèi)置一個(gè)SoC，位于汽車的中央顯示屏內(nèi)，一個(gè)SoC通常搭載一片GPU。

3、游戲玩家人數(shù)持續(xù)增長(zhǎng)，游戲GPU市場(chǎng)規(guī)模穩(wěn)中有升

游戲市場(chǎng)是傳統(tǒng)意義上GPU最關(guān)鍵的市場(chǎng)，隨著千禧一代游戲需求的進(jìn)一步提升，全球游戲玩家數(shù)量穩(wěn)增，相應(yīng)地?cái)U(kuò)展了游戲GPU市場(chǎng)規(guī)模。NewzooExpert預(yù)計(jì)2020-2025年全球游戲玩家人數(shù)復(fù)合年增率為4.2%。

游戲GPU的主要分類：根據(jù)現(xiàn)行市場(chǎng)上的主要產(chǎn)品可劃分為四類：1）游戲機(jī)、2）PC端主機(jī)游戲、3）控制臺(tái)、4）VR&AR。根據(jù)JonPeddie Research統(tǒng)計(jì)，2021年Q4全球PCGPU出貨量（包括集成和獨(dú)立顯卡）高達(dá)11000萬片。受到俄烏沖突、天然氣供應(yīng)等沖擊性全球事件影響，2022年Q1、Q2，全球PCGPU出貨量略有下降。

由于PC正常運(yùn)行必須要求硬件上同時(shí)具備CPU和GPU，因此每臺(tái)PC至少需要一張集成顯卡或獨(dú)立顯卡，此外，根據(jù)需求可再增購(gòu)獨(dú)立顯卡。根據(jù)JPR統(tǒng)計(jì)，全球GPU與PC配售比在2022Q1達(dá)到了129%。