生成式AI“風(fēng)浪”越大,GPU挑戰(zhàn)者越多,未來格局難言成敗
世界已經(jīng)為生成式人工智能瘋狂,而且會變得更加瘋狂。到 2027 年,每年的 GPU 硬件支出將達到4000億美元。
Gartner 的 IT 市場分析師預(yù)計,2024 年的 IT 總支出(包括硬件、軟件、IT 服務(wù)和電信服務(wù))將達到 5.13 萬億美元,同比增長 8.8%。其中,只有 2355 億美元預(yù)計將用于數(shù)據(jù)中心系統(tǒng),即全球銷售的所有服務(wù)器、所有存儲設(shè)備和所有交換設(shè)備。我們認為,這主要得益于用于生成式人工智能的人工智能集群的快速采用,盡管在數(shù)據(jù)中心的更多通用服務(wù)中,基礎(chǔ)設(shè)施支出出現(xiàn)了相當嚴重的下滑,但這一數(shù)字仍增長了 8.1%。
現(xiàn)在,這只是 AI 加速器業(yè)務(wù)數(shù)據(jù)中心部分的 TAM,不包括邊緣和客戶端 AI 硬件加速器的 TAM。AMD 沒有討論更廣泛的芯片市場的 TAM 是多少。幾個月前,IDC 還預(yù)測,到 2027 年,整個服務(wù)器業(yè)務(wù)的規(guī)模將略低于 2000 億美元。
如果逆向計算,使用人工智能服務(wù)器的 GPU 成本約占整體價格的 53% 這一比例,即基于八路 Nvidia HGX GPU 計算復(fù)合機的 37.5 萬美元貨款中約有 20 萬美元,那么如果我們對 IDC 預(yù)測的服務(wù)器市場以及人工智能和非人工智能服務(wù)器之間的分工的猜測是正確的,那么人工智能加速器硬件在 2027 年應(yīng)該只能推動約 500 億美元的 GPU 發(fā)展。顯然,有人需要修改他們對這一切將如何發(fā)展的估計,以及 AMD 所稱的 "數(shù)據(jù)中心 AI 加速器 "的確切含義。它肯定是指 GPU 和 NNP,但也可能指 CPU 的部分銷售額。
無論如何,AMD 所說的是,增長速度超過了計劃,加速器的收入增長率將比我們幾個月前估計的高出 9 倍。
我們認為這絕對稱得上瘋狂。假設(shè)圖形處理器和其他加速器的價格隨著 HBM 內(nèi)存的下降而下降,那么如果這一切都按照蘇世民團隊預(yù)期的那樣發(fā)展,這意味著銷量將真正達到巨大的規(guī)模。有了這樣的增長,許多供應(yīng)商就有了足夠的競爭和利潤空間。
GPU市場規(guī)模高速增長
(一)圖形處理市場GPU市場規(guī)模穩(wěn)固增長
目前來看,游戲產(chǎn)業(yè)發(fā)展已進入存量市場時代。2022年中國游戲市場銷售收入2658.84億元,同比下降10.33%;用戶規(guī)模6.64億,同比下降0.33%。但隨著游戲玩家對游戲畫質(zhì)、圖像幀率等需求的不斷提升,需要高性能 GPU 在特殊渲染算法等方面提供支持,圖形處理器在游戲端仍將占有較大份額。
在專業(yè)圖形渲染領(lǐng)域,國內(nèi)建筑設(shè)計、工業(yè)設(shè)計、影視動畫、虛擬現(xiàn)實等應(yīng)用專業(yè)圖形渲染技術(shù)的細分領(lǐng)域正在蓬勃發(fā)展。作為專業(yè)圖形渲染核心工具,2022 年國內(nèi)圖形設(shè)計/編輯/渲染軟件市場規(guī)模達到536.99億元,預(yù)計2023-2030年復(fù)合增長率為9.62%,據(jù)此測算國內(nèi) 2030年該市場規(guī)模將達到1120億元左右。圖形設(shè)計/編輯/渲染軟件借助高性能 GPU 提升圖形處理能力,以支撐渲染技術(shù)的應(yīng)用,以及高清晰畫質(zhì)、多幀率圖像的呈現(xiàn)。
(二)大規(guī)模擴展計算能力的高性能計算市場爆發(fā)
隨著大數(shù)據(jù)時代的到來,GPU 在并行計算方面的性能優(yōu)勢逐步顯現(xiàn),GPGPU應(yīng)運而生。GPGPU 作為運算協(xié)處理器,針對不同應(yīng)用領(lǐng)域的需求,增加了專用向量、張量、矩陣運算指令,提升了浮點運算的精度和性能,其產(chǎn)品技術(shù)特性已經(jīng)超過傳統(tǒng)圖形處理的應(yīng)用范疇,在數(shù)據(jù)中心、人工智能、自動駕駛等高性能計算領(lǐng)域發(fā)揮重要作用。
根據(jù)《中國算力發(fā)展指數(shù)白皮書(2022 年)》,2021 年國內(nèi)基礎(chǔ)設(shè)施算力規(guī)模達到 140 EFLOPS,位居全球第二,已經(jīng)投入運行的人工智能計算中心近 20個,在建設(shè)的人工智能計算中心超20個。根據(jù)工信部《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023)》和《“十四五”信息通信行業(yè)發(fā)展規(guī)劃》的目標,2023 年我國數(shù)據(jù)中心總算力將超過 200 EFLOPS,2025 年進一步提升至300 EFLOPS。GPU 作為實現(xiàn)算力的基礎(chǔ)硬件之一,在數(shù)據(jù)中心建設(shè)和部署過程中具有廣泛的配套需求。
在數(shù)據(jù)中心領(lǐng)域,作為算力的物理承載,國內(nèi)數(shù)據(jù)中心持續(xù)建設(shè)與擴容,推動數(shù)據(jù)中心總機架數(shù)連年增長。2018-2022年總機架數(shù)由 166 萬架增至650萬架,近5年年均增速超過30%。預(yù)計2025年大型及以上數(shù)據(jù)中心機架數(shù)量將達到802萬個,相應(yīng)的算力規(guī)模持續(xù)擴大。
在人工智能領(lǐng)域,隨著算法發(fā)展的突飛猛進,人工智能模型訓(xùn)練需要巨量算力支撐才能快速有效實施,不斷增加的數(shù)據(jù)量也要求算力同步進化,使得算力成為人工智能技術(shù)突破的關(guān)鍵因素:作為生成式 AI 的典型應(yīng)用,ChatGPT 引領(lǐng)人工智能技術(shù)變革,其大模型的特點帶來了陡增的算力需求。作為算力的硬件基礎(chǔ),當前主流 AI 芯片包括 GPU、FPGA、ASIC 等。
2021年國內(nèi) AI 芯片市場規(guī)模達到 426.8 億元,受益于算力需求的爆發(fā)式增長,預(yù)計 2025年市場規(guī)模將達到 1,780 億元。Al服務(wù)器通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合可以滿足高吞吐量互聯(lián)的需求,為自然語言處理、計算機視覺、機器學(xué)習(xí)等Al應(yīng)用場景提供強大的算力支持,支撐Al算法訓(xùn)練和推理過程。根據(jù) IDC 數(shù)據(jù),2021年國內(nèi)服務(wù)器市場按加速卡類型劃分市場份額中,GPU 占比為91.9%,系服務(wù)器市場按加速卡的主要產(chǎn)品類型,可以預(yù)見 GPU市場的巨大市場空間。
在自動駕駛領(lǐng)域, 2022年全球自動駕駛汽車市場規(guī)模為241 億美元,預(yù)計 2026 年將達到 619 億美元,年復(fù)合增長率為 20.75%。高級駕駛輔助系統(tǒng)(ADAS)作為實現(xiàn)自動駕駛的重要技術(shù)基礎(chǔ),利用 GPU 的并行計算能力實時分析來自激光雷達、毫米波雷達和紅外攝像頭的傳感器數(shù)據(jù),其大規(guī)模推廣將帶動高性能 GPU 的應(yīng)用需求。
英偉達迎來更多挑戰(zhàn)者
而在英偉達的身后,有許多年輕的初創(chuàng)公司正在奮力奔跑,有的不斷推出號稱超過英偉達GPU的產(chǎn)品,有的則瞄準了英偉達的CUDA編程平臺。
據(jù)The Information,2017年至少有十幾家初創(chuàng)公司試圖挑戰(zhàn)英偉達在AI芯片領(lǐng)域的地位,但經(jīng)歷了市場的一輪洗牌之后,該倒閉的倒閉,該換血的換血。
當時比較受關(guān)注的兩家公司,KnuEdge和Reduced Energy Microsystems雙雙倒閉。Wave Computing在2020年申請破產(chǎn),次年以新名稱MIPS東山再起。據(jù)科技網(wǎng)站The Register報道,另一家AI芯片初創(chuàng)公司Mythic的前工程副總裁在領(lǐng)英上寫道,該公司已于去年耗盡現(xiàn)金。今年早些時候,Mythic宣布任命新首席執(zhí)行官,并獲得了1300萬美元融資。
在現(xiàn)存的早期AI芯片初創(chuàng)企業(yè)中,Cerebras生產(chǎn)的大規(guī)模AI芯片整合了英偉達GPU的許多處理能力,而SambaNova Systems似乎是早期最有能力挑戰(zhàn)英偉達的公司。上一輪融資熱潮中,這兩家公司和Graphcore一起以數(shù)十億美元的估值進行了幾輪大型融資。
這輪市場大清洗告訴后來者,初創(chuàng)企業(yè)正面臨著高昂的成本和競爭風(fēng)險。
更重要的是,盡管最近投資者對AI充滿熱情,但初創(chuàng)公司面臨的融資環(huán)境比上一代更為嚴峻。風(fēng)險投資、私募股權(quán)和并購數(shù)據(jù)庫PitchBook的數(shù)據(jù)顯示,今年上半年,AI芯片初創(chuàng)公司獲得的風(fēng)險投資僅略高于10億美元,作為比較,2021年的融資額高達95億美元。
此外,這些初創(chuàng)公司還面臨著進入停滯階段的技術(shù)復(fù)雜性和高昂成本挑戰(zhàn),還需要將設(shè)計完成并交付給臺積電等制造商盡快投產(chǎn)。盡管如此,創(chuàng)始人和投資者都認為,生成式AI將使計算領(lǐng)域產(chǎn)生翻天覆地的變化,這足以使他們從英偉達身上分一杯羹。
國內(nèi)GPU企業(yè)也在發(fā)力
國際大廠競爭的同時,本土GPU廠商也在積極行動。事實上,本輪市場下行對本土GPU廠商來說,既有壓力也是機遇。在“東數(shù)西算”工程的支持下,近年來國內(nèi)涌現(xiàn)出一批GPU企業(yè)。2022年12月20日,天數(shù)智芯舉行發(fā)布通用GPU推理產(chǎn)品“智鎧100”。根據(jù)天數(shù)智芯產(chǎn)品線總裁鄒翾介紹,智鎧100產(chǎn)品卡,可提供最高384TOPS@int8、96TFlops@FP16、24TFlops@FP32的峰值算力,相較于市場上現(xiàn)有主流產(chǎn)品,智鎧100將提供2-3倍的實際使用性能。而此前,壁仞科技發(fā)布的通用GPU BR100,16位浮點算力達到1000T以上、8位定點算力達到2000T以上。芯動科技發(fā)布的“風(fēng)華2號”GPU,像素填充率達48GPixel/秒,F(xiàn)P32浮點算力1.5TFLOPS,性能領(lǐng)跑國產(chǎn)桌面、筆記本電腦和工控機賽道。
對此,芯動科技首席GPU科學(xué)家楊喜樂指出,現(xiàn)代GPU的涉及面廣泛開發(fā)應(yīng)用方面有很多技術(shù)壁壘,對開發(fā)團隊能力要求很高;要拿出一款對標行業(yè)先進水平且流暢兼容各種應(yīng)用的圖形GPU,需要具有跨多領(lǐng)域平臺能力和大量流片交付經(jīng)驗的復(fù)合型技術(shù)團隊,要不斷進行GPU底層技術(shù)、算法架構(gòu)和軟硬件創(chuàng)新。GPU行業(yè)已經(jīng)形成穩(wěn)定的壟斷格局,市場下行對本土GPU廠商來說,必將承受更多壓力,但也將為本土GPU廠商提供新的發(fā)展機遇。
