國(guó)內(nèi)企業(yè)已開(kāi)啟算力布局,國(guó)產(chǎn)GPU跟不跟得上此次好時(shí)機(jī)?
我國(guó)對(duì)算力的需求空間廣闊,算力規(guī)模正呈現(xiàn)高速增長(zhǎng)態(tài)勢(shì)。
近日,中國(guó)工程院院士高文在第21屆《財(cái)經(jīng)》年會(huì)上表示,算力網(wǎng)是算力發(fā)展的必然趨勢(shì),就像從電力跨越到電力網(wǎng)一樣是必然的歷史階段。
10月初,工業(yè)和信息化部、中央網(wǎng)信辦、教育部等六部門(mén)印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》,并提出到2025年,算力規(guī)模超過(guò)300EFLOPS(EFLOPS是指每秒百億億次浮點(diǎn)運(yùn)算次數(shù)),智能算力占比達(dá)到35%,東西部算力平衡協(xié)調(diào)發(fā)展。
為什么要大力發(fā)展算力
算力是指計(jì)算機(jī)系統(tǒng)能夠完成的計(jì)算任務(wù)量,通常用來(lái)描述計(jì)算機(jī)的處理能力。
算力是數(shù)字經(jīng)濟(jì)發(fā)展的重要底座。隨著AI與數(shù)字經(jīng)濟(jì)的發(fā)展,算力規(guī)模不斷擴(kuò)大,需求持續(xù)攀升。
AI浪潮來(lái)襲,通用大模型的訓(xùn)練、行業(yè)大模型的訓(xùn)練、基于通用大模型的行業(yè)應(yīng)用以及推理皆需要大量智能算力提供支持。AI芯片、AI服務(wù)器以及云計(jì)算算力需求將持續(xù)提升。
回顧歷史,人類(lèi)社會(huì)目前經(jīng)歷了三次重大的產(chǎn)業(yè)變革:蒸汽時(shí)代、電氣時(shí)代、信息時(shí)代,其分別對(duì)應(yīng)了18世紀(jì)60年代末期英國(guó)人詹姆斯·瓦特制造的第一代具有實(shí)用價(jià)值的蒸汽機(jī)、美國(guó)在19世紀(jì)60年代實(shí)現(xiàn)了電力的廣泛應(yīng)用以及電燈被發(fā)明、1946年美國(guó)制造出人類(lèi)第一臺(tái)二進(jìn)制計(jì)算機(jī)。每一次的產(chǎn)業(yè)革命都具有幾個(gè)共通點(diǎn),首先均有標(biāo)志性的產(chǎn)品面世,其次持續(xù)時(shí)間較長(zhǎng)以及對(duì)于世界發(fā)展影響深遠(yuǎn)。
如今,人類(lèi)社會(huì)或已處在人工智能時(shí)代的臨門(mén)一腳。2022年11月,ChatGPT的發(fā)布讓世界看到了無(wú)限的可能性,這僅僅只是“智能革命”的起點(diǎn),未來(lái)或?qū)⒊尸F(xiàn)出各行業(yè)各接納人工智能,人工智能助推世界發(fā)展的景象。
事實(shí)上,作為數(shù)字經(jīng)濟(jì)時(shí)代新的生產(chǎn)力,算力不僅為傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)提供支撐,還能催生新的經(jīng)濟(jì)增長(zhǎng)點(diǎn)。算力融入傳統(tǒng)制造業(yè),參與生產(chǎn)過(guò)程,可為企業(yè)智能化改造和數(shù)字化轉(zhuǎn)型提供有力支撐。
據(jù)IDC和浪潮信息聯(lián)合發(fā)布的《2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》,預(yù)計(jì)到2023年年底,中國(guó)將有50%的制造業(yè)供應(yīng)鏈環(huán)節(jié)采用人工智能技術(shù)實(shí)現(xiàn)業(yè)務(wù)體驗(yàn)提升。在未來(lái),隨著AI技術(shù)對(duì)傳統(tǒng)行業(yè)賦能作用日益凸顯,催生出更大智算需求成為必然。
算力資源是數(shù)字經(jīng)濟(jì)發(fā)展的重要底座。未來(lái),應(yīng)用更廣泛、更智慧的算力,必將在各類(lèi)數(shù)字化要素的協(xié)同中實(shí)現(xiàn)更大價(jià)值。
上市公司紛紛開(kāi)啟算力規(guī)劃
算力是指計(jì)算機(jī)或其他計(jì)算設(shè)備在一定時(shí)間內(nèi)可以處理的數(shù)據(jù)量或完成的計(jì)算任務(wù)的數(shù)量。算力通常被用來(lái)描述計(jì)算機(jī)或其他計(jì)算設(shè)備的性能,它的衡量方式有計(jì)算速度、計(jì)算能耗、計(jì)算精度等。
工信部數(shù)據(jù)顯示,截至2023年6月底,全國(guó)在用數(shù)據(jù)中心機(jī)架總規(guī)模超過(guò)760萬(wàn)標(biāo)準(zhǔn)機(jī)架,算力總規(guī)模達(dá)到197百億億次/秒(即197EFLOPS=197*1000P,1P=每秒1000萬(wàn)億次計(jì)算速度),算力總規(guī)模近5年年均增速近30%,存力總規(guī)模超過(guò)1080EB(1EB=1024*1024PB)。
作為全球第二大經(jīng)濟(jì)體,我國(guó)對(duì)算力的需求空間廣闊,算力規(guī)模正呈現(xiàn)高速增長(zhǎng)態(tài)勢(shì),智能算力規(guī)模增速遠(yuǎn)高于通用算力規(guī)模的增速。據(jù)IDC測(cè)算,我國(guó)智能算力規(guī)模預(yù)計(jì)到2026年將達(dá)到1271.4EFLOPS,2021-2026年期間年復(fù)合增長(zhǎng)率達(dá)52.3%;而通用算力規(guī)模方面,預(yù)計(jì)2026年將達(dá)到111.3EFLOPS,2021-2026年期間年復(fù)合增長(zhǎng)率為18.5%。
巨大需求推動(dòng)之下,國(guó)內(nèi)企業(yè)紛紛開(kāi)啟算力規(guī)劃。證券時(shí)報(bào)·數(shù)據(jù)寶根據(jù)公告或互動(dòng)平臺(tái)信息不完全統(tǒng)計(jì),恒潤(rùn)股份、中貝通信、利通電子等21家上市公司對(duì)其現(xiàn)階段及遠(yuǎn)期的算力進(jìn)行規(guī)劃。
具體來(lái)看,中貝通信官網(wǎng)新聞表示,年內(nèi)實(shí)現(xiàn)算力服務(wù)10000P;錦雞股份規(guī)劃的10000P算力項(xiàng)目尚在建設(shè)初期,當(dāng)前正在推動(dòng)一期2000P算力項(xiàng)目建設(shè);世紀(jì)華通遠(yuǎn)期規(guī)劃算力1400P;弘信電子預(yù)計(jì)2年內(nèi)達(dá)到10000P;匯納科技與并濟(jì)科技等共同出資設(shè)立四川匯算智算科技有限公司,四川匯算智算初期規(guī)劃算力規(guī)模約4500P。
優(yōu)刻得-W在互動(dòng)平臺(tái)回復(fù)稱(chēng),公司目前管理的AI算力規(guī)模約為3000P+;預(yù)計(jì)新增AI算力規(guī)模約為1000P+。
統(tǒng)計(jì)顯示,上述21家公司研發(fā)費(fèi)用率(研發(fā)費(fèi)用/營(yíng)業(yè)收入)普遍較高,且多數(shù)呈上升趨勢(shì),2023年前三季研發(fā)費(fèi)用率同比增加的公司有14家,包括亞康股份、恒潤(rùn)股份、眾合科技等。其中匯納科技、優(yōu)刻得-W研發(fā)費(fèi)用率均超過(guò)10%,前者高達(dá)22.18%,較上一年同期增加4.9個(gè)百分點(diǎn)。
國(guó)產(chǎn)GPU發(fā)展窗口期已至,生態(tài)構(gòu)筑核心優(yōu)勢(shì)
AI發(fā)展帶動(dòng)算力硬件需求,我們認(rèn)為未來(lái)三年可能是國(guó)產(chǎn)GPU發(fā)展關(guān)鍵窗口期。目前國(guó)產(chǎn)算力硬件理論性能可接近國(guó)際主流,但軟件生態(tài)是限制理論性能和開(kāi)發(fā)者使用的重要因素。
CUDA是GPU生態(tài)的先驅(qū),實(shí)現(xiàn)了GPU從圖形硬件向算力硬件的轉(zhuǎn)變。2006年CUDA推出后,開(kāi)發(fā)者無(wú)需再通過(guò)圖形API來(lái)調(diào)用GPU,而是可以直接操控GPU。CUDA在長(zhǎng)期發(fā)展中逐步滲透了HPC與AI生態(tài),2023年已經(jīng)迭代到第12代API,具備了巨量軟件組件,塑造了用戶(hù)習(xí)慣,如今要將其取代需要巨量的時(shí)間和資源投入。以CUDA為模板,我們可以發(fā)現(xiàn),其他算力芯片的生態(tài)要接近CUDA的地位,應(yīng)當(dāng)盡可能在(并行計(jì)算相關(guān))軟件庫(kù)覆蓋率以及AI框架支持度方面進(jìn)行投入。
CUDA為用戶(hù)提供便利的同時(shí),也帶來(lái)了代價(jià),一是需要承受英偉達(dá)硬件不低的成本,二是閉源的CUDA導(dǎo)致部分使用者面臨供應(yīng)不確定性。因此需要CUDA的低成本替代方案,目前AMD推出的ROCm軟件平臺(tái)未來(lái)有望替代CUDA。
ROCm作為后發(fā)者,采用開(kāi)源方式,聚集開(kāi)發(fā)者力量是合理選擇。目前ROCm生態(tài)中,除專(zhuān)為AMD硬件優(yōu)化的AOCC編譯器外,均為開(kāi)源組件。我們認(rèn)為未來(lái)ROCm與CUDA可能類(lèi)似Python和MATLAB的發(fā)展路線,ROCm可能在部分大型統(tǒng)一生態(tài)領(lǐng)域獲得認(rèn)可,而CUDA在大量細(xì)分場(chǎng)景的優(yōu)勢(shì)有望持續(xù)。
對(duì)AI芯片而言,通用并行運(yùn)算庫(kù)未必都能支持,對(duì)于AI框架的完善支持相對(duì)較為關(guān)鍵。其主要工作包括算子庫(kù)與輔助軟件庫(kù)的適配,我們認(rèn)為對(duì)于大型公司其適配耗時(shí)大致需3-5年。華為昇騰在國(guó)內(nèi)AI框架適配進(jìn)度較為領(lǐng)先,率先實(shí)現(xiàn)Pytorch NPU原生支持。我們認(rèn)為較高的適配時(shí)間需求可能導(dǎo)致先發(fā)優(yōu)勢(shì)持續(xù)。
