計算芯片“新貴”DPU,是國產(chǎn)芯片的下一個突破口嗎?
與卸載方法相比,芯片正面臨標線限制( reticle limits ),網(wǎng)絡(luò)和存儲功能的 CPU 處理非常昂貴等挑戰(zhàn),這些事實結(jié)合起來使 DPU 成為可能。因為其出現(xiàn)能夠更好地保護服務(wù)器工作負載,尤其是在多租戶(multitenant)環(huán)境中,這使得 DPU 不可避免。而現(xiàn)在,這種卸載的經(jīng)濟性使 DPU變得非??扇 ?br style="white-space: normal; color: rgb(102, 102, 102); font-family: 宋體; font-size: 12px;"/>
Amazon Web Services 發(fā)明了 Nitro DPU,Google 與 Intel 合作創(chuàng)建“Mount Evans”IPU,AMD 收購 了Xilinx 和 Pensando(兩者都有 DPU)以及 Nvidia 收購 Mellanox Technology。他們這些動作背后的原因都是——DPU 正在成為網(wǎng)絡(luò)中的控制點,并且越來越多地成為計算和存儲的看門人,它是這些超大規(guī)模廠商和希望將 DPU 傳播給大眾的 IT 供應(yīng)商的所有系統(tǒng)架構(gòu)的中心。
進入九月,在美國發(fā)出對中國出口高性能數(shù)據(jù)中心GPU的限制后,加速計算核心技術(shù)國產(chǎn)化的趨勢日漸明朗,這也順勢帶動了國產(chǎn)AI芯片、DPU、GPU市場熱度。在資本市場上,中國相關(guān)概念股應(yīng)聲上漲、同時相關(guān)企業(yè)融資成功的消息更是層出不窮,國內(nèi)芯片企業(yè)正在趁勢快速發(fā)展著。
9月20日訊,根據(jù)國內(nèi)媒體報道,國產(chǎn)DPU芯片公司中科馭數(shù)今天宣布完成數(shù)億元B輪融資,融資規(guī)模遠超以往輪次。據(jù)悉,本次融資主要由金融街資本領(lǐng)投,建設(shè)銀行旗下建信資本跟投,老股東靈均投資、光環(huán)資本、泉宗資本追投,中科馭數(shù)希望借此加速自研DPU芯片的迭代與產(chǎn)業(yè)布局。
問題來了,如今火爆全網(wǎng)的DPU到底是什么?它和我們這些普通消費者所熟知的CPU、GPU到底有什么不同之處?比起混合CPU+GPU的傳統(tǒng)異構(gòu)計算架構(gòu),DPU在計算領(lǐng)域里究竟擁有著怎樣的優(yōu)勢?在這場圍繞數(shù)字化時代的異構(gòu)計算大亂斗中,國產(chǎn)DPU的發(fā)展前景如何?讓我們來好好探討一下。
什么是DPU?
所謂DPU,指的是數(shù)據(jù)處理器(Data Processing Unit),理論上是繼CPU、GPU之后,設(shè)置在數(shù)據(jù)中心內(nèi)部的第三顆主力芯片。
根據(jù)維基顯示,DPU的概念最早是由美國初創(chuàng)公司Fungible提出的。在Fungible的定義中,DPU是一種運行Linux操作系統(tǒng)的SoC,其主要目標是通過承擔原本由CPU承擔的網(wǎng)絡(luò)、存儲和安全的加速處理任務(wù),滿足網(wǎng)絡(luò)側(cè)的專用計算需求,以此優(yōu)化和提升數(shù)據(jù)中心效能。
事實上,由于制程接近邊際效益、摩爾定律逐漸失效的緣故,如今CPU芯片的性能增長正在逐年放緩,CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的性能增幅。
作為對比,由于云端應(yīng)用的豐富、數(shù)據(jù)中心規(guī)模的擴大、數(shù)字化進展的驅(qū)動,近些年來網(wǎng)絡(luò)帶寬正在飛速上漲,這也導(dǎo)致了目標算力、網(wǎng)絡(luò)帶寬與計算性能的失調(diào),進一步加劇了服務(wù)器節(jié)點上CPU的計算負擔,CPU的算力幾乎已經(jīng)無法應(yīng)對大量云計算帶來的負擔。
在這種背景下,DPU自然應(yīng)運而生。
不同于為了高效管理本地資源而生的傳統(tǒng)CPU架構(gòu),DPU可以說是一種為了管理大量網(wǎng)絡(luò)資源而生的架構(gòu)。舉個例子,為了實現(xiàn)大量數(shù)據(jù)傳輸,數(shù)據(jù)中心的主機每天都要進行海量的?絡(luò)協(xié)議處理,這會大量占用算力,而DPU則可以承擔起網(wǎng)絡(luò)協(xié)議處理的工作,以此分擔CPU的負載,幫助CPU釋放算力負擔。
除了網(wǎng)絡(luò)協(xié)議外,DPU還能承載數(shù)據(jù)中心所需的存儲、安全和虛擬化等工作負載。舉個例子,傳統(tǒng)的數(shù)據(jù)中心要遠程讀取存儲數(shù)據(jù),還需經(jīng)過CPU的編譯和轉(zhuǎn)發(fā),而DPU則可以通過RDMA(遠程直接數(shù)據(jù)存?。┲苯幼x取主機存儲數(shù)據(jù),而AWS推出的Nitro Hypervisor更是宣稱可以通過DPU承擔虛擬化負載,讓CPU免去執(zhí)行虛擬化所需的算力損耗。
綜上所述,大家應(yīng)該也看明白了,DPU的作用本質(zhì)就是給CPU“減負”。將原本CPU要承擔的網(wǎng)絡(luò)、存儲、虛擬化等功能卸載到自己身上,并利用自己的算力特長,對這些工作進行加速運算。
事實上,DPU已經(jīng)不是第一個為彌補CPU能力不足而發(fā)揚光大的產(chǎn)品,多年前GPU的大熱也是為了彌補CPU在圖形處理能力方面的短板,近年逐漸興起的AI芯片本質(zhì)也是為了彌補CPU在人工智能算法方面的不足。至于普通消費者,只要知道DPU是為了數(shù)據(jù)中心這種大規(guī)模算力場景而生的,與我們的臺式機、筆記本電腦基本無關(guān)就行了。
百家爭鳴,誰能笑到最后?
雖說最早提出DPU概念的是Fungible,但是將DPU這一概念重新推向時代潮頭的無疑是英偉達。2020年4月,英偉達以69億美元完成對以色列網(wǎng)絡(luò)芯片商邁絡(luò)思(Mellanox)的收購,英偉達CEO黃仁勛更是將DPU定義為和CPU、GPU并肩的數(shù)據(jù)中心的“三大支柱”之一。
自此,DPU正式成為了芯片領(lǐng)域里的香饃饃,巨大的市場需求推動越來越多的玩家進入DPU賽道。除了國外主流芯片廠商外,如今不少國產(chǎn)公司已在這條百億美元賽道上嶄露頭角,其中不乏阿里云、百度云等互聯(lián)網(wǎng)巨頭,也有中科馭數(shù)、芯啟源、大禹智芯等初創(chuàng)公司。
先看看國外企業(yè),去年6月,英特爾發(fā)布了其可編程網(wǎng)絡(luò)設(shè)備IPU(基礎(chǔ)設(shè)施處理器),用于加速存儲虛擬化、網(wǎng)絡(luò)虛擬化和安全等功能,并釋放CPU核心。今年9月,AMD以19億美元的價格收購DPU芯片廠商Pensando Systems,以此補齊“云戰(zhàn)略”最后一塊拼圖。
在今年4月的GTC大會上,英偉達發(fā)布了新一代數(shù)據(jù)處理器 —— BlueField-3 DPU。這是首款為 AI 和加速計算而設(shè)計的 DPU ,專門針對多租戶、云原生環(huán)境進行了優(yōu)化,據(jù)悉一個BlueField-3 DPU所提供的數(shù)據(jù)中心服務(wù),可相當于多達300個x86主核才能實現(xiàn)的服務(wù)。
國產(chǎn)廠商這邊,今年6月,阿里云在三代神龍卡的基礎(chǔ)上正式推出其自主研發(fā)的云基礎(chǔ)設(shè)施處理器(CIPU),號稱將替代CPU成為云時代IDC的處理核心,可以綜合調(diào)度CPU、GPU、存儲硬盤、交換機等硬件。事實上,這枚芯片除了名字之外,與 DPU的功能和作用幾乎無異。
成立于2018年的中科馭數(shù),在自研敏捷異構(gòu)KPU芯片架構(gòu)以及DPU軟件開發(fā)平臺HADOS的基礎(chǔ)上,自主研發(fā)了業(yè)界首顆融合高性能網(wǎng)絡(luò)與數(shù)據(jù)庫一體化加速功能的DPU芯片和標準加速卡系列產(chǎn)品,目前已經(jīng)和金證股份、中移物聯(lián)網(wǎng)等企業(yè)達成戰(zhàn)略合作。
此外,成立于2015的芯啟源和成立于2020年的大禹智芯也是目前國內(nèi)DPU賽道的主流玩家,其中芯啟推出了基于SoC架構(gòu)的DPU完整解決方案,并于今年6月完成了數(shù)億元Pre-A3輪融資,大禹智芯則是一家由英特爾、思科核心研發(fā)人員組成的初創(chuàng)企業(yè),于今年7月宣布完成數(shù)千萬元Pre-A輪融資。
作為芯片新物種,DPU市場空間正在快速擴張。賽迪顧問預(yù)測,全球DPU市場將在2023-2024年迎來爆發(fā)式增長,預(yù)計至2025年,中國DPU產(chǎn)業(yè)市場規(guī)模將超過565.9億元,全球DPU產(chǎn)業(yè)市場規(guī)模將超過245.3億美元,復(fù)合增速分別為 51.73%、170.60%。
與國外廠商“逐鹿中原”
“我們認為DPU的潛力確實是巨大的?!痹谯迟F??磥恚瑥募夹g(shù)發(fā)展的角度來看,DPU的出現(xiàn)有一定的必然性——上層應(yīng)用對于算力的需求在過去5年急劇增長,使得DPU的應(yīng)用場景很多,它將廣泛分布在5G、云計算、大數(shù)據(jù)、數(shù)據(jù)中心和邊緣計算等領(lǐng)域。
而從工業(yè)和信息化部今年發(fā)布的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021—2023年)》中,鄢貴海更是看到了新型算力芯片難得的歷史發(fā)展機遇。
該計劃明確提出要加快提升算力算效水平,“推動CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力的部署比例”“加強專用服務(wù)器等核心技術(shù)研發(fā)”“樹立基于5G和工業(yè)互聯(lián)網(wǎng)等重點應(yīng)用場景的邊緣數(shù)據(jù)中心應(yīng)用標桿”等要求和措施。
“雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)相比國外一線廠商還有差距,但是在DPU架構(gòu)的理解上是有獨到的見解的,而且我國目前在數(shù)據(jù)中心這個領(lǐng)域,無論是市場規(guī)模、增速還是用戶數(shù)量,相較于國外都有巨大的優(yōu)勢?!臂迟F海認為,國內(nèi)廠商有望充分利用這一“應(yīng)用勢能”,加快發(fā)展步伐,在DPU這個賽道與國外廠商“逐鹿中原”。
不過,挑戰(zhàn)與機遇并存。
“目前要解決DPU標準化應(yīng)用,還存在一定挑戰(zhàn)。”鄢貴海解釋道,由于數(shù)據(jù)中心本身的復(fù)雜性,各大廠商一方面采用商用現(xiàn)貨組件(即COTS)來構(gòu)建系統(tǒng),追求低成本,一方面又設(shè)法分層服務(wù)化,打造面向不用類型客戶的標準化產(chǎn)品,但除此之外的所有技術(shù)實現(xiàn)幾乎都是“八仙過海,各顯神通”——如AWS有Nitro,阿里云有MOC。
“有的廠商強化IO能力、有的關(guān)注路由轉(zhuǎn)發(fā)、有的重視存儲卸載、有的關(guān)注安全加密,不一而足?!臂迟F海說,而上層負載不同,也必然對底層架構(gòu)有各異的需求,這也許是目前DPU標準化面臨的最大挑戰(zhàn)。
