DPU和DOCA,英偉達(dá)的新戰(zhàn)場(chǎng)
關(guān)鍵詞: 英偉達(dá) 人工智能 云計(jì)算
英偉達(dá)真正的護(hù)城河是軟硬件生態(tài)
計(jì)算機(jī)處理器分為CPU和GPU,它們均可執(zhí)行計(jì)算任務(wù)。然而,兩者在計(jì)算方式上存在顯著的差異。CPU更適合進(jìn)行線性計(jì)算,而GPU則更擅長(zhǎng)并行計(jì)算。
通過CUDA這一媒介,研究人員和編程人員能夠使用編程語言與硬件設(shè)備進(jìn)行交互,將復(fù)雜的數(shù)學(xué)問題分解成多個(gè)簡(jiǎn)單的子問題,然后分發(fā)給GPU的多個(gè)計(jì)算核心進(jìn)行處理。
在航空航天、生物科學(xué)研究、機(jī)械和流體模擬以及能源探索等領(lǐng)域,有80%的研究工作是建立在CUDA基礎(chǔ)之上的。
其實(shí)各廠商的AI芯片的性能差距并不很大,也可以追趕,拉開差距的關(guān)鍵在于英偉達(dá)的CUDA計(jì)算架構(gòu)及軟硬件生態(tài)。
通過CUDA技術(shù)的運(yùn)用,原本僅用于3D渲染的GPU得以在通用計(jì)算領(lǐng)域發(fā)揮作用,從而將應(yīng)用領(lǐng)域從游戲(圖形渲染)擴(kuò)展到了高性能計(jì)算、自動(dòng)駕駛等多個(gè)領(lǐng)域。
英偉達(dá)作為GPU核心供應(yīng)商,通過CUDA架構(gòu)構(gòu)建了一個(gè)高度穩(wěn)定的開發(fā)者生態(tài)系統(tǒng),推動(dòng)了其從傳統(tǒng)GPU供應(yīng)商轉(zhuǎn)型為平臺(tái)化公司。
AI浪潮下,軟硬件生態(tài)位發(fā)生變化
而在生成式AI時(shí)代,人工智能正在呈爆發(fā)式發(fā)展,成為數(shù)據(jù)中心算力需求的主要驅(qū)動(dòng)力之一。
為了卸載、加速和隔離數(shù)據(jù)中心基礎(chǔ)設(shè)施工作負(fù)載,DPU應(yīng)運(yùn)而生。
通過為高帶寬、低延遲、數(shù)據(jù)密集的計(jì)算場(chǎng)景提供計(jì)算引擎,DPU成了繼CPU、GPU之后,數(shù)據(jù)中心場(chǎng)景中的第三顆重要的算力芯片。
可以說,DPU是企業(yè)構(gòu)建加速計(jì)算平臺(tái)、AI工廠的關(guān)鍵。
DPU的最基本功能在于其能夠取代CPU,從而構(gòu)建以數(shù)據(jù)為中心的計(jì)算架構(gòu)。
通過采用DOCA,開發(fā)者可以創(chuàng)建軟件定義的、云原生的、由DPU加速的服務(wù)。
以此來對(duì)未來的數(shù)據(jù)中心基礎(chǔ)設(shè)施進(jìn)行編程,同時(shí)實(shí)現(xiàn)零信任保護(hù),以滿足現(xiàn)代數(shù)據(jù)中心日益增長(zhǎng)的性能和安全需求。
不斷進(jìn)階的DPU
去年英偉達(dá)發(fā)布了第一款DPU產(chǎn)品BlueField-2,今年的GTC上又發(fā)布了BlueField-3,BlueField-3會(huì)在明年上半年推向市場(chǎng)。
而從其路線圖上也可以看出,其DPU產(chǎn)品的性能實(shí)現(xiàn)了很大的跨越。從BlueField-2到BlueField-3,它的整形計(jì)算能力提升了5倍。
BlueField-2 目前為軟件定義的網(wǎng)絡(luò)安全和存儲(chǔ)卸載了相當(dāng)于125 個(gè)CPU核的工作量,而BlueField-3則能達(dá)到300個(gè)CPU核。
到了BlueField-4以后,英偉達(dá)把GPU集成到DPU里來,DPU就真正成為一個(gè)完整的數(shù)據(jù)中心單元。
據(jù)預(yù)測(cè),到2025年,DPU全球市場(chǎng)容量將達(dá)到120億美金。
在這個(gè)領(lǐng)域,業(yè)界已經(jīng)形成了一種共識(shí),即采用可編程的、開放式的基礎(chǔ)設(shè)施。
社會(huì)數(shù)字化轉(zhuǎn)型浪潮下,潛在海量數(shù)據(jù)待處理,DPU的邊界、職能、價(jià)值都尚在探討前期。
DOCA軟件堆棧同步DPU腳步
通過DOCA,開發(fā)人員可以利用行業(yè)標(biāo)準(zhǔn)的API在英偉達(dá)BlueField數(shù)據(jù)處理器(DPU)上快速創(chuàng)建網(wǎng)絡(luò),存儲(chǔ),安全以及管理服務(wù),以及AI/HPC的一系列應(yīng)用程序和服務(wù)。
因此,為了在這個(gè)市場(chǎng)獲得更大的成功,英偉達(dá)必須努力提高DOCA的完善程度和普及程度。
在2020年的GTC大會(huì)上,英偉達(dá)發(fā)布了DOCA 1.0。
在2021年,隨著DPU產(chǎn)品在市場(chǎng)上的成功,英偉達(dá)推出了與之配合的DOCA 1.2。
為了進(jìn)一步擴(kuò)大在DPU市場(chǎng)的份額,英偉達(dá)不斷加大技術(shù)創(chuàng)新的力度,于2022年5月推出了DOCA 1.3。
DOCA框架為開發(fā)者提供了一致的開發(fā)體驗(yàn),簡(jiǎn)化了開發(fā)環(huán)境和構(gòu)建部署的復(fù)雜性,從而為開發(fā)者帶來了諸多便利。
近日,據(jù)英偉達(dá)中國(guó)官方微博消息,英偉達(dá)今日發(fā)布首部DPU和DOCA編程入門書籍《數(shù)據(jù)處理器:DPU編程入門》,號(hào)稱可為使用 英偉達(dá)BlueField系列DPU和DOCA開發(fā)環(huán)境的開發(fā)者提供實(shí)用指南。
結(jié)尾:
英偉達(dá)的DPU和DOCA技術(shù)無疑是一項(xiàng)重大突破,但它們面臨著激烈的市場(chǎng)競(jìng)爭(zhēng)。
包括Marvell、Cisco和AMD等廠商也在積極研發(fā)DPU技術(shù),亞馬遜、阿里巴巴等云服務(wù)提供商也已經(jīng)在數(shù)據(jù)中心中采用DPU技術(shù)。
競(jìng)爭(zhēng)激烈,但英偉達(dá)憑借其豐富的經(jīng)驗(yàn)和強(qiáng)大的研發(fā)實(shí)力,仍然有望在這個(gè)領(lǐng)域取得成功。
