單線程暴漲50%!解密Arm Neoverse平臺沖擊數(shù)據(jù)中心的底氣
Arm近年來一直在高性能領(lǐng)域發(fā)力,無論是數(shù)據(jù)中心還是超算,Arm出現(xiàn)的頻率似乎越來越高。本月英偉達(dá)發(fā)布了旗下首個數(shù)據(jù)中心CPU Grace就采用了Arm的架構(gòu),當(dāng)然如果要做數(shù)據(jù)中心CPU,目前對于英偉達(dá)而言除了Arm沒有更好的選擇,但這也證明了Arm在高性能領(lǐng)域已經(jīng)具備了強(qiáng)大的實(shí)力。
去年9月,Arm發(fā)布了Neoverse N2、V1高性能計(jì)算平臺,而在昨天進(jìn)行的媒體交流會上,Arm終于公開了更多的詳細(xì)信息。
Neoverse與過去Arm提供單獨(dú)的IP授權(quán)不同,Arm基礎(chǔ)設(shè)施事業(yè)部高級副總裁兼總經(jīng)理Chris Bergey表示:“一個平臺實(shí)際上是由多個IP進(jìn)行優(yōu)化組合而成的,通過Neoverse產(chǎn)品,我們發(fā)現(xiàn)越來越多的客戶需要完整的解決方案,即一個平臺去承載他們的系統(tǒng),他們可以在上面添加他們自己的加速器或者其他設(shè)備,并且可以對其進(jìn)行定制,我們要做的就是為客戶提供構(gòu)建科技大廈所需要的“磚瓦”,而不只是單個給客戶某一個單獨(dú)的IP,單獨(dú)的CPU或互聯(lián)IP?!?/p>
作為升級版本,相比于2018年發(fā)布的N1,Neoverse N2在保持相同水平的功率和面積效率的基礎(chǔ)上,單線程性能提升了40%。與此同時(shí),Neoverse N2 具備良好的可擴(kuò)展性,可以橫跨從高吞吐量計(jì)算到功率與尺寸受限的邊緣和5G應(yīng)用場景,并在這些應(yīng)用中帶來優(yōu)于N1的表現(xiàn),例如,在云端上提升 1.3 倍的NGINX,在 5G 和邊緣應(yīng)用上提升 1.2 倍的DPDK 數(shù)據(jù)包處理。
除此之外,N2另一個重磅功能是SVE(可伸縮矢量擴(kuò)展)的升級版SVE2。簡單來說,SVE2能夠使CPU不需要重寫和重新編譯代碼,就可以適應(yīng)硬件寬度的增長。比如對于開發(fā)人員而言,開發(fā)時(shí)可能用到128bit的CPU,但在超算上變成512bit或更高后,寫的程序依然可以享受到更寬的SIMD 帶來的效果。于是SVE2就賦予了N2極為靈活的應(yīng)用,相同的代碼將能夠在具有較低硬件執(zhí)行寬度能力的更保守的設(shè)計(jì)上運(yùn)行,使得從云到邊緣的性能效率帶來巨大的提升。在諸如機(jī)器學(xué)習(xí)、數(shù)字信號處理、多媒體和5G等廣泛應(yīng)用場景中,SVE2除了帶來大幅性能提升外,還帶來了SVE具備的編程簡易性及可移植性等優(yōu)勢。
Neoverse V1則從設(shè)計(jì)之初就秉持性能至上的原則,與N1相比,Neoverse V1帶來了50%的性能提升、1.8倍的矢量工作負(fù)載優(yōu)化、以及4倍的機(jī)器學(xué)習(xí)工作負(fù)載優(yōu)化,同時(shí),V1也是Arm強(qiáng)調(diào)性能優(yōu)先的新型計(jì)算系列的第一個平臺。V1性能提升的重點(diǎn)是單線程,能夠提供Arm最佳的單線程性能,但內(nèi)核數(shù)相比N2會有所減少。另外,V1使芯片合作伙伴能靈活地為高度依賴CPU性能和帶寬的應(yīng)用構(gòu)建計(jì)算能力,并為其提供 SoC 設(shè)計(jì)的靈活性。
而構(gòu)建基于V1或N2高性能SoC的關(guān)鍵,還在于互連技術(shù),這次伴隨V1和N2推出的還有CMN-700互連技術(shù)。CMN-700 是基于CMN-600這個成功的基礎(chǔ)所打造,相比于CMN-600,CMN-700在每個矢量上進(jìn)一步提升了性能——從內(nèi)核的數(shù)量、緩存的大小,到附加內(nèi)存及 IO 設(shè)備的數(shù)量和類型。
CMN-700 賦能了多芯片、內(nèi)存擴(kuò)展和加速器的下一代應(yīng)用場景實(shí)現(xiàn)。通過Arm對CCIX和CXL持續(xù)不斷的投入,更多的定制選項(xiàng)應(yīng)運(yùn)而生,進(jìn)而使合作伙伴的解決方案具備總線和高核數(shù)的可擴(kuò)展性特色。這將為突破傳統(tǒng)的硅限制提供新的機(jī)遇,并為緊密耦合的異構(gòu)計(jì)算提供更大的靈活性。
Chris Bergey透露,基于N2的芯片將會在今年下半年推出,而V1在HPC領(lǐng)域已經(jīng)即將落地。就在4月中,印度電子和信息技術(shù)部MeitY宣布,其百萬兆級高性能計(jì)算CPU設(shè)計(jì)將采用 Neoverse V1平臺。在此之前,Arm的合作伙伴法國芯片初創(chuàng)企業(yè)SiPearl和韓國電子通信研究所ETRI也已經(jīng)公開支持通過Neoverse V1平臺來驅(qū)動百萬兆級超算。Chris Bergey認(rèn)為,我們認(rèn)為單核性能、能效以及對新SVE矢量擴(kuò)展的支持是這背后的一大原因。
除此之外,更多生態(tài)合作伙伴基于Neoverse的新功能來提升自身產(chǎn)品以及應(yīng)用的競爭力:比如Marvell發(fā)布了基于Neoverse N2的OCTEON系列網(wǎng)絡(luò)解決方案,相較于前一代的OCTEON解決方案,其性能提升高達(dá)3倍;阿里云在即將上線的基于Arm架構(gòu)ECS實(shí)例上完成了測試,結(jié)果顯示在SPECjbb?的測試數(shù)據(jù)中獲得了驚艷的表現(xiàn),且基于Arm架構(gòu)運(yùn)行的DragonWell JDK性能提高了50%;騰訊也在硬件測試和軟件支持方面持續(xù)投入,使其在云應(yīng)用上能采用 Arm Neoverse 技術(shù)。
