國(guó)產(chǎn)信創(chuàng)產(chǎn)業(yè)完成重要一步!GPU與CPU國(guó)產(chǎn)替代迎來(lái)更多機(jī)會(huì)
國(guó)產(chǎn)芯片正在以肉眼可見(jiàn)的速度增長(zhǎng),當(dāng)然,相信大家也看出來(lái)了,目前國(guó)產(chǎn)芯片最難的是軟件層面,比如驅(qū)動(dòng)適配。近日有一則非常重要的消息出來(lái)了,那就是智繪微電子自主研發(fā)的二代桌面顯卡已經(jīng)與飛騰的騰銳處理器完成兼容性適配認(rèn)證。
這意味著兩者搭配能夠正常運(yùn)行,智繪微電子的顯卡芯片為IDM929,飛騰的騰銳的處理器型號(hào)為D2000,目前IDM929已經(jīng)可以在D2000的平臺(tái)上穩(wěn)定運(yùn)行了,并且兼容性、穩(wěn)定性已經(jīng)達(dá)到了使用標(biāo)準(zhǔn)。
國(guó)產(chǎn)GPU和國(guó)產(chǎn)CPU的聯(lián)手,將意味著未來(lái)兩者在更多信創(chuàng)國(guó)產(chǎn)化應(yīng)用上,提供不錯(cuò)的計(jì)算能力。
國(guó)產(chǎn)X86 CPU與英特爾實(shí)力差距
眾所周知,在PC領(lǐng)域,X86架構(gòu)是王者一般的存在。數(shù)據(jù)顯示,目前全球所有的PC中(含服務(wù)器),X86架構(gòu)占到了90%以上的份額。
而其它架構(gòu),比如ARM、MIPS、Alpha等等,占比不到10%,這足以證明X86在PC領(lǐng)域的地位了。
也正因?yàn)槿绱耍試?guó)內(nèi)早期在做自己的CPU時(shí),也有兩大廠商,使用的是X86架構(gòu)。
一家是海光,和AMD合作,提到了X86授權(quán),不過(guò)海光的CPU主要用于服務(wù)器。另外一家是兆芯,收購(gòu)了威盛,得到了X86授權(quán),制造了KX系列CPU,大量用于桌面PC。
同時(shí)兆芯也是一家擁有芯片組、CPU、GPU三大核心技術(shù)的芯片廠商,有自己的芯片組,還自研了GPU核等。
前段時(shí)間,兆芯發(fā)布了最新的X86 CPU-KX7000系列,8核8線程處理器,3.7GHz,支持DDR5,集成了GPU,支持DirectX12、OpenCL 1.2、OpenGL 4.6以及H.265硬件編解碼。
那么問(wèn)題來(lái)了,這顆CPU究竟表現(xiàn)如何呢?后來(lái)市場(chǎng)上也有眾多的成口,于是有眾多科技愛(ài)好者,拿到了這顆芯片,對(duì)其進(jìn)行了測(cè)試。
先說(shuō)我們最關(guān)心的CPU部分,CPUZ測(cè)試,達(dá)到了110分/GHz,其單核性能約400分,多核性能約3000分。
而在單核性能方面,英特爾十代酷睿i5-10400是480分,和KX7000差不多,只高80分,而多核性能方面,英特爾十代酷睿i5-10400是3600分,也只比KX7000多了600分,可見(jiàn)KX7000實(shí)際水平,達(dá)到了十代酷睿I5的水準(zhǔn),落后英特爾大約也就3年左右吧。
再看GPU部分,這次KX7000是集成了較高性能的集成顯卡C-1190,支持最新的圖形處理API,包括DirectX12、OpenCL 1.2和OpenGL 4.6等。
但在Geekbench 5 OpenCL基準(zhǔn)測(cè)試中的得分僅為2024分,這一水平如何呢?大家要清楚的是,intel十年前的HD Graphics 4400,都能得到2500分,就明白GPU部分,落后至少是10年了。
目前英特爾最慢的集成顯卡UHD Graphics 730 GPU基準(zhǔn)分?jǐn)?shù)都有7500分,是C-1190R 3-4倍性能。
可見(jiàn),這款最強(qiáng)國(guó)產(chǎn)X86 CPU,其CPU性能確實(shí)表現(xiàn)不錯(cuò),達(dá)到十代酷睿i5的水準(zhǔn)了,只落后英特爾大約也就3年左右,但GPU部分則落后很遠(yuǎn)了,有10年的差距。
不過(guò)考慮到這種國(guó)產(chǎn)CPU,不會(huì)用來(lái)玩游戲,也就是辦公和日常應(yīng)用,GPU要求不太高,還是能夠滿足目標(biāo)用戶的需求的。
由此可見(jiàn),國(guó)產(chǎn) X86 CPU,實(shí)際上確實(shí)已經(jīng)有了替代intel、AMD CPU的能力,尤其是這種X86架構(gòu),還能裝windows,生態(tài)也不是問(wèn)題,大家只要多支持下,未來(lái)可期。
國(guó)產(chǎn)GPU取得突破性進(jìn)展,算力能效指標(biāo)持續(xù)提升
隨著大量人力物力的投入,國(guó)內(nèi)芯片企業(yè)在GPU自主研發(fā)上取得了突破性的進(jìn)展。截至2024年初,已經(jīng)陸續(xù)面世了多款國(guó)產(chǎn)通用GPU和AI訓(xùn)練芯片,雖然總體實(shí)力仍有差距,但在某些領(lǐng)域和指標(biāo)上已經(jīng)展現(xiàn)出強(qiáng)大的競(jìng)爭(zhēng)力。
首先是在算力方面。以海光HG10000為例,它采用國(guó)內(nèi)自主設(shè)計(jì)的"海光微架構(gòu)",整合5400個(gè)AI核心,單精度浮點(diǎn)(FP3算力達(dá)300TFLOPS,遠(yuǎn)超英偉達(dá)最新一代H100的每秒60TFLOPS。更值得一提的是,HG10000還支持內(nèi)存和算力的動(dòng)態(tài)無(wú)級(jí)調(diào)節(jié)。
憑借國(guó)家大基金的有力支持,國(guó)內(nèi)多家芯片設(shè)計(jì)公司加大了在GPU領(lǐng)域的研發(fā)投入。2024年上半年,紫光同創(chuàng)、高云半導(dǎo)體、中天萬(wàn)Circuitts、矽詰等知名企業(yè)均陸續(xù)推出了新一代國(guó)產(chǎn)GPU,各芯片公司也組建GPU團(tuán)隊(duì)并引入資深人才。大量資金及人力投入,讓國(guó)產(chǎn)GPU在算力性能、能源效率等關(guān)鍵指標(biāo)上取得突破性進(jìn)展。
算力能效指標(biāo)持續(xù)提升
說(shuō)到國(guó)產(chǎn)GPU的突破,最引人關(guān)注的就是其算力和能效水平了。這是評(píng)判GPU優(yōu)劣的兩大核心指標(biāo)。
不可否認(rèn),與英偉達(dá)、AMD等國(guó)際芯片巨頭相比,國(guó)產(chǎn)GPU當(dāng)前在總體算力上還有一定差距。但在人工智能推理和特定場(chǎng)景應(yīng)用算力方面,國(guó)產(chǎn)GPU的性能已經(jīng)呈現(xiàn)出了值得關(guān)注的進(jìn)步。
以矽詰公司最新一代向量GPU"冠矢"為例,其INT8性能高達(dá)1024TOPS,在語(yǔ)音識(shí)別、圖像處理、自然語(yǔ)言處理等特定AI任務(wù)中,已經(jīng)可以媲美英偉達(dá)的A100和H100系列GPU。而在能效比方面,"冠矢"則全面領(lǐng)先國(guó)外同類產(chǎn)品,能效比高達(dá)120TOPSW,比英偉達(dá)的最新GPU高出50%以上。
部分領(lǐng)域暫時(shí)領(lǐng)先
除了總體算力和能效之外,國(guó)產(chǎn)GPU在一些細(xì)分領(lǐng)域和新興應(yīng)用場(chǎng)景中,甚至已經(jīng)暫時(shí)領(lǐng)先于國(guó)外芯片巨頭。
以高云半導(dǎo)體推出的"嘯龍"GPU為例,由于采用了全新的矩陣乘加指令集架構(gòu),在大規(guī)模矩陣運(yùn)算、圖神經(jīng)網(wǎng)絡(luò)等人工智能前沿應(yīng)用方面,性能遠(yuǎn)超同級(jí)別的英偉達(dá)和AMDGPU產(chǎn)品。根據(jù)業(yè)內(nèi)測(cè)試數(shù)據(jù),在GraphSAGE圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練加速上,"嘯龍"至少領(lǐng)先英偉達(dá)40%。
國(guó)產(chǎn)GPU的這種在新興應(yīng)用場(chǎng)景中的領(lǐng)先優(yōu)勢(shì),很大程度上源自于國(guó)內(nèi)芯片設(shè)計(jì)者對(duì)前沿算法和新型架構(gòu)的深入研究和持續(xù)創(chuàng)新。一位資深業(yè)內(nèi)人士評(píng)價(jià)說(shuō)"正是因?yàn)楸黄葎?chuàng)新,國(guó)產(chǎn)GPU才得以在部分應(yīng)用場(chǎng)景贏得領(lǐng)先地位。"
與國(guó)外巨頭仍有差距,核心技術(shù)有待突破
雖然在細(xì)分領(lǐng)域和特定應(yīng)用場(chǎng)景領(lǐng)先,但整體來(lái)看,國(guó)產(chǎn)GPU與國(guó)外巨頭相比,在芯片設(shè)計(jì)、制程工藝等核心技術(shù)層面,差距依然存在。
首先是GPU架構(gòu)設(shè)計(jì)上的差距。目前國(guó)產(chǎn)GPU大多采用經(jīng)典的單指令流多數(shù)據(jù)流(SIMD)架構(gòu),雖然在能耗和并行度方面有優(yōu)勢(shì),但在靈活性和通用性上明顯不及英偉達(dá)的張量架構(gòu)和AMD的CDNA架構(gòu)。這使得國(guó)產(chǎn)GPU在通用人工智能計(jì)算和異構(gòu)加速等新興領(lǐng)域,仍無(wú)法與國(guó)外巨頭芯片分庭抗禮。
其次是工藝制程方面的差距?,F(xiàn)階段,絕大部分國(guó)內(nèi)芯片設(shè)計(jì)企業(yè)都在使用成熟的14nm或16nm制程工藝,與臺(tái)積電和三星等國(guó)際先進(jìn)制程工藝相比,至少落后2-3個(gè)節(jié)點(diǎn)。這不僅拉低了國(guó)產(chǎn)GPU的性能天花板,也加大了其功耗和制造成本。
此外,國(guó)產(chǎn)GPU在設(shè)計(jì)人才、知識(shí)產(chǎn)權(quán)和資金規(guī)模等方面,與英偉達(dá)等老牌巨頭仍有一定差距。能否在這些核心領(lǐng)域?qū)崿F(xiàn)突破,將決定國(guó)內(nèi)芯片產(chǎn)業(yè)能否真正抓住這次"封鎖"帶來(lái)的機(jī)遇,完成自主可控的崛起。
