該拋棄的就要早拋棄,國產(chǎn)CPU的發(fā)展,需要選擇最正確的路
眾所周知,電腦芯片被稱之為CPU,最牛的CPU是X86架構(gòu)的intel、AMD,而手機領(lǐng)域的芯片稱之為Soc,而最牛的Soc是ARM架構(gòu)的高通、聯(lián)發(fā)科、蘋果芯片等。
與此同時,在Soc中,又有什么CPU、GPU、基帶芯片、DSP等,那么問題來了,CPU、Soc、指令集、架構(gòu)、IP核等等,這些究竟是怎么回事?
CPU也叫做中央處理器(central processing unit)則電腦中負(fù)責(zé)計算的單元。而Soc包含有CPU、GPU、DSP、基帶芯片、ISP等等組件,這些組件封裝在一塊芯片中,就是Soc。
CPU在計算時,要按照一定的規(guī)模標(biāo)準(zhǔn)執(zhí)行,這個規(guī)范標(biāo)準(zhǔn)就是指令集。舉個例子,如果CPU只能理解英語,那么指令集就是英語的26個字母。像X86、ARM、MIPS、LoongArch、RISC-V都是指令集范疇。
架構(gòu),大部分時候與指令集是等同的,但在ARM這里,又有點不一樣,ARM每次都是將指令集組合成特定的規(guī)范,比如組合成一些特定的單詞,再形成版本,比如V8架構(gòu)、V9架構(gòu)……
而IP核,則是指Soc中的CPU核、GPU核心等,同時一個CPU中也有多個核心,這些稱之為IP核。
從上面這些名詞解釋,估計大家可以看出來,CPU/Soc的先進性,直接取決于IP核、也取決于架構(gòu)、指令集。
就像大家都熟悉26個英文字母,但要寫出一篇好的文章,則需要26個字母組合成特定的單詞,再通過這些單詞組合,最終寫成文章,有人寫的好,有人寫的壞。
而國產(chǎn)CPU發(fā)展的較晚,所以早期國內(nèi)的芯片廠商,要研發(fā)芯片,都是采用國外的指令集,沒有自研指令集,因為自研確實要求高,難度大。
比如6大國產(chǎn)CPU,華為鯤鵬、飛騰采用的是ARM指令集,兆芯、海光采用的是X86指令集、龍芯采用的是MIPS指令集、申威采用的是alpha指令集。
大家的想法很簡單,直接站在成熟的指令集肩上來設(shè)計芯片,門檻低,速度快、效率高,同時也能夠利用這些指令集的生態(tài),不至于要從0開始,這樣成功率大。
但這里大家要注意,X86是直接指令集授權(quán),即你買的是26個字母的使用權(quán),怎么組合排列,都沒問題,不存在侵權(quán)問題,但X86不輕易對外授權(quán),全球僅有intel、AMD、海光、兆芯4家授權(quán)授權(quán),可以開發(fā)X86芯片。
ARM不生產(chǎn)芯片只做授權(quán),所以ARM為了賺錢,基本不直接進行26個字母的指令集授權(quán),而是每次都是將字母進行組合,形成特定的單詞后,再打包成V1、V2……V9這樣的版本,再對外授權(quán)的,同時每次都會基于新的架構(gòu),發(fā)布新的IP核,IP核與架構(gòu)是對應(yīng)的。
所以使用ARM指令集時,要不斷的購買架構(gòu)版本、購買新的IP核才行,因為ARM會不斷的更新,比如你買了V8版本的架構(gòu),沒有買V9版本,則不能使用V9的架構(gòu),不能使用新的IP核,使用就是侵權(quán),你只能按照ARM畫的圈子走……
ARM這種做法有好有壞,好處是ARM從源頭對指令集進行打包,保證了ARM芯片的統(tǒng)一性,使用ARM架構(gòu)的廠商,不用想太多的事,直接找ARM買最新的架構(gòu),最新的IP核就行了,門檻低,效率高,還能夠保證性能與世界頂尖廠商基本一致,因為大家都源自ARM,水準(zhǔn)基本一致。
壞處的第一點就是有點費錢,因為你需要不停的買ARM架構(gòu)版本,一旦沒跟進新版本,就要落后。
當(dāng)然費錢還是小事,最重要的是從此被ARM卡住了脖子,ARM只要停止新的版本授權(quán),你就只能停留在老版本,注定會被淘汰,因為ARM每次新版架構(gòu)都會推出新技術(shù),而老架構(gòu)版本使用不了,一旦使用,就是侵權(quán)。
舉個最簡的例子,目前國內(nèi)著名的HW、FT公司,之前獲得了ARM V8.2的永久授權(quán),可以基于V8.2架構(gòu)進行芯片的研發(fā)。
但ARM后來推出了V9架構(gòu)版本,新款的V9引入了用于機密計算的Realms模塊。另外一個則是AI,將SVE升級到SVE2,能夠顯著改善CPU的AI性能。同時V9架構(gòu)版本中,CPU、GPU性能提升,而功耗降低。
但使用V8.2架構(gòu)的芯片,無法使用新的CPU、GPU核,同時也不能在V8.2上拓展新的指令集實現(xiàn)V9的功能,否則就是侵權(quán)。所以不黑不吹,HW、FT公司的ARM芯片,相比于其它使用V9架構(gòu)的芯片,劣勢就很明顯了。
并且如果一直無法使用V9架構(gòu),這個差距就會越來越大,最后甚至慢慢的就會被市場所淘汰掉。
除此之外,發(fā)展也受ARM的限制,如果ARM擠牙膏,那么使用ARM架構(gòu)、IP核的廠商,大家一起擠牙膏。
最近幾年,所有采用公版IP核的ARM芯片,其性能一進提升不明顯,這也是使用ARM架構(gòu)的缺點之一,只要ARM在擠牙膏,那么大家只有一起擠牙膏,受限于ARM。
而我們看看海光,看看龍芯,則進步明顯,比如龍芯自研的3A6000系列,其SPEC2006成績?yōu)槎c42.3分,浮點53分。算下來IPC達到了定點17/G,浮點22/G,達到了Zen2和10代酷睿水平了,甚至還要更高。
龍芯之所以這么牛,是因為采用了自研的LoongArch指令集,核心IP全部自主研發(fā),一步一個腳印,能夠依靠自身的設(shè)計能力提升芯片性能,不受誰的限制。
所以不黑不吹,國產(chǎn)ARM芯片的長期可持續(xù)發(fā)展之路,其實已經(jīng)出現(xiàn)了很大的問題,如果不能拿到新架構(gòu)的授權(quán)或另尋其他技術(shù)路線,我們基本可以認(rèn)為,它其實已經(jīng)走到盡頭了,長遠(yuǎn)來看這種國產(chǎn)ARM的投入最終都將變得毫無意義,遠(yuǎn)大的前景或許只是虛幻的假象。
近日,HW和FT生態(tài)合并,很多人認(rèn)為這是想在滯后的V8.2架構(gòu)下,將國產(chǎn)ARM生態(tài)演變成一條獨立的產(chǎn)業(yè)分支,脫離ARM的主流航道,獨立發(fā)展,擺脫限制。但大家都清楚,這種與主流ARM生態(tài)脫鉤的行為,在后續(xù)ARM公司性能不斷迭代之下,壓力還是相當(dāng)大的,畢竟ARM V8.2的上限只有那么高,要突破這個上際,太難了。
所以從中國芯的長遠(yuǎn)來考慮,我們也許是時候選擇更為合適的指令集了,不能被某些指令集困在局中止步不前,你覺得呢?
