GPU雖撿了AI時代的紅利，但它才是AI芯片真正的“適配者”

2024-05-28 來源：賢集網(wǎng)

1610

圖形處理單元（GPU）可能已經(jīng)成為人工智能領域令人垂涎的硬件，但它們作為最受歡迎組件的地位可能會減弱。

對 GPU 前所未有的需求使 NVIDIA 成為價值數(shù)萬億美元的公司。然而，Tenstorrent 首席運營官 Keith Witek 表示，就連 NVIDIA 也開始放棄他們最初創(chuàng)建的圖形芯片。

“他們甚至將其架構轉向異構計算，這看起來更像張量計算機。所以是的，我認為它會朝著這個方向發(fā)展。甚至人工智能圖形業(yè)務領域的人士也意識到將他們的架構向這個方向發(fā)展的好處，”Witek在獨家采訪中告訴AIM 。

他主張采用包含張量單元、圖形單元和 CPU 的片上系統(tǒng) (SoC) 架構，并聲稱利用 CPU 和圖形處理器的異構計算是處理未來工作負載的最佳方法。

最近，NVIDIA 最大的企業(yè)客戶之一的微軟和 AWS 等大型科技公司開發(fā)了自己的 AI 芯片，以減少對 NVIDIA GPU 的依賴，同時降低成本。

在最近舉行的 Google I/O 2024 上，這家科技巨頭宣布推出 Trillium TPU，這是其第六代芯片，旨在更有效地處理人工智能工作負載。

有趣的是，AWS、微軟和谷歌設計的芯片也有異構架構。例如，Azure Maia AI Accelerator 和 Azure Cobalt CPU 在同一芯片上集成了不同的專用計算引擎和加速器。

同樣，AWS Inferentia 和 Trainium 也在同一芯片上集成了不同的專用計算引擎和加速器。

然而，這些芯片主要供內部使用。另一方面，Tenstorrent 將其芯片出售給企業(yè)客戶，使其與 NVIDIA 形成直接競爭。

NPU和異構計算更適用于生成式AI

首先來說一說NPU。NPU也叫神經(jīng)網(wǎng)絡處理器，這是一種專門設計用于加速深度學習任務和機器學習算法的處理器。深度學習是AI的一個分支，在機器學習中占據(jù)核心地位，它在處理圖像識別、語音識別、自然語言處理等神經(jīng)網(wǎng)絡模型場景時發(fā)揮著重要作用，而NPU能夠顯著加速深度學習模型的推理和訓練過程，另外NPU有更高的能效比，更適用于邊緣計算設備和移動終端。

異構計算是指在一個計算系統(tǒng)中使用不同類型的處理器或者計算單元來協(xié)同完成計算任務的技術，這些單元包括CPU、GPU、以及如NPU這樣的專用加速器。它的目的在于通過結合不同處理器的優(yōu)勢，來提高系統(tǒng)的整體性能、效率和適應各種復雜計算場景的能力，同時解決單一架構在功耗、散熱等方面的局限性。

簡單地說，就是通過異構計算將生成式AI任務中不同類型的計算任務分配給最適合的計算單元。例如，面對豐富的生成式AI用例，CPU適用于需要低時延的應用場景，或者相對較小的傳統(tǒng)模型，如卷積神經(jīng)網(wǎng)絡模型（CNN），以及一些特定的大語言模型（LLM）；GPU擅長面向高精度格式的并行處理，比如對畫質要求非常高的圖像以及視頻處理；在持續(xù)型用例中，需要以低功耗實現(xiàn)持續(xù)穩(wěn)定的高峰值性能，NPU可以發(fā)揮其最大優(yōu)勢。

那么NPU和異構計算會更適用于生成式AI嗎？

答案是肯定的。實際上，生成式AI涉及大量的數(shù)據(jù)處理和復雜的計算任務，尤其是深度學習模型的訓練和推理。

這些任務對計算資源的要求極高，單獨依靠傳統(tǒng)的CPU或GPU可能無法滿足性能要求。NPU專為神經(jīng)網(wǎng)絡計算設計，能夠模擬人類神經(jīng)元和突觸的工作方式，對AI計算涉及的大量神經(jīng)網(wǎng)絡模型進行特殊優(yōu)化，從而提高處理效率和降低能耗。

其次，異構計算的出現(xiàn)進一步提升了生成式AI的計算能力。異構計算通過整合不同架構的計算單元（如CPU、GPU、NPU等），使它們能夠并行工作，從而充分發(fā)揮各自的優(yōu)勢。

此外，隨著生成式AI應用的不斷擴展和復雜化，對算力的需求也在持續(xù)增長。NPU和異構計算的結合能夠更好地滿足這種需求，以高通為例，CPU、GPU等計算單元每年都有迭代，并且每一次迭代都會帶來巨大的性能升級，推動生成式AI技術的進一步發(fā)展和應用。

AI算力競賽，巨頭加碼，誰主沉浮

AI芯片可是AI發(fā)展的核心動力，沒了它，就別想實現(xiàn)真正的智能化?，F(xiàn)在各大科技巨頭都在狂砸資金研發(fā)AI芯片，可謂是不遺余力啊。

比如說英偉達，作為顯卡之王，它們家的GPU可是AI訓練的利器。最新的H100就集成了超過8萬億晶體管，算力爆表，專門為大規(guī)模AI模型量身定制。再比如谷歌的TPU，憑借定制化設計，在推理加速方面效率極高。

英特爾、AMD這些傳統(tǒng)芯片巨頭也在加緊部署，紛紛推出面向AI優(yōu)化的CPU和GPU產(chǎn)品線。就連蘋果、亞馬遜這些公司，也在AI芯片領域布局。

這些巨頭們可都不是吃素的，各自都有自家的拳頭產(chǎn)品和技術優(yōu)勢。比如異構計算架構、專用AI加速器、先進制程工藝等等，都是提升AI算力的法寶。誰能在這場算力大戰(zhàn)中脫穎而出，將主導AI的未來發(fā)展方向，實在令人期待啊。

說到這些科技巨頭在AI芯片領域的布局，你可能會好奇:他們都推出了啥拳頭產(chǎn)品?。?/span>

咱先說說英偉達吧。作為顯卡一哥，它家的GPU可是AI訓練的利器。最新的H100芯片集成了超過80億晶體管，算力爆表，就是為大規(guī)模AI模型量身定制的。

再看看谷歌的TPU吧，這可是推理加速的專業(yè)戶。通過定制化設計，在推理效率上遠超同類產(chǎn)品。

英特爾和AMD這些老牌芯片巨頭也不甘示弱。英特爾的Ponte Vecchio就是專門針對AI優(yōu)化的高性能GPU；AMD的InstinctMI200則融合了CPU、GPU和矩陣引擎，異構計算架構提升了AI算力。

就連蘋果和亞馬遜這些公司，也在AI芯片領域躍躍欲試呢。蘋果的M系列芯片就內置了神經(jīng)網(wǎng)絡加速器；亞馬遜的Inferentia則是推理專用芯片，在云端AI服務中大顯身手。

各自都有自家的拳頭產(chǎn)品和技術優(yōu)勢，比如異構架構、專用AI加速器、先進制程工藝等等，都是提升AI算力的法寶。誰能在這場算力大戰(zhàn)中脫穎而出，將主導AI的未來發(fā)展方向，實在令人期待啊。

登入后，方可留言>>

行業(yè)動態(tài)

低空經(jīng)濟加速起飛：千米空域，萬億藍海

2025Q1全球云支出增長21%，AWS、微軟、谷歌三大云廠商持續(xù)云投入，以爭奪AI成本優(yōu)勢

AI走向應用還得看智能體，阿里、美團、滴滴相繼入局！

熱讀文章

苗圩出席統(tǒng)籌推進疫情防控和產(chǎn)業(yè)轉型升級促進制造業(yè)通信業(yè)穩(wěn)定發(fā)展發(fā)布會

一圖讀懂2020年《政府工作報告》

工業(yè)富聯(lián)：擬7763萬美元收購鴻海精密美國子公司相關資產(chǎn)

亚洲国产精品久久久久婷蜜芽,caoporn国产精品免费视频,久久久久久久久免费看无码,国产精品一区在线观看你懂的

GPU雖撿了AI時代的紅利，但它才是AI芯片真正的“適配者”

GPU雖撿了AI時代的紅利，但它才是AI芯片真正的“適配者”