殺入光刻領(lǐng)域，押注生成式AI，英偉達(dá)要放大招了

2023-03-22 來源：集微網(wǎng)

1072

據(jù)外媒報(bào)道，英偉達(dá)公司日前在GTC大會(huì)上宣布，將與與ASML、Synopsys和臺(tái)積電合作，推廣使用其“cuLitho”軟件庫(kù)進(jìn)行計(jì)算光刻，表示該庫(kù)將使其合作伙伴能夠以更高的效率設(shè)計(jì)和制造下一代芯片。

英偉達(dá)方面認(rèn)為，通過在GPU而不是通用CPU上運(yùn)行，復(fù)雜IC光刻圖案背后的計(jì)算效率可以提高40倍。cuLitho軟件用于將工作負(fù)載轉(zhuǎn)換為可以利用GPU并行性的格式。這使500個(gè) NVIDIA DGX H100 系統(tǒng)能夠完成40000個(gè)CPU系統(tǒng)執(zhí)行的工作。

使用cuLitho的晶圓廠每天可以使用九分之一的功率生產(chǎn)三到五倍的光掩模。該公司還表示，需要兩周才能生產(chǎn)的光掩?？梢允褂胏uLitho和GPU在一夜之間進(jìn)行處理。從長(zhǎng)遠(yuǎn)來看，cuLitho將實(shí)現(xiàn)更好的設(shè)計(jì)規(guī)則、更高的密度、更高的產(chǎn)量，并且是通向AI驅(qū)動(dòng)的光刻技術(shù)的途徑。

黃仁勛還透漏，Hopper架構(gòu)GPU將使用cuLitho庫(kù)進(jìn)行設(shè)計(jì)和制造。臺(tái)積電方面也回應(yīng)稱，“這一發(fā)展為臺(tái)積電在芯片制造中更廣泛地部署逆光刻技術(shù)和深度學(xué)習(xí)等光刻解決方案開辟了新的可能性，為半導(dǎo)體規(guī)模的持續(xù)發(fā)展做出了重要貢獻(xiàn)”。

這次被黃仁勛稱為“迄今為止最重要的一次GTC”有超過25萬人參加。他在演講中多次提到，AI的“iPhone”時(shí)刻已經(jīng)到來，而英偉達(dá)將在生成式AI領(lǐng)域進(jìn)行軟硬件全面布局。同時(shí)，他還公布了英偉達(dá)在加速計(jì)算、量子計(jì)算、元宇宙等領(lǐng)域的技術(shù)和應(yīng)用情況。

AI進(jìn)入“iPhone”時(shí)刻，推出專用云服務(wù)

黃仁勛在演講中數(shù)次提到生成式AI，稱“ChatGPT是震驚世界的AI”。他認(rèn)為，這意味著嶄新的計(jì)算平臺(tái)的誕生，AI的“iPhone”時(shí)刻已經(jīng)到來，加速計(jì)算和AI技術(shù)已經(jīng)走進(jìn)現(xiàn)實(shí)。

在黃仁勛看來，ChatGPT、Stable Diffusion、DALL-E和Midjourney等生成式AI工具喚醒了世界對(duì)生成式AI的認(rèn)知，尤其是ChatGPT作為迄今歷史上用戶數(shù)量增長(zhǎng)最快的應(yīng)用，生成的文本令人贊嘆。

黃仁勛認(rèn)為，生成式AI是一種新型計(jì)算機(jī)，一種可以用人類語言進(jìn)行編程的計(jì)算機(jī)，每個(gè)人都可以命令計(jì)算機(jī)來解決問題，而這之前是只有程序員才能接觸的領(lǐng)域，現(xiàn)在每個(gè)人都可以是程序員。

他同時(shí)還稱，生成式AI是一種新型計(jì)算平臺(tái)，與PC、互聯(lián)網(wǎng)、移動(dòng)設(shè)備和云類似。正如此前的互聯(lián)網(wǎng)一樣，生成式AI也將重塑每個(gè)行業(yè)。

不過，黃仁勛提到，一些專業(yè)領(lǐng)域的公司需要使用專有數(shù)據(jù)來定制模型，他們需要制定使用規(guī)范，并優(yōu)化模型，契合公司安全、隱私和安保要求?！斑@個(gè)行業(yè)需要一個(gè)類似臺(tái)積電的代工廠，來構(gòu)建自定義的大型語言模型?！?/span>

為此英偉達(dá)宣布推出AI Foundations，黃仁勛將其稱為云服務(wù)和代工廠，其可以讓企業(yè)使用專有數(shù)據(jù)進(jìn)行訓(xùn)練、處理特定領(lǐng)域的任務(wù)，構(gòu)建自定義的語言模型和生成式AI。

英偉達(dá)AI Foundations包括語言、視覺和生物學(xué)模型三個(gè)方面服務(wù)，其中Nemo用于構(gòu)建定制的語言文本生成模型，通過Nemo可以快速生成文本，最快捷的方法是從英偉達(dá)的某項(xiàng)先進(jìn)的預(yù)訓(xùn)練基礎(chǔ)模型入手，輕松自定義一個(gè)模型，并進(jìn)行參數(shù)調(diào)優(yōu)，如匯總財(cái)務(wù)文檔、創(chuàng)建特定品牌內(nèi)容、個(gè)性化寫作風(fēng)格撰寫郵件等，將模型鏈接到專有數(shù)據(jù)庫(kù)，可確保響應(yīng)是準(zhǔn)確和最新的，并可以通過指定區(qū)域放防止模型出現(xiàn)意外。

Picasso是一項(xiàng)視覺語言模型制作服務(wù)，可以用于生成式AI賦能的圖像、視頻和3D應(yīng)用，企業(yè)可以使用自己的數(shù)據(jù)來部署和訓(xùn)練自己的模型，并可將生成的素材導(dǎo)入編輯工具或Omniverse，以構(gòu)建逼真的虛擬世界、元宇宙應(yīng)用和數(shù)字孿生仿真。Getty Images、Shutterstock和Adobe等企業(yè)已經(jīng)開始使用該項(xiàng)服務(wù)。

黃仁勛還表示，英偉達(dá)將和Adobe共同構(gòu)建一系列新一代AI功能，打造創(chuàng)意領(lǐng)域的未來，將生成式AI融入營(yíng)銷和創(chuàng)意專業(yè)人士的日常工作中，新的生成式AI模型將對(duì)圖像、視頻、3D和動(dòng)畫制作進(jìn)行優(yōu)化。同時(shí)，為保護(hù)藝術(shù)家的權(quán)利，Adobe正在開發(fā)以商業(yè)可行性和正確內(nèi)容歸屬為重點(diǎn)的方案，由Adobe的“內(nèi)容真實(shí)性倡議”提供支持。

第三個(gè)是面向的生物學(xué)的BioNeMo，其可幫助研究人員使用專有數(shù)據(jù)創(chuàng)建、微調(diào)和提供自定義模型，讓研發(fā)人員輕松加速藥物研發(fā)工作流，可以進(jìn)行蛋白質(zhì)預(yù)測(cè)、分子生成、分析連接等，節(jié)省藥物研發(fā)時(shí)間和資金成本。

在應(yīng)用方面，英偉達(dá)與三菱聯(lián)合發(fā)布了將用于加速藥物研發(fā)的日本第一臺(tái)生成式AI超級(jí)計(jì)算機(jī)Tokyo-1。Tokyo-1通過使用BioNeMo軟件，研究人員能運(yùn)行高達(dá)數(shù)十億參數(shù)的先進(jìn)AI模型，可用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、小分子生成、姿態(tài)估計(jì)等。

計(jì)算光刻技術(shù)提速40倍

黃仁勛帶來的另一項(xiàng)革命性技術(shù)，也關(guān)乎英偉達(dá)自身的產(chǎn)品研發(fā)，是一項(xiàng)聚焦先進(jìn)芯片設(shè)計(jì)制造的技術(shù)——NVIDIA cuLitho的計(jì)算光刻庫(kù)。

NVIDIA cuLitho計(jì)算光刻庫(kù)可以通過計(jì)算技術(shù)大幅優(yōu)化芯片制造流程，利用GPU技術(shù)實(shí)現(xiàn)計(jì)算光刻，可以使傳統(tǒng)光刻技術(shù)提速40倍以上，為2nm及更先進(jìn)芯片的生產(chǎn)提供助力。

事實(shí)上，英偉達(dá)的計(jì)算光刻庫(kù)在研發(fā)過程中，已經(jīng)與3家全球頂尖的芯片制造廠商開展了長(zhǎng)達(dá)4年的合作。包括晶圓制造巨頭臺(tái)積電、光刻機(jī)制造商阿斯麥，以及EDA巨頭新思科技，目前3家廠商均已開始將該技術(shù)引入芯片設(shè)計(jì)和制造流程。

“計(jì)算光刻是芯片設(shè)計(jì)和制造領(lǐng)域中最大的計(jì)算工作負(fù)載，每年消耗數(shù)百億CPU小時(shí)?！秉S仁勛介紹說，大型數(shù)據(jù)中心24x7全天候運(yùn)行，以便創(chuàng)建用于光刻系統(tǒng)的掩膜板。這些數(shù)據(jù)中心是芯片制造商每年投資近2000億美元的資本支出的一部分。

NVIDIA H100需要89塊掩膜板，在CPU上運(yùn)算時(shí)，處理單個(gè)掩膜板，當(dāng)前需要2周時(shí)間。如果在GPU上運(yùn)行cuLitho則只需8小時(shí)即可處理完一個(gè)掩膜板。黃仁勛說：“臺(tái)積電可以通過在500個(gè)DGX H100系統(tǒng)上使用cuLitho加速，將功率從35MW降至5MW，替代用于計(jì)算光刻的40000臺(tái)CPU服務(wù)器?！?/span>

GPU&量子計(jì)算

除了AI和芯片以外，英偉達(dá)還在研究另一項(xiàng)前沿科技——量子計(jì)算。

本次GTC上宣布的第一個(gè)全新產(chǎn)品就是與Quantum Machines合作的NVIDIA DGX Quantum。該產(chǎn)品結(jié)合了通用量子控制系統(tǒng)Quantum Machines OPX+和NVIDIA Grace Hopper超級(jí)芯片，這個(gè)平臺(tái)可以為高性能和低延遲量子經(jīng)典計(jì)算的研究人員提供了一種革命性的新架構(gòu)。

據(jù)黃仁勛介紹，NVIDIA DGX Quantum是全球首個(gè)GPU加速的量子計(jì)算系統(tǒng)，可以實(shí)現(xiàn)GPU和量子處理單元（QPU）之間的亞微秒級(jí)延遲。這種組合使研究人員能夠建立強(qiáng)大的應(yīng)用，實(shí)現(xiàn)校準(zhǔn)、控制、量子糾錯(cuò)和混合算法，將量子計(jì)算與最先進(jìn)的經(jīng)典計(jì)算相結(jié)合。

DGX Quantum還為開發(fā)人員配備了統(tǒng)一軟件棧，混合GPU-Quantum編程模型NVIDIA CUDA Quantum，能夠在同一系統(tǒng)中整合和編程 QPU、GPU 和 CPU，是一個(gè)混合型量子經(jīng)典計(jì)算平臺(tái)。目前，CUDA Quantum 已經(jīng)開放了源代碼，為開發(fā)者提供了更多的支持。

在英偉達(dá)這次GTC大會(huì)上，下手ASML、TSMC 和 Synopsys突破計(jì)算光刻，助力行業(yè)跨越物理極限是另一個(gè)值得關(guān)注的亮點(diǎn)。

NVIDIA 表示，將加速計(jì)算帶入計(jì)算光刻領(lǐng)域，使 ASML、臺(tái)積電和 Synopsys 等半導(dǎo)體領(lǐng)導(dǎo)者能夠加速下一代芯片的設(shè)計(jì)和制造，正如當(dāng)前的生產(chǎn)流程已接近物理學(xué)的極限一樣使成為可能。

英偉達(dá)在新聞稿中指出，用于計(jì)算光刻的全新 NVIDIA cuLitho 軟件庫(kù)被世界領(lǐng)先的晶圓代工廠臺(tái)積電和電子設(shè)計(jì)自動(dòng)化領(lǐng)導(dǎo)者Synopsys集成到其最新一代 NVIDIA Hopper? 架構(gòu) GPU 的軟件、制造流程和系統(tǒng)中。設(shè)備制造商 ASML 在 GPU 和 cuLitho 方面與 NVIDIA 密切合作，并計(jì)劃將對(duì) GPU 的支持集成到其所有計(jì)算光刻軟件產(chǎn)品中。

這一進(jìn)步將使芯片具有比現(xiàn)在更細(xì)的晶體管和電線，同時(shí)加快上市時(shí)間并提高 24/7 全天候運(yùn)行以驅(qū)動(dòng)制造過程的大型數(shù)據(jù)中心的能源效率。

“芯片行業(yè)是世界上幾乎所有其他行業(yè)的基礎(chǔ)，”NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示?！半S著光刻技術(shù)達(dá)到物理極限，NVIDIA 推出 cuLitho 并與我們的合作伙伴 TSMC、ASML 和 Synopsys 合作，使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為 2nm 及更高工藝奠定
在 GPU 上運(yùn)行，cuLitho 比當(dāng)前光刻技術(shù)（在硅晶圓上創(chuàng)建圖案的過程）提供高達(dá) 40 倍的性能飛躍，加速目前每年消耗數(shù)百億 CPU 小時(shí)的大量計(jì)算工作負(fù)載。

它使 500 個(gè) NVIDIA DGX H100 系統(tǒng)能夠完成 40,000 個(gè) CPU 系統(tǒng)的工作，并行運(yùn)行計(jì)算光刻過程的所有部分，有助于減少電力需求和潛在的環(huán)境影響。

在短期內(nèi)，使用 cuLitho 的晶圓廠可以幫助每天多生產(chǎn) 3-5 倍的光掩?！酒O(shè)計(jì)的模板——使用比當(dāng)前配置低 9 倍的功率。需要兩周才能完成的光掩?，F(xiàn)在可以在一夜之間完成。
從長(zhǎng)遠(yuǎn)來看，cuLitho 將實(shí)現(xiàn)更好的設(shè)計(jì)規(guī)則、更高的密度、更高的產(chǎn)量和 AI 驅(qū)動(dòng)的光刻。

“cuLitho 團(tuán)隊(duì)通過將昂貴的操作轉(zhuǎn)移到 GPU，在加速計(jì)算光刻方面取得了令人欽佩的進(jìn)展，”臺(tái)積電首席執(zhí)行官 CC Wei 博士說?！斑@一發(fā)展為臺(tái)積電在芯片制造中更廣泛地部署逆光刻技術(shù)和深度學(xué)習(xí)等光刻解決方案開辟了新的可能性，為半導(dǎo)體規(guī)模的持續(xù)發(fā)展做出了重要貢獻(xiàn)?！?/span>

“我們計(jì)劃將對(duì) GPU 的支持集成到我們所有的計(jì)算光刻軟件產(chǎn)品中，”ASML 首席執(zhí)行官 Peter Wennink 說?！拔覀兣c NVIDIA 在 GPU 和 cuLitho 方面的合作應(yīng)該會(huì)給計(jì)算光刻帶來巨大好處，從而給半導(dǎo)體微縮帶來好處。在High NA 極紫外光刻時(shí)代尤其如此?！?/span>

Synopsys 董事長(zhǎng)兼首席執(zhí)行官 Aart de Geus 表示：“計(jì)算光刻，特別是光學(xué)鄰近校正 (OPC)，正在突破最先進(jìn)芯片的計(jì)算工作負(fù)載界限?！巴ㄟ^與我們的合作伙伴 NVIDIA 合作，在 cuLitho 平臺(tái)上運(yùn)行 Synopsys OPC 軟件，我們將性能從數(shù)周大幅提升至數(shù)天！我們兩家領(lǐng)先公司的合作將繼續(xù)推動(dòng)該行業(yè)取得驚人的進(jìn)步?！?/span>

英偉達(dá)表示，近年來，由于較新節(jié)點(diǎn)中的晶體管數(shù)量更多以及更嚴(yán)格的精度要求，半導(dǎo)體制造中最大工作負(fù)載所需的計(jì)算時(shí)間成本已超過摩爾定律。未來的節(jié)點(diǎn)需要更詳細(xì)的計(jì)算，并非所有這些都可以適用于當(dāng)前平臺(tái)提供的可用計(jì)算帶寬，從而減緩了半導(dǎo)體創(chuàng)新的步伐。

晶圓廠流程變更通常需要 OPC 修訂，從而造成瓶頸。cuLitho 有助于消除這些瓶頸，并使新穎的解決方案和創(chuàng)新技術(shù)成為可能，例如曲線掩模、High NA EUV 光刻和新技術(shù)節(jié)點(diǎn)所需的亞原子光刻膠建模。

總結(jié)

在昨天開幕的GTC上，英偉達(dá)還帶來了多樣化的產(chǎn)品，例如用于特定推理的的英偉達(dá) L4 GPU。據(jù)報(bào)道，這款 GPU 可以提供比 CPU 高 120 倍的人工智能視頻性能。它提供增強(qiáng)的視頻解碼和轉(zhuǎn)碼功能、視頻流、增強(qiáng)現(xiàn)實(shí)和生成 AI 視頻。

此外，英偉達(dá)還聯(lián)合客戶打造由 16 個(gè) DGX H100 系統(tǒng)組成，每個(gè)系統(tǒng)配備八個(gè) H100 GPU的生成式AI超級(jí)計(jì)算機(jī)Tokyo-1。根據(jù) Nvidia 的 AI 觸發(fā)器數(shù)學(xué)計(jì)算，這相當(dāng)于大約一半的 exaflop AI 能力；由于每個(gè) H100（一開始將有 128 個(gè)）提供 30 teraflops 的峰值 FP64 功率，因此它應(yīng)該達(dá)到大約 3.84 petaflops 的峰值。

由此可見，黃仁勛正在帶領(lǐng)英偉達(dá)走向一個(gè)新階段。