殺入光刻領(lǐng)域,押注生成式AI,英偉達(dá)要放大招了
關(guān)鍵詞: ASML 臺(tái)積電 英偉達(dá)
據(jù)外媒報(bào)道,英偉達(dá)公司日前在GTC大會(huì)上宣布,將與與ASML、Synopsys和臺(tái)積電合作,推廣使用其“cuLitho”軟件庫(kù)進(jìn)行計(jì)算光刻,表示該庫(kù)將使其合作伙伴能夠以更高的效率設(shè)計(jì)和制造下一代芯片。
英偉達(dá)方面認(rèn)為,通過在GPU而不是通用CPU上運(yùn)行,復(fù)雜IC光刻圖案背后的計(jì)算效率可以提高40倍。cuLitho軟件用于將工作負(fù)載轉(zhuǎn)換為可以利用GPU并行性的格式。這使500個(gè) NVIDIA DGX H100 系統(tǒng)能夠完成40000個(gè)CPU系統(tǒng)執(zhí)行的工作。
使用cuLitho的晶圓廠每天可以使用九分之一的功率生產(chǎn)三到五倍的光掩模。該公司還表示,需要兩周才能生產(chǎn)的光掩??梢允褂胏uLitho和GPU在一夜之間進(jìn)行處理。從長(zhǎng)遠(yuǎn)來看,cuLitho將實(shí)現(xiàn)更好的設(shè)計(jì)規(guī)則、更高的密度、更高的產(chǎn)量,并且是通向AI驅(qū)動(dòng)的光刻技術(shù)的途徑。
黃仁勛還透漏,Hopper架構(gòu)GPU將使用cuLitho庫(kù)進(jìn)行設(shè)計(jì)和制造。臺(tái)積電方面也回應(yīng)稱,“這一發(fā)展為臺(tái)積電在芯片制造中更廣泛地部署逆光刻技術(shù)和深度學(xué)習(xí)等光刻解決方案開辟了新的可能性,為半導(dǎo)體規(guī)模的持續(xù)發(fā)展做出了重要貢獻(xiàn)”。
這次被黃仁勛稱為“迄今為止最重要的一次GTC”有超過25萬人參加。他在演講中多次提到,AI的“iPhone”時(shí)刻已經(jīng)到來,而英偉達(dá)將在生成式AI領(lǐng)域進(jìn)行軟硬件全面布局。同時(shí),他還公布了英偉達(dá)在加速計(jì)算、量子計(jì)算、元宇宙等領(lǐng)域的技術(shù)和應(yīng)用情況。
AI進(jìn)入“iPhone”時(shí)刻,推出專用云服務(wù)
黃仁勛在演講中數(shù)次提到生成式AI,稱“ChatGPT是震驚世界的AI”。他認(rèn)為,這意味著嶄新的計(jì)算平臺(tái)的誕生,AI的“iPhone”時(shí)刻已經(jīng)到來,加速計(jì)算和AI技術(shù)已經(jīng)走進(jìn)現(xiàn)實(shí)。
在黃仁勛看來,ChatGPT、Stable Diffusion、DALL-E和Midjourney等生成式AI工具喚醒了世界對(duì)生成式AI的認(rèn)知,尤其是ChatGPT作為迄今歷史上用戶數(shù)量增長(zhǎng)最快的應(yīng)用,生成的文本令人贊嘆。
黃仁勛認(rèn)為,生成式AI是一種新型計(jì)算機(jī),一種可以用人類語言進(jìn)行編程的計(jì)算機(jī),每個(gè)人都可以命令計(jì)算機(jī)來解決問題,而這之前是只有程序員才能接觸的領(lǐng)域,現(xiàn)在每個(gè)人都可以是程序員。
他同時(shí)還稱,生成式AI是一種新型計(jì)算平臺(tái),與PC、互聯(lián)網(wǎng)、移動(dòng)設(shè)備和云類似。正如此前的互聯(lián)網(wǎng)一樣,生成式AI也將重塑每個(gè)行業(yè)。
不過,黃仁勛提到,一些專業(yè)領(lǐng)域的公司需要使用專有數(shù)據(jù)來定制模型,他們需要制定使用規(guī)范,并優(yōu)化模型,契合公司安全、隱私和安保要求?!斑@個(gè)行業(yè)需要一個(gè)類似臺(tái)積電的代工廠,來構(gòu)建自定義的大型語言模型?!?/span>
為此英偉達(dá)宣布推出AI Foundations,黃仁勛將其稱為云服務(wù)和代工廠,其可以讓企業(yè)使用專有數(shù)據(jù)進(jìn)行訓(xùn)練、處理特定領(lǐng)域的任務(wù),構(gòu)建自定義的語言模型和生成式AI。
英偉達(dá)AI Foundations包括語言、視覺和生物學(xué)模型三個(gè)方面服務(wù),其中Nemo用于構(gòu)建定制的語言文本生成模型,通過Nemo可以快速生成文本,最快捷的方法是從英偉達(dá)的某項(xiàng)先進(jìn)的預(yù)訓(xùn)練基礎(chǔ)模型入手,輕松自定義一個(gè)模型,并進(jìn)行參數(shù)調(diào)優(yōu),如匯總財(cái)務(wù)文檔、創(chuàng)建特定品牌內(nèi)容、個(gè)性化寫作風(fēng)格撰寫郵件等,將模型鏈接到專有數(shù)據(jù)庫(kù),可確保響應(yīng)是準(zhǔn)確和最新的,并可以通過指定區(qū)域放防止模型出現(xiàn)意外。
Picasso是一項(xiàng)視覺語言模型制作服務(wù),可以用于生成式AI賦能的圖像、視頻和3D應(yīng)用,企業(yè)可以使用自己的數(shù)據(jù)來部署和訓(xùn)練自己的模型,并可將生成的素材導(dǎo)入編輯工具或Omniverse,以構(gòu)建逼真的虛擬世界、元宇宙應(yīng)用和數(shù)字孿生仿真。Getty Images、Shutterstock和Adobe等企業(yè)已經(jīng)開始使用該項(xiàng)服務(wù)。
黃仁勛還表示,英偉達(dá)將和Adobe共同構(gòu)建一系列新一代AI功能,打造創(chuàng)意領(lǐng)域的未來,將生成式AI融入營(yíng)銷和創(chuàng)意專業(yè)人士的日常工作中,新的生成式AI模型將對(duì)圖像、視頻、3D和動(dòng)畫制作進(jìn)行優(yōu)化。同時(shí),為保護(hù)藝術(shù)家的權(quán)利,Adobe正在開發(fā)以商業(yè)可行性和正確內(nèi)容歸屬為重點(diǎn)的方案,由Adobe的“內(nèi)容真實(shí)性倡議”提供支持。
第三個(gè)是面向的生物學(xué)的BioNeMo,其可幫助研究人員使用專有數(shù)據(jù)創(chuàng)建、微調(diào)和提供自定義模型,讓研發(fā)人員輕松加速藥物研發(fā)工作流,可以進(jìn)行蛋白質(zhì)預(yù)測(cè)、分子生成、分析連接等,節(jié)省藥物研發(fā)時(shí)間和資金成本。
在應(yīng)用方面,英偉達(dá)與三菱聯(lián)合發(fā)布了將用于加速藥物研發(fā)的日本第一臺(tái)生成式AI超級(jí)計(jì)算機(jī)Tokyo-1。Tokyo-1通過使用BioNeMo軟件,研究人員能運(yùn)行高達(dá)數(shù)十億參數(shù)的先進(jìn)AI模型,可用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、小分子生成、姿態(tài)估計(jì)等。
計(jì)算光刻技術(shù)提速40倍
黃仁勛帶來的另一項(xiàng)革命性技術(shù),也關(guān)乎英偉達(dá)自身的產(chǎn)品研發(fā),是一項(xiàng)聚焦先進(jìn)芯片設(shè)計(jì)制造的技術(shù)——NVIDIA cuLitho的計(jì)算光刻庫(kù)。
NVIDIA cuLitho計(jì)算光刻庫(kù)可以通過計(jì)算技術(shù)大幅優(yōu)化芯片制造流程,利用GPU技術(shù)實(shí)現(xiàn)計(jì)算光刻,可以使傳統(tǒng)光刻技術(shù)提速40倍以上,為2nm及更先進(jìn)芯片的生產(chǎn)提供助力。
事實(shí)上,英偉達(dá)的計(jì)算光刻庫(kù)在研發(fā)過程中,已經(jīng)與3家全球頂尖的芯片制造廠商開展了長(zhǎng)達(dá)4年的合作。包括晶圓制造巨頭臺(tái)積電、光刻機(jī)制造商阿斯麥,以及EDA巨頭新思科技,目前3家廠商均已開始將該技術(shù)引入芯片設(shè)計(jì)和制造流程。
“計(jì)算光刻是芯片設(shè)計(jì)和制造領(lǐng)域中最大的計(jì)算工作負(fù)載,每年消耗數(shù)百億CPU小時(shí)?!秉S仁勛介紹說,大型數(shù)據(jù)中心24x7全天候運(yùn)行,以便創(chuàng)建用于光刻系統(tǒng)的掩膜板。這些數(shù)據(jù)中心是芯片制造商每年投資近2000億美元的資本支出的一部分。
NVIDIA H100需要89塊掩膜板,在CPU上運(yùn)算時(shí),處理單個(gè)掩膜板,當(dāng)前需要2周時(shí)間。如果在GPU上運(yùn)行cuLitho則只需8小時(shí)即可處理完一個(gè)掩膜板。黃仁勛說:“臺(tái)積電可以通過在500個(gè)DGX H100系統(tǒng)上使用cuLitho加速,將功率從35MW降至5MW,替代用于計(jì)算光刻的40000臺(tái)CPU服務(wù)器?!?/span>
GPU&量子計(jì)算
除了AI和芯片以外,英偉達(dá)還在研究另一項(xiàng)前沿科技——量子計(jì)算。
本次GTC上宣布的第一個(gè)全新產(chǎn)品就是與Quantum Machines合作的NVIDIA DGX Quantum。該產(chǎn)品結(jié)合了通用量子控制系統(tǒng)Quantum Machines OPX+和NVIDIA Grace Hopper超級(jí)芯片,這個(gè)平臺(tái)可以為高性能和低延遲量子經(jīng)典計(jì)算的研究人員提供了一種革命性的新架構(gòu)。
據(jù)黃仁勛介紹,NVIDIA DGX Quantum是全球首個(gè)GPU加速的量子計(jì)算系統(tǒng),可以實(shí)現(xiàn)GPU和量子處理單元(QPU)之間的亞微秒級(jí)延遲。這種組合使研究人員能夠建立強(qiáng)大的應(yīng)用,實(shí)現(xiàn)校準(zhǔn)、控制、量子糾錯(cuò)和混合算法,將量子計(jì)算與最先進(jìn)的經(jīng)典計(jì)算相結(jié)合。
DGX Quantum還為開發(fā)人員配備了統(tǒng)一軟件棧,混合GPU-Quantum編程模型NVIDIA CUDA Quantum,能夠在同一系統(tǒng)中整合和編程 QPU、GPU 和 CPU,是一個(gè)混合型量子經(jīng)典計(jì)算平臺(tái)。目前,CUDA Quantum 已經(jīng)開放了源代碼,為開發(fā)者提供了更多的支持。
在英偉達(dá)這次GTC大會(huì)上,下手ASML、TSMC 和 Synopsys突破計(jì)算光刻,助力行業(yè)跨越物理極限是另一個(gè)值得關(guān)注的亮點(diǎn)。
NVIDIA 表示,將加速計(jì)算帶入計(jì)算光刻領(lǐng)域,使 ASML、臺(tái)積電和 Synopsys 等半導(dǎo)體領(lǐng)導(dǎo)者能夠加速下一代芯片的設(shè)計(jì)和制造,正如當(dāng)前的生產(chǎn)流程已接近物理學(xué)的極限一樣使成為可能。
英偉達(dá)在新聞稿中指出,用于計(jì)算光刻的全新 NVIDIA cuLitho 軟件庫(kù)被世界領(lǐng)先的晶圓代工廠臺(tái)積電和電子設(shè)計(jì)自動(dòng)化領(lǐng)導(dǎo)者Synopsys集成到其最新一代 NVIDIA Hopper? 架構(gòu) GPU 的軟件、制造流程和系統(tǒng)中。設(shè)備制造商 ASML 在 GPU 和 cuLitho 方面與 NVIDIA 密切合作,并計(jì)劃將對(duì) GPU 的支持集成到其所有計(jì)算光刻軟件產(chǎn)品中。
這一進(jìn)步將使芯片具有比現(xiàn)在更細(xì)的晶體管和電線,同時(shí)加快上市時(shí)間并提高 24/7 全天候運(yùn)行以驅(qū)動(dòng)制造過程的大型數(shù)據(jù)中心的能源效率。
“芯片行業(yè)是世界上幾乎所有其他行業(yè)的基礎(chǔ),”NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示?!半S著光刻技術(shù)達(dá)到物理極限,NVIDIA 推出 cuLitho 并與我們的合作伙伴 TSMC、ASML 和 Synopsys 合作,使晶圓廠能夠提高產(chǎn)量、減少碳足跡并為 2nm 及更高工藝奠定
在 GPU 上運(yùn)行,cuLitho 比當(dāng)前光刻技術(shù)(在硅晶圓上創(chuàng)建圖案的過程)提供高達(dá) 40 倍的性能飛躍,加速目前每年消耗數(shù)百億 CPU 小時(shí)的大量計(jì)算工作負(fù)載。
它使 500 個(gè) NVIDIA DGX H100 系統(tǒng)能夠完成 40,000 個(gè) CPU 系統(tǒng)的工作,并行運(yùn)行計(jì)算光刻過程的所有部分,有助于減少電力需求和潛在的環(huán)境影響。
在短期內(nèi),使用 cuLitho 的晶圓廠可以幫助每天多生產(chǎn) 3-5 倍的光掩?!酒O(shè)計(jì)的模板——使用比當(dāng)前配置低 9 倍的功率。需要兩周才能完成的光掩?,F(xiàn)在可以在一夜之間完成。
從長(zhǎng)遠(yuǎn)來看,cuLitho 將實(shí)現(xiàn)更好的設(shè)計(jì)規(guī)則、更高的密度、更高的產(chǎn)量和 AI 驅(qū)動(dòng)的光刻。
“cuLitho 團(tuán)隊(duì)通過將昂貴的操作轉(zhuǎn)移到 GPU,在加速計(jì)算光刻方面取得了令人欽佩的進(jìn)展,”臺(tái)積電首席執(zhí)行官 CC Wei 博士說?!斑@一發(fā)展為臺(tái)積電在芯片制造中更廣泛地部署逆光刻技術(shù)和深度學(xué)習(xí)等光刻解決方案開辟了新的可能性,為半導(dǎo)體規(guī)模的持續(xù)發(fā)展做出了重要貢獻(xiàn)?!?/span>
“我們計(jì)劃將對(duì) GPU 的支持集成到我們所有的計(jì)算光刻軟件產(chǎn)品中,”ASML 首席執(zhí)行官 Peter Wennink 說?!拔覀兣c NVIDIA 在 GPU 和 cuLitho 方面的合作應(yīng)該會(huì)給計(jì)算光刻帶來巨大好處,從而給半導(dǎo)體微縮帶來好處。在High NA 極紫外光刻時(shí)代尤其如此?!?/span>
Synopsys 董事長(zhǎng)兼首席執(zhí)行官 Aart de Geus 表示:“計(jì)算光刻,特別是光學(xué)鄰近校正 (OPC),正在突破最先進(jìn)芯片的計(jì)算工作負(fù)載界限?!巴ㄟ^與我們的合作伙伴 NVIDIA 合作,在 cuLitho 平臺(tái)上運(yùn)行 Synopsys OPC 軟件,我們將性能從數(shù)周大幅提升至數(shù)天!我們兩家領(lǐng)先公司的合作將繼續(xù)推動(dòng)該行業(yè)取得驚人的進(jìn)步?!?/span>
英偉達(dá)表示,近年來,由于較新節(jié)點(diǎn)中的晶體管數(shù)量更多以及更嚴(yán)格的精度要求,半導(dǎo)體制造中最大工作負(fù)載所需的計(jì)算時(shí)間成本已超過摩爾定律。未來的節(jié)點(diǎn)需要更詳細(xì)的計(jì)算,并非所有這些都可以適用于當(dāng)前平臺(tái)提供的可用計(jì)算帶寬,從而減緩了半導(dǎo)體創(chuàng)新的步伐。
晶圓廠流程變更通常需要 OPC 修訂,從而造成瓶頸。cuLitho 有助于消除這些瓶頸,并使新穎的解決方案和創(chuàng)新技術(shù)成為可能,例如曲線掩模、High NA EUV 光刻和新技術(shù)節(jié)點(diǎn)所需的亞原子光刻膠建模。
總結(jié)
在昨天開幕的GTC上,英偉達(dá)還帶來了多樣化的產(chǎn)品,例如用于特定推理的的英偉達(dá) L4 GPU。據(jù)報(bào)道,這款 GPU 可以提供比 CPU 高 120 倍的人工智能視頻性能。它提供增強(qiáng)的視頻解碼和轉(zhuǎn)碼功能、視頻流、增強(qiáng)現(xiàn)實(shí)和生成 AI 視頻。
此外,英偉達(dá)還聯(lián)合客戶打造由 16 個(gè) DGX H100 系統(tǒng)組成,每個(gè)系統(tǒng)配備八個(gè) H100 GPU的生成式AI超級(jí)計(jì)算機(jī)Tokyo-1。根據(jù) Nvidia 的 AI 觸發(fā)器數(shù)學(xué)計(jì)算,這相當(dāng)于大約一半的 exaflop AI 能力;由于每個(gè) H100(一開始將有 128 個(gè))提供 30 teraflops 的峰值 FP64 功率,因此它應(yīng)該達(dá)到大約 3.84 petaflops 的峰值。
由此可見,黃仁勛正在帶領(lǐng)英偉達(dá)走向一個(gè)新階段。
