全程回顧黃仁勛GTC演講：Blackwell架構(gòu)B200芯片登場(chǎng)

史正丞2024-03-21 07:51

北京時(shí)間3月19日4時(shí)-6時(shí)，英偉達(dá)創(chuàng)始人黃仁勛在美國(guó)加州圣何塞SAP中心登臺(tái)，發(fā)表GTC 2024的主題演講《見證AI的變革時(shí)刻》。鑒于過去一年多時(shí)間里AI帶來的生產(chǎn)力變革，以及英偉達(dá)等一眾概念股的表現(xiàn)，老黃的演講已經(jīng)變成全球資本市場(chǎng)翹首以待的熱門事件。

在這場(chǎng)兩個(gè)小時(shí)的演講中，黃仁勛公布了搭載B200芯片的GB200 Grace Blackwell超級(jí)芯片系統(tǒng)，以及英偉達(dá)在AI軟件（NIM微服務(wù)）、Omiverse云、具身智能方面的最新進(jìn)展。

以下為演講內(nèi)容回顧：

黃仁勛登臺(tái)，對(duì)觀眾們強(qiáng)調(diào)：我希望你們搞清楚今天這里不是演唱會(huì)，而是一場(chǎng)開發(fā)者大會(huì)。

黃仁勛介紹了本屆GTC的一些參與者，并強(qiáng)調(diào)這些公司不只是來參會(huì)，而是有自己的東西要來展示。

黃仁勛展示英偉達(dá)發(fā)展史，又提了將首臺(tái)DGX One送給OpenAI的故事。

黃仁勛：今天我們將討論這個(gè)新行業(yè)的許多問題。我們要談?wù)勅绾芜M(jìn)行計(jì)算、我們要談?wù)勀闼鶚?gòu)建的軟件類型，你將如何看待這個(gè)新軟件，新行業(yè)中的應(yīng)用然后，也許（再談?wù)劊┫乱徊绞鞘裁矗覀內(nèi)绾螐慕裉扉_始做準(zhǔn)備，下一步會(huì)發(fā)生什么。

黃仁勛：我們使用仿真工具來創(chuàng)造產(chǎn)品，并不是為了降低計(jì)算成本，而是為了擴(kuò)大計(jì)算規(guī)模。我們希望能夠以完全保真、完全數(shù)字化的方式模擬我們所做的整個(gè)產(chǎn)品。從本質(zhì)上講，我們稱之為數(shù)字孿生。

老黃開始介紹一系列“新加速生態(tài)系統(tǒng)”合作伙伴，包括ANSYS、Synopsis、Cadence等。他也提及，臺(tái)積電和Synopsys將突破性的英偉達(dá)計(jì)算光刻平臺(tái)投入生產(chǎn)。

隨著transformer模型被發(fā)明，我們能以驚人的速度擴(kuò)展大型語言模型，實(shí)際上每六個(gè)月就能翻一番。而為了訓(xùn)練這些越來越大的模型，我們也需要更強(qiáng)的算力。

“非常強(qiáng)大”的Blackwell架構(gòu)GPU登場(chǎng)

老黃現(xiàn)場(chǎng)對(duì)比Blackwell架構(gòu)和Grace Hopper架構(gòu)的GPU

老黃現(xiàn)場(chǎng)展示Grace-Blackwell系統(tǒng)（兩個(gè)Blackwell GPU、四個(gè)die與一個(gè)Grace Cpu連接在一起）。GB200將兩個(gè)B200 Blackwell GPU與一個(gè)基于Arm的Grace CPU進(jìn)行配對(duì)。新芯片擁有2080億個(gè)晶體管，所有這些晶體管幾乎同時(shí)訪問與芯片連接的內(nèi)存。

為了處理大規(guī)模數(shù)據(jù)中心的GPU交互問題，也需要更強(qiáng)的連接（NVlink）能力。

這個(gè)GB200新系統(tǒng)提升在哪里呢？老黃舉例稱，如果要訓(xùn)練一個(gè)1.8萬億參數(shù)量的GPT模型，需要8000張Hopper GPU，消耗15兆瓦的電力，連續(xù)跑上90天。但如果使用Blackwell GPU，只需要2000張，同樣跑90天只要消耗四分之一的電力。當(dāng)然不只是訓(xùn)練，生成Token的成本也會(huì)隨之降低。

把芯片做大的好處：?jiǎn)蜧PU每秒Token吞吐量翻了30倍

毫無疑問，微軟Azure、AWS、谷歌云等一眾科技巨頭都是Blackwell架構(gòu)的首批用戶。

接下來應(yīng)該是應(yīng)用側(cè)的部分，先展示的是生物醫(yī)藥的部分，包括NVIDIA DGX云中的多項(xiàng)更新。

黃仁勛宣布新的AI微服務(wù)，用于開發(fā)和部署企業(yè)級(jí)生成式AI應(yīng)用。老黃表示，未來如何開發(fā)軟件？與現(xiàn)在寫一行行代碼不同，未來可能就要靠一堆NIMs（Nvidia inference micro service），用與AI聊天的形式調(diào)動(dòng)一堆NIMS來完成訓(xùn)練、應(yīng)用的部署。英偉達(dá)的愿景是成為AI軟件的“晶圓廠”。

英偉達(dá)的AI微服務(wù)NIM網(wǎng)站已經(jīng)上線。

NIM微服務(wù)提供了最快、性能最高的AI生產(chǎn)容器，用于部署來自NVIDIA、A121、Adept、Cohere、Getty Images和Shutterstock的模型，以及來自Google、Hugging Face、Meta、Microsoft、Mistral AI和Stability AI的開放模型。

NVIDIA AI Enterprise軟件平臺(tái)更新，包括NIM、構(gòu)建RAG應(yīng)用程序的工具等。隨后老黃又分享了西門子科技、日產(chǎn)汽車等用如何在工作流中將Omiverse Cloud應(yīng)用在工作流中。

黃仁勛宣布，現(xiàn)在支持將Omniverse云推流至Vision Pro。

可能是時(shí)間不太夠了，老黃開始加速官宣一系列合作。其中提到全球最大電動(dòng)車公司比亞迪將采用英偉達(dá)集中式車載計(jì)算平臺(tái)DRIVE Thor開發(fā)下一代電動(dòng)車。此外，比亞迪同時(shí)將使用英偉達(dá)基礎(chǔ)設(shè)施進(jìn)行自動(dòng)駕駛模型訓(xùn)練，以及英偉達(dá)Isaac來設(shè)計(jì)/模擬智能工廠機(jī)器人。

開始提機(jī)器人了。黃仁勛表示，在我們的世界里，類人機(jī)器人很有可能會(huì)發(fā)揮更大的作用，我們?cè)O(shè)置工作站、制造和物流的方式都是為人類設(shè)計(jì)的。黃仁勛同時(shí)宣布一項(xiàng)名為GR00T的項(xiàng)目，旨在進(jìn)一步推動(dòng)英偉達(dá)在機(jī)器人和具身智能的突破性工作。由GR00T驅(qū)動(dòng)的機(jī)器人可以理解自然語言，并通過觀察人類動(dòng)作來模擬運(yùn)動(dòng)。