北京時(shí)間3月19日4時(shí)-6時(shí),英偉達(dá)創(chuàng)始人黃仁勛在美國(guó)加州圣何塞SAP中心登臺(tái),發(fā)表GTC 2024的主題演講《見證AI的變革時(shí)刻》。鑒于過去一年多時(shí)間里AI帶來的生產(chǎn)力變革,以及英偉達(dá)等一眾概念股的表現(xiàn),老黃的演講已經(jīng)變成全球資本市場(chǎng)翹首以待的熱門事件。
在這場(chǎng)兩個(gè)小時(shí)的演講中,黃仁勛公布了搭載B200芯片的GB200 Grace Blackwell超級(jí)芯片系統(tǒng),以及英偉達(dá)在AI軟件(NIM微服務(wù))、Omiverse云、具身智能方面的最新進(jìn)展。
以下為演講內(nèi)容回顧:
黃仁勛登臺(tái),對(duì)觀眾們強(qiáng)調(diào):我希望你們搞清楚今天這里不是演唱會(huì),而是一場(chǎng)開發(fā)者大會(huì)。
黃仁勛介紹了本屆GTC的一些參與者,并強(qiáng)調(diào)這些公司不只是來參會(huì),而是有自己的東西要來展示。
黃仁勛展示英偉達(dá)發(fā)展史,又提了將首臺(tái)DGX One送給OpenAI的故事。
黃仁勛:今天我們將討論這個(gè)新行業(yè)的許多問題。我們要談?wù)勅绾芜M(jìn)行計(jì)算、我們要談?wù)勀闼鶚?gòu)建的軟件類型,你將如何看待這個(gè)新軟件,新行業(yè)中的應(yīng)用 然后,也許(再談?wù)劊┫乱徊绞鞘裁矗覀內(nèi)绾螐慕裉扉_始做準(zhǔn)備,下一步會(huì)發(fā)生什么。
黃仁勛:我們使用仿真工具來創(chuàng)造產(chǎn)品,并不是為了降低計(jì)算成本,而是為了擴(kuò)大計(jì)算規(guī)模。我們希望能夠以完全保真、完全數(shù)字化的方式模擬我們所做的整個(gè)產(chǎn)品。從本質(zhì)上講,我們稱之為數(shù)字孿生。
老黃開始介紹一系列“新加速生態(tài)系統(tǒng)”合作伙伴,包括ANSYS、Synopsis、Cadence等。他也提及,臺(tái)積電和Synopsys將突破性的英偉達(dá)計(jì)算光刻平臺(tái)投入生產(chǎn)。
隨著transformer模型被發(fā)明,我們能以驚人的速度擴(kuò)展大型語言模型,實(shí)際上每六個(gè)月就能翻一番。而為了訓(xùn)練這些越來越大的模型,我們也需要更強(qiáng)的算力。
“非常強(qiáng)大”的Blackwell架構(gòu)GPU登場(chǎng)
老黃現(xiàn)場(chǎng)對(duì)比Blackwell架構(gòu)和Grace Hopper架構(gòu)的GPU
老黃現(xiàn)場(chǎng)展示Grace-Blackwell系統(tǒng)(兩個(gè)Blackwell GPU、四個(gè)die與一個(gè)Grace Cpu連接在一起)。GB200將兩個(gè)B200 Blackwell GPU與一個(gè)基于Arm的Grace CPU進(jìn)行配對(duì)。新芯片擁有2080億個(gè)晶體管,所有這些晶體管幾乎同時(shí)訪問與芯片連接的內(nèi)存。
為了處理大規(guī)模數(shù)據(jù)中心的GPU交互問題,也需要更強(qiáng)的連接(NVlink)能力。
這個(gè)GB200新系統(tǒng)提升在哪里呢?老黃舉例稱,如果要訓(xùn)練一個(gè)1.8萬億參數(shù)量的GPT模型,需要8000張Hopper GPU,消耗15兆瓦的電力,連續(xù)跑上90天。但如果使用Blackwell GPU,只需要2000張,同樣跑90天只要消耗四分之一的電力。當(dāng)然不只是訓(xùn)練,生成Token的成本也會(huì)隨之降低。
把芯片做大的好處:?jiǎn)蜧PU每秒Token吞吐量翻了30倍
毫無疑問,微軟Azure、AWS、谷歌云等一眾科技巨頭都是Blackwell架構(gòu)的首批用戶。
接下來應(yīng)該是應(yīng)用側(cè)的部分,先展示的是生物醫(yī)藥的部分,包括NVIDIA DGX云中的多項(xiàng)更新。
黃仁勛宣布新的AI微服務(wù),用于開發(fā)和部署企業(yè)級(jí)生成式AI應(yīng)用。老黃表示,未來如何開發(fā)軟件?與現(xiàn)在寫一行行代碼不同,未來可能就要靠一堆NIMs(Nvidia inference micro service),用與AI聊天的形式調(diào)動(dòng)一堆NIMS來完成訓(xùn)練、應(yīng)用的部署。英偉達(dá)的愿景是成為AI軟件的“晶圓廠”。
英偉達(dá)的AI微服務(wù)NIM網(wǎng)站已經(jīng)上線。
NIM微服務(wù)提供了最快、性能最高的AI生產(chǎn)容器,用于部署來自NVIDIA、A121、Adept、Cohere、Getty Images和Shutterstock的模型,以及來自Google、Hugging Face、Meta、Microsoft、Mistral AI和Stability AI的開放模型。
NVIDIA AI Enterprise軟件平臺(tái)更新,包括NIM、構(gòu)建RAG應(yīng)用程序的工具等。隨后老黃又分享了西門子科技、日產(chǎn)汽車等用如何在工作流中將Omiverse Cloud應(yīng)用在工作流中。
黃仁勛宣布,現(xiàn)在支持將Omniverse云推流至Vision Pro。
可能是時(shí)間不太夠了,老黃開始加速官宣一系列合作。其中提到全球最大電動(dòng)車公司比亞迪將采用英偉達(dá)集中式車載計(jì)算平臺(tái)DRIVE Thor開發(fā)下一代電動(dòng)車。此外,比亞迪同時(shí)將使用英偉達(dá)基礎(chǔ)設(shè)施進(jìn)行自動(dòng)駕駛模型訓(xùn)練,以及英偉達(dá)Isaac來設(shè)計(jì)/模擬智能工廠機(jī)器人。
開始提機(jī)器人了。黃仁勛表示,在我們的世界里,類人機(jī)器人很有可能會(huì)發(fā)揮更大的作用,我們?cè)O(shè)置工作站、制造和物流的方式都是為人類設(shè)計(jì)的。黃仁勛同時(shí)宣布一項(xiàng)名為GR00T的項(xiàng)目,旨在進(jìn)一步推動(dòng)英偉達(dá)在機(jī)器人和具身智能的突破性工作。由GR00T驅(qū)動(dòng)的機(jī)器人可以理解自然語言,并通過觀察人類動(dòng)作來模擬運(yùn)動(dòng)。
除了機(jī)器人影像外,迪士尼的orange和green機(jī)器人也來到現(xiàn)場(chǎng),這款機(jī)器人用的是英偉達(dá)為機(jī)器人設(shè)計(jì)的首款A(yù)I芯片Jetson。
黃仁勛帶著機(jī)器人下場(chǎng),現(xiàn)場(chǎng)播放ending影片
黃仁勛返場(chǎng)告別,全場(chǎng)發(fā)布會(huì)結(jié)束。
轉(zhuǎn)載來源:財(cái)聯(lián)社 作者:史正丞