5月19日上午,英偉達創(chuàng)始人CEO黃仁勛在COMPUTEX 2025發(fā)表演講。發(fā)布了一系列英偉達公司在軟硬件方面的更新,并介紹了他在未來全球AI領(lǐng)域的宏達暢想。
黃仁勛認為,AI在未來將會像互聯(lián)網(wǎng)和電力一樣,成為我們生活中不可或缺的必要組成部分。
黃仁勛還在演講后半段講述了他對AI代理、人形機器人等的暢想。在他的設(shè)想中,未來全球企業(yè)的IT部門將成為數(shù)字AI代理的人力資源管理部門,而人形機器人有一天會成為一個價值萬億美元的產(chǎn)業(yè)。
以下為演講實錄:
很高興來到這里。我的父母也在觀眾席中,他們在那里。
英偉達在這里已經(jīng)超過30年了。這里是我們許多珍貴合作伙伴和親愛朋友的家。多年來,你們見證了英偉達的成長,也見證了我們完成了許多激動人心的成就,并一路與我合作。
今天,我們將討論我們在行業(yè)中所處的位置、我們將要去的地方,并宣布一些新產(chǎn)品,令人激動和令人驚喜的產(chǎn)品,這些產(chǎn)品將為我們打開新的市場,創(chuàng)造新的市場、新的增長。我們將討論偉大的合作伙伴,以及我們將如何共同發(fā)展這個生態(tài)系統(tǒng)。
眾所周知,我們正處于計算機生態(tài)系統(tǒng)的中心,這是世界上最重要的行業(yè)之一。因此,當(dāng)需要創(chuàng)造新的市場時,我們必須從這里開始創(chuàng)造,這是理所當(dāng)然的,位于計算機生態(tài)系統(tǒng)的中心。而且我為你們準(zhǔn)備了一些驚喜,一些你們可能猜不到的事情。
當(dāng)然,我保證我會談?wù)撊斯ぶ悄芎蜋C器人技術(shù)。
英偉達的故事是計算機產(chǎn)業(yè)的重塑。事實上,英偉達的故事也是我們公司的重塑。正如我所說,我已經(jīng)來了30年了,你們中的許多人都經(jīng)歷過我的多次主題演講,你們中的一些人,全部都經(jīng)歷過?;仡欉@次對話,以及我們過去30年所談?wù)摰膬?nèi)容,變化是如此巨大。
我們最初是一家芯片公司,目標(biāo)是創(chuàng)建一個全新的計算平臺。在2006年,我們推出了CUDA,它徹底改變了計算的方式。
10年后的2016年,我們意識到一種新的計算方法已經(jīng)到來。這種新的計算方法需要對技術(shù)堆棧的每一層進行徹底的改造。處理器是全新的,軟件堆棧是全新的,因此,系統(tǒng)也必然是全新的。
所以我們發(fā)明了一個新的系統(tǒng)。一個在我2006年在GTC大會上宣布它的那天,沒有人理解我在說什么,也沒有人給我下采購訂單的系統(tǒng),叫做DGX-1。
DGX-1,我將第一臺捐贈給了一個叫做OpenAI的非營利性公司,它開啟了人工智能革命。
幾年后,我們意識到,事實上,這種新的軟件開發(fā)方式,現(xiàn)在被稱為人工智能,與傳統(tǒng)的軟件運行方式不同。許多應(yīng)用程序都在大型數(shù)據(jù)中心的少量處理器上運行,我們稱之為超大規(guī)模。這種新型應(yīng)用程序需要多個處理器協(xié)同工作,為數(shù)百萬人的查詢提供服務(wù)。并且該數(shù)據(jù)中心的架構(gòu)將從根本上不同。我們意識到有兩種類型的網(wǎng)絡(luò)。
一條用于南北向流量,因為仍然需要控制存儲,仍然需要擁有一個控制平面,仍然需要連接到外部。
但是最重要的網(wǎng)絡(luò)將會是東西向流量,計算機互相通信,試圖解決一個問題。我們認識到在高性能計算的東西向流量方面,最優(yōu)秀的網(wǎng)絡(luò)公司進行大規(guī)模分布式處理。
一家對我們公司非常重要且與我們息息相關(guān)的公司,一家名為Mellanox的公司,我們在5年前,即2019年收購了他們。
我們將整個數(shù)據(jù)中心轉(zhuǎn)換成一個計算單元。之前聽我說過,現(xiàn)代計算機就是一個完整的數(shù)據(jù)中心。數(shù)據(jù)中心是一個計算單元,不再僅僅是一臺PC,不再僅僅是一臺服務(wù)器,整個數(shù)據(jù)中心都在運行一個作業(yè),而操作系統(tǒng)將會改變。
英偉達的數(shù)據(jù)中心發(fā)展歷程現(xiàn)在已廣為人知。在過去的三年里,已經(jīng)看到了我們正在塑造的一些理念,以及我們?nèi)绾伍_始以不同的視角看待我們的公司。歷史上沒有任何一家公司,尤其是沒有任何一家科技公司,會一次性公布長達五年的發(fā)展路線圖。沒有人會告訴你接下來會發(fā)生什么,他們對此秘而不宣,極其保密。
然而,我們意識到英偉達不再僅僅是一家科技公司。事實上,我們是一家至關(guān)重要的基礎(chǔ)設(shè)施公司。如果不了解我將要做什么,又如何規(guī)劃你的基礎(chǔ)設(shè)施、你的場地、你的外殼、你的電力、你所有的必要融資,遍布全世界?如果不了解我將要做什么,又怎么可能做到這一切呢?
于是,我們相當(dāng)詳細地描述了我們公司的發(fā)展藍圖,詳細到世界上每個人都可以開始建造數(shù)據(jù)中心。
我們現(xiàn)在意識到,我們是一家人工智能基礎(chǔ)設(shè)施公司,一家在全球都至關(guān)重要的基礎(chǔ)設(shè)施公司。每個地區(qū)、每個行業(yè)、每家公司都將建設(shè)這些基礎(chǔ)設(shè)施。
那么,這些基礎(chǔ)設(shè)施是什么呢?事實上,這些基礎(chǔ)設(shè)施與第一次工業(yè)革命非常相似。當(dāng)人們意識到,通用電氣、西屋電氣、西門子公司意識到,有一種名為電的新型技術(shù),并且需要在世界各地建設(shè)新的基礎(chǔ)設(shè)施。這些基礎(chǔ)設(shè)施成為了社會基礎(chǔ)設(shè)施的重要組成部分,如今,這種基礎(chǔ)設(shè)施被稱為電力。
若干年后,就在我們這一代,我們意識到出現(xiàn)了一種新型的基礎(chǔ)設(shè)施,而且這種新的基礎(chǔ)設(shè)施非常概念化,難以理解。這種基礎(chǔ)設(shè)施被稱為信息。這種信息基礎(chǔ)設(shè)施,第一次被描述時,沒有人能理解,但我們現(xiàn)在意識到它就是互聯(lián)網(wǎng),互聯(lián)網(wǎng)無處不在,并且所有事物都與它相連。
現(xiàn)在出現(xiàn)了一種新的基礎(chǔ)設(shè)施,這種新的基礎(chǔ)設(shè)施建立在前兩種基礎(chǔ)設(shè)施之上,而這種新的基礎(chǔ)設(shè)施是一種智能基礎(chǔ)設(shè)施。我知道現(xiàn)在,當(dāng)我們說存在智能基礎(chǔ)設(shè)施時,這毫無意義。
我向你們保證,10年后,你們回首往事,就會意識到人工智能已經(jīng)融入到一切事物之中。事實上,我們需要人工智能無處不在。而且每個地區(qū)、每個行業(yè)、每個國家、每個公司,都需要人工智能。
人工智能現(xiàn)在是基礎(chǔ)設(shè)施的一部分。而這種基礎(chǔ)設(shè)施,就像互聯(lián)網(wǎng),就像電力一樣,需要工廠。這些工廠本質(zhì)上就是我們今天所建造的東西。它們不是過去的那些數(shù)據(jù)中心。一個價值1 萬億美元的產(chǎn)業(yè),提供信息和存儲,支持我們所有的企業(yè)資源計劃(ERP)系統(tǒng)和員工。這是一個數(shù)據(jù)中心。一個過去的數(shù)據(jù)中心。
從某種意義上說,這與它類似,因為它來自同一個行業(yè)。它來自我們所有人。但它將演變成完全不同的東西。完全獨立于世界的數(shù)據(jù)中心。這些人工智能數(shù)據(jù)中心,如果你愿意這么稱呼它們,實際上被不恰當(dāng)?shù)孛枋隽?。它們實際上是人工智能工廠。
你向它輸入能量,它就會產(chǎn)出極具價值的東西。這些東西被稱為token。到了企業(yè)開始談?wù)撋蟼€季度他們生產(chǎn)了多少token的地步。以及上個月他們生產(chǎn)了多少token。很快,我們將討論我們每小時生產(chǎn)多少token。正如每個工廠所做的那樣。
因此,世界已經(jīng)發(fā)生了根本性的變化。從我們公司成立的那天起,我就在試圖弄清楚1993年我們的機會有多大。我得出的結(jié)論是,英偉達的商機是巨大的。3億美元。我們要發(fā)財了。3億美元的芯片產(chǎn)業(yè)。
針對一個價值約一萬億美元的數(shù)據(jù)中心機遇。發(fā)展到如今,一個人工智能工廠,一個價值將以數(shù)萬億美元計的人工智能基礎(chǔ)設(shè)施產(chǎn)業(yè)。這就是我們正在從事的令人興奮的未來。
現(xiàn)在,從根本上說,我們所做的一切都建立在幾項重要的技術(shù)之上。當(dāng)然,我經(jīng)常談?wù)摷铀儆嬎恪N医?jīng)常談?wù)撊斯ぶ悄?。使英偉達真正特別的是這些能力的融合。尤其重要的是算法、庫,我們稱之為CUDAX 庫的東西。我們一直在談?wù)搸?。事實上,我們是世界上唯一一家不停談?wù)搸斓目萍脊?。這背后的原因是圖書館是我們一切工作的核心。圖書館是這一切的起點。
今天我將向大家展示一些新的圖書館。但在此之前,讓我先預(yù)覽一下我今天要講的內(nèi)容。您即將看到的一切都與模擬、科學(xué)和人工智能相關(guān)。這里展示的都不是藝術(shù)。一切都是模擬。只是恰好很美。讓我們來看一下。
我現(xiàn)在正站在實時的計算機圖形前。這不是視頻,這是計算機圖形。它由GeForce生成。這是全新的GeForce 5060,RTX 5060。這是華碩的產(chǎn)品。我的好朋友約翰尼在前排。這是微星的產(chǎn)品。我們將這款令人難以置信的GPU縮小并放到了這里。這有道理嗎?
這太不可思議了,這就是微星搭載5060顯卡的新款筆記本電腦。英偉達GeForce為世界帶來了CUDA,現(xiàn)在你所看到的,是每一個像素都經(jīng)過了光線追蹤。
我們是如何做到模擬光子,并以這種分辨率提供這種幀率的?原因在于人工智能。我們只渲染十分之一的像素。所以你看到的每個像素中,只有十分之一是實際計算出來的,剩下的九個,由人工智能推測,而且效果堪稱完美,它完美地猜中了。這項技術(shù)叫做DLSS,神經(jīng)渲染。我們花費了許多年才開發(fā)出來,從我們開始研究人工智能的那一刻起,就已經(jīng)開始了,所以這已經(jīng)是一個10年的旅程。人工智能徹底革新了計算機圖形學(xué)的進步,GeForce將人工智能帶到了世界,現(xiàn)在人工智能又回來革新了GeForce,真的是非常驚人。
GeForce RTX 50系列剛剛完成了其有史以來最成功的發(fā)布,這是我們歷史上最快的發(fā)布,而且PC游戲現(xiàn)在已經(jīng)有30年歷史了,這說明了GeForce有多么令人難以置信。
核心在于,一切都始于CUDA。通過使CUDA盡可能地高性能、盡可能地普及,從而使安裝基礎(chǔ)遍布全球,應(yīng)用程序就能很容易地找到CUDA GPU。安裝基礎(chǔ)越大,就越多的開發(fā)者希望創(chuàng)建庫。庫越多,越能完成令人驚嘆的事情,應(yīng)用程序越好,用戶受益越多,他們就會購買更多的計算機。計算機越多,CUDA就越多,這種反饋路徑至關(guān)重要。
然而,加速計算并非通用計算。通用計算編寫軟件,每個人都用Python或C++編寫,然后進行編譯,通用計算的方法論始終一致:編寫應(yīng)用程序,編譯應(yīng)用程序,在CPU上運行它。然而,這種方法從根本上不適用于加速計算,因為如果可以這樣做,它就會被稱為CPU。如果不直接改變CPU,以便你可以編寫軟件、編譯軟件、并在CPU上運行它,那還有什么意義呢?你需要做一些不同的事情,這個事實實際上相當(dāng)合理。其原因在于,如此多的人致力于通用計算,數(shù)萬億美元的創(chuàng)新投入,怎么可能僅僅因為芯片內(nèi)部的幾個小部件,計算機突然就變得快50倍、快100倍呢?這毫無道理。
因此,我們應(yīng)用的邏輯是,如果你對應(yīng)用程序有更深入的理解,你就可以加速它。如果你創(chuàng)建一種更適合加速、以接近光速運行99%運行時的架構(gòu),即使它只占代碼的5%,你也可以加速應(yīng)用程序,這相當(dāng)令人驚訝。大多數(shù)應(yīng)用程序中,代碼的一小部分消耗了大部分的運行時。我們觀察到了這一點,因此我們逐個攻克不同的領(lǐng)域。
我剛才向你展示了計算機圖形。我們還有數(shù)值計算庫,這是數(shù)值計算庫。是最普及的數(shù)值計算庫。
Arial和Shona。Arial是世界首個用于5G和6G的GPU加速無線電信號處理方案。一旦我們將其軟件定義化,就可以在其上疊加人工智能。這樣我們就能將人工智能引入5G和6G。
Parabricks用于基因組學(xué)分析。Monai用于醫(yī)學(xué)影像。Earth 2用于天氣預(yù)測。cuQuantum用于量子經(jīng)典計算機架構(gòu)和計算機系統(tǒng)。
Megatron。這一整行,這一整列包含我們所有的深度學(xué)習(xí)以及所有用于深度學(xué)習(xí)訓(xùn)練和推理的必要庫。這徹底改變了計算。而這一切都始于這些庫。不僅僅是CUDA,還有CUDNN。在CUDNN之上,有Megatron。Megatron,然后是Tensor RTLM。然后最近,用于大型AI工廠的全新操作系統(tǒng),Dynamo。
CUDF用于像Spark和SQL這樣的數(shù)據(jù)幀。結(jié)構(gòu)化數(shù)據(jù)也可以被加速。cuML,經(jīng)典機器學(xué)習(xí)。Warp,一個框架,一個用于描述 CUDA 內(nèi)核的 Pythonic 框架。非常成功。
cuopt,數(shù)學(xué)運算,優(yōu)化。例如旅行商問題。能夠優(yōu)化高度約束、大量變量類型的問題,例如供應(yīng)鏈優(yōu)化。這是一個了不起的成功。我對 cuopt 非常興奮。cuDSS 和cuDSparse,用于
稀疏結(jié)構(gòu)模擬器。它們用于 CAE 和 CAD 流體動力學(xué)。有限元分析,對于EDA和CAE行業(yè)來說極其重要。
然后,當(dāng)然還有粗culitho。它是計算光刻領(lǐng)域最重要的庫之一。光掩模制造很容易花費一個月的時間。而且光掩模制造過程需要極高的計算強度。現(xiàn)在有了culitho,我們可以將計算速度提高50倍、70倍。因此,這將為未來將人工智能應(yīng)用于光刻技術(shù)奠定基礎(chǔ),打開世界。我們在這里擁有優(yōu)秀的合作伙伴。臺積電正在廣泛使用culitho。阿斯麥、新思科技,都是與我們在culitho方面合作的卓越伙伴。
正是這些庫本身使得我們能夠在一個又一個的應(yīng)用領(lǐng)域、科學(xué)領(lǐng)域和物理領(lǐng)域中加速應(yīng)用,同時也為我們開拓了市場。我們關(guān)注特定的區(qū)域和市場,認為這些區(qū)域?qū)τ谵D(zhuǎn)型到新型計算方式而言非常重要。如果通用計算經(jīng)過這么多年已經(jīng)走到了盡頭,為什么它沒有在每一個行業(yè)都走到盡頭呢?
最重要的行業(yè)之一,當(dāng)然是電信業(yè)。正如世界上的云數(shù)據(jù)中心現(xiàn)在已經(jīng)變成了軟件定義的一樣,電信也應(yīng)該變成軟件定義的,這是理所當(dāng)然的。因此,我們花了大約6年的時間來完善和優(yōu)化一個完全加速的無線接入網(wǎng)(RAN)堆棧,它能實現(xiàn)驚人的性能。對于每兆瓦的數(shù)據(jù)速率,或每瓦的數(shù)據(jù)速率,我們現(xiàn)在與最先進的專用集成電路(ASIC)處于同一水平。
一旦我們能夠做到這一點,一旦我們能夠達到那種性能和功能水平,那么之后我們就可以在上面疊加人工智能(AI)。我們在這里有很棒的合作伙伴,如軟銀、T-Mobile、印尼電信和沃達豐正在進行試驗。諾基亞、三星、京瓷正在與我們合作進行全棧開發(fā)。富士通和思科正在進行系統(tǒng)方面的合作。因此,現(xiàn)在我們有能力引入基于5G的人工智能,或者基于6G的人工智能,以及基于計算的人工智能的理念。
我們正在利用量子計算來實現(xiàn)這一點。量子計算仍處于含噪聲中等規(guī)模量子(NISQ) 狀態(tài)。然而,我們已經(jīng)可以開始進行許多非常有用的應(yīng)用。因此我們對此感到興奮,我們正在開發(fā)一個量子經(jīng)典,或者量子GPU計算平臺,我們稱之為CUDA-cu,并與世界各地出色的公司合作。GPU可以用于預(yù)處理和后處理、糾錯以及控制。我預(yù)測在未來,所有超級計算機都將擁有量子加速器,所有計算機都將連接cuQPU。因此,一臺超級計算機將是由cuPU、GPU和一些CPU組成的系統(tǒng)。這將是現(xiàn)代計算機的表征。因此,我們與該領(lǐng)域的許多優(yōu)秀公司合作。
人工智能方面,12年前,我們從感知開始,即能夠理解模式、識別語音、識別圖像的人工智能模型。那是開端。過去5年,我們一直在談?wù)撋墒饺斯ぶ悄埽慈斯ぶ悄懿粌H能理解,還能生成的能力。因此,它可以從文本生成文本,比如ChatGPT中一直在使用的那樣;文本到圖像,文本到視頻,視頻到文本;圖像到文本,幾乎任何事物到任何事物。這才是人工智能真正令人驚嘆之處,我們已經(jīng)發(fā)現(xiàn)了一個通用的函數(shù)逼近器,一個通用的翻譯器。它可以從任何事物翻譯到任何其他事物。
只要我們能簡單地對其進行標(biāo)記化,表示信息的比特,那么我們就已經(jīng)達到了一個真正重要的人工智能水平。
生成式人工智能賦予了我們一次性人工智能。你給它一段文本,它就給你一段文本作為回報。那是兩年前,我們首次接觸了聊天機器人GPT。那是重大的、令人驚嘆的突破。你給它一段文本,它會回給你一段文本。它預(yù)測下一個詞,預(yù)測下一段。
然而,智能遠不止是你從大量數(shù)據(jù)中所學(xué)到的東西。智能包括推理能力,包括解決你以前從未見過的問題的能力,包括將問題逐步分解的能力,包括應(yīng)用一些規(guī)則和定理來解決你從未見過的問題,包括模擬多種選擇并權(quán)衡其優(yōu)劣的能力。
你可能聽說過其中的一些技術(shù):思維鏈,將其逐步分解;思維樹,提出大量可能的路徑。所有這些技術(shù)都在引領(lǐng)人工智能具備推理能力。
現(xiàn)在,令人驚奇的是,一旦你擁有推理能力,并且擁有感知能力,也就是說,比如,多模態(tài)讀取PDF,你就可以進行搜索,可以使用工具,你就擁有了自主智能。
這種自主智能所做的事情,正是我剛才描述的我們所有人都在做的事情。我們被賦予一個目標(biāo),我們將其逐步分解。我們推理要做什么,以及做這件事的最佳方式是什么。我們考慮其后果,然后開始執(zhí)行計劃。該計劃可能包括做一些研究,可能包括做一些工作,使用一些工具。它可能包括聯(lián)系另一個人工智能代理,以便與之協(xié)作。
代理型人工智能基本上就是理解、思考和行動。嗯,理解、思考和行動是機器人學(xué)的循環(huán)。代理型人工智能基本上是數(shù)字形式的機器人。這些將在未來幾年變得非常重要。我們正在看到這個領(lǐng)域取得巨大的進展。
除此之外的下一個浪潮是物理人工智能,能夠理解世界的人工智能。他們理解慣性、摩擦、因果關(guān)系等事物。例如,如果我滾動一個球,球滾到車下,根據(jù)球的速度,它可能滾到了車的另一邊,但球并沒有消失,客體永久性。你或許能夠推斷出,如果你面前有一張桌子,而你必須到另一邊去,最好的方法不是直接穿過去。最好的方法可能是繞過它或從它下面過去。能夠推理這些物理事物對于下一代人工智能至關(guān)重要。我們稱之為物理人工智能。
因此,在這個特定的例子中,你看到我們只是提示人工智能,它就生成視頻來訓(xùn)練自動駕駛汽車在不同的場景中行駛。稍后我會向你展示更多相關(guān)內(nèi)容。
那是一只狗。它可以說,“給我生成一只狗”?!敖o我生成一只帶鳥的,帶人的”。它一開始生成了左邊的圖像。
在那之后的階段,我們將采用推理系統(tǒng)、生成系統(tǒng)、物理人工智能,而這種級別的能力將會進入我們稱之為機器人的物理載體中。如果你能想象提示人工智能生成一個視頻來伸手拿起一個瓶子,當(dāng)然你也可以想象告訴一個機器人伸手拿起那個瓶子。今天的人工智能有能力做到這些事情。這就是我們在不久的將來要實現(xiàn)的目標(biāo)。我們?yōu)閷崿F(xiàn)這一目標(biāo)而構(gòu)建的計算
機,其屬性與之前的計算機截然不同。名為Hopper的革命性計算機大約在3年前問世,它徹底改變了我們所認知的人工智能。 它可能成為了世界上最流行、最廣為人知的計算機。
在過去的幾年里,我們一直在研發(fā)一種新的計算機,以便我們能夠?qū)崿F(xiàn)推理時間擴展,或者說,能夠以難以置信的速度進行思考。因為當(dāng)你思考的時候,你會產(chǎn)生大量的tokens(標(biāo)記),你會產(chǎn)生大量的想法,并且在你給出答案之前,在你的大腦中進行迭代。 所以,過去的一次性人工智能現(xiàn)在將變成思考型人工智能、推理型人工智能、推理時間擴展型人工智能。 而這將需要更多的計算量。
因此,我們創(chuàng)建了一個名為Grace Blackwell的新系統(tǒng)。Grace Blackwell具有多種功能:它具有向上擴展的能力,意味著將一臺計算機變成一臺巨型計算機;向外擴展是指將一臺計算機與多臺計算機連接起來,并讓多臺不同的計算機完成工作。 擴展很容易,向上擴展極其困難。 構(gòu)建超越半導(dǎo)體物理極限的更大型計算機,難如登天。 而這正是格蕾絲·布萊克威爾所做的。 格蕾絲·布萊克威爾幾乎打破了一切。
在座的各位,你們中的許多人正在與我們合作構(gòu)建格蕾絲·布萊克威爾系統(tǒng)。 我很高興地說,我們已經(jīng)全面投產(chǎn)。 雖然基于HGX的布萊克威爾系統(tǒng)自去年年底以來一直在全面生產(chǎn),并且自2月起已上市,但我們現(xiàn)在才剛剛將所有格蕾絲·布萊克威爾系統(tǒng)上線。 它們每天都在各地陸續(xù)上線,已經(jīng)在CoreWeave上可用好幾周了,已經(jīng)有很多云服務(wù)提供商(CSPs)在使用它。 現(xiàn)在你開始看到它從各個地方涌現(xiàn)出來,每個人都開始發(fā)推文說Grace Blackwell正在全面投產(chǎn)。
在今年第三季度,正如我承諾的,我們將像有節(jié)奏一樣,每年都提高我們平臺的性能。今年,在第三季度,我們將升級到Grace Blackwell GB300。
GB300 將沿用相同的架構(gòu)、相同的物理尺寸和相同的電氣機械結(jié)構(gòu),但內(nèi)部的芯片已經(jīng)升級,使用了一種新的 Blackwell 芯片。
現(xiàn)在,它的推理性能提高了1.5 倍,HBM 內(nèi)存增加了 1.5 倍,網(wǎng)絡(luò)吞吐量提高了 2 倍,因此整體系統(tǒng)性能更高。
讓我們看看Grace Blackwell 內(nèi)部是什么。Grace Blackwell 從計算節(jié)點開始。這是其中一個計算節(jié)點。這是上一代產(chǎn)品 B200 的樣子,這是 B300 的樣子。請注意正中間,現(xiàn)在是 100% 液冷,但除此之外,從外部來看,它是一樣的。你可以把它插入到相同的系統(tǒng)和相同的機箱中。
這是Grace Blackwell GB300 系統(tǒng),它的推理性能提高了 1.5 倍。訓(xùn)練性能大致相同,但推理性能提高了 1.5 倍。現(xiàn)在,這個特殊的系統(tǒng)算力達到了 40 Petaflops,大約相當(dāng)于 2018 年 Sierra 超級計算機的性能。
Sierra 超級計算機擁有 18000 個 Volta 架構(gòu)的 GPU。這里的這一個節(jié)點就取代了整個超級計算機。6 年內(nèi)性能提升了 4000 倍。這就是極端的摩爾定律。記住,人工智能公司 NVIDIA 已經(jīng)實現(xiàn)了大約每 10 年計算能力提升一百萬倍,而且我們?nèi)匀辉谘刂@條軌道前進。
但是實現(xiàn)這一目標(biāo)的方法不僅僅是提高芯片的速度。芯片的速度和尺寸都有其極限。在Blackwell 的案例中,甚至將兩個芯片連接在一起,使其成為可能。臺積電與我們合作,發(fā)明了一種名為COOS-L的全新COOS工藝,使我們能夠制造這些巨型芯片。
但即便如此,我們?nèi)匀幌胍冗@更大的芯片。因此,我們必須創(chuàng)造出所謂的NVLink,這是世界上最快的交換機,速率是每秒7.2太字節(jié)。9個這樣的交換機安裝到那個機架中。
這9個交換機通過這個奇跡般的裝置連接起來。這就是NVLink骨干網(wǎng),兩英里的電纜,5000根結(jié)構(gòu)化的電纜,全部同軸,其阻抗已匹配。它將所有72個GPU連接到NVLink交換網(wǎng)絡(luò)中的其他72個GPU。NVLink骨干網(wǎng)的帶寬為每秒130兆兆字節(jié)。
簡單來說,整個互聯(lián)網(wǎng)的峰值流量為每秒900兆兆比特,除以8,它的流量超過了整個互聯(lián)網(wǎng)的流量。
一個NVLink主干網(wǎng)連接著9個NVLink交換機,這樣每個GPU都可以完全同時地與其他GPU通信。這就是GB200的奇跡。
由于SerDes的驅(qū)動距離有限制,這是SerDes所能達到的最遠距離,它從芯片到交換機,再到主干網(wǎng),到任何其他交換機,任何其他芯片,全部是電信號。因此,這個限制迫使我們將所有東西都放在一個機架中。
現(xiàn)在一個機架是120千瓦,這就是所有東西都必須進行液冷的原因。我們現(xiàn)在有能力將GPU從一個主板上分離出來,本質(zhì)上是分布在一個完整的機架上。那么整個機架就是一塊主板,這就是奇跡,完全解耦。
現(xiàn)在GPU的性能非常驚人,內(nèi)存容量非常驚人,網(wǎng)絡(luò)帶寬非常驚人,現(xiàn)在我們真的可以大規(guī)模擴展這些系統(tǒng)。一旦我們向上擴展,我們就可以將它們向外擴展到大型系統(tǒng)中。
英偉達幾乎所有產(chǎn)品都非常龐大,原因在于我們不是在構(gòu)建數(shù)據(jù)中心和服務(wù)器,我們正在建造人工智能工廠。這是CoreWeave,這是Oracle Cloud。每個機架的功率密度非常高,他們必須將它們分隔得更遠,以便功率密度可以分散。但實際上,歸根結(jié)底,我們不是在建造數(shù)據(jù)中心,我們正在建造人工智能工廠
這是XAI Colossus工廠,這是星門 (Stargate),4百萬平方英尺,1吉瓦。因此,請想象一下這座工廠,這座1吉瓦的工廠可能需要大約600億到800億美元的投資。在這600億到800億美元中,電子設(shè)備和計算部分,也就是這些系統(tǒng),就占了400億到500億美元。所以,這些都是巨大的工廠投資。
人們建造工廠的原因是因為你知道答案,買得越多,生產(chǎn)得越多,這就是工廠所做的事情。
這項技術(shù)非常復(fù)雜,實際上,僅僅在這里看看,你仍然無法充分領(lǐng)略我們的所有合作伙伴以及在座的所有公司所完成的卓越工作。所以我們?yōu)槟谱髁艘徊坑捌?/p>
因此,今天我們宣布,富士康、英偉達、臺積電,我們將在這里為人工智能基礎(chǔ)設(shè)施和人工智能生態(tài)系統(tǒng)建造第一臺巨型人工智能超級計算機。
謝謝。有誰需要一臺人工智能計算機嗎?有聽眾席上的任何人工智能研究人員嗎?每一位學(xué)生、每一位研究人員、每一位科學(xué)家、每一家初創(chuàng)公司、每一家大型成熟公司,臺積電本身已經(jīng)進行了大量的人工智能和科學(xué)研究。富士康在機器人技術(shù)方面也做了大量的工作。我知道聽眾席上還有許多其他的公司,稍后會提到,你們也在進行機器人技術(shù)研究和人工智能研究。因此,擁有世界一流的人工智能基礎(chǔ)設(shè)施確實非常重要。
所有這些都是為了我們能夠構(gòu)建一個非常大的芯片。NVLink 和 Blackwell,這一代的技術(shù),使我們能夠創(chuàng)造出這些令人難以置信的系統(tǒng)。這是來自和碩、廣達電腦、緯創(chuàng)和緯穎的系統(tǒng)。這是來自富士康、技嘉和華碩的系統(tǒng)。可以看到它的正面和背面。它的整個目標(biāo)是利用這些 Blackwell 芯片,可以看到它們有多大,并將它們變成一個巨大的芯片。當(dāng)然,實現(xiàn)這一目標(biāo)的能力是由 NVLink 提供的。但這低估了系統(tǒng)架構(gòu)的復(fù)雜性,以及將它們連接在一起的豐富的軟件生態(tài)系統(tǒng)。由 150 家公司共同構(gòu)建的整個生態(tài)系統(tǒng)。這種架構(gòu)以及技術(shù)、軟件和產(chǎn)業(yè)中的整個生態(tài)系統(tǒng),是三年工作的成果。這是一項大規(guī)模的工業(yè)投資。
現(xiàn)在,我們希望讓任何想構(gòu)建數(shù)據(jù)中心的人都能做到。它可以是大量的英偉達GB200或300,以及英偉達的加速計算系統(tǒng)。也可以是其他公司的產(chǎn)品。
所以今天,我們要宣布一件非常特別的事情。我們要宣布英偉達NVLink Fusion。NVLink Fusion 旨在讓可以構(gòu)建半定制的 AI 基礎(chǔ)設(shè)施。不僅僅是半定制芯片,因為那已經(jīng)是過去式了。需要構(gòu)建 AI 基礎(chǔ)設(shè)施。而且每個人的 AI 基礎(chǔ)設(shè)施都可能略有不同。有些人可能擁有更多的 CPU,有些人可能擁有更多的英偉達 GPU,還有些人可能擁有某種半定制的 ASIC。而那些系統(tǒng)構(gòu)建起來極其困難。并且它們都缺少一個至關(guān)重要的要素。這個至關(guān)重要的要素叫做NVLink。NVLink可以擴展這些半定制系統(tǒng),并構(gòu)建真正強大的計算機。所以今天,我們宣布推出NVLink Fusion。NVLink Fusion的工作方式大致如下。這是英偉達平臺。100%英偉達。
您擁有英偉達CPU、英偉達GPU、NVLink交換機,來自英偉達的網(wǎng)絡(luò),名為Spectrum X或InfiniBand,網(wǎng)卡,網(wǎng)絡(luò)互連,交換機。整個系統(tǒng),整個基礎(chǔ)設(shè)施都是端到端構(gòu)建的。
現(xiàn)在,當(dāng)然,您可以隨意混合搭配。而且今天我們使您甚至可以在計算層面上進行混合搭配。這將是您使用定制專用集成電路(ASIC)所做的事情。我們有很多優(yōu)秀的合作伙伴,他們正在與我們合作,以集成您特殊的TPU或您特殊的ASIC,您特殊的加速器。
而且它不一定是轉(zhuǎn)換器加速器。它可以是您想集成到大型縱向擴展系統(tǒng)中的任何類型的加速器。我們創(chuàng)建了一個NVLink芯片模塊,它基本上是一個緊挨著您的芯片的交換機。將會有IP可用于集成到您的半定制ASIC中。
然后,一旦您完成了這些,它就可以直接安裝到計算板中,并且可以安裝到AI超級計算機的生態(tài)系統(tǒng)中。
現(xiàn)在,也許您想要的是使用您自己的CPU。您已經(jīng)構(gòu)建自己的CPU一段時間了,也許您的CPU已經(jīng)建立了一個非常龐大的生態(tài)系統(tǒng),并且您希望將NVIDIA整合到您的生態(tài)系統(tǒng)中?,F(xiàn)在,我們使您能夠做到這一點。您可以通過構(gòu)建自定義CPU來實現(xiàn)這一點。
我們?yōu)槟峁㎞VLink芯片間接口,以便集成到您的專用集成電路(ASIC)中。我們使用NVLink芯片組進行連接,現(xiàn)在它可以連接并直接毗鄰Blackwell芯片和我們的下一代Rubin芯片。再次強調(diào),它完全適合這個生態(tài)系統(tǒng)。
這項令人難以置信的工作成果現(xiàn)在變得靈活和開放,供所有人集成。因此,您的人工智能基礎(chǔ)設(shè)施可以包含一些NVIDIA組件,還有很多您的自有組件,很多CPU,很多ASIC,也許還有很多NVIDIA GPU。
因此,在任何情況下,您都可以受益于使用NVLink基礎(chǔ)設(shè)施和NVLink生態(tài)系統(tǒng),并且它與Spectrum X完美連接。所有這些都具有工業(yè)強度,并且受益于已經(jīng)使其成為可能的龐大工業(yè)合作伙伴生態(tài)系統(tǒng)。這就是NVLink Fusion。
我們有一些很棒的合作伙伴,如LCHIP、Astera Labs、Marvell,以及聯(lián)發(fā)科,他們將與我們合作,與ASIC或半定制客戶、超大規(guī)模企業(yè),以及希望構(gòu)建這些東西的CPU供應(yīng)商合作,他們將成為他們的半定制ASIC供應(yīng)商。
我們還有富士通和高通,他們正在構(gòu)建帶有NVLink的CPU,以集成到我們的生態(tài)系統(tǒng)中。
Cadence和Synopsys,我們與他們合作將我們的IP轉(zhuǎn)移給他們,以便他們可以與所有人合作,并將該IP提供給所有芯片。
所以這個生態(tài)系統(tǒng)非常棒。但這恰恰突顯了NVLink Fusion生態(tài)系統(tǒng)的優(yōu)勢。一旦與他們合作,將立即融入整個更大的NVIDIA生態(tài)系統(tǒng),從而擴展到這些AI超級計算機中。
現(xiàn)在來談?wù)勔恍┬碌漠a(chǎn)品類別。已經(jīng)展示了幾款不同的計算機。然而,為了服務(wù)于世界上的絕大多數(shù)人,仍然缺少一些計算機。所以將要談?wù)勊鼈儭?/p>
在此之前,想通報一下,我們稱之為DGX Spark的這款新計算機已經(jīng)全面投產(chǎn)。DGX Spark即將就緒,不久即可上市,可能就在幾周內(nèi)。
我們有非常棒的合作伙伴與我們合作,如戴爾、HPI、華碩、微星、技嘉、聯(lián)想。他們是與我們合作的杰出伙伴。這就是DGX Spark。這實際上是一臺量產(chǎn)機型。這是我們的版本。然而,我們的合作伙伴正在構(gòu)建許多不同的版本。
這是為原生AI 開發(fā)者設(shè)計的。如果是一名開發(fā)者、一名學(xué)生、一名研究人員,而且不想總是打開云端,并進行準(zhǔn)備工作,然后在完成后再進行清理,那么就會希望擁有自己的,基本上是自己的 AI 云就坐在旁邊,并且它始終開啟,始終等待著。它允許進行原型設(shè)計、早期開發(fā),這就是它令人驚嘆的地方。這就是 DGX Spark。這是一個千萬億次浮點運算和128千兆字節(jié)。
在2016年,當(dāng)我交付DGX One時,這只是擋板,我無法抬起一整臺電腦,它重達300磅。這是DGX One,這是一個千萬億次浮點運算和128千兆字節(jié)。當(dāng)然,這是128千兆字節(jié)的HBM內(nèi)存。這是128千兆字節(jié)的LPDDR5X。實際上,性能非常相似。但最重要的是,能做的工作,可以在這里做的工作與在這里能做的工作相同。這在僅僅大約10年的時間里,是一項了不起的成就。
這是DGX Spark,適合任何想要擁有自己的人工智能超級計算機的人。我會讓所有的合作伙伴自己定價,但可以肯定的是,每個人都能在圣誕節(jié)擁有一臺。
我還有另一臺電腦想展示。如果那還不夠,并且仍然想要擁有自己的個人電腦,這位是珍妮·保羅女士。如果那臺對你來說不夠大,這里還有一臺。這又是另一臺臺式機,將由戴爾、惠普、華碩、技嘉、微星、聯(lián)想提供。它將從Box、Lambda等卓越的工作站公司提供。這將是你自己的個人DGX超級計算機,能讓你從一個墻壁插座中獲得你能獲得的最高性能。你可以把它放在你的廚房里,但只能勉強放得下。如果把這個放在廚房里,然后有人啟動微波爐,我認為那就是極限了。
這就是極限,這就是你能從墻上插座獲得的極限。這是一個DGX工作站。它的編程模型和我展示的那些巨型系統(tǒng)的編程模型是相同的。這就是令人驚嘆的地方。單一架構(gòu),它擁有足夠的能力和性能來運行一個萬億參數(shù)的AI模型。記住,Llama是Llama 70B。一個萬億參數(shù)的模型在這臺機器上將會運行得非常出色。這就是DGX工作站。
這些系統(tǒng)都是AI原生的,是為新一代軟件而構(gòu)建的計算機。它不必與 x86 兼容,不必運行傳統(tǒng)的 IT 軟件,不必運行虛擬機監(jiān)控程序,不必運行 Windows。這些計算機是為現(xiàn)代人工智能原生應(yīng)用程序設(shè)計的。當(dāng)然,這些人工智能應(yīng)用程序可以是可以通過傳統(tǒng)和經(jīng)典應(yīng)用程序調(diào)用的 API。但是,為了將人工智能帶入一個新世界,而這個新世界是企業(yè) IT,我們必須回到我們的根源,并且必須重新發(fā)明計算并將人工智能帶入傳統(tǒng)的企業(yè)計算中。
現(xiàn)在,我們所知的企業(yè)計算,實際上是三個層次,不僅僅是計算層,而是計算、存儲和網(wǎng)絡(luò)。始終是計算、存儲和網(wǎng)絡(luò)。正如人工智能已經(jīng)改變了一切,可以推斷,人工智能也必然改變了企業(yè)IT的計算、存儲和網(wǎng)絡(luò)。那么,這個底層必須被徹底改造,而我們正在進行改造。
我將展示一些新產(chǎn)品,這些產(chǎn)品將為我們開啟、解鎖企業(yè)IT。它必須與傳統(tǒng)的IT行業(yè)協(xié)同工作,并且必須增加一種新的能力。對于企業(yè)而言,這種新的能力就是代理式人工智能。
基本上就是數(shù)字營銷活動經(jīng)理、數(shù)字研究員、數(shù)字軟件工程師、數(shù)字客服、數(shù)字芯片設(shè)計師、數(shù)字供應(yīng)鏈經(jīng)理,以及過去所做所有工作的數(shù)字化人工智能版本。
代理式人工智能具有推理、使用工具以及與其他人工智能協(xié)同工作的能力。在很多方面,這些都是數(shù)字勞工,是數(shù)字雇員。
世界正面臨勞動力短缺,工人短缺。預(yù)計到2030年,勞動力短缺將達到約3000萬到5000萬,這實際上限制了世界經(jīng)濟的增長能力。因此,現(xiàn)在我們有了這些可以協(xié)同工作的數(shù)字代理。英偉達(NVIDIA)現(xiàn)在有100%的軟件工程師都配備了數(shù)字代理,以便它們能夠幫助、協(xié)助開發(fā)更好的代碼,提高生產(chǎn)力。
在未來,將會看到人工智能代理。過去我們有人力資源部管理人力勞動者,未來信息技術(shù)部門將成為數(shù)字勞動者的人力資源部。因此,必須為當(dāng)今的IT產(chǎn)業(yè)、當(dāng)今的IT從業(yè)者創(chuàng)造必要的工具,使他們能夠管理、改進、評估在其公司內(nèi)部工作的一整個AI代理家族。這就是我們想要構(gòu)建的愿景。
但首先,我們必須重新發(fā)明計算。企業(yè)IT運行在x86架構(gòu)上,運行傳統(tǒng)的軟件,例如來自VMware、IBM Red Hat或Nutanix的虛擬機管理程序。它運行著大量的經(jīng)典應(yīng)用程序。我們需要擁有能夠執(zhí)行相同操作的計算機,同時還要增加一種稱為代理人工智能的新功能。
這是全新的RTX Pro 企業(yè)級和 Omniverse 服務(wù)器。這臺服務(wù)器可以運行所有程序,當(dāng)然,它有 x86 架構(gòu),可以運行所有經(jīng)典的虛擬機管理程序。它在這些虛擬機管理程序中運行 Kubernetes。因此,IT 部門想要管理網(wǎng)絡(luò)、集群以及編排工作負載的方式,與之前的工作方式完全相同。它甚至能夠?qū)?Citrix 和其他虛擬桌面流式傳輸?shù)?PC。今天世界上運行的任何東西都應(yīng)該能在這里運行。Omniverse 在這里運行得非常完美。除此之外,這還是企業(yè)級人工智能代理的計算機。這些人工智能代理可能僅是文本形式,也可能是計算機圖形。像是小 TJ,來到你面前,像是小玩具 Jensen 來拜訪你,幫助你工作。因此,這些人工智能代理可以是文本形式,可以是圖形形式,也可以是視頻形式。
所有這些工作負載都可以在此系統(tǒng)上運行。無論何種模態(tài),我們所知的世界上每一個模型、每一個應(yīng)用程序都應(yīng)該運行于此,即使是Crysis 也能在這里運行。
連接這8個GPU(Blackwell,新的Blackwell RTX,RTX Pro 6000s)的是這塊新的主板。這塊新的主板實際上是一個交換網(wǎng)絡(luò)。
CX8是一個新的芯片類別,首先它是一個交換機,其次它是一個網(wǎng)絡(luò)芯片,也是世界上最先進的網(wǎng)絡(luò)芯片。CX8現(xiàn)在已進入批量生產(chǎn)階段。在CX8中,可以插入GPU。CX8都在后面,PCI Express 連接在此處,CX8 在它們之間進行通信。而且網(wǎng)絡(luò)帶寬非常高,達到每秒800千兆位。這是插入到這里的收發(fā)器。因此,每個GPU都有它們自己的網(wǎng)絡(luò)接口。現(xiàn)在,所有GPU都在東西向流量上與其他所有GPU進行通信,性能驚人。
這是RTX Pro。在人工智能工廠的世界中,思考性能的方式是吞吐量,即每秒處理的token數(shù)。你的工廠產(chǎn)出越多,你生產(chǎn)的token就越多。因此,吞吐量衡量的是每秒處理的token數(shù)。
然而,每個AI模型都不一樣,有些AI模型需要更多的推理。因此,你需要每個用戶的性能非常高,每個用戶的每秒token數(shù)必須很高。工廠要么喜歡高吞吐量,要么喜歡低延遲,但它不喜歡兩者兼得。
因此,挑戰(zhàn)在于如何創(chuàng)建一個操作系統(tǒng),使我們能夠在擁有高吞吐量的同時,擁有非常低的延遲,即交互性,每用戶每秒令牌數(shù)。
這張圖表告訴您一些關(guān)于計算機整體性能,以及工廠整體計算機性能的信息。這些不同的顏色代表了您必須配置我們所有GPU的不同方式,才能實現(xiàn)這種性能。有時您需要流水線并行,有時您需要專家并行,有時您希望進行批處理,有時您希望進行推測性解碼,有時您不希望。因此,所有這些不同類型的算法必須根據(jù)工作負載分別且不同地應(yīng)用。
帕累托曲線(即外圍區(qū)域)的總體區(qū)域代表您工廠的能力。請注意,Hopper(世界上最著名的計算機,Hopper H100,HGX,225000美元的Hopper)就在那里。
您剛才看到的Blackwell企業(yè)級服務(wù)器,其性能是現(xiàn)有服務(wù)器的1.7倍。
Llama70B與DeepSeek R1相比,后者性能是前者的4倍。 這得益于DeepSeek R1的優(yōu)化,它確實是世界人工智能產(chǎn)業(yè)的一份禮物。?其中計算機科學(xué)的突破非常顯著,為美國和世界各地的研究人員開啟了大量的優(yōu)質(zhì)研究。 無論在哪里,DeepSeek R1都對人們?nèi)绾慰创斯ぶ悄?、推理以及推理型人工智能產(chǎn)生了影響。 他們?yōu)樾袠I(yè)和世界做出了巨大貢獻。?DeepSeek R1的性能是當(dāng)前最先進的H100的4倍,這使其更具現(xiàn)實意義。
如果您正在構(gòu)建企業(yè)人工智能,我們現(xiàn)在為您提供一臺出色的服務(wù)器,一個出色的系統(tǒng)。它是一臺可以運行任何程序的計算機,一臺具有驚人性能的計算機,無論是x86還是AI程序都能運行。 我們的RTX Pro服務(wù)器正在行業(yè)內(nèi)所有合作伙伴處批量生產(chǎn),這很可能是有史以來規(guī)模最大的上市系統(tǒng)。
計算平臺和存儲平臺是不同的。人們查詢的是像SQL這樣的結(jié)構(gòu)化數(shù)據(jù)庫,但AI想要查詢非結(jié)構(gòu)化數(shù)據(jù)。 它們需要語義和意義,所以我們需要創(chuàng)建一個新型的存儲平臺,這就是英偉達AI數(shù)據(jù)平臺。
在最頂層,就像SQL服務(wù)器、SQL軟件以及存儲供應(yīng)商提供的文件存儲軟件一樣,存在一個非常復(fù)雜的軟件層,它與存儲相關(guān)聯(lián)。 大多數(shù)存儲公司本質(zhì)上都是軟件公司,而那個軟件層極其復(fù)雜。 因此,在新型存儲系統(tǒng)之上,將是一個我們稱之為IQ的新型查詢系統(tǒng),英偉達AI IQ,或者IQ。 它是最先進的,非常出色,并且正在與存儲行業(yè)的幾乎所有人合作。
未來的存儲不再是位于一排存儲設(shè)備之上的CPU,而將會是位于存儲機架頂端的GPU。 這樣做的原因是,你需要系統(tǒng)嵌入并找到非結(jié)構(gòu)化數(shù)據(jù)、原始數(shù)據(jù)中的意義。 你必須進行索引、搜索和排序。 因此,這個過程是計算密集型的。 所以未來大多數(shù)存儲服務(wù)器的前端都會有一個計算節(jié)點,即GPU計算節(jié)點。
這是基于我們創(chuàng)建的模型。我接下來要展示的幾乎所有內(nèi)容都始于優(yōu)秀的AI模型。 我們創(chuàng)建AI模型,并在開源AI模型的后訓(xùn)練中投入大量的精力和技術(shù)。 我們使用對您完全透明的數(shù)據(jù)對這些AI模型進行后訓(xùn)練。 這些數(shù)據(jù)是安全可靠的,可以完全放心地使用和訓(xùn)練,我們會將該列表提供給您查看。它是完全透明的,我們會向您提供數(shù)據(jù)。我們對模型進行后訓(xùn)練,
后訓(xùn)練模型性能非常出色。
它目前可供下載,是開源的推理模型。LamaNemotron推理模型是世界上最好的,它的下載量非常巨大。
我們也用一大堆其他AI模型將其包圍,以便您可以進行IQ,即檢索部分。它比市面上現(xiàn)有的快15倍,查詢結(jié)果好50%。這些模型都是可用的,都可以提供給您,IQ藍圖是開源的。
我們與存儲行業(yè)合作,將這些模型集成到他們的存儲堆棧、他們的AI平臺中。這是一個廣闊的領(lǐng)域,這就是它的樣子。
我不打算深入探討,我只是想讓大家感受一下集成到他們平臺中的人工智能模型的質(zhì)感。讓我們看看VAST都做了些什么。主動式人工智能改變了企業(yè)利用數(shù)據(jù)進行決策的方式。
僅僅三天時間,VAST就利用NVIDIA IQ藍圖及其加速人工智能數(shù)據(jù)平臺構(gòu)建了一個銷售研究人工智能代理。利用Nemo Retriever,該平臺持續(xù)提取、嵌入和索引數(shù)據(jù),以實現(xiàn)快速的語義搜索。
首先,該代理起草一個概要,然后接入CRM系統(tǒng)、多模態(tài)知識庫和內(nèi)部工具。最后,它使用Lama Nemotron將該概要轉(zhuǎn)化為一個循序漸進的銷售計劃。
過去需要幾天才能完成的銷售計劃,現(xiàn)在可以通過一個人工智能提示開始,并在幾分鐘內(nèi)完成計劃。借助VAST加速的人工智能數(shù)據(jù)平臺,各組織可以為每位員工創(chuàng)建專門的代理。
這就是VAST。戴爾擁有卓越的人工智能平臺,是世界領(lǐng)先的存儲供應(yīng)商之一。日立擁有卓越的人工智能平臺,人工智能數(shù)據(jù)平臺。IBM正在與NVIDIA Nemo合作構(gòu)建人工智能數(shù)據(jù)平臺。NetApp正在構(gòu)建人工智能平臺。
正如您所見,所有這些都對您開放。如果您正在構(gòu)建一個具有語義查詢?nèi)斯ぶ悄芮岸说娜斯ぶ悄芷脚_,那么NVIDIA Nemo是世界上最好的。這樣,您就擁有了企業(yè)計算能力和企業(yè)存儲能力。
下一部分是一個名為AIOps的新的軟件層。正如供應(yīng)鏈有他們的運營,人力資源有他們的運營一樣,未來,IT也將有AIOps。他們將管理數(shù)據(jù),微調(diào)模型,評估模型,為模型設(shè)置護欄,保障模型的安全。
我們擁有大量必要的庫和模型,可以集成到AIOps生態(tài)系統(tǒng)中。我們有優(yōu)秀的合作伙伴來幫助我們做到這一點,并將其推向市場。CrowdStrike正在與我們合作。DataIQ正在與我們合作。DataRobots正在與我們合作。
正如你所見,這些都是人工智能運營,為企業(yè)中的主體人工智能創(chuàng)建微調(diào)模型和部署模型。你可以看到NVIDIA的庫和模型集成在其中。
DataRobots之后,這里是DataStacks。 這是Elastic。 據(jù)說他們被下載了4000億次。 這是Nutanix。 這是紅帽。 這是趨勢科技。 。
這就是我們將為全球企業(yè)IT帶來為您的所有工作添加人工智能能力的方式。 您不會把企業(yè)IT組織中的所有東西都拆掉,因為公司必須運轉(zhuǎn)。 但我們可以把人工智能添加進去。 現(xiàn)在我們有了具備企業(yè)級就緒狀態(tài)的系統(tǒng),以及令人難以置信的生態(tài)系統(tǒng)合作伙伴。
杰夫·克拉克,偉大的杰夫·克拉克。 他長期以來一直是我們的合作伙伴。 還有杰夫·克拉克。 因此,我們的生態(tài)系統(tǒng)合作伙伴,戴爾和其他公司,將把這個平臺,這些平臺,帶給全球的企業(yè)IT領(lǐng)域。
讓我們來談?wù)剻C器人。智能體人工智能,類智能體人工智能,人工智能智能體,有很多不同的說法,智能體本質(zhì)上是數(shù)字機器人。原因是機器人能夠感知、理解和規(guī)劃。而這基本上就是智能體所做的事情。
但我們也希望建造實體機器人。這些實體機器人,首先,需要具備學(xué)習(xí)成為機器人的能力。在現(xiàn)實世界中高效地學(xué)習(xí)成為機器人的能力是不可能實現(xiàn)的。你必須創(chuàng)建一個虛擬世界,讓機器人在其中學(xué)習(xí)如何成為一個優(yōu)秀的機器人。那個虛擬世界必須遵守物理定律。
大多數(shù)物理引擎都無法高保真地處理剛體和柔體模擬。因此,我們與DeepMind、谷歌 DeepMind 和迪士尼研究院合作,共同構(gòu)建了 Newton,世界上最先進的物理引擎。 它將于7月開源,它的功能令人難以置信。 它完全通過GPU加速。 它是可微的,因此你可以從經(jīng)驗中學(xué)習(xí)。 它的保真度極高,它是超實時的。
因此我們可以使用那個牛頓引擎,并且它已集成到Mujoco中。 它已集成到NVIDIA的Isaac Sim中。 所以無論你使用什么仿真環(huán)境和框架。 因此,通過它,我們可以讓這些機器人栩栩如生。
你能想象其中一個小家伙,或者幾個小家伙在房子里到處跑嗎?追逐你的狗?讓他們發(fā)瘋?
你看到了發(fā)生了什么嗎?那不是動畫,而是一個模擬。他在沙子和泥土中打滑。所有這些都是模擬的。
機器人的軟件在模擬中運行,這是一種模擬而非動畫。未來,我們將采用訓(xùn)練好的人工智能模型,并將其置入模擬環(huán)境中的機器人中,讓它學(xué)習(xí)如何成為一個優(yōu)秀的機器人。
我們正在研究多項舉措來幫助機器人產(chǎn)業(yè)。我們已經(jīng)在自主系統(tǒng)領(lǐng)域工作了一段時間。我們的自動駕駛汽車基本上包含三個系統(tǒng):創(chuàng)建人工智能模型的系統(tǒng)(使用GB200、GB300),訓(xùn)練人工智能模型的系統(tǒng)(使用Omniverse模擬人工智能模型),以及將人工智能模型置入自動駕駛汽車中的系統(tǒng)。
今年,我們將在全球范圍內(nèi)推廣梅賽德斯所使用的端到端自動駕駛汽車技術(shù)棧。我們創(chuàng)建所有這些,并以與我們在其他任何地方工作方式完全相同的方式上市。我們創(chuàng)建整個技術(shù)棧,并將其開放。合作伙伴可以使用他們想使用的任何東西。他們可以使用我們的計算機,但不能使用我們的庫;他們可以使用我們的計算機、我們的庫以及我們的運行時環(huán)境。無論您想使用多少,都取決于您。
由于存在許多不同的工程團隊、不同的工程風(fēng)格和不同的工程能力,我們希望確保以一種盡可能方便所有人都能夠集成英偉達技術(shù)的方式來提供我們的技術(shù)。如果您從我這里購買所有東西,我會很高興,但請至少從我這里購買一些東西。我們非常務(wù)實。
因此,我們正在機器人系統(tǒng)中做完全相同的事情,就像汽車一樣。這是我們的Isaac Groot平臺。仿真環(huán)境完全相同,都是Omniverse。訓(xùn)練系統(tǒng)也是相同的。當(dāng)你完成模型后,你把它放入這個Isaac Groot平臺。
Isaac Groot平臺始于一臺全新的計算機,名為Jetson Thor,它才剛剛開始投入生產(chǎn),是一個令人難以置信的處理器。這款機器人處理器可以用于自動駕駛汽車,也可以用于人或機器人系統(tǒng)。
在此之上是一個我們稱之為NVIDIA ISAAC的操作系統(tǒng),這是一個運行時環(huán)境,它進行所有的神經(jīng)網(wǎng)絡(luò)處理、傳感器處理、所有管線處理,并輸出驅(qū)動結(jié)果。在其之上,是我們與一個出色的機器人團隊創(chuàng)建的預(yù)訓(xùn)練模型,他們正在對這些模型進行預(yù)訓(xùn)練。創(chuàng)建這一切所需的所有工具,包括模型本身,我們都會提供。
今天我們宣布Isaac Groot N1.5 現(xiàn)已開源,并向全世界開放使用。它已經(jīng)被下載了6000次,來自社區(qū)的歡迎、喜愛和贊賞令人難以置信。
以上是關(guān)于模型創(chuàng)建方面的內(nèi)容,我們公開了我們創(chuàng)建模型的方式。
機器人技術(shù),或者說人工智能領(lǐng)域總體上最大的挑戰(zhàn)在于數(shù)據(jù)策略。你的數(shù)據(jù)策略必須投入大量的研究和技術(shù)。
就機器人技術(shù)而言,人類演示非常重要,就像我們向孩子們演示,或者教練向運動員演示一樣。你演示如何使用遙控操作,你向機器人示范如何執(zhí)行任務(wù),然后機器人可以從該示范中進行泛化。因為人工智能可以泛化,并且我們擁有泛化技術(shù),可以從該演示中泛化出其他技術(shù)。
那么,如果你想教機器人一大堆技能呢?你需要多少不同的遙控操作人員?結(jié)果表明需要很多。所以我們決定使用人工智能來放大人類示范系統(tǒng)。
因此,這本質(zhì)上是從真實到真實,并使用人工智能來幫助我們擴展、放大人類示范過程中收集的數(shù)據(jù)量,以訓(xùn)練人工智能模型。
通用機器人時代已經(jīng)到來,伴隨著機電一體化、物理人工智能和嵌入式計算的突破。正當(dāng)其時,因為勞動力短缺限制了全球工業(yè)增長。
機器人制造商面臨的主要挑戰(zhàn)是缺乏大規(guī)模的、真實的和合成的數(shù)據(jù)來訓(xùn)練模型。人工示范不具備可擴展性,受限于一天中的小時數(shù)。
開發(fā)人員可以使用NVIDIA Cosmos物理人工智能世界基礎(chǔ)模型來放大數(shù)據(jù)。Groot Dreams是一個基于Cosmos的藍圖,用于大規(guī)模生成合成軌跡數(shù)據(jù)。
一種真實到真實的數(shù)據(jù)工作流程:首先,開發(fā)人員通過在單一環(huán)境中對單一任務(wù)進行遙操作記錄的人工示范來微調(diào)Cosmos。然后,他們用一張圖片和新的指令提示模型來生成夢想,或者說是未來的世界狀態(tài)。Cosmos是一個生成模型,因此開發(fā)者可以使用新的動作詞進行提示,而無需捕獲新的遙操作數(shù)據(jù)。
一旦生成了大量夢想,Cosmos會推理并評估每個夢想的質(zhì)量,選擇最佳的夢想用于訓(xùn)練。但這些夢想仍然只是像素。機器人從行動中學(xué)習(xí)。
Groot Dreams藍圖從2D夢想視頻中生成3D動作軌跡。然后,這被用于訓(xùn)練機器人模型。Groot Dreams讓機器人能夠?qū)W習(xí)各種各樣的新動作,而只需極少的人工捕獲。
因此,一小隊人類演示者現(xiàn)在可以完成成千上萬人的工作。Groot Dreams讓開發(fā)者們在解決機器人數(shù)據(jù)挑戰(zhàn)方面更進一步。
為了實現(xiàn)機器人技術(shù),你需要人工智能。但為了教導(dǎo)人工智能,你需要人工智能。因此,這確實是智能體時代的偉大之處,我們需要大量的合成數(shù)據(jù)生成。機器人技術(shù),需要大量的合成數(shù)據(jù)生成。
被稱為微調(diào)的技能學(xué)習(xí),涉及到大量的強化學(xué)習(xí)和巨大的計算量。因此,人工智能的訓(xùn)練、開發(fā)和運行都需要巨大的計算量。
正如之前提到的,世界正面臨嚴(yán)重的勞動力短缺。人形機器人如此重要的原因是,它是唯一一種幾乎可以在任何棕地環(huán)境中部署的機器人。它不必是綠地環(huán)境,它可以融入我們創(chuàng)造的世界,完成我們?yōu)樽约涸O(shè)定的任務(wù)。我們?yōu)樽约涸O(shè)計了世界,現(xiàn)在我們可以創(chuàng)造一個機器人來適應(yīng)這個世界,并幫助我們。
現(xiàn)在,人形機器人最令人驚嘆之處不僅僅在于,如果它能正常運作,它將具有相當(dāng)高的通用性。它很可能是唯一有可能成功的機器人。其原因在于技術(shù)需要規(guī)模效應(yīng)。我們目前擁有的大多數(shù)機器人系統(tǒng)產(chǎn)量太低,這些低產(chǎn)量系統(tǒng)永遠無法達到足夠的技術(shù)規(guī)模,從而無法使飛輪運轉(zhuǎn)足夠遠、足夠快,以至于我們愿意投入足夠的技術(shù)來改進它。但人形機器人很可能成為下一個數(shù)萬億美元級的產(chǎn)業(yè),而且技術(shù)創(chuàng)新速度非常快。計算和數(shù)據(jù)中心的消耗是巨大的,但這是需要三臺計算機才能實現(xiàn)的應(yīng)用之一。一臺計算機用于學(xué)習(xí)的人工智能,一臺計算機是仿真引擎,人工智能可以在虛擬環(huán)境中學(xué)習(xí)如何成為機器人,然后進行部署。一切移動的物體都將是機器人。
當(dāng)我們將這些機器人放入工廠時,請記住,工廠也將是機器人化的。今天的工廠非常復(fù)雜,例如達美航空的生產(chǎn)線,他們正在為機器人化的未來做準(zhǔn)備。它已經(jīng)是機器人和軟件定義的了,并且未來將會有機器人在其中工作。
為了讓我們創(chuàng)造和設(shè)計能夠像一個艦隊一樣,像一個團隊一樣運作的機器人,在一個也是機器人化的工廠中協(xié)同工作,我們必須賦予其Omniverse(全宇宙)來學(xué)習(xí)如何協(xié)同工作。而那個數(shù)字孿生,現(xiàn)在有了一個機器人的數(shù)字孿生,擁有所有設(shè)備的數(shù)字孿生,擁有一個工廠的數(shù)字孿生。這些嵌套的數(shù)字孿生將成為 Omniverse 能夠?qū)崿F(xiàn)的一部分。這是達美航空的數(shù)字孿生,這是緯創(chuàng)資通的數(shù)字孿生。
這些都是數(shù)字孿生,都是模擬,看起來非常漂亮。圖像看起來非常漂亮,但它們都是數(shù)字孿生。這是和碩的數(shù)字孿生,這是富士康的數(shù)字孿生,這是技嘉的數(shù)字孿生,這是澳洲航空的,這是緯創(chuàng)資通的。臺積電正在為其下一個晶圓廠構(gòu)建一個數(shù)字孿生。
全球正在規(guī)劃價值5萬億美元的工廠。未來三年內(nèi),將新建價值5萬億美元的工廠。
世界正在重塑,再工業(yè)化正在全球推進,新的工廠正在各地興建。這對我們來說是一個巨大的機遇,確保其建造得良好、經(jīng)濟高效且準(zhǔn)時。
將一切都放入數(shù)字孿生體中,是邁出的絕佳第一步,并為機器人化的未來做好準(zhǔn)備。建造這價值5萬億美元的工廠,還不包括我們正在建造的一種新型工廠。甚至我們自己的工廠,也將其放入數(shù)字孿生體中。這是英偉達人工智能工廠的數(shù)字孿生體。高雄也是一個數(shù)字孿生體。他們將高雄制造成了一個數(shù)字孿生體。目前已經(jīng)有成千上萬棟建筑,數(shù)百萬英里的道路。
臺積電、富士康、緯創(chuàng)、和碩、臺達電子、廣達、云達科技和技嘉正在NVIDIA Omniverse 上為制造過程的每一步開發(fā)數(shù)字孿生體。臺積電與 MED-AI 從二維 CAD 生成整個晶圓廠的 3D 布局,并在 CUOP 上開發(fā)人工智能工具,可以模擬和優(yōu)化跨多個樓層的復(fù)雜管道系統(tǒng),從而節(jié)省數(shù)月時間。廣達、緯創(chuàng)和和碩計劃在實際建造之前,先以虛擬方式規(guī)劃新的設(shè)施和生產(chǎn)線,通過減少停機時間節(jié)省數(shù)百萬美元的成本。和碩模擬焊膏點膠,從而減少生產(chǎn)缺陷。廣達使用 Siemens Teamcenter X 與 Omniverse 來分析和規(guī)劃多步驟流程。富士康、緯創(chuàng)和廣達利用 Cadence Reality Digital Twin 模擬測試數(shù)據(jù)中心的電力和散熱效率。為了開發(fā)具備人工智能的實體機器人,每家公司都將其數(shù)字孿生體用作機器人訓(xùn)練場,以開發(fā)、訓(xùn)練、測試和模擬機器人。無論是機械臂、自主移動機器人(AMR)、人形機器人,還是視覺人工智能代理,在執(zhí)行任務(wù)或作為多元化團隊協(xié)同工作時,均可利用數(shù)字孿生體。當(dāng)通過物
聯(lián)網(wǎng)(IoT)連接到物理孿生體時,每個數(shù)字孿生體都成為一個實時交互式儀表板。和碩利用 NVIDIA Metropolis 構(gòu)建人工智能代理,以幫助員工學(xué)習(xí)復(fù)雜的技術(shù)。
LinkerVision 公司和高雄市利用數(shù)字孿生體來模擬不可預(yù)測情境的影響,并構(gòu)建可監(jiān)控城市攝像頭流的人工智能代理,向急救人員提供即時警報。
工業(yè)人工智能時代已經(jīng)到來,由科技領(lǐng)軍企業(yè)率先開創(chuàng),由Omniverse 驅(qū)動。
作為最先進產(chǎn)業(yè)的中心,人工智能和機器人技術(shù)的發(fā)源地,理應(yīng)如此。這里是世界上最大的電子產(chǎn)品制造區(qū)域。
人工智能和機器人技術(shù)將變革我們所做的一切。歷史上第一次,各位所做的工作已經(jīng)徹底改變了每一個行業(yè),現(xiàn)在它將回過頭來徹底改變各位的行業(yè)。
GeForce將人工智能帶到了世界。人工智能又回來并改變了GeForce。各位將人工智能帶到了世界,人工智能現(xiàn)在會反過來改變各位所做的一切。和各位一起工作非常愉快。謝謝。
我有一個新產(chǎn)品要發(fā)布。我們已經(jīng)在太空船塢開發(fā)了一段時間。現(xiàn)在是我們揭曉我們有史以來建造的最大的產(chǎn)品之一的時候了。而它就停在外面等著我們。讓我們看看情況如何。英偉達星系(NVIDIA Constellation)。
正如各位所知,我們一直在發(fā)展。我們與各位的所有合作關(guān)系也一直在發(fā)展。我們這里的工程師人數(shù)一直在增長。因此,我們的發(fā)展已經(jīng)超出了目前辦公室的局限。所以我打算為他們建造一個全新的英偉達辦公室。它被稱為英偉達星系(NVIDIA Constellation)。
我們也在選擇場地。我們一直在選擇場地,各個城市的市長們都對我們非常友善。我認為我們達成了一些不錯的交易。我不太確定,但黃金地段就是黃金地段。今天我非常高興地宣布,NVIDIA Constellation 將落戶北投士林。
我們已經(jīng)就租賃權(quán)的轉(zhuǎn)讓事宜與現(xiàn)有租賃權(quán)所有者進行了談判。然而,我了解到,為了讓市長批準(zhǔn)該租賃,他想知道臺北市民是否同意我們在這里建造一個大型、美麗的NVIDIA Constellation。各位同意嗎?他還讓各位給他回電話。所以各位確信知道他的號碼。大家都立刻給他打電話,告訴他你認為這是個很棒的主意。
這將是英偉達星空平臺。我們將要構(gòu)建它。我們會盡快開始構(gòu)建。我們需要辦公空間。英偉達星空平臺,北投士林。非常令人興奮。
我想感謝各位多年來的合作。我們正面臨著千載難逢的機會。擺在我們面前的機遇是前所未有的。在我們共同經(jīng)歷的這段時間里,我們第一次不僅在創(chuàng)造下一代信息技術(shù),我們已經(jīng)這樣做了好幾次,從個人電腦到互聯(lián)網(wǎng),再到云,再到移動云。我們已經(jīng)這樣做了好幾次。
但這一次,我們不僅在創(chuàng)造下一代信息技術(shù),事實上,我們正在創(chuàng)造一個全新的產(chǎn)業(yè)。
這個全新的產(chǎn)業(yè)將使我們面臨著巨大的機遇。
我期待與各位合作,共同構(gòu)建人工智能工廠、企業(yè)智能代理、機器人。感謝各位杰出的合作伙伴,與我們共同圍繞統(tǒng)一架構(gòu)構(gòu)建生態(tài)系統(tǒng)。
因此,我想感謝各位今天的光臨。祝各位Computex2025愉快。謝謝。
-END-