Dagelijks meer nieuwsberichten dan enige andere Nederlandse nieuwsbron over Nederland.

Economy

Nvidia kondigt de GB200 Blackwell AI-chip aan, die later dit jaar wordt gelanceerd

Nvidia CEO Jensen Huang houdt een keynote speech tijdens de Nvidia GTC AI-conferentie in SAP Center op 18 maart 2024 in San Jose, Californië.

Justin Sullivan | Getty-afbeeldingen

De nieuwe generatie AI-aangedreven grafische processors heet Blackwell. De eerste chip van Blackwell heet de GB200 en wordt later dit jaar verzonden. Nvidia lokt zijn klanten met krachtigere chips om nieuwe bestellingen te stimuleren. Bedrijven en softwaremakers zijn bijvoorbeeld nog steeds bezig om de huidige generatie “Hopper” H100-chips en soortgelijke chips te verkrijgen.

“Hopper is geweldig, maar we hebben grotere GPU’s nodig”, zei Nvidia-CEO Jensen Huang maandag op de ontwikkelaarsconferentie van het bedrijf in Californië.

Nvidia-aandelen daalden maandag tijdens de uitgebreide handelsdag met meer dan 1%.

Het bedrijf introduceerde ook een inkomstengenererend programma genaamd NIM dat de inzet van AI zal vergemakkelijken, waardoor klanten nog een reden krijgen om Nvidia-chips te blijven gebruiken te midden van een groeiend aantal concurrenten.

De leidinggevenden van Nvidia zeggen dat het bedrijf minder een aanbieder van huurchips is geworden, en meer een platformaanbieder, zoals Microsoft of Apple, waarop andere bedrijven software kunnen bouwen.

“Blackwell is geen chip, het is de naam van een platform”, zei Huang.

“Het commercieel verkoopbare product was de GPU en de software was bedoeld om mensen te helpen de GPU op verschillende manieren te gebruiken”, zei Manuvir Das, vice-president van de Nvidia Foundation in een interview. “Natuurlijk doen we dat nog steeds. Maar wat echt veranderd is, is dat we nu daadwerkelijk een bedrijfssoftwarebedrijf hebben.”

Das zei dat de nieuwe software van Nvidia het gemakkelijker zal maken om software op alle GPU's van Nvidia te draaien, zelfs oudere die misschien beter geschikt zijn voor implementatie, maar niet voor het bouwen van AI.

READ The Morning Show: belangrijke macrosignalen uit China en Japan

“Als je een ontwikkelaar bent en je hebt een interessant model waarvan je wilt dat mensen het adopteren, als je het in NIM stopt, zorgen we ervoor dat het op al onze GPU's kan worden afgespeeld, zodat je veel mensen kunt bereiken,” zei Das.

Nvidia's GB200 Grace Blackwell Superchip, met twee B200 GPU's en één Arm-gebaseerde CPU.

Om de paar jaar werkt Nvidia zijn GPU-architectuur bij, waardoor een enorme prestatieverbetering ontstaat. Veel van de AI-modellen die het afgelopen jaar zijn uitgebracht, zijn getraind op de Hopper-architectuur van het bedrijf – waarvan chips zoals de H100 gebruik maken – die in 2022 zal worden aangekondigd.

Nvidia zegt dat op Blackwell gebaseerde processors, zoals de GB200, een enorme prestatie-upgrade bieden voor AI-bedrijven, met 20 petaflops in AI-prestaties versus 4 petaflops voor de H100. Nvidia zei dat de extra verwerkingskracht AI-bedrijven in staat zal stellen grotere, complexere modellen te trainen.

De chip bevat wat Nvidia een “transformator-engine noemt die specifiek is ontworpen om op transformatoren gebaseerde AI aan te drijven, een van de kerntechnologieën die ten grondslag liggen aan ChatGPT.”

De Blackwell GPU is groot en combineert twee afzonderlijk vervaardigde matrijzen in één enkele chip, gemaakt door TSMC. Het zal ook beschikbaar zijn als een complete server genaamd de GB200 NVLink 2, die 72 Blackwell GPU's en andere Nvidia-onderdelen combineert die zijn ontworpen om AI-modellen te trainen.

Nvidia CEO Jensen Huang vergelijkt de grootte van de nieuwe “Blackwell”-chip met de huidige “Hopper” H100-chip op de ontwikkelaarsconferentie van het bedrijf in San Jose, Californië.

READ Dan Yergin praat over dalende olieprijzen ondanks krappe voorraden en spanningen in Rusland

Nvidia

Amazon, Google, Microsoft en Oracle zullen toegang tot de GB200 verkopen via clouddiensten. De GB200 combineert twee B200 Blackwell GPU's met een enkele Arm-gebaseerde Grace CPU. Nvidia zei dat Amazon Web Services een serverfarm zal bouwen met 20.000 GB200-chips.

Nvidia zei dat het systeem een model kan inzetten dat 27 biljoen parameters bevat. Dit is veel groter dan zelfs de grootste modellen, zoals GPT-4, die naar verluidt 1,7 biljoen parameters bevat. Veel AI-onderzoekers zijn van mening dat grotere modellen meer parameters en gegevens bevatten Het kan nieuwe vaardigheden ontgrendelen.

Nvidia heeft geen kosten opgegeven voor de nieuwe GB200 of de daarin gebruikte systemen. Nvidia's Hopper-gebaseerde H100 kost tussen de $25.000 en $40.000 per chip, terwijl complete systemen volgens schattingen van analisten tot wel $200.000 kosten.

Nvidia zal de B200 GPU's ook verkopen als onderdeel van een compleet systeem dat een heel serverrack in beslag neemt.

Nvidia heeft ook aangekondigd dat het een nieuw product genaamd NIM, wat staat voor Nvidia Inference Microservice, toevoegt aan zijn Nvidia Enterprise-programmaabonnement.

NIM maakt het gemakkelijker om oudere Nvidia GPU's te gebruiken voor gevolgtrekkingen, of het proces van het uitvoeren van AI-programma's, en zal bedrijven in staat stellen de honderden miljoenen Nvidia GPU's die ze al bezitten te blijven gebruiken. Inferentie vereist minder rekenkracht dan de initiële training van een nieuw AI-model. Met NIM kunnen bedrijven hun eigen AI-modellen gebruiken, in plaats van toegang tot AI-resultaten als een dienst aan te schaffen bij bedrijven als OpenAI.

De strategie is om klanten die Nvidia-gebaseerde servers kopen, te overtuigen zich te abonneren op Nvidia Enterprise, wat $4.500 per GPU per jaar kost om te licentiëren.

READ Fed-voorzitter Powell noemt de inflatie 'zeer hoog' en waarschuwt 'we zijn bereid de rente verder te verhogen'

Nvidia zal samenwerken met AI-bedrijven zoals Microsoft of Hugging Face om ervoor te zorgen dat zijn AI-modellen zijn afgestemd op alle compatibele Nvidia-chips. Met behulp van NIM kunnen ontwikkelaars het model vervolgens efficiënt uitvoeren op hun eigen servers of op de cloudgebaseerde servers van Nvidia, zonder een langdurig configuratieproces.

“In mijn code, waar ik OpenAI aanriep, zou ik één regel code vervangen om deze naar de NIM te verwijzen die ik van Nvidia kreeg”, zei Das.

Nvidia zegt dat de software AI ook zal helpen draaien op met GPU uitgeruste laptops, in plaats van op servers in de cloud.