NVIDIA Blackwell Ultra duce Agentic AI la un nou nivel: performanță de 50x mai mare și costuri reduse drastic

NVIDIA Blackwell Ultra duce Agentic AI la un nou nivel: performanță de 50x mai mare și costuri reduse drastic
Blackwell Ultra. Foto - Nvidia

NVIDIA anunță un salt spectaculos în infrastructura pentru inteligență artificială, odată cu lansarea arhitecturii Blackwell Ultra. Noile sisteme, în special configurația GB300 NVL72, promit performanțe record în sarcini cu latență scăzută și în scenarii cu context extins, esențiale pentru noul val de aplicații „agentice”.

Performanță de până la 50 de ori mai mare

Într-un test realizat pe platforma InferenceMAX de la SemiAnalysis, NVIDIA a evidențiat un indicator devenit crucial pentru marile centre de date: „token/watt”. Pe scurt, este vorba despre câtă procesare AI poate fi obținută pentru fiecare unitate de energie consumată.

Comparativ cu generația anterioară Hopper, Blackwell Ultra în configurația GB300 NVL72 ar oferi o creștere de până la 50 de ori a performanței per megawatt. Într-un context în care hyperscalerii investesc masiv în infrastructură AI, eficiența energetică devine la fel de importantă ca puterea brută de calcul.

NVLink și arhitectura cu 72 de GPU-uri

Unul dintre secretele performanței este tehnologia NVLink, care conectează 72 de GPU-uri într-o singură structură unificată, cu o lățime de bandă de până la 130 TB/s. Spre deosebire de arhitectura Hopper, limitată la un design cu opt cipuri interconectate, Blackwell Ultra scalează la nivel de rack complet.

În plus, NVIDIA introduce formatul de precizie NVFP4, optimizat pentru inferență AI, ceea ce permite o creștere semnificativă a throughput-ului fără a sacrifica eficiența.

Blackwell Ultra – Costuri reduse și performanță mai bună pe context lung

Pentru aplicațiile de tip „agentic AI”, care trebuie să gestioneze volume mari de date și contexte extinse (de exemplu, analizarea unui cod sursă complex), Blackwell Ultra aduce îmbunătățiri clare. NVIDIA vorbește despre o reducere de până la 35 de ori a costului per milion de tokeni față de generația anterioară.

În comparație directă între GB200 și noul GB300 NVL72, compania susține o reducere de până la 1,5 ori a costului per token și o procesare a mecanismelor de atenție de două ori mai rapidă. Aceste aspecte sunt esențiale pentru agenții AI care trebuie să mențină „memoria” unor seturi mari de informații.

Blackwell Ultra – O nouă etapă în cursa infrastructurii AI

Blackwell Ultra este deja în proces de integrare la marii furnizori de infrastructură cloud, iar primele rezultate sugerează că NVIDIA reușește să mențină ritmul accelerat al evoluției performanței AI.

Pe măsură ce piața se îndreaptă tot mai mult către aplicații autonome și modele avansate, arhitectura Blackwell Ultra consolidează poziția NVIDIA în fruntea cursei globale pentru infrastructură AI. Iar generațiile următoare ar putea duce această competiție la un nivel și mai ridicat.

Urmărește Go4IT.ro pe Google News
Răzvan Crăciun
Răzvan Crăciun
Cu o experiență de aproape 30 de ani în presă, în luna mai 2025 am ajuns din nou în domeniul care m-a pasionat de la început - IT. Cea mai lungă perioadă (mai mult de 15 ani) am petrecut-o la agenția de presă Mediafax, unde am trecut prin piața de capital și IT. Am publicat și în Ziarul ... citește mai mult