NVIDIA a conceput Nemotron 3 Super, un model AI pentru agenți autonomi

NVIDIA a conceput Nemotron 3 Super, un model AI pentru agenți autonomi
Nemotron 3 Super. Foto - Jon Peddie Research

NVIDIA a prezentat noul model de inteligență artificială Nemotron 3 Super, o platformă concepută pentru a susține dezvoltarea agenților AI autonomi capabili să execute sarcini complexe pe termen lung.

Noul model încearcă să rezolve două dintre cele mai mari provocări ale sistemelor agentice: costurile ridicate generate de procesarea tokenilor și dificultatea de a menține contextul în procesele extinse.

O arhitectură eficientă pentru sarcini complexe

Nemotron 3 Super include în total 120 de miliarde de parametri, însă activează aproximativ 12 miliarde în timpul inferenței. Această abordare permite menținerea unor costuri de calcul mai reduse și a unor timpi de răspuns mai rapizi, fără a sacrifica performanța generală.

Modelul utilizează o arhitectură de tip Mixture-of-Experts (MoE), care selectează dinamic componente specializate pentru diferite tipuri de sarcini. Prin comprimarea tokenilor înainte de rutarea către experți, sistemul poate utiliza mai multe module specializate fără a crește costurile de inferență.

Memorie extinsă pentru fluxuri de lucru îndelungate

Una dintre caracteristicile centrale ale modelului este fereastra de context de până la un milion de tokeni. Aceasta permite agenților AI să mențină o memorie extinsă pe durata unor procese complexe și de lungă durată, reducând riscul de pierdere a obiectivelor inițiale ale sarcinilor.

În plus, modelul folosește tehnici precum generarea simultană a mai multor tokeni și decodarea speculativă pentru a accelera producerea de răspunsuri, în special în cazul secvențelor lungi.

Optimizat pentru infrastructura de ultimă generație

Nemotron 3 Super utilizează o arhitectură hibridă Mamba-Transformer, concepută pentru a îmbunătăți eficiența utilizării memoriei și a resurselor de calcul. Modelul a fost antrenat folosind infrastructura bazată pe arhitectura Blackwell, iar în timpul inferenței poate rula de până la patru ori mai rapid pe acceleratoarele NVIDIA B200 comparativ cu generațiile anterioare.

Procesul de optimizare a inclus tehnici de învățare prin recompensă aplicate în mediul de testare NeMo Gym, cu peste 1,2 milioane de simulări dedicate fluxurilor de lucru ale agenților AI.

Aplicații în industrie și cercetare

Noul model este destinat unor scenarii profesionale variate, precum dezvoltarea software, analiza incidentelor de securitate cibernetică, cercetarea în științele vieții sau administrarea sistemelor IT la nivel de companie.

Potrivit companiei, modelul a obținut rezultate de top în testele PinchBench, un benchmark care evaluează performanța modelelor lingvistice utilizate ca nucleu de raționament pentru agenți AI.

Un pas important pentru adoptarea agenților AI

Lansarea Nemotron 3 Super reflectă evoluția rapidă a sistemelor de inteligență artificială către modele capabile să execute procese autonome complexe. În timp ce modelele tradiționale sunt utilizate în principal pentru conversații sau generarea de conținut, agenții AI pot gestiona fluxuri de lucru complete, implicând analiză, planificare și execuție.

Prin optimizarea costurilor de calcul și extinderea capacității de memorie contextuală, NVIDIA încearcă să faciliteze trecerea acestor sisteme din faza experimentală către utilizarea reală în mediul enterprise și în infrastructuri de calcul la scară largă.

Urmărește Go4IT.ro pe Google News
Răzvan Crăciun
Răzvan Crăciun
Cu o experiență de aproape 30 de ani în presă, în luna mai 2025 am ajuns din nou în domeniul care m-a pasionat de la început - IT. Cea mai lungă perioadă (mai mult de 15 ani) am petrecut-o la agenția de presă Mediafax, unde am trecut prin piața de capital și IT. Am publicat și în Ziarul ... citește mai mult