NVIDIA a prezentat Cosmos 3, un nou model de inteligență artificială destinat roboților și sistemelor autonome, pe care compania îl descrie drept primul „omnimodel” complet deschis pentru aplicații din lumea reală.
Anunțul a fost făcut în cadrul conferinței GTC Taipei, unde CEO-ul Jensen Huang a detaliat ambițiile companiei de a accelera dezvoltarea inteligenței artificiale fizice.
Spre deosebire de modelele AI tradiționale, orientate în principal către generarea de text sau imagini, Cosmos 3 este conceput pentru a înțelege și interpreta mediul fizic în care operează roboții, vehiculele autonome sau sistemele inteligente de monitorizare.
NVIDIA susține că noua platformă poate procesa simultan texte, imagini, secvențe video, sunete ambientale și informații legate de mișcare. Astfel, sistemul este capabil să analizeze obiecte, relații spațiale și traiectorii înainte de a lua o decizie sau de a genera o acțiune.
Scopul este simplu: anticiparea modului în care lumea reală evoluează, pentru ca sistemele autonome să poată reacționa mai rapid și mai sigur.
La baza Cosmos 3 se află o arhitectură denumită „mixture-of-transformers”, care combină două componente specializate.
Prima este responsabilă de procesul de raționament și analiză, iar cea de-a doua gestionează generarea de conținut și simulări. Împreună, acestea permit modelului să evalueze interacțiunile dintre obiecte, efectele mișcării și constrângerile impuse de legile fizicii.
Practic, modelul încearcă să prevadă starea viitoare a mediului înconjurător înainte de a executa o comandă sau de a genera o simulare.
Odată cu lansarea Cosmos 3, NVIDIA a anunțat și formarea Cosmos Coalition, o alianță care reunește companii și laboratoare specializate în inteligență artificială și robotică.
Printre partenerii implicați se numără Black Forest Labs, Runway, Skild AI și Agile Robots. De asemenea, grupuri industriale importante precum Samsung, LG Electronics și Doosan Robotics utilizează deja platforma pentru dezvoltarea unor sisteme industriale inteligente și a soluțiilor pentru conducere autonomă.
Strategia NVIDIA diferă de abordările închise adoptate de o parte a industriei. Compania dorește să ofere dezvoltatorilor acces direct la tehnologie pentru a accelera inovația în domeniul inteligenței artificiale fizice.
Cosmos 3 poate fi folosit în mai multe scenarii.
Platforma poate funcționa ca model multimodal pentru analiză și raționament, ca sistem de simulare a mediilor reale sau ca bază pentru instruirea roboților în executarea unor sarcini specifice.
Potrivit NVIDIA, modelul a obținut deja rezultate de top în mai multe teste dedicate inteligenței artificiale fizice, inclusiv benchmark-urile Physics-IQ și PAI-Bench.
Compania a lansat Cosmos 3 în mai multe variante.
Versiunea Cosmos 3 Super este destinată aplicațiilor care necesită simulări fizice complexe și precizie ridicată, precum vehiculele autonome sau roboții industriali avansați.
Pentru aplicațiile care pun accent pe rapiditate, NVIDIA oferă Cosmos 3 Nano, capabil să proceseze scenarii video și acțiuni în timp foarte scurt.
Ambele versiuni sunt disponibile deja pentru dezvoltatori prin platforme precum GitHub și Hugging Face.
În perioada următoare va fi lansată și varianta Edge, optimizată pentru rularea directă pe dispozitive compacte și sisteme integrate.
Prin Cosmos 3, NVIDIA încearcă să reducă una dintre cele mai mari provocări ale industriei: timpul și resursele necesare pentru instruirea roboților și a sistemelor autonome.
Dacă modelele generative au schimbat modul în care calculatoarele creează conținut digital, Cosmos 3 urmărește să facă același lucru pentru interacțiunea dintre inteligența artificială și lumea fizică, oferind roboților capacitatea de a înțelege, anticipa și reacționa la evenimente din mediul real.