Meta a încheiat un nou acord cu Amazon Web Services pentru utilizarea la scară largă a procesoarelor Graviton.
Implementarea inițială vizează zeci de milioane de nuclee, cu posibilitatea extinderii pe măsură ce infrastructura dedicată inteligenței artificiale evoluează.
Decizia reflectă o tendință mai amplă în industrie, în care sistemele clasice sunt completate de procesoare specializate pentru sarcini noi. În timp ce unitățile grafice rămân esențiale pentru antrenarea modelelor, noile aplicații solicită din ce în ce mai mult resurse de tip CPU.
Meta urmărește să susțină astfel de sarcini complexe, precum procesarea datelor în timp real, generarea de cod și coordonarea unor fluxuri de lucru extinse.
Infrastructura va utiliza în principal modelul AWS Graviton5, proiectat pentru sarcini intensive. Acesta include un număr ridicat de nuclee și un sistem de memorie extins, care contribuie la reducerea întârzierilor și la creșterea performanței generale.
Procesorul funcționează pe baza arhitecturii AWS Nitro System, care permite acces direct la resurse hardware și menține performanțe ridicate în medii virtualizate. În plus, tehnologia Elastic Fabric Adapter facilitează comunicarea rapidă între sisteme, esențială pentru distribuirea sarcinilor la scară mare.
Noile procesoare sunt fabricate pe tehnologie de 3 nanometri, ceea ce permite o eficiență energetică mai bună și performanțe superioare față de generațiile anterioare. Această abordare ajută la reducerea costurilor operaționale și la limitarea impactului asupra mediului.
Controlul întregului lanț tehnologic, de la proiectarea cipului până la integrarea în centrele de date, oferă posibilitatea unor optimizări suplimentare față de soluțiile standard.
Parteneriatul dintre cele două companii se extinde într-un moment în care cererea pentru infrastructură AI crește rapid. Diversificarea resurselor de calcul devine un element esențial pentru susținerea noilor aplicații și pentru gestionarea volumelor mari de date.
Prin această inițiativă, Meta urmărește să își dezvolte capacitățile tehnologice și să susțină servicii AI la scară globală, într-un mod eficient și adaptat cerințelor actuale.