Microsoft a prezentat oficial Maia 200, un nou accelerator dedicat inteligenței artificiale. Maia 200 este descris de companie drept un „moment-cheie” în evoluția tehnologiilor de antrenare și inferență AI.
Noul cip este succesorul lui Maia 100 și marchează ambiția Microsoft de a deveni un jucător de prim-plan pe piața infrastructurii hardware pentru AI.
Maia 200 este construit pe procesul de fabricație TSMC de 3 nanometri și integrează peste 100 de miliarde de tranzistori. Acceleratorul dispune de nuclee tensoriale native pentru precizie FP8 și FP4, un sistem de memorie reproiectat cu 216 GB HBM3e și o lățime de bandă impresionantă de 7 TB/s, alături de 272 MB de memorie SRAM on-chip.
Potrivit Microsoft, aceste specificații permit o performanță de peste 10 PFLOPS în precizie FP4 și aproximativ 5 PFLOPS în FP8, suficient pentru rularea celor mai mari modele de inteligență artificială disponibile în prezent, dar și pentru cerințele viitoare.
Microsoft susține că Maia 200 oferă de trei ori mai multă performanță FP4 decât acceleratorul Amazon Trainium de generația a treia și depășește performanța FP8 a TPU-ului Google de generația a șaptea. Astfel, compania îl descrie drept cel mai eficient sistem de inferență AI pe care l-a dezvoltat până acum.
Designul optimizat, axat pe tipuri de date cu precizie redusă, un motor DMA specializat, memorie SRAM integrată și o rețea NoC dedicată transferurilor de mare viteză, permite păstrarea locală a unei părți mai mari din datele și greutățile modelului. Rezultatul: sunt necesare mai puține acceleratoare pentru rularea unui model AI complex.
Maia 200 este deja utilizat pentru sarcini AI interne, inclusiv în Microsoft Foundry și Microsoft 365 Copilot. Din punct de vedere al infrastructurii, acceleratorul este implementat inițial în centrul de date US Central, urmând ca în curând să ajungă și în regiunea US West 3, în apropiere de Phoenix, Arizona. Alte regiuni vor urma.
Prin această lansare, Microsoft își consolidează poziția Azure ca platformă competitivă pentru rularea rapidă și eficientă a modelelor AI, într-o confruntare directă cu Amazon Web Services și Google Cloud.
Pentru cei interesați de testarea noii tehnologii, Microsoft oferă acces timpuriu la SDK-ul Maia 200. Sunt invitați să se înscrie cercetători din mediul academic, dezvoltatori, laboratoare AI de frontieră și parteneri la proiecte open-source, înainte de disponibilitatea comercială extinsă.
Cu Maia 200, Microsoft face un pas important spre redefinirea modului în care sunt construite și rulate aplicațiile AI la scară globală.