Companiile americane din sectorul cloud pregătesc investiții masive în infrastructura dedicată AI, pe fondul competiției tot mai intense pentru dezvoltarea serviciilor AI comerciale.
Principalii cinci furnizori de servicii cloud din America de Nord vor majora semnificativ achizițiile de servere AI de tip rack-scale în 2026, potrivit unei analize publicate de TrendForce.
Raportul estimează că această expansiune va duce la o creștere de aproximativ 122% a puterii totale de procesare dedicate inferenței AI, comparativ cu anul precedent.
Google, Amazon, Microsoft, Meta și Oracle vor reprezenta peste 60% din cererea globală pentru serverele NVIDIA din seriile GB și VR în cursul acestui an.
Aceste sisteme sunt concepute atât pentru antrenarea modelelor AI, cât și pentru rularea inferențelor, adică procesul prin care modelele generează răspunsuri și rezultate pentru utilizatori. NVIDIA pune tot mai mult accent pe această zonă, pe măsură ce companiile încearcă să transforme inteligența artificială într-un serviciu comercial profitabil.
Potrivit estimărilor, puterea totală de calcul pentru antrenarea modelelor AI a celor cinci mari furnizori cloud va depăși 9 ExaFLOPS în 2025 și va crește cu peste 56% în 2026.
În ceea ce privește inferența AI, creșterea este considerabil mai rapidă. Capacitatea totală ar urma să urce de la peste 37 ExaFLOPS în 2025 la un nivel cu aproape 122% mai mare în 2026.
Livrările globale de servere AI vor crește cu peste 28% în 2026, estimează TrendForce. Serverele destinate antrenării modelelor avansate vor continua să domine piața și vor reprezenta aproximativ 55% din totalul livrărilor.
Pe termen mediu și lung, însă, serverele optimizate pentru inferență ar putea depăși segmentul dedicat antrenării, pe măsură ce furnizorii cloud extind serviciile AI către utilizatorii comerciali și consumatori.
Cele cinci mari companii tehnologice nord-americane sunt așteptate să aloce împreună peste 770 de miliarde de dolari pentru investiții de capital în 2026, ceea ce ar reprezenta un avans de aproape 87% față de anul anterior.
În paralel cu soluțiile NVIDIA și AMD, marile companii continuă dezvoltarea propriilor cipuri AI. Google își extinde platforma TPU, iar TrendForce estimează că cererea pentru aceste procesoare va crește cu aproape 80% în 2026, odată cu trecerea graduală de la generația v7 la v8.
Amazon își consolidează, la rândul său, poziția prin platforma Trainium, care ar putea reprezenta peste 40% din propriile livrări de servere AI ale companiei în 2026.
Extinderea accelerată a infrastructurii AI vine însă cu un cost important în ceea ce privește energia consumată. Noile generații de servere AI folosesc sisteme avansate de răcire lichidă pentru a gestiona temperaturile ridicate produse de acceleratoarele grafice și cipurile specializate.
Puterea totală consumată de serverele operate de cei cinci mari furnizori cloud se esrimează că va crește cu 18 GW în 2026 față de anul precedent, ceea ce ar însemna un salt anual de aproximativ 116%.
Analiștii consideră că această evoluție reflectă intensificarea competiției globale din domeniul inteligenței artificiale, alimentată de implementarea simultană a noilor platforme NVIDIA GB300, AMD Helios și a soluțiilor dezvoltate intern de marile companii cloud.
:format(webp):quality(100)/https://www.go4it.ro/wp-content/uploads/2026/05/Trendforce-AI_Nvidia_tf-press-center-58-.jpg)