Creșterea accelerată a aplicațiilor bazate pe inteligență artificială pune o presiune tot mai mare asupra arhitecturilor actuale de acceleratoare grafice și memorii HBM, scrie Trendforce, care citează presa de specialitate. Companiile din industria semiconductorilor analizează o nouă abordare care ar separa fizic GPU-urile de memoria HBM și le-ar conecta prin legături optice de mare viteză.
În prezent, memoria HBM este amplasată foarte aproape de GPU, pe același substrat, pentru a reduce latențele și pentru a asigura transferuri rapide de date. Capacitatea totală a memoriei a fost extinsă în ultimii ani prin suprapunerea verticală a tot mai multor straturi de memorie.
Totuși, odată cu trecerea la configurații de 16 sau chiar 20 de straturi, complexitatea procesului de fabricație a crescut semnificativ. În paralel, apar și limite fizice care fac dificilă continuarea acestei direcții de dezvoltare.
O altă soluție analizată de industrie presupune amplasarea unui număr mai mare de module HBM în jurul GPU-ului. Și această metodă întâmpină însă restricții. În arhitecturile actuale de tip 2.5D, spațiul disponibil din jurul procesorului grafic este limitat, ceea ce reduce numărul total de module de memorie care pot fi integrate.
În acest context, companiile din domeniul memoriei și al tehnologiilor de ambalare a cipurilor discută despre posibilitatea separării GPU-ului și memoriei HBM în pachete distincte.
Noua arhitectură ar renunța la ideea tradițională potrivit căreia memoria trebuie să fie poziționată imediat lângă procesorul grafic. În schimb, transferul de date ar urma să fie realizat prin conexiuni optice ultra-rapide, capabile să compenseze distanța mai mare dintre componente.
Potrivit specialiștilor, această abordare ar putea permite integrarea unei cantități de memorie HBM de câteva ori mai mare decât în sistemele actuale.
Industria analizează mai multe variante pentru amplasarea memoriei HBM în noile sisteme. Unele scenarii prevăd extinderea spațiului din jurul GPU-ului, în timp ce altele propun poziționarea modulelor de memorie în zone separate ale plăcii de bază, inclusiv sub aceasta.
Astfel de modificări ar putea schimba inclusiv designul general al serverelor și acceleratoarelor AI, motiv pentru care producătorii de GPU-uri sunt deja implicați în discuții.
Legăturile optice dintre GPU și HBM folosesc principii similare celor întâlnite în comunicațiile optice dintre serverele centrelor de date. Totuși, provocarea majoră constă în miniaturizarea componentelor fotonice pentru a putea funcționa la scară microscopică, direct pe plăcile electronice sau în interiorul modulelor semiconductor.
Implementarea unor conexiuni optice într-un spațiu atât de restrâns presupune un grad foarte ridicat de integrare și dezvoltarea unor componente fotonice mult mai compacte decât cele utilizate în infrastructurile actuale de rețea.
În același timp, producătorii din industria OSAT, specializați în asamblarea și testarea semiconductorilor, urmăresc atent evoluția acestor concepte, deoarece ele ar putea redefini tehnologiile de ambalare și interconectare folosite în acceleratoarele AI ale următorilor ani.
Pe măsură ce cerințele pentru inteligența artificială continuă să crească, industria semiconductorilor caută soluții care să permită extinderea capacității de memorie fără compromisuri majore în privința performanței și eficienței energetice.
:format(webp):quality(100)/https://www.go4it.ro/wp-content/uploads/2026/05/NVIDIA-architecture-on-CPO-20260417.jpg)