DeepSeek pregătește lansarea modelului AI V4, cu o scalare masivă a parametrilor

DeepSeek pregătește lansarea modelului AI V4, cu o scalare masivă a parametrilor
Foto AI

DeepSeek se apropie de lansarea unei noi generații de model de inteligență artificială, denumită V4, care ar putea debuta spre finalul lunii aprilie.

Noul sistem promite un salt semnificativ în performanță și marchează o etapă importantă în evoluția tehnologiilor AI dezvoltate în China.

Un model de dimensiuni impresionante

Potrivit informațiilor apărute până în prezent, DeepSeek V4 ar putea integra aproximativ un trilion de parametri, o valoare care îl plasează în categoria celor mai avansate modele existente.

Modelul utilizează o arhitectură de tip Mixture-of-Experts, care activează doar o parte din parametri pentru fiecare sarcină. Această abordare permite menținerea costurilor de operare la un nivel controlat, în timp ce oferă performanțe ridicate.

Eficiență și scalabilitate

Prin activarea a aproximativ 32-37 de miliarde de parametri pentru fiecare operațiune, modelul reușește să combine dimensiunea mare cu eficiența. Această strategie permite extinderea capacităților fără o creștere proporțională a resurselor necesare pentru rulare.

Conceptul nu este nou pentru companie, însă V4 duce această abordare la un nivel superior, atât din punct de vedere al dimensiunii, cât și al optimizării.

Tehnologie bazată pe infrastructură chineză

Un element esențial al acestui proiect îl reprezintă utilizarea procesoarelor dezvoltate de Huawei, din gama Ascend. Alegerea acestor componente reflectă o orientare strategică către dezvoltarea unui ecosistem tehnologic independent.

Decizia de a colabora cu furnizori locali, în detrimentul unor companii precum NVIDIA sau AMD, sugerează o schimbare de direcție în industria AI din China.

Capacitate extinsă de procesare a contextului

Un alt aspect intens discutat este posibilitatea ca modelul să suporte un context de până la un milion de tokeni. Deși această specificație nu a fost confirmată oficial, există indicii că arhitectura tehnică ar putea susține o astfel de capacitate.

Cercetările recente ale companiei în domeniul memoriei condiționale indică o orientare clară către modele capabile să gestioneze volume mari de informații într-o singură interacțiune.

Lansare amânată, dar iminentă

Modelul V4 a fost deja amânat de două ori, iar calendarul exact rămâne incert. Totuși, testele recente ale unei versiuni preliminare, denumită V4-Lite, sugerează că lansarea completă este aproape.

Industria urmărește cu atenție acest moment, în condițiile în care fiecare nou model lansat de DeepSeek a avut un impact semnificativ asupra pieței.

Un posibil moment de cotitură în industria AI

Dacă specificațiile vehiculate se confirmă, DeepSeek V4 ar putea reprezenta un punct de referință atât din punct de vedere tehnologic, cât și strategic. Combinația dintre performanță ridicată, eficiență și independență față de furnizorii occidentali ar putea influența direcția întregii industrii.

Rămâne de văzut dacă lansarea va avea loc conform estimărilor, însă așteptările sunt deja ridicate.

Urmărește Go4IT.ro pe Google News
Răzvan Crăciun
Răzvan Crăciun
Cu o experiență de aproape 30 de ani în presă, în luna mai 2025 am ajuns din nou în domeniul care m-a pasionat de la început - IT. Cea mai lungă perioadă (mai mult de 15 ani) am petrecut-o la agenția de presă Mediafax, unde am trecut prin piața de capital și IT. Am publicat și în Ziarul ... citește mai mult