Claude Mythos: 10.000 de vulnerabilități descoperite într-o lună

Anthropic pare să se pregătească pentru lansarea publică a „Mythos”, anunțat în aprilie ca un model restricționat care prezintă riscuri majore de securitate pentru software-ul privat și public.

Pe 7 aprilie, Anthropic a anunțat Mythos în versiune preliminară și l-a numit un model de frontieră nou, cu capacități remarcabil de avansate în sarcinile de securitate informatică.

Anthropic și-a dezvăluit intenția de a lansa într-o zi modele care să egaleze performanța AI-ului său Mythos de detectare a erorilor, odată ce le va putea face sigure, potrivit publicației The Register.

Anthropic a declarat că modelul Mythos prezintă îmbunătățiri majore în ceea ce privește raționamentul și autonomia programării software, depășind cu mult modelul său actual de referință, Opus 4.7.

Îmbunătățirile în programare nu sunt o noutate pentru modelele de IA, dar în cazul Mythos, Anthropic a constatat că modelul poate dezvolta automat atacuri cibernetice funcționale la un nivel profesional.

Compania a susținut, de asemenea, că lansarea sa reprezintă un risc grav pentru infrastructura digitală globală.

Pentru a împiedica atacatorii să exploateze un volum masiv de vulnerabilități necorectate în aplicații populare, Anthropic a decis să nu lanseze public modelul Mythos până când nu va pregăti un sistem puternic de protecție.

Referințele la modelul Mythos descoperite în Claude Code și Claude Security par să indice că Anthropic ar fi dezvoltat deja un sistem de protecție.

De fapt, unii utilizatori au observat pentru scurt timp comutatorul de activare a Mythos în versiunea publică a Claude Code înainte ca acesta să fie scos offline.

Modelul se numește claude-mythos-1-preview și a apărut, de asemenea, pentru scurt timp în versiunea publică a Claude Security.

Acest lucru confirmă faptul că Anthropic pregătește modelul pentru lansarea publică, dar nu este clar dacă acesta va fi disponibil pentru toate nivelurile de abonament.

Anthropic a confirmat că lucrează la proiectul numit „Glasswing”, în cadrul căruia startup-ul de IA colaborează cu alte companii pentru a proteja cele mai critice programe software din lume împotriva potențialelor exploatări bazate pe IA.

Această inițiativă utilizează versiunea preliminară, încă nelansată, a modelului Claude Mythos și a reușit deja să ajute până la 50 de parteneri organizaționali.

Modelul Mythos a reușit să descopere 10.000 de vulnerabilități de gravitate ridicată sau critică doar în prima lună, ceea ce explică de ce Anthropic a amânat lansarea sa publică.

Până în prezent, Mythos a găsit aproximativ 6.202 de vulnerabilități de gravitate ridicată sau critică în aceste proiecte – și 23.019 de defecte în total.

„75 dintre cele 530 de bug-uri cu gravitate ridicată sau critică pe care le-am raportat au fost acum remediate, iar 65 dintre acestea au primit avertismente publice”, se menționează în postare, care explică apoi rata scăzută de remediere prin dezvăluirea faptului că Anthropic se află „încă la începutul perioadei de 90 de zile prevăzute în politica noastră de divulgare coordonată a vulnerabilităților: ne așteptăm ca multe alte remedieri să apară în curând”.

Compania consideră că este, de asemenea, „probabil să subestimeze numărul de remedieri, deoarece unele vulnerabilități sunt remediate fără o notificare publică”. În cele din urmă, avalanșa de bug-uri descoperite de Mythos „se adaugă unui ecosistem de securitate deja supraîncărcat”.

Anthropic a publicat săptămâna trecută o „actualizare inițială” privind Proiectul Glasswing, care, în penultimul paragraf, dezvăluie că următorul pas al companiei va consta în „… colaborarea cu parteneri critici, inclusiv guvernele SUA și ale aliaților, pentru a extinde Proiectul Glasswing către parteneri suplimentari. Și, în viitorul apropiat, odată ce vom fi dezvoltat măsurile de protecție mult mai puternice de care avem nevoie, așteptăm cu nerăbdare să punem la dispoziție modele de clasa Mythos printr-o lansare generală”.

Compania nu a explicat ce înseamnă „viitorul apropiat” și recunoaște că „în prezent, nicio companie, inclusiv Anthropic, nu a dezvoltat măsuri de protecție suficient de puternice pentru a împiedica utilizarea abuzivă a acestor modele și potențialele daune grave pe care le-ar putea provoca”.

Anthropic oferă în prezent Claude Opus 4.7, Opus 4.6, Opus 4.5, Sonnet 4.6 și Haiku 5.5.

Tags: Anthropic Claude Mythos inteligenta artificiala securitate cibernetica vulnerabilitati software

Urmărește Go4IT.ro pe Google News

Iți recomandăm