Anthropic a prezentat astăzi Claude Sonnet 5, cea mai nouă versiune a modelului său de inteligență artificială din gama Sonnet, poziționată ca o alternativă mai accesibilă financiar față de modelele Opus, dar cu performanțe semnificativ îmbunătățite. Compania susține că noul model reduce diferența dintre Sonnet și Opus, oferind capabilități avansate la costuri mai mici, adresându-se astfel utilizatorilor care au nevoie de un echilibru mai bun între preț, autonomie și performanță.
Potrivit Anthropic, Claude Sonnet 5 este cel mai „agentic” model Sonnet lansat până acum. Cu alte cuvinte, acesta poate funcționa mai independent, fiind capabil să își construiască planuri, să folosească instrumente precum browsere sau terminale și să execute sarcini complexe cu un grad ridicat de autonomie. Deși modelele Opus rămân superioare în privința capacităților agentice, acestea sunt considerabil mai costisitoare, iar Sonnet 5 pare conceput tocmai pentru a oferi o variantă mai eficientă din punct de vedere al costurilor.
Compania afirmă că performanța noului model este apropiată de cea a Opus 4.8, în timp ce saltul față de Sonnet 4.6 este vizibil în mai multe domenii-cheie: raționament, utilizarea instrumentelor, scriere de cod și activități de knowledge work. Anthropic susține că Sonnet 5 poate finaliza sarcini complexe pe care versiunea 4.6 nu reușea să le ducă la capăt și că are capacitatea de a-și verifica propriile rezultate fără să i se solicite explicit acest lucru.
Un alt punct pe care Anthropic îl evidențiază este siguranța. Evaluările interne arată că Sonnet 5 refuză mai eficient solicitările rău intenționate și înregistrează rate mai scăzute de halucinații și de comportamente lingușitoare față de utilizator, cunoscute în domeniul AI drept „sycophancy”. Compania mai susține că noul model are, per ansamblu, o rată mai redusă a comportamentelor nedorite decât Sonnet 4.6 și este mai sigur de folosit în contexte agentice, acolo unde modelul poate acționa pe baza unor obiective și instrumente externe.
Anthropic a publicat și comparații de performanță între Sonnet 5, Sonnet 4.6 și Opus 4.8, pe evaluări precum BrowseComp, dedicată căutării agentice, și OSWorld-Verified, care măsoară capacitatea de utilizare a computerului. Potrivit companiei, Sonnet 5 reprezintă o îmbunătățire clară față de Sonnet 4.6 și oferă o plajă mai largă de opțiuni cost-performanță în comparație cu Opus 4.8. La nivel mediu de efort, modelul promite o eficiență substanțial mai bună, iar la niveluri ridicate de efort poate egala Opus 4.8 în anumite sarcini.
Totuși, Anthropic precizează că Sonnet 5 are o capacitate mult mai redusă de a executa sarcini de securitate cibernetică decât modelele Opus actuale, un detaliu important în contextul preocupărilor privind utilizarea AI în activități cu risc ridicat.
Claude Sonnet 5 este disponibil pentru toate planurile Claude și devine modelul implicit pentru utilizatorii planurilor Free și Pro. Până la 31 august, prețul este de 2 dolari pentru un milion de tokene de intrare și 10 dolari pentru un milion de tokene de ieșire. Ulterior, tarifele vor crește la 3 dolari, respectiv 15 dolari pentru aceleași volume.
Sursa: Mac Rumors