La începutul acestei săptămâni, platforma de dezvoltare AI Hugging Face a lansat un model AI deschis pentru robotică numit SmolVLA. Antrenat pe seturi de date „compatibly licensed” și partajate în comunitate, SmolVLA depășește performanțele modelelor mult mai mari pentru robotică, atât în medii virtuale, cât și în medii reale, susține Hugging Face.
„SmolVLA își propune să democratizeze accesul la modelele de vedere-limbaj-acțiune [VLA] și să accelereze cercetarea către agenți robotici generaliști”, scrie Hugging Face într-o postare pe blog. „SmolVLA nu este doar un model ușor, dar capabil, ci și o metodă de antrenare și evaluare a [tehnologiilor] robotice generaliste.”
Acest model face parte din efortul de expansiune rapidă al Hugging Face, care vrea un ecosistem de hardware și software robotic low-cost. Anul trecut, compania a lansat LeRobot, o colecție de modele, seturi de date și instrumente axate pe robotică. Mai recent, Hugging Face a achiziționat Pollen Robotics, un startup de robotică din Franța, și a lansat mai multe sisteme robotice ieftine, inclusiv umanoizi.
SmolVLA, care are 450 de milioane de parametri, a fost antrenat pe baza datelor din seturile de date comunitare LeRobot, seturi de date robotice special marcate, partajate pe platforma de dezvoltare AI a Hugging Face. Parametrii, uneori denumiți „greutăți”, sunt componentele interne ale unui model care îi ghidează comportamentul.
Hugging Face susține că SmolVLA este suficient de mic pentru a rula pe un singur GPU de obișnuit sau pe un MacBook. De asemenea, poate fi testat și implementat pe hardware „accesibil”, inclusiv pe propriile sisteme robotice ale companiei.
SmolVLA acceptă și o „stivă de inferență asincronă”, despre care Hugging Face spune că permite modelului să separe procesarea acțiunilor unui robot de procesarea a ceea ce vede și aude. După cum a explicat compania în postarea sa pe blog, din „cauza acestei separări, roboții pot reacționa mai rapid în medii aflate în continuă schimbare”.
SmolVLA este disponibil pentru descărcare de pe Hugging Face. Un utilizator de pe X susține deja că a folosit modelul pentru a controla un braț robotic terț.
Este demn de remarcat faptul că Hugging Face este departe de a fi singurul jucător în cursa roboticii deschise, aflată la început de drum.
Nvidia are o colecție de instrumente pentru robotică deschisă, iar startup-ul K-Scale Labs construiește componentele pentru ceea ce numește „umanoizi open-source”. Alte firme din acest segment sunt Dyna Robotics, Physical Intelligence, susținută de Jeff Bezos, și RLWRLD.
Sursa: TechCrunch