Google DeepMind lucrează la un nou concept de interacțiune cu inteligența artificială, o tehnologie bazată pe modelul Google Gemini, care promite să transforme cursorul computerului într-un instrument capabil să înțeleagă nu doar unde indică utilizatorul, ci și contextul în care o face, precum și intenția acestuia.
Potrivit cercetătorilor de la Google DeepMind, ideea urmărește eliminarea unuia dintre cele mai frustrante aspecte ale utilizării actuale a inteligenței artificiale: necesitatea de a întrerupe activitatea, de a deschide o fereastră separată pentru chatbot și de a explica acestuia în detaliu ceea ce se află pe ecran și ceea ce se dorește.
„Ne dorim exact opusul: o inteligență artificială intuitivă, care le oferă utilizatorilor toate instrumentele necesare, fără să le întrerupă fluxul de lucru”, au explicat reprezentanții Google DeepMind într-o postare pe blogul oficial.
Noua tehnologie permite utilizatorului să indice un element de pe ecran, formulând o comandă scurtă, adresată în limbaj natural. De exemplu, cursorul poate fi plasat peste un tabel pentru a genera automat un grafic circular, peste o rețetă pentru dublarea ingredientelor sau peste un document PDF pentru a obține un rezumat al acestuia, gata de utilizat într-un e-mail.
Într-un alt exemplu prezentat de companie, un cadru oprit dintr-un videoclip de călătorie poate deveni instantaneu un link de rezervare pentru restaurantul afișat în imagine.
Google DeepMind susține că sistemul folosește contextul vizual și semantic din jurul cursorului pentru a înțelege ce dorește utilizatorul, reducând semnificativ nevoia introducerii unor comenzi lungi și complicate.
Compania a prezentat deja două demonstrații experimentale disponibile în Google AI Studio, una pentru editare de imagini și alta pentru căutare pe hartă.
Tehnologia urmează să fie integrată și în browser-ul Google Chrome, unde utilizatorii vor putea selecta elemente de pe o pagină web și vor putea adresa întrebări către Gemini direct din browser, fără a mai deschide o interfață separată.
Printre exemplele oferite de Google se numără compararea automată a unor produse selectate de pe un site sau vizualizarea unei canapele într-o fotografie a propriei sufragerii.
În paralel, compania a anunțat că funcția „Magic Pointer” va fi disponibilă și pe Googlebook, noua gamă de laptopuri bazate pe Gemini, unde inteligența artificială va fi integrată direct la nivelul sistemului de operare.
Cercetătorii de la Google DeepMind spun că obiectivul este redefinirea modului în care oamenii interacționează cu dispozitivele digitale, într-un context în care utilizarea cursorului de mouse a rămas aproape neschimbată din anii ’80 și până acum.
„Construirea unei tehnologii care se adaptează comportamentului uman – și nu invers – deschide drumul către un viitor în care colaborarea cu inteligența artificială va părea intuitivă, fluentă și naturală”, au transmis reprezentanții Google DeepMind.
Sursa: Mediafax