L'assistent de Google ha fet un salt que canvia completament la relació amb el telèfon intel·ligent: Gemini ja no només respon preguntes, ara és capaç de controlar el mòbil i executar tasques complexes pel seu compte. La companyia el presenta com un agent que es mou entre aplicacions, ajusta opcions del sistema i completa processos llargs mentre l'usuari segueix a la seva.
Aquesta nova etapa de la IA agèntica a Android arranca de la mà dels Samsung Galaxy S26 i els Pixel 10, convertits en l'aparador d'una funció que apunta directament com utilitzarem el mòbil en els propers anys. De moment el desplegament es concentra als Estats Units i Corea del Sud, però l'impacte també es notarà a Europa, on fabricants i reguladors observen amb lupa com es gestiona el control del dispositiu, els permisos i la privadesa.
D'assistent a pilot automàtic del mòbil
Gemini ja pot actuar com un «pilot automàtic» del telèfon: l'usuari fa una ordre senzilla i la IA s'encarrega d'encadenar tots els passos necessaris. La idea de Google és clara: passar d'un assistent que contesta consultes a un agent que es remanga i fa la feina dins de les apps.
A la pràctica, això significa que Gemini es mou entre aplicacions, omple formularis, canvia ajustaments i completa fluxos de treball sense que l'usuari vagi tocant cada botó. Tot passa en segon pla: el mòbil es pot continuar fent servir amb normalitat mentre l'agent executa la tasca.
Google posa exemples molt quotidians per il·lustrar-ho. És possible demanar-li que feu una comanda a la pizzeria de sempre: la IA revisa el grup de família a l'app de missatgeria, identifica què vol cada persona i entra a l'aplicació de repartiment per tramitar la comanda. O sol·licitar-li que reservi una taula, compri unes entrades o gestioni una compra en línia en diversos passos.
La clau és que ja no cal anar saltant d'app a app. Gemini connecta aquests punts: obre l'aplicació adequada, navega pels menús, introdueix les dades i mostra el resultat final quan s'acaba. El que fins ara requeria uns quants minuts de tocs i menús pot quedar reduït a una ordre de veu o un missatge de text.
Per arribar-hi, Google ha dotat Gemini de agents especialitzats en tasques concretes, petits mòduls que s'encarreguen de gestionar àmbits específics (comandes, reserves, organització d'informació, ajustaments del sistema…) i que col·laboren entre ells per completar l'encàrrec.

Què pot fer Gemini quan controla el mòbil
Més enllà de l‟impacte mediàtic, l‟interès real d‟aquesta funció està en les tasques concretes. Segons Google, Gemini ja es pot encarregar de diversos tipus d'accions al telèfon, encara que amb límits clars en aquesta fase inicial.
- Gestió d'ajustaments del sistema: activar o desactivar opcions sense bussejar als menús. Només cal demanar que canvieu un permís, ajusteu la brillantor, modifiqueu opcions de connectivitat o altereu paràmetres més amagats.
- Extracció i organització d'informació: recopilar dades de diferents aplicacions (missatgeria, correu, agendes, apps de viatges) i presentar-les en un únic resum, sense que l'usuari hagi d'anar obrint cadascuna.
- Reserves i compres amb diversos passos: iniciar una reserva en un restaurant, un viatge en una app tipus Uber o una compra en línia, completant la cadena de pantalles necessàries. L'usuari manté la darrera paraula en pagaments i decisions sensibles.
- Automatització en segon pla: mentre Gemini treballa, el telèfon continua disponible. El procés es controla mitjançant notificacions dinàmiques, similars a les Live Activities d'altres sistemes, des de les quals es pot pausar o cancel·lar.
Google insisteix que cada acció es registra de forma visible: l'usuari pot revisar què ha fet la IA abans de confirmar canvis crítics o pagaments. No es tracta de fer-li un xec en blanc, sinó de delegar els passos mecànics mantenint la supervisió.
Per als qui s'emboliquen amb la configuració del mòbil, aquest enfocament suposa una ajuda important: Gemini pot convertir-se en el «arranjament» que configura el telèfon per ells, sense que hagin de memoritzar rutes de menús ni termes tècnics. Per als usuaris avançats, el guany està en el temps: automatitzar seqüències que abans feia uns quants minuts i molts tocs.
Tot i així, el sistema no és totpoderós. En aquesta fase inicial la compatibilitat amb aplicacions és parcial i moltes funcions depenen que els desenvolupadors adaptin les seves aplicacions perquè l'agent les manegi amb fiabilitat. A més, les regles de cada país i la botiga d'aplicacions condicionaran fins on pot arribar aquesta automatització.

Com protegeix Google el control del mòbil: finestra virtual, edat i permisos
Deixar que una IA controli el telèfon no és precisament un tema menor, ia Google ho saben. Per això han posat el focus en diversos mecanismes de seguretat. El més destacat és que totes les accions de Gemini s'executen dins d'una mena de «finestra virtual» aïllada dins del mòbil.
Aquest entorn funciona com una capa intermèdia: l'agent actua allà dins i no té accés lliure a la resta del sistema. Així es redueix el risc que una tasca concreta acabi obrint la porta a dades o funcions que no estaven previstes. Per a l'usuari, l'ideal és que l'experiència sigui transparent: veu el procés com si es fes a les aplicacions habituals, però tècnicament està encapsulat.
A més a més, Google ha posat un filtre d'edat. El control d'aplicacions per part de Gemini només s'activarà en comptes de Google de més de 18 anys. És una manera de limitar l'abast en dispositius utilitzats per menors, un punt especialment sensible a mercats europeus on la regulació de protecció de la infància és estricta.
També hi ha restriccions quant a quines aplicacions poden ser controlades. Almenys a l'arrencada, la funció es limitarà a un conjunt d'apps seleccionades, probablement aquelles on Google ha pogut validar millor el comportament de l'agent. La llista encara no s'ha detallat, però cal esperar que inclogui serveis de Google, missatgeria majoritària i algunes plataformes de lliurament i transport.
En paral·lel, es reforcen els controls de permisos i l'historial d'accions. L'usuari podrà revisar què ha fet exactament Gemini, des de quin ordre es va llançar fins a quines pantalles ha anat recorrent. I, sobretot, haurà de confirmar les operacions delicades: pagaments, canvis profunds a la configuració o accessos a dades molt sensibles.
On i quan arriba: Galaxy S26, Pixel 10 i el salt a altres Android
La nova capacitat que Gemini controli el mòbil arrenca en un nombre limitat de dispositius i països. Google ha triat com a aparador els nous Samsung Galaxy S26, S26+ i S26 Ultra, a més dels propers Pixel 10, que es converteixen així en la punta de llança d'aquesta estratègia.
En aquests models, Gemini s'integra com a agent de sistema capaç de gestionar tasques en segon pla, convivint amb altres funcions d'IA com Rodear para Buscar, que també ha rebut millores (per exemple, reconèixer diversos objectes alhora a la pantalla per mostrar resultats més rics o permetre provar roba virtualment).
El desplegament inicial se centrarà en Estats Units i Corea del Sud, dos mercats en què tant Samsung com Google solen estrenar les novetats més avançades. Ara com ara, la companyia parla d'una disponibilitat «molt aviat» en fase beta i sense data tancada per a una expansió global.
Per a Europa i Espanya, l?horitzó és més obert. L'arribada de Gemini com a agent que controla el mòbil dependrà de diversos factors: l'adaptació dels fabricants, l'encaix amb la regulació de dades (incloent-hi el RGPD), les normes sobre serveis de plataforma i la pròpia estratègia de Google amb els acords comercials locals.
Tot i així, el moviment apunta a una tendència que probablement veurem estendre's a la resta de marques Android el 2026. Google ja ha deixat caure que altres mòbils recents aniran incorporant aquestes capacitats de forma progressiva, cosa que obre la porta al fet que cada fabricant tingui el seu propi agent sobre la base de Gemini o altres IA.

Un canvi d'etapa als assistents mòbils i el que caldrà vigilar
Amb aquest pas, Google dóna per tancada l'etapa dels assistents clàssics i posa damunt la taula un nou model: de respondre a actuar. Enfront d'eines que es limitaven a executar ordres simples, ara l'aposta és que la IA es converteixi en un col·laborador capaç d'encarregar-se de processos complets.
El valor real daquesta proposta es mesurarà en el dia a dia. Caldrà veure com respon Gemini en fluxos complexos, quin nivell d'errors comet i quanta latència introdueix quan se li demana que encadeni diverses apps. També serà clau comprovar si els desenvolupadors de tercers adopten la integració necessària perquè els seus serveis funcionin sense ensopegades.
Un altre front delicat serà el de la privadesa i la confiança. Que una IA tingui capacitat per tocar gairebé qualsevol racó del mòbil obliga que els controls d'auditoria, els registres d'activitat i les opcions per limitar-ne l'abast siguin realment clars. L'usuari necessitarà saber què està passant, poder desactivar funcions i, si voleu, restringir el paper de l'agent a tasques molt concretes.
Paral·lelament, el mercat s'està omplint de propostes similars: cada gran fabricant prepara el seu propi agent intel·ligent per al mòbil. Això pot accelerar la innovació, però també generar certa confusió si cada sistema ofereix un nivell diferent de transparència i protecció. La manera com Google gestioni aquesta primera onada de Gemini com a controlador del mòbil marcarà el llistó per a la resta.
Si tot encaixa —compatibilitat suficient, controls clars i un comportament estable—, és probable que en poc temps ens acostumem a delegar a la IA moltes de les tasques que avui fem a mà al telèfon: des de configurar el WiFi fins a organitzar un viatge complet. I, com acostuma a passar en tecnologia, quan això passi serà fàcil oblidar que estrany que sonava al principi això que «Gemini controla ja el mòbil».

