La nova generació de models de Google fa un gir interessant amb l'arribada de Gemini 3 Flash, una variant que busca trencar la idea que la velocitat sempre va renyida amb la intel·ligència. Aquest model s'estrena com a opció principal al ecosistema de Google i s'orienta tant a usuaris corrents com a empreses i desenvolupadors.
Amb aquesta aposta, Google intenta consolidar la seva posició a la competència directa amb OpenAI i Bard i altres actors del sector, recolzant-se en un model que manté gran part de les capacitats de raonament de Gemini 3 Pro, però amb respostes molt més ràpides, un consum de recursos més ajustat i un preu que el fa atractiu per a desplegaments massius, també a Europa.
Què és Gemini 3 Flash i com encaixa a la família Gemini
Gemini 3 Flash és la versió més lleugera i veloç de la família Gemini 3, dissenyada sobre la mateixa base tecnològica que Gemini 3 Pro i Gemini 3 Deep Think, però optimitzada per oferir latències molt baixes i costos menors sense renunciar a un raonament avançat. A la pràctica, ve a substituir Gemini 2.5 Flash com a model ràpid de referència.
Google explica que aquest model és capaç de modular “quant pensa” segons la tasca: pot dedicar més passos de raonament quan la petició és complexa o reduir aquest esforç per a consultes senzilles, cosa que es tradueix en un ús més eficient dels recursos.
En trànsit real, la companyia afirma que Gemini 3 Flash consumeix al voltant d'un 30% menys de tokens que Gemini 2.5 Pro per resoldre tasques quotidianes amb una precisió alta, cosa que resulta rellevant per als qui depenen de la facturació per volum de tokens en aplicacions intensives.
A més de la rapidesa, manté capacitats completes de IA multimodal: pot treballar amb text, imatges i vídeo, analitzar contingut complex, extreure'n dades i respondre preguntes visuals exigents, cosa que el converteix en una opció versàtil per a múltiples casos d'ús.

Rendiment i benchmarks: així es compara amb GPT-5.2 i altres models
El terreny dels benchmarks no ho és tot, però sí que ofereix una referència clara per comparar models. En aquest apartat, les dades publicades per Google i per anàlisis externes situen a Gemini 3 Flash en una posició molt competitiva, especialment cridanera si es té en compte que és un model ràpid.
A SimpleQA Verified, una prova de preguntes de coneixement verificades, Gemini 3 Flash arriba al voltant d'un 68,7 %, molt per sobre del 38,0 % de GPT-5.2 Extra High (el nivell de raonament màxim de la família GPT-5.2 segons la nomenclatura interna xhigh d'OpenAI). Aquesta diferència el col·loca com una opció especialment sòlida a consultes de coneixement factual.
En raonament multimodal avançat (MMMU-Pro), el model de Google aconsegueix un 81,2%, situant-se per sobre tant de GPT-5.2 Extra High com d'altres models d'avantguarda com Claude Sonnet 4.5. A Video-MMMU, orientat a l'anàlisi de vídeo, també treu avantatge amb un 86,9 % davant el 85,9 % de GPT-5.2 Extra High, cosa que reforça el seu perfil per a tasques audiovisuals complexes.
Les proves multilingües i culturals també en són un dels punts forts. A Global PIQA, que mesura el sentit comú en més de 100 idiomes, obté un 92,8 % davant el 91,2 % de GPT-5.2 Extra High. Google subratlla que Flash està especialment optimitzat per captar matisos fora de l'anglès, cosa rellevant per a mercats com Espanya i la resta d'Europa.
En l'ús d'eines i agents, Gemini 3 Flash torna a situar-se al davant a Toolathlon, amb un 49,4 % davant d'un 46,3 % del model avançat d'OpenAI, i manté un avantatge lleuger a la FACTS Benchmark Suite, amb 61,9 % davant de 61,4 %. És a dir, no només respon ràpid, sinó que també mostra consistència en fluxos de treball on intervenen múltiples eines.

On brilla i on segueix darrere del raonament “pur”
Tot i aquests resultats, és important matisar el panorama. En els tests més centrats en raonament lògic extrem o endevinalles d'alt nivell, GPT-5.2 Extra High continua al capdavant. Per exemple, a ARC-AGI-2, una prova enfocada a endevinalles visuals complexes, el model d'OpenAI arriba a un 52,9 % davant el 33,6 % de Gemini 3 Flash.
En entorns on l'execució de codi al límit és determinant, la diferència és més petita, però continua present. A OBJECTIU 2025 amb execució de codi, GPT-5.2 Extra High arriba al 100%, mentre que Gemini 3 Flash es queda al voltant del 99,7%, una distància petita però existent. A SWE-bench Verified, orientat a la resolució de tasques d'enginyeria de programari, el model d'OpenAI obté un 80,0 % davant el 78,0 % del model de Google.
La lectura que fa Google és que Flash no pretén ser el “rei absolut” del raonament pur, sinó oferir un equilibri diferent: raonament de nivell professional molt proper al dels models més grans, però amb latències molt baixes i un cost molt més manejable.
Una altra xifra que destaca la companyia és el seu rendiment en proves de coneixement d'alt nivell, com ara Diamant GPQA, on obté un 90,4%, i Humanity's Last Exam, amb un 33,7% sense eines. Són resultats que, segons Google, el posen al nivell de models de frontera més grans, cosa poc habitual en una variant ràpida.
A la pràctica, per a la majoria de tasques del dia a dia i casos d'ús empresarials habituals, aquestes diferències als extrems del raonament passen a un segon pla davant de la velocitat i l'eficiència en costos, que és on Flash vol marcar la diferència.
Integració a Google Search i l'app de Gemini
Un dels canvis més visibles per als usuaris és que Gemini 3 Flash es converteix en el motor per defecte del Mode IA de Google Search i de la pròpia app de Gemini, tant a escriptori com a mòbils. En altres paraules, quan algú activi o utilitzi el mode de cerca amb IA a Google, serà aquest model el que estigui responent per darrere en la majoria de casos.
A les cerques, això es tradueix en respostes més elaborades i ràpides davant de consultes llargues o amb múltiples condicions. Google posa com a exemple peticions complexes del tipus “plans nocturns a una ciutat per a pares amb nens petits”, on el model ha de tenir en compte diversos matisos alhora i oferir resultats raonats.
La companyia assegura que el Mode IA amb Gemini 3 Flash és més potent per captar els matisos de cada consulta, combinar informació en temps real (incloent-hi dades locals) i presentar respostes visualment més fàcils de digerir, amb resums estructurats i enllaços rellevants.
A Espanya i la resta d'Europa, el desplegament del Mode IA s'està fent de manera progressiva, condicionat també per les normatives de protecció de dades i les exigències del marc regulador europeu. Tot i així, Google ha deixat clar que la intenció és portar Flash al major nombre possible de mercats, mantenint ajustaments regionals quan sigui necessari.
A l'app de Gemini, el canvi també és evident: en obrir el selector de models apareix la família Gemini 3 amb tres opcions principals: “Ràpid” (Gemini 3 Flash), “Pensar” (manera orientada a problemes complexos) i “Pro” (per a tasques avançades de programació i matemàtiques). Per a la majoria de converses, lopció marcada per defecte serà la ràpida.

Canvis en l'experiència mòbil i l'ús quotidià
Al marge dels números, un dels punts on més es nota Gemini 3 Flash és a la sensació immediatesa en utilitzar l'app de Gemini o el Mode IA al mòbil. El model respon amb molta menys latència, cosa que redueix el temps d'espera fins i tot quan la consulta té una certa complexitat.
Google també ha ajustat la manera com la IA interactua amb el contingut de la pantalla en Android. Abans calia prémer un botó per “compartir pantalla"amb Gemini; ara, només cal dir alguna cosa com "explica'm això" perquè l'assistent analitzi directament el que s'està veient i ofereixi una resposta contextual, cosa que a Espanya ja està començant a veure's en alguns dispositius".
Les capacitats multimodals millorades fan possible que es puguin carregar vídeos, imatges o documents extensos i demanar a Gemini 3 Flash resums, extracció de dades o explicacions detallades. Fins i tot pot analitzar vídeos en temps real mentre s'estan reproduint, sense esperar que s'acabin.
En l'àmbit de l'entreteniment, Google posa el focus en usos com a videojocs amb baixa latència i personatges no jugables que poden conversar de manera coherent i sense retards apreciables gràcies a la baixa latència. Aquest tipus dexperiència és especialment sensible a qualsevol demora, per la qual cosa un model ràpid resulta clau.
Per a l'usuari mitjà, més enllà de les mètriques, es notarà que la IA “va més solta”: respon abans, manté millor el fil de la conversa i suporta peticions més llargues sense que l'espera es faci pesada. La percepció de fluïdesa sol ser determinant perquè les persones adoptin aquestes eines a la seva rutina diària.
Disponibilitat a Espanya, Europa i accés per a desenvolupadors
Google està desplegant Gemini 3 Flash de manera global i el presenta com un model sense restriccions específiques per país pel que fa a l'accés bàsic des de l'app de Gemini. Això significa que els usuaris d'Espanya i de la Unió Europea poden utilitzar-lo ja com a model predeterminat a l'app ia la versió web, sempre que el servei de Gemini estigui disponible a la vostra regió.
A més, la línia Flash porta temps sent la més utilitzada per desenvolupadors. Els models Gemini 2 i 2.5 Flash ja processaven bilions de tokens a centenars de milers d'aplicacions; amb Gemini 3 Flash, Google vol que no s'hagi de triar entre velocitat i intel·ligència a l'hora de dissenyar nous productes.
Per a entorns de desenvolupament, el model s'està desplegant a través de l'API de Gemini a Google AI Studio, CLI de Gemini, Android Studio i altres eines com Google Antigravity. En el plànol corporatiu, els clients poden accedir a Gemini 3 Flash a través de Vèrtex AI, la plataforma empresarial de Google Cloud.
Aquest enfocament apunta a un escenari on la IA de Google estigui integrada “a cada racó del dia a dia digital”: des d'aplicacions mòbils i webs fins a eines internes de treball, passant per sistemes d'atenció al client, assistents a plataformes de comerç electrònic o solucions específiques del sector públic a Europa.
En el cas concret d'Espanya, Google ha destacat que el país es troba entre els mercats on el desplegament de Gemini està anant especialment ràpid, de manera que usuaris i empreses locals podran aprofitar abans aquestes noves capacitats, sempre dins dels límits que marqui la regulació europea.
Preus, eficiència de tokens i ús empresarial
Gemini 3 Flash no és el model més barat del catàleg de Google, però es posiciona com un dels més eficients en relació cost-rendiment. Per als que integrin l'API als seus serveis, el preu anunciat és de 0,50 dòlars per milió de tokens d'entrada i 3 dòlars per milió de tokens de sortida, amb una entrada d'àudio fixada a 1 dòlar per milió de tokens.
Davant Gemini 2.5 Flash, s'aprecia una lleugera pujada de tarifes (abans 0,30 dòlars per milió de tokens d'entrada i 2,50 per milió de sortida), encara que Google sosté que el model compensa amb la seva major eficiència: utilitza al voltant d'un 30% menys de tokens que Gemini 2.5 Pro en fluxos típics estalvi global en facturació depenent del tipus dús.
Aquesta combinació de velocitat i cost raonable fa que Flash estigui especialment orientat a fluxos de treball d'alta freqüència: assistents dins d'apps, sistemes de suport al client, automatització de processos empresarials, anàlisi de grans volums de dades o aplicacions creatives que requereixen moltes trucades a l'API.
Per a moltes companyies europees que es plantegen quin model triar, el rendiment de primera línia que ofereix Flash resulta atractiu: no arriba als màxims absoluts de raonament de Pro o d'alguns rivals, però ofereix un rendiment de primera línia a la majoria de mètriques rellevants amb un cost assumible.
En paral·lel, Google manté Gemini 3 Pro disponible com a opció per a tasques que exigeixen eines interactives avançades, visualitzacions complexes o generació d'imatges d'alta qualitat, donant cert marge perquè cada organització combini models segons la sensibilitat dels casos d'ús.
Amb l'arribada de Gemini 3 Flash, Google reforça la seva estratègia de portar la intel·ligència de nova generació a més persones i més productes, apostant per un model que demostra que la rapidesa i l'escalabilitat no han d'anar renyides amb un bon raonament. Per a usuaris i empreses a Espanya i Europa, el resultat és una IA més present al cercador, al mòbil ia les eines de treball, amb temps de resposta molt reduïts, capacitats multimodals millorades i un cost que permet pensar en desplegaments a gran escala sense perdre de vista els requisits reguladors i de confiança que exigeix el mercat europeu.
