Així funcionen els nous resums d'àudio amb IA a Google Docs

  • Google integra Gemini a Docs per generar resums d'àudio breus i naturals de documents.
  • La funció s'activa des del menú Eines > Àudio > Escoltar resum del document.
  • Els resums es poden personalitzar amb diferents veus i velocitats, i són útils per a treball, estudi i accessibilitat.
  • Ara com ara només està disponible per a plans de pagament empresarials i educatius de Google Workspace i Google AI.

resums d'àudio a Google Docs

Google està fent un nou pas en la integració de la intel·ligència artificial a la seva suite ofimàtica amb una funció que pot canviar la manera com moltes persones es relacionen amb els documents de text. A partir d'ara, Google Docs és capaç de generar i reproduir resums d'àudio dels documents utilitzant Gemini, el seu assistent d'IA.

En lloc d'haver de llegir pàgines i pàgines, l'usuari pot escoltar una sinopsi parlada d'uns quants minuts que destaca els punts essencials del fitxer, fins i tot quan es treballa amb diverses pestanyes al mateix document. És una eina pensada per estalviar temps i facilitar la comprensió del contingut, tant a nivell professional com acadèmic.

Nova funció de resums d'àudio a Google Docs

La novetat arriba integrada directament a l'editor de text de Google, dins de Google Drive, i es recolza en la tecnologia de Gemini. Aquests resums dàudio ofereixen una breu «radiografia» verbal del document, condensant la vostra informació més rellevant en un format fàcil d'escoltar mentre es realitzen altres tasques.

Google detalla que la durada habitual daquests resums és dun parell de minuts, encara que pot variar en funció de lextensió i la complexitat del contingut. La locució es realitza amb un to natural, molt similar a la veu que ja utilitza Gemini en la seva pròpia aplicació, cosa que ajuda a fer que l'experiència sigui més còmoda que una simple lectura robòtica.

Aquesta característica complementa el lector de documents que Docs ja va incorporar anteriorment, també basat en IA, que és capaç de narrar el contingut íntegre. La diferència clau és que ara no es reprodueix tot el text, sinó una síntesi pensada per posar-se ràpidament al dia sense necessitat de recórrer el document de principi a fi.

Segons explica la companyia al bloc, la intenció és que l'usuari pugui «posar-se al dia ràpidament» gràcies a una sinopsi parlada que resumeixi les parts més importants del document. D'aquesta manera, es faciliten tant la revisió d'informes extensos com el repàs de notes abans d'una reunió.

Com activar els resums dàudio pas a pas

L'accés a aquesta nova eina es fa des del mateix menú de Google Docs, sense necessitat d'instal·lar complements externs. El procés d'activació és senzill i està pensat perquè qualsevol usuari el pugui fer servir sense coneixements tècnics.

Per escoltar un resum d'àudio d'un document a la versió web de Google Docs, cal seguir aquests passos:

  1. Obrir el document desitjat a Google Docs.
  2. Anar a menú Eines a la barra superior.
  3. Seleccionar l'opció Audio.
  4. Fer clic a Escoltar resum d'aquest document.

Un cop activada l'opció, apareix un petit reproductor amb línia de temps integrat a la interfície, des del qual es pot iniciar, pausar o avançar en el resum de veu. En qüestió de segons, la IA genera la síntesi i comença la reproducció.

El funcionament està dissenyat perquè l'usuari pugui continuar treballant al document o en altres pestanyes mentre escolta el resum. L'experiència s'assembla a un pòdcast molt breu que resumeix el contingut clau, una cosa especialment pràctica quan el temps és limitat.

Opcions de personalització: veus, estils i velocitat

Més enllà de reproduir un àudio estàndard, Google permet ajustar lexperiència descolta. Si necessiteu millorar la qualitat de l'àudio, consulteu com treure el soroll de fons. Els resums generats amb Gemini es poden personalitzar escollint entre diferents veus i estils de locució, la qual cosa ajuda a adaptar-los a diferents necessitats o preferències.

Entre els estils disponibles s'inclouen opcions com narrador, persuasiu o coach, orientades a diferents usos: des d'una explicació neutra i descriptiva fins a un to més motivador o enfocat a la formació. Aquesta varietat pot ser útil, per exemple, en preparar presentacions o materials educatius.

A més, l'usuari té la possibilitat de modificar la velocitat de reproducció. Qui prefereixi anar més ràpid pot accelerar l'àudio per consumir la informació en menys temps, mentre que els qui necessitin un ritme més pausat poden alentir-lo per facilitar l'assimilació de conceptes.

Aquesta personalització contribueix a fer que l'eina no es limiti a un únic mode d'ús. S'adapta tant a persones que volen un repàs ràpid abans d'una reunió com a les persones que utilitzen l'àudio com a suport per a l'estudi o la revisió de documents més complexos.

Qui pot fer servir els resums d'àudio amb IA

Tot i que el desplegament té abast global, la funció encara no està oberta a tothom. Google ha començat a activar els resums d'àudio de manera gradual, amb un calendari dextensió daproximadament dues setmanes des de linici del llançament.

Ara com ara, l'accés està limitat a clients de pagament de Google Workspace i dels plans específics d'IA de la companyia. Entre els perfils que ja poden utilitzar aquesta novetat hi ha:

  • Usuaris de Google Workspace Business Standard i Business Plus.
  • Comptes Enterprise Standard i Enterprise Plus.
  • Subscriptors del complement Google AI Ultra for Business.
  • Centres educatius amb el complement Google AI Pro for Education.
  • Usuaris amb subscripcions Google AI Pro i Google AI Ultra.

A la pràctica, això significa que la major part dels qui ja paguen per funcions avançades de Google en entorns empresarials o educatius tindran accés prioritari. Com ha passat amb altres eines d'IA de la companyia, no es descarta que més endavant pugui arribar, almenys de manera limitada, a comptes gratuïts, encara que de moment no hi ha un calendari oficial.

En el context europeu, on moltes organitzacions treballen amb Google Workspace sota marcs de compliment normatiu estrictes, aquesta funció se suma al conjunt de ferramentes orientades a millorar la productivitat sense necessitat d'abandonar els fluxos de treball ja consolidats a empreses, universitats i administracions.

Usos pràctics en treball, estudis i accessibilitat

Més enllà de l‟impacte tecnològic, l‟interès d‟aquests resums d‟àudio està en els casos d‟ús quotidians. L'eina està pensada per als que necessiten extreure allò essencial d'un document sense llegir-lo íntegrament, una cosa molt comuna en entorns doficina i en làmbit acadèmic.

A la feina, un professional pot utilitzar el resum d'àudio per repassar informes llargs abans d'una reunió, escoltar els punts clau dun document de diverses pestanyes o posar-se al dia amb notes compartides per lequip sense dedicar temps a la seva lectura completa. Això és especialment útil quan es gestionen diversos projectes alhora.

A l'entorn educatiu, estudiants d'universitat o de formació professional poden recórrer a aquesta funció per escoltar la síntesi d'apunts extensos o treballs de recerca mentre es desplacen amb transport públic o realitzen altres tasques. El format sonor pot ajudar, a més a més, a fixar millor els conceptes clau.

L'eina també té un vessant daccessibilitat. Persones amb dificultats de visió, fatiga visual o que senzillament prefereixen un enfocament auditiu es poden beneficiar d'aquests resums com a alternativa a la lectura contínua en pantalla. Es tracta d'una opció que amplia les maneres de consumir la informació, una cosa rellevant a Europa, on la normativa sobre accessibilitat digital és cada cop més exigent.

A tots aquests escenaris, la combinació d'un àudio breu, veus personalitzables i control de velocitat permet adaptar el resum a l'estil d'aprenentatge i al ritme de cada usuari, sense canviar de plataforma ni sortir de Google Docs.

Gemini dins de Google Docs: molt més que àudio

La incorporació dels resums de veu arriba acompanyada d'altres capacitats de Gemini ja integrades a Docs. A més, Gemini està arribant a altres dispositius com Google TV. L'assistent d'IA funciona com un xat incrustat a l'editor de text, des del qual es poden llançar peticions en llenguatge natural per automatitzar tasques habituals.

Entre les eines disponibles, una de les més utilitzades és la generació d'esborranys. L'usuari pot demanar a Gemini que redacti un text inicial sobre un tema concret, que ampliï una secció del document o que proposi una introducció a partir d'unes poques indicacions.

Una altra funció rellevant és la reescriptura. És possible ajustar el to d'un paràgraf, fer-lo més formal o més proper, escurçar-lo o desenvolupar-lo segons les necessitats. Això és útil tant per a correus corporatius com per a documents interns, presentacions o materials de formació.

A més, Gemini pot generar resums de text en format escrit, elaborar llistes d'idees, proposar estructures per a presentacions o convertir conceptes dispersos en taules i esquemes més organitzats. La intenció de Google és que l'usuari no només escolti un resum del que ja ha escrit, sinó que també pugui recolzar-se a la IA per planificar, redactar i polir els documents.

En conjunt, aquestes funcions situen Google Docs com una plataforma de treball on la intel·ligència artificial s'integra al flux diari, sense obligar a saltar a altres aplicacions o serveis externs per a tasques de redacció i organització de continguts.

Amb l'arribada dels resums d'àudio generats per Gemini, Google reforça la seva aposta per convertir Docs en una eina més versàtil i adaptable a ritmes de treball diferents. Escoltar una síntesi verbal d'un informe o uns apunts en pocs minuts pot marcar la diferència quan el temps escasseja, i encaixa amb una tendència clara: gestionar la informació de manera més àgil, sense renunciar a la precisió en els continguts.

Gemini 3 Flash
Article relacionat:
Gemini 3 Flash: el model ràpid de Google que s'imposa a la cursa de la IA