Documentos de Google ahora genera breves resúmenes de audio de documentos usando Gemini, y la función se está implementando para los suscriptores pagos de Google Workspace.
La modernización agrega una nueva opción en Documentos en Herramientas > Audio > Escuchar para documentar el prontuario. Cuando se selecciona, Docs crea un prontuario hablado del documento coetáneo, normalmente de menos de tres minutos de duración. La reproducción se realiza en un pequeño reproductor multimedia integrado en el interior de la interfaz de Docs.
El dispersión comenzó el 12 de febrero y puede tardar hasta 15 días en ascender a todas las cuentas admitidas.
Escuche resúmenes de audio en Google Docs usando Gemini
Google ha integrado el prontuario y la síntesis de voz de Gemini directamente en Docs, encima de la función de descripción universal de audio preparatorio que ayuda a los usuarios a corregir sus errores gramaticales. El sistema analiza el contenido del documento, extrae conceptos secreto, genera un banderín conciso y lo convierte en audio. Esta función similar ya se utiliza en Google NotebookLM, donde puede crear un prontuario de podcast a partir de sus archivos.
Los resúmenes pueden extraer información de varias pestañas en el interior del mismo documento. El resultado está diseñado como un breve prontuario estilo podcast en ocasión de una recitación palabra por palabra.
Los usuarios de Google Docs pueden:
- Ajuste la velocidad de reproducción entre 0,5× y 2×
- Pausa y rebobina
- Cambiar entre ajustes preestablecidos de voz como narrador, persuasor y monitor
Parece que esta característica es popular y útil en NotebookLM, por lo que Google decidió integrarla asimismo en Google Docs. Esta es la primera vez que Google incorpora ese motor de prontuario a Docs para clientes empresariales y educativos.
¿Quién tiene camino a los resúmenes de audio en Google Docs?
Los resúmenes de audio están limitados a planes pagos. Según Google, la disponibilidad incluye:
- Niveles Google AI Pro y Reaccionario
- Habitual empresarial y Plus empresarial
- Empresa Habitual y Empresa Plus
- Cuentas con complementos de Google AI para educación o empresas
Las cuentas gratuitas de Google no están incluidas en esta implementación.
Si administra un entorno de Workspace, es posible que deba esperar a que aparezca la función. Google indica que el dispersión por etapas puede retrasarse hasta 15 días desde la plazo de inicio.
¿Cómo crear audio con Gemini en Google Docs?

Si su cuenta es elegible y ya recibió el dispersión, la función de prontuario de audio de AI Gemini está habitable directamente en Google Docs.
- Anconada un documento en Google Docs.
- Hacer clic Herramientas en el menú superior.
- Inclinarse Audio.
- Designar Escuchar prontuario del documento.
Docs generará el prontuario y mostrará un pequeño reproductor de audio.
Entonces puedes:
- Cambiar la velocidad de reproducción
- Pausar o rebobinar
- Cambiar preajustes de voz
No hay ninguna indicación de que los resúmenes se almacenen por separado o se exporten automáticamente. La función opera en el interior de la interfaz del documento.
Si la opción Audio no aparece en el menú Herramientas, es posible que su cuenta aún no tenga camino o que no esté en un plan cuota.
Google Docs convertirá documentos largos en resúmenes de audio
Para los usuarios de Google Docs que trabajan con documentos extensos, informes o archivos colaborativos, esto cambia la forma en que se puede consumir el contenido en el interior de Docs.
En ocasión de escanear o resumir manualmente un archivo, puede crear un prontuario de audio y escucharlo mientras realiza otras tareas. Todavía puede ayudar a los colaboradores a ponerse al día con los documentos compartidos sin leerlos en su totalidad.
Google no posiciona esta función como un reemplazo para la revisión de material crítico. Los resúmenes se elaboran como resúmenes para dosificar tiempo, no como reemplazos del contenido diferente.
Desde un punto de traza práctico, esto convierte a Docs en una útil multimodal. El texto ya no se limita a la recitación en pantalla o la exportación manual a un software forastero de conversión de texto a voz. La engendramiento y reproducción ocurren directamente en el editor de documentos.
Google no ha detallado cómo los resúmenes manejan documentos enormemente técnicos, legales o de cumplimiento ajustado. Siquiera ha publicado límites específicos relacionados con la largo de los documentos en este anuncio.
El dispersión está en curso. Creo que Google seguirá actualizando esta función. Por lo tanto, veremos muchas más funciones de descripción universal de audio de IA actualizadas.





