Google anunció oficialmente Gemini 3.5 Live Translate el 9 de junio de 2026, un modelo de inteligencia artificial capaz de realizar traducciones de voz a voz en tiempo casi real para más de 70 idiomas. Esta herramienta promete transformar la manera en que nos comunicamos con personas de otras culturas.
A diferencia de los sistemas tradicionales que esperan a que termines de hablar para procesar la frase, este nuevo modelo opera como un sistema de transmisión continua. Esto significa que la IA genera voz traducida constantemente, manteniéndose solo unos segundos detrás del hablante original. El sistema está diseñado con robustez ante el ruido, lo que lo hace útil para entornos del mundo real como calles concurridas o aeropuertos.
La tecnología destaca por preservar la entonación, el ritmo y el tono del hablante original. Además, el modelo soporta más de 2,000 combinaciones de idiomas, lo que elimina la necesidad de enrutar las traducciones a través del inglés.
La disponibilidad varía según el tipo de usuario. Para usuarios particulares, la actualización se está desplegando gradualmente en Google Translate para iOS y Android. La integración en Google Meet ocurrirá en una etapa posterior. Clientes selectos de Google Workspace en México podrán participar en una vista previa privada a partir de junio de 2026, con un despliegue masivo previsto para finales de año.
Para garantizar la confianza del usuario, Google ha integrado SynthID en el audio generado por Gemini 3.5 Live Translate. Esta tecnología permite identificar que el contenido de audio ha sido producido por inteligencia artificial.
Los desarrolladores que deseen experimentar con la tecnología pueden acceder al modelo en modo vista previa a través de Gemini Live API y Google AI Studio.







