noviembre 13, 2025
Mientras llegan Gemini 3 y Nano Banana 2, Google ha mejorado lo que hace más natural a su IA: la voz

Mientras llegan Gemini 3 y Nano Banana 2, Google ha mejorado lo que hace más natural a su IA: la voz

Tomado de https://www.xatakandroid.com/feed

Estamos a poco tiempo de ver las grandes renovaciones en la IA de Google: los modelos Gemini 3 y el esperado salto adelante en la herramienta de generación de imágenes, Nano Banana 2. Mientras tanto, Google ha decidido impulsar una de las funciones más útiles en el móvil: Gemini Live. Las voces reciben una esperada mejora.

Voces más naturales. Gemini Live es el asistente por voz de la IA de Google. Admite diez voces diferentes, cada una con su propia personalidad, tono y entonación. La empresa consiguió desde el inicio unas voces muy naturales, aunque pecaban de cierta robotización. Se notaba que el hilo de la conversación no siempre fluía de forma adecuada.

10 APLICACIONES de GOOGLE que PODRÍAN HABER TRIUNFADO

Según ha confirmado Google, Gemini Live mejora en la conversación para que su IA sea más empática y menos robótica. Esto afecta a las entonaciones y a los dejes característicos del tono que terminan haciendo humana a una voz. Sin llegar a tanto, lo cierto es que el cambio supone un claro paso adelante.


Imagen de Google

Demasiado entusiasta. El esfuerzo puesto por Google en hacer menos robótico su TTS (la herramienta que convierte el texto en voz sintética) es notable. Se aprecia nada más abrir Gemini Live: la IA responde alegre, con energía, cargada de entusiasmo. Y aquí es donde choca con la realidad: algunas voces le ponen demasiado entusiasmo.

Funciones mejoradas. Aparte del esfuerzo en naturalidad y empatía, las voces de Gemini han aprendido nuevos trucos y mejorado otros. El aprendizaje de idiomas es uno de sus refuerzos: la experiencia con la IA es más enriquecedora y educativa. Además, puede modular el tono con acentos. Como el británico y el de Nueva York, por ejemplo. No es perfecto, pero se acerca.

Escuchar historias mucho más inmersivas gracias al mayor esfuerzo en la entonación, tono más didáctico en las explicaciones y, como señalaba, mucha más empatía: Gemini sube un importante escalón en humanidad. Se echaba de menos.

Ya disponible. No hay que actualizar la aplicación de Gemini ni contar con suscripciones: los nuevos modelos de voz ya están disponibles en el móvil y en la web. Con los límites habituales dentro de cada plan.

Imagen de portada | Iván Linares editada con ChatGPT

En Xataka Android | Para encontrar gasolina barata usaba una app en Android Auto. Ahora me basta con el nuevo Gemini

Tomado de https://www.xatakandroid.com/feed