Este martes, Google llevó a cabo el muy anticipado lanzamiento de sus nuevos teléfonos Pixel, auriculares y un smartwatch. A pesar de que no hubo mucha sorpresa en los dispositivos debido a las amplias filtraciones, la firma de Mountain View logró asombrar con las innovadoras funciones de inteligencia artificial incorporadas.
Una de las características más anheladas es el nuevo mode de chat de voz para Gemini, conocido como Gemini Live. Esta herramienta de vanguardia se mostró en la conferencia anual de desarrolladores de Google en mayo y ahora se incorpora a los dispositivos, aunque no a todos.
Google explicó en su presentación que Gemini Live estará accesible solo para los suscriptores de Gemini Advanced y únicamente en inglés.
Pero, ¿cómo funciona Gemini Live, el revolucionario modo de voz impulsado por la IA de Google? Al igual que la función de chat de voz de ChatGPT, este servicio permite a los usuarios comunicarse con su móvil de forma natural.
Involucra un estilo de conversación que permite interrumpir una respuesta a mitad de camino o pausar la conversación y retomarla luego, todo sin necesidad de presionar un botón. Gemini Live también puede operar en segundo plano o incluso cuando el teléfono está bloqueado.
Esta IA dispone de una variedad de voces para seleccionar: 10 nuevas. A diferencia de las funciones anteriores, es una IA multimodal; es decir, no solo comprende texto, sino también voz e imágenes, y posiblemente video en un futuro próximo.
Por lo tanto, con esta nueva IA, uno podría hablar con su teléfono en lenguaje cotidiano y hacer solicitudes como si se estuviera dialogando con un humano. A modo de ilustración, ya no necesitarías dar instrucciones estructuradas para solicitarle a Google Assistant que te programe una cita para el dentista; podrías pedirlo de manera natural.
Una de las ventajas de esta inteligencia artificial es su capacidad para entender el contexto y, por lo tanto, tomar en cuenta la información aportada por las múltiples aplicaciones de tu móvil, como el email. Gemini, al fusionar datos de la web con herramientas y aplicaciones de Google ya en uso, asistirá con tareas de todos los tamaños sin necesitar cambiar entre diferentes servicios y apps, a diferencia de otros asistentes virtuales.
Además, al ser capaz de interpretar una imagen, puede extraer datos de un archivo que se le comparte. Google anticipa que con la futura extensión de Calendario, será posible tomar fotos de un cartel de un concierto, por ejemplo, y consultarle a Gemini si ese día está libre o incluso programar un recordatorio para la compra de entradas.
Google anuncia que próximamente habrá nuevas extensiones como Keep, Tasks, Utilidades y funciones ampliadas en YouTube Music. La compañía indica que los asistentes digitales han servido durante años para establecer alarmas, reproducir música y administrar nuestros hogares inteligentes. Añaden que estas tecnologías facilitaron las tareas cotidianas y ahorran valiosos minutos cada día. Con la inteligencia artificial generativa, Google promete ofrecer asistencia con actividades complejas que pueden liberar horas.
Este nuevo servicio ya ha comenzado a ser instalado en dispositivos Android, aunque actualmente sólo está disponible en inglés. Google asegura que estará disponible en iOS y en otros idiomas «en las próximas semanas».