Google I/O 2024: Acercándose a «Her» con Proyecto Astra y otras innovaciones en IA
Google I/O 2024 estuvo repleto de novedades, pero la que sin duda captó más atención fue el Proyecto Astra. Se trata de un prototipo de asistente digital que marca un acercamiento significativo a la interacción vista en la película «Her». Proyecto Astra, presentado por DeepMind, la división de inteligencia artificial de Google, tiene como objetivo convertirse en un asistente universal que acompañe a los usuarios en su día a día.
Ver también: ¡OpenAI desenmascara las imágenes falsas!
Pero Google no se quedó atrás solo con Proyecto Astra. La compañía también presentó avances en su familia de modelos de inteligencia artificial Gemini, diseñada para procesar texto, imagen, audio, vídeo y código. Entre las novedades de Gemini se encuentran la versión Gemini 1.5 Flash, con mayor velocidad, y Gemini 1.5 Pro, con capacidades mejoradas como la comprensión de código y la generación creativa de formatos de texto.
Aquí te cuento algunas de las novedades más destacadas de la presentación de Google:
- Proyecto Astra: Un asistente de IA multimodal
Proyecto Astra es la apuesta de Google para el futuro de los asistentes inteligentes. Este prototipo puede comprender el entorno, responder preguntas, identificar objetos, e incluso generar creaciones a partir de instrucciones de audio. Lo que más llama la atención es su capacidad de procesar información en tiempo real a través de diferentes formatos, como texto, imagen y audio, similar a como interactúan los personajes en la película «Her».
Además, Proyecto Astra no se limitará a los teléfonos móviles. La idea es integrarlo en diversos dispositivos, como gafas inteligentes, para ofrecer una experiencia aún más inmersiva. Google planea incorporar algunas de las funcionalidades de Proyecto Astra en la aplicación Gemini a finales de este año.
- Gemini se fortalece y llega a Ask Photos
La familia de modelos Gemini recibió un impulso importante en Google I/O. Se presentó Gemini 1.5 Flash, una versión mejorada con mayor velocidad y rendimiento. También se dieron a conocer las novedades de Gemini 1.5 Pro, que ahora puede comprender código y generar formatos de texto creativos. Por otro lado, Gemini Nano se actualizó con la capacidad de detectar estafas telefónicas en tiempo real analizando patrones de conversación.
Ver también: Lavado verde vs. Silencio verde: ¿Trampa o Transparencia?
Pero la influencia de Gemini va más allá. Google anunció Ask Photos, una nueva función que permitirá a los usuarios realizar búsquedas inteligentes en sus fotos usando lenguaje natural. Ask Photos se apoya en la comprensión de la IA del contenido de las imágenes y otros metadatos para ofrecer resultados más precisos y naturales.