Google lanzó tres nuevas versiones de Gemini, una IA que pretende desbancar a ChatGPT. Este es el primer paso para volver a la tecnología un ser consciente.
Google lanzó esta mañana Gemini, un modelo de Inteligencia Artificial (IA) multimodal que puede generar y comprender, operar y combinar diferentes tipos de información. Esto incluye texto, imágenes, audios, videos y lenguajes de programación, según un comunicado de la compañía.
Alphabet decidió optimizar Gemini 1.0, la primera versión de esta herramienta IA, y adecuarla a tres tamaños diferentes:
De acuerdo con Demis Hassabis, director ejecutivo y cofundador de Google DeepMind, el modelo Ultra, superó los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje grande (LLM).
“Nuestro nuevo enfoque de referencia para MMLU permite a Gemini utilizar sus capacidades de razonamiento para pensar más detenidamente antes de responder preguntas difíciles. Esto genera mejoras significativas con respecto al simple uso de su primera impresión”.
Gemini, la herramienta multimodal que quiere que te olvides de ChatGPT
A partir de hoy, Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios. La compañía explicó que esta herramienta tiene mayores capacidades de hacer tareas como comprender y resumir, razonar, generar ideas, escribir y planificar.
“Esta es la mayor mejora de calidad de Bard desde su lanzamiento”, mencionó Alphabet en un comunicado oficial.
Además, los usuarios podrán acceder a Gemini a través de Pixel. Pixel 8 Pro es el primer teléfono inteligente diseñado para ejecutar Gemini Nano. Este smartphone impulsa nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard.
A partir del 13 de diciembre, los internautas podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio y en Vertex AI de Google Cloud.
“Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos”.
Bard de Google quiere afianzarse en la carrera por la regulación de la IA
Hasta el momento, una de las grandes promesas que le hace Google a su público con esta herramienta es su capacidad de funcionar con imágenes, videos y audios. Esto la haría una de las IA más sofisticadas que existen en el mercado.
Hassabis comentó que las capacidades de razonamiento multimodal de Gemini 1.0 pueden ayudar a dar sentido a información visual y escrita compleja.
“Esto lo hace especialmente hábil para descubrir conocimientos que pueden ser difíciles de discernir en medio de grandes cantidades de datos”.
Durante su participación en Google I/O 2023, el cofundador de Google DeepMind mencionó el tipo de IA con la que sueña, una mucho más consciente.