twitter account

Google presenta Gemini, su esperado modelo lingüístico de gran tamaño

08/12/2023
Megan Crouse

El modelo competirá con GPT-4

Los usuarios de la inteligencia artificial de Google, Bard, así como quienes posean los teléfonos móviles Pixel 8 Pro, de Google, que será puesto en venta la semana próxima, tendrán acceso a Gemini, un gigantesco modelo de lenguaje que se aplica a aplicaciones inteligencia artificial generativa.

Según un reporte de prensa de la empresa, Gemini servirá para proveer a Bard de “un razonamiento más avanzado, planificación, comprensión y más aún”.

Gemini está disponible en tres tamaños: Ultra, Pro y Nano. Ultra es el más potente, Nano es el más pequeño y eficiente, y Pro se sitúa en el medio para tareas generales. La versión Nano es la que Google utiliza en el Pixel, mientras que Bard se queda con Pro. Google afirma que planea llevar a cabo "exhaustivas comprobaciones de confianza y seguridad" antes de poner Gemini Ultra a disposición de grupos selectos de desarrolladores.

Gemini puede codificar en Python, Java, C++, Go y otros lenguajes de programación populares. Google ha utilizado Gemini para mejorar su sistema de generación de código basado en IA, AlphaCode.

A continuación, Google tiene previsto incorporar Gemini a Ads, Chrome y Duet

Competidores de Gemini

Gemini y los productos creados con él, como los chatbots, competirán con GPT-4 de OpenAI, Copilot de Microsoft (que se basa en GPT-4 de OpenAI), Claude AI de Anthropic, Llama 2 de Meta y otros. Google afirma que Gemini Ultra supera a GPT-4 en varias pruebas comparativas, como la prueba masiva de conocimientos generales de comprensión de lenguajes multitarea y en la generación de código Python.

¿Hay un modelo de Gemini para empresas?

A partir del 13 de diciembre, los clientes empresariales y los desarrolladores podrán acceder a Gemini Pro a través de la API de Gemini en Vertex AI o Google AI Studio de Google.

Google anuncia que Gemini Nano estará disponible para desarrolladores y clientes empresariales a principios de 2024. Los desarrolladores de Android pueden utilizar este Large Language Model (LLM) para crear aplicaciones Gemini en el dispositivo a través de AndroidAICore.

Posibles usos empresariales de Gemini

La capacidad de Gemini para "entender y razonar sobre la intención de los usuarios", según Palash Nandy, director de ingeniería de Google, en un vídeo de demostración, puede ser de especial interés para las empresas. Gemini genera una interfaz de usuario a medida en función de si el usuario busca imágenes o texto. En la misma interfaz, Gemini señala las áreas en las que no tiene suficiente información y pide aclaraciones. A través de la interfaz personalizada, el usuario puede explorar otras opciones con mayor detalle.

Gemini ha sido entrenado en contenidos multimodales desde el principio, en lugar de empezar con texto y ampliarlo después a audio, imágenes y vídeo, lo que le permite analizar información escrita o visual con la misma agudeza. Un ejemplo de la utilidad que esto puede tener para las empresas que ofrece Google es la pregunta "¿Podría Gemini ayudar a hacer una demostración basada en este vídeo?", en la que la IA traduce el contenido de vídeo a una animación original.

El calendario de Gemini comparado con otros modelos similares

Se ha rumoreado mucho sobre Gemini, ya que Google intenta competir con OpenAI. El New York Times informó de que los ejecutivos de Google estaban "conmocionados" por la tecnología de OpenAI en enero de 2023. Más recientemente, Google supuestamente tuvo problemas con el lanzamiento de Gemini en idiomas distintos del inglés, lo que provocó el retraso de un evento de lanzamiento en persona.

Sin embargo, el lanzamiento del gran modelo lingüístico de Google después de que ChatGPT haya recibido actualizaciones graduales de GPT-4 durante casi un año significa que Google tiene la ventaja de adelantarse al último año de desarrollo de la IA. Por ejemplo, Gemini es multimodal (es decir, capaz de trabajar con texto, vídeo, voz y código) y vive de forma nativa en el Google Pixel 8. Los usuarios pueden acceder a Gemini en su Google Pixel 8 sin conexión a Internet, a diferencia de ChatGPT, que comenzó en un navegador