La semana pasada se había generado bastante ruido tras la irrupción de una inteligencia artificial desconocida llamada GPT2. Después de la intriga inicial, quedó en evidencia que se trataba de tecnología perteneciente a OpenAI y ello llevó a que se especulara con que podía tratarse de GPT-5. Sin embargo, ahora ha quedado en claro que no era así. La propia startup ha confirmado que el misterioso bot era, en realidad, una versión encubierta de GPT-4o, su nuevo modelo de lenguaje.
Así lo reveló William Fedus, un ingeniero de OpenAI, a través de X (Twitter) tras la actualización de primavera que realizó la compañía. El susodicho explicó que habían estado probando GPT-4o en LMSYS bajo el nombre im-also-a-good-gpt2-chatbot, y compartió una muy interesante tabla sobre cómo le fue en las calificaciones ELO.
Sin meternos en terreno demasiado técnico, las calificaciones ELO se utilizan para evaluar las destrezas de los modelos de lenguaje de gran tamaño. Si bien la puntuación que logra una inteligencia artificial bajo este sistema no representa sus capacidades totales, sí se utiliza como un método objetivo para evaluar la precisión de sus respuestas. Básicamente, ayuda a medir qué tan bien puede resolver problemas o responder preguntas.
Durante las pruebas enmascarado como GPT2, GPT-4o obtuvo una puntuación general de 1.310 en las calificaciones ELO. Esto marca un salto considerable en comparación con GPT-4 Turbo y GPT-4, que obtuvieron 1.253 y 1.250, respectivamente. El nuevo modelo de lenguaje de OpenAI también se impuso a Gemini 1.5 Pro de Google (1.249), Claude 3 (1.246) y Llama 3 de Meta en su versión para instrucciones con 70.000 millones de parámetros (1.208).
El misterioso GPT2 era el nuevo modelo GPT-4o de OpenAI


En otra tabla, Fedus reveló que GPT-4o logró superar a GPT-4 Turbo por 100 puntos en las calificaciones ELO dedicadas a prompts difíciles para labores de programación. Allí, la nueva IA logró un puntaje de 1.369, contra 1.269 de su predecesor. «Este no solo es el mejor modelo [de lenguaje] del mundo, sino que está disponible de forma gratuita en ChatGPT, lo que nunca antes había sido el caso para una inteligencia artificial de vanguardia», agregó.
GPT-4o trae consigo novedades muy importantes, tal y como anunció OpenAI este lunes. Este modelo presume de «inteligencia al nivel de GPT-4», pero con mucha más velocidad y mejores capacidades para lidiar con texto, audio e imágenes como métodos de entrada. La nueva IA puede procesar la voz y las fotos o vídeos de forma nativa, ofreciendo respuestas más veloces y precisas.
Según explicaron sus desarrolladores, GPT-4o tiene una latencia mínima de 232 milisegundos al responder usando el Modo Voz (Voice Mode). Esto es una mejora crucial en comparación con GPT-4, que tenía una demora promedio de 5,4 segundos en ChatGPT. Durante la presentación de la tecnología se realizaron varias demostraciones en tiempo real. El chatbot fue capaz de resolver ecuaciones y detectar emociones a través de la cámara de un móvil. Y también pudo interpretar código y ofrecer un resumen en voz alta del mismo.
GPT-4o llegará a todas las versiones de ChatGPT, incluyendo la de acceso gratuito. En principio, sus funciones estarán limitadas y se expandirá el acceso a todas sus características de forma gradual.