OpenAI lanza o1, su primera IA capaz de razonar

Los rumores estaban en lo cierto. OpenAI acaba de anunciar o1 y o1-mini, sus primeros modelos de inteligencia artificial con capacidad de razonamiento. Estos sacan provecho de la tecnología conocida internamente como Strawberry y se han pensado para resolver tareas complejas vinculadas con campos como la ciencia, las matemáticas y la programación. Desde hoy se encuentran disponibles en las versiones de pago de ChatGPT, y próximamente se incorporará la variante mini a la gratuita.

«En nuestras pruebas, la próxima actualización del modelo se desempeña de manera similar a la de los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología. También descubrimos que se destaca en matemáticas y programación. En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el modelo de razonamiento obtuvo una puntuación del 83 %», dice OpenAI sobre o1.

OpenAI ha lanzado o1 a modo de preview, de modo que aún no integra el 100 % de sus características a ChatGPT. Esto significa que todavía no puede lidiar con imágenes, ni tampoco buscar información en la web. De todos modos, los de Sam Altman consideran que esta nueva inteligencia artificial representa un salto bestial en cuando a capacidades, y por eso han decidido darle el nombre o1.

La startup ha publicado algunos vídeos con ejemplos que muestran a la nueva IA resolviendo problemas o instrucciones complejas, o incluso respondiendo a preguntas simples con las que otros modelos de lenguaje fallaban. A continuación, pueden ver a OpenAI o1 creando un videojuego desde cero a partir de un prompt de texto, y también acertando cuando se le pregunta cuántas R tiene la palabra Strawberry, que GPT-4o no podía contestar de forma acertada.

Al usar o1 en ChatGPT, se aprecia una demora en el tiempo de respuesta en comparación con GPT-4o y otros modelos de OpenAI. Esto se debe, justamente, a que la inteligencia artificial está usando sus capacidades de razonamiento para resolver lo que se pide o consulta, en lugar de disparar una contestación rápida. El objetivo de la nueva tecnología no solo es brindar respuestas más certeras, sino también acabar con las alucinaciones. Esto no quiere decir que la IA no vaya a equivocarse o a inventarse a una respuesta. Pero sus desarrolladores dicen que es menos frecuente que en versiones anteriores de GPT.

«Los investigadores del ámbito de la sanidad pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y los desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos».

OpenAI

ChatGPT suma capacidades de razonamiento con o1 y o1-mini, de OpenAI

Desde OpenAI comentaron que el entrenamiento de o1 se realizó con un set de datos hecho a medida y un nuevo algoritmo de optimización. A diferencia de GPT-4o y modelos previos, esta IA no imita sus patrones de adiestramiento, sino que usa aprendizaje por refuerzo para resolver por su cuenta los problemas que se le presentan.

Ver fuente

Related Post