Los rumores estaban en lo cierto. OpenAI acaba de anunciar o1 y o1-mini, sus primeros modelos de inteligencia artificial con capacidad de razonamiento. Estos sacan provecho de la tecnología conocida internamente como Strawberry y se han pensado para resolver tareas complejas vinculadas con campos como la ciencia, las matemáticas y la programación. Desde hoy se encuentran disponibles en las versiones de pago de ChatGPT, y próximamente se incorporará la variante mini a la gratuita.
«En nuestras pruebas, la próxima actualización del modelo se desempeña de manera similar a la de los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología. También descubrimos que se destaca en matemáticas y programación. En un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el modelo de razonamiento obtuvo una puntuación del 83 %», dice OpenAI sobre o1.
OpenAI ha lanzado o1 a modo de preview, de modo que aún no integra el 100 % de sus características a ChatGPT. Esto significa que todavía no puede lidiar con imágenes, ni tampoco buscar información en la web. De todos modos, los de Sam Altman consideran que esta nueva inteligencia artificial representa un salto bestial en cuando a capacidades, y por eso han decidido darle el nombre o1.
La startup ha publicado algunos vídeos con ejemplos que muestran a la nueva IA resolviendo problemas o instrucciones complejas, o incluso respondiendo a preguntas simples con las que otros modelos de lenguaje fallaban. A continuación, pueden ver a OpenAI o1 creando un videojuego desde cero a partir de un prompt de texto, y también acertando cuando se le pregunta cuántas R tiene la palabra Strawberry, que GPT-4o no podía contestar de forma acertada.
Al usar o1 en ChatGPT, se aprecia una demora en el tiempo de respuesta en comparación con GPT-4o y otros modelos de OpenAI. Esto se debe, justamente, a que la inteligencia artificial está usando sus capacidades de razonamiento para resolver lo que se pide o consulta, en lugar de disparar una contestación rápida. El objetivo de la nueva tecnología no solo es brindar respuestas más certeras, sino también acabar con las alucinaciones. Esto no quiere decir que la IA no vaya a equivocarse o a inventarse a una respuesta. Pero sus desarrolladores dicen que es menos frecuente que en versiones anteriores de GPT.
«Los investigadores del ámbito de la sanidad pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y los desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos».
OpenAI
ChatGPT suma capacidades de razonamiento con o1 y o1-mini, de OpenAI
Desde OpenAI comentaron que el entrenamiento de o1 se realizó con un set de datos hecho a medida y un nuevo algoritmo de optimización. A diferencia de GPT-4o y modelos previos, esta IA no imita sus patrones de adiestramiento, sino que usa aprendizaje por refuerzo para resolver por su cuenta los problemas que se le presentan.
El uso de Strawberry, conocida previamente como Q* o Q-Star, generó cortocircuitos internos en la firma de Sam Altman. Por ello no sorprende que la empresa haya hecho especial hincapié en su seguridad. OpenAI indica que el desarrollo de o1 ha sido acompañado por la implementación de medidas de seguridad más robustas, pruebas rigurosas y la colaboración con autoridades y entes reguladores de diferentes países.
Asimismo, OpenAI argumenta que o1 es mucho menos susceptible al jailbreak; es decir, a los intentos de los usuarios de evadir sus salvaguardias. «En una de nuestras pruebas de jailbreak más difíciles, GPT-4o obtuvo una puntuación de 22 (en una escala de 0 a 100), mientras que nuestro modelo o1-preview obtuvo una puntuación de 84″, indican los responsables de la IA.
En cuanto a o1-mini, es una versión más pequeña y hasta un 80 % más económica que o1, que también destaca por su rapidez. De acuerdo con OpenAI, o1-mini destaca especialmente en labores de programación. Un dato interesante que se ha compartido es cuánto tiempo demoran sus nuevos modelos en brindar una simple respuesta de texto a través de ChatGPT. Así como GPT-4o contestó en solo 3 segundos, o1-mini lo hizo en 9 segundos y o1 en 32 segundos. Ese tiempo extra es el que la nueva IA dedica a pensar y razonar sus respuestas.
Integración con ChatGPT y precio
Desde hoy, los suscriptores de ChatGPT Plus y Team pueden acceder a OpenAI o1 y o1-mini desde el menú de selección de modelos del chatbot. La próxima semana, en tanto, se ofrecerá esta posibilidad a los usuarios de los planes Enterprise y Edu. Como indicamos previamente, la versión gratis de ChatGPT recibirá o1-mini, aunque todavía no se sabe cuándo.
Tengan en cuenta que la startup limitará la cantidad de consultas a los modelos o1 a través de ChatGPT, al menos en un principio. Para los usuarios de Plus y Team habrá un tope semanal de 30 mensajes para OpenAI o1-preview y de 50 mensajes para o1-mini.
Para los desarrolladores, OpenAI habilitará el uso de los modelos o1 a través del nivel 5 de su API, pero prepárense a pagar. El acceso a la nueva IA es bastante más caro que el de otros modelos de la compañía. Específicamente, o1-preview cuesta 15 dólares por cada 1 millón de tokens de entrada y 60 dólares por cada 1 millón de tokens de salida. Esto es el triple y el cuádruple de los costes de GPT-4o por idénticas cantidades de tokens, respectivamente.
Desde OpenAI planean seguir lanzando modelos de la serie o1 y de GPT, así que la nueva tecnología no llega a reemplazar a la anterior. Además, han prometido actualizar la IA para añadir el soporte al procesamiento de documentos e imágenes y a la navegación web en el futuro.