La setmana passada, entre l'auge de DeepSeek, els gegants consolidats van començar a llançar i avançar noves propostes. Una que ja comença a rodar és la de Microsoft amb el seu nou model de raonament d'OpenAI o1 als seus usuaris Copilot. Però la cursa no s'atura. Aquesta setmana, és OpenAI qui ha llançat un nou model de raonament, o3-mini, per a les persones que utilitzen la versió gratuïta de ChatGPT. Aquesta serà la primera vegada que la gran majoria de les persones tindran accés a un dels models de raonament d'OpenAI, que abans estaven restringits als seus paquets de pagament Pro i Plus.

Per què has de conèixer el nou model d'OpenAI?

La major part del progrés del LLM fins ara ha estat impulsat per l'idioma. Aquest nou model entra en l'àmbit del raonament complex, amb implicacions per a la física, la codificació i molt més. Els models de raonament utilitzen una tècnica de "cadena de pensament" per generar respostes, bàsicament treballant a través d'un problema presentat al model pas a pas. Mitjançant aquest mètode, el model pot trobar errors en el seu procés i corregir-los abans de donar una resposta. Això normalment dona com a resultat respostes més exhaustives i precises, però també fa que els models s'aturen abans de respondre, de vegades provocant temps d'espera llarga. OpenAI afirma que o3-mini respon un 24% més ràpid que o1-mini.

Aquest tipus de models són més eficaços per resoldre problemes complexos, de manera que si teniu problemes de matemàtiques de nivell de doctorat que estigueu resolent, podeu provar-los. Alternativament, si heu tingut problemes per aconseguir que els models anteriors responguin correctament a les vostres indicacions més avançades, potser voldreu provar-hi aquest nou model de raonament. Per provar l'o3-mini, només cal que seleccioneu "Motiu" quan inicieu un missatge nou a ChatGPT. Tot i que els models de raonament tenen noves capacitats, tenen un cost. L'o1-mini d'OpenAI és 20 vegades més car d'executar que el seu model equivalent sense raonament, GPT-4o mini. L'empresa diu que el seu nou model, o3-mini, costa un 63% menys que o1-mini per testimoni d'entrada. No obstant això, a 1,10 dòlars per milió de fitxes d'entrada, encara és aproximadament set vegades més car d'executar que GPT-4o mini. Des d'OpenAI marquen les diferències: "Tot i que OpenAI o1 segueix sent el nostre model de raonament de coneixement general més ampli, OpenAI o3-mini ofereix una alternativa especialitzada per a dominis tècnics que requereixen precisió i velocitat. A ChatGPT, l'o3-mini utilitza un esforç de raonament mitjà per oferir un equilibri equilibrat entre velocitat i precisió. Tots els usuaris de pagament també tindran l'opció de seleccionar o3-mini-highal selector de models una versió de més intel·ligència que trigui una mica més a generar respostes". 

Els usuaris de ChatGPT Plus, Team i Pro poden accedir a OpenAI o3-mini a partir d'avui, amb l'accés Enterprise al febrer. o3-mini substituirà OpenAI o1-mini al selector de models, oferint límits de velocitat més alts i una latència més baixa, cosa que el converteix en una opció convincent per a tasques de codificació, STEM i resolució de problemes lògics. Com a part d'aquesta actualització, estem triplicant el límit de tarifa per als usuaris Plus i Team de 50 missatges al dia amb o1-mini a 150 missatges al dia amb o3-mini. A més, ara o3-mini funciona amb la cerca per trobar respostes actualitzades amb enllaços a fonts web rellevants. Aquest és un prototip primerenc, ja que treballem per integrar la cerca als nostres models de raonament.

Aquest nou model arriba just després del llançament de DeepSeek que va sacsejar el món de la IA fa menys de dues setmanes. El nou model de DeepSeek funciona igual que els millors models d'OpenAI, però la companyia xinesa afirma que va costar aproximadament 6 milions de dòlars per entrenar, a diferència del cost estimat de més de 100 milions de dòlars per entrenar el GPT-4 d'OpenAI. (Val la pena assenyalar que molta gent està interrogant aquesta afirmació.) A més, el model de raonament de DeepSeek costa 0,55 dòlars per milió de fitxes d'entrada, la meitat del preu d'o3-mini, de manera que OpenAI encara té un camí per recórrer per reduir els seus costos. S'estima que els models de raonament també tenen costos energètics molt més elevats que altres tipus, donat el nombre més gran de càlculs que requereixen per produir una resposta.