Saps que ja una IA no només pot veure imatges, sinó que també pot raonar a partir d'aquestes? Avui t'explicaré com OpenAI, ha llançat dos nous models d'intel·ligència artificial, o3 i o4-mini, amb més capacitats de raonament, visuals i autònomes. Soc Esther Checa, i en els pròxims minuts t'explicaré per què aquests models són rellevants, ja que no només processen text, sinó que raonen, utilitzen eines de forma autònoma, comprenen imatges en profunditat, i fins i tot generen noves idees en el camp, la ciència.
Descobreix els dos models
El model d'intel·ligència o3 és el més avançat que han creat fins ara en paraules d'OpenAI. Està dissenyat per resoldre problemes complexos que requereixen raonament profund: des de matemàtiques avançades fins a analitzar imatges o generar idees noves. És com tenir un assistent que no només executa tasques, sinó que també col·labora amb tu, et fa preguntes de forma proactiva i et proposa solucions.
D'altra banda, o4-mini és la seva versió més lleugera, però igualment potent. És més ràpid i eficient, ideal per a tasques com l'anàlisi de dades o la programació, sense perdre aquesta capacitat de raonament profund. Aquests models poden utilitzar eines per si sols. Ells decideixen quan obrir un navegador, utilitzar un llenguatge de programació com Python, o generar imatges com a part del seu raonament. No necessiten que els ho diguis: simplement ho fan quan el consideren útil. A més, tenen una nova habilitat: "pensen amb imatges". No només entenen el que hi ha en una foto, sinó que la integren a la seva manera de resoldre problemes. Això permet noves aplicacions on la lògica i el visual es combinen, una cosa que fins ara era impensable.
Codex CLI, nou assistent
I si ets desenvolupador, això t'interessa: OpenAI també ha llançat Codex CLI, un assistent que es connecta directament a la teva terminal. T'ajuda a programar, corregir errors o entendre codi en temps real. La importància d'aquests avenços rau que ja no parlem de models que simplement reaccionen a l'entrada de l'usuari, sinó que són sistemes que observen, elegeixen i actuen de forma proactiva. Amb capacitats com a memòria, raonament multimodal, i ús autònom d'eines, sembla que estem davant sistemes amb estructura similar al que es coneix com a intel·ligència artificial general.
Malgrat proclamar-se com els millors models amb capacitats per pensar amb intenció, actuar amb autonomia i comprendre el món de forma més semblant a com ho faria un ésser humà, és Google qui continua liderant la millor relació qualitat-preu dels models segons experts de la indústria, és a dir, els models de Google ofereixen la millor intel·ligència artificial per dòlar avui dia.