OpenAI lancia o1-preview e o1-mini, i nuovi modelli AI in grado di "ragionare"

OpenAI ha lanciato ufficialmente il suo nuovo modello di intelligenza artificiale chiamato internamente “Strawberry“, noto formalmente come OpenAI o1. Questo modello si presenta in due varianti, o1-preview e o1-mini, e promette miglioramenti significativi nelle capacità di ragionamento e risoluzione dei problemi rispetto ai precedenti modelli di linguaggio di grandi dimensioni (LLM).

L’introduzione di OpenAI o1 rappresenta un passo avanti nel campo dell’intelligenza artificiale, con l’azienda che sottolinea la performance superiore del modello nelle competizioni di programmazione e in test scientifici e matematici. Tuttavia, alcuni utenti hanno segnalato che non supera sempre il predecessore GPT-4o in tutte le metriche e che i tempi di risposta possono essere lenti a causa del nuovo approccio al processo decisionale del modello.

Joanne Jang, manager di prodotto presso OpenAI, ha cercato di moderare le aspettative con un tweet:

C’è molto entusiasmo sul mio feed riguardo o1, ma ciò potrebbe creare aspettative sbagliate. o1 eccelle in compiti molto complessi e continuerà a migliorare“.

Strawberry risolve alcuni problemi molto difficili per gli LLM

Nonostante alcuni limiti evidenziati dagli utenti, o1-preview ha dimostrato una notevole efficacia in numerosi benchmark, posizionandosi nell’89° percentile nelle domande di programmazione competitive di Codeforces e ottenendo l’83% in un esame di qualificazione per l’Olimpiade Internazionale di Matematica.

L’approccio innovativo adottato da OpenAI con o1, che si basa su un nuovo metodo di apprendimento rinforzato (RL), permette al modello di “pensare” più a lungo ai problemi prima di rispondere, tentando diverse strategie e riconoscendo i propri errori. Questo processo imitativo del ragionamento umano passo dopo passo mira a migliorare significativamente le prestazioni del modello.

Inoltre, o1-mini è stato progettato specificamente per compiti di programmazione ed è disponibile a un prezzo inferiore del 80% rispetto a o1-preview, rendendolo più accessibile per determinati utilizzi.

Implicazioni e prospettive future

La piattaforma o1 di OpenAI è ancora agli esordi e, sebbene promettente, richiederà ulteriori sviluppi e aggiornamenti prima di realizzare appieno il suo potenziale. L’azienda prevede di implementare future capacità come la navigazione web, la generazione di immagini e l’upload di file. Nel frattempo, ulteriori test e verifiche indipendenti saranno fondamentali per valutare le effettive capacità e limitazioni del modello.

Nonostante le sfide, l’introduzione di OpenAI o1 segna un punto di svolta significativo nello sviluppo delle capacità di intelligenza artificiale, spingendo i limiti di ciò che le macchine possono comprendere e come possono interagire nel risolvere problemi complessi.