Rivale di ChatGPT a basso costo
Il modello S1, sviluppato con soli 50 dollari, dimostra come sia possibile addestrare sistemi di IA a costi ridotti. Utilizzando la distillazione, S1 raggiunge prestazioni competitive, ma lo sviluppo di tecnologie avanzate richiede ancora enormi risorse.

La comparsa del modello S1, sviluppato da ricercatori delle università di Stanford e Washington, segna un passo importante nel campo dell'intelligenza artificiale. Questo modello è stato addestrato con un investimento sorprendentemente basso di soli 50 dollari. Utilizzando una tecnica chiamata 'distillazione', i ricercatori hanno potuto insegnare a S1 come funzionano modelli più complessi come Gemini 2.0 di Google. La distillazione consente a modelli più piccoli di apprendere da quelli più grandi, mantenendo prestazioni simili a costi notevolmente inferiori. S1 è stato addestrato in soli 26 minuti e ha utilizzato solo 16 GPU H100 di Nvidia, mentre i modelli più avanzati richiedono decine di migliaia di GPU.
Il modello S1 ha dimostrato di raggiungere prestazioni competitive in vari benchmark rispetto a sistemi di intelligenza artificiale noti. Inoltre, sfrutta un approccio di 'ragionamento' per migliorare la qualità delle risposte generate. Questa innovazione ha sollevato preoccupazioni tra i giganti della tecnologia, in particolare dopo il successo di DeepSeek, che ha dimostrato come si possano ottenere risultati notevoli con un budget ridotto. Le reazioni da parte delle aziende più affermate nel settore non si sono fatte attendere, con richieste di limitare l'accesso delle realtà cinesi alle risorse tecnologiche statunitensi.
Nonostante i progressi, i ricercatori avvertono che per sviluppare modelli di intelligenza artificiale davvero avanzati sono necessarie ingenti risorse. Anche se la distillazione permette di replicare le capacità di modelli esistenti a costi contenuti, la creazione di nuove tecnologie richiede investimenti che solo i leader del settore possono permettersi. Gli Stati Uniti stanno investendo 500 miliardi di dollari nel progetto Stargate per mantenere la loro posizione di leadership nell'IA, sottolineando l'importanza di risorse adeguate per lo sviluppo futuro. In questo nuovo contesto, chiunque può avvicinarsi alla creazione di modelli linguistici avanzati con un budget limitato, ma le sfide rimangono significative per l'innovazione nel settore.