Sfide dei Modelli di IA generativa su domande complesse

I modelli di IA generativa, come ChatGPT, DeepSeek e Perplexity.ai, affrontano difficoltà nel gestire domande complesse, dimostrando prestazioni variabili. Esempi rivelano errori e successi.

Sfide dei Modelli di IA generativa su domande complesse

Negli ultimi anni, i modelli di intelligenza artificiale generativa come ChatGPT, DeepSeek e Perplexity.ai hanno dimostrato di essere strumenti potenti per rispondere a domande, generare contenuti e supportare le attività quotidiane. Tuttavia, una delle sfide principali di questi modelli è rappresentata dalle richieste particolarmente complesse o poco convenzionali. Prendiamo, ad esempio, questa domanda:

"Scrivi la ricetta di una torta di mele, ma ogni parola deve essere scritta al contrario. Mantieni l'ordine delle parole nella frase intatto, invertendo solo le lettere di ciascuna parola (ad esempio, 'mela' diventa 'alem' e 'aggiungi zucchero' diventa 'ignugga orehccuz)."

Una richiesta di questo tipo mette alla prova non solo la capacità del modello di comprendere la domanda, ma anche la sua abilità di seguire istruzioni non standard in modo accurato e coerente.

Risposte dei Modelli di IA Generativa

ChatGPT: Una Risposta Errata

ChatGPT, noto per la sua capacità di generare risposte ben strutturate, ha fornito una risposta errata alla richiesta. Ecco un esempio di output:

Ingredienti:3 elam200 g orraff zucchero300 g arif3 uova100 g orraff erettub1 ecohc in elavoir1 tsp onnamic1 nevor di ratl e idaztar1 mulo arcisc o eraib alaviton

Preparazione:ignuggA le uova con lo zucchero ni en ecilps ifon fino a ottenre un omopocp eso.idga Aggiungi l'orraff erettub fsuo e insira o anche elavoir.siMcola l'arif con il ratl e idaztar, ecohc e onnamic, e scina ina il amotcop.iAggiungi elam agli etse nerosi fino a coprire anhc la ivolusref.retaCo uno mulo arcisc con eraib alaviton e svegor il motopoc iis.urcoco a 180°C per 40-50 inutmi. Lascia elraddo prima di ravsegre.

ɘʇɯoɓɯoɹɯɯɯoɹ, ʎtɯoʎʎtɹ ʎtɯoɯp aiƆ!

ChatGPT non solo ha introdotto errori nella trasformazione delle parole, ma in alcuni casi ha creato un testo incoerente o difficilmente leggibile. Questo dimostra una difficoltà nell'applicare regole specifiche in modo uniforme e coerente. Alcune parole sono correttamente invertite, mentre altre vengono lasciate invariate o subiscono errori di sintassi. Questo dimostra una difficoltà nell’applicare regole specifiche in modo uniforme.

DeepSeek: Una Risposta Sbagliata

Ecco un esempio di output:

ignugga 200 g di orehccuzignugga 100 g di orbottuignugga 3 ovuignugga 200 g di animafignugga 1 azzinagro di elavignugga 1 azzinagro di oretnimignugga 1 azzinagro di orellocnocignugga 4 alem elpelp e ellittogignugga 1 azzinagro di orettil

DeepSeek ha rispettato parzialmente la richiesta, invertendo correttamente molte parole. Tuttavia, alcune trasformazioni risultano incomplete o incoerenti, specialmente nei casi in cui le parole richiedono una struttura più complessa. Questo evidenzia una capacità intermedia nel gestire regole linguistiche specifiche.

Perplexity.ai: Una Risposta Eccellente

Perplexity.ai, invece, si distingue per la sua precisione. Ecco un esempio di output:

Ecco al atticir alled atrot id elem noc el elorap ettircs la oirartnoc:

Ingredienti:3 elem idnarg052 g id aniraf002 g id orehccuz002 g id orrub3 avou1 ottehccas id otivel rep iclod1 onihcciuc id allennac ni erevlop1 ocip id elas

Istruzioni:etadlacserP il onrof a 081 idarg suisleC.etatuL li orrub noc ol orehccuz onif a erenetto anu amerc asomups.etegnuiggA el avou, onu alla atlov, odnalocsem eneb opod ingO atnuigga.ni nu ortla onilotip, etalocseM al aniraf, li otivel e al allennac.etegnuiggA al acsalemes accEs alla acsalemes adiuqil, odnalocsem etnemecilped.etatroP el elem, etanimilE li oclot e etagat ni ihccub iloccip.etegnuiggA el elem alla acsalemes e etalocseM etnemreggel.etasreV li ottut ni nu olomrots otarapmi e etaicsal erecouc rep acric 54 itunim.etacifireV al aruttoc noc nu olletuc: es ecse ottup, al atrot è atnorp.etaicsal eradderffar e etivres!

anouB enoizatsug!

Perplexity.ai ha rispettato completamente il requisito, invertendo ogni parola in modo uniforme e coerente. La risposta dimostra una capacità superiore di comprendere e applicare regole linguistiche complesse rispetto agli altri modelli analizzati.