Guida breve ai modelli di LLM / AI Generative

Intro: Perché questa guida?
OpenAI, Anthropic, Alphabet, Mistral, Deepseek: esistono diverse aziende che offrono il proprio LLM. Ogni LLM poi ha, nella stessa offerta, anche diversi modelli che fanno cose complementari, a questo aggiungiamo gli agenti: è oggettivamente facile perdersi nel mare magnum delle proposte.
Molto probabilmente questa è solo una difficoltà temporanea e tra qualche mese questo post non avrà più nessuna utilità dato il mixure of expert sarà standard.
Nel frattempo, usiamolo come guida.
Se credi che stia lasciando indietro qualche Ai fammelo sapere.
Ultimo aggiornamento:
- 18 Maggio - Aggiunta anche tabella riassuntiva
- 17 maggio 2025 - aggiunto AI Codex
- 5 Maggio - Prima bozza
Guida breve ai modelli OpenAI: Confronto tra Modelli "ChatGPT"

GPT-4o
Eccelle nei compiti quotidiani: brainstorming, sintesi, email, contenuti creativi.
Completamente multimodale: supporta quasi tutte le funzionalità (GPTs, analisi dati, ricerca, generazione immagini, canvas, voce avanzata) e input (documenti, immagini, file CSV, audio, video).
Esempi di prompt:
- Riassumi i verbali della riunione nei punti chiave.
- Scrivi un'email di follow-up dopo l’avvio di un progetto.
- Correggi il mio report.
- Fai brainstorming per un piano di lancio in tempo reale—puoi caricare schizzi o screenshot.
GPT-4.5
Ideale per attività creative: intelligenza emotiva, comunicazione chiara, creatività e approccio collaborativo e intuitivo al brainstorming.
Esempi di prompt:
- Crea un post coinvolgente su LinkedIn sulle tendenze dell’AI.
- Scrivi una descrizione prodotto per una nuova funzionalità.
- Redigi una lettera di scuse al cliente con tono empatico.
OpenAI o4-mini
Compiti tecnici rapidi: domande STEM veloci, programmazione, ragionamento visivo.
Esempi di prompt:
- Estrai i dati chiave da un file CSV.
- Fornisci un riassunto rapido di un articolo scientifico.
- Risolvi velocemente questo errore Python (traceback).
OpenAI o4-mini-high
Compiti tecnici dettagliati: codice avanzato, matematica, spiegazioni scientifiche. Pensa più a lungo per offrire maggiore precisione.
Esempi di prompt:
- Risolvi un'equazione matematica complessa e spiega i passaggi.
- Scrivi query SQL per l’estrazione dei dati.
- Spiega un concetto scientifico in termini semplici.
OpenAI o3
Compiti complessi o a più fasi: pianificazione strategica, analisi approfondite, coding estensivo, matematica avanzata, scienza e ragionamento visivo.
Esempi di prompt:
- Sviluppa un’analisi dei rischi per l’espansione in un nuovo mercato.
- Scrivi un piano strategico aziendale basato su dati competitivi.
- Esegui un’analisi multi-step su questo CSV—prevedi il prossimo trimestre e crea un grafico della tendenza.
- Rivedi le metriche delle pipeline, visualizza i dati e cerca nuove strategie per la parte alta del funnel.
OpenAI o1 Pro Mode
Ragionamento complesso: impiega un po’ più di tempo per pensare, ma restituisce la precisione necessaria per compiti intricati.
Esempi di prompt:
- Redigi un memo dettagliato di analisi dei rischi per l’adozione delle norme EU sulla privacy dei dati.
- Genera un riassunto di ricerca di più pagine sulle tecnologie emergenti.
- Crea un algoritmo per la previsione finanziaria basato su modelli teorici.
OpenAi Codex
Basato su codex-1, una versione ottimizzata del modello o3, Codex è progettato per:
- scrivere funzionalità,
- correggere bug,
- eseguire test automatici,
- analizzare interi codebase.
Il modello genera codice più "pulito" e conforme alle istruzioni rispetto ai predecessori, ed è in grado di testare iterativamente il codice fino al completamento corretto.
Guida breve ai modelli Anthropic: Confronto tra Modelli "Claude"

Claude 3.7 Sonnet
Il modello più intelligente
Claude 3.7 Sonnet è il primo modello sul mercato con ragionamento ibrido e rappresenta l’ultima evoluzione dell’intelligenza Claude.
- Input: testo e immagini
- Output: testo
- Finestra di contesto: 200k token
- Extended Thinking: sì (ragionamento potenziato)
Claude 3.5 Haiku
Il modello più veloce
- Input: testo e immagini
- Output: testo
- Finestra di contesto: 200k token
Guida ai Modelli di Gemini

Gemini 2.5 Pro
Eccelle in:
Ragionamento avanzato, generazione di codice, comprensione di documenti complessi, interazione multimodale (testo, immagini, audio, video).
Cosa fa:
Gemini 2.5 Pro è il modello più intelligente di Google AI al momento.
Offre capacità avanzate di problem solving, scrittura creativa, analisi file, visione, audio comprehension e contesto di lunga durata. È ideale per task complessi, brainstorming tecnici e generazione di contenuti multiformato.
Multimodale:
upporta testo, immagini, audio e video come input.
Capacità principali:
- Codifica avanzata
- Ragionamento logico
- Analisi documentale e di file strutturati
- Comprensione e generazione di immagini
- Interazione audio/video
- Lunga memoria contestuale (milioni di token)
Gemini 2.5 Flash
Eccelle in:
Velocità, versatilità, ottimo compromesso tra costi e prestazioni.
Cosa fa:
Modello veloce e leggero con supporto multimodale. Adatto a task quotidiani, risposte rapide, prototipazione.
Esempi di prompt:
- Riassumi questa mail in 3 punti.
- Crea un carosello per Instagram da questo testo.
- Analizza questa tabella Excel.
Gemini 2.0 Flash
Eccelle in:
Efficienza, produzione di contenuti, analisi veloce.
Cosa fa:
Gestisce immagini, testo e codice. Ottimo per app AI leggere o operazioni in tempo reale.
Esempi di prompt:
- Genera un titolo accattivante per questo articolo.
- Spiega cosa rappresenta questo grafico.
- Riformula questo paragrafo in modo più diretto.
Gemini 2.0 Flash-Lite
Eccelle in:
Latenza minima, costo bassissimo.
Cosa fa:
Perfetto per chatbot, microtask e risposte istantanee. Leggerissimo.
Esempi di prompt:
- Cos’è l’IVA?
- Dammi un sinonimo di “innovativo”.
- Crea una call-to-action di 5 parole.
Gemini 1.5 Pro
Eccelle in:
Contesto lunghissimo, analisi articolate.
Cosa fa:
Modello robusto per ragionamenti complessi su grandi quantità di testo. Supporto multimodale.
Esempi di prompt:
- Analizza questo libro e individua i temi principali.
- Scrivi una strategia di go-to-market.
- Crea uno script per elaborare migliaia di righe CSV.
Gemini 1.5 Flash
Eccelle in:
Reattività, bilanciamento prestazioni-costi.
Cosa fa:
Ideale per risposte rapide, task multitipo. Supporta anche immagini e audio.
Esempi di prompt:
- Crea una caption per questo video.
- Riassumi il contenuto di questa immagine.
- Suggerisci 5 titoli per un blog post.
Vibe Coding: V0.dev / Vercel

Se parliamo di vibe coding io mio sguardo a cuoricino 😍 va a v0.dev.
Anche se forse non è il migliore tra i sistemi di coding, ha un vantaggio enorme: divide lo schermo in due: sulla parte a sinistra la finestra di dialogo e sulla parte di destra c'è il codice generato e la preview dello stesso (funzionante!) c'è anche un tasto di deploy cosi da poterlo mettere online.

Per cosa usarlo?
Perfetto per fare MVP e tools verticali
Io per esempio ho fatto generare un motore di ricerca semantico per il blog ModelliMentali.com - lo vedi all'opera qui: https://www.modellimentali.com/cerca-con-ai/
Agenti: Manus.im

Manus è un agente di intelligenza artificiale generale che non si limita a ragionare, ma naviga e produce.
Eccelle in una vasta gamma di compiti, sia nel lavoro che nella vita quotidiana, con risultati particolarmente interessanti
AI Generative: DeepSeek

Deepseek è un modello linguistico open-source rivoluzionario in termini di costi/prestazione, che raggiunge risultati paragonabili al modello o1 di OpenAI pur mantenendo l’accessibilità garantita dalla licenza MIT.
Ha dei benchmark impressionanti e 3 funzioni principali. Lo trovi qui:chat.deepseek.com/
Chat
Per prompt semplici Risultati comparabili a 01 di OpenAI
Sistema di ragionamento
DeepSeek-V3 ha una funzione di “deep thinking”, che gli consente di analizzare e processare le informazioni con una profondità e precisione senza precedenti.
Real Time Web Search
DeepSeek-V3 è stata la prima ad avere una funzione avanzata di ricerca, e ancora adesso funziona molto bene
AI Generative: Mistral

Ultimo ma non ultimo una AI generativa Europea open weight con una serie di modelli verticali interesanti come quello sulla matematica, sull'intermediazione culturale (molto forte sui paesi del sud est asiatico), motore di ricerca interno a un sito (lo stesso che ho usato insieme a v0dev nell'esempio precedente)
Non da i risultati di un ChatGPT, ma se dovessi sviluppare qualcosa di sicuro a prova di GDPR guarderei in questa direzione.
Tabelle Comparative

Tabella di valutazione personale
Tabelle generate da ChatGPT, perdonatemi.
ChatGPT
Modello | Limite d’Uso | Funzionalità | Input Supportati |
---|---|---|---|
GPT-4o | Illimitato | GPTs, Analisi dati, Ricerca, Generazione immagini, Canvas, Voce avanzata | Documenti, Immagini, CSV, Audio, Video |
GPT-4.5 | 20 richieste/settimana | Analisi dati, Ricerca, Generazione immagini, Canvas, Voce | Documenti, Immagini, CSV, Audio, Video |
o4-mini | 300 richieste/giorno | Analisi dati, Ricerca, Generazione immagini, Canvas, Ricerca approfondita | Documenti, Immagini, CSV |
o4-mini-high | 100 richieste/giorno | Analisi dati, Ricerca, Generazione immagini, Canvas | Documenti, Immagini, CSV |
o3 | 100 richieste/settimana | Analisi dati, Ricerca, Generazione immagini, Canvas, Ricerca approfondita | Documenti, Immagini, CSV |
o1-pro | 5 richieste/mese | Ricerca | Immagini |
Caratteristica | GPT-4o | GPT-4.5 | o4-mini | o4-mini-high | o3 | o1-pro |
---|---|---|---|---|---|---|
Descrizione | Il più completo e multimodale | Creativo e collaborativo | Tecnico e rapido | Tecnico avanzato | Complesso e strategico | Ragionamento profondo |
Punti di forza | Capacità complete, voce avanzata, input video e audio | Creatività, chiarezza, collaborazione | Velocità, efficienza | Precisione tecnica, accuratezza | Analisi a più fasi, strategia | Accuratezza su compiti complessi |
Multilingua | ✅ | ✅ | ✅ | ✅ | ✅ | ❌ (non specificato) |
Visione | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ (solo immagini) |
Pensiero Esteso | ✅ | ❌ | ❌ | ❌ | ✅ (ricerca approfondita) | ❌ |
Latenza | Veloce | Media | La più veloce | Veloce con maggiore accuratezza | Media | Lenta ma precisa |
Cut-off training | Non specificato (2024)¹ | Non specificato | Non specificato | Non specificato | Non specificato | Non specificato |
Limiti d’Uso | Illimitato | 20 richieste / settimana | 300 richieste / giorno | 100 richieste / giorno | 100 richieste / settimana | 5 richieste / mese |
Input supportati | Documenti, immagini, CSV, audio, video | Documenti, immagini, CSV, audio, video | Documenti, immagini, CSV | Documenti, immagini, CSV | Documenti, immagini, CSV | Solo immagini |
Funzionalità | GPTs, analisi dati, ricerca, immagini, canvas, voce avanzata | Analisi dati, ricerca, immagini, canvas, voce | Analisi dati, ricerca, immagini, canvas, ricerca approfondita | Analisi dati, ricerca, immagini, canvas | Analisi dati, immagini, ricerca approfondita | Solo ricerca |
Claude Sonnet
Caratteristica | Claude 3.7 Sonnet | Claude 3.5 Sonnet | Claude 3.5 Haiku | Claude 3 Opus | Claude 3 Haiku |
---|---|---|---|---|---|
Descrizione | Il più intelligente | Versione precedente | Il più veloce | Potente per compiti complessi | Ultra veloce e compatto |
Punti di forza | Intelligenza top + pensiero esteso | Alta intelligenza | Velocità estrema | Intelligenza e fluidità elevate | Prestazioni mirate rapide |
Multilingua | ✅ | ✅ | ✅ | ✅ | ✅ |
Visione | ✅ | ✅ | ✅ | ✅ | ✅ |
Pensiero Esteso | ✅ | ❌ | ❌ | ❌ | ❌ |
Latenza | Rapido | Rapido | Il più rapido | Moderato | Il più rapido |
Cut-off training | Ott 2024¹ | Apr 2024 | Lug 2024 | Ago 2023 | Ago 2023 |
Gemini
Caratteristica | Gemini 2.5 Pro | Gemini 2.5 Flash | Gemini 2.0 Flash | Gemini 2.0 Flash-Lite | Gemini 1.5 Pro | Gemini 1.5 Flash |
---|---|---|---|---|---|---|
Descrizione | Modello più potente per ragionamento avanzato | Ottimo rapporto qualità-prezzo | Modello multimodale di nuova generazione | Ottimizzato per costi e latenza | Ragionamento complesso e contesto esteso | Prestazioni rapide e versatili |
Punti di forza | Ragionamento avanzato, comprensione multimodale, codifica complessa | Adattivo, configurabile, efficiente | Generazione di codice e immagini, analisi file | Efficienza nei costi, bassa latenza | Contesto fino a 2 milioni di token, supporto multimodale | Velocità, versatilità, supporto multimodale |
Multilingua | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Visione | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Pensiero Esteso | ✅ | ✅ (configurabile) | ✅ | ❌ | ✅ | ❌ |
Latenza | Media | Bassa | Bassa | Molto bassa | Media | Bassa |
Cut-off training | Non specificato | Non specificato | Non specificato | Non specificato | Non specificato | Non specificato |
Limiti d’Uso | Accesso gratuito con limiti standard | Accesso gratuito con limiti standard | Accesso gratuito con limiti standard | Accesso gratuito con limiti standard | Accesso gratuito con limiti standard | Accesso gratuito con limiti standard |
Input supportati | Testo, immagini, audio, video | Testo, immagini, audio, video | Testo, immagini, audio, video | Testo, immagini, audio, video | Testo, immagini, audio, video | Testo, immagini, audio, video |
Funzionalità | Ragionamento avanzato, generazione codice, comprensione multimodale | Pensiero adattivo, efficienza nei costi | Generazione codice e immagini, analisi file | Efficienza nei costi, bassa latenza | Ragionamento complesso, contesto esteso | Prestazioni rapide, versatilità |
Fonti
- OpenAI Enterprise Models
- Claude 3.7 Sonnet and Claude Code
- Link con tutti gli update di Gemini : gemini.google.com/updates
- Mistal Models
Member discussion