17 mag 2025 8 min read LLM

Guida breve ai modelli di LLM / AI Generative

Esistono diverse aziende che offrono la propria AI Generativa. Ogni LLM ha anche diversi modelli ed è oggettivamente complesso capire quale modello utilizzare dentro la stessa famiglia di servizi. in questo articolo facciamo un po' di ordine.

Creata con Midjourney - trovi il prompt qui: https://manolo.macchetta.com/i-prompt-di-midjourney-su-notion/

Intro: Perché questa guida?

OpenAI, Anthropic, Alphabet, Mistral, Deepseek: esistono diverse aziende che offrono il proprio LLM. Ogni LLM poi ha, nella stessa offerta, anche diversi modelli che fanno cose complementari, a questo aggiungiamo gli agenti: è oggettivamente facile perdersi nel mare magnum delle proposte.

Molto probabilmente questa è solo una difficoltà temporanea e tra qualche mese questo post non avrà più nessuna utilità dato il mixure of expert sarà standard.
Nel frattempo, usiamolo come guida.

Se credi che stia lasciando indietro qualche Ai fammelo sapere.

Ultimo aggiornamento:

18 Maggio - Aggiunta anche tabella riassuntiva
17 maggio 2025 - aggiunto AI Codex
5 Maggio - Prima bozza

Guida breve ai modelli OpenAI: Confronto tra Modelli "ChatGPT"

GPT-4o

Eccelle nei compiti quotidiani: brainstorming, sintesi, email, contenuti creativi.
Completamente multimodale: supporta quasi tutte le funzionalità (GPTs, analisi dati, ricerca, generazione immagini, canvas, voce avanzata) e input (documenti, immagini, file CSV, audio, video).

Esempi di prompt:

Riassumi i verbali della riunione nei punti chiave.
Scrivi un'email di follow-up dopo l’avvio di un progetto.
Correggi il mio report.
Fai brainstorming per un piano di lancio in tempo reale—puoi caricare schizzi o screenshot.

GPT-4.5

Ideale per attività creative: intelligenza emotiva, comunicazione chiara, creatività e approccio collaborativo e intuitivo al brainstorming.

Esempi di prompt:

Crea un post coinvolgente su LinkedIn sulle tendenze dell’AI.
Scrivi una descrizione prodotto per una nuova funzionalità.
Redigi una lettera di scuse al cliente con tono empatico.

OpenAI o4-mini

Compiti tecnici rapidi: domande STEM veloci, programmazione, ragionamento visivo.

Esempi di prompt:

Estrai i dati chiave da un file CSV.
Fornisci un riassunto rapido di un articolo scientifico.
Risolvi velocemente questo errore Python (traceback).

OpenAI o4-mini-high

Compiti tecnici dettagliati: codice avanzato, matematica, spiegazioni scientifiche. Pensa più a lungo per offrire maggiore precisione.

Esempi di prompt:

Risolvi un'equazione matematica complessa e spiega i passaggi.
Scrivi query SQL per l’estrazione dei dati.
Spiega un concetto scientifico in termini semplici.

OpenAI o3

Compiti complessi o a più fasi: pianificazione strategica, analisi approfondite, coding estensivo, matematica avanzata, scienza e ragionamento visivo.

Esempi di prompt:

Sviluppa un’analisi dei rischi per l’espansione in un nuovo mercato.
Scrivi un piano strategico aziendale basato su dati competitivi.
Esegui un’analisi multi-step su questo CSV—prevedi il prossimo trimestre e crea un grafico della tendenza.
Rivedi le metriche delle pipeline, visualizza i dati e cerca nuove strategie per la parte alta del funnel.

OpenAI o1 Pro Mode

Ragionamento complesso: impiega un po’ più di tempo per pensare, ma restituisce la precisione necessaria per compiti intricati.

Esempi di prompt:

Redigi un memo dettagliato di analisi dei rischi per l’adozione delle norme EU sulla privacy dei dati.
Genera un riassunto di ricerca di più pagine sulle tecnologie emergenti.
Crea un algoritmo per la previsione finanziaria basato su modelli teorici.

OpenAi Codex

Basato su codex-1, una versione ottimizzata del modello o3, Codex è progettato per:

scrivere funzionalità,
correggere bug,
eseguire test automatici,
analizzare interi codebase.

Il modello genera codice più "pulito" e conforme alle istruzioni rispetto ai predecessori, ed è in grado di testare iterativamente il codice fino al completamento corretto.

Guida breve ai modelli Anthropic: Confronto tra Modelli "Claude"

Claude 3.7 Sonnet

Il modello più intelligente
Claude 3.7 Sonnet è il primo modello sul mercato con ragionamento ibrido e rappresenta l’ultima evoluzione dell’intelligenza Claude.

Input: testo e immagini
Output: testo
Finestra di contesto: 200k token
Extended Thinking: sì (ragionamento potenziato)

Claude 3.5 Haiku

Il modello più veloce

Input: testo e immagini
Output: testo
Finestra di contesto: 200k token

Guida ai Modelli di Gemini

immagine presa dal sito: blog.google/technology/developers/

Gemini 2.5 Pro

Eccelle in:
Ragionamento avanzato, generazione di codice, comprensione di documenti complessi, interazione multimodale (testo, immagini, audio, video).

Cosa fa:
Gemini 2.5 Pro è il modello più intelligente di Google AI al momento.
Offre capacità avanzate di problem solving, scrittura creativa, analisi file, visione, audio comprehension e contesto di lunga durata. È ideale per task complessi, brainstorming tecnici e generazione di contenuti multiformato.

Multimodale:
upporta testo, immagini, audio e video come input.

Capacità principali:

Codifica avanzata
Ragionamento logico
Analisi documentale e di file strutturati
Comprensione e generazione di immagini
Interazione audio/video
Lunga memoria contestuale (milioni di token)

Gemini 2.5 Flash

Eccelle in:
Velocità, versatilità, ottimo compromesso tra costi e prestazioni.

Cosa fa:
Modello veloce e leggero con supporto multimodale. Adatto a task quotidiani, risposte rapide, prototipazione.

Esempi di prompt:

Riassumi questa mail in 3 punti.
Crea un carosello per Instagram da questo testo.
Analizza questa tabella Excel.

Gemini 2.0 Flash

Eccelle in:
Efficienza, produzione di contenuti, analisi veloce.

Cosa fa:
Gestisce immagini, testo e codice. Ottimo per app AI leggere o operazioni in tempo reale.

Esempi di prompt:

Genera un titolo accattivante per questo articolo.
Spiega cosa rappresenta questo grafico.
Riformula questo paragrafo in modo più diretto.

Gemini 2.0 Flash-Lite

Eccelle in:
Latenza minima, costo bassissimo.

Cosa fa:
Perfetto per chatbot, microtask e risposte istantanee. Leggerissimo.

Esempi di prompt:

Cos’è l’IVA?
Dammi un sinonimo di “innovativo”.
Crea una call-to-action di 5 parole.

Gemini 1.5 Pro

Eccelle in:
Contesto lunghissimo, analisi articolate.

Cosa fa:
Modello robusto per ragionamenti complessi su grandi quantità di testo. Supporto multimodale.

Esempi di prompt:

Analizza questo libro e individua i temi principali.
Scrivi una strategia di go-to-market.
Crea uno script per elaborare migliaia di righe CSV.

Gemini 1.5 Flash

Eccelle in:
Reattività, bilanciamento prestazioni-costi.

Cosa fa:
Ideale per risposte rapide, task multitipo. Supporta anche immagini e audio.

Esempi di prompt:

Crea una caption per questo video.
Riassumi il contenuto di questa immagine.
Suggerisci 5 titoli per un blog post.

Vibe Coding: V0.dev / Vercel

Se parliamo di vibe coding io mio sguardo a cuoricino 😍 va a v0.dev.
Anche se forse non è il migliore tra i sistemi di coding, ha un vantaggio enorme: divide lo schermo in due: sulla parte a sinistra la finestra di dialogo e sulla parte di destra c'è il codice generato e la preview dello stesso (funzionante!) c'è anche un tasto di deploy cosi da poterlo mettere online.

sulla sinistra scrivi cosa vuoi fare e sulla destra vedi già l'APP

Per cosa usarlo?

Perfetto per fare MVP e tools verticali

Io per esempio ho fatto generare un motore di ricerca semantico per il blog ModelliMentali.com - lo vedi all'opera qui: https://www.modellimentali.com/cerca-con-ai/

Agenti: Manus.im

Manus è un agente di intelligenza artificiale generale che non si limita a ragionare, ma naviga e produce.
Eccelle in una vasta gamma di compiti, sia nel lavoro che nella vita quotidiana, con risultati particolarmente interessanti

AI Generative: DeepSeek

Deepseek è un modello linguistico open-source rivoluzionario in termini di costi/prestazione, che raggiunge risultati paragonabili al modello o1 di OpenAI pur mantenendo l’accessibilità garantita dalla licenza MIT.

Ha dei benchmark impressionanti e 3 funzioni principali. Lo trovi qui:chat.deepseek.com/

Chat

Per prompt semplici Risultati comparabili a 01 di OpenAI

Sistema di ragionamento

DeepSeek-V3 ha una funzione di “deep thinking”, che gli consente di analizzare e processare le informazioni con una profondità e precisione senza precedenti.

Real Time Web Search

DeepSeek-V3 è stata la prima ad avere una funzione avanzata di ricerca, e ancora adesso funziona molto bene

AI Generative: Mistral

Ultimo ma non ultimo una AI generativa Europea open weight con una serie di modelli verticali interesanti come quello sulla matematica, sull'intermediazione culturale (molto forte sui paesi del sud est asiatico), motore di ricerca interno a un sito (lo stesso che ho usato insieme a v0dev nell'esempio precedente)

Non da i risultati di un ChatGPT, ma se dovessi sviluppare qualcosa di sicuro a prova di GDPR guarderei in questa direzione.

Tabelle Comparative

Tabella di valutazione personale

Tabelle generate da ChatGPT, perdonatemi.

ChatGPT

Modello	Limite d’Uso	Funzionalità	Input Supportati
GPT-4o	Illimitato	GPTs, Analisi dati, Ricerca, Generazione immagini, Canvas, Voce avanzata	Documenti, Immagini, CSV, Audio, Video
GPT-4.5	20 richieste/settimana	Analisi dati, Ricerca, Generazione immagini, Canvas, Voce	Documenti, Immagini, CSV, Audio, Video
o4-mini	300 richieste/giorno	Analisi dati, Ricerca, Generazione immagini, Canvas, Ricerca approfondita	Documenti, Immagini, CSV
o4-mini-high	100 richieste/giorno	Analisi dati, Ricerca, Generazione immagini, Canvas	Documenti, Immagini, CSV
o3	100 richieste/settimana	Analisi dati, Ricerca, Generazione immagini, Canvas, Ricerca approfondita	Documenti, Immagini, CSV
o1-pro	5 richieste/mese	Ricerca	Immagini

Caratteristica	GPT-4o	GPT-4.5	o4-mini	o4-mini-high	o3	o1-pro
Descrizione	Il più completo e multimodale	Creativo e collaborativo	Tecnico e rapido	Tecnico avanzato	Complesso e strategico	Ragionamento profondo
Punti di forza	Capacità complete, voce avanzata, input video e audio	Creatività, chiarezza, collaborazione	Velocità, efficienza	Precisione tecnica, accuratezza	Analisi a più fasi, strategia	Accuratezza su compiti complessi
Multilingua	✅	✅	✅	✅	✅	❌ (non specificato)
Visione	✅	✅	✅	✅	✅	✅ (solo immagini)
Pensiero Esteso	✅	❌	❌	❌	✅ (ricerca approfondita)	❌
Latenza	Veloce	Media	La più veloce	Veloce con maggiore accuratezza	Media	Lenta ma precisa
Cut-off training	Non specificato (2024)¹	Non specificato	Non specificato	Non specificato	Non specificato	Non specificato
Limiti d’Uso	Illimitato	20 richieste / settimana	300 richieste / giorno	100 richieste / giorno	100 richieste / settimana	5 richieste / mese
Input supportati	Documenti, immagini, CSV, audio, video	Documenti, immagini, CSV, audio, video	Documenti, immagini, CSV	Documenti, immagini, CSV	Documenti, immagini, CSV	Solo immagini
Funzionalità	GPTs, analisi dati, ricerca, immagini, canvas, voce avanzata	Analisi dati, ricerca, immagini, canvas, voce	Analisi dati, ricerca, immagini, canvas, ricerca approfondita	Analisi dati, ricerca, immagini, canvas	Analisi dati, immagini, ricerca approfondita	Solo ricerca

Claude Sonnet

Caratteristica	Claude 3.7 Sonnet	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Haiku
Descrizione	Il più intelligente	Versione precedente	Il più veloce	Potente per compiti complessi	Ultra veloce e compatto
Punti di forza	Intelligenza top + pensiero esteso	Alta intelligenza	Velocità estrema	Intelligenza e fluidità elevate	Prestazioni mirate rapide
Multilingua	✅	✅	✅	✅	✅
Visione	✅	✅	✅	✅	✅
Pensiero Esteso	✅	❌	❌	❌	❌
Latenza	Rapido	Rapido	Il più rapido	Moderato	Il più rapido
Cut-off training	Ott 2024¹	Apr 2024	Lug 2024	Ago 2023	Ago 2023

Gemini

Caratteristica	Gemini 2.5 Pro	Gemini 2.5 Flash	Gemini 2.0 Flash	Gemini 2.0 Flash-Lite	Gemini 1.5 Pro	Gemini 1.5 Flash
Descrizione	Modello più potente per ragionamento avanzato	Ottimo rapporto qualità-prezzo	Modello multimodale di nuova generazione	Ottimizzato per costi e latenza	Ragionamento complesso e contesto esteso	Prestazioni rapide e versatili
Punti di forza	Ragionamento avanzato, comprensione multimodale, codifica complessa	Adattivo, configurabile, efficiente	Generazione di codice e immagini, analisi file	Efficienza nei costi, bassa latenza	Contesto fino a 2 milioni di token, supporto multimodale	Velocità, versatilità, supporto multimodale
Multilingua	✅	✅	✅	✅	✅	✅
Visione	✅	✅	✅	✅	✅	✅
Pensiero Esteso	✅	✅ (configurabile)	✅	❌	✅	❌
Latenza	Media	Bassa	Bassa	Molto bassa	Media	Bassa
Cut-off training	Non specificato	Non specificato	Non specificato	Non specificato	Non specificato	Non specificato
Limiti d’Uso	Accesso gratuito con limiti standard	Accesso gratuito con limiti standard	Accesso gratuito con limiti standard	Accesso gratuito con limiti standard	Accesso gratuito con limiti standard	Accesso gratuito con limiti standard
Input supportati	Testo, immagini, audio, video	Testo, immagini, audio, video	Testo, immagini, audio, video	Testo, immagini, audio, video	Testo, immagini, audio, video	Testo, immagini, audio, video
Funzionalità	Ragionamento avanzato, generazione codice, comprensione multimodale	Pensiero adattivo, efficienza nei costi	Generazione codice e immagini, analisi file	Efficienza nei costi, bassa latenza	Ragionamento complesso, contesto esteso	Prestazioni rapide, versatilità

Fonti

OpenAI Enterprise Models
Claude 3.7 Sonnet and Claude Code
Link con tutti gli update di Gemini : gemini.google.com/updates
Mistal Models

Intro: Perché questa guida?

Ultimo aggiornamento:

Guida breve ai modelli OpenAI: Confronto tra Modelli "ChatGPT"

GPT-4o

GPT-4.5

OpenAI o4-mini

OpenAI o4-mini-high

OpenAI o3

OpenAI o1 Pro Mode

OpenAi Codex

Guida breve ai modelli Anthropic: Confronto tra Modelli "Claude"

Claude 3.7 Sonnet

Claude 3.5 Haiku

Guida ai Modelli di Gemini

Gemini 2.5 Pro

Gemini 2.5 Flash

Gemini 2.0 Flash

Gemini 2.0 Flash-Lite

Gemini 1.5 Pro

Gemini 1.5 Flash

Vibe Coding: V0.dev / Vercel

Per cosa usarlo?

Agenti: Manus.im

AI Generative: DeepSeek

Chat

Sistema di ragionamento

Real Time Web Search

AI Generative: Mistral

Tabelle Comparative

Tabella di valutazione personale

Tabelle generate da ChatGPT, perdonatemi.

ChatGPT

Claude Sonnet

Gemini

Fonti

You might also like...

Memory Updated... 8 (Dicembre 2025)

Vending-Bench: come testare un Agente nel mondo reale (o quasi)

Sora - l'ultima App di OpenAI ha un feed. La nuova generazione di Social Network: cosa succederà alla nostra capacità di prestare attenzione?

Memory Updated... 7 (novembre 2025)

Memory Updated... 6