8 min read

Guida breve ai modelli di LLM / AI Generative

Esistono diverse aziende che offrono la propria AI Generativa. Ogni LLM ha anche diversi modelli ed è oggettivamente complesso capire quale modello utilizzare dentro la stessa famiglia di servizi. in questo articolo facciamo un po' di ordine.
Guida breve ai modelli di LLM / AI Generative
Creata con Midjourney - trovi il prompt qui: https://manolo.macchetta.com/i-prompt-di-midjourney-su-notion/

Intro: Perché questa guida?

OpenAI, Anthropic, Alphabet, Mistral, Deepseek: esistono diverse aziende che offrono il proprio LLM. Ogni LLM poi ha, nella stessa offerta, anche diversi modelli che fanno cose complementari, a questo aggiungiamo gli agenti: è oggettivamente facile perdersi nel mare magnum delle proposte.

Molto probabilmente questa è solo una difficoltà temporanea e tra qualche mese questo post non avrà più nessuna utilità dato il mixure of expert sarà standard.
Nel frattempo, usiamolo come guida.

Se credi che stia lasciando indietro qualche Ai fammelo sapere.

Ultimo aggiornamento:

  • 18 Maggio - Aggiunta anche tabella riassuntiva
  • 17 maggio 2025 - aggiunto AI Codex
  • 5 Maggio - Prima bozza

Guida breve ai modelli OpenAI: Confronto tra Modelli "ChatGPT"

Immagine presa da openai.com/news/

GPT-4o

Eccelle nei compiti quotidiani: brainstorming, sintesi, email, contenuti creativi.
Completamente multimodale: supporta quasi tutte le funzionalità (GPTs, analisi dati, ricerca, generazione immagini, canvas, voce avanzata) e input (documenti, immagini, file CSV, audio, video).

Esempi di prompt:

  • Riassumi i verbali della riunione nei punti chiave.
  • Scrivi un'email di follow-up dopo l’avvio di un progetto.
  • Correggi il mio report.
  • Fai brainstorming per un piano di lancio in tempo reale—puoi caricare schizzi o screenshot.

GPT-4.5

Ideale per attività creative: intelligenza emotiva, comunicazione chiara, creatività e approccio collaborativo e intuitivo al brainstorming.

Esempi di prompt:

  • Crea un post coinvolgente su LinkedIn sulle tendenze dell’AI.
  • Scrivi una descrizione prodotto per una nuova funzionalità.
  • Redigi una lettera di scuse al cliente con tono empatico.

OpenAI o4-mini

Compiti tecnici rapidi: domande STEM veloci, programmazione, ragionamento visivo.

Esempi di prompt:

  • Estrai i dati chiave da un file CSV.
  • Fornisci un riassunto rapido di un articolo scientifico.
  • Risolvi velocemente questo errore Python (traceback).

OpenAI o4-mini-high

Compiti tecnici dettagliati: codice avanzato, matematica, spiegazioni scientifiche. Pensa più a lungo per offrire maggiore precisione.

Esempi di prompt:

  • Risolvi un'equazione matematica complessa e spiega i passaggi.
  • Scrivi query SQL per l’estrazione dei dati.
  • Spiega un concetto scientifico in termini semplici.

OpenAI o3

Compiti complessi o a più fasi: pianificazione strategica, analisi approfondite, coding estensivo, matematica avanzata, scienza e ragionamento visivo.

Esempi di prompt:

  • Sviluppa un’analisi dei rischi per l’espansione in un nuovo mercato.
  • Scrivi un piano strategico aziendale basato su dati competitivi.
  • Esegui un’analisi multi-step su questo CSV—prevedi il prossimo trimestre e crea un grafico della tendenza.
  • Rivedi le metriche delle pipeline, visualizza i dati e cerca nuove strategie per la parte alta del funnel.

OpenAI o1 Pro Mode

Ragionamento complesso: impiega un po’ più di tempo per pensare, ma restituisce la precisione necessaria per compiti intricati.

Esempi di prompt:

  • Redigi un memo dettagliato di analisi dei rischi per l’adozione delle norme EU sulla privacy dei dati.
  • Genera un riassunto di ricerca di più pagine sulle tecnologie emergenti.
  • Crea un algoritmo per la previsione finanziaria basato su modelli teorici.

OpenAi Codex

Basato su codex-1, una versione ottimizzata del modello o3, Codex è progettato per:

  • scrivere funzionalità,
  • correggere bug,
  • eseguire test automatici,
  • analizzare interi codebase.

Il modello genera codice più "pulito" e conforme alle istruzioni rispetto ai predecessori, ed è in grado di testare iterativamente il codice fino al completamento corretto.

Guida breve ai modelli Anthropic: Confronto tra Modelli "Claude"

Immagine presa da anthropic.com/news

Claude 3.7 Sonnet

Il modello più intelligente
Claude 3.7 Sonnet è il primo modello sul mercato con ragionamento ibrido e rappresenta l’ultima evoluzione dell’intelligenza Claude.

  • Input: testo e immagini
  • Output: testo
  • Finestra di contesto: 200k token
  • Extended Thinking: sì (ragionamento potenziato)

Claude 3.5 Haiku

Il modello più veloce

  • Input: testo e immagini
  • Output: testo
  • Finestra di contesto: 200k token

Guida ai Modelli di Gemini

immagine presa dal sito: blog.google/technology/developers/

Gemini 2.5 Pro

Eccelle in:
Ragionamento avanzato, generazione di codice, comprensione di documenti complessi, interazione multimodale (testo, immagini, audio, video).

Cosa fa:
Gemini 2.5 Pro è il modello più intelligente di Google AI al momento.
Offre capacità avanzate di problem solving, scrittura creativa, analisi file, visione, audio comprehension e contesto di lunga durata. È ideale per task complessi, brainstorming tecnici e generazione di contenuti multiformato.

Multimodale:
upporta testo, immagini, audio e video come input.

Capacità principali:

  • Codifica avanzata
  • Ragionamento logico
  • Analisi documentale e di file strutturati
  • Comprensione e generazione di immagini
  • Interazione audio/video
  • Lunga memoria contestuale (milioni di token)

Gemini 2.5 Flash

Eccelle in:
Velocità, versatilità, ottimo compromesso tra costi e prestazioni.

Cosa fa:
Modello veloce e leggero con supporto multimodale. Adatto a task quotidiani, risposte rapide, prototipazione.

Esempi di prompt:

  • Riassumi questa mail in 3 punti.
  • Crea un carosello per Instagram da questo testo.
  • Analizza questa tabella Excel.

Gemini 2.0 Flash

Eccelle in:
Efficienza, produzione di contenuti, analisi veloce.

Cosa fa:
Gestisce immagini, testo e codice. Ottimo per app AI leggere o operazioni in tempo reale.

Esempi di prompt:

  • Genera un titolo accattivante per questo articolo.
  • Spiega cosa rappresenta questo grafico.
  • Riformula questo paragrafo in modo più diretto.

Gemini 2.0 Flash-Lite

Eccelle in:
Latenza minima, costo bassissimo.

Cosa fa:
Perfetto per chatbot, microtask e risposte istantanee. Leggerissimo.

Esempi di prompt:

  • Cos’è l’IVA?
  • Dammi un sinonimo di “innovativo”.
  • Crea una call-to-action di 5 parole.

Gemini 1.5 Pro

Eccelle in:
Contesto lunghissimo, analisi articolate.

Cosa fa:
Modello robusto per ragionamenti complessi su grandi quantità di testo. Supporto multimodale.

Esempi di prompt:

  • Analizza questo libro e individua i temi principali.
  • Scrivi una strategia di go-to-market.
  • Crea uno script per elaborare migliaia di righe CSV.

Gemini 1.5 Flash

Eccelle in:
Reattività, bilanciamento prestazioni-costi.

Cosa fa:
Ideale per risposte rapide, task multitipo. Supporta anche immagini e audio.

Esempi di prompt:

  • Crea una caption per questo video.
  • Riassumi il contenuto di questa immagine.
  • Suggerisci 5 titoli per un blog post.

Vibe Coding: V0.dev / Vercel

Se parliamo di vibe coding io mio sguardo a cuoricino 😍 va a v0.dev.
Anche se forse non è il migliore tra i sistemi di coding, ha un vantaggio enorme: divide lo schermo in due: sulla parte a sinistra la finestra di dialogo e sulla parte di destra c'è il codice generato e la preview dello stesso (funzionante!) c'è anche un tasto di deploy cosi da poterlo mettere online.

sulla sinistra scrivi cosa vuoi fare e sulla destra vedi già l'APP

Per cosa usarlo?

Perfetto per fare MVP e tools verticali

Io per esempio ho fatto generare un motore di ricerca semantico per il blog ModelliMentali.com - lo vedi all'opera qui: https://www.modellimentali.com/cerca-con-ai/

Agenti: Manus.im

Immagine presa da manus.im/?index=1

Manus è un agente di intelligenza artificiale generale che non si limita a ragionare, ma naviga e produce.
Eccelle in una vasta gamma di compiti, sia nel lavoro che nella vita quotidiana, con risultati particolarmente interessanti

AI Generative: DeepSeek

presa da Deepseek.blog/

Deepseek è un modello linguistico open-source rivoluzionario in termini di costi/prestazione, che raggiunge risultati paragonabili al modello o1 di OpenAI pur mantenendo l’accessibilità garantita dalla licenza MIT.

Ha dei benchmark impressionanti e 3 funzioni principali. Lo trovi qui:chat.deepseek.com/

Chat

Per prompt semplici Risultati comparabili a 01 di OpenAI

Sistema di ragionamento

DeepSeek-V3 ha una funzione di “deep thinking”, che gli consente di analizzare e processare le informazioni con una profondità e precisione senza precedenti.

DeepSeek-V3 è stata la prima ad avere una funzione avanzata di ricerca, e ancora adesso funziona molto bene

AI Generative: Mistral

imistral.ai/models

Ultimo ma non ultimo una AI generativa Europea open weight con una serie di modelli verticali interesanti come quello sulla matematica, sull'intermediazione culturale (molto forte sui paesi del sud est asiatico), motore di ricerca interno a un sito (lo stesso che ho usato insieme a v0dev nell'esempio precedente)

Non da i risultati di un ChatGPT, ma se dovessi sviluppare qualcosa di sicuro a prova di GDPR guarderei in questa direzione.

Tabelle Comparative

Tabella di valutazione personale

Tabelle generate da ChatGPT, perdonatemi.

ChatGPT

Modello Limite d’Uso Funzionalità Input Supportati
GPT-4o Illimitato GPTs, Analisi dati, Ricerca, Generazione immagini, Canvas, Voce avanzata Documenti, Immagini, CSV, Audio, Video
GPT-4.5 20 richieste/settimana Analisi dati, Ricerca, Generazione immagini, Canvas, Voce Documenti, Immagini, CSV, Audio, Video
o4-mini 300 richieste/giorno Analisi dati, Ricerca, Generazione immagini, Canvas, Ricerca approfondita Documenti, Immagini, CSV
o4-mini-high 100 richieste/giorno Analisi dati, Ricerca, Generazione immagini, Canvas Documenti, Immagini, CSV
o3 100 richieste/settimana Analisi dati, Ricerca, Generazione immagini, Canvas, Ricerca approfondita Documenti, Immagini, CSV
o1-pro 5 richieste/mese Ricerca Immagini
Caratteristica GPT-4o GPT-4.5 o4-mini o4-mini-high o3 o1-pro
Descrizione Il più completo e multimodale Creativo e collaborativo Tecnico e rapido Tecnico avanzato Complesso e strategico Ragionamento profondo
Punti di forza Capacità complete, voce avanzata, input video e audio Creatività, chiarezza, collaborazione Velocità, efficienza Precisione tecnica, accuratezza Analisi a più fasi, strategia Accuratezza su compiti complessi
Multilingua ❌ (non specificato)
Visione ✅ (solo immagini)
Pensiero Esteso ✅ (ricerca approfondita)
Latenza Veloce Media La più veloce Veloce con maggiore accuratezza Media Lenta ma precisa
Cut-off training Non specificato (2024)¹ Non specificato Non specificato Non specificato Non specificato Non specificato
Limiti d’Uso Illimitato 20 richieste / settimana 300 richieste / giorno 100 richieste / giorno 100 richieste / settimana 5 richieste / mese
Input supportati Documenti, immagini, CSV, audio, video Documenti, immagini, CSV, audio, video Documenti, immagini, CSV Documenti, immagini, CSV Documenti, immagini, CSV Solo immagini
Funzionalità GPTs, analisi dati, ricerca, immagini, canvas, voce avanzata Analisi dati, ricerca, immagini, canvas, voce Analisi dati, ricerca, immagini, canvas, ricerca approfondita Analisi dati, ricerca, immagini, canvas Analisi dati, immagini, ricerca approfondita Solo ricerca

Claude Sonnet

Caratteristica Claude 3.7 Sonnet Claude 3.5 Sonnet Claude 3.5 Haiku Claude 3 Opus Claude 3 Haiku
Descrizione Il più intelligente Versione precedente Il più veloce Potente per compiti complessi Ultra veloce e compatto
Punti di forza Intelligenza top + pensiero esteso Alta intelligenza Velocità estrema Intelligenza e fluidità elevate Prestazioni mirate rapide
Multilingua
Visione
Pensiero Esteso
Latenza Rapido Rapido Il più rapido Moderato Il più rapido
Cut-off training Ott 2024¹ Apr 2024 Lug 2024 Ago 2023 Ago 2023

Gemini

Caratteristica Gemini 2.5 Pro Gemini 2.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 1.5 Pro Gemini 1.5 Flash
Descrizione Modello più potente per ragionamento avanzato Ottimo rapporto qualità-prezzo Modello multimodale di nuova generazione Ottimizzato per costi e latenza Ragionamento complesso e contesto esteso Prestazioni rapide e versatili
Punti di forza Ragionamento avanzato, comprensione multimodale, codifica complessa Adattivo, configurabile, efficiente Generazione di codice e immagini, analisi file Efficienza nei costi, bassa latenza Contesto fino a 2 milioni di token, supporto multimodale Velocità, versatilità, supporto multimodale
Multilingua
Visione
Pensiero Esteso ✅ (configurabile)
Latenza Media Bassa Bassa Molto bassa Media Bassa
Cut-off training Non specificato Non specificato Non specificato Non specificato Non specificato Non specificato
Limiti d’Uso Accesso gratuito con limiti standard Accesso gratuito con limiti standard Accesso gratuito con limiti standard Accesso gratuito con limiti standard Accesso gratuito con limiti standard Accesso gratuito con limiti standard
Input supportati Testo, immagini, audio, video Testo, immagini, audio, video Testo, immagini, audio, video Testo, immagini, audio, video Testo, immagini, audio, video Testo, immagini, audio, video
Funzionalità Ragionamento avanzato, generazione codice, comprensione multimodale Pensiero adattivo, efficienza nei costi Generazione codice e immagini, analisi file Efficienza nei costi, bassa latenza Ragionamento complesso, contesto esteso Prestazioni rapide, versatilità

Fonti

Mastodon