16 lug 2025 5 min read OpenAI

Memory Updated 3 (Luglio 2025)

Breve recap di tutti gli ultimi rilasci: Come al solito le notizie in cui si diceva di aver raggiunto il tetto nello sviluppo di AI Generative erano un filo premature

Evito di chiaccherarmi addosso: i memory update devono essere veloci e al punto.

LLM > OpenAI

Un'ordinanza di un giudice ha obbligato OpenAi di tenere il log di tutte le chat temporanee, e anche quelle cancellate e quelle via API. Come descritto Sui Mak's File le ragioni sono nobili, il risultato un po' discutibile.

OpenAI, lato suo si sta oppenendo alla decisione.

Agentic Browser > Perplexity

Perplexity annuncia Comet, un brower con agenti. Per ora solo su invito. Io sono in attesa, appena mi attivano ne parlo sui Mak's File.

Anche OpenAI sta sviluppando qualcosa di simile... siamo pronti alla terza guerra dei browser?

LLM > Grok 4

Grok ha fatto scintille: prima Grok 3 ha avuto un upgrade che con qualche semplice Jail break produceva risultati davvero ben oltre il limite delle decenza (tanto che la CEO di twitter / X si è licenziata).

Nessuno si è stupito della cosa: quanto prendi terabite di 4chan e li usi per creare un bilanciamento anti-woke potrai solo sviluppare una Ai che dice cose fuori dal mondo.

Però....

il 9 luglio è uscito Grok 4 che ha distrutto quasi tutti i benchmark. Grok ha dei piani base ma il piano pro da 300$, è raggiungibile su Grok.com (non in europa).

Non è il più performante per la programmazione e il multimodale, ma è stata rilasciata una road map in cui vengono mostrati gli upgrade da qui a fine anno.

Nota: ovviamente Come ogni cosa bisogna prendere i risultati dei benchmark con le pinze e vedere come funziona sul campo.

Audio > Udio

La modifica delle track su Udio ha subito un restyling: la nuova interfaccia, chiamata Sessions, offre uno spazio di lavoro basato su una timeline, in modo da poter produrre con precisione e gestire tutte le modifiche in un'unica sessione.

Audio > Suno

Anche Suno ha rilasciato un Update al suo recente modello (4.5) - Aggiunge Weirdness e Style Influence

Come funziona?

Weirdness ci dice quanto potrebbe suonare particolare, Style influence è la coerenza col prompt

In questo caso il prompt è "Lofi triphop, chill vibes"

Lofi triphop - 100 weird 0Style influence:

https://suno.com/s/VDQCN33OupBgT0B5

Lofi triphop - 0 weird 100Style influence:

https://suno.com/s/bwDPKq7m5hAG19xL

Video > Midjourney

Midjourney entra nell'arena dell'animazione video. i risultati sono interessanti: non tutte le animazioni sono top, ma hanno due ENORMI pregi: super economiche e partono da un'immagine. Ho creato una guida qui.

Vibe Coding > Anthropic

Anthropic ha aggiunto una nuova funzionalità al suo chatbot Claude AI che consente agli utenti di creare app basate sull'intelligenza artificiale direttamente all'interno dell'app. Si basa sulla funzionalità Artifacts di Anthropic, che consente agli utenti di vedere e interagire con ciò che chiedono a Claude di creare. Loveble e V0.dev di vercel hanno già qualcosa di simile e ti svolta davvero

Vibe Coding > Codex di Open AI

Codex di OpenAI ora può accedere a internet durante l’esecuzione di task, gestendo compiti che richiedono risorse esterne (es. installazione di dipendenze o test).

LLM > ChatGPT si connette con Google Drive, La suite Microsoft, DropBox e anche Hubspot

Finalmente, dopo mesi in cui connettere i tool di produttività è stato piuttosto complesso adesso è possibile farlo con un click.

Agganciare Excel / Google sheet permette di utilizzare la potenza dei fogli di calcolo, Hubspot è in arrivo e permetterà un grande arricchimento dei dati del CRM.

Teams permette la registrazione e la trascrizione dei meeting. NON sono cosi sicuro che sia saggio dare le proprie informazioni in pasto a OpenAi, ma adesso è possibile.

Questo senza parlare della possibilità di usare la connessione Calendar per ottimizzare tempi e modi.

LLM > OpenAI > GPTs Personalizzati

Anche se sono stati per mesi figli di un Dio minore sembra che forse OpenAI si sia data una sveglia. Nell'ultimo rilascio si può infatti:

Selezionare il modello.
Ricerca web molto migliorata (compreso Deep Research)
Canvas

Ho visto che hanno aumentato anche il numero di APP connesse, vedi sezione sopra, ma desso c'è Dropbox, Box, Gmail e Outlook (oltre a Google Drive che funziona da un po').

LLM > OpenAI rilascia O3-pro

OpenAI ha lanciato ufficialmente O3-pro, l’ultima e più avanzata versione della sua linea di modelli di intelligenza artificiale dedicati al reasoning (ragionamento).
Progettato per spingere al massimo l’affidabilità in ambiti complessi come scienza, matematica e programmazione, O3-pro è ora disponibile per gli utenti ChatGPT Pro e Team.

A differenza dei modelli AI convenzionali, O3-pro fa parte della famiglia dei “modelli di ragionamento” di OpenAI, evoluzione diretta del modello O3 base.
Questi modelli sono progettati per affrontare i problemi passo dopo passo, migliorando così la coerenza in compiti ad alta densità logica.
Secondo OpenAI, questa nuova versione eccelle soprattutto in ambiti come scienza, istruzione, business, scrittura e programmazione.

Nelle valutazioni interne condotte da esperti, O3-pro ha superato costantemente sia il predecessore O3, sia il modello predefinito precedente (O1-pro), in particolare per quanto riguarda chiarezza, accuratezza, capacità di seguire istruzioni e completezza.

Video > HeyGen

HeyGen ha lanciato AI Studio, un editor video basato su script che consente il controllo dettagliato su avatar, voce, gesti e montaggio.

Audio > ElevenLabs

ElevenLabs ha rilasciato Eleven v3, ora compatibile con oltre 70 lingue e capace di esprimere emozioni tramite tag vocali come excited o laughing.

Video > Luma Labs - coerenza nei video

Luma Labs ha introdotto la funzione Modify Video, che permette di trasformare video reali mantenendo dettagli originali, modificandone selettivamente altri.

Agentic AI > Kimi K2

Uscito un modello LLM OpenWeight, Kimi K2 di moonshot.ai, che pur avendo un utilizzo molto limitato funziona benissimo in due cose: Connessione coi Tools e capacità di generare Data. Anche in questo caso la Cina esce con un qualcosa di potenzialmente devastante per il mercato

LLM > Mistral rilascia il primo modello di ragionamento Europeo

Mistral, azienda di AI Francese rilascia il primo reasoning model europeo chiamato Magistral Europeo vuol dire che sottosta a tutte le regolamentazioni EU.

Se volete giocare un po' con il vibe coding la combo V0.dev + Mistral è perfetta.

Lo stato dei modelli di ragionamento

Visto che abbiamo parlato di modelli di ragionamento, facciamo un po' la cronostoria.

OpenAI aveva aperto la pista l’anno scorso con i primi modelli dedicati al ragionamento. Poi è arrivata Google, subito a ruota.

A gennaio 2025, DeepSeek è entrato a gamba tesa: un modello open-source a basso costo, con capacità di reasoning avanzate.

Meta invece niente ancora di autonomamente focalizzato sul reasoning.

Nel frattempo, Mistral lancia Magistral Small, open-source, e prepara Magistral Medium, pensato per le aziende.

Open vs Closed

Anche se la discussione di cosa vuol dire "open" nel dominio dei LLM è ancora aperta possiamo vedere le due filosofie. Si usa molto spesso il termine Open Weight più che open source.

Le aziende americane tengono stretti i gioielli di famiglia — modelli avanzati spesso blindati.
Le cinesi, da DeepSeek a Alibaba, invece, scelgono la via dell’open-source come dimostrazione pubblica di forza. Gesto tecnico o geopolitico?