Memory Updated...9
Clawdbot / Moltbot / OpenClaw
La novità di questi giorni è Clawdbot (che ha già cambiato nome 2 volte). Clawabot è un agente opensource che si installa locale e che si aggancia via API ai vari LLM e finalmente da la sensazione di assistente personale.
Come ogni cosa su cui c'è un hype spropositata, mi siedo sul fiume e aspetto che passino i cadaveri dei vari FacciaBuffi.
Quello che posso dire in questi pochi giorni: stai attento se agganci le tue API e gli dai un comando, senza stare li a controllare... potrebbe farti pagare un bella cifra per l'uso di risorse.
OpenAI
Se ho aperto con OpenClaw, fammi fare un salto indietro con ChatGPT 5.2, uscito ormai quasi due mesi fa, con alcune informazioni passate sotto traccia (il motore grafico, le Apps e il recente Prism)
ChatGpt 5.2
ChatGPT 5.2. Ha due varianti: base e Pro, non esiste la mini per ora. Codex 5.2 pronto - il cutoff time è il 31 Agosto 2025, aggiornamento significativo: le precedenti versione erano metà 2024. Stessa finestra di contesto.
Altra cosa interessante: il modello di riconoscimento visivo è molto migliorato: gli ho dato in pasto la struttura di una pagina di wordpress e mi ha detto dove inserire del codice. Mi ha anche creato un Json da importare i suggerendomi persino la struttura.
Aumentati i costi e - neanche a dirlo - grossi risultati nei benchmark... anche se ormai sapete che io faccio riferimento a un solo benchmark. GPT 5.2 performa decisamente meglio della versione 5.1 (sotto a Gemini 3 Pro)

ChatGPT 5.2 permette anche
Update del generatore immagini

Memore dell'esplosione di iscrizioni dopo il GhibliGate e conscio del fatto che Nano Banana è mostruoso, anche ChatGPT ha fatto un upgrade del suo generatore di immagini.
Come funziona? Per ora l'ho solo testato su un prompt senza fare fotoritocco, ma direi che funziona bene.
Ho chiesto un modello in 3D isometrico di Milano e questo è il risultato. Non vedo ragazzi col pantalone stretto e il cappellino appoggiato al microcefalo che girano in monopoattino... questo gli impedisce di prendere il massimo dei voti, ma direi chatgpt Image è un bel 9/10.

OpenAi Apps
ChatGpt finalmente si integra nativamente con un buon numero di APP, le più interessanti: Photoshop (che promette di tradurre le idee in comandi), Canva, Google Calendar
Come attivarre le OpenAI Apps?
Da browser, clicca sul tuo avatar in basso a sinistra vai su Impostazioni /Setting > Apps & Connectors, seleziona e connetti (dovrai dare i diritti di accesso)
ChatGPT Health
Annunciato ChatGPT Health. "Personalmente ho già dei rimorsi per aver fatto il test con 23&Me e non credo che caricherò i miei dati medici su chatGpt..." Questo è il pensiero che mi faccio a mente lucida, ma già so che quando starò poco bene il primo a cui chiedo informazioni sarà la macchina di OpenAI.
Sulla pagina dedicata dicono che non verranno usati i tuoi dati per il training e che si potrà cancellarli quando vogliamo... ma il pregresso non mi fa riporre molta fiducia in queste affermazioni. Link annuncio
Prism
Prism è un altro strumento di OpenAI focalizzato sulla scrittura di testi scientifici (usa Latex). E' buffo notare come PRISM sia un programma di sorveglianza elettronica, guerra cibernetica e Signal Intelligence, classificato come di massima segretezza, usato per la gestione di informazioni raccolte attraverso Internet e altri fornitori di servizi elettronici e telematici. L'ironia del fatto che nel board di Open Ai ci sia un ex dirigente NSA non è stata immediata per tutti.
Il video demo è qui https://openai.com/index/introducing-prism/?video=1158873872
Piccolo appunto: OpenAI in questo caso sterza la narrazione di ChatGPT come acceleratore di risultati umani invece che la solita di creatrice di cose extra-umane. Interessante
Manus 1.6
due grosse novità da parte di Manus: la prima è l'uscita delle versione 1.6. Performance e costi molti migliorati.
La seconda è che entra a far parte della famiglio Meta. L'acquisto è avvenuto per 2 Bilions. Meta si è accorta che forse fa prima a comprare e distribuire.
Cosa vorrà dire questo non ci è dato sapere.
Z.ai rilascia GLM 4.7 - LLM opensource
Z.ai, conosciuta come Zhipu AI prima del rebrandng, ha rilasciato un modello Opensource che ha qualità paragonabile a Sonnet 4.5 e ChatGPT 5.1 ma a un costo 84% minore.
Zhipu AI era una delle 4 tigri dell'AI cinese ma era stata considerata fuori dai giochi fino a un paio di mesi fa. Che ribaltoni ci sono. Link su Hugging Face
Suno
Suno ha aggiornato la funzione Personas: adesso il modello riesce a concentrarsi SOLO sulla voce: questa può rimanere la stessa in un album intero.
Questa capacità di distinguere la voce vuol dire che si possono mischiare generi diversi...
usando la funzione upload di una canzone, riesce a separare molto bene strumenti e chiedere di fare una cover di un pezzo in altri generi.
Ho preso questa mia traccia strumentale (elettronica downtempo/ IDM )
e ne ho create due Progressive Rock:
Se si usano melodie meno rarefatte i risultati sono anche migliori.
Suno Samples
Sempre da Suno, un altro aggiornamento permette di estrarre dei campioni musicali dalle canzone che ha generato e persino quelle caricate. Se hai 10 minuti qui c'è tutto il workflow.
Google / Alphabet
Come ho scritto nell'articolo del pozzo gravitazionale di google, L'AI generativa è uno strato su tutti prodotti Google, rendendoli usabili anche dai non addetti.
Ai in Google Analytics

Google ha rilasciato la beta di Analytics Advisor, chatbot che ha l'obiettivo di rispondere a chi vuole usare Google Analytics. Da quando è uscita la versione 4 è rischiesta un'abilità maggiore nell'ottenere i dati (tra looker studio e query). L'arrivo del Chatbot - quando sarà funzionante bene - è un manna dal cielo.
Divertente come Google abbia tolto funzionalità per creare un bisogno e poi abbia offerto una soluzione :-)
Gemini 3 Flash
Google infierisce su OpenAI. Dopo il rilascio della versione 5.2 potente, ma lenta e costosta, Google risponde con la versione Flash di Gemini 3: veloce e super economica, i cui benchmark sono simili al concorrente OpenAI.
Verifica di Contenuti sintetici
Google ha aggiunto la verifica video alla sua app Gemini, consentendo agli utenti di vedere se i contenuti sono stati creati con gli strumenti di intelligenza artificiale di Google. Gli utenti possono caricare video e chiedere se sono stati generati dall'intelligenza artificiale.
L'app esegue la scansione alla ricerca di filigrane SynthID nelle tracce audio e video, fornendo feedback basandosi sulle funzionalità di verifica delle immagini già esistenti di Google.
Xai / Grok
Grok Voice Agent API
xAI ha rilasciato le API vocali di Grok di Tesla a tutti gli sviluppatori. Hanno il tempo di risposta più veloce (meno di un secondo dall'arrivo della voce) e hanno un costo di circa 0.05$ al minuto (la metà di quelle di OpenAI. Link
Meta
Su Facebook mi è apparsa la funzione Channel. Dovrebbe essere simile alla funzione Broadcast di Instragram / Newsletter.
Meta Ads
sui meta Ads hanno cambiato molte cose (as usual) lato creatività e ho visto per la prima volta anche la possibilità di mettere un cap alle volte che mostri la tua pubblicità. Mi piace come cosa, non vedo l'ora di vedere i vostri fenomeni paranormali disquisire 3 ore in video sul tubo su questo argomento.

Eleven Labs
Eleven Labs esce con la beta della V3. Due cose sono state migliorate alla grande:
- La possibilità di controllare emozione, tono e direzione con dei tags come per esempio [giggles]
- Generare una conversazione tra persone diverse.
Siamo davvero ai limiti di quanto un orecchio non esperto possa capire sia AI.
Questo Memory Update ci ha messo davvero troppo a uscire, mea culpa.
Ci vediamo a breve, magari con qualcosa di più pratico (Midjourney vs Nano Banana vs ChatGPT images?)
Member discussion