6 min read

Memory Updated... 6

Tante cose successe queste ultime settimane. La più importante è il rilascio di Browser con Agenti. Da quello che sembra si sta costruendo un layer tra il sistema operativo e le App con questi browser che piano piano faranno tutto loro.
Memory Updated... 6

I memory updated sono nati per dare news brevi ogni tot e condividerle coi colleghi... la velocità con cui però escono aggiornamenti e la mia retrosia a bombardarvi di email mi fa scrivere mail fiume come questa...

Ho quindi un dubbio e chiedo: per gli aggiornamenti, meglio due mail brevi o una più lunga in un mese? pigia "reply" e rispondimi!

Suno

Suno offre la funzione Hooks, dove permette di sincronizzare un video a una traccia creata precedentemente: obiettivo è ovviamente andare a prendere i creator TikTok e forse creare una piccola comuniytà di video meme. Mi aspetto che con l'arrivo delle API di Sora ci sarà da divertirsi.

Third Browser Wars ?

I più anzianotti si ricorderanno la prima Browser War di fine anni 90 (Internet Explorer vs Netscape Navigator), la seconda Browser War durata da metà anni 2000 fino alla decade sucessiva (Firefox vs Chrome vs Explorer). Se hai 5 minuti da investire c'è la pagina di Wikipedia che ne parla.

Dedicherò uno spazio sui Mak's File, dato che ridurre a una semplice Browser War è una banalizzazione che non apprezzo. Quello che stanno facendo è costruire un layer operativo e un sistema di distribuzione.

Perplexity - Comet

Comet, il browser di Perplexity, sta ricevendo molti aggiornamenti: lo sto usando abbastanza e i piccoli bachi che notavo su Youtube e altri siti ormai non esistono più. Funziona meglio di Safari ormai. Per chi come me sta cercando di segregare i browser in base all'uso è stato un toccasana. Testare i prompt e gli agenti su App diverse rispetto a ChatGPT è sempre utile. farò qualche tutorial se mi viene chiesto. Scaricalo qui.

OpenAI - Atlas

Anche OpenAi è uscito col browser. Anche Loro hanno un Agent Mode nativo, anche loro escono con un aggiornamento ogni 3 giorni.

Prima di inserire carte di credito e la vostra vita su Atlas, vi ricordo che OpenAi NON è ancora designata come VLOP/VLOSE (Very Large Online Platform/ Very Large Search Engine) da parte della Commissione Europea.
A differenza di Google (ad esempio) Atlas deve quindi sottostare "solo" al DSA, evitando tutti gli obblighi aggiuntivi di chi ha almeno 45mln di utenti medi mensili in UE (circa il 10% della popolazione). Questi obblighi sono pensati per "limitare" il potere delle grandi piattaforme e controllare da vicino l'influenza che possono avere sulla popolazione.

Firefox

Firefox ha la possibilità di integrare l'AI ormai da Aprile 2024. è l'icona in alto a sinistra, poi devi agganciarci un account.

Dalla versione 144 di metà ottobre c'è l'interessante funzione "profili" che finalmente aiuta a tenere separato profilo di lavoro da quello personale etc etc. Io ormai uso diversi browser, ma capisco l'utilità della funzione.

Manus 1.5

Manus, il primo LLM davvero Agentic compie 6 mesi e ha un update alla versione. Oltre a essere 5 volte più veloce ha abbracciato totalmente il vibe coding, dando la possibilità di avere tutta l'esperienza: webapp, database, domini, collaborazioni.

Oltre ovviamente a un potenziamento dell'esperienza agente già presente. Manus è uno dei prodotti più sottovalutati. Link.


Anthropic

Parlando di prodotti sottovalutati Anthropic è lo sleeping Giant della scena. Si parla dell'azienda solo quando rilascia grosse innovazioni (il protocollo MCP, e adesso le Skill). Ultimamente ha cambiato il marketing e il posizionamento. Mi sta piacendo molto il lavoro che stanno facendo anche da quel punto di vista.

Claude integra Microsoft 365. Puoi analizzare tuttii tuoi documenti, mail e ovviamente Teams.

Anthropic rilascia SKILLS

Anthropic ha annunciato una nuova funzionalità chiamata "Skills" (abilità) che mira a migliorare le capacità del modello di intelligenza artificiale Claude nell’esecuzione di compiti specializzati all’interno di app, ambienti di codice e API.

Ogni Skill funziona come una cartella che contiene istruzioni, script e risorse che Claude può utilizzare quando necessario. Questo permette al modello di operare meglio in ambiti specifici senza dover essere riaddestrato.

Le Skills sono concettualmente estremamente semplici: una skill è un file Markdown che indica al modello come svolgere un determinato compito, eventualmente accompagnato da documenti aggiuntivi e script pre-scritti che il modello può eseguire per aiutarlo a portare a termine le attività descritte dalla skill. Anthropic ne ha già rilasciato un bel pacchetto

A prima vista una versione simile ma potenziate delle knowledge dei GPT Personalizzati di OpenAI, ma sono trasversali a tutte le chat, combinabili tra di loro e possono richiamare anche fonti esterne (simile ai plugins / tools di ChatGPT). Potenzialmente questo è un altro grosso passo in avanti,


Google

Uscito AI Mode... ho fatto subito un test un po' ignorante (appositamente fumoso), ma ha preso una cantonata :-)

Google Earth AI

il recente aggiornamento di Google Earth fa una cosa clamorosa: non solo notifica dei disastri in tempo reale, ma si può interrogare l'AI per avere risposte.

Google sta giocando un gioco pericoloso, ma davvero molto utile. Quello che dico da sempre: a causa dei primi passi falsi molti reputano Google l'ultima ruota del carro, ma la sua capacità di poter far dialogare ogni tipo di informazione che il gigante ha raccolto negli ultimi 20 anni è il fossato che manca a tutti gli altri


OpenAI

OpenAI è davvero un fiume in piena. Oltre ad Atlas, già menzionato sopra ha aggiunto una serie di Prompt Packs da cui imparare nella sua academy (link qui) e settimana scorsa ha anche fatto il primo OpenAi DevDay degno di questo nome.

OpenAI DevDay 2025

Non so se sia opera di Jony Ive, ma di sicuro l'ultimo DevDay di OpenAi non è stato sommesso come i precedenti... magari ancora non grandioso come quelli di Apple, ma la strada è quella giusta

Il DevDay 2025 di OpenAI ha presentato sei novità: 6 strumenti che promettono di cambiare il modo in cui gli sviluppatori creano applicazioni AI, sembra che Codex abbia supportato alla scrittura dell’80 % del codice di Agent Builder in meno di sei settimane.

  • Le app possono ora risiedere direttamente dentro ChatGPT, grazie all’Apps SDK, aprendo un nuovo ecosistema “chat + app”.
  • AgentKit fornisce un kit completo per creare, gestire e scalare agenti AI, semplificando molto il passaggio da prototipo a produzione.
  • Codex diventa GA (generally available) e si integra con Slack: perfetto per pipeline real-time di sviluppo e automazione. La nicchia dei coder è piccola ma è importantissima.
  • GPT-5 Pro si pone come modello “top” nell’API per task ad alta precisione, mentre gpt-realtime-mini e gpt-image-1-mini offrono versioni più leggere e accessibili per voce, immagini e interazione veloce.
  • Sora 2 API mette in campo capacità di generazione video integrate — un grande passo avanti per contenuti creativi automatizzati... Questa forse è la cosa più facile da agganciare ai servizi consumer: Ho visto un sacco di servizi che hanno iniziato a implementare le API di Sora per creare i video.

Instant Checkout + Agentic Commerce Protocol

Sempre OpenAI si propone come marketplace.

Negli Stati Uniti, gli utenti ChatGPT (Free, Plus e Pro) possono ora acquistare direttamente da venditori Etsy all’interno della chat. A breve arriveranno anche oltre un milione di negozi Shopify, tra cui Glossier, SKIMS, Spanx e Vuori.
Per ora il sistema supporta acquisti singoli (Instant Checkout), ma presto includerà carrelli multipli e nuovi mercati internazionali.

OpenAI ha inoltre reso open source la tecnologia alla base di questo sistema, chiamata Agentic Commerce Protocol: uno standard aperto per il commercio AI, sviluppato con Stripe e vari partner commerciali, pensato per consentire a agenti AI, persone e aziende di collaborare nelle transazioni in modo sicuro, trasparente e facile da integrare.

Come funziona:

  • L’utente pone una domanda di shopping (“scarpe da corsa sotto i 100$”, “regali per chi ama la ceramica”).
  • ChatGPT mostra prodotti rilevanti non sponsorizzati, ordinati per pertinenza.
  • Se un prodotto supporta Instant Checkout, si può cliccare “Buy”, confermare indirizzo e pagamento, e concludere tutto senza uscire dalla chat.
  • I pagamenti e le spedizioni restano gestiti dal venditore con i propri sistemi; ChatGPT funge da agente AI intermediario, in modo sicuro.
  • I venditori pagano solo una piccola commissione per le vendite concluse, mentre il servizio è gratuito per gli utenti e non altera il ranking dei risultati. (almeno per ora :-P )

In sintesi: ChatGPT diventa un personal shopper con pagamento integrato, aprendo la strada a un nuovo modello di “agentic commerce” in cui conversazione e transazione si fondono in un unico flusso. Wordpress sta facendo qualcosa di simile

OpenAI & Paypal

Anche gli acquisti tramite paypal potranno essere nativi ChatGPT


Wystia

Wystia è un host video, tra i più utilizzati per i video corsi o per chi ha una libreria propria e non vuole metterla su youtube. Gli LLM però non vedevano i video su una pagina (banalmente non caricano i javascript).

adesso hanno fatto un patch e gli LLM riescono a vedere che c'è un video e leggere la trascrizione del video stesso

Strutturare i dati destrutturati

Fondata da Andrew Ng (Coursera, Google Brain, Baidu,) LandingAI è nata con l'obiettivo ambizioso ma vitale di usare modelli AI visuali per dare una struttura ai dati che fino a oggi erano in formati complessi da capire per una macchina (foglietti, appunti, documentazione cartacea. Link


Tanta roba anche questo mese: alcuni temi sono importanti per il futuro e verranno trattati anche sui Mak's File.

Mastodon