Episodio 43: Midjourney 6, Google prende appunti per te, AI per il medicale.
Questa edizione dei Mak's File ha una sezione su Midjourney 6 alpha. I passi avanti sono incredibili e se hai un account ti consiglio di andare a giocarci un po'. ho creato un folder apposta su Notion quindi parti pure con quei prompt.
Seconda Notizia, passata sotto traccia praticamente da tutti ma che per me merita un approfondimento: Google rilascia pubblicamente la sua Note Taking APP supportata da AI. Perché è notizia importante ne parlo più sotto.
Chiudo con un'articolo sulle Ai e le applicazioni nel medicale e la solita Gragnuola di news.
Ciao, Il mio nome è Manolo Macchetta e ti do il benvenuto ai Mak's File. Ogni settimana leggo decine di pagine di contenuti su Digital Transformation, Digital Marketing, AI & dintorni e te li ripropongo in questa newsletter.
Midjourney v 6a è stato rilasciato.
Midjourney 6 è uscito in alpha. I risultati sono MOLTO interessanti. La V 6.0 presenta notevoli progressi nella comprensione del linguaggio e nella coerenza dei testi, l'assegnazione del colore sembra molto migliorata. Anche se come dicono nel comunicato ufficiale tutto potrebbe cambiare, l'asticella si è alzata ancora tanto.
Nella directory con tutti i prompt di Midjourney ho caricato un bel po' di esempi con soggetti diversi.
Per attivarlo, digitare --v 6 dopo il prompt.
Cosa c'è di nuovo nel modello Midjourney V6?
Ci sono stati un bel po' di cambiamenti e molti altri ce ne saranno.
Apri per leggere i cambiamenti
Comprensione del prompt molto più accurata
Capacità aumentata di disegnare il testo (il testo deve essere scritto tra "virgolette" e i valori --style raw o --stylize più bassi possono aiutare).
Upscaler migliorato, con modalità "sottile" e "creativa"
Al lancio sono supportate le seguenti funzioni/argomenti:
--ar, --chaos, --weird, --tile ,--stylize, --style raw , Vary (sottile) ,Vary (forte), Remix, /blend ,/describe (solo la versione v5)
Stile e prompt per la V6
I prompt della V6 sono molto diversi da quelli della V5. È necessario "reimparare" il modo in cui vengono fornite le richieste.
La V6 è molto più sensibile alle richieste. Evitate le "sciocchezze" come "premiato, fotorealistico, 4k, 8k".
Siate espliciti su ciò che volete: Midjurney è molto più in grado di capirvi.
Se si vuole qualcosa di più fotografico / meno opinionistico / più letterale, probabilmente si dovrebbe usare di default --style raw.
Valori più bassi di --stylize (default 100) possono avere una migliore comprensione immediata, mentre valori più alti (fino a 1000) possono avere una migliore estetica.
NON fate affidamento sul fatto che questo modello esatto sia disponibile in futuro. Cambierà significativamente quando porteremo la V6 al rilascio completo.
La velocità, la qualità dell'immagine, la coerenza, l'indicazione e l'accuratezza del testo dovrebbero migliorare nelle prossime settimane.
Il nuovo strumento di Google per prendere appunti.
Se mi segui da un po' sai che questa è una newsletter dedicata alla digital transformation: se questo 2023 abbiamo parlato tanto di AI generative è soltanto perché in questo momento storico le AI sono le tecnologie che più stanno spingendo verso l'idea che la trasformazione è necessaria.
E' altresì vero che senza un pensiero che unisce i puntini, comprendere i perché e i percome di una tecnologia, persino le AI sono uno strumento sterile.
E' quindi importante essere capaci di pensare e collegare i puntini. Nel 2024 (sopratutto sul mio canale di Youtube) ti parlerò anche di questo.
Nel frattempo è interessante vedere come anche Google ha reso disponibile a tutti gli utenti degli Stati Uniti la sua app per prendere appunti con l'intelligenza artificiale, NotebookLM.
L'applicazione sperimentale, alimentata da Gemini Pro, introduce nuove funzionalità per aiutare la comprensione dei documenti e il ragionamento. Gli utenti possono ora utilizzare l'app per generare automaticamente riassunti, suggerire domande di approfondimento e organizzare gli appunti curati in progetti di scrittura strutturati.
Google quindi vuole porsi non solo come il luogo che ti permette di trovare le cose, ma anche il luogo che ti propone queste cose già digerite.
My two cents
Google pone l'attenzione del mondo sulla capacità di prendere appunti e farne una selezione. La specializzazione dell'app è la gestione delle informazioni contenute sui documenti e questa la distingue dai chatbot generici, fornendo agli utenti uno strumento più specializzato ed efficiente, mettendola potenzialmente in competizione con i GPTs.
Questa APP permette a Google di nutrirsi di ancora più dati, questa volta con un grado di selezione maggiore rispetto a una pagina web. Posso immaginare come contenuti presi e riassunti più volte diventino anche più influenti nelle SERP.
Apple similmente ha promesso un Gpt portatile in locale sui propri dispositivi (vedi più sotto). Notion offre qualcosa di simile, Obsidian (il PKM che uso) ha uno scopo diverso, ma ti ho mostrato ad Aprile la possibiltà di aggangiarlo alle API di OpenAI.
Il 2024 potrebbe essere l'anno in cui finalmente si penserà a fornire contenuti personalizzati e agenti intelligenti? Io ci sarò, pronto a riportarti novità e collegamenti.
Medicale: "Ricordati che devi morire": Come una AI danese riesce a prevedere la durata della tua vita
Settimana scorsa ho parlato di come il servizio sanitario del Regno Unito abbia appaltato alla Palantir la gestione dei dati personali dei pazienti. Perplessità e dubbi compresi.
In Danimarca hanno fatto molto di più ma hanno gestito la cosa molto meglio.
Vediamo nel dettaglio: settimana scorsa è uscito su Nature un paper in cui descrivono un'intelligenza artificiale addestrata sui dati personali dell'intera popolazione danese.
Life2vec è in grado di prevedere le probabilità di morte delle persone in modo più accurato di qualsiasi modello esistente, anche di quelli utilizzati nel settore assicurativo.
Ma è etico?
Questa notizia è arrivata la stessa settimana dell'European AI Act e probabilmente lo scope è fuori dal perimetro di quello che è permesso.
Quello che però fa ben sperare è il modo in cui è stato comunicato. Dove negli UK hanno detto "Non preoccupatevi, siamo un'azienda di Big Data statunitense, specializzata in tecnologie di spionaggio, ma questa volta tranquilli che i dati saranno ben tenuti e non verranno abusati." in Danimarca l'approccio è stato opposto.
I ricercatori che si occupano di questa tecnologia affermano che potrebbe avere un impatto positivo anche nella previsione precoce di problemi sociali e sanitari, ma deve essere tenuta lontana dalle mani delle grandi aziende.
Sune Lehmann Jørgensen della Technical University of Denmark e i suoi colleghi hanno utilizzato un ricco set di dati danese che comprende l'istruzione, le visite a medici e ospedali, le diagnosi conseguenti, il reddito e l'occupazione di 6 milioni di persone dal 2008 al 2020.
Hanno convertito questo data set in parole che potevano essere utilizzate per addestrare un modello linguistico di grandi dimensioni, la stessa tecnologia che alimenta app di intelligenza artificiale come ChatGPT.
Questi modelli funzionano esaminando una serie di parole e determinando quale parola è statisticamente più probabile che venga dopo, sulla base di una vasta quantità di esempi. In modo simile, il modello Life2vec dei ricercatori è in grado di esaminare una serie di eventi della vita che formano la storia di una persona e di determinare cosa è più probabile che accada dopo.
Come sappiamo se il modello funziona davvero?
Negli esperimenti, Life2vec è stato addestrato su tutti i dati tranne gli ultimi quattro anni, che sono stati trattenuti per i test. I ricercatori hanno preso i dati di un gruppo di persone di età compresa tra i 35 e i 65 anni, metà delle quali sono morte tra il 2016 e il 2020, e hanno chiesto a Life2vec di prevedere chi è sopravvissuto e chi è morto.
Il modello è risultato più preciso dell'11% rispetto a qualsiasi altro modello di intelligenza artificiale esistente o alle tabelle attuariali sulla vita utilizzate per il calcolo dei prezzi delle polizze di assicurazione sulla vita nel settore finanziario.
Il modello è stato anche in grado di prevedere i risultati di un test della personalità in un sottoinsieme della popolazione in modo più accurato rispetto ai modelli di intelligenza artificiale addestrati specificamente per questo lavoro.
La Gragnuola di Novità
Anthropic raccoglie altri 750 Milioni di fondi. Il round Series C da Menlo Venture porta la quotazione dell'azienda a 18.4 Miliardi. Anthropic si era già portata a casa anche un investimento da Alphabet (2 Miliardi) e Amazon (4 Miliardi). Bravo Dario Amodei !
Parlando di raccolta investimenti. I fondi di investimento hanno investito 50Miliardi in aziende AI nel 2023.
OpenAI pubblica una guida gratuita all'ingegneria dei prompt. La guida descrive in dettaglio sei strategie per ottimizzare le prestazioni di ChatGPT e LLM. Te li riassumo:
- includere istruzioni chiare,
- utilizzare testi di riferimento,
- suddividere i compiti complessi,
- concedere tempo per "pensare",
- utilizzare strumenti esterni,
- eseguire valutazioni mirate dei prompt.
Questo è il link della guida ufficiale al prompt engineering.
OpenAI ha stabilito un nuovo quadro normativo di sicurezza per lo sviluppo dell'IA e ha dato al suo consiglio di amministrazione il potere di veto sulle decisioni del CEO. Come ricorderai il consiglio di amministrazione di OpenAI ha brevemente licenziato Altman prima di reintegrarlo proprio per faccende relative alla sicurezza dell'AI. Il nuovo quadro normativo crea un gruppo consultivo che esamina i rischi emergenti dai modelli di IA e riferisce alla leadership e al consiglio di amministrazione e che ha ora l'ultima parola potendo annullare qualsiasi decisione di Altman. Non ho ancora capito quanto questa cosa della AGI sia vicina, quanto sia soltanto marketing di prodotto e quanto sia il volersi conquistare le simpatie delle varie istituzioni.
Apple sembra sempre essere ai bordi di questa gara chi ha l'AI più grossa. Questo non vuol dire che stia dormendo. I ricercatori Apple hanno pubblicato due documenti molto interessanti.
- Uno che crea avatar 3D realistici a partire da un solo video
- l'altro che permette a modelli complessi di intelligenza artificiale di funzionare senza problemi su dispositivi con memoria limitata come iPhone e iPad.
Questo cosa vuol dire? Metaverso da e per i dispositivi portativi, magari in realtà aumentata.
Ti lascio anche due link:
- il lavoro notevole di Meta sugli avatar: https://manolo.macchetta.com/maks-file-episodio-35-2023/
- La presentazione del visore di Apple: Apple & l'approccio alle AI: un'altra lezione di marketing dalla Mela.
Parlando di Modelli compatti, dobbiamo citare anche il fatto che Microsoft Research ha rilasciato Phi-2, un modello linguistico AI compatto ma potente. Nonostante le sue dimensioni ridotte, ( 2,7 miliardi di parametri) Phi-2 supera modelli più grandi come Llama 2-7B e Mistral 7-B e perfino Gemini Nano 2 di Google in termini di prestazioni, mostrando al contempo bias ridotti.
E' importante perchè questo modello è stato allenato senza un esplicito apprendimento di rinforzo dal feedback umano (RLHF). Il successo di Phi-2 dimostra che l'ipotesi di poter addestrare degli LLM su dati reali e sintetici di "qualità da libro di testo" è vera e disponibile già adesso.
Adatto all'esecuzione su computer portatili e dispositivi mobili, l'uso attuale di Phi-2 è limitato a scopi di ricerca non commerciali, secondo le specifiche condizioni di licenza di Microsoft.
Chatbot Arena è una pagina che fornisce le risposte fornite da due LLM casuali alla stessa domanda. Quando sei soddisfatto puoi votare il vincitore e in questo modo contribuisci alla graduatoria. Provalo qui: https://chat.lmsys.org/
L'acquisizione di FIGMA da parte di Adobe è ufficialmente naufragata. Le autorità di regolamentazione dell'UE e del Regno Unito hanno sostanzialmente messo fine all'operazione di acquisizione di Figma da parte di Adobe per un valore di 20 miliardi di dollari. Figma è un ottimo software e recentemente praticamente tutti i lavori che mi sono passati sotto mano utilizzavano FIGMA. È positivo che le autorità di regolamentazione intervengano quando vedono un eccessivo consolidamento del mercato.
Se non ci sentiamo più quest'anno, buon 2024!
Abrazo,
Manolo
Member discussion