30 apr 2023 9 min read Ai

Week 17.2023: Lo stato attuale dell'internet e il ruolo delle AI nella società

La big news è stata il ritorno di ChatGPT in italia, ma non mancheremo di parlare di Buzzfeed News che chiude, il costo dei dataset e altro... ( e sì, l'immagine di copertina è "open to meraviglia versione niji)

Midjourney prompt: cartoon Venere di botticelli in the style of a scanner darkly, 32k uhd, blink-and-you-miss-it detail --niji 5 --niji 5 --style scenic --ar 16:9 --niji 5 --style scenic

Incredibilmente questa settimana c'è stata calma relativa sulle AI. Sono uscite molte meno cose e questo ha permesso al mondo un po' più di introspezione sul ruolo delle AI nel tessuto sociale. La big news è stata il ritorno di ChatGPT in italia. Oggi però parliamo del costo dei dataset, di giornali online che chiudono e la risposta alla domanda che tutti ci siamo fatti: "Ma chat GPT come si comporterebbe se partecipasse a chi vuol essere milionario?"

Il mio nome è Manolo Macchetta e ti do il benvenuto ai Mak's File. Ogni settimana leggo decine di pagine di contenuti su Digital Transformation, Digital Marketing AI & dintorni e te li ripropongo in questa newsletter.

ChatGPT is Back, babe!

Printscreen dalla welcome page di ChatGPT dove ricorda capacità e limiti

ChatGPT è tornato live in Italia. Usando Obsidian + API non ne ho abusato troppo ancora. Ho fatto qualche accesso e non ho ancora avuto limitazioni per il traffico. Direi che siamo tornati in pista alla grande.

My two cents

ChatGPT ha anche implementato la richiesta dell'età e la possibilità di disabilitare la cronologia delle chat: in questo modo non utilizzeranno le vostre conversazioni come dataset futuri.

Questo si traduce maggiore sicurezza e privacy per tutti gli utenti di ChatGPT. Che il garante italiano abbia fatto del bene a tutto il mondo?

Il consenso è unanime: I dati per allenare le AI si pagano.

Midjourney prompt: **cute cow eating social network icons no backgroung**

Stack Overflow ha annunciato che inizierà a far pagare agli sviluppatori di AI l'accesso ai suoi 50 milioni di domande e risposte.

Questa notizia arriva dopo che Reddit ha rivelato che gli sviluppatori dovranno pagare per accedere ai dataset.

E non dimentichiamo che qualche mese fa il mondo rideva di Musk quando ha messo tariffe altissime per l'accesso alle API di Twitter e minacciato Microsoft per lo scraping non acconsentito del social.

My two cents

Come dice il saggio: "Se non paghi per il prodotto, beh il prodotto sei tu."

Credo che la direzione di far pagare per i dataset sia chiara, e tutto sommato è corretto che chi sviluppa for-profit debba pagare, ma un cambio del genere mette sotto stress tutto il sistema.

I dubbi che mi vengono in mente e su cui mi piacerebe porre l'attenzione per discuterne insieme sono:

Si spinge ancora di più il frame che le AI siano for-profit. Frame dannosissimo secondo me.
Si restringe ancora di più la possibilità di sviluppare LLM da parte di indipendenti rendendo, le AI generative appannaggio solo di grossi player che hanno il budget per svilupparle, o di chi ha agito in maniera piratesca all'inizio.
Rischia di estromettere chi davvero fa ricerca e che fin'ora è stato ligio.
Si dimentica di quelli che le questi dati gli hanno creati: gli utenti.

Non tutti i dubbi sono negative ovviamente:

Si apreno nuove possibilità di monetizzazione per siti di news e gli aggregatori, questo quando sono scritti bene e danno valore aggiunto.
Potrebbe limitare la crescita infinita (e probabilmente senza senso allo stato dei fatti) dei "parametri" nei modelli di linguaggio.

Siti di News che chiudono

Midjourney Prompt: **svg cartoon style of a newspaper screaming to the public --ar 2:1**

Parlando di siti di news che non riescono a monetizzare, la scorsa settimana Buzzfeed News ha chiuso i battenti, mettendo un'altro chiodo sulla tomba dell'editoria guidata dal traffico dei social media.

Buzzfeed News era il braccio giornalistico di BuzzFeed, sito di immagini virali.

My two cents

I media digitali hanno registrato una rapida crescita dal fine anni 2000 al metà anni 10, spinta in gran parte da Facebook e nutrita dalle ads.

I siti che sono riusciti a cavalcare l'onda hanno fatto quintalate di soldi, tanto da avvelenare tutto il mondo dei media con questa idea: moltissime testate storiche scrivono articoli al kilo, polarizzanti e col solo scopo di attirare click.

Ma la cecità di questo piano si è presto svelata. Già nel 2016 Facebook ha limitato il reach, i titoli particolarmente clickbait non vengono praticamente mostrati e in genere tutto il mercato ha subito un duro colpo.

La nicchia degli approfondimenti è andata in mano ai creator. Prima con i long content di Youtube, poi con gli short di TikTok.
La creator economy si muove grazie a modelli di abbonamento (su tutti patreon) ma per portarti a casa abbonati devi fornire contenuti di qualità.

I Media outlet si sono trovati schiacciati in mezzo.

Quali mezzi utilizzare quindi?

Newsletter. Le mode vanno e vengono, le persone leggono meno le email... ma queste continuano a perdurare come mezzo principe di comunicazione. Dopo un periodo di stanca dove essere iscritto a una newsletter equivaleva a essere bombardati da messaggi promozionali e spam, negli ultimi anni c'è stata una rinascita dello strumento. Substack sta facendo grossi numeri, ma anche Ghost (che è la piattaforma che sto utilizzando io per i Mak's File) sta facendo passi da gigante.
Podcast. I podcast sono qui per rimanere: con la crisi della creatività nella musica sempre più persone preferiscono ascoltare podcast che ascoltare la radio quando sono in auto. Convertire un ascoltatore di podcast in premium è sicuramente più semplice che trasformare un follower tiktok.
Long Form Video. Youtube è la televisione del presente: documentari, speciali, contenuti davvero di nicchia montati con una qualità da televisione. Esattamente come coi Podcast, il lavoro dello youtuber è massacrante ma permette di avere ascoltatori molto propensi a sostenere finanziariamente chi gli intrattiene.

Strumenti che mi lasciano più perplesso.

Shorts: TikTok e il suo algoritmo hanno preso il mondo in contropiede... la modalità di fruizione è divertente, intrigante e soddisfa la voglia di curiosità. Ancora non sono sicuro come si possa monetizzare coi contenuti anche se tra product placement e Soap Opera da un minuto abbiamo visto che qualcosa si sta muovendo.
SEO & Google Search. I risultati di Google sono rotti e se guardi i risultati con spirito critico concorderai con me: i grossi player hanno un'importanza in SERP spoporzionata, troppi articoli inutili ma over ottimizzati ancora in prima pagina e problema dei problemi non si capisce quale articolo è legittimo e quale è di pubblicità.
Personalmente ormai uso da anni Reddit e Amazon per avere dei pareri ponderati su qualcosa. L'arrivo delle AI e dei risultati zero click poi faranno scendere ancora di più lo spazio dei blog. Saranno tempi duri prima che la situazioni migliori. Spazio da presidiare ma su cui non investirei tutte le mie energie (e lo dico dispiaciuto da utente e da professionista nel settore).

Ho dato uno sguardo a cosa potrebbe succedere quando Google integra un LLM

Benchmark: LLM vs i quizzoni, LLM vs i pareri medici

Finalmente stanno uscendo i primi paper coi risultati dei test indipendenti sull'effettiva utilità di Chat GPT nel rispondere alle domande.

A scanso di equivoci: stiamo parlando di ChatGPT / Llama e parenti, che sono modelli linguistici (LLM), non dei sistemi di AI di riconoscimento dei pattern nella salute.

Una delle prime applicazioni metta sotto la lente di ingrandimento è stata la capacità di dare risposte mediche. 66 domande, GPT-3.5 vs GPT-4, tutto sotto lo scrutinio di 12 medici. Vediamo cosa è successo:

A nessuna domanda la maggioranza dei medici ha ritenuto le risposte dannose.
Le risposte di ChatGPT-4 hanno ottenuto risultati molto più corretti.
Meno del il 20% delle risposte erano "allucinate" che è un ottimo risultato ma ancora troppo alto.

Non ho trovato i test indipendenti su Med-Palm di google (che è specializzato in risultati medici) ma ho trovato un altro studio che affermava quanto GPT-4 sia superiore, senza però portare numeri... mi fido completamente :-)

Parliamo anche dei Quizzoni.

Un'altro studio che questa volta prende in studio solo i modelli lingustici del recentissimo (e opensource) LLama / Alpaca e lo mette a confronto con Jeopardy, il re di tutti i quizzoni.

Anche se supera il 48% del partecipante umano, la percentuale di correttezza si ferma solo al 62%.

My two cents

Partiamo coi risultati al quizzone dato che la cosa mi perplime: ero sicuro che un LLM avrebbe performato alla grande a un Quiz televisivo. Purtroppo non ho trovato il paper originario e non so dare informazioni sul tipo di domande e di prompting, ma 62% mi sembra davvero basso.

Non ho nemmeno avuto modo di usare Alpaca / vicunia quanto avrei dovuto quindi voglio evitare di buttarla in ciaciara con commenti fuori luogo. Ti riporto il dato a futura memoria.

Parlando invece dei risultati in ambito medico: voler utilizzare un modello linguistico per fare cose per cui non è stato progettato è ricetta di disastri.

Sono uscite già molte idee su come rendere multimodale un LLM, su come fare fine-tuning di dati medici e in generale quanto un'AI possa davvero aiutare.

Utilizzare ChatGPT "liscio" è più un disservizio per il mondo delle AI che un passo avanti.

L'ennesima prova che abbiamo i piedi sull'esponziale e non ce ne siamo ancora accorti.

Vi lascio 4 Immagini che ho trovato su un gruppo dedicato a Midjourney. Io ho iniziato a smanettare soltanto l'estate 2022 con l'uscita della versione 3, ma c'è qualcuno che ha salvato immagini e prompt della versione 2, di Aprile 2022

Scuola di Prompting, direttamente da OpenAi + Andrew NG

Print screen della pagina di presentazione del corso.

Andrew Ng, professore di Stanford, cofondatore ed ex responsabile di Google Brain, nonchè uno dei massimi esponenti nel campo delle Intelligenze Artificiali ha unito le forze con OpenAI per sviluppare un corso di prompt engineering per sviluppatori.

Il corso è concepito come una serie di video su vari argomenti di prompt engineering, accompagnati dalla relativa documentazione per ogni video.

Il link? https://learn.deeplearning.ai/chatgpt-prompt-eng/

My two cents

Il corso è completamente gratuito e il comunicato stampa dice che richiede solo 1,5 ore per essere completato. E' stato progettato per essere accessibile ai principianti e richiede solo una conoscenza di base di Python... ma conoscendo i miei polli probabilemente è fuori dallo scope della maggior parte di noi umili mortali.

Un'ora e mezza, però, potrebbe valer la pena investirla lo stesso, anche se ci portiamo a casa un decimo del valore: i suggerimenti forniti possono essere generalizzati per migliorare le abilità di prompting in generale.

Mi aspetto che si possa impare dagli esempi offerti.

Il prompt della settimana.

e parlando di prompting...

Questa settimana prompt brevissimo ma super utile per il brainstorming. Studiatelo e praticatelo che tra qualche settimana costruiremo qualcosa di più complicato su questa impalcatura.

"Write an outline about exploring AI and PKM Guide to the future of Knowledge Management. use markdown to reply."

Facoltatitvo: "Output in Italian", Chiedere di usare il markdown permette di averlo già formattato sia per gli appunti che per il blog (sia wordpress che ghost accettano il markdown).

E anche questa settimana è andata.

un Abrazo,

Manolo

ChatGPT is Back, babe!

My two cents

Il consenso è unanime: I dati per allenare le AI si pagano.

My two cents

Siti di News che chiudono

My two cents

Quali mezzi utilizzare quindi?

Strumenti che mi lasciano più perplesso.

Benchmark: LLM vs i quizzoni, LLM vs i pareri medici

Parliamo anche dei Quizzoni.

My two cents

Links

L'ennesima prova che abbiamo i piedi sull'esponziale e non ce ne siamo ancora accorti.

Scuola di Prompting, direttamente da OpenAi + Andrew NG

My two cents

Il prompt della settimana.

You might also like...

Memory Updated... Episodio 1

Episodio 54.2025

Episodio 49.2024: L'armonia interiore di Huawei, Acquisizioni, SearchGPT + i podcast che sto ascoltando.

Episodio 48.bis.2024: i sentori che le piattaforme Social stiano restringendo il tuo reach, MarTech & Contenuti, Nobel & Centrali Nucleari.

Mak's File - Episodio 42.2023: AI Acts, Elon Musk, Startup Francesi.