6 min read

Week 15.2023

Parliamo di: Come stanno andando i canali di streaming video, Musica e AI, Amazon che potenzia le Alexa Skill, Samsung e la fuga di dati verso ChatGPT e un prompt utile per il brainstorming.
Week 15.2023
Prompt: super mario bros by Zao Wou-Ki Egon Schiele

Benvenuti alla week 15 del 2023 dei Mak's Filez. Ogni settimana, leggo decine di pagine di contenuti su Digital Transformation, Digital Marketing AI & dintorni e ve li ripropongo in questa newsletter.

Parliamo di: Come stanno andando i canali di streaming video, Musica e AI, Amazon che potenzia le Alexa Skill, Samsung e la fuga di dati verso ChatGPT e un prompt utile per il brainstorming.

Streaming Wars

Matthew Ball, famoso autore di saggi su moltissimi temi sulla Tecnologia, Business e Intrattenimento ha pubblicato un saggio sulla "Guerra dello Streaming". E' tutto disponibile online, si legge in un'oretta ed è davvero ben fatto.

Affronta sia i big player (Netflix, Amazon Prime, DisneyPlus, HBO Max, Hulu) che i piccoli. E' una lettura che merita di essere fatta. E' interessante vedere a storia passata e le lezioni apprese.

E una volta che sei li guardati anche gli altri articoli.

Il link: https://www.thestreamingbook.com/


La Universal chiede a Spotify e Apple di bloccare potenziale scraping

prompt: a cartoon thief walking with a bag full of tapes --ar 2:1

La Universal Music Group (UMG), una delle tre maggiori etichette musicali del mondo, ha ufficialmente espresso preoccupazione per la AI generativa musicale.
La sua richiesta, nei confronti di Spotify e Apple music, è di bloccare l'accesso ai bot e tecnologie simili che possano fare scraping delle canzoni.
La UMG è un colosso e ha in catalogo tantissimi artisti pop e label più piccole coprendo quasi il 30%

My two Cents

E' interessante vedere che l'Universal chieda di impedire lo scraping e che sia pronta a "difendere gli interessi gli interessi degli artisti".
E' interessante perchè la Universal sa di essere a un bivio:

  • se riesce a creare una propria AI generativa potrà in futuro scavalcare gli artisti (gli stessi che al momento vuole proteggere),
  • se invece gli scappa di mano e appare un Midjourney Musicale a fargli concorrenza sa che è vicina alla chiusura.

La musica Pop, per sua natura di prodotto di massa e di facile consumo, si presta molto facilmente a essere quasi una commodity... e la musica generata da una AI verrebbe accettata dal pubblico in maniera molto simile a come avviene adesso.
Ci rendiamo conto che questo potrebbe essere una rovina per quasi tutte le etichette non di nicchia.

Il fatto che la Universal è conscia di questo però apre anche lo scenario di una difesa legale strenua e continuata dei dataset. Se facesse cartello con le altre due major (Sony Music Entertainment e Warner Music Group) avrebbero la capacità di stroncare sul nascere ogni AI generativa musicale.
Tempi interessanti ci aspettano.


AI & Etica

Ho recentemente modificato il nome del gruppo di facebook in "AI News Italia (Etica, Arte, Notizie sull' intelligenza artificiale)" in modo di far passare già dal titolo che parliamo di ETICA.

per tediarti, anche qui posto questa immagine - così da parlare la stessa lingua.

Sei aree con rischi sociali ed etici associati ai modelli linguistici:


Uno dei motivi Amazon è una delle aziende più potenti del mondo.

Prompt: a cute AI working as a call center in his cublible is speaking on phone, sweating but very kawaii --ar 2:1

Panera Bread, verso la fine di marzo, è diventata il primo ristorante a utilizzare il software di scansione biometrica di Amazon. Una settimana fa, Panera ha annunciato di aver collaborato con il team Alexa Skills di Amazon per offrire ordini vocali potenziati dall'intelligenza artificiale.

L'aggiornamento delle API Food Skills si distingue dalle ordinazioni vocali utilizzate da altri rivenditori perché utilizza l'intelligenza artificiale conversazionale simulando un'esperienza dal vivo.
Prima dell'aggiornamento, l'offerta era una ciofeca tipo: "premi 3 per il panino, premi 8 per tornare al menu". L'esperienza utente era simile a un ricevitore automatico di una banca, adesso invece si potranno fare domande e rispondere.
Il lavoro non è stato facile e ha dovuto pensare a ogni tipo di domande (puoi tagliarmi il panino in due?)

My two cents

Perchè il mio titolo provocativo? Amazon durante questa rivoluzione è stranamente molto silenziosa, ma non perchè stia dormendo ma semplicemente perchè sta cercando di capire come usare le AI (anche su sistemi incistati come Alexa) per aiutare davvero il cliente... e monetizzare.

Per quanto creare un nuovo modello (API Food Skill + Panera data) non sia banale immagino che sia molto meno complicato che creare da zero una propria AI.
Finito il proof of concept con Panera poi pensiamo cosa potrebbe succedere tra un annetto quando ci saranno le API Call Center Skill? Chiami in banca, e puoi subito metterti a interagire con una AI, che sarà molto più agile a gestire problemi e che potra decidere di scalare all'assistenza umana dove serve. Potrebbe davvero essere un bel passo avanti per il customer service.


Stability AI rilascia Stable Diffusion XL gratuitamente.

Stability AI, l'azienda che sta dietro a Stable Diffusion 2.0, Dreambooth e anche ClipDrop, ha annunciato che il suo nuovo modello di generazione di immagini, Stable Diffusion XL , è disponibile e utilizzabile gratuitamente sulle sue varie piattaforme.

Il nuovo modello è addestrato su oltre 2 miliardi di parametri, più del doppio rispetto a quelli utilizzati dal modello precedente. Ma come sono i risultati?
Noi lo abbiamo testato su 7 prompt diversi con risultati abbastanza netti a favore di Midjourney 5.

Ecco qui il link con il test:

Stable Diffusion XL vs Midjourney 5
E’ uscito oggi Stable Diffusion XL e promette grandi miglioramenti. Ecco i risultati dei miei test

My two cents

Il modello di business di Midjourney (Premium puro) unito alla velocità di sviluppo e alla capacità di rispondere ai bisogni di mercato in maniera celere lo hanno fatto già fatto uscire come vincitore delle ultime 3 battaglie delle AI generative Text to Image.
Considerando che non è passano nemmeno un anno da quando hanno dato i primi risultati decenti azzarderei a dire che se superano indenni anche la tempesta di querele avremo un player molto importante in futuro. Non mi stupirei se qualche incumbent la assorba.


Fuga di codice di Samsung su ChatGPT

Secondo quanto riferito dai dipendenti di Samsung, in tre diverse occasioni c'è stato un passaggio di informazioni aziendali riservate tramite ChatGPT.

In un caso, un dipendente ha copiato il codice sorgente di un database difettoso di semiconduttori in ChatGPT. In un altro caso, un dipendente ha condiviso un codice riservato per trovare una soluzione a un'apparecchiatura difettosa. Nel terzo caso, un dipendente ha sottoposto gli appunti al chatbot chiedendogli di creare un verbale della riunione.

La stessa cosa è successa anche ad Amazon e Walmart, anche se non ho le specifiche.

Samsung sta cercando di contenere i danni limitando a 1024 byte le richieste di ChatGPT da parte di ciascuna chiamata. Nel frattempo l'azienda sta ora sviluppando la propria IA interna.

My two cents

Anche se i tre casi dichiarati da Samsung sembrano troppo esemplificativi dei problemi correlati a chatGPT per essere veri sono un ottimo monito a chi usa le software di cui non conosce i funzionamenti in maniera troppo leggera.


Prompt Driving School:

Dal momento che mi è stato chiesto di parlare più di prompt engineering e scrivere articoli lunghi è particolarmente complicato data la velocità con cui cambia la scena (scrivo un articolo e questo non è più valido il giorno dopo), ogni settimana ti proporrò un prompt che funziona e che reputo interessante.

Per iniziare propongo quelli che suonano più "naturali", che non richiedono una sequenza di aggiustamenti (quasi-zero-shot) e che possono essere modificati senza rischiare di invalidare il prompt, anche a costo di darvi una struttura poco didattica.

I prompt sono solitamente in inglese perchè trovo più facile essere preciso in quella lingua: aggiungendo "output in italian" alla fine solitamente i risultati generati sono in italiano.

Altra strada è di avere l'output in inglese e poi farselo tradurre: in ogni caso, trattandosi di brain storming, il risultato va sempre modificato, quindi entrambe le strade sono utili.

Ecco il prompt per avere abbozzo / riassunto di uno speech

You are now BusinessGPT. I'm a marketing professor at the Stanford Graduate School of Business. I'm going to a marketing agency full of marketing and sales enthusiasts to give a guest lecture. I have a time limit of [one hour] and these are the [topics] people want me to cover. Your job is to help me to give this guest lecture, create an outline covering all the topics, and mention the time limit for each topic strictly one hour in total. Finally if you can do anything else for my guest lecture I am happy to take your help. Topics: VideoGames

Saluti finali

Anche questa settimana ho dovuto fare una selezione di tutte le notizie uscite, e continuo a chiedermi quale sia il numero e la lunghezza corretta. Ogni post viene letto da un centinaio di persone quindi sono curioso di sapere la tua opinione. Fammi sapere.

Un Abrazo,

Manolo

Mastodon