3 set 2023 7 min read Animation

Mak's File - Episodio 32.2023: Cartoni animati, Bias vs Bias, microprocessori

Questa settimana ti parlo di un nuovo modello per tradurre le immagine in fotogrammi di cartoni animati, la guerra dei microchip sempre più calda, un ingegnoso modo di mettere dei controlli ai Bias delle AI.

Traffico cittadino tornato ai massimi, abbronzature che se ne vanno, riunione fiume di aggiornamento. Benvenuto Settembre! Dai fanciulli su col morale, che tra 11 mesi torniamo tutti in vacanza!

Ciao, Il mio nome è Manolo Macchetta e ti do il benvenuto ai Mak's File. Ogni settimana leggo decine di pagine di contenuti su Digital Transformation, Digital Marketing, AI & dintorni e te li ripropongo in questa newsletter.

L'animazione 2D tramite AI più vicina.

Nijijourney: Naruto silhouette, 2D, flat illustration, orange and red --ar 16:9 --niji 5

Apro con una notizia che interessa solo a me e pochi altri milioni di Fan dei film di animazione.

Appena uscito un paper a cura di tre ricercatori cinesi chiamato: "Scenimefy: Imparare a creare scene di anime attraverso la traduzione semi-supervisionata da immagine a immagine". Il documento non è banale da leggere e te lo riassumo: Scenimefy è un nuovo metodo che può essere utilizzato per creare rendering di alta qualità di scene anime da immagini del mondo reale. Questo altri tool, pur notevoli come Niji non sono coerenti nemmeno con se stessi.

Il metodo è semi-supervisionato, il che significa che richiede solo un piccolo numero di immagini abbinate reali-anime per addestrare il modello.

Scenimefy è in grado di preservare il significato delle immagini originali, applicare una stilizzazione anime coerente e aggiungere dettagli fini.

Il sistema è stato allenato con un dataset di scene anime ad alta risoluzione e ha dimostrato di essere superiore ai metodi precedenti in termini di qualità percettiva e prestazioni quantitative. Se ti va di leggerlo è qui: https://arxiv.org/abs/2308.12968

My two cents

Riporto queste notizie sempre combattuto:

Da una parte sono felice se la produzione di anime diventi più abbordabile, magari con lo stile di autori che ho amato e che non sono più tra di noi (Osamu Dezaki, Shingo Araki).
Dall'altra ho perplessità sul fatto che questo produca una valangata di prodotti di bassa qualità.
Rimane poi il vero elefante nella stanza. Questi data set di "frame" di anime, sono liberamente utilizzabili? Oppure sono stati rubati senza chiedere il permesso e qualche grossa azienda si arricchirà sfruttando il lavoro di altri senza riconoscergli un centesimo?

Insomma il fatto che ancora esista un comportamento così predatorio nei confronti degli artisti (non solo che lavora nei fumetti, che si sa essere masochisti per scelta :-) ma anche musicisti, scrittori, registi, attori ) raffrenda in me e in moltissime altre persone tutta l'esaltazione per l'innovazione potenziale nel campo.

E' cosi difficile fare delle leggi, anche temporanee, a riguardo? Speriamo che gli scioperi negli Usa portino i risultati sperati.

Barricate contro lo scraping di OpenAI.

Midjourney: **union struggle for equal rights, Barricade and resistance, beginning 1900s --ar 2:1**

Parlando di aziende che in maniera piratesca rubano dataset, e tornando a bomba sulla questione OpenAI che fa scraping dei siti senza chiedere il permesso o ripagare gli aventi diritti molte organizzazioni di media hanno chiesto una regolamentazione globale per proteggere i diritti d'autore sui dati di addestramento dell'IA.

I nomi di queste organizzazioni sono pesanti: Agence France-Presse, European Pressphoto Agency, European Publishers’ Council, Gannett, Getty Images, the National Press Photographers Association, National Writers Union, News Media Alliance, The Associated Press, e The Authors Guild.

Le richieste sono proprio il minimo sindacale: trasparenza, consenso dei titolari dei diritti e la possibilità di negoziare con gli operatori di IA. Speriamo che più punti di pressione nascono prima si trova una soluzione.

Quanto progressista è ChatGPT?

Hai presente quando in vicinanza delle elezioni ci sono quei quiz online che ti indicano quali sono i partiti più vicini alle tue idee, i cosidetti "Political Typology Quiz"? Qualcuno ha avuto l'idea di porre le stessse domande ai vari LLM: GPT-4 propende per il libertarismo, mentre LLaMA è più autoritario.

La spiegazione è semplice: se l'addestramento è stato fatto su dataset recenti (tipo il CommonCrawl) questo tenderà ad assorbire inclinazioni liberali, se si utilizzano dataset con fonti più vecchie (BookCorpus) queste risultano più conservatrici.

Fino a qui scoperta dell'acqua calda, acqua calda che però so non essere ancora stata scoperta da molti creatori di contenuti sui vari social. Adesso sai cosa rispondere.

Ma il bello viene adesso: quis custodiet ipsos custodes?

Quello che è importante è il passo successivo. L'idea interessante è che, addestrando i modelli linguistici (LLM) con i pregiudizi di una parte politica, è possibile individuare più facilmente le incongruenze dell'altra parte.

Questo perché, anche se è impossibile eliminare completamente i pregiudizi culturali da un LLM, è possibile affinarne un altro per rilevare le incongruenze e fare una sorta di fact checking dei valori, perfetto esempio di applicazione di un duumvirato per fare in modo che i controllori si autocontrollino.

È vero che non sarà facile realizzare un sistema del genere: temo che non sia una priorità per gli LLM commerciali. Ma ogni volta che si traccia una nuova strada, c'è la possibilità di migliorare il mondo e quella è la direzione in cui voglio guardare.

I no spik cines

Il presidente Biden ha firmato un provvedimento che limita gli investimenti statunitensi in tecnologie cinesi avanzate, come semiconduttori e computer quantistici.

Secondo un recente studio dell'Australian Strategic Policy Institute, i computer quantistici sono una delle poche tecnologie in cui gli Stati Uniti hanno davvero un vantaggio competitivo. Questa nuova regolamentazione ha innescato una corsa all'accaparramento di chip e un aumento delle tensioni tecnologiche tra Cina e Stati Uniti.

A titolo di esempio, i giganti tecnologici cinesi Baidu, ByteDance, Tencent e Alibaba hanno investito collettivamente 5 miliardi di dollari nei chip di Nvidia per i loro progetti di intelligenza artificiale.

Gli LLM Opensource performano benissimo nei riassunti.

Anyscale riporta un articolo lungherrimo (che puoi leggere qui). In esso ha condotto una serie di test per confrontare le capacità di riassumere testi di diversi modelli di linguaggio grandi (LLM), tra cui modelli open source e chiusi. I risultati hanno mostrato che Llama-2-70b e GPT-4 sono entrambi in grado di generare riassunti accurati e informativi, che sono quasi indistinguibili da quelli prodotti da umani.

Il succo è questo: Prestazioni quasi umane

Inoltre, Llama-2-70b ha superato di gran lunga GPT-3.5-turbo, un altro modello closed-source. Ciò dimostra che i modelli open source stanno rapidamente raggiungendo i livelli di qualità dei modelli chiusi.

Infine, Llama-2-70b è circa 30 volte più economico di GPT-4. Ciò lo rende un'opzione molto attraente per le aziende e le organizzazioni che cercano un modello di linguaggio grande di alta qualità a un prezzo accessibile.

La Gragnuola di novità

AI Acts: anche il Regno Unito vuole legiferare sulle intelligenze artificiali. Per ora ha prodotto un interim report: Il testo è per ora breve e leggibile ed è interessante per l'uso pragmatico. Lo puoi leggere qui: https://manolo.macchetta.com/ai-acts-nel-mondo/#ai-act-nel-regno-unito-uk

Non dimentichiamo che gli UK sono la terza nazione a livello globale per quanto riguarda gli investimenti in AI, quindi io sono particolarmente curioso di vedere come si muoverà

Brevetti: Microsoft potrebbe produrre uno zaino con un assistente AI.

Microsoft ha depositato un brevetto per uno zaino indossabile con un agente AI che potrebbe utilizzare dei sensori per scansionare un'area e l'AI per fornire risposte agli utenti in base a ciò che si trova intorno a quell'individuo.

Il dispositivo potrebbe essere utilizzato per fornire indicazioni stradali, identificare oggetti o persino aiutare gli sciatori a scegliere il percorso migliore per scendere da una montagna. Probabilmente non lo vedremo a breve, ma interessante vedere quanto il mondo sta credendo nella crescita degli agenti AI.

La Qualcomm punta tutto sul mercato dei chip per autoveicoli. Nella crescita incredibile che stanno avendo le aziende di Chip, sembra invece che la storica Qualcomm stia incredibilmente perdendo terreno. Recentemente ha annunciato di voler puntare tutto sui Chip per le auto, creando processori per degli AI agent a supporto dei conducenti. Nei piani è arrivare a fatturare 9 Miliardi entro 8 anni. Vediamo le loro prime proposte, ma l'idea di specializzarsi negli bot invece che nella guida automatica potrebbe essere stata saggia.

Voucher innovation manager: Un mese in più di tempo per presentare domanda e iscriversi all’elenco del Ministero delle imprese e del Made in Italy (MIMIt) dei soggetti accreditati a fornire alle PMI e alle reti di impresa i servizi di consulenza specialistica ammissibili al voucher innovation manager.
Con decreto direttoriale 29 agosto 2023, infatti, la scadenza per le istanze di iscrizione, originariamente fissata al 5 settembre 2023, è stata prorogata al 5 ottobre 2023. Non sai di cosa stia parlando? Mandami una mail!

Il prompt su Bard.

Questa settimana ho avuto un po' più di tempo per la raccolta di novità e ho voluto giocare con Bard. Ho usato un prompt semplicissimo:

Mi rendi più leggibile questo [TESTO] . il testo deve essere comprensibile, ma articolato e preciso - non sacrifichiamo la completezza per renderlo più facile del dovuto.
[Testo] =

Riesci a capire quali articoli sono stati pettinati dalle AI e quali no?

Ho poi chiesto cosa avrei potuto aggiungere per renderlo più SEO-friendly, e a ogni risposta ho seguito con altre domande su come migliorare. Ha poco senso in articoli con una raccolta di notizie brevi, ma lo sto integrando nel mio flusso di lavoro.

Bard tende a perdersi dopo qualche interazione ma mi sta piacendo, forse proprio grazie a questo limite.

Ci sentiamo a breve; un Abrazo,

Manolo