10 min read

Episodio 45.2024: Apple Vision Pro, Papiri di Ercolano, Chips & Bots

Apple vision Pro a spasso, scopriremo cosa c'è scritto sui papiri di Ercolano? chiudiamo con un bel po' di novità su Open AI, Google e Microsoft
Episodio 45.2024: Apple Vision Pro, Papiri di Ercolano, Chips & Bots
Creata con Midjourney - trovi il prompt qui: https://manolo.macchetta.com/i-prompt-di-midjourney-su-notion/

Questo episodio parliamo ancora di Apple Vision Pro che viene già usato per passeggiarae, parliamo lungamente anche dei papiri carbonizzati di Ercolano e di come sono riusciti a leggerne i contenuti. Questa sezione è un po' più lunga di quello che sarebbe potuta essere, ma l'eccitazione di poter leggere opere perse nei meandri della storia ha avuto il sopravvento su di me, e ho sbrodolato con le parole. So che ai librofoli come me farà piacere leggerlo.

Chiudiamo con una serie di news brevi dove il tema comune sono i chip, la potenza di calcolo e le prime discussioni sulla costruzione di androidi.

Apple Vision Pro portato a passeggio

Creata con Midjourney - trovi il prompt qui: https://manolo.macchetta.com/i-prompt-di-midjourney-su-notion/

Settimana scorso abbiamo parlato del Vision Pro delle Apple, anche se mi lamentavo della mancanza di video sul campo.

Bene, nel frattempo sul tubo di video ne sono usciti molti: sembra che la Realtà Passante sia così ben progettata che si può persino andare in giro per la città come se nulla fosse. In questo video il sempre interessante Casey Neidstat ha passato una giornata col visore. Questo youtuber va in aereo, questa coppia cercano di fare delle cose insieme.

Non credo che l'andare in giro sia stata un'applicazione pensata a priori da Apple. Tanto che, al di la dell'usabilità, è già sorto un problema: come preservare la privacy delle persone, evitando di riprendere i visi, le targe pur consentendo questo uso del visore all'aperto?

La risposta arriva semplice. Con una bella AI!

Apple sta quindi pensando di acquisire Brighter AI, una startup tedesca specializzata nell'anonimizzazione dei volti e dei dati delle targhe che offre una tecnologia AI in grado di rimuovere le informazioni identificabili dalle immagini senza oscurare il contenuto. Questa acquisizione aiuterebbe Apple a rafforzare le caratteristiche di privacy e di operare in Europa senza altri problemi.

My two cents

Devo dire la verità: sull'Apple Vision Pro sono passato da uno stato di perplessità a uno di curiosità a uno di interesse molto velocemente. Nonostante i limiti (batteria esterna, durata della stessa, luce sparata negli occhi a pochi centimetri di distanza) questa cosa della realtà passante è già pronta per degli acquirenti che vanno oltre ai videogiocatori. Ho letto che anche degli ospedali hanno già deciso di utilizzarlo.

Al di la della mia simpatia o meno per Apple o il metaverso, quando una tecnologia così importante prende piede mi da accende sempre fiducia.


Epicuro & le AI: letto il primo papiro di Ercolano.

(c) scrollprize.org

La Vesuvius Challenge è una competizione globale finalizzata a sviluppare modelli per decifrare gli antichi papiri di Ercolano. I papiri sopravvissuti sono numerosi ma sono stati carbonizzati nel 79 dc durante l'esplosione del Vesuvio.

E' risultato impossibile srotolarli ma è da oltre 200 anni che tutti gli studiosi sognano di poterli leggere.

Ecco che arriva in aiuto l'AI.

Nel marzo 2023 Nat Friedman, Daniel Gross, e Brent Seales raccolgono abbastanza fondi per indirre un concorso in cui vengono fornite immagini ad alta risoluzione di una TAC di uno dei suddetti papiri e un premio bello paffuto (1 Milione di Dollari) per chi riesce a dare le migliori letture.

E detto fatto, le letture arrivano.

La valutazione della qualità della lettura è basata sul giudizio di due gruppi di esperti:

  • Papirologisti - che leggono il testo e ne guardano la coerenza.
  • Tecnici - che studiano i modelli di Ai alla base della trascrizione.

Il team che ha vinto il primo premio (700K) è composto da Youssef Nader, Luke Farritor e Julian Schilliger.

I tre, giovanissimi, non sono di primo pelo:

Luke aveva vinto il primo premio della sfida precedente, quella della fattibilità della lettura di papiri carbonizzati, meritandosi un posto nella storia riuscendo per primo a leggere una parola.

Youssef, secondo posto della stessa competizione ha invece sviluppato un modello che permetteva di leggere i risultati più chiaramente ancora. ( a questo link potete leggere tutta la storia)

Julian ha sviluppato un modello 3D per leggere i papiri e trovare meglio le zone con il testo.

Il super team ha quindi usato 3 modelli. Due sono specifici sul riconoscimento dei segni di inchiostro, ognuno dei quali rinforza i risultati dell'altro. L'apporto di Julian serve per avere accesso a porzioni molto più larghe del papiro.

Questi tris d'assi si porta a casa il primo premio. Se sei gasato quanto me, puoi mettere le mani sul codice che è in Open Source su GitHub. C'è anche il modello di Julian Schilliger disponibile qui.

Anche gli altri partecipanti hanno messo i loro modelli e mi aspetto che le prossime iterazioni del contest diano risultati ancora migliori. Il testo

My Two cents

Se il solo pensiero di aver accesso a testi di filosofia vecchi di 2000 anni non ti esalta, fammi aggiungere anche qualche altro spunto.

  • Ci sono voluti solo 9 mesi per svelare un mistero che durava da sempre, e che senza le AI sarebbe stato irrisolvibile.
  • Ha dato un obiettivo a centinaia di sviluppatori. Esattamente come le missioni sulla luna, l'uomo è stimolato dalle sfide complesse. Questa lo è: e le ricadute sul sistema saranno enormi, dai nuovi modelli, alla capacità di metterli in competizione e collaborazione.
  • Per tornare alle ricadute su campi diversi, partendo da quello medico: pensiamo un modello del genere cosa potrebbe scoprire dopo una tac al nostro corpo!
  • E' una grossa pubblicità ai modelli Open Source anche di AI. Anche se non sono ancora convinto che Open Source dei modelli delle AI sia la scelta più saggia in ogni situazione è comunque positivo pensare che esista anche una strada che non sia il for profit.
  • E' l'applicazione di tecnologia al limite per argomenti che di più antichi non esistono. Sapere che il mondo classico e quello STEM si stringono la mano su questi progetti mi rende fiducioso sul futuro sempre più solido delle AI, al di la dei chatbot e dei cani robot coi lanciafiamme.
  • Per uno come me che ancora adesso è triste anche al solo pensiero del rogo della biblioteca di Alessandria - per quanto storicamente poco vero - avere la possibilità di leggere certo cose lo mette di buon umore.

Cosa è stato scoperto?

Torniamo al titolo: cosa centra Epicuro?

Sembra che il testo sia opera di Filodemo, insegnate di Virgilio e che in quegli anni era curatore della biblioteca da cui sono stati recuperati i papiri.

Il testo tradotto -inedito - sembra essere uno scritto dedicato all'epicureismo con una frecciatina agli Stoici nel finale.

Al momento è stato decifrato solo il 5% di un solo papiro.

Il prossimo challenge è decifrare il 90% di 4 papiri entro il 2024.

L'obiettivo finale è di sviluppare sistemi di "segmanetazione" automatico, fare la TAC ai restanti 800 papiri e avere i testi pronti.

Non mi stupirei che Google (o qualcuno con potenza di calcolo e interesse) si facesse avanti per dare una mano.

Cosa dicono i papiri del Vesuvio letti dalle AI?

col. -8, ll. 2-14:
2 ...]ι̣μ̣εν τοὺϲ̣ [πα]ρ̣[ὰ Ξ]ε̣-
νοφάντωι το̣ιούτου[ϲ,
ὃ καὶ ὑπ’ ἄ̣λλων δοκεῖ
5 γείνεϲθαι, παραπλη-
ϲίωϲ δ̣’ ο̣ὐδὲ παρ̣’ ἑτέρωι
ἴδι̣ον το̣ῦ δ̣οκοῦ̣ντοϲ̣
εἶναι καὶ παρὰ πλε̣ί-
οϲ̣ι̣ν̣ ἥδιο̣ν, ἀλλ’ ὡ̣ϲ̣ καὶ
10 ἐ̣π̣ὶ τῶν βρω̣μ̣άτ̣ων
ο̣ὐ̣κ ἤδ̣η τὰ ϲπάνια
πάντωϲ̣ καὶ ἡδ̣ίω
τῶν δ̣αψιλῶν̣ ε̣ἶναι̣
14 νομίζ̣ο̣με̣ν· οὐ γ̣ὰρ̣

col. -7, ll. 4-10:
λ̣ει παρὰ τὰ δαψιλῆ.
5 θεωρηθήϲεται δὲ τὰ
τοιαῦθ’ οὕτω{ι} πολ̣λά-
κιϲ πότερον ὅ̣ταν πα-
ρῇ τὸ δαψιλέϲτερον
ἡ φύϲιϲ ἥδιον ἀπαλλάτ-
10 τει το̣ύ̣τ̣ο̣υ̣ καὶ πάλ̣ι̣ν̣ ̣ ̣

col. -7, ll. 4-10:
λ̣ει παρὰ τὰ δαψιλῆ.
5 θεωρηθήϲεται δὲ τὰ
τοιαῦθ’ οὕτω{ι} πολ̣λά-
κιϲ πότερον ὅ̣ταν πα-
ρῇ τὸ δαψιλέϲτερον
ἡ φύϲιϲ ἥδιον ἀπαλλάτ-
10 τει το̣ύ̣τ̣ο̣υ̣ καὶ πάλ̣ι̣ν̣ ̣ ̣

col. -2, ll. 2-8:
2 ἑ̣κάϲτηϲ κριτηρίων
θεωροῦνται. πρὸϲ δὲ
οὔτε καθόλου περὶ
5 ἡδονῆϲ ἐχόντων τι
λέγειν οὔτε περὶ τῆϲ
κατὰ μ̣έ̣ρο̣ϲ̣, ὅ̣τε ὡ-
8 ριϲμένον τι, ἀλλ’ οὖν

col. -1, ll. 1-6:
1 ὰρ ἀπ̣εχόμ̣ε̣θ̣α̣ τὰ
μὲν κρίνειν, τὰ δὲ
κατέχειν καὶ ἐμφαί
νoιθ’ ἡμῖν ἀληθῆ λέ-
5 γειν ὥϲπερ πολλά̣κιϲ
ἂν ἐ̣μφανε̣ίη̣{ι}.

La Gragnuola di Novità

Microsoft e OpenAI starebbero discutendo di un investimento congiunto di 500 milioni di dollari in Figure AI, un'azienda focalizzata sullo sviluppo di robot umanoidi. Il potenziale accordo potrebbe valutare Figure AI a 1,9 miliardi di dollari, con un contributo iniziale di Microsoft di circa 95 milioni di dollari e un investimento di OpenAI di 5 milioni di dollari. La startup punta a impiegare il suo robot dotato di intelligenza artificiale, Figure 01, per compiti ritenuti pericolosi per gli esseri umani, affrontando la carenza di manodopera.

Sebbene il round di finanziamento sia in corso, se finalizzato, la valutazione di Figure AI potrebbe aumentare, diventando un unicorno del settore. In precedenza l'azienda aveva già raccolto 70 milioni di dollari in un round di finanziamento guidato da Parkway Venture Capital.

Questo potrebbe dare una bella accellerata al settore degli androidi dopo Boston dynamics e Optimus di Tesla. Ho le mie perplessità sull'utilizzo di robot in molti lavori (non hanno senso da un punto di vista economico) ma sono felice che anche questa strada venga esplorata.


Sempre nei dintorni di OpenAI parliamo di Sam Altman, che dell'azienda è il CEO: sembra stia discutendo con Samsung e SK Group in Corea del Sud per creare un'alleanza sui semiconduttori AI, esplorando opportunità di investimento.

Questa notizia non è nuova ed era già girata quando era stato messo alla porta un paio di mesi fa. Secondo quanto riferito, Altman intende produrre chip di intelligenza artificiale e ha espresso interesse a rifornirsi di memoria ad alta larghezza di banda (HBM) da Samsung e SK.

Sono in corso discussioni con i principali investitori potenziali, tra cui G42 e Softbank Group Corp. per creare una rete globale multimiliardaria di fabbriche di chip AI. Oltre a loro sono in gioco anche gli Emirati Arabi Uniti.

L'obiettivo è di raccogliere dai 5 ai 7 Miliardi di dollari.

Hai letto bene 5000 miliardi... che è qualcosa tra le 2 e 3 volte il prodotto nazionale lordo italiano. Tuttavia, non sarebbe sorprendente che Sam sappia precisamente quanto voraci saranno le AI nel futuro e si aspetti che il mercato dei chip cresca ben oltre i livelli attuali.

My two cents

Se leggi questa newsletter questa mossa di voler sviluppare dei Chip sembra seguire il normale sviluppo del mercato.

Ma se guardiamo la notizia in un contesto più largo: quante volte ho parlato di Chip, la mancanza di essi e di come il potenza di calcolo è una dei campi dove si stiano giocando le partire più importanti?

E come corollario: come andremo a fornire l'energia per nutrire questa potenza di calcolo? L'energia solare basterà?

Come al solito la mia mente "lineare" fatica a pensare a uno sviluppo "esponenziale", ma è proprio per questo che sto postando così tanto su questi argomenti.


Bard diventa Gemini . Se vai su bard.google.com verrai inoltrato a gemini.google.com/app. Come al solito l'ho provata per farmi un'idea. Se da un lato ChatGPT si sta impigrendo, dando risposte brevi, Gemini mi ha stupito.
Ho fatto due test: nel primo usandolo come un motore di ricerca avanzato, chiedendo info su un genere musicale di nicchia ed espandere da li. Le risposte mi sono piaciute e alcune erano anche formalmente corrette.

Nel secondo caso l ho usato a supporto della stesura di un articolo, chiedendo fonti e spunti e fornendo dove possibile anche il link.


Neuralink di Elon Musk ha impiantato con successo il suo dispositivo cerebrale in un essere umano per la prima volta. Secondo quanto riferito, il paziente si sta riprendendo bene, e questo rappresenta una promessa significativa per gli individui affetti da gravi paralisi, offrendo loro la possibilità di comunicare e interagire con le piattaforme digitali utilizzando i segnali neurali.

Denominato "Telepathy", l'innovativo prodotto di Neuralink segna un significativo balzo in avanti nella neurotecnologia. Pensate quante cose avrebbe potuto comunicare Stephen Hawking con una interfaccia uomo macchina.

Insieme ad altre aziende pionieristiche come Synchron e Precision Neuroscience, Neuralink sta guidando l'evoluzione della tecnologia di interfaccia cervello-computer, aprendo la strada ad applicazioni trasformative nel settore sanitario. L'operazione al momento è ancora invasiva, ma ci sono già studi per avere solo elmetti. Vediamo se il futuro sarà più cyberpunk o più solarpunk.


In una recente intervista Jim Collins, professore di ingegneria medica al MIT ha detto dei progressi incredibili nello scoprire una nuova classe di antibiotici grazie alle AI. Questo antibiotico chiamato Halicina funziona in maniera dagli altri e i test iniziali sembrano molto promettenti. Ascolta l'intervista per altre informazioni a riguardo.


Dopo la mezza delusione dei GPTs (che ogni tot vanno sistemati e sono troppo succubi dei cambi di umore di ChatGPT) OpenAI starebbe sviluppando due agenti AI per automatizzare compiti complessi.

Secondo The Information, il primo agente lavorerebbe come aiutante sui dispositivi dell'utente rendendo più facili alcuni compiti ripetitvi, per esempio trasferire dati tra documenti e fogli di calcolo o compilare rapporti di spesa.

Il secondo agente è più un assistente personale che sa fare ricerche: esegue attività basate sul web come la raccolta di dati pubblici, la creazione di itinerari di viaggio o la prenotazione di biglietti aerei.

Gli agenti sono ovviamente quello che tutti stiamo aspettando: io sono curioso di sapere come funzionerà l'AI prossima ventura di Apple.


L'americana Federal Communications Commission (FCC) ha ufficialmente dichiarato illegali le robocall create dall'intelligenza artificiale. Non si tratta di una nuova legge, ma di un'espansione delle tutele già applicate ai consumatori in base al Telephone Consumer Protection Act, che delinea le procedure legali per i soggetti accusati di aver emesso chiamate rapide.

Tutto questo è nato da una serie di chiamate automatizzate con la voce di Biden simulata da un AI che dispensava consigli non richiesti agli elettori, con lo scopo di indebolire la campagna del candidato democratico.

Speriamo che anche in Italia si legiferi qualcosa di simile, non vedo l'ora di avere qualche scammer telefonico che mi parla con la voce di Cicciolina per convincermi a investire in crypto.


Anche se molti continuano a considerare le AI di Google come il cugino un po' lento di ChatGPT, io sono convinto che Google ha tantissimi assi nella manica ma gli manca ancora un transformer degno di questo nome per riuscire a farli interagire col mondo.
Google DeepMind per esempio ha sviluppato un modello trasformatore da 270 milioni di parametri che ha raggiunto il livello di Grandmaster negli scacchi senza ricorrere alle tecniche di ricerca tradizionali. Addestrato su un set di dati di 10 milioni di partite con le informazioni del motore di scacchi Stockfish 16, il modello ha raggiunto uno score tanto alto da metterlo tra i top 3000 mondiale e ha dimostrato di essere in grado di risolvere rompicapi scacchistici avanzati. Qui c'è il paper di arxiv.org


E anche per questo episodio abbiamo dato, e di spunti di pensiero ce ne sono vari

Abrazo,

Manolo

Mastodon