Vending-Bench: come testare un Agente nel mondo reale (o quasi)
Approfondimento su Vending Bench. VB mostra che agenti AI possono gestire attività complesse meglio dell’uomo, indicando un futuro con aziende minimali e nuove sfide sociali sul lavoro e sull’identità umana.
Memory Updated... 7 (novembre 2025)
Principali novità LLM (gemini 3, ChatGPT 5.1 Grok 4.1),e World Model. strumenti creativi, piattaforme di sviluppo e nuovi benchmark più realistici.
Guida breve ai modelli di LLM / AI Generative
Esistono diverse aziende che offrono la propria AI Generativa. Ogni LLM ha anche diversi modelli ed è oggettivamente complesso capire quale modello utilizzare dentro la stessa famiglia di servizi. in questo articolo facciamo un po' di ordine.
Episodio 55.2025: Stiamo entrando nell'era degli Agenti?
Breve recap del passato e presente prossimo delle AI Generative, Business model dell'editoria moderna, microchip e distopia.
Mak's File - Episodio 32.2023: Cartoni animati, Bias vs Bias, microprocessori
Questa settimana ti parlo di un nuovo modello per tradurre le immagine in fotogrammi di cartoni animati, la guerra dei microchip sempre più calda, un ingegnoso modo di mettere dei controlli ai Bias delle AI.
Week 14.2023: AI,LLM Verticali, Amazon
Oggi Parliamo di: Ancora l'etica nelle AI, la prima morte associata a un chatBot, i primi LLM verticali.