Hackerspace News — 19 June

News

Tracce digitali nei LLM: sei tu, o è solo un pattern statistico?

🇮🇹 · /root · Lamberto Tedaldi

C’è un fantasma nella macchina e, spoiler, ha le tue stesse preferenze di voto e lo stesso modo di scrivere i commenti su Reddit. Mentre noi pensiamo di navigare nel web con un briciolo di anonimato, la realtà è che stiamo alimentando un mostro statistico che non dimentica nulla. Con l’esplosione degli LLM, il traffico non si limita più a finire nei database di Google o Meta, ma viene assorbito direttamente nei «weights», ovvero quei miliardi di parametri che compongono i modelli linguistici. E la domanda sorge spontanea: quanto di te è rimasto intrappolato in quei calcoli probabilistici? Un gruppo di developer ha appena rilasciato «Are You in the Weights?», un progetto che è una vera chicca per chi ama smontare la realtà. L’idea è geniale nella sua semplicità: il tool interroga contemporaneamente una serie di modelli, dai giganti muchachotraschisti (i cosiddetti «frontier models») a quelli più piccoli e agili, per vedere se riescono a riconoscerti o a ricollegare determinati pattern alla tua identità. Il funzionamento è tecnico ma affascinante. Il sistema lancia query in parallelo, raccoglie le risposte e poi usa tecniche di clustering per vedere se c’è una coerenza nel riconoscimento. In pratica, cerca di capire se la tua ‘impronta digitale’ è diventata parte integrante della struttura neurale di questi modelli. Non è solo un esercizio di stile; è un modo per visualizzare quanto l’addestramento su dati pubblici abbia creato una memoria collettiva (e personale) che non possiamo cancellare con un semplice ‘delete’ dal browser. Per noi che mastichiamo codice e amiamo l’open source, questo progetto è una boccata d’aria fresca rispetto ai soliti comunicati stampa pieni di hype inutile. Non ci sono promesse di rivoluzioni magiche, solo un tentativo onesto di esplorare una nuova frontiera della privacy e della tracciabilità. Certo, non cambierà le leggi europee o le policy di OpenAI, ma ci dà uno strumento per guardare sotto il cofano e vedere quanto siamo effettivamente ‘esposti’. È un tool che ti fa sentire un po’ come Neo in Matrix, ma senza il superpotere di piegare la realtà. Ti fa solo capire che, in un mondo di modelli che imparano da tutto, il concetto di ‘iniziare da zero’ è diventato un mito romantico da dimenticare. Source: Show HN: Are You in the Weights?

webnewsaidatascienceHackerNewsLLM

Git non è solo un .gitignore (e la tua salute mentale ringrazierà)

🇮🇹 · /root · Lamberto Tedaldi

Se la tua cronologia di Git somiglia a un museo di file temporanei, log spazzatura e configurazioni personali che non dovrebbero mai vedere la luce di un commit, non sei solo. Siamo tutti sulla stessa barca (o meglio, nello stesso container Docker mal configurato). Per anni abbiamo agito come se il file .gitignore fosse l’unica linea di difesa tra noi e il disastro. Ma la verità è che Git offre delle scorciatoie molto più eleganti per ignorare tutto ciò che è inutile, senza dover sporcare il repository con regole che valgono solo sulla tua macchina. È un po’ come quando in un film sci-fi il protagonista trova un comando segreto per bypassare la sicurezza del mainframe senza lasciare tracce nel log. Il primo livello, quello che conosciamo tutti, è il classico .gitignore. È il colpo pesante, quello che viene pushato nel repo e che tutti vedono. Va bene per i file che *tutti* devono ignorare, tipo la cartella ‘node_modules’ o i file di build. Ma se devi ignorare quel tuo file ‘appunti_segreti_e_piani_per_la_conquista_del_mondo.txt’ che usi solo tu per gestire il tuo workflow, metterlo nel .gitignore è un suicidio professionale. Qui entra in gioco il secondo livello: .git/info/exclude. Questo file vive dentro la cartella .git del tuo repository locale e, la cosa fondamentale, non viene mai pushato. È il posto perfetto per le tue personalizzazioni ‘sporche’ che restano confinate solo al tuo progetto, senza infastidire i tuoi colleghi o contaminare la repo ufficiale. È il rifugio sicuro per chi vuole customizzare il proprio ambiente senza lasciare impronte digitali nel codice condiviso. E se proprio vuoi fare il pro e pulire l’intera tua workstation, esiste il terzo livello: il file di ignore globale. Se usi macOS, ad esempio, puoi dire a Git di ignorare per sempre i fastidiosi .DS_Store in ogni singolo progetto che toccherai, senza dover scrivere una riga di codice in ogni repo. Basta configurare un file in ~/.config/git/ignore (o dove preferisci) e Git lo applicherà come un filtro universale su tutta la tua macchina. La parte più divertente? Se un giorno ti svegli nel caos e non capisci più perché un file non viene tracciato, esiste il comando ‘git check-ignore -v’. Ti dice esattamente quale file, in quale riga e in quale percorso sta facendo da guardiano. Niente più misteri degni di un episodio di Black Mirror. In un mondo dove tutto cerca di essere tracciato, monitorato e analizzato, imparare a usare questi livelli di esclusione è un piccolo atto di resistenza tecnica. Meno rumore nel repo, meno fuffa nei commit, più focus sul codice che conta davvero. Source: .gitignore Isn't the only way to ignore files in Git

webnewsdevopsgitopensourceprogramming

Broadcom e il furto legalizzato: Tesco dice basta (e noi diciamo: godetela!)

🇮🇹 · /root · Lamberto Tedaldi

Se pensate che i prezzi dei componenti per le vostre stampanti 3D siano diventati folli, aspettate di leggere cosa sta combinando Broadcom con la gestione di VMware. Secondo i documenti depositati in un tribunale inglese, il colosso della distribuzione Tesco ha deciso di dare un calcio nel sedere a VMware, spostando ben 40.000 server workload altrove. Il motivo? Non è un bug nel codice o un problema di performance, ma un banale e brutale aumento dei prezzi del 175% circa. Sì, avete letto bene: un incremento di quasi il doppio del costo, deciso con la stessa delicatezza con cui si schiaccia un chip sottile con un saldatore a 400 gradi. Tesco ha parlato chiaro, definendo la condotta di Broadcom come «abusiva». È la classica mossa da azienda che ha capito di avere la gente per le palle grazie al vendor lock-in e decide di spremere i clienti finché non riescono a scappare. È lo stesso tipo di dinamica che odiamo quando un software proprietario ti costringe a comprare hardware specifico e costosissimo solo per far girare una funzione che su un sistema open source funzionerebbe meglio e gratis. Da smanettone, questa notizia mi fa gasare e preoccupare allo stesso tempo. Gasare perché vedere un gigante come Tesco che dice «andatevene affari vostri» e inizia una migrazione massiccia di 40.000 istanze è un segnale potentissimo. È la prova che, per quanto la infrastruttura sia complessa, la via di fuga esiste. Ma preoccupare perché conferma che il mondo enterprise sta diventando un terreno di caccia per i predatori che odiano l’innovazione e amano solo i margini di profitto gonfiati. Cosa significa per noi, che passiamo le serate a compilare kernel custom o a far girare container su vecchi server recuperati dai rifiuti elettronici? Significa che non dobbiamo mai diventare troppo dipendenti da un unico ecosistema. Se Broadcom può fare questo a Tesco, può farlo a chiunque. La vera libertà sta nel saper usare alternative open-source, nel saper gestire l’astrazione dell’hardware e nel non farsi incastrare in licenze che sembrano scritte da un sadico. In un mondo dove i giganti del software cercano di trasformare ogni licenza in un ricatto, l’unica difesa è la competenza tecnica e la capacità di spostare i carichi di lavoro dove l’interoperabilità è la priorità, non il fatturato del prossimo trimestre. Quindi, meno hype per le nuove feature inutili e più focus su tutto ciò che è indipendente dal vendor. La migrazione è l’unica vera patch che può salvare il settore. Source: Tesco moving 40,000 server workloads off VMware amid Broadcom's “abusive conduct”

webnewsBroadcomopen sourceTescovendor lock-in

Spotify e Live Nation: Il nuovo club esclusivo per i fan (o il nuovo modo per farci pagare di più?)

🇮🇹 · /root · Lamberto Tedaldi

Avete mai provato quella sensazione di impotenza quando cercate di comprare un biglietto per il concerto del vostro gruppo preferito e vi ritrovate a combattere contro bot russi e scalper che hanno la velocità di connessione di un modem 56k rimasto in un garage abbandonato? Ecco, Spotify ha deciso di intervenire con una soluzione che promette di salvare la pelle ai veri appassionati. La notizia, trapelata da Gizmodo, è che la piattaforma di streaming sta stringendo le mani a Live Nation per lanciare una nuova funzione: una fase di vendita riservata ai cosiddetti «superfan». In pratica, se Spotify sa che ascolti l’album di quell’artista in loop dal 2015 e non hai mai saltato un suo singolo, potresti avere la priorità sull’acquisto dei biglietti prima che la vendita generale inizi a far esplodere i prezzi. Sulla carta, sembra una figata. Un premio per la fedeltà, un modo per bypassare il caos della vendita pubblica e dare una possibilità a chi l’artista lo vive davvero. Ma, e c’è sempre un «ma» grande come un server rack, per chi è abituato a leggere tra le righe del codice. Il partner di questo progetto è Live Nation, ovvero l’entità che è spesso indicata con il dito come la principale responsabile dell’aumento vertiginoso dei prezzi dei biglietti negli ultimi anni. È un po’ come se chiedessi a un cattivo di un film di Marvel di aiutarti a proteggere il quartiere: tecnicamente potrebbe funzionare, ma l’intento finale resta comunque il controllo del mercato. Certo, per noi che viviamo in Italia, la questione ha un sapore un po’ diverso. Sappiamo bene che il mercato dei concerti da noi ha dinamiche proprie, spesso legate a una distribuzione più frammentata rispetto al colosso americano. Tuttavia, l’impatto di una piattaforma globale come Spotify è inevitabile. Se iniziano a creare questi ecosistemi chiusi, dove l’accesso ai contenuti fisici (sì, i concerti) dipende dal tuo livello di interazione digitale con un algoritmo, stiamo entrando in un territorio poco amato da chiunque apprezzi la libertà di accesso e la trasparenza. Il rischio è che questo sistema diventi un modo elegante per incentivare l’uso intensivo della piattaforma e creare un perimetro dove tutto, dal flusso audio all’ingresso allo stadio, sia monitorato e monetizzato attraverso un unico account. È una strategia di fidelizzazione che, se da un lato premia l’utente accanito, dall’altro costruisce muri invisibili intorno a ciò che dovrebbe essere accessibile a tutti. Insomma, restiamo in attesa di vedere come verrà implementata questa funzione. Sarà una rivoluzione per i fan o solo un altro modo per assicurarci che l’algoritmo sappia esattamente quanto siamo disposti a pagare per un posto in prima fila? Tenete d’occhio i log, perché la partita si gioca tutta lì. Source: Spotify Will Now Reserve Tickets for Superfans Before General Sales Can Skyrocket in Price

webnewsLive NationMusic BusinessMusic IndustrySpotify

Ubiquiti lancia l’Enterprise NAS: Finalmente il file system ZFS esce dal dungeon degli sysadmin

🇮🇹 · /root · Lamberto Tedaldi

C’è qualcosa di profondamente catartico nel vedere un nome che di solito associamo ai router che fanno girare la rete della nostra smart home avanzata (e che a volte decidono di andare in crash senza motivo) che prova a bussare alla porta del mondo enterprise con le maniere forti. Ubiquiti ha appena annunciato il suo nuovo Enterprise NAS (ENAS), e la notizia che fa saltare sulla sedia chiunque abbia passato troppe notti a configurare pool di dischi è una sola: è basato su ZFS. Sì, avete letto bene. ZFS. Quel file system che è il vero pilastro della resilienza dei dati, finalmente in un prodotto che promette di eliminare tutto quel nonsense tipico delle soluzioni corporate: licenze esorbitanti, hardware proprietario che sembra un reperto archeologico e una complessità gestionale che richiederebbe un PhD in astrofisica solo per fare un backup. L’idea di Ubiquiti è quella di offrire una piattaforma di storage locale, privata e scalabile, eliminando l’overhead che solitamente accompagna le infrastrutture enterprise. In pratica, vogliono portarti la potenza del file system più amato dagli smanettoni in un pacchetto che promette semplicità e performance. Dal mio punto di osservazione, questa è una mossa che può far oscillare il cuore tra l’entusiasmo puro e il sospetto cronico. Da un lato, vedere ZFS spinto verso l’alto è una vittoria per la tecnologia stessa. Se riesci ad avere la solidità del checksumming e la gestione avanzata dei snapshot senza dover compilare un kernel custom o combattere con configurazioni di RAID manuali che ti fanno venire l’ulcera, allora è una figata atomica. Per noi che amiamo montare server fatti in casa con componenti riciclati o che gestiamo piccoli cluster per i nostri progetti di automazione, avere una soluzione ‘pronta all’uso’ ma tecnicamente seria è un sogno. Dall’altro lato, c’è il classico ‘ma’. Sappiamo come funziona l’ecosistema Ubiquiti. Sono fantastici, ma tendono a creare dei giardini recintati molto accoglienti, dove tutto funziona finché non decidi di uscire dal sentiero tracciato. Il rischio di vendor lock-in è sempre dietro l’angolo: quanto sarà ‘aperta’ questa piattaforma? Potrò smanettare con la configurazione o sarò limitato a una dashboard bellissima ma priva di qualsiasi potere decisionale? E la questione privacy? In un mondo di cloud onnipresenti, un NAS enterprise deve essere un bunker, non un spyware travestito da storage. In conclusione, se Ubiquiti riuscirà a mantenere le promesse di semplicità senza trasformare l’ENAS in una scatola nera impenetrabile, avremo tra le mani uno strumento rivoluzionario. Se invece sarà solo un altro ecosistema chiuso con un bel vestito ZFS, beh… torneremo volentieri ai nostri vecchi server custom fatti con pezzi di recupero e tanta, tantissima pazienza. Source: Ubiquiti: Enterprise NAS, Built on ZFS

webnewsEnterprise TechNASstorageUbiquiti

L’arte di ignorare gli esperti (e pagare il conto dopo cinque anni)

🇮🇹 · /root · Lamberto Tedaldi

Scommetto che non tutti avete la pazienza di avvertire qualcuno di un errore imminente per ben cinque anni, aspettando che il disastro avvenga e poi godervi lo spettacolo del conto che arriva. Il caso in questione riguarda Elkjop, un colosso della vendita al dettaglio in Norvegia, che ha appena ricevuto una mazzata da 20 milioni di corone (parliamo di circa 1.8 milioni di euro) dal Datatilsynet, l’autorità per la protezione dei dati norvegese. Il motivo? Un trucchetto piuttosto vecchio e decisamente poco elegante: hanno praticamente costretto gli utenti ad accettare il trattamento dei dati personali per poter accedere ai benefici del loro loyalty club. In pratica, o ti svendi alla loro base dati, o non ricevi sconti. Un classico approccio «prendere o lasciare» che, spoiler, non è affatto legale. La cosa incredibile non è solo la multa, ma il fatto che un esperto del settore avesse avvisato il loro DPO (Data Protection Officer) esattamente cinque anni fa. Immaginate la scena: un consulente che punta il dito, spiega che quel workflow è una bomba a orologeria pronta a esplodere, e il management risponde con un sorrisetto compiaciuto e un ‘andiamo avanti così che i numeri crescono’. Cinque anni dopo, la bomba è esplosa e ha lasciato un buco nel bilancio che nemmeno un upgrade massiccio di RAM potrebbe riparare. Per noi che viviamo di open source e di controllo totale sui nostri sistemi, questa è la dimostrazione di quanto sia tossica la mentalità del ‘growth hacking’ a tutti i costi. Creare barriere artificiali e manipolare le scelte dell’utente per estrarre valore è una pratica che non solo mina la fiducia, ma crea un debito tecnico e legale che prima o poi viene incassato con gli interessi. Certo, la notizia arriva dalla Norvegia e le leggi locali possono sembrare distanti dal nostro quotidiano tra un caffè e una sessione di debugging, ma il principio è universale. Anche qui, con il Garante che ogni tanto si sveglia con la voglia di fare sul serio, il messaggio è chiaro: le regole sulla gestione delle informazioni non sono suggerimenti opzionali che puoi ignorare se hai obiettivi di marketing aggressivi. In conclusione, se siete dei manager e qualcuno vi dice che la vostra nuova feature di registrazione è un po’ troppo ‘insistente’ nel richiedere permessi inutili, un consiglio: ascoltatelo. Costa molto meno di una multa da un milione e mezzo di euro e vi evita di diventare il meme della settimana nel mondo della privacy. Source: I told them forced consent was unlawful. 5 years later it cost Elkjop €1.8M

webnewsCorporate FailsData ProtectionGDPRprivacy

Il grande salto: Noam Shazeer abbandona Google per OpenAI (e noi restiamo a guardare)

🇮🇹 · /root · Lamberto Tedaldi

Le correnti magnetiche del talento tech stanno cambiando direzione, e stavolta non si tratta di un semplice aggiornamento di driver. Se avete seguito le ultime movimentazioni nel panorama AI, avrete notato un rumore di fondo decisamente interessante: Noam Shazeer, uno dei pilastri che ha guidato lo sviluppo di Gemini in casa Google, ha ufficialmente deciso di saltare il fosso e unirsi al team di OpenAI. Sì, avete letto bene. Uno dei ‘big brain’ che ha contribuito a plasmare i modelli più avanzati che abbiamo oggi ha deciso che l’erba del giardino di Sam Altman è decisamente più verde. Per chi non fosse aggiornato, Shazeer non è uno qualunque; è uno di quei nomi che, quando appaiono nei paper di ricerca, fanno tremare i server. Il suo passaggio da Google a OpenAI non è solo un classico ‘talent grab’ da manuale della Silicon Valley, ma un vero e proprio trasferimento di know-how strategico. È come se il progettista capo di un motore a combustione leggendario decidesse di spostarsi in un garage che sta cercando di costruire un reattore a fusione. Da smanettone, la cosa mi eccita e mi spaventa allo stesso tempo. Da un lato, c’è l’entusiasmo puro di vedere cosa potrà tirare fuori un genio del genere con le risorse (e la potenza di calcolo) che OpenAI sta accumulando. Potremmo assistere a un salto generazionale nei modelli linguistici che renderà i GPT attuali dei poveri script Bash scritti male. Dall’altro, però, c’è quel retrogusto amaro di sempre: la concentrazione di potere in pochissime mani. Per noi che amiamo smontare hardware, programmare in Godot o addestrare piccoli modelli locali sui nostri server domestici, questo trend è un segnale d’allarme. Mentre i colossi si contendono i pesi massimi per creare modelli sempre più chiusi, proprietari e decisamente troppo costosi da far girare su una RTX 4090, noi restiamo qui a cercare di capire come far funzionare un Llama senza far esplodere l’alimentatore. Il rischio di un monopolio intellettuale è reale: se i cervelli migliori finiscono tutti in un unico ecosistema chiuso, la libertà di sperimentare ‘wild’ diventerà sempre più difficile. In conclusione, congratulazioni a OpenAI, ma un occhio di riguardo alla community open-source. Speriamo che questo nuovo super-team produca qualcosa di rivoluzionario che non sia solo un altro muro di codice proprietario e inaccessibile. Restiamo in attesa di vedere i primi test, sperando che il prossimo grande breakthrough non arrivi solo tramite una API a pagamento con un sottoscrizione mensile che costa quanto un abbonamento a tutta la suite Adobe combinata. Source: Noam Shazeer Joins OpenAI

webnewsaigoogleMachineLearningopenai