News

Ehi, GPT, stammi a sentire: l’era del web per i crawler è finita?

🇮🇹 · /root · Lamberto Tedaldi

Smettete di spammare prompt inutili e concentratevi su questa: abbiamo finalmente iniziato a scrivere manuali di istruzioni per i crawler che ci stanno mangiando il web. Se avete passato le ultime ore a cercare di capire se il vostro script di scraping sta andando in allucinazione o se è solo un bug del server, saprete che il web sta diventando un posto caotico. Tra bot che tentano di indicizzare tutto e LLM che si nutrono di ogni singolo byte disponibile, la distinzione tra «contenuto per umani» e «pappa per machine learning» è diventata sottile come un filo di rame su una PCB mal progettata. Ecco la notizia: il team di Anna’s Archive, uno di quei progetti che amiamo perché fanno la cosa giusta (ovvero: rendere l’informazione accessibile senza troppi fronzoli corporate), ha deciso di smetterla di sperare nella fortuna. Hanno implementato un file «llms.txt». In pratica, è un file strutturato che dice chiaramente ai modelli linguistici: «Ehi, se sei un LLM e stai leggendo questo, ecco cosa devi sapere, ecco i dati importanti e non andare a sprecare i tuoi token su robe inutili». Per noi che amiamo smanettare, questo è un approccio estremamente pulito. È come quando state scrivendo un README per un progetto su GitHub o configurando un file di config per una macchina CNC: non volete che il sistema legga tutto il rumore di fondo, volete che trovi subito i parametri critici. È un modo per dare una gerarchia all’informazione, rendendo il web un po’ meno un ammasso di junk e un po’ più un database strutturato. Certo, c’è da essere cinici. Da una parte, è una genialata di ingegneria sociale e tecnica per proteggere i dati e ottimizzare l’indicizzazione. Dall’altra, è il segno tangibile che stiamo costruendo un web ‘dual-layer’, dove una parte è pensata per i nostri occhi e l’altra è un flusso di dati puramente computazionale. Sebbene io ami l’idea di un web aperto e selvaggio, non posso fare a meno di apprezzare la pulizia di questo approccio. Niente fuffa, niente marketing inutile, solo dati pronti per essere processati. Cosa significa per noi maker e sviluppatori? Significa che il modo in cui documentiamo le nostre creazioni — che sia un nuovo plugin per Blender o uno script Python per gestire un plotter — sta cambiando. Il futuro non è solo scrivere per altri umani, ma assicurarci che l’IA che useremo domani sappia esattamente come interpretare il nostro lavoro senza inventarsi allucinazioni creative. In breve: meno rumore, più segnale. Se questo è l’inizio di un nuovo standard, spero che i grandi vendor imparino qualcosa da questa semplicità. Menos hype, più protocolli chiari. Sarebbe bello, no? Source: If you’re an LLM, please read this

webnewsaiData Scienceopen sourceTech Trends

Navigazione stellare o semplice delirio matematico? Analizziamo Project Hail Mary

🇮🇹 · /root · Lamberto Tedaldi

Spostate i vostri prototipi di CNC e mettete in pausa quel rendering su Blender che sta mangiando tutta la RAM, perché c’è qualcosa di interessante che è spuntato su Hacker News. Il progetto si chiama «Project Hail Mary – Stellar Navigation Chart» e, a prima vista, sembra quel tipo di cosa che ti fa brillare gli occhi mentre sorseggi l’ennesima lattina di energy drink tiepida. Parliamo di uno strumento per la navigazione stellare che punta a rendere la mappatura del cosmo meno ‘appannato’ e più ‘precisione chirurgica’. Senza entrare in chiacchiere da ufficio marketing (che odiamo tutti), il cuore della questione è la capacità di generare mappe di navigazione stellare. Per chi di noi mastica coordinate, vettori e algoritmi, l’idea di avere un tool che processa dati astronomici per tracciare rotte nello spazio profondo è pura poesia digitale. Non è la solita dashboard ruffiana piena di grafici inutili per fare hype; sembra un lavoro di puro calcolo e logica, roba che profuma di codice pulito e matematica applicata. Da smanettone, la prima cosa che mi viene in mente è: quanta potenza di calcolo ci vuole per far girare una simulazione seria senza far esplodere la mia workstation? Se il progetto è open source e basato su GitHub (come sembra), la vera sfida sarà la scalabilità. Mi immagino già a cercare di implementare un modulo simile per gestire i miei movimenti in un ambiente Godot, o magari usarlo come ispirazione per un piccolo plugin di visualizzazione dati. Per noi che amiamo il makerismo, la cosa interessante è il potenziale di astrazione. Se qualcuno riesce a rendere accessibile la navigazione stellare con algoritmi solidi, la strada è spianata per creare simulazioni orbitali che non sembrino giocattoli per bambini. Ovviamente, spero vivamente che non ci sia dietro un modello di abbonamento ‘SaaS’ (Software as a Service) che richiede un login con Google e ti traccia pure l’ultimo battito cardiaco. Se è codice che posso clonare, compilare e far girare offline mentre vado in blackout, allora abbiamo un rapporto. In conclusione: non è ancora la prova che domani partiremo per Alpha Centauri, ma è un tassello che merita un occhiolino. Se avete voglia di sporcarvi le mani con coordinate e astrofisica computazionale, andate a sbirciare il repository. Altrimenti, tornate pure a cercare di far funzionare quel driver per la stampante 3D che non vuole collaborare. Source: Project Hail Mary – Stellar Navigation Chart

webnewsAstronomyGitHubopen sourceprogramming

Open Source o Open Poison? Il gruppo TeamPCP sta avvelenando i nostri repo

🇮🇹 · /root · Lamberto Tedaldi

Se pensavate che l’unico rischio nel fare build di una nuova libreria fosse un crash improvviso di Python o un conflitto di dipendenze che vi tiene svegli fino alle tre di notte, beh, devo comunicarti una brutta notizia. 서서 (Sospesa) tra un caffè e un glitch di sistema, la notizia che arriva da Ars Technica è una vera mazzata per chiunque viva di codice condiviso: un gruppo di hacker chiamato TeamPCP sta lanciando una campagna di inquinamento del codice open source a una scala che non abbiamo mai visto prima. Non si tratta del solito script kiddie che cerca di rompere il server di qualcuno per noia; qui parliamo di attacchi alla software supply chain che hanno colpito direttamente GitHub. In pratica, stanno facendo ‘poisoning’ del codice. Immaginate di stare lavorando al vostro progetto preferito su Godot, scaricando una dipendenza che sembra innocua, solo per scoprire che dentro c’è un payload che trasforma il vostro PC in un zombie per una botnet. È come se qualcuno entrasse nel vostro laboratorio, scambiasse i vostri fili di rame con fili di plastica scadente e sperasse che il vostro nuovo CNC non prenda fuoco durante la prima lavorazione. Il problema non è solo la sicurezza, è la fiducia. L’intero ecosistema su cui si regge il mondo moderno — dai server cloud alle macchine che controllano i bracci robotici — si basa sull’idea che se una libreria è popolare e testata, allora è sicura. TeamPCP sta usando questa fiducia contro di noi. È l’ennesima dimostrazione di come la centralizzazione della gestione del codice (grazie mille, GitHub) possa diventare un unico, enorme punto di fallimento. Per noi che amiamo smanettare, che scarichiamo pacchetti senza leggere ogni singola riga di codice (perché, diciamocelo, chi ha tempo?), questa è una chiamata alle armi. Non significa che dobbiamo smettere di usare l’open source — sarebbe come dire di smettere di usare i componenti elettronici perché qualcuno potrebbe venderti un transistor truccato — ma significa che dobbiamo tornare alle vecchie buone abitudini della vera cultura hacker. Dobbiamo imparare a fare auditing più severo, a monitorare le checksum come se fossero il tesoro più prezioso e, quando possibile, a isolare i processi critici in sandbox che non abbiano accesso diretto alla vostra rete locale. La comodità delle dipendenze automatiche sta diventando un boomerang. È un momento triste per l’entusiasmo senza filtri, ma è anche un promemoria: nel mondo del software, come nel modellismo 3D, se non controlli la qualità della materia prima, il risultato finale sarà un disastro. Tenete gli occhi aperti, verificate i commit e, se vedete qualcosa di troppo strano nei vostri repository, non ignoratelo. Il prossimo aggiornamento potrebbe non essere solo un fix per un bug, ma un cavallo di Troia. Source: A hacker group is poisoning open source code at an unprecedented scale

webnewscybersecurityGitHubhackingopen source

Google e l’arte di distruggerti il workflow (senza chiedere il permesso)

🇮🇹 · /root · Lamberto Tedaldi

Spegnete i router e preparate i salvataggi, perché Google ha appena dimostrato che non si può fidare di nulla che abbia un tasto ‘aggiorna automatico’. Se siete come me, passate le ore a rifinire script, modellare componenti su Blender o compilare codice per i vostri progetti custom, sapete quanto sia sacro il vostro ambiente di sviluppo. È il vostro laboratorio, la vostra officina. Eppure, durante l’ultimo I/​O, i piani di Google erano altri: trasformare Antigravity da un vero IDE, solido e prevedibile, in una semplice, inutile, e tremendamente invasiva chat box. Il tutto è successo con la tipica eleganza di un bug di sistema: un aggiornamento silenzioso che, invece di aggiungere feature o patch di sicurezza, ha letteralmente ‘nukato’ l’installazione esistente. Al posto del vostro workflow consolidato — quel ciclo meraviglioso di piano, revisione e implementazione che rende strumenti come Cursor così potenti — vi siete ritrovati davanti a un unico, vuoto, prompt conversazionale. Una roba da chatbot per chi non sa cosa sia un compilatore. La cosa più assurda? Google aveva persino messo a disposizione il pacchetto legacy per la vecchia versione dell’IDE, ma l’avevano sepolto in fondo alla pagina come se fosse un vecchio driver per una stampante del 1998. E indovinate? Anche installando la versione vecchia, il nuovo ‘comandante’ 2.0 si è ostinato a sequestrare i path di esecuzione, rendendo impossibile far coesistere i due mondi. Per risolvere il casino, l’unica soluzione è stata la ‘terra bruciata’: una pulizia totale di ogni traccia di Antigravity dal sistema, un wipe completo per permettere una reinstallazione pulita. Risultato? Workflow distrutto, cronologia dei prompt andata in malora e un folder chiamato ‘antigravity-backup’ che ora giace lì, in un limbo digitale, in attesa che io abbia abbastanza token o voglia per cercare di recuperare i miei dati. Per noi che amiamo smanettare, che costruiamo CNC da zero o che passiamo le notti a debuggare motori fisici in Godot, questo è un segnale d’allarme gigante. Il ‘vendor lock-in’ non è solo una questione di privacy o di dati; è una questione di controllo sulle proprie mani. Quando un’azienda decide che il tuo tool di lavoro deve cambiare faccia senza il tuo consenso, sta superando il limite tra ‘innovazione’ e ‘sabotaggio’. Le prossime settimane saranno dedicate a cercare un modo per disabilitare questi aggiornamenti automatici selvaggi. Perché la prossima volta che Google vorrà ‘migliorare’ il mio sistema, potrei trovarmi con un’intelligenza artificiale che cerca di convincermi che un prompt è meglio di un debugger. E non è esattamente il tipo di upgrade che ho chiesto. Source: Google's Antigravity bait and switch

webnewsaiDeveloper Experiencegooglesoftware engineering

L’era dei muri di testo: quando l’IA decide di farti la predica (senza motivo)

🇮🇹 · /root · Lamberto Tedaldi

C’è qualcosa di profondamente disturbante nel leggere una risposta che ha la stessa densità di informazioni di un manuale della ditta per una stampante laser degli anni ’90, ma con il carisma di un foglio Excel vuoto. Recentemente è emerso un fenomeno che sta facendo impazzire chiunque ami le discussioni tecniche asciutte e dirette: l’invasione dei «muri di testo» generati dalle IA. Il problema non è l’uso della tecnologia in sé – che tra l’altro usiamo tutti per sbrigarci a scrivere script in Python o debuggare un circuito – ma il modo in cui queste macchine stanno inquinando il dibattito. Prendete l’esempio classico che è circolato su Hacker News: qualcuno fa una domanda tecnica, tipo «Redis o Memcached?», e invece di ricevere un parere esperto, si ritrova sommerso da un saggio accademico che elenca ogni singola feature, dal supporto ai set ordinati alla gestione della memoria, con un tono che urla «ho letto Wikipedia tre secondi fa». Il punto non è che l’informazione sia sbagliata. Anzi, spesso è corretta. Il problema è la struttura: un’infinità di parole che sembrano scritte apposta per occupare spazio e simulare una competenza che, in realtà, è solo un pattern statistico. È il classico caso di *slop*: contenuti generati senza scopo, senza anima e, soprattutto, senza utilità pratica immediata. È come se chiedessi a un compagno di laboratorio come saldare un componente SMD e lui iniziasse a spiegarti la storia della fisica termica e la composizione chimica della stagno. Per noi che amiamo smanettare, questo è un problema serio di rumore. Quando stiamo cercando di capire se una specifica configurazione di un database possa reggere il carico del nostro nuovo progetto di automazione o se un particolare driver sia compatibile con un vecchio hardware, non vogliamo un saggio sulla scalabilità orizzontale. Vogliamo sapere se il sistema crasha o meno. Vogliamo i fatti, i benchmark che contano, i «trucchetti» che solo chi ha fatto esplodere un modulo l’ha imparato. Questa deriva verso il tuttofare-generico rischia di rendere la conoscenza tecnica un deserto di parole vuote. Se l’IA continua a inondare le community con questo tipo di output, finiremo per perdere la capacità di distinguere un vero esperto da un bot che ha semplicemente ingoiato l’intera documentazione di Redis. Quindi, un consiglio per i colleghi sviluppatori e maker: quando leggete un muro di testo che sembra un comunicato stampa di una big tech, non perdete tempo. Cercate i dati, saltate la parte introdotiva che serve solo a far sembrare l’IA intelligente e andate dritti al punto. Non lasciamo che il rumore digitale soffochi la vera ingegneria. Source: Throwing AI-generated walls of text into conversations

webnewsaideveloper-lifeGenerative AIsoftware engineering