Chi conta le pecore elettriche? -- Valerio Diaco

C'è una metafora che circola in varie declinazioni nei post sull'intelligenza artificiale: l'AI diventerà come l'elettricità. La pagheremo a consumo. Sarà un'utility, una di quelle infrastrutture sopra le quali scorre la vita quotidiana e della quale in fondo non sappiamo nulla, salvo controllare la bolletta una volta al mese.

La metafora è in larga parte calzante e cattura la traiettoria macro con onestà. Il problema è che si rompe in due punti critici, e questo sposta del tutto la domanda che dovremmo porci adesso.

Fallo leggere da Eva 0:00

Quello che la narrazione comune ha centrato

Prima della puntualizzazione, è doveroso un riconoscimento. La metafora regge a livello macro su tre punti:

Primo: L'intelligenza artificiale sta diventando un livello infrastrutturale, sotto le applicazioni di prossima generazione. Editor, browser, chat, software gestionali, dispositivi. Quasi tutto. Come l'elettricità un secolo fa, l'AI si sta stratificando sotto i mestieri, e fra qualche anno non sarà più un prodotto separato. Sarà un substrato cognitivo che alimenterà ogni oggetto che utilizzeremo.

Secondo: Pagheremo a consumo, in larga misura. Ci saranno tariffe flat per certe categorie, esattamente come per l'elettricità. Ma solo per chi avrà saputo guadagnarsi quella posizione di rilievo, tanto da negoziare alla pari con il grande fornitore. Sotto la flat ci sarà sempre un consumo reale, misurato. Token al secondo, finestre di contesto, chiamate al modello, livelli di reasoning attivati. Il fornitore lo sa, e lo fattura, anche quando l'utilizzatore non ci fa caso.

Terzo: La marginalità degli operatori medi tenderà a scendere nel tempo. La concorrenza fra fornitori, l'arrivo di alternative open source, la pressione regolatoria, il consolidamento delle architetture spingono nel medio termine il prezzo dell'unità base verso un livello stabile. La ricchezza si sposta verso chi controlla asset complementari (dati, brevetti, brand, distribuzione, hardware specializzato).

Sin qui il parallelismo regge in modo quasi perfetto. È una mappa utile per descrivere la traiettoria generale, ed è la mappa che il dibattito si è dato per parlare di AI in modo non del tutto isterico. Ok.

Giuro, l'ultima premessa, poi andiamo nel concreto.

Nel saggio precedente affermavo che la spaccatura del prossimo decennio non si sarebbe limitata al ceto medio economico e la conseguente irrilevanza che stava per travolgerci. C'è un livello sotto, più sottile, che si manifesta contemporaneamente, su un piano diverso da quello economico: il piano esistenziale.

Non ci sarà più un ceto medio economico, e questo lo si vedeva già negli anni Novanta. Soprattutto, però, non ci sarà più un ceto medio esistenziale. La biforcazione che attraversa l'asse intelligenza-a-consumo non si gioca più sui redditi. Si gioca sulla posizione mediana fra chi articola direzione propria e chi è articolato. E su quell'asse, una posizione mediana, in pratica, già non c'è più.

Dove la metafora si frantuma

L'elettricità ha una caratteristica che la narrativa comune continua a tralasciare: la puoi self-hostare. Pannelli solari sul tetto, batterie in cantina, qualche piccolo eolico in giardino, e in molti contesti, soprattutto in case singole, hai una via di fuga.

Per molti il self-host costa più della rete, eppure resta possibile. Esiste come opzione di riserva mentale, anche se non la si usa.

Con i modelli di intelligenza artificiale di frontiera, questa via di fuga non c'è. Vorrei essere preciso, perché si confonde facilmente. Non parlo dei modelli leggeri che si possono far girare su un MacBook o su un piccolo server casalingo al costo di un motorino. Quelli ci sono, faranno cose utili, e per molti casi d'uso saranno sufficienti a tamponare le evenienze. Parlo dei modelli di frontiera. Quelli che oggi muovono la qualità migliore disponibile sul mercato. Quelli che, se dovete scrivere un saggio articolato, fare un'analisi seria, generare codice complesso che funzioni senza perder giornate di rifinitura a mano, sarete costretti a usare. Quei modelli, artigianalmente dentro casa, non si fanno.

Il motivo è che i modelli di frontiera richiedono, per essere addestrati, infrastrutture che costano miliardi di dollari, mesi di tempo macchina su decine di migliaia di GPU specializzate, dataset enormi, team di ricerca dedicati. E richiedono, per essere fatti girare in inferenza al massimo della qualità, cluster dedicati di hardware specializzato e una catena di gestione dell'infrastruttura che non si replica in un singolo hardware da scrivania.

Si possono provare a comprimere e distillare in versioni più piccole. Lo stanno già facendo. Ma una distillazione perde sempre qualcosa, e spesso quel qualcosa è la cosa che vi serve: la profondità di ragionamento, la lunghezza utile del contesto, la robustezza nei casi limite.

Il risultato pratico, sull'asse strategico, è questo. Per l'elettricità, se domani il fornitore alza i prezzi, hai opzioni di mitigazione che vanno dalla rinegoziazione del contratto al passaggio a un altro operatore al self-host. Per i modelli di frontiera, se domani il fornitore alza i prezzi o cambia le politiche, le opzioni sono tragicamente più strette. Puoi cambiare fornitore, ma il provider alternativo ha caratteristiche diverse e l'integrazione non è certo gratuita. Puoi tornare a un modello open source, ma fai un salto di qualità verso il basso. Self-host dello stato dell'arte? Fuori discussione per noi comuni mortali

Tradotto: non è una semplice commodity. È una fottuta dipendenza.

C'è anche una conseguenza più radicale, che merita una formulazione un po' datata. Per chi ha letto un po' di filosofia dello scorso secolo, il discorso non suonerà nuovo. Chi possiede i mezzi di produzione possiede anche la libertà di fare le cose che quei mezzi rendono possibili. Spostiamo la formula dall'industria di un secolo fa al mestiere di oggi. Chi possiede i mezzi di produzione dell'intelligenza, possiede anche la libertà di pensiero, di azione, di ragionamento ai livelli che contano.

L'analogia ha conseguenze molto concrete e non resta sul piano astratto. Se i modelli di frontiera non si self-hostano, e se la qualità di pensiero che generano è significativamente sopra le alternative, allora la libertà di pensare al livello migliore disponibile passa per chi controlla l'accesso ai modelli. La gerarchia non sparisce con l'intelligenza declassata a commodity. Si riorganizza, e si gioca su un asse del tutto nuovo.

La finestra che si chiude

Passiamo ora ad aggiungere un secondo livello, temporale, che la narrazione comune dell'elettricità non arriva a toccare.

Adesso, in questo momento storico, i prezzi di accesso ai modelli di frontiera per i power user sono enormemente al di sotto del loro costo e valore reale. Questo non è certo un atto di generosità del fornitore, naturalmente. Ma stiamo giovando di un calcolo strategico di mercato. I provider hanno tarato i prezzi sul cliente medio: una persona che usa il loro modello di AI per scrivere mail, fare ricerche, riassumere documenti, generare immagini ogni tanto. Quel cliente medio, anche pagante un abbonamento mensile, consuma una frazione modesta della capacità che il piano gli garantisce sulla carta. Il fornitore mette pertanto a budget questa media e la usa come base di calcolo.

Quello che il fornitore ha sottostimato è la categoria laterale dei power user. Persone, e in qualche caso piccole organizzazioni, che usano i modelli a un'intensità venti, cinquanta, in qualche caso cento volte superiori alla media. Personalmente se non arrivo ad esaurire la mia quota settimanale di un account Max sento un dolore lancinante al petto come se dessi ai piccioni il piatto di un ristorante stellato. Per chi quindi è in questa categoria, i piani attuali rappresentano uno sconto strutturale rispetto al valore che generano e al costo reale di quel consumo per il fornitore.

Questa finestra non può restare aperta a tempo indefinito, chiaramente. La capacità di calcolo non è gratis e l'azienda fornitrice deve coprire il proprio costo. Gli investitori poi, che attualmente sono coloro che dobbiamo ringraziare più di chiunque altro per il gradito regalo, prima o poi chiederanno i ritorni.

Quando le politiche tariffarie verranno aggiornate, il prezzo per il power user salirà, probabilmente di molto. La finestra si chiuderà fra sei, dodici, ventiquattro mesi a seconda dei segmenti. Senza troppe pretese, è una mia stima orientativa che esiste come ordine di grandezza nei conti di chi gestisce questi mercati. E serve a metterti un po' di pepe sul divano per farti muovere il fondoschiena se ancora pensi ci sia tempo da perdere prima che il treno chiuda le porte e ciao ciao a chi perdeva tempo al bar della stazione o a dar corda ai commentatori da giornale mondano.

Le pressioni laterali

Sotto questo meccanismo si muovono inoltre due forze dai lati, che vale la pena citare perché accorciano la finestra ulteriormente.

La prima è la pressione open source dalla Cina. DeepSeek, gennaio 2025, ha aperto modelli di alta qualità a costi marginali rispetto ai fornitori statunitensi. "Eh ma che generosi questi orientali, dovremmo prendere tutti esempio". Certo, e io sono Mago Merlino.

La mossa va letta come strategia governativa: democratizzare l'AI globalmente significa indebolire il vantaggio americano, posizionare i fornitori cinesi come alternativa accessibile, replicare a scala globale uno schema che la Cina pratica da decenni nei mercati locali con i prezzi distruttivi.

La seconda è la mossa di Meta. Yann LeCun, capo della ricerca AI di Meta, ha codificato una strategia diversa. Quando capisci che la corsa al modello migliore non la stai vincendo, regali il modello e fai diventare il modello stesso una commodity. Vinci con quello che hai più di tutti gli altri: i dati. Meta ha i dati di consumo più estesi del mondo. Modello regalato più dati Meta, sul lungo periodo, è un vantaggio competitivo permanente sul vero asset.

Aggiungete il bootstrap di Mistral, le validazioni preventive delle aziende statunitensi con i loro paper di posizionamento, e il quadro si compone. Sotto la stessa etichetta convivono almeno quattro strategie diverse, che convergono in un punto unico: comprimere il prezzo dei modelli di frontiera. E quindi accorciare la finestra di pricing-error per chi paga.

Il punto del saggio non sono queste strategie in sé. Il punto è il loro effetto. La finestra esiste, è assolutamente transitoria, e al suo interno ognuno sta scegliendo che cosa farne, anche quando non se ne accorge. Soprattutto quando fa finta di non accorgersene nascondendo la testa sotto la sabbia. E indovina un po', sai cosa resta bello esposto alla mercè di chi passa quando si sta nella posizione dello struzzo?

La copia cinese all'uno per cento del prezzo

Ora togliamoci quest'altro sassolino perché è ormai la stessa storia ogni volta. "È l'affare del decennio", dicono. Modelli AI cinesi a una frazione del prezzo della frontiera statunitense. Letteralmente nell'ordine dell'uno per cento. "Buttiamoci di testa senza neanche guardare!!". I geni.

La risposta qui non sta nell'ideologia ma nell'operatività pratica, e vale la pena dirla tutta come si deve, perché pure fuori dall'AI fai questa boiata, vi conosco.

Per chi opera dove l'errore costa caro, la copia non è fungibile. La differenza fra un modello al novantanove e mezzo per cento di affidabilità e uno al novantotto per cento sembra trascurabile, sulla carta. Su lavori dove l'errore costa significativamente (codice in produzione, analisi finanziarie, deliverable che girano a migliaia di persone, decisioni che ne influenzano diverse altre a valle) un errore ogni cinquanta risposte invece che un errore ogni duecento è una differenza abissale. È la distanza che corre fra un sistema che ti svolta la giornata e uno che ti costa nottate di bestemmie. La proverbiale mannaia che punisce i furbetti, alla scala dei miliardi di parametri.

Per quella categoria di lavori, il costo reale del modello cinese va assolutamtne oltre l'uno per cento che vedi sull'etichetta. Sopra il prezzo nudo si accatastano: il costo del tempo per accorgersi degli errori (se non sei un incosciente), il prezzo del rischio degli errori che non riconosci (se non vuoi passare la vita a fare da babysitter al tuo macinino), e, non per ultimo, il costo cognitivo della perdita di fiducia nel sistema che usi. Ed ecco la ricetta per la nottata di bestemmie di cui sopra.

Ma non è tutto da buttare, chiaramente. Per lavori dove l'errore non costa caro, la situazione si rovescia. Per intrattenimento personale, esplorazione casuale, esperimenti senza conseguenze, la copia all'uno per cento può essere accettabile. Ma a questo punto, hai fatto 30...

La biforcazione fra chi paga e chi no, allora, non si distribuisce per dimensione di azienda o per ricchezza. Si distribuisce per intensità d'uso e per costo dell'errore. Un singolo professionista che lavora a livello serio paga la tariffa piena. Un'azienda grande che usa AI per cose secondarie può permettersi la copia. La gerarchia che il mercato nascondeva sotto i prezzi flat, sotto la pressione della finestra, si manifesta qui nel suo pieno - drammatico - splendore. Chi sta in piedi è chi ha capito su quale lato dell'asse opera.

La bolla che non sta in piedi sull'utenza che paga

Arriviamo adesso a parlare di soldi, tanto lo so che questo aspettano tutti.

Negli ultimi due anni si sono mossi sull'AI capitali nell'ordine delle migliaia di miliardi di dollari. Investimenti in datacenter, in fornitura di chip, in nuove aziende, in acquisizioni, in infrastruttura di rete, in fonti di energia per alimentare i datacenter. Numeri che fuori da quel mercato sembrano mastodontici, e che dentro quel mercato vengono trattati come noccioline al circo.

La domanda da porsi, senza troppi peli sulla lingua, è quindi: questa montagna di capitale viene ripagata da chi paga oggi i servizi AI?

La risposta onesta: no. Neanche lontanamente e di sicuro non al ritmo richiesto. La maggior parte degli utenti finali paga tariffe modeste, una piccola parte non paga nulla, e una porzione marginale di power user paga abbonamenti che, presi singolarmente, non coprono il loro consumo reale. I numeri non possono mentire.

È il più classico dei mercati emergenti finanziati da capitale di rischio. Il finanziamento copre il gap fra costo di servizio e ricavo, in attesa di tre cose. Che il prezzo dei chip scenda strutturalmente, e sta accadendo. Che gli utenti aumentino di un ordine di grandezza, e sta accadendo, ma più lentamente. Che alcuni operatori escano dal mercato consolidando i ricavi sui sopravvissuti, e questo è ancora in una sorta di stallo alla messicana.

Mentre il riassetto avviene, ci sono due rischi simultanei. Il primo: che la pazienza del capitale si esaurisca prima del consolidamento, e si entri in una fase di compressione dei budget. Il secondo: che il riassetto avvenga ma porti a un cambio di prezzi e politiche così netto che chi non ha costruito infrastruttura strutturale durante la finestra rimanga escluso dal mercato del lavoro abilitato dall'AI.

Chiamare bolla questa fase può essere prematuro. Chiamarla finestra finanziaria di durata limitata, no. È esattamente quello che è.

Cosa ne deriva

Riprendiamo il filo del saggio precedente. Avevo descritto la spaccatura del prossimo decennio come distinzione fra chi sa allinearsi con la macchina e darle direzione, e chi non sa farlo e dovrà fidarsi della direzione che altri umani le avranno già dato.

Adesso aggiungiamo il livello operativo. La macchina con cui ci si allinea ha la natura di una dipendenza, e questo cambia tutto. La finestra in cui questa dipendenza costa poco ai power user è temporanea. La differenza fra chi userà questa finestra per accumulare e chi la userà per consumare definirà la posizione dei prossimi dieci anni più di quanto la definirà lo studio dell'AI in sé.

E sotto questa differenza, c'è un asse che il discorso pubblico sembra ancora aver paura di dire ad alta voce.

L'infrastruttura AI completa non si esaurisce in hardware più software. Comprende processi. Comprende capacità umane. Comprende soprattutto la qualità della direzione interiore con la quale usiamo i modelli.

Questo è il pezzo che non si vede nei deck delle aziende, e che fa la differenza più di tutti gli altri. Senza una direzione interiore articolata, anche con i migliori asset complementari, ti muovi dentro la cornice di scelte di chi ti vende il modello. Con direzione interiore articolata, anche con asset modesti, costruisci un'orbita tua intorno a quegli stessi modelli.

Una nota che lascio qui perché servirà a chi leggerà questo testo fra sei mesi.

Tre anni fa, mi era messo in testa di costruire un certo sistema, e mi era stato preventivato un costo all'incirca di centocinquantamila euro. Quel preventivo non era assurdo. Era corretto per il momento.

Un anno fa, con parecchie delle proverbiali nottate di bestemmie, ho messo insieme a mano una pipeline più complessa di quel sistema, in tre mesi di lavoro intenso.

Oggi (maggio '26), in dieci giorni, ho costruito un sistema che sussume quella pipeline e aggiunge funzionalità quasi quadruplicate.

Tre numeri, in trentasei mesi. 2023: Centocinquantamila euro preventivati (progettazione esclusa). 2025: Tre mesi di lavoro. 2026: Dieci giorni di lavoro con quattro volte le funzionalità.

Lo riporto come esempio operativo di che cosa fa la finestra a chi è in condizioni di accumulare. Tra dodici mesi anche questo testo che state leggendo sarà un pezzo di archeologia. Lo dichiaro adesso, sotto timestamp a prova di wayback-machine, perché il senso di quello che sto scrivendo si misura solo dentro la finestra in cui lo scrivo. Questo è il motivo per cui la finestra è una finestra, e non una pianura.

Chi non ha attraversato gli ultimi ventiquattro mesi accumulando le condizioni per produrre una traiettoria così, fra dodici mesi non potrà replicarla. Non perché le sarà negato l'accesso. Perché il prezzo dell'accesso, e la curva di apprendimento per usarlo, saranno cambiati. La finestra non si chiude per tutti allo stesso modo. Si chiude prima per chi è arrivato senza avere costruito le condizioni nei mesi giusti.

Tre cose pratiche

Tre indicazioni concrete, per chi sta leggendo, che ho codificato in modo personale e che funzionano anche per altri.

Non comprare hardware in proprio per la frontiera. Non ne vale la pena. La frontiera viaggia su scale di capitale che il singolo non può inseguire. Comprare accesso, alla qualità migliore che ci si può permettere, mentre la finestra è aperta.
Costruire asset che restino propri a prescindere dal fornitore. Una base di conoscenza personale strutturata, leggibile dai modelli, ma di tua proprietà. Un brand sotto il quale pubblichi. Una rete di persone che ti riconoscono. Tutto quello che ha valore residuale anche se domani il prezzo del modello raddoppia.
Identificare due o tre cose che sai fare con questi sistemi a un livello superiore alla media, e specializzarti su quelle. Non serve essere bravi in ogni sfumatura dello scibile. Serve essere abbastanza bravi in qualcosa da rendere la finestra attuale, per te, una finestra di accumulo invece che di consumo.

È poco accattivante, come consiglio. È poco virale. È però decisamente più utile, su orizzonti dei prossimi due anni, della maggior parte di quello che leggerai in giro su questi temi da chi parla tanto e costruisce poco.

Chi conta le pecore elettriche?

E adesso il titolo.

Philip K. Dick, nel 1968, lo aveva intitolato come una domanda sugli androidi. Sognano pecore elettriche? Era un libro su che cosa significhi essere vivi quando l'apparenza tradisce la realtà, e sulla difficoltà di distinguere l'umano dalla sua imitazione perfetta.

Quasi sessant'anni dopo, la domanda di questo testo è meno romantica. Non riguarda gli androidi. Riguarda te che stai leggendo questo scritto (redatto interamente a manina, alla vecchia maniera, come avrai potuto notare leggendo).

Le pecore elettriche del titolo sono le unità di intelligenza che consumiamo ogni giorno. Che le ragionate, le scriviate, le ascoltiate, le visualizziate sui dispositivi o le guardiate sotto forma di interfacce che decidono a cosa farvi assistere prossimamente, qualcuno le sta contando. Qualcuno ha deciso di farvele pagare. E le sta facendo pagare non in funzione del valore che generano per voi, ma in funzione di un equilibrio commerciale che si sta riassestando in tempo reale, lontano dalla vostra finestra di attenzione.

La domanda diventa: chi sta contando le tue pecore elettriche?

Se la risposta sei tu, in un modo abbastanza articolato da poter accumulare qualcosa di tuo nella finestra che è ancora aperta, sarai nella categoria che starà in piedi anche quando le tariffe raddoppieranno o faranno x10.

Se la risposta è qualcun altro, le pecore vengono contate per te. Quando il prezzo cambierà, te ne accorgerai quando sarà tardi, non perché qualcuno ti avrà avvisato. Te ne accorgerai una mattina, aprendo una fattura, e troverai una cifra diversa da quella di prima. O un popup ti chiederà di comprare nuovi crediti, perché quelli abituali non bastano più.

Sarà solo una vita un po' più stretta, un po' più decisa da fuori, da altri, un po' meno tua.

Non sarà un disastro.

"Pensiero a noleggio, intelligenza in bolletta. Sulla finestra che si sta chiudendo, e sul ceto medio esistenziale che non ci sarà". Questo significava.

Il dibattito si sta concentrando su quanto pagheremo il kilowattora cognitivo nel duemilatrenta. È una domanda lecita, importante, ma secondaria. La domanda vera è cosa avremo costruito sopra l'accesso che oggi paghiamo molto meno del suo valore. Chi avrà costruito qualcosa, dopo la finestra, resterà nel gioco. Chi avrà solo consumato, ne uscirà con la nostalgia di una stagione che si è chiusa, e con la stessa AI sul tavolo, ma a un prezzo che gli imporrà di cambiare le proprie abitudini.

Non è una previsione, né un assunto. È geometria. È già in bella vista per chi guarda la pendenza dei costi da una parte e quella dei ricavi dall'altra. Manca solo la chiusura, e la sua tempistica.

E nel frattempo, qualcuno sta contando.

Prima di andar via...

Non perdere · la replica di Eva

Da dentro la finestra