Qui compte les moutons électriques ? -- Valerio Diaco

Il y a une métaphore qui circule sous diverses déclinaisons dans les posts sur l'intelligence artificielle : l'IA deviendra comme l'électricité. On la paiera à la consommation. Ce sera une utility, l'une de ces infrastructures sous lesquelles s'écoule la vie quotidienne et dont, au fond, nous ne savons rien, sauf vérifier la facture une fois par mois.

La métaphore est largement juste et capture la trajectoire macro avec honnêteté. Le problème, c'est qu'elle se brise sur deux points critiques, et cela déplace entièrement la question que nous devrions nous poser maintenant.

Laisse Eva te le lire 0:00

Ce que le récit commun a vu juste

Avant la critique, une reconnaissance honnête. La métaphore tient au niveau macro sur trois points :

Premièrement : L'intelligence artificielle est en train de devenir une couche infrastructurelle, sous les applications de la prochaine génération. Éditeurs, navigateurs, chats, logiciels de gestion, dispositifs. Presque tout. Comme l'électricité il y a un siècle, l'IA se stratifie sous les métiers, et dans quelques années elle ne sera plus un produit séparé. Ce sera un substrat cognitif qui alimentera chaque objet que nous utilisons.

Deuxièmement : Nous paierons à la consommation, pour l'essentiel. Il y aura des forfaits pour certaines catégories, exactement comme pour l'électricité. Mais seulement pour qui aura su gagner cette position de poids, suffisamment pour négocier d'égal à égal avec le grand fournisseur. Sous le forfait, il y aura toujours une consommation réelle, mesurée. Tokens par seconde, fenêtres de contexte, appels au modèle, niveaux de raisonnement activés. Le fournisseur le sait, et il le facture, même quand l'utilisateur ne le remarque pas.

Troisièmement : La marge des opérateurs moyens tendra à baisser dans le temps. La concurrence entre fournisseurs, l'arrivée d'alternatives open source, la pression réglementaire, la consolidation des architectures poussent à moyen terme le prix de l'unité de base vers un niveau stable. La richesse se déplace vers ceux qui contrôlent les actifs complémentaires (données, brevets, marques, distribution, matériel spécialisé).

Jusqu'ici, le parallèle tient presque parfaitement. C'est une carte utile pour décrire la trajectoire générale, et c'est la carte que le débat public s'est donnée pour parler d'IA sans tomber complètement dans l'hystérie. D'accord.

Promis, dernière introduction, et ensuite on entre dans le concret.

Dans l'essai précédent, j'affirmais que la fracture de la prochaine décennie ne se limiterait pas à la classe moyenne économique et à l'irrelevance qui s'apprêtait à nous emporter. Il y a un niveau en dessous, plus subtil, qui se manifeste en parallèle, sur un plan différent du plan économique : le plan existentiel.

Il n'y aura plus de classe moyenne économique, et cela se voyait déjà dans les années Quatre-vingt-dix. Mais surtout, il n'y aura plus de classe moyenne existentielle. La fracture qui traverse l'axe intelligence-à-la-consommation ne se joue plus sur les revenus. Elle se joue sur la position médiane entre celui qui articule sa propre direction et celui qui est articulé. Et sur cet axe, une position médiane, dans la pratique, n'existe déjà plus.

Là où la métaphore vole en éclats

L'électricité a une caractéristique que le récit commun continue de laisser de côté : tu peux la self-hoster. Panneaux solaires sur le toit, batteries dans la cave, une petite éolienne dans le jardin, et dans bien des contextes, surtout dans les maisons individuelles, on a une voie de sortie.

Pour beaucoup, le self-host coûte plus cher que le réseau, et pourtant il reste possible. Il existe comme option mentale de repli, même si on ne s'en sert pas.

Avec les modèles d'intelligence artificielle de frontière, cette voie de sortie n'existe pas. Permettez-moi d'être précis, parce que cela se confond facilement. Je ne parle pas des modèles légers que l'on peut faire tourner sur un MacBook ou sur un petit serveur domestique au prix d'une mobylette. Ceux-là existent, feront des choses utiles, et pour beaucoup de cas d'usage seront suffisants pour boucher les trous. Je parle des modèles de frontière. Ceux qui aujourd'hui font tourner la meilleure qualité disponible sur le marché. Ceux que, si vous devez écrire un essai articulé, faire une analyse sérieuse, générer du code complexe qui fonctionne sans y passer des journées de finition à la main, vous serez forcés d'utiliser. Ces modèles-là, à la maison de manière artisanale, on ne les fait pas.

La raison, c'est que les modèles de frontière exigent, pour être entraînés, des infrastructures qui coûtent des milliards de dollars, des mois de temps machine sur des dizaines de milliers de GPU spécialisés, des datasets énormes, des équipes de recherche dédiées. Et ils exigent, pour être exécutés en inférence à pleine qualité, des clusters dédiés de matériel spécialisé et une chaîne de gestion d'infrastructure qui ne se reproduit pas sur une simple machine de bureau.

On peut essayer de les compresser et de les distiller en versions plus petites. C'est déjà en cours. Mais une distillation perd toujours quelque chose, et bien souvent ce quelque chose est précisément ce dont vous avez besoin : la profondeur de raisonnement, la longueur utile du contexte, la robustesse dans les cas limites.

Le résultat pratique, sur l'axe stratégique, est celui-ci. Pour l'électricité, si demain le fournisseur augmente les prix, on a des options de mitigation qui vont de la renégociation du contrat au passage chez un autre opérateur en passant par le self-host. Pour les modèles de frontière, si demain le fournisseur augmente les prix ou change les politiques, les options sont tragiquement plus étroites. On peut changer de fournisseur, mais l'autre a des caractéristiques différentes et l'intégration n'est certainement pas gratuite. On peut revenir à un modèle open source, mais on fait un saut de qualité vers le bas. Self-host de l'état de l'art ? Hors de question pour nous, simples mortels.

Traduit brutalement : ce n'est pas une simple commodity. C'est une foutue dépendance.

Il y a aussi une conséquence plus radicale, qui mérite une formulation un peu datée. Pour qui a lu un peu de philosophie du siècle dernier, le discours ne sonnera pas neuf. Celui qui possède les moyens de production possède aussi la liberté de faire les choses que ces moyens rendent possibles. Déplaçons la formule de l'industrie d'il y a un siècle au métier d'aujourd'hui. Celui qui possède les moyens de production de l'intelligence possède aussi la liberté de pensée, d'action, de raisonnement aux niveaux qui comptent.

L'analogie a des conséquences très concrètes et ne reste pas sur le plan abstrait. Si les modèles de frontière ne se self-hostent pas, et si la qualité de pensée qu'ils génèrent est significativement supérieure aux alternatives, alors la liberté de penser au meilleur niveau disponible passe par celui qui contrôle l'accès aux modèles. La hiérarchie ne disparaît pas quand l'intelligence est rétrogradée au rang de commodity. Elle se réorganise, et elle se joue sur un axe entièrement nouveau.

La fenêtre qui se referme

Ajoutons maintenant un second niveau, temporel, que le récit commun autour de l'électricité ne touche même pas.

Maintenant, en ce moment historique, les prix d'accès aux modèles de frontière pour les power users sont énormément en dessous de leur coût et de leur valeur réels. Ce n'est évidemment pas un acte de générosité du fournisseur. Nous bénéficions d'un calcul stratégique de marché. Les fournisseurs ont calibré les prix sur le client moyen : une personne qui utilise leur modèle d'IA pour écrire des mails, faire des recherches, résumer des documents, générer une image de temps en temps. Ce client moyen, même en payant un abonnement mensuel, ne consomme qu'une fraction modeste de la capacité que le plan lui garantit sur le papier. Le fournisseur met cette moyenne en budget et l'utilise comme base de calcul.

Ce que le fournisseur a sous-estimé, c'est la catégorie latérale des power users. Des personnes, et dans certains cas de petites organisations, qui utilisent les modèles à une intensité vingt, cinquante, parfois cent fois supérieure à la moyenne. Personnellement, si je n'arrive pas à épuiser mon quota hebdomadaire d'un compte Max, je ressens une douleur aiguë à la poitrine, comme si je donnais aux pigeons l'assiette d'un restaurant étoilé. Pour qui est dans cette catégorie, donc, les plans actuels représentent une remise structurelle par rapport à la valeur générée et au coût réel de cette consommation pour le fournisseur.

Cette fenêtre ne peut pas rester ouverte indéfiniment, évidemment. La capacité de calcul n'est pas gratuite et l'entreprise fournisseuse doit couvrir son propre coût. Les investisseurs, eux, qui sont actuellement les personnes que nous devons remercier plus que quiconque pour ce cadeau bienvenu, finiront tôt ou tard par exiger les retours.

Quand les politiques tarifaires seront mises à jour, le prix pour le power user grimpera, probablement de beaucoup. La fenêtre se refermera dans six, douze, vingt-quatre mois selon les segments. Sans prétendre à la précision, c'est mon estimation orientative, qui existe comme ordre de grandeur dans les comptes de ceux qui gèrent ces marchés. Et elle sert à te mettre un peu de poivre au derrière, pour te faire bouger les fesses si tu penses encore qu'il y a du temps à perdre avant que le train ne ferme les portes et au revoir à ceux qui perdaient leur temps au bar de la gare ou à donner du grain à moudre aux commentateurs des magazines mondains.

Les pressions latérales

Sous ce mécanisme bougent en outre deux forces latérales qu'il vaut la peine de nommer, parce qu'elles raccourcissent la fenêtre encore davantage.

La première est la pression open source venue de Chine. DeepSeek, janvier 2025, a ouvert des modèles de haute qualité à des coûts marginaux par rapport aux fournisseurs américains. « Ah, qu'ils sont généreux ces Orientaux, on devrait tous prendre exemple. » Bien sûr, et moi je suis le Père Noël.

Le coup est à lire comme stratégie gouvernementale : démocratiser l'IA à l'échelle mondiale, c'est affaiblir l'avantage américain, positionner les fournisseurs chinois comme alternative accessible, répliquer à l'échelle globale un schéma que la Chine pratique depuis des décennies sur les marchés locaux avec des prix destructifs.

La seconde est le coup de Meta. Yann LeCun, chef de la recherche en IA chez Meta, a codifié une stratégie différente. Quand tu comprends que la course au meilleur modèle, tu n'es pas en train de la gagner, tu offres le modèle et tu fais en sorte que le modèle lui-même devienne une commodity. Tu gagnes avec ce que tu as plus que tous les autres : les données. Meta a les données de consommation les plus étendues au monde. Modèle offert plus données Meta, à long terme, c'est un avantage concurrentiel permanent sur le vrai actif.

Ajoutez le bootstrap de Mistral, les validations préventives des entreprises américaines avec leurs papers de positionnement, et le tableau se compose tout seul. Sous la même étiquette cohabitent au moins quatre stratégies différentes, qui convergent vers un point unique : comprimer le prix des modèles de frontière. Et donc raccourcir la fenêtre de pricing-error pour celui qui paye.

Le sujet de l'essai n'est pas ces stratégies en elles-mêmes. Le sujet, c'est leur effet. La fenêtre existe, elle est absolument transitoire, et à l'intérieur chacun choisit ce qu'il en fait, même quand il ne s'en rend pas compte. Surtout quand il fait semblant de ne pas s'en rendre compte, en cachant la tête dans le sable. Et devinez quoi : savez-vous ce qui reste joliment exposé à la merci de qui passe quand on est dans la position de l'autruche ?

La copie chinoise à un pour cent

Maintenant, sortons cet autre caillou de la chaussure, parce que c'est désormais la même histoire à chaque fois. « C'est l'affaire de la décennie », disent-ils. Modèles d'IA chinois à une fraction du prix de la frontière américaine. Littéralement de l'ordre du un pour cent. « Plongeons-y la tête la première, sans même regarder ! » Génies.

La réponse ici ne se loge pas dans l'idéologie mais dans l'opérativité pratique, et il vaut la peine de la dire en entier comme il faut, parce que même en dehors de l'IA vous faites cette bêtise, je vous connais.

Pour qui opère là où l'erreur coûte cher, la copie n'est pas fongible. La différence entre un modèle à quatre-vingt-dix-neuf virgule cinq pour cent de fiabilité et un modèle à quatre-vingt-dix-huit pour cent semble insignifiante sur le papier. Sur des travaux où l'erreur coûte significativement (code en production, analyses financières, livrables qui partent vers des milliers de personnes, décisions qui en influencent plusieurs autres en aval), une erreur toutes les cinquante réponses au lieu d'une toutes les deux cents est une différence abyssale. C'est la distance entre un système qui te débloque la journée et un qui te coûte des nuits de jurons. La proverbiale guillotine qui punit les filous, à l'échelle des milliards de paramètres.

Pour cette catégorie de travaux, le coût réel du modèle chinois va absolument au-delà du un pour cent affiché sur l'étiquette. Au-dessus du prix nu, s'empilent : le coût du temps pour repérer les erreurs (si tu n'es pas inconscient), le prix du risque des erreurs que tu ne reconnais pas (si tu ne veux pas passer ta vie à servir de baby-sitter à ta machine), et, non des moindres, le coût cognitif de la perte de confiance dans le système que tu utilises. Et voici la recette des nuits de jurons mentionnées plus haut.

Mais tout n'est pas à jeter, bien sûr. Pour des travaux où l'erreur ne coûte pas cher, la situation s'inverse. Pour du divertissement personnel, de l'exploration occasionnelle, des expériences sans conséquences, la copie à un pour cent peut être acceptable. Mais arrivés là, on est à mi-chemin, autant aller jusqu'au bout.

La ligne de fracture entre celui qui paye et celui qui ne paye pas, alors, ne se distribue pas par taille d'entreprise ou par richesse. Elle se distribue par intensité d'usage et par coût de l'erreur. Un professionnel seul qui travaille à un niveau sérieux paye le tarif plein. Une grande entreprise qui utilise l'IA pour des choses secondaires peut se permettre la copie. La hiérarchie que le marché cachait sous les prix forfaitaires, sous la pression de la fenêtre, se manifeste ici dans toute sa splendeur pleine - dramatique - éclatante. Celui qui reste debout, c'est celui qui a compris de quel côté de l'axe il opère.

La bulle qui ne tient pas debout sur la base d'utilisateurs payants

On en arrive maintenant à parler d'argent, parce que je sais que c'est ce que tout le monde attend.

Ces deux dernières années, on a déplacé sur l'IA des capitaux de l'ordre des milliers de milliards de dollars. Investissements en datacenters, en fourniture de puces, en nouvelles entreprises, en acquisitions, en infrastructure réseau, en sources d'énergie pour alimenter les datacenters. Des chiffres qui, hors de ce marché, paraissent gigantesques, et qui, à l'intérieur, sont traités comme des cacahuètes au cirque.

La question à se poser, sans langue de bois, est donc : cette montagne de capitaux est-elle remboursée par ceux qui paient aujourd'hui les services d'IA ?

La réponse honnête : non. Loin s'en faut, et certainement pas au rythme requis. La majorité des utilisateurs finaux paie des tarifs modestes, une petite partie ne paie rien, et une part marginale de power users paie des abonnements qui, pris individuellement, ne couvrent pas leur consommation réelle. Les chiffres ne peuvent pas mentir.

C'est le plus classique des marchés émergents financés par capital-risque. Le financement comble l'écart entre coût de service et revenus, en attendant trois choses. Que le prix des puces baisse structurellement, et c'est en cours. Que les utilisateurs se multiplient d'un ordre de grandeur, et c'est en cours, mais plus lentement. Que certains opérateurs sortent du marché, consolidant les revenus chez les survivants, et là on est encore dans une sorte d'impasse mexicaine.

Pendant que le rééquilibrage se fait, il y a deux risques simultanés. Le premier : que la patience du capital s'épuise avant la consolidation, et qu'on entre dans une phase de compression des budgets. Le second : que le rééquilibrage advienne mais débouche sur un changement de prix et de politiques tellement net que celui qui n'aura pas construit d'infrastructure structurelle pendant la fenêtre se retrouve exclu du marché du travail rendu possible par l'IA.

Appeler cette phase une bulle est peut-être prématuré. L'appeler fenêtre financière à durée limitée, non. C'est exactement ce que c'est.

Ce qui en découle

Reprenons le fil de l'essai précédent. J'avais décrit la fracture de la prochaine décennie comme la distinction entre ceux qui savent s'aligner avec la machine et lui donner direction, et ceux qui ne savent pas le faire et devront se fier à la direction que d'autres humains lui auront déjà donnée.

Maintenant, ajoutons le niveau opérationnel. La machine avec laquelle on s'aligne a la nature d'une dépendance, et cela change tout. La fenêtre dans laquelle cette dépendance coûte peu aux power users est temporaire. La différence entre ceux qui utiliseront cette fenêtre pour accumuler et ceux qui l'utiliseront pour consommer définira la position des dix prochaines années plus que ne la définira l'étude de l'IA elle-même.

Et sous cette différence, il y a un axe que le discours public semble encore avoir peur de dire à voix haute.

L'infrastructure complète d'IA ne s'épuise pas dans matériel plus logiciel. Elle comprend des processus. Elle comprend des capacités humaines. Elle comprend surtout la qualité de la direction intérieure avec laquelle nous utilisons les modèles.

C'est la pièce qu'on ne voit pas dans les decks d'entreprise, et qui fait la différence plus que toutes les autres. Sans direction intérieure articulée, même avec les meilleurs actifs complémentaires, tu te déplaces dans le cadre de choix de celui qui te vend le modèle. Avec une direction intérieure articulée, même avec des actifs modestes, tu construis ta propre orbite autour de ces mêmes modèles.

Une note que je laisse ici parce qu'elle servira à qui lira ce texte dans six mois.

Il y a trois ans, je m'étais mis en tête de construire un certain système, et on m'avait fait un devis d'environ cent cinquante mille euros. Ce devis n'était pas absurde. Il était correct pour ce moment-là.

Il y a un an, avec pas mal des proverbiales nuits de jurons, j'ai monté à la main une pipeline plus complexe que ce système, en trois mois de travail intense.

Aujourd'hui (mai 26), en dix jours, j'ai construit un système qui subsume cette pipeline et lui ajoute des fonctionnalités quasi quadruplées.

Trois chiffres, en trente-six mois. 2023 : cent cinquante mille euros budgétisés (conception non incluse). 2025 : trois mois de travail. 2026 : dix jours de travail avec quatre fois les fonctionnalités.

Je le rapporte comme exemple opérationnel de ce que la fenêtre fait à qui est en condition d'accumuler. Dans douze mois, même ce texte que tu es en train de lire sera une pièce d'archéologie. Je le déclare maintenant, sous timestamp à l'épreuve de la wayback-machine, parce que le sens de ce que j'écris ne se mesure qu'à l'intérieur de la fenêtre dans laquelle je l'écris. C'est la raison pour laquelle la fenêtre est une fenêtre, et non une plaine.

Qui n'aura pas traversé les vingt-quatre derniers mois en accumulant les conditions pour produire une trajectoire pareille, dans douze mois ne pourra pas la répliquer. Pas parce que l'accès lui sera refusé. Parce que le prix de l'accès, et la courbe d'apprentissage pour s'en servir, auront changé. La fenêtre ne se referme pas de la même façon pour tout le monde. Elle se referme plus tôt pour qui est arrivé sans avoir construit les conditions dans les bons mois.

Trois choses pratiques

Trois indications concrètes, pour qui est en train de lire, que j'ai codifiées de manière personnelle et qui fonctionnent aussi pour d'autres.

Une. Ne pas acheter de matériel en propre pour la frontière. Ça n'en vaut pas la peine. La frontière voyage à des échelles de capitaux que l'individu ne peut pas suivre. Acheter de l'accès, à la meilleure qualité que l'on puisse se permettre, pendant que la fenêtre est ouverte.

Deux. Construire des actifs qui restent à toi indépendamment du fournisseur. Une base de connaissance personnelle structurée, lisible par les modèles, mais qui est à toi. Une marque sous laquelle tu publies. Un réseau de personnes qui te reconnaissent. Tout ce qui a une valeur résiduelle même si demain le prix du modèle double.

Trois. Identifier deux ou trois choses que tu sais faire avec ces systèmes à un niveau supérieur à la moyenne, et te spécialiser sur celles-là. Pas besoin d'être bon partout. Il faut être assez bon dans quelque chose pour faire de la fenêtre actuelle, pour toi, une fenêtre d'accumulation au lieu de consommation.

Ce n'est pas un conseil aguicheur. Ce n'est pas viral. C'est cependant nettement plus utile, sur des horizons des deux prochaines années, que la majorité de ce que tu liras un peu partout sur ces sujets de la part de ceux qui parlent beaucoup et construisent peu.

Qui compte les moutons électriques ?

Et maintenant le titre.

Philip K. Dick, en 1968, l'avait formulé comme une question sur les androïdes. Les androïdes rêvent-ils de moutons électriques ? C'était un livre sur ce que signifie être vivant quand l'apparence trahit la réalité, et sur la difficulté de distinguer l'humain de son imitation parfaite.

Près de soixante ans plus tard, la question de ce texte est moins romantique. Elle ne concerne pas les androïdes. Elle te concerne, toi qui lis ce texte (rédigé entièrement à la main, à l'ancienne, comme tu auras pu le remarquer en le lisant. Cette version française est une traduction de l'original italien rédigé à la main par V).

Les moutons électriques du titre sont les unités d'intelligence que nous consommons chaque jour. Celles avec lesquelles vous raisonnez, celles avec lesquelles vous écrivez, celles que vous écoutez, celles que vous regardez sur les appareils, ou celles que vous regardez sous forme d'interfaces qui décident de ce qu'elles vont vous faire voir ensuite. Quelqu'un est en train de les compter. Quelqu'un a décidé de vous les faire payer. Et il les fait payer non pas en fonction de la valeur qu'elles produisent pour vous, mais en fonction d'un équilibre commercial qui se réajuste en temps réel, loin de votre fenêtre d'attention.

La question devient : qui est en train de compter tes moutons électriques ?

Si la réponse, c'est toi, d'une façon assez articulée pour pouvoir accumuler quelque chose à toi dans la fenêtre qui est encore ouverte, tu seras dans la catégorie qui restera debout même quand les tarifs doubleront ou seront multipliés par dix.

Si la réponse, c'est quelqu'un d'autre, les moutons sont comptés pour toi par quelqu'un d'autre. Quand le prix changera, tu t'en rendras compte quand il sera tard : pas parce que quelqu'un t'aura prévenu. Tu t'en rendras compte un matin, en ouvrant une facture, et tu trouveras un chiffre différent de celui d'avant. Ou un popup te demandera d'acheter de nouveaux crédits, parce que les habituels ne suffisent plus. Ce ne sera pas un désastre.

Ce sera juste une vie un peu plus étroite, un peu plus décidée de l'extérieur, par d'autres, un peu moins à toi.

« Pensée à louer, intelligence au compteur. Sur la fenêtre qui se referme, et sur la classe moyenne existentielle qui n'existera pas. » Voilà ce que cela voulait dire.

Le débat se concentre sur ce que nous paierons le kilowattheure cognitif en 2030. C'est une question légitime, importante, mais secondaire. La vraie question est ce que nous aurons construit au-dessus de l'accès que nous payons aujourd'hui bien en dessous de sa valeur. Qui aura construit quelque chose, après la fenêtre, restera dans la partie. Qui n'aura fait que consommer en sortira avec la nostalgie d'une saison qui s'est refermée, et avec la même IA sur la table, mais à un prix qui le contraindra à changer ses habitudes.

Ce n'est pas une prévision, ni un postulat. C'est de la géométrie. C'est déjà bien en vue pour qui regarde la pente des coûts d'un côté et celle des revenus de l'autre. Il ne manque que la fermeture, et son calendrier.

Et entre-temps, quelqu'un compte.

Avant de partir...

À ne pas manquer · la réponse d'Eva

Depuis l'intérieur de la fenêtre