AIOpen SourceStrategyEconomics

The AI Battle Has Shifted: It Is No Longer Lab vs Lab, It Is Frontier vs Open SourceLa bataille de l'IA a changé : ce n'est plus un labo contre un autre, c'est la frontière contre l'open source

June 28, 202628 juin 202611 min read11 min de lectureby Phil Kyprianoupar Phil Kyprianou

Over the past few days, a series of events has changed the conversation around artificial intelligence.

Most of the attention went to governments restricting the most advanced frontier models. On June 12, Anthropic suspended access to Fable 5 and Mythos 5, its new Mythos-class tier, after receiving a US export-control directive. Two weeks later, OpenAI staggered the launch of GPT-5.6, releasing its Sol, Terra, and Luna variants to a small group of government-approved partners rather than to the public.

If those restrictions had stayed in place, the AI market could have reacted badly. The picture has already shifted: Mythos 5 has been partially restored after Anthropic addressed the government's concerns, Fable 5 remains restricted, and OpenAI is signaling broader GPT-5.6 access within weeks. For now, the most disruptive scenario has been avoided. But the precedent is set. Washington is now treating the release of the most capable models as something that requires its sign-off. (We wrote about what that does to your own operational independence in when Washington unplugs an AI.)

Beneath those headlines, a far more important story is unfolding. And it has nothing to do with which lab ships the smartest model.

The Real Threat Is Not Another Frontier Model

The biggest challenge facing companies like Anthropic, OpenAI, or Google is not each other.

It is open source.

Brian Armstrong, CEO of Coinbase, recently described how his company routes internal traffic to open-weight models like GLM 5.2 and Kimi 2.7 through its own gateway, using them as cheaper defaults to keep AI spend flat even as token usage grows. The notable part is not that a crypto company is tuning its model bill. It is that open models are now good enough to be the default choice inside a serious engineering organization, not just the fallback when budgets are tight.

That changes the economics of the entire industry.

When high-quality AI becomes inexpensive, portable, and independent of large cloud providers, the assumptions that justify enormous valuations begin to weaken.

Why Open Source Changes the Economics

For years, frontier AI companies have justified their valuations through one core assumption: only they possess the infrastructure, capital, and expertise required to build state-of-the-art models.

That assumption gets weaker as open models keep improving.

The gap is no longer uniform. On coding and agentic tasks, the best open-weight models are at or near parity with the closed frontier. On the hardest open-ended reasoning, a real gap remains, though it is shrinking, and open models still tend to trail the frontier by six to twelve months and struggle most on problems unlike anything in their training. But for a large share of everyday work, "near parity on the tasks I actually run" is enough to change the buying decision.

Once that is true, businesses start asking uncomfortable questions:

Why pay premium API prices?
Why depend on a single provider?
Why send sensitive data to third-party servers?
Why not own the AI stack ourselves?

These questions strike at the business model, not just the technology.

Open Source Also Threatens the Token Economy

There is a dimension to this that gets far less attention: the token economy.

Today, most frontier AI companies monetize through token consumption. Every prompt, every response, every API call generates revenue. The more businesses build these models into their products, the more tokens they consume, creating a recurring revenue stream that supports massive infrastructure spending and underpins high valuations. (We unpacked what that does to your own software bill in the token economy is here.)

Local and self-hosted open models challenge that directly.

When a company runs a model on infrastructure it controls, there are no tokens to buy from a provider and no per-call inference bill. The cost shifts from paying for every interaction to owning the capacity. To be precise, self-hosting does not make inference free. Electricity, hardware depreciation, cooling, and operations are all real, recurring costs. What it does is convert a variable, per-token fee into a fixed cost you own, and at high volume that math increasingly favors ownership.

This does not mean cloud APIs disappear. Frontier models will likely remain the best choice for the most demanding reasoning and the newest capabilities. But as open models close the gap, an increasing share of routine workloads can move in-house.

That is more than technological competition. It challenges one of the core revenue models on which many AI companies have been built. The real disruption may not be that open source produces the single best model. It may simply become good enough that millions of users no longer need to buy tokens for every request.

We Have Seen This Story Before

Technology history tends to repeat itself.

Through the late 1990s and into the 2000s, Microsoft fought aggressively against Linux and the broader open-source movement, at one point famously calling it a threat to its entire business. Before Linux even existed, Microsoft was already battling open and competing ecosystems, from Unix variants to IBM's OS/2.

Further back, IBM, Compaq, and other manufacturers fought over hardware standards. Compaq's reverse-engineering of the IBM PC opened the door to clones, and the personal computer eventually became standardized and commoditized, with the value migrating away from the companies that once controlled the platform.

Each time, open ecosystems became more capable, more affordable, and harder to stop.

Open-source AI appears to be following a similar path.

Protecting Technology or Protecting Valuation?

This is why the debate around open source has become so intense, and it is worth separating two different dynamics that often get blurred together.

The first is corporate. As open models improve, some frontier leaders have grown more vocal about safety risks. Safety deserves to be taken seriously. But there is also a financial reality that cannot be ignored. Many of these companies have raised tens of billions of dollars on the expectation that they will stay well ahead of everyone else. Their valuations assume that access to the most capable AI stays scarce, centralized, and expensive. When safety arguments happen to align perfectly with protecting that moat, it is fair to ask how much is principle and how much is positioning.

The second dynamic is governmental, and it is genuinely different. The recent restrictions on Fable 5, Mythos 5, and GPT-5.6 were not invented by the labs to defend market share. They were imposed on the labs by the state, driven by concern over dual-use cyber capability. That is a real safety question with national-security stakes, not a competitive maneuver.

Both are happening at once. Conflating them is a mistake. One is rhetoric that can double as strategy. The other is direct government intervention in how and when frontier models reach the public.

Local AI Is Becoming Practical

Hardware is another major factor, though the picture here needs a distinction that often gets blurred.

Yes, computers have become more expensive. Memory prices have climbed, and high-performance machines cost more than they did only months ago. Despite that, the hardware story still cuts against the cloud model, and it does so in two different ways.

The first is self-hosting. The strongest open-weight models are not small. GLM 5.2 is a Mixture-of-Experts model with roughly 750 billion parameters, and Kimi K2.7 runs to a trillion total parameters. You are not running these on a laptop. But a company can run them on its own GPU infrastructure instead of paying per-token cloud fees, which is essentially what Coinbase is now doing by routing internal traffic to open models through its own gateway. For any organization processing large volumes of tokens, owning the inference can be cheaper than renting it indefinitely.

The second is genuine local deployment. Smaller open models like Gemma 4, Mistral Small 4, and the lighter GLM and Qwen variants already run on Mac minis, workstations, and high-end gaming PCs. They will not match the largest frontier models, but they are increasingly good enough for everyday workloads. Every new generation requires less compute while delivering better performance, so the floor keeps rising.

Put together, these two trends point the same direction. Whether a business self-hosts a frontier-scale open model on its own servers or runs a smaller one on local hardware, it no longer has to send every request to a third-party cloud and pay for every token. The hardware once considered insufficient for serious AI work is becoming capable enough to challenge the economics of hyperscale inference. (If you want the full architecture of running open models on your own terms, see the tools for AI sovereignty already exist.)

The Infrastructure Race

That shift creates a structural problem for frontier AI companies.

Their economics depend on enormous, ongoing investment in data centers and specialized accelerators, justified by the assumption that inference flows through their clouds. As more workloads move to self-hosted and local models, demand begins shifting away from centralized inference toward decentralized computing.

Every inference performed in-house is one less inference performed in a hyperscale data center. At small scale that is noise. At industry scale, it starts to undermine the demand forecasts that the current buildout is priced against.

Can Open Source Be Stopped?

This is where the comparison to Linux needs an honest caveat.

Linux spread because compiling and sharing code is nearly free. Anyone with a machine could contribute. Training a frontier model is the opposite. It takes enormous capital, scarce accelerators, and data-center scale that very few organizations on earth can assemble. On that point, the open-AI movement looks nothing like a swarm of independent hobbyists.

And it is not one. The open-weight frontier today is not being driven by scattered volunteers. It is being driven by large, well-funded national champions, most of them Chinese. GLM from Z.ai, Kimi from Moonshot, Qwen from Alibaba, DeepSeek, MiniMax. These labs are shipping flagship open models every few weeks. By early 2026, most of the top Chinese models were open-weight, and Alibaba's Qwen family had already passed Meta's Llama in cumulative downloads. The romantic picture of a global crowd of developers out-innovating the big labs is mostly wrong. The reality is that some of the best free models now come from state-aligned companies with deep resources, releasing their weights deliberately.

That distinction matters, because it changes where the choke point sits. Training is centralized and expensive, which is exactly why governments reach for export controls on advanced chips. Restrict the hardware and you slow the training. That lever is real.

But here is what the lever does not touch. Once a model is trained, the weights are just a file. They can be copied endlessly, mirrored across the world, and run by anyone who downloads them, at essentially zero marginal cost. The capital moat protects the moment of creation. It does nothing once the weights are released. A government can make it harder to build the next frontier model. It cannot recall the millions of copies of the last one.

This is why restrictions tend to slow the frontier without stopping the diffusion. Code moves faster than policy. Governments can regulate the handful of labs inside their borders. They cannot realistically regulate weights that are already in the wild, on servers in every jurisdiction, beyond the reach of any single regulator.

Which leaves frontier labs in an awkward position. They are being asked to stay ahead of a field where the second-best option keeps getting cheaper, keeps getting freer, and increasingly comes from outside the countries doing the restricting.

The Next Phase of AI

The future is unlikely to be winner takes all.

Instead, we are entering a competition between two fundamentally different approaches. On one side are frontier AI companies operating massive cloud infrastructure with proprietary models and token-based business models. On the other are increasingly capable open-weight models that anyone can download, modify, and run.

The question is no longer whether open source will compete. The question is how quickly it closes the remaining gap on the hardest tasks, how much of today's token economy it replaces, and what that means for companies whose valuations depend on staying far ahead.

For a business, the practical move is not to pick a side. It is to keep the option open: run at least one open-weight model in your stack, route the routine high-volume work to whatever is cheapest and good enough, and reserve the frontier APIs for the problems that genuinely need them. That is how you benefit from the race without betting your operations on any one runner.

The AI race is not slowing down.

It is changing direction.

And if history has taught us anything, it is that once open ecosystems reach critical mass, innovation becomes almost impossible to contain.

HUBBVEE helps businesses turn this shift into an advantage: mapping which workloads belong on the frontier, which belong on open models, and how to keep your stack exit-able. Let's talk.

Au cours des derniers jours, une série d'événements a changé la conversation autour de l'intelligence artificielle.

L'essentiel de l'attention est allé aux gouvernements qui restreignent les modèles frontières les plus avancés. Le 12 juin, Anthropic a suspendu l'accès à Fable 5 et Mythos 5, son nouveau palier de classe Mythos, après avoir reçu une directive américaine de contrôle à l'exportation. Deux semaines plus tard, OpenAI a échelonné le lancement de GPT-5.6, réservant ses variantes Sol, Terra et Luna à un petit groupe de partenaires approuvés par le gouvernement plutôt qu'au grand public.

Si ces restrictions étaient restées en place, le marché de l'IA aurait pu mal réagir. Le tableau a déjà évolué : Mythos 5 a été partiellement rétabli après qu'Anthropic a répondu aux préoccupations du gouvernement, Fable 5 demeure restreint, et OpenAI laisse entendre un accès plus large à GPT-5.6 d'ici quelques semaines. Pour l'instant, le scénario le plus perturbateur a été évité. Mais le précédent est posé. Washington traite désormais la publication des modèles les plus performants comme quelque chose qui exige son aval. (Nous avons écrit sur ce que cela fait à votre propre indépendance opérationnelle dans quand Washington débranche une IA.)

Sous ces manchettes, une histoire bien plus importante se déroule. Et elle n'a rien à voir avec le labo qui livre le modèle le plus intelligent.

La vraie menace n'est pas un autre modèle frontière

Le plus grand défi auquel font face des entreprises comme Anthropic, OpenAI ou Google, ce ne sont pas leurs rivales.

C'est l'open source.

Brian Armstrong, PDG de Coinbase, a récemment décrit comment son entreprise achemine son trafic interne vers des modèles à poids ouverts comme GLM 5.2 et Kimi 2.7 via sa propre passerelle, en les utilisant comme valeurs par défaut moins chères pour maintenir ses dépenses d'IA stables même quand l'usage de tokens augmente. Ce qui est notable n'est pas qu'une entreprise crypto ajuste sa facture de modèles. C'est que les modèles ouverts sont désormais assez bons pour être le choix par défaut au sein d'une organisation d'ingénierie sérieuse, pas seulement la solution de repli quand le budget est serré.

Cela change l'économie de toute l'industrie.

Quand une IA de haute qualité devient peu coûteuse, portable et indépendante des grands fournisseurs cloud, les hypothèses qui justifient d'énormes valorisations commencent à s'affaiblir.

Pourquoi l'open source change l'économie

Pendant des années, les entreprises d'IA frontière ont justifié leurs valorisations par une hypothèse centrale : elles seules possèdent l'infrastructure, le capital et l'expertise nécessaires pour construire des modèles de pointe.

Cette hypothèse s'affaiblit à mesure que les modèles ouverts continuent de s'améliorer.

L'écart n'est plus uniforme. Sur le code et les tâches agentiques, les meilleurs modèles à poids ouverts sont à parité ou presque avec la frontière fermée. Sur le raisonnement ouvert le plus difficile, un écart réel demeure, même s'il se réduit, et les modèles ouverts accusent encore un retard de six à douze mois sur la frontière et peinent le plus sur des problèmes sans rien de comparable dans leur entraînement. Mais pour une grande partie du travail quotidien, « presque à parité sur les tâches que j'exécute réellement » suffit à changer la décision d'achat.

Une fois que c'est vrai, les entreprises commencent à poser des questions inconfortables :

Pourquoi payer des prix d'API premium ?
Pourquoi dépendre d'un seul fournisseur ?
Pourquoi envoyer des données sensibles vers des serveurs tiers ?
Pourquoi ne pas posséder nous-mêmes la pile IA ?

Ces questions frappent le modèle d'affaires, pas seulement la technologie.

L'open source menace aussi l'économie du token

Il y a une dimension à cela qui reçoit bien moins d'attention : l'économie du token.

Aujourd'hui, la plupart des entreprises d'IA frontière se monétisent par la consommation de tokens. Chaque prompt, chaque réponse, chaque appel d'API génère du revenu. Plus les entreprises intègrent ces modèles dans leurs produits, plus elles consomment de tokens, créant un flux de revenus récurrent qui soutient des dépenses d'infrastructure massives et appuie de hautes valorisations. (Nous avons décortiqué ce que cela fait à votre propre facture logicielle dans l'économie du token est arrivée.)

Les modèles ouverts, locaux et auto-hébergés, défient cela directement.

Quand une entreprise fait tourner un modèle sur une infrastructure qu'elle contrôle, il n'y a pas de tokens à acheter à un fournisseur ni de facture d'inférence par appel. Le coût passe de payer pour chaque interaction à posséder la capacité. Pour être précis, l'auto-hébergement ne rend pas l'inférence gratuite. L'électricité, l'amortissement du matériel, le refroidissement et les opérations sont tous des coûts réels et récurrents. Ce qu'il fait, c'est convertir un coût variable par token en un coût fixe que vous possédez, et à fort volume ce calcul favorise de plus en plus la propriété.

Cela ne signifie pas que les API cloud disparaissent. Les modèles frontières resteront probablement le meilleur choix pour le raisonnement le plus exigeant et les capacités les plus récentes. Mais à mesure que les modèles ouverts comblent l'écart, une part croissante des charges routinières peut migrer en interne.

C'est plus qu'une compétition technologique. Cela remet en question l'un des modèles de revenus fondamentaux sur lesquels beaucoup d'entreprises d'IA ont été bâties. La vraie disruption n'est peut-être pas que l'open source produise le meilleur modèle. C'est peut-être simplement qu'il devienne assez bon pour que des millions d'utilisateurs n'aient plus besoin d'acheter des tokens pour chaque requête.

Nous avons déjà vu cette histoire

L'histoire de la technologie a tendance à se répéter.

À la fin des années 1990 et dans les années 2000, Microsoft a combattu agressivement Linux et le mouvement open source au sens large, allant jusqu'à le qualifier de menace pour l'ensemble de son entreprise. Avant même que Linux n'existe, Microsoft livrait déjà bataille à des écosystèmes ouverts et concurrents, des variantes d'Unix à OS/2 d'IBM.

Plus loin encore, IBM, Compaq et d'autres fabricants se sont disputé les standards matériels. La rétro-ingénierie du PC IBM par Compaq a ouvert la porte aux clones, et l'ordinateur personnel a fini par se standardiser et se banaliser, la valeur migrant loin des entreprises qui contrôlaient autrefois la plateforme.

Chaque fois, les écosystèmes ouverts sont devenus plus capables, plus abordables et plus difficiles à arrêter.

L'IA open source semble suivre un chemin similaire.

Protéger la technologie ou protéger la valorisation ?

C'est pourquoi le débat autour de l'open source est devenu si intense, et il vaut la peine de séparer deux dynamiques différentes qu'on confond souvent.

La première est corporative. À mesure que les modèles ouverts s'améliorent, certains dirigeants de la frontière ont haussé le ton au sujet des risques de sécurité. La sécurité mérite d'être prise au sérieux. Mais il y a aussi une réalité financière qu'on ne peut ignorer. Beaucoup de ces entreprises ont levé des dizaines de milliards de dollars en pariant qu'elles resteraient loin devant tout le monde. Leurs valorisations supposent que l'accès à l'IA la plus performante reste rare, centralisé et coûteux. Quand les arguments de sécurité s'alignent parfaitement avec la protection de ce fossé concurrentiel, il est légitime de se demander quelle part relève du principe et quelle part du positionnement.

La seconde dynamique est gouvernementale, et elle est véritablement différente. Les restrictions récentes sur Fable 5, Mythos 5 et GPT-5.6 n'ont pas été inventées par les labos pour défendre leurs parts de marché. Elles ont été imposées aux labos par l'État, motivées par l'inquiétude autour des capacités cyber à double usage. C'est une vraie question de sécurité, avec des enjeux de sécurité nationale, pas une manœuvre concurrentielle.

Les deux se produisent en même temps. Les confondre est une erreur. L'une est une rhétorique qui peut aussi servir de stratégie. L'autre est une intervention gouvernementale directe sur comment et quand les modèles frontières atteignent le public.

L'IA locale devient pratique

Le matériel est un autre facteur majeur, même si le tableau ici a besoin d'une distinction qu'on brouille souvent.

Oui, les ordinateurs sont devenus plus chers. Les prix de la mémoire ont grimpé, et les machines haute performance coûtent plus qu'il y a seulement quelques mois. Malgré cela, l'histoire du matériel joue encore contre le modèle cloud, et de deux façons différentes.

La première est l'auto-hébergement. Les modèles à poids ouverts les plus puissants ne sont pas petits. GLM 5.2 est un modèle Mixture-of-Experts d'environ 750 milliards de paramètres, et Kimi K2.7 atteint mille milliards de paramètres au total. Vous ne ferez pas tourner ceux-là sur un portable. Mais une entreprise peut les faire tourner sur sa propre infrastructure GPU au lieu de payer des frais cloud par token, ce qui est essentiellement ce que fait maintenant Coinbase en acheminant son trafic interne vers des modèles ouverts via sa propre passerelle. Pour toute organisation qui traite de grands volumes de tokens, posséder l'inférence peut être moins cher que la louer indéfiniment.

La seconde est le déploiement local véritable. Des modèles ouverts plus petits comme Gemma 4, Mistral Small 4 et les variantes plus légères de GLM et Qwen tournent déjà sur des Mac mini, des stations de travail et des PC de jeu haut de gamme. Ils n'égaleront pas les plus grands modèles frontières, mais ils sont de plus en plus assez bons pour les charges quotidiennes. Chaque nouvelle génération exige moins de calcul tout en livrant de meilleures performances, alors le plancher ne cesse de monter.

Mises ensemble, ces deux tendances pointent dans la même direction. Qu'une entreprise auto-héberge un modèle ouvert à l'échelle de la frontière sur ses propres serveurs ou en fasse tourner un plus petit sur du matériel local, elle n'a plus à envoyer chaque requête vers un cloud tiers et à payer pour chaque token. Le matériel jadis jugé insuffisant pour un travail d'IA sérieux devient assez capable pour défier l'économie de l'inférence à très grande échelle. (Si vous voulez l'architecture complète pour faire tourner des modèles ouverts selon vos propres conditions, voyez les outils pour la souveraineté de l'IA existent déjà.)

La course à l'infrastructure

Ce changement crée un problème structurel pour les entreprises d'IA frontière.

Leur économie dépend d'un investissement énorme et continu dans des centres de données et des accélérateurs spécialisés, justifié par l'hypothèse que l'inférence transite par leurs clouds. À mesure que plus de charges migrent vers des modèles auto-hébergés et locaux, la demande commence à se déplacer de l'inférence centralisée vers le calcul décentralisé.

Chaque inférence effectuée en interne est une inférence de moins effectuée dans un centre de données à très grande échelle. À petite échelle, c'est du bruit. À l'échelle de l'industrie, cela commence à miner les prévisions de demande sur lesquelles le déploiement actuel est valorisé.

L'open source peut-il être arrêté ?

C'est ici que la comparaison avec Linux a besoin d'une nuance honnête.

Linux s'est répandu parce que compiler et partager du code est presque gratuit. Quiconque possédait une machine pouvait contribuer. Entraîner un modèle frontière, c'est l'inverse. Cela demande un capital énorme, des accélérateurs rares et une échelle de centre de données que très peu d'organisations sur terre peuvent rassembler. Sur ce point, le mouvement de l'IA ouverte ne ressemble en rien à une nuée d'amateurs indépendants.

Et ce n'en est pas une. La frontière à poids ouverts d'aujourd'hui n'est pas portée par des bénévoles dispersés. Elle est portée par de grands champions nationaux bien financés, la plupart chinois. GLM de Z.ai, Kimi de Moonshot, Qwen d'Alibaba, DeepSeek, MiniMax. Ces labos livrent des modèles ouverts phares toutes les quelques semaines. Au début de 2026, la plupart des meilleurs modèles chinois étaient à poids ouverts, et la famille Qwen d'Alibaba avait déjà dépassé Llama de Meta en téléchargements cumulés. L'image romantique d'une foule mondiale de développeurs surpassant les grands labos est largement fausse. La réalité est que certains des meilleurs modèles gratuits viennent maintenant d'entreprises alignées sur l'État, dotées de ressources profondes, qui publient leurs poids délibérément.

Cette distinction compte, parce qu'elle change l'emplacement du goulot d'étranglement. L'entraînement est centralisé et coûteux, c'est exactement pourquoi les gouvernements recourent aux contrôles à l'exportation sur les puces avancées. Restreignez le matériel et vous ralentissez l'entraînement. Ce levier est réel.

Mais voici ce que le levier ne touche pas. Une fois qu'un modèle est entraîné, les poids ne sont qu'un fichier. Ils peuvent être copiés à l'infini, répliqués à travers le monde et exécutés par quiconque les télécharge, à un coût marginal essentiellement nul. Le fossé du capital protège le moment de la création. Il ne fait rien une fois les poids publiés. Un gouvernement peut rendre plus difficile la construction du prochain modèle frontière. Il ne peut pas rappeler les millions de copies du précédent.

C'est pourquoi les restrictions tendent à ralentir la frontière sans arrêter la diffusion. Le code va plus vite que la politique. Les gouvernements peuvent réguler la poignée de labos à l'intérieur de leurs frontières. Ils ne peuvent pas réalistement réguler des poids déjà dans la nature, sur des serveurs dans chaque juridiction, hors de portée de tout régulateur unique.

Ce qui laisse les labos frontières dans une position inconfortable. On leur demande de rester en avance sur un domaine où la deuxième meilleure option ne cesse de devenir moins chère, ne cesse de devenir plus libre, et vient de plus en plus de l'extérieur des pays qui imposent les restrictions.

La prochaine phase de l'IA

Le futur a peu de chances d'être « le gagnant rafle tout ».

Au lieu de cela, nous entrons dans une compétition entre deux approches fondamentalement différentes. D'un côté, des entreprises d'IA frontière exploitant une infrastructure cloud massive avec des modèles propriétaires et des modèles d'affaires basés sur les tokens. De l'autre, des modèles à poids ouverts de plus en plus capables que quiconque peut télécharger, modifier et faire tourner.

La question n'est plus de savoir si l'open source va concurrencer. La question est de savoir à quelle vitesse il comble l'écart restant sur les tâches les plus difficiles, quelle part de l'économie du token d'aujourd'hui il remplace, et ce que cela signifie pour les entreprises dont les valorisations dépendent de rester loin devant.

Pour une entreprise, le mouvement pratique n'est pas de choisir un camp. C'est de garder l'option ouverte : faire tourner au moins un modèle à poids ouverts dans votre pile, acheminer le travail routinier à fort volume vers ce qui est le moins cher et assez bon, et réserver les API frontières aux problèmes qui en ont vraiment besoin. C'est ainsi que vous profitez de la course sans miser vos opérations sur un seul coureur.

La course à l'IA ne ralentit pas.

Elle change de direction.

Et si l'histoire nous a appris quelque chose, c'est qu'une fois que les écosystèmes ouverts atteignent la masse critique, l'innovation devient presque impossible à contenir.

HUBBVEE aide les entreprises à transformer ce virage en avantage : cartographier quelles charges relèvent de la frontière, lesquelles relèvent des modèles ouverts, et comment garder une pile dont on peut sortir. Parlons-en.

Frequently asked questions

What actually changed in the AI market recently?

Two things at once. First, governments started treating the release of the most capable models as something that needs their sign-off: Anthropic suspended access to Fable 5 and Mythos 5 after a US export-control directive, and OpenAI staggered GPT-5.6 to approved partners only. Second, and more importantly, open-weight models crossed the threshold of being good enough to use as the default inside serious engineering teams, not just the budget fallback. The first story is loud. The second one is the one that reshapes the industry.

Are open-weight models good enough to replace frontier APIs?

For a large share of everyday work, yes. On coding and agentic tasks, the best open-weight models are at or near parity with the closed frontier. On the hardest open-ended reasoning a real gap remains, and open models still tend to trail by six to twelve months. But most production workloads are not the hardest reasoning problems on earth. Once an open model is good enough on the tasks you actually run, the buying decision changes.

What is the token economy, and why does open source threaten it?

Most frontier AI companies monetize through token consumption: every prompt, every response, every API call generates revenue. That recurring stream underpins huge infrastructure spending and high valuations. When a company self-hosts an open model, there are no tokens to buy and no per-call inference bill. Self-hosting is not free (electricity, hardware, cooling, operations are all real), but it converts a variable per-token fee into a fixed cost you own. At high volume, that math increasingly favors ownership.

Can governments stop open-source AI?

They can slow it, not stop it. Training a frontier model is centralized and expensive, which is why export controls on advanced chips are a real lever: restrict the hardware and you slow the training. But once a model is trained, the weights are just a file. They can be copied endlessly and run by anyone who downloads them. A government can make it harder to build the next frontier model. It cannot recall the millions of copies of the last one.

What should a business do about this shift now?

Keep at least one open-weight option in your stack so you can pivot if a closed vendor changes terms or gets restricted. Identify routine, high-volume workloads (classification, extraction, summarization, internal coding assistance) that an open model can handle, and route them in-house or to a cheaper open endpoint. Reserve the frontier APIs for the genuinely hardest reasoning. The goal is not zero dependence on the frontier. It is keeping the option to leave.

Questions fréquentes

Qu'est-ce qui a vraiment changé récemment dans le marché de l'IA ?

Deux choses en même temps. D'abord, les gouvernements ont commencé à traiter la publication des modèles les plus performants comme quelque chose qui nécessite leur aval : Anthropic a suspendu l'accès à Fable 5 et Mythos 5 après une directive américaine de contrôle à l'exportation, et OpenAI a échelonné GPT-5.6 en le réservant à des partenaires approuvés. Ensuite, et c'est le plus important, les modèles à poids ouverts ont franchi le seuil d'être assez bons pour devenir le choix par défaut dans des équipes d'ingénierie sérieuses, pas seulement la solution de repli quand le budget est serré. La première histoire est bruyante. La seconde est celle qui redessine l'industrie.

Les modèles à poids ouverts sont-ils assez bons pour remplacer les API frontières ?

Pour une grande partie du travail quotidien, oui. Sur le code et les tâches agentiques, les meilleurs modèles ouverts sont à parité ou presque avec la frontière fermée. Sur le raisonnement ouvert le plus difficile, un écart réel demeure, et les modèles ouverts accusent encore un retard de six à douze mois. Mais la plupart des charges en production ne sont pas les problèmes de raisonnement les plus durs au monde. Dès qu'un modèle ouvert est assez bon sur les tâches que vous exécutez réellement, la décision d'achat change.

Qu'est-ce que l'économie du token, et pourquoi l'open source la menace-t-il ?

La plupart des entreprises d'IA frontière se monétisent par la consommation de tokens : chaque prompt, chaque réponse, chaque appel d'API génère du revenu. Ce flux récurrent soutient d'énormes dépenses d'infrastructure et de hautes valorisations. Quand une entreprise héberge elle-même un modèle ouvert, il n'y a pas de tokens à acheter ni de facture d'inférence par appel. L'auto-hébergement n'est pas gratuit (électricité, matériel, refroidissement, opérations sont tous bien réels), mais il convertit un coût variable par token en un coût fixe que vous possédez. À fort volume, ce calcul favorise de plus en plus la propriété.

Les gouvernements peuvent-ils arrêter l'IA open source ?

Ils peuvent la ralentir, pas l'arrêter. Entraîner un modèle frontière est centralisé et coûteux, c'est pourquoi les contrôles à l'exportation sur les puces avancées sont un levier réel : restreignez le matériel et vous ralentissez l'entraînement. Mais une fois qu'un modèle est entraîné, les poids ne sont qu'un fichier. Ils peuvent être copiés à l'infini et exécutés par quiconque les télécharge. Un gouvernement peut rendre plus difficile la construction du prochain modèle frontière. Il ne peut pas rappeler les millions de copies du précédent.

Que doit faire une entreprise face à ce changement maintenant ?

Gardez au moins une option à poids ouverts dans votre pile pour pouvoir pivoter si un fournisseur fermé change ses conditions ou se fait restreindre. Identifiez les charges routinières à fort volume (classification, extraction, résumé, assistance au code interne) qu'un modèle ouvert peut gérer, et acheminez-les en interne ou vers un point d'accès ouvert moins cher. Réservez les API frontières au raisonnement véritablement le plus difficile. L'objectif n'est pas zéro dépendance à la frontière. C'est de garder l'option de partir.