« Data is the new oil » — l’expression, popularisée par le mathématicien Clive Humby en 2006, est devenue un slogan incontournable de l’économie numérique. Comme le pétrole au XXe siècle, les données sont aujourd’hui une ressource stratégique, convoitée, source de pouvoir et de richesses. Mais la métaphore est-elle vraiment juste ? Quels sont les parallèles entre l’économie du pétrole et l’économie des données ? Et quelles sont les limites de cette comparaison ? Cet article explore en profondeur ce lieu commun devenu réalité, ses implications économiques, géopolitiques et environnementales, et les défis d’une gouvernance juste des données.
L’expression « Data is the new oil » est attribuée à Clive Humby, mathématicien britannique et architecte du programme de fidélité Tesco (Clubcard), qui l’aurait prononcée en 2006. Sa formule complète est : « Data is the new oil. It’s valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc. » (Les données sont le nouveau pétrole. Elles ont de la valeur, mais non raffinées, elles ne peuvent pas vraiment être utilisées. Elles doivent être transformées en gaz, plastique, produits chimiques, etc.).
La métaphore a été reprise et popularisée par les géants du numérique (Google, Facebook, Amazon) pour souligner l’importance stratégique des données dans l’économie moderne. En 2026, elle est devenue un lieu commun, mais aussi un outil d’analyse critique : comme le pétrole, les données sont une ressource dont l’extraction massive pose des questions de propriété, d’inégalités, de souveraineté et d’impact environnemental.
Selon IDC, la « data economy » (économie des données) représentait 4,5 % du PIB mondial en 2025, soit environ 4 800 milliards de dollars. Une part comparable à celle de l’industrie pétrolière (5-6 % du PIB mondial).

Infographie n°1 – La métaphore « Data is the new oil » : extraction, raffinage, valorisation, déchets.
La comparaison entre données et pétrole repose sur plusieurs similitudes frappantes, qui éclairent les enjeux de l’économie numérique.
Comme le pétrole au XXe siècle, les données sont devenues une ressource stratégique pour les États et les entreprises. Celui qui contrôle les données contrôle l’intelligence économique, la capacité d’innovation (IA, recherche), et une partie de la souveraineté nationale. Les guerres commerciales (États-Unis/Chine, Europe/États-Unis) ont désormais une dimension « data ». La course aux données massives (big data) est comparable à la course aux gisements pétroliers du début du XXe siècle.
L’extraction de pétrole nécessite des infrastructures lourdes (forages, pipelines, raffineries). L’extraction de données nécessite également des infrastructures massives : data centers (consommation énergétique colossale), réseaux de fibre optique, capteurs IoT, et surtout des plateformes numériques (réseaux sociaux, moteurs de recherche, places de marché) qui collectent en continu les données des utilisateurs.
Le pétrole brut n’est pas utilisable en l’état : il doit être raffiné en carburants, plastiques, lubrifiants. De même, les données brutes (logs, clics, images) n’ont pas de valeur intrinsèque. Elles doivent être nettoyées, structurées, recoupées, analysées (data mining, machine learning) pour produire des « insights » exploitables (prédictions, profils, recommandations). Le « raffinage des données » est un secteur en plein essor (data engineering, data science).
Le marché pétrolier a été dominé par quelques grandes compagnies (les « Seven Sisters »). Le marché des données est dominé par quelques géants (GAFAM : Google, Apple, Facebook (Meta), Amazon, Microsoft ; et les chinois BATX : Baidu, Alibaba, Tencent, Xiaomi). Ces entreprises possèdent des quantités de données massives (effet « data network effect » : plus de données → meilleurs algorithmes → plus d’utilisateurs → encore plus de données) qui créent des barrières à l’entrée quasi infranchissables.
Comprendre l’économie des données, c’est comprendre comment les données brutes sont transformées en valeur économique.
Les données sont extraites de multiples sources : navigation web (cookies, pixels espions), réseaux sociaux (posts, likes, partages), transactions commerciales (historique d’achat), objets connectés (montres, assistants vocaux, voitures), capteurs urbains, etc. L’utilisateur « paie » souvent avec ses données plutôt qu’avec de l’argent (modèle économique des plateformes « gratuites »).
Les données extraites sont stockées dans des data centers (centres de données) géants. En 2026, il existe environ 8 000 data centers dans le monde, consommant environ 2 % de l’électricité mondiale (l’équivalent de la consommation d’un pays comme le Japon). Les leaders sont : AWS (Amazon), Azure (Microsoft), Google Cloud, Alibaba Cloud.
Les données brutes sont nettoyées, recoupées, et analysées par des algorithmes (machine learning, IA) pour produire : des profils de consommateurs (ciblage publicitaire), des prédictions (risque de crédit, comportement d’achat), des recommandations (Amazon, Netflix), ou des décisions automatisées (recrutement, prêt bancaire). La valorisation finale peut être directe (vente de produits) ou indirecte (vente de données à des tiers — data brokers).
Des entreprises comme Acxiom, Experian, Oracle Data Cloud, ou LiveRamp collectent, agrègent et revendent des données personnelles (parfois anonymisées, souvent pseudonymisées) à des annonceurs, des assureurs, des employeurs potentiels, etc. Ce marché, largement opaque, est estimé à 250 milliards de dollars en 2026.
Quelques acteurs dominent l’économie des données, créant des situations de quasi-monopole.
Ces cinq entreprises possèdent collectivement des quantités astronomiques de données : Google (recherche, emails, localisation, vidéos YouTube), Meta (interactions sociales, centre d’intérêts), Amazon (historique d’achat, données de paiement), Apple (écosystème matériel + services), Microsoft (productivité, cloud). Leur capitalisation boursière cumulée dépasse 12 000 milliards de dollars (2026).
En Chine, ces quatre géants contrôlent l’essentiel des données numériques : Baidu (recherche), Alibaba (e-commerce, cloud), Tencent (messagerie WeChat, jeux), Xiaomi (objets connectés). Leur puissance est renforcée par la coopération avec l’État chinois, qui a accès à une partie des données pour la surveillance et le contrôle social.
Moins connus du grand public, les data brokers sont des entreprises qui ne collectent pas directement les données auprès des utilisateurs, mais les achètent, les agrègent, et les revendent. Exemples : Acxiom (détient des données sur 700 millions de consommateurs), Experian (crédit scoring), Oracle Data Cloud, LiveRamp. Leur marché est opaque et peu régulé.

Infographie n°2 – Les géants de la donnée : GAFAM, BATX, data brokers.
Comme le pétrole, les données sont devenues un enjeu de souveraineté nationale. Les États veulent contrôler les données de leurs citoyens et de leurs entreprises.
Le Clarifying Lawful Overseas Use of Data Act (CLOUD Act) permet aux autorités américaines d’accéder aux données détenues par des entreprises américaines (Google, Microsoft, Amazon), où qu’elles soient stockées dans le monde. Cela pose un problème de souveraineté pour les pays européens.
Le RGPD impose que les données personnelles des citoyens européens soient stockées dans l’UE (ou dans des pays jugés « adéquats »). Il donne aussi aux citoyens un droit de contrôle sur leurs données. La jurisprudence « Schrems II » (2020) a invalidé le Privacy Shield, compliquant les transferts de données Europe-États-Unis.
Pour contrer la domination américaine et chinoise, l’Europe développe des « clouds de confiance » : en France, Bleu (Microsoft + Orange), NumSpot (Capgemini), et Outscale (groupe Dassault) proposent des hébergements souverains, avec des données stockées en France et soumises au droit français.
La Chine impose que les données dites « importantes » (données personnelles de citoyens chinois, données de santé, données géographiques) soient stockées sur le territoire chinois et soumises à un contrôle strict. Les entreprises étrangères doivent se plier à ces règles.
La souveraineté des données (data sovereignty) est le principe selon lequel les données sont soumises aux lois du pays où elles sont collectées ou stockées. C’est un enjeu majeur des relations internationales, comparable aux luttes pour le contrôle des gisements pétroliers au XXe siècle.
Comme le pétrole, les données créent des inégalités : entre pays riches (producteurs de données) et pays pauvres, entre entreprises (géants vs PME), entre individus (data rich vs data poor).
Environ 3 milliards de personnes n’ont toujours pas accès à Internet en 2026 (essentiellement en Afrique, Asie du Sud, Amérique latine rurale). Ces populations sont « data poor » : elles ne produisent presque pas de données numériques, ne bénéficient pas des services basés sur les données, et ne participent pas à l’économie de la donnée.
Les utilisateurs des plateformes gratuites (Facebook, Google, TikTok) produisent des données massives, mais n’en captent quasiment pas la valeur. Les actionnaires des GAFAM, eux, s’enrichissent. Ce déséquilibre est comparable à l’exploitation des ressources naturelles dans les pays colonisés : les matières premières sont extraites localement, mais la valeur est captée ailleurs.
Les petites entreprises ont du mal à rivaliser avec les géants qui disposent de données massives. Les « data network effects » créent des barrières à l’entrée. Des initiatives de « data cooperatives » (coopératives de données) ou de « data trusts » (fiducies de données) tentent de rééquilibrer la donne.
Contrairement au pétrole, les données ne sont pas « consommées » (on peut les utiliser sans les épuiser), mais leur extraction, leur stockage et leur traitement ont un impact environnemental significatif.
Les data centers (centres de données) consomment environ 2 % de l’électricité mondiale, soit autant que l’industrie aéronautique. Cette part croît de 10-15 % par an. L’entraînement d’un seul grand modèle de langage (type GPT-4) peut émettre plusieurs centaines de tonnes de CO₂.
Le streaming vidéo (YouTube, Netflix, TikTok) représente à lui seul environ 1 % des émissions mondiales de CO₂ (soit l’équivalent de l’Espagne). Chaque heure de vidéo visionnée émet environ 36 g de CO₂ (selon l’étude Shift Project).
Les géants du cloud (AWS, Google, Microsoft) s’engagent à atteindre la neutralité carbone, mais leurs bilans réels sont contestés (utilisation de crédits carbone, énergies renouvelables non directement connectées). Le PUE (Power Usage Effectiveness) s’améliore (1,1-1,2 pour les meilleurs data centers), mais la croissance du nombre de data centers annule ces gains.

Infographie n°3 – Data centers, streaming, entraînement IA : l’empreinte carbone des données.
Malgré sa force heuristique, la métaphore « data is the new oil » a des limites importantes qu’il est essentiel de souligner.
Le pétrole est une ressource rare, non renouvelable (à l’échelle humaine). Les données, elles, sont potentiellement infinies : plus on en produit, plus on peut en produire. 90 % des données mondiales ont été créées depuis 2020. L’abondance pose d’ailleurs un problème de « data overload » (trop de données inexploitables).
Le pétrole brûlé disparaît. Une donnée, en revanche, peut être utilisée des milliers de fois, simultanément, sans s’épuiser. C’est un bien non rival. Cette propriété rend l’économie des données très différente de l’économie des ressources physiques.
Une tonne de pétrole a une valeur de marché à peu près constante (dépendant de l’offre et de la demande). Une donnée, en revanche, peut avoir une valeur nulle, faible, ou immense selon le contexte, le croisement avec d’autres données, et l’usage qui en est fait. Une donnée inutile aujourd’hui peut devenir cruciale demain.
Pour le pétrole, le problème principal est l’épuisement des ressources. Pour les données, le problème principal est la gouvernance : qui possède les données ? Qui a le droit de les utiliser ? Comment protéger la vie privée ? Comment éviter les monopoles ? La métaphore du pétrole peut occulter ces questions spécifiques.
Face aux dérives de l’économie des données, des alternatives émergent pour une gouvernance plus démocratique et équitable.
Un data trust est une structure juridique qui permet à un groupe d’individus ou d’organisations de mettre en commun leurs données, et de déléguer leur gestion à des fiduciaires indépendants, qui les utilisent au bénéfice des membres (et non à des fins commerciales). Des expérimentations sont en cours au Royaume-Uni (Open Data Institute), au Canada (Citizen Data Trust), et dans quelques villes françaises.
Inspirés des communs (ressources gérées collectivement), les communs numériques sont des bases de données ouvertes, contributives et gérées démocratiquement. Exemples : Wikipedia (données encyclopédiques), OpenStreetMap (données cartographiques), les bases de données scientifiques en libre accès. L’enjeu est d’étendre ce modèle à d’autres types de données (santé, mobilité, environnement).
Plutôt que de laisser les GAFAM capturer les données, les États (notamment européens) veulent reprendre le contrôle. Le RGPD, le DSA, l’IA Act, et les initiatives de « cloud de confiance » visent à renforcer la souveraineté des données européennes. L’idée est de créer un « marché unique des données » européen, avec des règles communes.
Dans une économie de la fonctionnalité, on ne vend plus un bien, mais un service. Appliqué aux données, cela signifie que les entreprises ne « possèdent » plus les données des utilisateurs, mais en ont un usage limité, encadré, et révocable. Le modèle des « dataspace » (espaces de données) exploré par l’Union européenne s’inspire de cette philosophie.
Certains militants (comme la fondatrice de Creative Commons, Lawrence Lessig) rêvent d’un « data commons » mondial : un réservoir de données librement accessibles pour la recherche, l’innovation, et le bien commun. Les obstacles sont immenses (propriété intellectuelle, vie privée, sécurité), mais des premiers pas existent (ex. données météo, données génomiques en accès ouvert).
L’expression est attribuée à Clive Humby, mathématicien britannique et architecte du programme de fidélité Tesco Clubcard, qui l’aurait prononcée en 2006. Elle a été popularisée ensuite par les géants du numérique et par des ouvrages comme « Big Data » (Mayer-Schönberger et Cukier, 2013).
Parce que la capitalisation boursière des entreprises de la donnée (GAFAM) dépasse celle des compagnies pétrolières (ExxonMobil, Shell, TotalEnergies). En 2026, Apple vaut environ 3 500 milliards de dollars, ExxonMobil environ 500 milliards. Les données sont devenues la principale source de valeur de l’économie numérique, supplantant les ressources physiques.
Les données brutes (raw data) sont les données telles qu’elles sont collectées : logs de serveurs, clics, enregistrements, images. Elles sont volumineuses, désorganisées, et souvent inexploitables en l’état. Les données raffinées (processed data) sont nettoyées, structurées, recoupées, enrichies, et prêtes à être analysées par des algorithmes. C’est le « raffinage » (data processing) qui crée la valeur.
Selon le RGPD, les données personnelles appartiennent à la personne concernée. L’utilisateur a des droits (accès, rectification, effacement, portabilité). Cependant, en pratique, les plateformes ont un accès quasi exclusif à ces données, et les utilisateurs n’en captent quasiment pas la valeur économique. Le débat sur la « propriété des données » est vif : faut-il rémunérer les utilisateurs pour leurs données ? Certaines expérimentations (Solid d’Internet inventor Tim Berners-Lee, ou les data cooperatives) tentent de donner plus de pouvoir aux utilisateurs.
Le stockage des données (data centers) consomme environ 2 % de l’électricité mondiale, soit l’équivalent de la consommation d’un pays comme le Japon. À cela s’ajoutent les réseaux de transmission (fibre, 5G) et les terminaux (smartphones, ordinateurs). L’empreinte carbone du numérique est estimée à 4-5 % des émissions mondiales (autant que l’aviation civile). La croissance exponentielle des données (doublant tous les 2-3 ans) rend difficile la réduction de cette empreinte, malgré les progrès technologiques (PUE).
Plusieurs actions : 1) Utiliser des moteurs de recherche respectueux de la vie privée (DuckDuckGo, Qwant). 2) Limiter les autorisations des applications sur smartphone. 3) Utiliser un VPN pour masquer son adresse IP. 4) Naviguer en mode privé et effacer régulièrement ses cookies. 5) Se méfier des applications « gratuites » qui se rémunèrent via les données. 6) Exercer ses droits RGPD (demander l’accès et l’effacement de ses données). 7) Soutenir des alternatives éthiques aux GAFAM (framasoft, mastodon, peertube).