Fondamentaux

Les données : le pétrole du XXIe siècle

« Data is the new oil » — l’expression, popularisée par le mathématicien Clive Humby en 2006, est devenue un slogan incontournable de l’économie numérique. Comme le pétrole au XXe siècle, les données sont aujourd’hui une ressource stratégique, convoitée, source de pouvoir et de richesses. Mais la métaphore est-elle vraiment juste ? Quels sont les parallèles entre l’économie du pétrole et l’économie des données ? Et quelles sont les limites de cette comparaison ? Cet article explore en profondeur ce lieu commun devenu réalité, ses implications économiques, géopolitiques et environnementales, et les défis d’une gouvernance juste des données.

Mis à jour en : avril 2026

Sommaire

1. La métaphore : d’où vient « data is the new oil » ?
2. Les parallèles entre données et pétrole
3. L’économie des données : valeur, extraction, raffinage
4. Les acteurs : GAFAM, data brokers et géants de la donnée
5. Souveraineté des données : le nouvel enjeu géopolitique
6. Inégalités d’accès et fracture data
7. L’empreinte environnementale des données
8. Les limites de la métaphore : données ≠ pétrole
9. Alternatives : data trusts, communs numériques, souveraineté
10. FAQ — Données, le pétrole du XXIe siècle
11. Sources

1. La métaphore : d’où vient « data is the new oil » ?

L’expression « Data is the new oil » est attribuée à Clive Humby, mathématicien britannique et architecte du programme de fidélité Tesco (Clubcard), qui l’aurait prononcée en 2006. Sa formule complète est : « Data is the new oil. It’s valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc. » (Les données sont le nouveau pétrole. Elles ont de la valeur, mais non raffinées, elles ne peuvent pas vraiment être utilisées. Elles doivent être transformées en gaz, plastique, produits chimiques, etc.).

La métaphore a été reprise et popularisée par les géants du numérique (Google, Facebook, Amazon) pour souligner l’importance stratégique des données dans l’économie moderne. En 2026, elle est devenue un lieu commun, mais aussi un outil d’analyse critique : comme le pétrole, les données sont une ressource dont l’extraction massive pose des questions de propriété, d’inégalités, de souveraineté et d’impact environnemental.

Chiffre clé – la valeur des données

Selon IDC, la « data economy » (économie des données) représentait 4,5 % du PIB mondial en 2025, soit environ 4 800 milliards de dollars. Une part comparable à celle de l’industrie pétrolière (5-6 % du PIB mondial).

Infographie de la métaphore données = pétrole du XXIe siècle

Infographie n°1 – La métaphore « Data is the new oil » : extraction, raffinage, valorisation, déchets.

2. Les parallèles entre données et pétrole

La comparaison entre données et pétrole repose sur plusieurs similitudes frappantes, qui éclairent les enjeux de l’économie numérique.

Une ressource stratégique convoitée

Comme le pétrole au XXe siècle, les données sont devenues une ressource stratégique pour les États et les entreprises. Celui qui contrôle les données contrôle l’intelligence économique, la capacité d’innovation (IA, recherche), et une partie de la souveraineté nationale. Les guerres commerciales (États-Unis/Chine, Europe/États-Unis) ont désormais une dimension « data ». La course aux données massives (big data) est comparable à la course aux gisements pétroliers du début du XXe siècle.

Extraction massive et infrastructures lourdes

L’extraction de pétrole nécessite des infrastructures lourdes (forages, pipelines, raffineries). L’extraction de données nécessite également des infrastructures massives : data centers (consommation énergétique colossale), réseaux de fibre optique, capteurs IoT, et surtout des plateformes numériques (réseaux sociaux, moteurs de recherche, places de marché) qui collectent en continu les données des utilisateurs.

Raffinage : des données brutes aux insights exploitables

Le pétrole brut n’est pas utilisable en l’état : il doit être raffiné en carburants, plastiques, lubrifiants. De même, les données brutes (logs, clics, images) n’ont pas de valeur intrinsèque. Elles doivent être nettoyées, structurées, recoupées, analysées (data mining, machine learning) pour produire des « insights » exploitables (prédictions, profils, recommandations). Le « raffinage des données » est un secteur en plein essor (data engineering, data science).

Monopoles et inégalités d’accès

Le marché pétrolier a été dominé par quelques grandes compagnies (les « Seven Sisters »). Le marché des données est dominé par quelques géants (GAFAM : Google, Apple, Facebook (Meta), Amazon, Microsoft ; et les chinois BATX : Baidu, Alibaba, Tencent, Xiaomi). Ces entreprises possèdent des quantités de données massives (effet « data network effect » : plus de données → meilleurs algorithmes → plus d’utilisateurs → encore plus de données) qui créent des barrières à l’entrée quasi infranchissables.

90 %

des données mondiales créées depuis 2020

IDC, 2026

entreprises contrôlent 60 % des données numériques mondiales

étude Statista, 2025

4,8 %

du PIB mondial (économie des données)

IDC, 2025

3. L’économie des données : valeur, extraction, raffinage

Comprendre l’économie des données, c’est comprendre comment les données brutes sont transformées en valeur économique.

Extraction : la collecte massive

Les données sont extraites de multiples sources : navigation web (cookies, pixels espions), réseaux sociaux (posts, likes, partages), transactions commerciales (historique d’achat), objets connectés (montres, assistants vocaux, voitures), capteurs urbains, etc. L’utilisateur « paie » souvent avec ses données plutôt qu’avec de l’argent (modèle économique des plateformes « gratuites »).

Stockage et traitement : les data centers

Les données extraites sont stockées dans des data centers (centres de données) géants. En 2026, il existe environ 8 000 data centers dans le monde, consommant environ 2 % de l’électricité mondiale (l’équivalent de la consommation d’un pays comme le Japon). Les leaders sont : AWS (Amazon), Azure (Microsoft), Google Cloud, Alibaba Cloud.

Analyse et valorisation : le raffinage

Les données brutes sont nettoyées, recoupées, et analysées par des algorithmes (machine learning, IA) pour produire : des profils de consommateurs (ciblage publicitaire), des prédictions (risque de crédit, comportement d’achat), des recommandations (Amazon, Netflix), ou des décisions automatisées (recrutement, prêt bancaire). La valorisation finale peut être directe (vente de produits) ou indirecte (vente de données à des tiers — data brokers).

Le marché des data brokers (courtiers en données)

Des entreprises comme Acxiom, Experian, Oracle Data Cloud, ou LiveRamp collectent, agrègent et revendent des données personnelles (parfois anonymisées, souvent pseudonymisées) à des annonceurs, des assureurs, des employeurs potentiels, etc. Ce marché, largement opaque, est estimé à 250 milliards de dollars en 2026.

4. Les acteurs : GAFAM, data brokers et géants de la donnée

Quelques acteurs dominent l’économie des données, créant des situations de quasi-monopole.

Les GAFAM (Google, Apple, Meta, Amazon, Microsoft)

Ces cinq entreprises possèdent collectivement des quantités astronomiques de données : Google (recherche, emails, localisation, vidéos YouTube), Meta (interactions sociales, centre d’intérêts), Amazon (historique d’achat, données de paiement), Apple (écosystème matériel + services), Microsoft (productivité, cloud). Leur capitalisation boursière cumulée dépasse 12 000 milliards de dollars (2026).

Les BATX chinois (Baidu, Alibaba, Tencent, Xiaomi)

En Chine, ces quatre géants contrôlent l’essentiel des données numériques : Baidu (recherche), Alibaba (e-commerce, cloud), Tencent (messagerie WeChat, jeux), Xiaomi (objets connectés). Leur puissance est renforcée par la coopération avec l’État chinois, qui a accès à une partie des données pour la surveillance et le contrôle social.

Les data brokers (courtiers)

Moins connus du grand public, les data brokers sont des entreprises qui ne collectent pas directement les données auprès des utilisateurs, mais les achètent, les agrègent, et les revendent. Exemples : Acxiom (détient des données sur 700 millions de consommateurs), Experian (crédit scoring), Oracle Data Cloud, LiveRamp. Leur marché est opaque et peu régulé.

Infographie des acteurs de l’économie des données

Infographie n°2 – Les géants de la donnée : GAFAM, BATX, data brokers.

5. Souveraineté des données : le nouvel enjeu géopolitique

Comme le pétrole, les données sont devenues un enjeu de souveraineté nationale. Les États veulent contrôler les données de leurs citoyens et de leurs entreprises.

Le Cloud Act américain (2018)

Le Clarifying Lawful Overseas Use of Data Act (CLOUD Act) permet aux autorités américaines d’accéder aux données détenues par des entreprises américaines (Google, Microsoft, Amazon), où qu’elles soient stockées dans le monde. Cela pose un problème de souveraineté pour les pays européens.

Le RGPD européen (2018, révisé 2025)

Le RGPD impose que les données personnelles des citoyens européens soient stockées dans l’UE (ou dans des pays jugés « adéquats »). Il donne aussi aux citoyens un droit de contrôle sur leurs données. La jurisprudence « Schrems II » (2020) a invalidé le Privacy Shield, compliquant les transferts de données Europe-États-Unis.

Les clouds de confiance européens (France, Allemagne)

Pour contrer la domination américaine et chinoise, l’Europe développe des « clouds de confiance » : en France, Bleu (Microsoft + Orange), NumSpot (Capgemini), et Outscale (groupe Dassault) proposent des hébergements souverains, avec des données stockées en France et soumises au droit français.

La loi chinoise sur la sécurité des données (2021, renforcée 2025)

La Chine impose que les données dites « importantes » (données personnelles de citoyens chinois, données de santé, données géographiques) soient stockées sur le territoire chinois et soumises à un contrôle strict. Les entreprises étrangères doivent se plier à ces règles.

Le concept de « data sovereignty »

La souveraineté des données (data sovereignty) est le principe selon lequel les données sont soumises aux lois du pays où elles sont collectées ou stockées. C’est un enjeu majeur des relations internationales, comparable aux luttes pour le contrôle des gisements pétroliers au XXe siècle.

6. Inégalités d’accès et fracture data

Comme le pétrole, les données créent des inégalités : entre pays riches (producteurs de données) et pays pauvres, entre entreprises (géants vs PME), entre individus (data rich vs data poor).

La fracture numérique mondiale

Environ 3 milliards de personnes n’ont toujours pas accès à Internet en 2026 (essentiellement en Afrique, Asie du Sud, Amérique latine rurale). Ces populations sont « data poor » : elles ne produisent presque pas de données numériques, ne bénéficient pas des services basés sur les données, et ne participent pas à l’économie de la donnée.

Les GAFAM captent la valeur, les utilisateurs créent la valeur sans être rémunérés

Les utilisateurs des plateformes gratuites (Facebook, Google, TikTok) produisent des données massives, mais n’en captent quasiment pas la valeur. Les actionnaires des GAFAM, eux, s’enrichissent. Ce déséquilibre est comparable à l’exploitation des ressources naturelles dans les pays colonisés : les matières premières sont extraites localement, mais la valeur est captée ailleurs.

Les PME et start-ups : des difficultés d’accès aux données

Les petites entreprises ont du mal à rivaliser avec les géants qui disposent de données massives. Les « data network effects » créent des barrières à l’entrée. Des initiatives de « data cooperatives » (coopératives de données) ou de « data trusts » (fiducies de données) tentent de rééquilibrer la donne.

7. L’empreinte environnementale des données

Contrairement au pétrole, les données ne sont pas « consommées » (on peut les utiliser sans les épuiser), mais leur extraction, leur stockage et leur traitement ont un impact environnemental significatif.

La consommation énergétique des data centers

Les data centers (centres de données) consomment environ 2 % de l’électricité mondiale, soit autant que l’industrie aéronautique. Cette part croît de 10-15 % par an. L’entraînement d’un seul grand modèle de langage (type GPT-4) peut émettre plusieurs centaines de tonnes de CO₂.

L’empreinte carbone du streaming et des réseaux sociaux

Le streaming vidéo (YouTube, Netflix, TikTok) représente à lui seul environ 1 % des émissions mondiales de CO₂ (soit l’équivalent de l’Espagne). Chaque heure de vidéo visionnée émet environ 36 g de CO₂ (selon l’étude Shift Project).

Le green data center : des progrès, mais insuffisants

Les géants du cloud (AWS, Google, Microsoft) s’engagent à atteindre la neutralité carbone, mais leurs bilans réels sont contestés (utilisation de crédits carbone, énergies renouvelables non directement connectées). Le PUE (Power Usage Effectiveness) s’améliore (1,1-1,2 pour les meilleurs data centers), mais la croissance du nombre de data centers annule ces gains.

2 %

de l’électricité mondiale (data centers)

IEA, 2025

1 %

des émissions CO₂ (streaming vidéo)

The Shift Project

+15 %/an

croissance des data centers

Gartner, 2026

Infographie de l’empreinte environnementale des données

Infographie n°3 – Data centers, streaming, entraînement IA : l’empreinte carbone des données.

8. Les limites de la métaphore : données ≠ pétrole

Malgré sa force heuristique, la métaphore « data is the new oil » a des limites importantes qu’il est essentiel de souligner.

Les données ne sont pas rares (elles sont abondantes, voire surabondantes)

Le pétrole est une ressource rare, non renouvelable (à l’échelle humaine). Les données, elles, sont potentiellement infinies : plus on en produit, plus on peut en produire. 90 % des données mondiales ont été créées depuis 2020. L’abondance pose d’ailleurs un problème de « data overload » (trop de données inexploitables).

Les données ne sont pas consommées (elles sont réutilisables)

Le pétrole brûlé disparaît. Une donnée, en revanche, peut être utilisée des milliers de fois, simultanément, sans s’épuiser. C’est un bien non rival. Cette propriété rend l’économie des données très différente de l’économie des ressources physiques.

Les données ne sont pas intrinsèquement précieuses (leur valeur est contextuelle)

Une tonne de pétrole a une valeur de marché à peu près constante (dépendant de l’offre et de la demande). Une donnée, en revanche, peut avoir une valeur nulle, faible, ou immense selon le contexte, le croisement avec d’autres données, et l’usage qui en est fait. Une donnée inutile aujourd’hui peut devenir cruciale demain.

Le problème n’est pas l’extraction, mais la gouvernance

Pour le pétrole, le problème principal est l’épuisement des ressources. Pour les données, le problème principal est la gouvernance : qui possède les données ? Qui a le droit de les utiliser ? Comment protéger la vie privée ? Comment éviter les monopoles ? La métaphore du pétrole peut occulter ces questions spécifiques.

9. Alternatives : data trusts, communs numériques, souveraineté

Face aux dérives de l’économie des données, des alternatives émergent pour une gouvernance plus démocratique et équitable.

Les data trusts (fiducies de données)

Un data trust est une structure juridique qui permet à un groupe d’individus ou d’organisations de mettre en commun leurs données, et de déléguer leur gestion à des fiduciaires indépendants, qui les utilisent au bénéfice des membres (et non à des fins commerciales). Des expérimentations sont en cours au Royaume-Uni (Open Data Institute), au Canada (Citizen Data Trust), et dans quelques villes françaises.

Les communs numériques (digital commons)

Inspirés des communs (ressources gérées collectivement), les communs numériques sont des bases de données ouvertes, contributives et gérées démocratiquement. Exemples : Wikipedia (données encyclopédiques), OpenStreetMap (données cartographiques), les bases de données scientifiques en libre accès. L’enjeu est d’étendre ce modèle à d’autres types de données (santé, mobilité, environnement).

La souveraineté des données (data sovereignty)

Plutôt que de laisser les GAFAM capturer les données, les États (notamment européens) veulent reprendre le contrôle. Le RGPD, le DSA, l’IA Act, et les initiatives de « cloud de confiance » visent à renforcer la souveraineté des données européennes. L’idée est de créer un « marché unique des données » européen, avec des règles communes.

L’économie de la fonctionnalité appliquée aux données

Dans une économie de la fonctionnalité, on ne vend plus un bien, mais un service. Appliqué aux données, cela signifie que les entreprises ne « possèdent » plus les données des utilisateurs, mais en ont un usage limité, encadré, et révocable. Le modèle des « dataspace » (espaces de données) exploré par l’Union européenne s’inspire de cette philosophie.

Vers un « data commons » mondial ?

Certains militants (comme la fondatrice de Creative Commons, Lawrence Lessig) rêvent d’un « data commons » mondial : un réservoir de données librement accessibles pour la recherche, l’innovation, et le bien commun. Les obstacles sont immenses (propriété intellectuelle, vie privée, sécurité), mais des premiers pas existent (ex. données météo, données génomiques en accès ouvert).

10. FAQ — Données, le pétrole du XXIe siècle

Qui a inventé l’expression « data is the new oil » ?

L’expression est attribuée à Clive Humby, mathématicien britannique et architecte du programme de fidélité Tesco Clubcard, qui l’aurait prononcée en 2006. Elle a été popularisée ensuite par les géants du numérique et par des ouvrages comme « Big Data » (Mayer-Schönberger et Cukier, 2013).

Pourquoi dit-on que les données valent plus que le pétrole ?

Parce que la capitalisation boursière des entreprises de la donnée (GAFAM) dépasse celle des compagnies pétrolières (ExxonMobil, Shell, TotalEnergies). En 2026, Apple vaut environ 3 500 milliards de dollars, ExxonMobil environ 500 milliards. Les données sont devenues la principale source de valeur de l’économie numérique, supplantant les ressources physiques.

Quelle est la différence entre données brutes et données raffinées ?

Les données brutes (raw data) sont les données telles qu’elles sont collectées : logs de serveurs, clics, enregistrements, images. Elles sont volumineuses, désorganisées, et souvent inexploitables en l’état. Les données raffinées (processed data) sont nettoyées, structurées, recoupées, enrichies, et prêtes à être analysées par des algorithmes. C’est le « raffinage » (data processing) qui crée la valeur.

Les données personnelles appartiennent-elles à l’utilisateur ?

Selon le RGPD, les données personnelles appartiennent à la personne concernée. L’utilisateur a des droits (accès, rectification, effacement, portabilité). Cependant, en pratique, les plateformes ont un accès quasi exclusif à ces données, et les utilisateurs n’en captent quasiment pas la valeur économique. Le débat sur la « propriété des données » est vif : faut-il rémunérer les utilisateurs pour leurs données ? Certaines expérimentations (Solid d’Internet inventor Tim Berners-Lee, ou les data cooperatives) tentent de donner plus de pouvoir aux utilisateurs.

Quel est l’impact environnemental du stockage des données ?

Le stockage des données (data centers) consomme environ 2 % de l’électricité mondiale, soit l’équivalent de la consommation d’un pays comme le Japon. À cela s’ajoutent les réseaux de transmission (fibre, 5G) et les terminaux (smartphones, ordinateurs). L’empreinte carbone du numérique est estimée à 4-5 % des émissions mondiales (autant que l’aviation civile). La croissance exponentielle des données (doublant tous les 2-3 ans) rend difficile la réduction de cette empreinte, malgré les progrès technologiques (PUE).

Comment les particuliers peuvent-ils protéger leurs données ?

Plusieurs actions : 1) Utiliser des moteurs de recherche respectueux de la vie privée (DuckDuckGo, Qwant). 2) Limiter les autorisations des applications sur smartphone. 3) Utiliser un VPN pour masquer son adresse IP. 4) Naviguer en mode privé et effacer régulièrement ses cookies. 5) Se méfier des applications « gratuites » qui se rémunèrent via les données. 6) Exercer ses droits RGPD (demander l’accès et l’effacement de ses données). 7) Soutenir des alternatives éthiques aux GAFAM (framasoft, mastodon, peertube).

Dominez le déluge de données
Comprenez enfin les architectures et les enjeux des volumes massifs dans notre : Guide Big Data 2026 : Définition, outils et usages.

Sources

IDC – The Data Economy : Value and Growth (2025)
Statista – Data market share by company (2025)
IEA (International Energy Agency) – Data centers and energy consumption (2025)
The Shift Project – Empreinte carbone du numérique (2025)
CNIL – Données personnelles et économie des données (2025)
Open Data Institute – Data trusts : governance models (2025)
European Commission – Data Sovereignty and Cloud Act (2025)
Tim Berners-Lee – Solid project : re-decentralizing the web (2025)
Lawrence Lessig – The future of ideas (réédition 2025)

Réseaux sociaux

Équipe

Support

Ressources

Recevez la veille IA & Data