Catégorie

Fondamentaux

Retrouvez les articles publiés dans cette thématique.

Variables instrumentales pour débutants

09 avril 2026

Variables instrumentales pour débutants

Une variable instrumentale (ou instrument) est une variable qui permet de contourner les biais dans l'estimation d'un effet causal, en particulier quand on soupçonne l'existence de variables confondantes non observées.

Le paradoxe de Simpson expliqué simplement

09 avril 2026

Le paradoxe de Simpson expliqué simplement

Le paradoxe de Simpson est un phénomène statistique contre-intuitif : une tendance observée dans chaque groupe pris séparément peut s'inverser lorsqu'on regarde les groupes fusionnés.

IA exemples concrets

02 avril 2026

IA exemples concrets

Quand on parle d'intelligence artificielle, on imagine souvent des robots humanoïdes ou des ordinateurs surpuissants. La réalité est plus discrète, mais plus omniprésente. Aujourd'hui, chaque Français interagit avec l'IA

Deep learning expliqué simplement

02 avril 2026

Deep learning expliqué simplement

Le deep learning (ou apprentissage profond en français) est une technique avancée de machine learning. Il utilise des réseaux de neurones artificiels comportant plusieurs couches (d'où le terme "profond" / "deep").

Machine learning expliqué simplement

02 avril 2026

Machine learning expliqué simplement

Le machine learning (ou apprentissage automatique en français) est une méthode qui permet à un ordinateur d'apprendre à partir d'exemples, sans être programmé avec des règles précises pour chaque situation.

IA pour débutants

02 avril 2026

IA pour débutants

L'intelligence artificielle (IA) est un domaine de l'informatique qui cherche à créer des machines capables d'effectuer des tâches qui nécessitent normalement une intelligence humaine.

Le paradoxe de Simpson expliqué avec des cas marketing

21 mars 2026

Le paradoxe de Simpson expliqué avec des cas marketing

Le paradoxe de Simpson désigne une situation statistique dans laquelle une tendance observée dans plusieurs groupes séparés s’inverse ou disparaît lorsque ces groupes sont fusionnés. Dit autrement, chaque segment raconte

Méthodes d’inférence causale avec R et Python

21 mars 2026

Méthodes d’inférence causale avec R et Python

L’inférence causale regroupe un ensemble de méthodes statistiques et économétriques visant à estimer l’effet d’une action, d’un traitement, d’une exposition ou d’une décision sur un résultat donné. Le mot important ici n

Biais cognitifs en analyse de données

21 mars 2026

Biais cognitifs en analyse de données

Un biais cognitif est une déviation systématique de la pensée, une manière récurrente de simplifier la réalité, parfois utile, souvent trompeuse. Dans un contexte d’analyse de données, ces biais influencent la manière do

Introduction à la régression linéaire multiple

21 mars 2026

Introduction à la régression linéaire multiple

La régression linéaire multiple est une méthode statistique permettant de modéliser la relation entre une variable dépendante et plusieurs variables explicatives. Autrement dit, il ne s’agit plus de comprendre une relati

Pipelines de données : ETL, ELT et orchestration des flux

20 mars 2026

Pipelines de données : ETL, ELT et orchestration des flux

Un pipeline de données est une chaîne de traitement permettant de collecter, transformer et acheminer des données d’un point A à un point B. Mais cette définition reste presque trop simple. Car en réalité, un pipeline n’

Analyse exploratoire des données

18 mars 2026

Analyse exploratoire des données (EDA)

L’analyse exploratoire des données, souvent appelée EDA (Exploratory Data Analysis), désigne l’ensemble des méthodes permettant d’examiner un jeu de données afin d’en comprendre les caractéristiques principales.

C'est quoi le Machine Learning ?

17 mars 2026

C'est quoi le Machine Learning ?

Le Machine Learning, ou apprentissage automatique, est une branche de l’intelligence artificielle qui permet aux systèmes informatiques d’apprendre à partir des données sans être explicitement programmés pour chaque tâch

Loi de Zipf et Text Mining

30 octobre 2024

Loi de Zipf et Text Mining

La loi de Zipf est une loi empirique largement observée dans l’analyse des langues naturelles et des distributions de fréquence. Elle est très pertinente en text mining pour modéliser la distribution des mots dans les do

C'est quoi le NLTK ?

01 septembre 2021

C'est quoi le NLTK ?

Le NLTK, ou Natural Language Toolkit, est une bibliothèque Python spécialement conçue pour le traitement du langage naturel (TLN / NLP). En pratique, c’est un ensemble de modules, de données linguistiques (corpus) et d’a

Le Big Data : quand les données révèlent l'avenir

01 septembre 2021

Le Big Data : quand les données révèlent l'avenir

Le mot big data a longtemps donne l impression d une mode. En 2026, il sert surtout a nommer un fait industriel : la donnees n est plus un simple sous-produit des systemes, elle devient une matiere premiere, au meme titr