Débutant

Comprendre le biais et l'équité de l'IA

⏱ ~35 Durée · 9 Module

Pourquoi est-ce important?

Les biais de l'IA discriminent — sans intention, sans conscience, à grande échelle. Quiconque utilise l'IA sans vérifier les biais risque de causer des dommages aux personnes et de subir des conséquences juridiques (EU AI Act Art. 10).

Ce que vous allez apprendre

Vous comprenez comment le biais dans l'IA se forme, reconnaissez les 3 principaux types et savez quoi faire si vous suspectez un biais.

Video

Automatisons-nous le racisme ? (Vox)

Présente des exemples réels de biais d'IA — COMPAS, Amazon Recruiting, Reconnaissance Faciale. Rend le sujet immédiatement tangible.

Video

Coded Bias — Bande-annonce du documentaire

Bande-annonce de 3 minutes pour le documentaire sur les biais de l'IA dans la reconnaissance faciale. Motive pourquoi le sujet doit être pris au sérieux.

Lesen

Comment le biais se forme

~15 Min

Comment le biais pénètre dans les systèmes d'IA

La formule de base

Biais en entrée → Biais en sortie. L'IA apprend à partir des données. Si les données sont biaisées, les résultats seront biaisés. Sans mauvaise intention. Sans conscience. À grande échelle.

Les trois principaux types

Type 1 — Biais des données

Les données d'entraînement reflètent le monde tel qu'il était, non tel qu'il devrait être.

Exemple Amazon : Dix ans de données historiques de recrutement dans un secteur dominé par les hommes. Le modèle apprend : les candidats masculins sont préférés. Les CV contenant le mot « femmes » sont dévalorisés. Résultat : Biais systémique sans intention de programmation.

Signe distinctif : Un groupe apparaît moins souvent ou de manière plus négative dans les données d'entraînement.

Type 2 — Biais de proxy

Le modèle utilise des variables indirectes comme proxy pour des caractéristiques protégées.

Exemple de scoring de crédit : Le code postal est corrélé au niveau de revenu → corrélé à l'origine → corrélé à l'ethnicité. Le modèle discrimine selon l'ethnicité, sans utiliser directement la variable.

Signe distinctif : Une variable « devrait » être neutre, mais produit systématiquement des résultats inégaux.

Type 3 — Boucle de rétroaction

La sortie de l'IA devient la nouvelle entrée — et renforce les schémas existants.

Exemple de police prédictive : L'IA prédit plus de criminalité dans le quartier A → plus de police là-bas → plus d'arrestations là-bas → de nouvelles données confirment la prédiction → l'IA devient plus sûre de son évaluation. La boucle de renforcement tourne.

Pourquoi le biais est si difficile à détecter

Raison	Explication
Pas d'intention	Le biais provient des données, pas du code
Correction technique	Le modèle est « correct » au sens statistique
Pas de signal visible	Les différences ne sont pas émises, seulement reflétées
Complexité	Avec plus de 100 variables, les relations ne sont pas intuitives

Suite : Détecter et agir sur le biais →

Quiz

Vérification rapide

1. Le biais doit-il être intentionnel pour causer du tort ?

A Oui — sans intention, ce n'est pas un véritable problème B Non — Les biais se forment souvent de manière involontaire et causent néanmoins des préjudices. C Seulement s'il peut être prouvé

2. Qu'est-ce que le biais des données ?

A Une erreur dans le code qui ralentit le modèle B Des biais dans les données d'entraînement qui se répercutent sur les résultats C Une méthode de nettoyage des données

Merke

3 types de biais

Datenbias: Trainingsdaten spiegeln historische Ungleichheit wider
Algorithmusbias: Modell-Design verstärkt bestehende Muster
Feedback-Bias: Bias im Output wird zum neuen Input — Verstärkungs-Schleife

Lesen

Reconnaître les biais et que faire

~20 Min

Détecter les biais — et agir correctement

La méthode la plus importante : analyser la distribution des résultats

Aucune connaissance en apprentissage automatique requise. Une seule question :

« Existe-t-il des différences systématiques dans les résultats entre des groupes comparables ? »

Pratiquement :

Exporter les résultats du système d'IA
Diviser par groupes (sexe, âge, origine, code postal)
Comparer les taux : taux de rejet, taux d'approbation, scores

Si des différences sont visibles, qui ne peuvent être expliquées par des facteurs professionnels légitimes : suspicion de biais.

Signaux d'alerte — ces motifs doivent vous alerter

Signal d'alerte	Cause possible
Scores systématiquement inférieurs pour un groupe	Biais de données ou biais de proxy
Les résultats ne s'améliorent jamais pour un groupe	Boucle de rétroaction
Le système « connaît » des choses qu'il ne devrait pas avoir appris directement	Variable de proxy
Le fournisseur ne peut pas expliquer les motifs	Manque de transparence
Les taux s'écartent fortement de la moyenne de la population	Biais structurel

La bonne procédure en cas de suspicion de biais

1. IMMÉDIATEMENT : Retirer le système du processus critique
   (pas : observer, pas : attendre un correctif)

2. DOCUMENTER : Qu'a-t-on observé ? Depuis quand ? Quels groupes sont concernés ?

3. ANALYSER : Cause racine — Données d'entraînement ? Variable de proxy ? Boucle de rétroaction ?

4. DÉCIDER : Réentraînement, ajustement du modèle ou remplacement du système ?

5. TESTER : Test de biais avec des cas de test structurés avant réactivation

6. DOCUMENTER : Mesures, résultats, responsables

Ce que la loi exige

Base légale	Exigence
EU AI Act Art. 10	Les données d'entraînement doivent être représentatives, pertinentes et exemptes d'erreurs — Obligation pour les systèmes à haut risque
EU AI Act Art. 9	Le système de gestion des risques doit inclure le biais comme catégorie de risque
AGG	L'interdiction de discrimination s'applique également aux décisions algorithmiques
ISO 42001 A.5.4	L'équité comme mesure de contrôle explicite

Conclusion : La vérification des biais n'est pas facultative. Elle est légalement obligatoire — pour les systèmes à haut risque à partir d'août 2026.

Cas pratique : L'outil de recrutement

Situation : Après 6 mois, il est constaté qu'un système de recrutement basé sur l'IA évalue systématiquement moins bien les candidats de certains codes postaux. Le code postal n'est pas un critère de sélection officiel.

Que s'est-il passé ici ? Biais de proxy : Code postal → Écoles → Statut socio-économique → Origine. Le modèle discrimine indirectement, sans le « savoir ».

Procédure correcte :

Suspendre immédiatement l'outil — pas seulement après analyse
Faire vérifier toutes les décisions prises depuis la mise en œuvre
Analyse de la cause racine : Quelle variable agit comme proxy ?
Réentraînement sans code postal et caractéristiques corrélées
Avant réactivation : test de biais structuré avec jeu de données de test

Procédure incorrecte : « Nous retirons le code postal des données d'entrée. » Cela résout le symptôme. Les caractéristiques corrélées (nom de l'école, nom de la rue, appartenance à un club) transportent le même proxy.

Retour : Comment les biais se forment | Commencer l'évaluation →

Praxisfall

Cas pratique : Les quotas inégaux

Situation

Vous analysez les résultats d'un outil de recrutement basé sur l'IA. Les candidats provenant de certains codes postaux sont systématiquement moins bien évalués — bien que le code postal ne soit pas un critère de sélection.

Que s'est-il passé ici et que fais-tu ?

Lösung anzeigen

C'est un biais de substitution classique : le code postal est corrélé avec le statut socio-économique, l'accès à l'éducation, etc.

Ce qu'il faut faire :

Retirer immédiatement l'outil du processus de candidature
Vérifier toutes les décisions prises depuis la mise en œuvre
Confronter le fournisseur (obligation de haut risque : test de biais)
Pour un outil propre : analyse des causes profondes, nouvel entraînement
Documenter — le EU AI Act Art. 10 exige des pratiques de gestion des données

Häufige Fehler:

✗ Supprimer le code postal des données d'entrée et continuer

Cela ne résout que le symptôme. Les caractéristiques corrélées (nom de l'école, prénoms) continuent de transmettre le même proxy.

Reflexion

Votre perspective

Y a-t-il des systèmes d'IA dans votre environnement où vous voyez des risques de biais ?

Beispiele:

Empfehlungsalgorithmen die immer ähnliche Profile bevorzugen
Scoring-Systeme ohne nachvollziehbare Kriterien
Tools die historische Entscheidungen als 'optimal' behandeln

Wird nur in deinem Browser gespeichert.

Merke

Ce que vous emportez avec vous

Bias aktiv suchen — nicht hoffen dass keiner vorhanden ist
Ergebnisverteilung regelmäßig prüfen: systematische Unterschiede?
Bei Bias-Verdacht: sofort stoppen, nicht abwarten
EU AI Act Art. 10: Datenverwaltung und Bias-Prüfung sind Pflicht

Prêt pour l'évaluation?

Cours terminé ! Commencer l'évaluation.

Démarrer l'évaluation →