Abrogeons la loi des moyennes


I. Stewart

Subtilités mathématiques du jeu de pile ou face.

Pile ou face

Jouons à pile ou face, un grand nombre de fois, avec une pièce non truquée. Pile et face ont la même probabilité, égale à 1/2, d'apparaître à chaque lancer. Comptabilisons les résultats au fur et à mesure et supposons que, à une étape, le nombre de tirages sur face soit supérieur de 100 à celui des pile : le nombre de pile a-t-il ensuite tendance à rattraper le nombre de face ? Ceux qui jouent à pile ou face sans en connaître les arcanes mathématiques évoquent parfois une «loi des moyennes» fondée sur l'intuition que les nombres de pile et de face obtenus avec une pièce non truquée devraient devenir peu différents après un grand nombre de lancers. Pourtant les pièces n'ont pas de «mémoire» : la probabilité d'obtenir pile ou face lors d'un lancer est toujours 1/2. Ne devrait-on pas penser plutôt que les totaux n'ont pas de raison de devenir égaux ?

Les mêmes questions se posent dans des contextes variés. Si un accident d'avion se produit en moyenne tous les quatre mois et si trois mois se sont passés sans accident, un accident est-il imminent ?

Dans tous les cas de ce type, la réponse est non : les processus aléatoires ou, plus exactement, les modèles mathématiques de ces processus n'ont pas de mémoire.

Le problème est subtil : qu'entend-on quand on dit que «le nombre de pile rattrapera celui des face» ? Certes, une longue suite de face ne change pas la probabilité d'obtenir ensuite des pile, mais, même après une série comportant par exemple 100 face de plus que de pile, la probabilité que les nombres totaux de pile et de face deviennent ultérieurement égaux est toujours égale à 1. La probabilité d'un événement est égale à 1 quand l'événement est certain, et elle est nulle quand l'événement est impossible. Ici nous envisageons une série potentiellement infinie de lancers : le jeu peut durer aussi longtemps que le désire le joueur. Dans ce cas, les mathématiciens préfèrent dire «presque certain» ou «presque impossible».

D'un autre point de vue, après une série où le nombre de face est supérieur de 100 au nombre de pile, la probabilité que, plus tard, vienne un moment où le total des face soit supérieur à celui des pile d'au moins un million est aussi égale à 1.

Pour analyser ces apparentes contradictions, examinons de plus près le jeu de pile ou face . Nous avons lancé une pièce 20 fois et avons obtenu la suite PPPPFPFFFFFFPPPFPPPF, qui comprend 11 pile (P) et 9 face (F). D'après une loi de la théorie des probabilités nommée loi des grands nombres, la fréquence d'apparition d'un événement tend vers sa probabilité quand le nombre d'expériences augmente indéfiniment. Dans la série précédente, les fréquences des événements «tirer pile» et «tirer face» sont respectivement 11/20, soit 0,55 et 9/20, soit 0,45. Elles sont proches de 0,5, mais pas égales à 0,5.

La suite précédente ne vous semble-t-elle pas assez aléatoire ? Préférez-vous FPFFPPFPPFPFFPFPFFPP, où les fréquences de pile et de face sont exactement égales à 0,5 ? Cette deuxième séquence semble plus aléatoire ... mais elle ne l'est pas.

La première suite ne semble pas aléatoire, car elle contient de longues chaînes du même événement, telles PPPP ou FFFFFF. En réalité, notre intuition est trompeuse : les séquences aléatoires contiennent souvent des motifs et des répétitions, et cela ne doit pas nous étonner (à moins que face sorte à chaque coup pendant très longtemps, auquel cas la pièce a probablement deux côtés marqués face).

FIGURE 1 : Les résultats possibles de quatre lancers à pile (en vert) ou face (en bleu)
Lançons une pièce quatre fois de suite. La figure 1 indique les résultats possibles. Le premier lancer donne soit F, soit P (chacun avec une probabilité 1/2). Le deuxième lancer donne encore soit F, soit P, et ainsi de suite, de sorte qu'après quatre lancers on obtient un arbre à 16 branches. D'après la théorie des probabilités , chaque chemin a une probabilité égale à 1/2 x 1/2 x 1/2 x 1/2, soit 1/16. Remarquez que la probabilité de PPPP est égale à 1/16, tout comme celle de FPFF. Ainsi, bien que FPFF paraisse plus aléatoire que PPPP, les deux séquences ont la même probabilité .

En lançant quatre fois une pièce, on obtient en moyenne deux fois face. Obtiendra-t-on le plus souvent deux pile et deux face ? Non : la figure 1 montre que, sur les 16 chemins, 6 comportent exactement deux faces : FFPP, FPFP, FPPF, PFFP, PFPF, PPFF. La probabilité de tirer exactement deux fois face est donc égale à 6/16, soit 0,375. Elle est inférieure à la probabilité de ne pas avoir exactement deux face, qui est égale à 0,625. Avec des séquences plus longues, l'effet est encore accentué.

Ce genre d'études montre qu'il n'existe pas de «loi des moyennes» : les probabilités des événements futurs ne dépendent pas des résultats passés. Il existe cependant une façon intéressante de considérer le problème, selon laquelle les comptes tendent à la longue à s'équilibrer. Représentons par une courbe la différence entre le nombre de F et le nombre de P en fonction du nombre de lancers : chaque F obtenu fait monter la courbe d'un niveau et chaque P la fait descendre d'un niveau. On obtient ainsi ce que les mathématiciens nomment une marche aléatoire, ou marche au hasard.

FIGURE 2 : Marche au hasard, où «face» correspond à un pas vers le haut et «pile» à un pas vers le bas. Les nombres de «face» et de «pile» totalisés depuis le début du jeu sont rarement égaux ; quand cela se produit, la courbe rouge croise l'axe des abscisses.

La figure 2 représente une marche au hasard typique qui correspond à 10 000 lancers. Son allure déséquilibrée (ici vers le côté face) est tout à fait normale. Par exemple, quand on lance 10 000 fois une pièce, la probabilité qu'un côté soit en tête 9 930 fois et l'autre 70 fois est de l'ordre de 1/10, ce qui est loin d'être négligeable.

On peut également démontrer que la probabilité de ne jamais obtenir l'égalité est nulle ; autrement dit, une des faces ne peut l'emporter indéfiniment, et la courbe croisera nécessairement l'axe des abscisses. C'est dans ce sens que la loi des moyennes est vraie, mais cela ne vous permettra pas d'améliorer vos chances de gain si vous pariez à pile ou face. En effet, ce résultat ne dit pas combien de coups seront nécessaires pour revenir à l'égalité : on sait seulement que ce temps sera vraisemblablement très long si le déséquilibre initial est notable.

Supposez qu'en 100 lancers vous obteniez 55F et 45P - un excès de 10F. La théorie des marches aléatoires indique qu'après un nombre suffisant de lancers supplémentaires le bilan se rééquilibrera (avec une probabilité égale à 1). N'est-ce pas la loi des moyennes ? Non, du moins pas telle qu'elle est interprétée habituellement. Si vous choisissez à l'avance un nombre de lancers supplémentaires (par exemple, un million), ce million de coups ne sera pas influencé par l'excès initial. En outre, si vous faites un grand nombre d'expériences, chacune avec un million de coups supplémentaires, vous obtiendrez en moyenne 500 055F et 500 045P dans la séquence combinée de 1 000 100 lancers : en moyenne, le déséquilibre persiste. Notez toutefois que la fréquence des F passe de 55/100 (0,55) à 500 055/1 000 100 (0,500 005). La loi des moyennes s'affirme non en éliminant les déséquilibres mais en les noyant.

Au lieu d'une pièce, lançons maintenant un dé et comptons combien de fois chaque face apparaît. Admettons que toutes les faces ont la même probabilité à chaque lancer, égale à 1/6. Quand nous commençons à jouer, les nombres totaux d'apparitions des différentes faces sont tous égaux à zéro. Après quelques lancers, ces nombres commencent à différer (ils ne peuvent redevenir égaux qu'après au moins six coups). Quelle est la probabilité que les six nombres redeviennent égaux au bout d'un certain temps, si long soit-il ? Je ne connais pas la valeur exacte ; c'est là une lacune que vous pourrez combler, mais nous allons voir que la réponse n'est pas 1, à la différence du jeu de pile ou face.


FIGURE 3. Marche aléatoire bidimensionnelle.

Pour traiter le cas des dés, on doit étendre la marche au hasard à des dimensions supérieures. Par exemple, la marche au hasard la plus simple dans le plan s'effectue sur un quadrillage infini : un point part d'une origine et se déplace par pas successifs égaux vers le Nord, le Sud, l'Est ou l'Ouest, avec, à chaque pas, une probabilité 1/4 pour chaque direction. La figure 3 représente un chemin typique. Une marche au hasard sur un réseau à trois dimensions est similaire, mais les six directions (Nord, Sud, Est, Ouest, haut, bas) ont chacune une probabilité égale à 1/6.

On peut calculer que, dans une marche au hasard à deux dimensions, la probabilité de repasser par l'origine au bout d'un certain temps est égale à 1. En revanche, le mathématicien hongrois Stanislaw Ulam, qui fut l'un des inventeurs de la bombe à hydrogène, a prouvé que, dans un espace à trois dimensions, la probabilité de retour à l'origine n'est plus que de l'ordre de 0,35. Ainsi, si vous vous perdez dans le désert, marchez au hasard : vous retrouverez votre oasis, à condition d'en avoir le temps ; en revanche, si vous vous perdez dans l'espace, vous n'avez qu'une chance sur trois de retrouver la Terre.

Associons aux six directions d'une marche au hasard tridimensionnelle les faces d'un dé : Nord = 1, Sud = 2, Est = 3, Ouest = 4, haut = 5 et bas = 6. Lançons le dé et déplaçons-nous dans la direction qu'il indique. Dans ce cas, revenir à l'origine signifie obtenir autant de 1 que de 2, de 3 que de 4 et de 5 que de 6. Or, nous avons vu que la probabilité que cela se produise est égale à 0,35. Soulignons que les totaux doivent ici être égaux par paires, alors que, dans le problème des dés, on demande que les six totaux soient égaux : comme cette condition est plus restrictive, la probabilité cherchée est inférieure à 0,35.

Même la marche au hasard la plus simple, à une dimension, a de nombreuses caractéristiques qui heurtent l'intuition. Choisissez un nombre de lancers de pièce à l'avance, par exemple un million, et observez quel côté est en tête à chaque étape. En moyenne, quelle proportion de ces bilans donnera l'avantage à face ? Penchez-vous pour 1/2 ? En fait, cette proportion est la moins vraisemblable, et les proportions extrêmes sont les plus probables : les face sont soit toujours en tête, soit jamais  !



Bibliographie :





N° 248 juin 1998
© Pour la Science (1998)
Cet article est reproduit dans SMEL grâce à l'aimable autorisation de Ian Stewart qui en possède les droits de reproduction électronique.