Loi normale: généralités, modélisation et bref historique


Modélisation naturelle

La loi normale est une loi théorique: c'est une idéalisation mathématique qui ne se rencontre jamais exactement dans la nature, pas plus qu'un cercle...
Sans chercher à entrer spécifiquement dans la notion de "modèle" en sciences et en mathématiques, un modèle est une représentation qui permet, en contrepartie d'une simplification et idéalisation, de fournir des outils de description, d'analyse et de compréhension.

Un cercle donc, par exemple, est un modèle mathématique. Dans un premier temps, on peut dire qu'il en va simplement de même pour la courbe gaussienne de la loi normale.

En d'autres termes, qui voit des cercles dans les exemples suivants ...
La Terre
Source: par PIRO4D from Pixabay
eye iris focus
Source: par Rudy and Peter Skitterians from Pixabay
Gouttes d'huile dans de l'eau
Gouttes d'huile dans de l'eau
Source: par A_Different_Perspective from Pixabay
Onde de surface circulaire
Onde circulaire à la surface d'eau
Source: par kalhh from Pixabay

... doit bien accepter de voir des courbes gaussiennes, représentatives d'une loi normale, dans les exemples suivants:
Répartition des notes obtenues au baccalauréat 2001
330 000 candidats
Source : Direction de la Programmation et du Développement,
Ministère de la Jeunesse de l’Éducation nationale et de la Recherche, 2002
Répartition de l'IMC en fonction de l'âge et du sexe en 2003
Source: INSEE, enquête Santé 2002-2003
Répartition de l'écart d'âge H/F au mariage en 2017
Source: INSEE, statistiques de l'état civil
ou encore dans la répatition des résultats d'une expérience aléatoire.
La pertinence de la loi normale, ou de l'ajustement par la courbe gaussienne est certes critiquable dans certains cas, malgré l'allure en "cloche".
On se rappellera bien que, dans n'importe quel cas non "parfait", l'onde à la surface de l'eau n'est pas non plus "parfaitement" circulaire non plus. De même, tout le monde sait bien que la Terre n'est pas excatement sphérique (sphère aplatie aux pôles) ...

Néanmoins, de nombreuses distributions réellement observées (statistiques donc) se trouvent présenter cette forme typique en "cloche".
Un théorème très important en statistique et probabilité, le théorème central limite (hors programme au lycée), montre la place prépondérante que cette loi occupe dans la modélisation de phénomènes naturels.

Tirages aléatoires, lois binomiale et normale


La loi normale se trouve, et c'est une de ses origines historiques, dans l'archétype d'expérience aléatoire suivant: le lancer d'une pièce.
On lance donc N fois une pièce (équilibrée ou non: probabilité p d'obtenir Pile). On peut obtenir sur ces N lancers, au hasard, 0, 1, ... , jusqu'à N fois Pile.
Pour observer et essayer de comprendre ce phénomène, on le répète n fois et on compte sur ces n répétitions le nombre de fois qu'on aura obtenu 0 Pile, 1 Pile, ..., jusqu'à N fois Pile.

Le graphique suivant montre ces résultats aléatoires (cliquer sur les dés pour relancer n une expérience).
Les différentes probabilités des résultats observés sont donnés par la loi binomiale. La courbe "en cloche", ou courbe gaussienne s'y dessine lorsque N augmente:


et



Historique

La loi normale est aussi appelée loi de Gauss, ou loi de Laplace, ou encore de Laplace-Gauss.
Gauss et Laplace trouvèrent tous les deux cette loi, indépendamment l'un de l'autre, et par des approches bien distinctes et différentes:
  • Gauss[1] introduisit la loi normale à propos d'un problème d'estimation de paramètres, pour un problème dans un contexte complètement étranger à celui du calcul des probabilités (il s'intéressait alors au mouvement des corps célestes, et son but était de palier, dans une certaine mesure, l'imprécision des appareils d'observation et de mesure).
    C'est d'ailleurs dans ce même objectif qu'il développa la méthode, célèbre et couramment utilisée de nos jours, des moindres carrés.
  • Laplace[2], quant à lui, était bien dans le cadre du calcul de probabilités telles qu'elles étaient perçues et développées à son époque.
    Laplace prolongea les travaux de Moivre sur l'approximation de la loi binomiale, et montra le résultat illustré ci-dessus.
    La loi normale est ainsi vue comme une approximation (une limite plus précisément) d'une expérience modélisée par une loi binomiale (revoir à ce sujet le théorème de Moivre-Laplace qui, lui, est bien dans les programmes actuels de classe de terminale).


Au 17ème siècle, les jeux de hasard, alors très en vogue, ont poussé les mathématiciens à s'intéresser aux calculs de probabilités. La loi normale est une loi de probabilité qui a aussi son origine dans ce contexte.
Chronologiquement, les étapes marquantes de l'essor de la loi normale sont:
  • Abraham de Moivre (1667-1754) démontre en 1733 que la loi normale est la limite de la loi binomiale pour n infiniment grand et p=q=\dfrac12
  • Pierre-Simon de Laplace (1749-1827) généralise en 1772 le résultat de de Moivre pour p\not=q\not=\dfrac12, c'est-à-dire pour toutes les lois binomiales.
  • Carl Friederich Gauss (1777-1855) parvient au même résultat que de Laplace en s'intéressant à la distribution des erreurs touchant les observations astronomiques.
  • Adolphe Quételet (1796-1874), astronome belge a été le premier à appliquer cette distribution à des données sociales et biologiques. Il a rassemblé les mesures du tour de poitrine de soldats écossais et du tour de taille de soldats français, et a constaté que les deux ensembles de mesures présentaient une distribution approximativement normale.
    Quételet interprétait la moyenne ces distributions "normales" comme l'idéal à atteindre par la nature, et les observations situées de part et d'autre de cette moyenne comme des erreurs par rapport à cette "normalité" (donc, d'une certaine façon, des anormalités). Cette interprétation ne lui a pas survécu.
  • Francis Galton (1822-1911) affirme quant à lui l'omniprésence de la loi normale dans la nature, physique comme biologique. C'est par ailleurs lui qui a donné à la distribution normale un rôle central dans la théorie sur les facultés mentales.
    Galton (cousin de Darwin) voulait justifier la transmission des capacités intellectuelles par l'hérédité pour permettre l'amélioration de l'espèce humaine (il est par ailleurs considéré comme le fondateur de l'eugénisme).
  • Jacques Hadamard (1865-1963) démontre (Faculté des Sciences de Paris, 1926) la possibilité et la nécessité, en s'appuyant sur la loi normale, de gérer scientifiquement la qualité de la production industrielle.
    C'est le début de l'étude statistique des systèmes de production.
    Dans ce cadre industriel l'étude de la fluctuation aléatoire des phénomènes (de tests et contrôles par exemple) et l'estimation (aussi connue sous le terme plus populaire de sondage) sont maintenant incontournables.
  • Emile Borel (1877-1956), mathématicien français, donna une généralisation des conditions de réalisation d'une distribution normale: Lorsque la réalisation d'une variable quantitative X est sous la dépendance d'une cause prépondérante constante, et d'un ensemble de causes perturbatrices secondaires nombreuses et indépendantes, et dont les effets sont additifs, petits, symétriques et aléatoires, la distribution de cette variable tend vers la loi normale et l'approximation est d'autant meilleure que le nombre de causes secondaires est grand.


De nos jours, on estime que les variables qui suivent la loi normale sont vraisemblablement beaucoup moins nombreuses que ce que l'enthousiasme de Galton avait pu suggérer.

Les séries statistiques expérimentales qui se rapprochent le plus de la loi normale concernent des variables (poids, dimensions\dots) observées dans l'industrie pour les fabrications en grande série. En biométrie, un certain nombre de variables quantitatives se distribuent selon la loi normale: taille, poids, rythme cardiaque, périmètre crânien, diamètre des hématies … La généralisation de Borel s'applique ici très bien à l'observation des données biologique ou médical: la taille, par exemple, dépend de très nombreux facteurs, les uns héréditaires, les autres dus au milieu (alimentation, mode de vie, conditions de chauffage des habitations, etc\dots), chacun de ces facteurs agissant indépendamment et pour une petite part.


Notes
  • 1 Gauss (1777-1855) est un mathématicien, astronome et physicien allemand. Surnommé "le prince des mathématiciens", il est considéré comme l'un des plus grands mathématiciens de tous les temps.
  • 2 Laplace (1749-1827) est un mathématicien, astronome et physicien français. Laplace est l'un des principaux scientifiques de la période napoléonienne ; il a apporté des contributions fondamentales dans différents champs des mathématiques, de l'astronomie et de la théorie des probabilités ; il a été l'un des scientifiques les plus influents de son temps, notamment par son affirmation du déterminisme; En 1799 il est nommé ministre de l'Intérieur sous le Consulat. Napoléon Ier, en 1808 lui confère le titre de comte de l'Empire. Il est nommé marquis en 1817, après la restauration des Bourbons.


Voir aussi
Lien
LongPage: h2: 3 - h3: 0