Estimation de l'intervalle de fluctuation

Cette page détaille les éléments théoriques, mathématique, qui permettent d'expliquer les fluctuations observées lors de la répétition d'une variable aléatoire.
Voir et tester le simulateur.

Intervalle de fluctuation

Un intervalle de fluctuation à 95% pour une variable aléatoire X est tel que
P X ∈ I ≥ 95%
ou encore, si on souhaite un intervalle I centré sur l'espérance:
P X   E(X) − α ; E(X) + α   ≥ 95% P | X − E(X) | ≤ α ≥ 95%

Les estimations générales, c'est-à-dire sans information a priori sur la loi de probabilité suivie, reposent sur l'inégalité de Bienaymé-Tchebychev suivante:
Inégalité de Bienaymé-Tchebychev
Pour toute variable aléatoire X, on a
P | X − E(X) | ≥ a V(X) / a2
inégalités de Markov et de Bienaymé-Tchebychev …
Cette inégalité est une conséquence de celle de Markov:
Inégalité de Markov
Pour toute variable aléatoire positive X et tout nombre réel a > 0, on a
P Xa E(X) / a
Démonstration de l'inégalité de Markov:
X est une variable aléatoire discrète, qui peut prendre n valeurs positives, et qu'on suppose ordonnées 0 ≤ x1x2 ≤ … ≤ xn.
On peut présenter la loi de probabilité de X sous la forme d'un tableau:
xi x1 x2 xk xk+1 xn
P(X=xi) p1 p2 pk pk+1 pn
On suppose que 0 ≤ xk < axk+1.
On a alors l'espérance
E(X) = x1p1 + x2p2 + + xkpk + xk+1pk+1 + + xnpn 0 + 0 + + 0 + a pk+1 + + a pn a ( pk+1 + + pn ) a P ( X ≥ a )
d'où l'inégalité de Markov en divisant par a > 0

Démonstration de l'inégalité de Bienaymé-Tchebychev:
On applique l'inégalité de Markov à la variable aléatoire Y = | X − E(X) |2 qui est bien positive, et donc, pour tout réel a > 0,
P Ya E(Y) / a
soit,
P | X − E(X) |2a E | X − E(X) |2 / a
avec
  • | X − E(X) |2a ⇔ | X − E(X) | ≥ a

  • E | X − E(X) |2 = V(X) : " la moyenne des carrés des écarts à la moyenne "
On obtient ainsi directement l'inégalité de Inégalité de Bienaymé-Tchebychev en posant α = a > 0, à savoir
P | X − E(X) | ≥ α V ( X) / α



Répétitions: gains total et moyens

On note X une variable aléatoire qui suit la loi de probabilité du jeu: X est au égale au gain i avec la probabilité pi.

On joue maintenant n fois à ce jeu. On note Xi la variable aléatoire égale au gain lors du ième jeu. On suppose ces variables aléatoires indépendantes. Elles suivent de plus la même loi que X.

Le gain total pour ces n parties est alors la variable aléatoire définie par la somme
Sn = X1 + X2 + … + Xn
et le gain moyen
Mn = X1 + X2 + … + Xn / n = Sn / n

D'après les propriétés de l'espérance et variance d'une somme de variables aléatoires, on a alors l'espérance, la variance et l'écart type pour ce gain total

Espérance et variance d'une somme, linéarité
Soit deux variables aléatoires X et Y et un nombre réel a alors on a
E (X + Y) = E (X) + E(Y) E (aX) = a E (X)
Si les variables X et Y sont de plus indépendantes, on a
V (X + Y) = V (X) + V(Y) V (aX) = a2 V (X)
et on rappelle que l'écart type est la racine carrée de la variance:
σ(X) = V(X)
d'où
E(Sn) = nE(X) V(Sn) = nV(X) σ(Sn) = nσ(X)
et de même pour le gain moyen
E(Mn) = E(Sn) / n = E(X) V(Mn) = V(Sn) / n2 = V(X) / n σ(Mn) = σ(X) / n

Estimation et intervalle de fluctuation pour le gain moyen

On applique l'inégalité de Bienaymé-Tchebychev à la variable aléatoire Mn:
P | Mn − E(Mn) | ≥ a V(Mn) / a2
soit, avec les relations précédentes entre l'espérance et la variance de Mn et X,
P | Mn − E(X) | ≥ a V(X) / na2
En passant à l'événement contraire, on obtient donc
P | Mn − E(X) | < a = 1 − P | Mn − E(X) | ≥ a 1 − V(X) / na2
Pour obtenir un intervalle de fluctuation par exemple à 95% (le plus courant), il suffit donc de choisir le réel a tel que
1 − V(X) / na2 = 95% V(X) / na2 = 1 − 95% = 5% a = V(X) / 5%n = k σ(X) / n
k est une constante (dépendant de la fluctuation souhaitée, 95% ici), et qui montre donc que
Fluctuation en moyenne d'une variable aléatoire
L'amplitude des fluctuations de la moyenne des n répétitions indépendantes d'une variable aléatoire est proportionelle à l'écart type de la variable et inversement proportionnelle à la racine carrée du nombre de répétition:

P | Mn − E(X) | ≤ αn ≥ Constante ⇔ αnk σ(X) / n
On peut observer ce résultat et ces fluctuations là, en choisissant de tracer le " gain moyen " et l' " intervalle de fluctuation ".

Estimation et intervalle de fluctuation pour le gain total

On applique cette fois l'inégalité de Bienaymé-Tchebychev à la variable aléatoire Sn:
P | Sn − E(Sn) | ≥ a V(Sn) / a2
soit, avec les relations précédentes entre l'espérance et la variance de Mn et X,
P | SnnE(X) | ≥ a nV(X) / a2
On passe à nouveau à l'événement contraire et on obtient, comme précédemment,
P | SnnE(X) | ≤ a ≥ 1 − nV(X) / a2
Pour obtenir un intervalle de fluctuation par exemple à 95% (le plus courant), il suffit donc maintenant de choisir le réel a tel que
1 − nV(X) / a2 = 95% nV(X) / a2 = 1 − 95% = 5% a = nV(X) / 5% = k σ(X) n
k est une constante (dépendant de la fluctuation souhaitée, 95% ici), et qui montre donc que
Fluctuation de la somme des répétitions d'une variable aléatoire
L'amplitude des fluctuations de la somme des n répétitions indépendantes d'une variable aléatoire est proportionelle à l'écart type de la variable et inversement proportionnelle à la racine carrée du nombre de répétition:

P | Mn − E(X) | ≤ αn ≥ Constante ⇔ αnk σ(X) n
On peut observer ce résultat et ces fluctuations là, en choisissant de tracer le " gain total " et l' " intervalle de fluctuation ".

Estimation et intervalle de fluctuation pour la loi binomiale / normale

Pour la loi binomiale (en s'aidant d'une approximation par une loi normale), on a le résultat
P | Mn − E(X) | ≤ αn = 95%
pour
αn ≃ 1,96 σ(X) / n

(La démonstration complète peut être trouvée, par exemple, dans ce cours).
Dans les calculs précédents, le coefficient de proportionnalité trouvé pour cet intervalle à 95% était k = 20 ≃ 4,47.
L'intervalle est un peu plus fin et précis ici; il faut pour cela se rappeler que l'estimation plus large obtenue précédemment ne présupposait quant à elle aucune hypothèse sur la loi de probabilité suivie par X.



LongPage: h2: 5 - h3: 0