Graphes et chaînes de Markov

Introduction

Les chaînes de Markov sont des objets probabilistes qui permettent de modéliser assez simplement des situations dans lesquelles la prédiction de l'évolution future est dépendante de l'état présent, et exclusivement de l'état présent (dans indépendante du passé).
La mathématicien russe Andreï Markov, en publiant les premiers résultats dans ce domaine en 1906, laissa son nom à ces événements qui s'enchaînent.
Ce fut le début d'un domaine de recherche très riche et toujours d'actualité.
30 ans après les première publications de Markov, Kolmogorov généralisa les chaînes de Markov (en temps discret) en processus de Markov (en temps continu). Kolmogorov s'inspira certes des travaux de Markov, mais aussi des recherches et interrogations sur les fluctuations des marchés financiers et du modèle du mouvement Brownien introduit par Einstein (en 1905, la même année qu'il a publié ses deux articles révolutionnaires, l'un sur les quanta de lumière et l'autre sur la relativité)

On peut représenter efficacement une chaîne de Markov, ses états et probabilités de transition, par un graphe orienté et pondéré. Les états sont les sommets du graphe, les poids sur les arêtes sont les probabilités.
Ce chapitre commence ainsi par quelques paragraphes sur les graphes, et leurs représentations et exploitations matricielles. L'histoire des graphes débute au 18^ème siècle à Königsberg avec Euler, voir l'exercice 1, et se poursuit encore de nos jours comme une branche des mathématiques discrètes et informatique.

Ce chapitre en mathématiques expertes en terminale générale apparaît comme une pierre angulaire, mêlant probabilités, matrices, graphes, suites et limites.

Pour aller plus loin, juste au delà des programmes de terminale et du lycée, les chaînes de Markov à temps continu permettent de modéliser des phénomènes dans lesquelles l'évolution n'est plus discrète (modélisée à l'aide de suite: étape 1, étape 2, … étape n, …) mais se fait à temps continu (pour tout t réel).
Dans cette variante des chaînes de Markov se mêlent alors aussi les fonctions (dont l'exponentielle), des probabilités continues, des intégrales. On modélise ainsi par exemple les phénomènes de file d'attente.

Échauffements, exercices & rappels

Exercice 1: Problème des 7 ponts de Königsberg

Le problème suivant, connu comme le problème des 7 ponts de Königsberg, fut résolu par Euler en 1735. Ce problème est de nos jours largement connu comme étant à l'origine de la théorie des graphes.
La ville de Königsberg (aujourd'hui Kaliningrad) est traversée par la rivière Pregolya, et comporte deux iles. Ces iles sont reliées entre elles et aux berges par, au total, 7 ponts.
Le problème est alors le suivant: est-il possible de se promener dans cette ville en passant une, et une seule, fois par tous les ponts ? Est-il possible de le faire à partir d'un point de départ au choix et de revenir finalement à son point de départ ? (bien sûr, on ne peut traverser la rivière qu'en empruntant un pont).

Correction

Ce problème historique est pris comme départ de la théorie des graphes.
On le trouve abondamment cité et documenté.
Voir là par exemple.

Exercice 2: arbre de probabilités

On considère une expérience aléatoire modélisée par l'arbre ci-contre.

Compléter cet arbre.
Déterminer P (A∩B) et P(B).
Déterminer P_A(B) et P_B(A).

Correction

(Re)Voir les cours: Arbres et formules classiques de probabilités et Probabilités conditionnelles, indépendance et arbre de probabilité.

P (A∩B) = 0,6×0,3 = 0,18
et d'après la formule des probabilités totales,
P(B) = 0,6×0,3 + 0,4×0,1 = 0,22
P_A(B) = P (A∩B)/P(A) = 0,18/0,6 = 0,3
et
P_B(A) = P (A∩B)/P(B) = 0,18/0,22 ≃ 0,818

Exercice 3: système matriciel

Écrire le système suivant sous forme matriciel: 2x + y = 8 −3x + 4y = −1 puis le résoudre matriciellement.

Exercice 4: suite arithmético-géométrique

Soit la suite (u_n) définie par u₀=7 puis par

u_n+1 = 0,5u_n+2

pour tout entier n.

Vers quelle limite l la suite (u_n) peut-elle éventuellement converger ?
On pose v_n = u_n − 4.
Montrer que (v_n) est une suite géométrique dont on précisera la raison.
Exprimer alors v_n en fonction de n, puis u_n en fonction de n.
Quelle est la limite de (u_n) ?

Exercice 5

Le glucose admet deux isomères (deux composés qui ont la même formule d'ensemble, mais un agencement différent des atomes dans la molécule et donc des propriétés différentes), le dextrose (qui est dextrogyre, c'est-à-dire qui a la propriété de dévier vers la gauche la lumière), et le lévulose (qui est lévogyre, c'est-à-dire qui dévie la lumière vers la droite).
Dans une certaine réaction chimique, dite de Pierre Landin, une partie du dextrose se transforme en lévulose et vice-versa. Plus précisément, au cours d'une unité de temps, 60% des molécules de dextrose se transforment en lévulose et les 40% restant demeurent sous forme dextrose, tandis que 35% des molécules de lévulose restent sous forme lévulose et que les 65% autres deviennent dextrose.
On note d_n et l_n les proportions de dextrose et de lévulose au temps n dans le mélange (l'unité de temps est l'heure). On suppose qu'on a, au départ, d₀ = 1 et l₀ = 0.
On note U_n le vecteur colonne U_n = d_n l_n

Représenter l'évolution des proportions de dextrose et de levulose lors de cette réaction chimique par un graphe pondéré.
Montrer alors que la réaction se traduit par une égalité matricielle de la forme U_n+1 = AU_n où A est une matrice 2x2 à préciser. En déduire qu'on a U_n = AⁿU₀
Calculer U₁, U₂, U₃ et interpréter les résultats en termes de proportions de chaque composant.
À l'aide de la calculatrice, calculer Aⁿ pour n = 10, n = 20, n = 30.
Que constate-t-on ? Qu'en déduit-on pour les proportions de dextrose et de lévulose ?
On pose B = 0,520,52 0,480,48
1. Calculer B², B³, …, Bⁿ
2. Calculer C = 4(B−A), puis C², C³, …, Cⁿ.
3. Calculer BC et CB.
4. Déduire de ce qui précède la formule
  Aⁿ = 0,52+0,48(−0,25)ⁿ0,52(1−(−0,25)ⁿ) 0,48(1−(−0,25)ⁿ)0,48+0,52(−0,25)ⁿ
5. Calculer enfin d_n et l_n en fonction de n, et en déduire leurs limites lorsque n tend vers l'infini.

Graphes

Définitions - Terminologie des graphes

Définitions: Vocabulaire sur les graphes

Un graphe d'ordre n est un ensemble de n points, appelés sommets, relié entre eux par des liens.
Le graphe peut être non orienté, les liens reliant deux sommets se schématisent par un trait, ou arête.
Le graphe peut aussi être orienté, les liens se schématisent alors par une flèche, aussi appelé arc.
Dans ce cas un sommet peut aussi être relié à lui-même par une boucle.
Deux sommets sont adjacents s'ils sont reliés par une arête ou un arc.
Un sommet adjacent à aucun autre est dit isolé.
Le degré d'un sommet est le nombre d'arêtes ou d'arcs dont ce sommet est une extrémité (une boucle comptant pour 2)
Un graphe est complet si tous les sommets sont adjacents entre eux.

Exercice 6

Compléter:

Un graphe non orienté d'ordre … :

Sommet A B C D E

Degré 2
Un graphe orienté d'ordre … :

Sommet A B C D E

Degré 3

C'est un graphe non orienté d'ordre 5 et

Sommet A B C D E

Degré 2 3 2 1 0
C'est un graphe orienté d'ordre 5 et

Sommet A B C D E

Degré 3 4 3 1 1

Propriété

Dans un graphe, la somme des degrés de chaque sommet est égale au double du nombre d'arêtes

Définitions: Parcours dans un graphe

Une chaîne de longueur n est une liste de n sommets telle que chaque sommet de la liste soit adjacent au suivant.
Un graphe est connexe s'il existe une chaîne entre deux sommets quelconques de ce graphe.
Pour un graphe orienté, on distingue:
- fortement connexe: pour tout couple de sommets A et B, il existe un chemin de A à B et de B à A.
- faiblement connexe: si le graphe est connexe sans considérer l'orientation des arcs.
Une chaîne est fermée lorsque l'origine et l'extrémité sont confondues.
Une chaîne fermée composée d'arêtes toutes distinctes s'appelle un cycle.

Exemples:
Dans le 1^er graphe de l'exercice précédent, A-B-C et A-B-D-B-C sont des chaînes de longueurs 3 et 4.
C-B-D-B-A-C est une chaîne fermée.
A-B-C-A est un cycle de longueur 4.

Matrice d'adjacence

Définition: Matrices d'adjacence

À tout graphe G d'ordre n on associe une matrice carrée M = (m_i,j) telle que m_i,j = 1 si une arête ou un arc relie les sommets i et j, et m_i,j = 0 sinon.
Cette matrice s'appelle la matrice d'adjacence du graphe G.

Exercice 7

Compléter les matrices d'adjacence:

M = 011.. 10... ..000 ..... .....
M = ...00 .01.. 010.. ..... 0....

M = 01100 10110 11000 01000 00000
M = 11000 00110 01001 00000 00000

Théorème: Nombre de chemin de longueur p

Soit un graphe G de matrice d'adjacence M = (m_i,j).
On note M^p = ( m_i,j^(p) ). Le coefficient m_i,j^(p) de la matrice M^p est le nombre de chemins de longueur p reliant le sommet i au sommet j.

Exercice 8

Avec le graphe précédent,

dont la matrice d'adjacence est:

M = 11000 00110 01001 00000 00000

On a
M² = 11110 01001 00110 00000 00000

Il y a par exemple … chemin(s) de longueur … reliant B à B.
Il y a par exemple … chemin(s) de longueur … reliant B à D.
Calculer M³.
Il y a ici par exemple … chemins de longueur … reliant A à B.
M⁷ = 14333 00110 01001 00000 00000
Il y a ici par exemple … chemins de longueur … reliant A à E.

Il y a par exemple 1 chemin(s) de longueur 2 reliant B à B.
Il y a par exemple 0 chemin(s) de longueur 2 reliant B à D.
M³ = 12111 00110 01001 00000 00000

Il y a par 2 chemins de longueur 3 reliant A à B.
Il y a ici par exemple 3 chemins de longueur 7 reliant A à E.

Exercice 9

Les arêtes du graphe suivnat représentent des pistes de ski mesurant chacune 2km. Les sommets de ce graphes sont les différents points d'accès à ce domaine skiable.

Donner la matrice d'adjacence du graphe.
Déterminer le nombre de parcours de 4 km reliant A à C.
Déterminer le nombre de parcours de 6 km reliant C à lui-même.
Déterminer le nombre de parcours de 6 km reliant A à D.
Déterminer le nombre de parcours d'au plus 8 km reliant A à D.

La matrice d'adjacence du graphe est M = 1010 0011 1100 0010
Pour compter le nombre de parcours de 4 km, donc en 2 arêtes, on utilise la matrice M² = 0021 1110 0112 1100 Dans cette matrice, on trouve qu'on a 2 chemins de longueur 2, donc de 4 km, reliant A à C.
Pour 6 km, donc des chemins de longueur 3, dans la matrice on calcule la matrice M³ = 2210 1212 1131 0112 On a là 3 chemins fermés de longueur 3, donc 6 km.
Pour 6 km, donc des chemins de longueur 3, on a dans la matrice M³, on n'a aucun chemin reliant A à D.
Il faut ajouter là les nombres de chemin dans les matrices M, M², M³ et M⁴, reliant A à D.
On calcule donc M⁴ = 1324 1243 3422 1131
Il y a en tout: 0+1+0+4 = 5 chemins de longueur inférieure à 8 km

Graphe pondéré

Définition: Graphe pondéré

Un graphe, orienté ou non, est pondéré lorsque chacune des arêtes est affectée d'un poids: un nombre positif.

Exemple:

La chaîne A-B-C-B-D est une chaîne de poids 1+12+9+7 = 29

Exercice 10: Voyageur de commerce

On s'intéresse au problème dit "du voyageur de commerce": dans un ensemble de villes, trouver le plus court circuit passant par chaque ville une seule fois.

On considère dans un premier temps un graphe complet de 5 villes: A, B, C, D et E.
1. On exclut dans un premier temps le sommet E et on ne considère donc que le sous-graphe constitué des sommets A, B, C et D.
  Combien existe-t-il de chaînes fermées débutant et terminant en A, et ne passant qu'une seule fois par chaque autre sommet ?
  Comment trouver l'itinéraire le plus court ?
2. Même question en prenant aussi en compte le sommet E.
3. Combien de chaînes fermées peut-on faire en tout, en partant d'un sommet quelconque et terminant sur ce même sommet ?
Combien de chaînes fermées peut-on faire dans un graphe complet avec 10 sommets (10 villes) ? 20 sommets ? 30 sommets ? 50 sommets ? 100 sommets ?
En admettant que le calcul du poids total (ou distance totale) nécessite 1μs pour chaque itinéraire, quel est le temps de calcul nécessaire pour le calcul de tous les itinéraires possibles avec 10 sommets ? 20 sommets ? 30 sommets ? 50 sommets ?

1. On peut s'aider d'un arbre.
  On part de A. Ensuite on a 3 possibilités: B, C ou D. À chacune de ces 3 possibilités, il en reste après 2, les deux villes restantes.
  Enfin il ne reste après plus qu'une ville à parcourir avant de revenir en A.
  En tout, il y a 3×2×1 = 6 possibilités.
  
  Pour trouver l'itinéraire le plus court, il suffit de calculer le poids (ou la longueur) de ces 6 possibilités, et de choisir la plus courte.
2. Avec aussi le sommet E, on a tout d'abord, après A, 4 villes possibles: B, C, D ou E.
  À la 2^ème ville, il reste alors 3 possibilités pour le choix de la 3^ème ville.
  Enfin à la 3^ème ville, il ne reste plus que 2 possibilités pour le choix de la 4^ème ville.
  Enfin, la dernière ville à visiter avant de revenir en A s'impose d'elle-même.
  En tout il y a donc 4×3×2×1 = 24 possibilités.
3. Si le sommet de départ est quelconque, on a alors 5 possibilités pour le choisir: A, B, C, D ou E.
  Une fois ce sommet de départ (et d'arrivé) choisi, on est de retour au calcul de la question précédente: pour chaque sommet =possible de départ, il y a ensuite 24 possibilités.
  En tout il y a donc 5×24 = 120 possibilités pour 5 sommets (5 villes).
De même, dans un graphe complet avec 12 sommets, on peut construire
10! = 10×9×…×2×1 = 3 628 800
chemins fermés différents.
Avec 20 sommets, on peut construire
20! = 20×19×…×2×1 ≃ 2,4 10¹⁸
chemins fermés différents, soit environ 2 milliards de milliards de chemins.
Avec 30 sommets, on peut construire
30! = 30×29×…×2×1 ≃ 2,6 10³²
chemins fermés différents, soit environ 200 000 milliards de milliards de milliards de chemins
Avec 50 sommets, on en a
50! = 50×49×…×2×1 ≃ 3 10⁶⁴
et enfin (pour les calculatrices capables de le calculer) pour 100 sommets
100! = 100×99×…×2×1 ≃ 10¹⁵⁸
On a 1μs = 10⁻⁶s et donc:
- pour 10 sommets, un temps de
  3 628 800×10⁻⁶s ≃ 3,6s
- pour 20 sommets, un temps de
  2,4 10¹⁸×10⁻⁶s = 2,4 10¹²s
  soit, en convertissant en unités de temps plus parlantes, un temps de
  2,4 10¹²/3600×24×365≃76 000 ans
- pour 30 sommets, un temps de
  2,6 10³²×10⁻⁶/3600×24×365≃8 10¹⁸ ans
  soit environ 8 milliards de milliards d'années !! … pour seulements 30 villes …

Le calcul de l'itinéraire le plus court, pour un nombre important de sommets ne peut donc clairement pas se faire par une liste exhaustive de tous les itinéraires.
Dans ces graphes pondérés, l'algorithme de Moore-Dijkstra permet de déterminer la chaîne la plus courte reliant deux sommets de manière efficace.
Il permet de passer du O(n!) à du O(nln(n)).

Chaînes de Markov

Graphe probabiliste

Définition: Graphe probabiliste

Un graphe probabiliste est un graphe orienté et pondéré tel que:

Tous les poids sont positifs et inférieurs à 1: ce sont des probabilités
La somme des poids des chemins issus de chaque sommet est égale à 1.

La matrice d'adjacence d'un graphe probabiliste est une matrice stochastique: une matrice carrée avec des coefficients positifs dont la somme à chaque ligne est égale à 1.

Exercice 11

Compléter la matrice d'adjacence M = 0,20,8. ... .0,4. du graphe suivant et vérifier qu'il s'agit d'une matrice stochastique.
Un arbre pondéré peut être vu comme un graphe probabiliste, avec par exemple deux événements A et B, donc 4 états A, A, B et B:

qui peut se représenter sous la forme:

Donner les probabilités P_A(B), P(B), P_B(A), P_B(A), P_B(A) et P_B(A) et compléter les probabilités sur l'arbre inversé:

Compléter alors finalement le graphe orienté complet et en donner la matrice d'adjacence:

Chaîne de Markov

Définition: Chaîne de Markov

Une chaîne de Markov est une suite de variables aléatoires (X_n) définies sur un même espace fini muni d'une probabilité et à valeur dans un ensemble E appelé espace d'états et vérifiant

P_{(X₀=e₀, X₁=e₁, … , X_n=e_n)} (X_n+1=e_n+1) = P_{(X_n=e_n)} (X_n+1=e_n+1)

En d'autres termes, la situation du système à l'instant n+1 ne dépend que de sa situation à l'instant n, et aucunement des situations antérieures X₀, X₁, … , X_n−1.

Exemples:

On considère une urne contenant 10 boules noires et 10 boules blanches dans laquelle on effectue successivement des tirages de la manière suivante: on tire tout d'abord une boule, puis au 2ème tirage on tire une autre boule et on remet celle tirée au 1er tirage. Au 3ème tirage on tire une boule et on remet celle tirée au 2ème, ...

On note X_n la variable aléatoire égale à la couleur de la boule tirée au n-ième tirage. L'espace d'états est E = { "noire", "blanche" }
Météo probabiliste simpliste: un jour donné il peut faire beau, mauvais ou un temps variable.
Lorsqu'un jour il fait beau, il y a une chance sur deux pour qu'il fasse encore beau le lendemain, et une chance sur dix qu'il fasse mauvais.
S'il fait mauvais un jour, il y a aussi une chance sur deux pour que cela continue le lendemain, et une chance sur dix pour qu'il fasse beau.
Enfin, lorsque le temps est variable un jour, il y a une chance sur cinq pour que le temps reste variable le lendemain, et autant de chance qu'il fasse beau ou mauvais.
On note X_n la variable aléatoire égale au temps qu'il fait le n-ième jour.
L'espace d'états est E = { "beau", "variable", "mauvais" }

On peut préciser un ensemble particulier et courant de chaîne de Markov:

Définition: Chaîne de Markov homogène

Une chaîne de Markov est dite homogène si, de plus, les probabilités P_{(X_n=i)}(X_n+1=j) ne dépendent pas de n.
On note alors p_i,j cette probabilité, et la matrice P = (p_i,j) est appelée matrice de transition de la chaîne de Markov.

Remarque: Avec une modélisation par une chaîne homogène, la probabilité de passage à l'état j ne dépend donc que de l'état présent du système.
En particulier, P_{(X_n=j)}(X_n+1=j) = P_(X₀=j)(X₁=i)

Propriété

La matrice de transition P = (p_i,j) d'une chaîne de Markov homogène est une matrice stochastique.
À une matrice d’une chaîne de Markov homogène, on peut associer un graphe probabiliste dont les sommets sont les états de l'espace d'état E et les arcs reliant l'état i à l'état j sont affectés des coefficients p_i,j.

Propriété

On considère une chaîne de Markov homogène (X_n) dont on note P la matrice de transition associée et π₀ la distribution initiale.

Si on note Pⁿ = (p_i,j⁽ⁿ⁾) alors on a
p_i,j⁽ⁿ⁾ = P_(X₀=i)(X_n=j)
En notant π_n la distribution de X_n, on a alors, pour tout entier n,
π_n+1 = π_nP
et donc, avec π₀ la distribution initiale,
π_n = π₀Pⁿ

Remarque: Une chaîne de Markov homogène est donc entièrement déterminée par sa distribution initiale et par sa matrice de transition

Exercice 12

On considère une chaîne de Markov à trois états A, B et C, dont la matrice de transition est P = 0,200,8 0,10,30,6 0,50,50 .
La distribution initiale est π₀ = (0,5 0,5 0).

Donner les valeurs des probabilités P(X₀=A), P(X₀=C), P(X₁=A) et P(X₂=C).
Exprimer π_n en fonction de π₀ et P.

On a directement dans la matrice P(X₀=A)= 0,5 et P(X₀=C)= 0.
Pour les probabilités de X₁, on calcule la distribution π₁ = π₀P soit
π₁ = (0,5 0,5 0) 0,200,8 0,10,30,6 0,50,50 = (0,15 0,15 0,7)
et donc P(X₁=A)= 0,15.
De même pour X₂, on calcule la distribution
π₂ = π₁P = (0,395 0,395 0,21)
et on y trouve donc que P(X₂=C)= 0,21.

Exercice 13

Dans une université, les étudiants participent à un mouvement de grève.
Le premier jour, 20% des étudiants faisaient grève.

On note X_n la variable aléatoire qui indique si un étudiant désigné au hasard dans l'université fait grève ou non le n-ième jour.
On admet que la suite (X_n) est une chaîne de Markov dont la matrice de transition est

P= 0,70,3 0,330,67

dans l'ordre grèviste, non grèviste. On note enfin π_n la distribution le n-ième jour.

Quelle est la probabilité qu'un étudiant qui fait grève un jour donné ne fasse plus grève le lendemain ? Quelle est la probabilité qu'un non grèviste un jour le reste le lendemain ?
Donner π₀, π₁, et π₂.
Donner la probabilité qu'un étudiant soit en grève le 3ème jour.

La probabilité qu'un étudiant qui fait grève un jour donné ne fasse plus grève le lendemain est de 0,3, et celle qu'un non grèviste un jour le reste le lendemain est de 0,67
D'après l'énoncé, on a directement
π₀ = (0,2 0,8)

On calcule ensuite la distribution π₁ = π₀P = (0,404 0,596) puis π₂ = π₁P ≃ (0,48 0,52)
π₀ est la distribution pour le 1er jour, π₁ est la distribution pour le 2ème jour, et donc π₂ est la distribution pour le 3ème jour, et donc, d'après le résultat précédent, la probabilité qu'un étudiant soit en grève le 3ème jour est de 0,48.

Distribution invariante

Définition: Distribution invariante d'une chaîne de Markov

Soit une chaîne de Markov homogène (X_n) de matrice de transition P.
Une distribution invariante est une matrice ligne π telle que: π P = π.

On parle aussi d'état stable de la chaîne de Markov.

Remarque: On a π P = π ⇔ π(I_n−P) = 0 avec I_n la matrice identité.
Le vecteur ligne nul est toujours solution de cette équation matricielle, mais le vecteur ligne n'est pas une distribution de probabilité (la somme de ses élements ne vaut pas 1).
Ainsi, si la matrice I_n−P est inversible, le système π(I_n−P)=0 admet une unique solution, qui est donc le vecteur nul, et il n'existe donc pas de distribution invariante.
Les distribution invariantes sont donc à rechercher lorsque la matrice I_n−P n'est pas inversible.

Exemple: Soit P = 01 10
On a alors I₂−P = 1−1 −11 dont le déterminant vaut

det(I₂−P) = 1×1−(−1)×(−1) = 0

Ainsi le système πP = π ⇔ π(I₂−P) = 0 n'admet pas qu'une unique solution (pas que la solution nulle).
On vérifie que π = 1/2 1/2 est une distribution invariante.

Exercice 14

Trouver deux nombres réels strictement positifs x et y tels que x+y = 1 et solutions du système: 2/3x + 1/6y = x 1/3x + 5/6y = y
En déduire une distribution invariante de la chaîne de Markov définie par la matrice de transition P = 2/31/6 1/35/6

En mettant tout du même côté, on a −1/3x + 1/6y = 0 1/3x − 1/6y = 0 Ces deux équations sont équivalentes (l'opposée l'une de l'autre), et on a donc
1/3x −1/6y = 0 ⇔ 2x = y
On a alors
x+y=1 ⇔ 2x+x=1 ⇔ x = 1/3
puis
x+y=1 ⇔ y = 1−x = 2/3
Une distribution π = (x y) vérifie x+y=1 et de plus invariable donc π=πP.
La solution est donc celle trouvée précédemment.

Exercice 15

On considère une chaîne de Markov dont la matrice de transition est P = 0,40,6 0,90,1
Déterminer une distribution π invariante.

On a π = (x y), avec x+y = 1 et πP = π, soit le système d'équations 0,4x + 0,9y = x 0,6x + 0,1y = y soit aussi −0,6x + 0,9y = 0 0,6x − 0,9y = 0
On a deux équations équivalentes, et qui donnent x = 0,9/0,6y = 3/2y et, comme x+y =1 on a aussi

3/2y+y = 5/2y = 1

d'où y = 2/5 et alors

x = 1−y = 3/5

Ainsi, une distribution invariante est

π = (0,6 0,4)

Les distributions invariantes sont importantes dans l'étude d'une chaîne de Markov, en raison du théorème suivant:

Propriété

Soit (X_n) une chaîne de Markov homogène et (π_n) la suite de ses distributions, alors si (π_n) converge, (π_n) converge vers une distribution invariante (théorème du point fixe pour les suites récurrentes).

Pour une chaîne de Markov à deux états, quelque soit la distribution initiales π₀, la suite (π_n) des distributions converge vers la distribution invariante π.

Exercice 16

On considère une chaîne de Markov (X_n) décrite par le graphe suivant et la distribution initiale π₀ = (1 0).

Écrire la matrice de transition $M$ associée à cette chaîne de Markov.
Calculer π₁ et π₂.
Donner l'expression de π_n en fonction de n, puis calculer π₅ et π₁₀ (à l'aide de la calculatrice, un ordinateur, ...)
Montrer que (X_n) admet une distribution invariante π_l et la déterminer.

ddd

Exercice 17

On considère une chaîne de Markov à deux états A et B dans laquelle P_A(B) = P_B(A), avec P_B(A) différent de 0 et de 1.
Montrer qu'à long terme, et quelque soit la distribution de probabilité initiale, les deux états sont équiprobables.

Exercices

Exercice 18

Les célèbres Dalton sont à l'heure actuelle en prison.
Chaque semaine, ils tentent de s'évader et leur tentative est une réussite une fois sur trois. Une fois évadés, ils ont chaque semaine trois chance sur quatre de se faire capturer.

Modéliser cette situation par une chaîne de Markov à deux états.
On notera L l'état "les Dalton sont libre" et P l'état "les Dalton sont en prison".
Déterminer alors la probabilité qu'ils soient libre dans trois semaines.
Quelle est la probabilité qu'ils purgent la totalité de leur peine d'un mois de prison (quatre semaines) sans avoir réussi à s'évader une seule fois ?

Exercice 19 (D'après Bac ES, Liban 2018)

Dans un pays deux opérateurs se partagent le marché des télécommunications mobiles. Une étude révèle que chaque année:

parmi les clients de l'opérateur EfficaceRéseau, 70% se réabonnent à ce même opérateur et 30% souscrivent un contrat avec l'opérateur GenialPhone;
parmi les clients de l'opérateur GenialPhone, 55% se réabonnent à ce même opérateur et 45% souscrivent un contrat avec l'opérateur Efficaceréseau.

On note E l'état: "la personne possède un contrat chez l'opérateur EfficaceRéseau" et G l'état: "la personne possède un contrat chez l'opérateur GenialPhone".
À partir de 2018, on choisit au hasard un client de l'un des deux opérateurs.

On note également:

e_n la probabilité que le client possède un contrat avec l'opérateur EfficaceRéseau au 1^ier janvier (2018+n);
g_n la probabilité que le client possède un contrat avec l'opérateur GenialPhone au 1^ier janvier (2018+n);
P_n = (e_n &nsbp; g_n) désigne la matrice ligne traduisant l'état probabiliste du système au 1^ier janvier (2018+n)

Au 1er janvier 2018, on suppose que 10% des clients possèdent un contrat chez EfficaceRéseau, ainsi P₀ = (0,1 0,9).

Représenter cette situation par un graphe probabiliste de sommets E et G.
1. Déterminer la matrice de transition M associée au graphe en rangeant les sommets dans l'ordre alphabétique.
2. Vérifier qu'au 1^ier janvier 2020, environ 57% des clients ont un contrat avec l'opérateur EfficaceRéseau.
1. On rappelle que pour tout entier naturel n, P_n+1 = P_n×M.
  Exprimer e_n+1 en fonction de e_n et g_n.
2. En déduire que pour tout entier naturel n, e_n+1 = 0,25 e_n + 0,45
Déterminer l'état stable du système et interpréter votre réponse dans le contexte de l'exercice.

\begin{enumerate} \item On représente cette situation par un graphe probabiliste de sommets $E$ et $G$: \[\psset{unit=1cm} \begin{pspicture}(-4.5,-0.8)(6,1.2) \Rnode{C}{$E$} \hskip 4cm \Rnode{T}{$G$}%définition des sommets \psset{nodesep=4pt,arcangle=15,arrowsize=2pt 3}% paramètres \ncarc{->}{C}{T} \Aput{0,30}% arc \ncarc{->}{T}{C} \Aput{0,45}% arc \nccircle[angleA=90]{->}{C}{4mm} \Bput{0,70}% boucle \nccircle[angleA=-90]{<-}{T}{.4cm} \Bput{0,55}% boucle \end{pspicture}\] \item \begin{enumerate} \item La matrice de transition est: $M = \begin{pmatrix} 0,70&0,30\\0,45&0,55\end{pmatrix}$. \item $P_2 = P_0 \times M^2 = (0,56875\quad 0,43125)$ donc $e_2\approx 0,57$ soit 57\,\%. \end{enumerate} \item \begin{enumerate} \item On rappelle que $P_{n+1} = P_n\times M$. Donc pour tout entier naturel $n$,\\ $(e_{n+1}\quad g_{n+1})= (e_{n}\quad g_{n}) \times \begin{pmatrix} 0,70&0,30\\0,45&0,55\end{pmatrix} = (0,70\times e_n+0,45\times g_n \quad 0,30\times e_n+0,55 \times g_n)$. Donc $e_{n+1}=0,70e_n+0,45g_n$. \item Pour tout entier naturel $n$, $e_n+g_n=1$ donc $g_n=1-e_n$.\\ Donc $e_{n+1}=0,70e_n+0,45(1-e_n)$ et donc $e_{n+1}=0,25e_n+0,45$. \end{enumerate} \item Pour trouver l'état stable $\begin{pmatrix} e & g \end{pmatrix}$ il suffit de résoudre le système d'équations:\\ $\left\{ \begin{array}{lc r} e&=&0,25e+0,45 \\ e+g &=& 1 \end{array}\right.$ La première équation donne : $0,75 e=0,45$ donc $e=\dfrac{0,45}{0,75}=0,6$. Donc $g=1-e=0,4$. L'état stable est donc $P = \begin{pmatrix} 0,6 & 0,4 \end{pmatrix}$. Ceci signifie qu'à partir d'un certain nombre d'années la part de marché de l'opérateur \emph{EfficaceRéseau} sera de 60\,\%. \end{enumerate}

Exercice 20: Marche aléatoire

Marche aléatoire} Un robot se déplace unidirectionnellement, vers la droite ou vers la gauche, au hasard et avec la même probabilité.
Il peut se trouver en trois position, A, B ou C et est bloqué par un mur sur la gauche de A. Depuis A, il peut donc, avec la même probabilité, se déplacer en B ou rebondir contre le mur et se retrouver à nouveau en A.
En C, le robot à chuté et ne peut, bien sûr, plus aller ailleurs qu'en C.

Le robot est initialement en A.
Quelle est la probabilité qu'il ait chuté après 3 déplacements ? après 5 déplacements ? après 10 déplacements ?

On a une chaîne de Markov à 3 états A, B et C, et de matrice de transition

P = 0,50,50 0,500,5 001

On calcule alors

P³ ≃ 0,04690,03120,0781 0,031250,0156250,265625 001

puis

P⁵ ≃ 0,00780,00490,089 0,00490,00290,271 001

et enfin

P¹⁰ ≃ 5.10⁻⁶5.10⁻⁵9.10⁻² 5.10⁻⁵3.10⁻⁵0,273 001

En partant de A, la probabilité qu'il arrive en C (c'est-à-dire chute) au bout de 3 déplacements est environ 0,0781.
La probabilité qu'il chute après 5 déplacements est d'environ 0,089, et après 10 déplacements d'environ 0,09.

Voir aussi:

Sommet	A	B	C	D	E
Degré	2

Sommet	A	B	C	D	E
Degré	3

Sommet	A	B	C	D	E
Degré	2	3	2	1	0

Sommet	A	B	C	D	E
Degré	3	4	3	1	1