2.2 Probabilités de transition et chaînes de Markov
Dans le cadre de la statistique textuelle, la probabilité conditionnelle est souvent utilisée de manière un peu différente. Plutôt que d'étudier le rapport entre deux variables X et Y, on cherche à caractériser la relation entre les états (symboles) consécutifs d'une seule variable X. On parlera alors de probabilité de transition d'un symbole vers un autre:
(9)
où ai, aj
A, et Xt représente l'état du système au temps t. Pour donner un exemple concret, considérons à nouveau la série (5). Supposons qu'on cherche à prédire le prochain symbole, étant donné que le symbole actuel est un a. Par (6) et (7), on a: p(a
a) = P(Xt+1 = a | Xt = a) = P(aa) / P(a) = 0.17 / 0.19 = 0.89 (voir solutions de l'exercice 1.2) et p(ab) = 0.11. Comme on pouvait s'y attendre, on a:
(10)
On appelle chaîne de Markov d'ordre 1 le modèle défini par une matrice de transition P de composantes Pij = p(ai
aj). En généralisant, on peut construire des modèles d'ordre k
1 avec Pij = p(wi
aj) et wi
Ak.


