2.1 Probabilité conditionnelle

Le concept de probabilité conditionnelle formalise l'idée que la probabilité d'un événement puisse être conditionnée par l'information qu'un autre événement s'est réalisé. Par exemple, supposons qu'on cherche à déterminer la langue maternelle X d'un citoyen helvétique tiré au hasard. On dispose pour cela d'un modèle, mettons P(a) = P(X = a) = 0.45, P(f) = 0.35, P(i) = 0.15, et P(r) = 0.05 (a = "allemand", f = "français", i = "italien", r = "romanche"). Le pari le plus sûr serait donc d'affirmer que notre homme parle allemand.

Si on possède une information complémentaire, comme par exemple la région d'origine Y (à choisir parmi les modalités suivantes: A = "Suisse alémanique", R = "Suisse romande", T = "Tessin", G = "Grisons"), la situation peut être très différente. Typiquement, la probabilité qu'un Suisse parle français n'est pas la même selon sa région d'origine - elle ne l'est que si les deux variables (langue et région d'origine) sont indépendantes.

Considérons un cas particulier: comment évaluer la probabilité conditionnelle P(a|R) qu'un Suisse parle allemand étant donné qu'il est originaire de Suisse romande ? Nous savons déjà qu'un Suisse a P(a) = 45% de chances de parler allemand. Supposons qu'on connaisse encore la probabilité P(R) qu'il soit originaire de Suisse romande et la probabilité jointe P(R,a) qu'il parle allemand et soit originaire de Suisse romande. Cette dernière quantité fait partie d'une distribution de 4*4 paires de modalités: P(A,a), P(A,f), P(A,i), P(A,r), P(R,a), P(R,f), ..., P(G,i), P(G,r). Nous pouvons représenter graphiquement ces informations comme sur la figure 1.

Figure 1 : Représentation ensembliste des probabilités P(R), P(a) et P(R,a).

Sur la figure, représente le référentiel, ici la population helvétique. R et a représentent l'ensemble des Suisses originaires de Suisse romande et celui des Suisses germanophones respectivement. R a dénote l'intersection de R et a, soit l'ensemble des germanophones originaires de Romandie. De façon générale, on a:

                        (6)

Dans notre exemple, la probabilité conditionnelle P(a|R) qu'un Suisse parle allemand étant donné qu'il est originaire de Suisse romande est égale à la la probabilité jointe P(R,a) qu'il parle allemand et soit originaire de Suisse romande, rapportée à celle P(R) qu'il soit originaire de Suisse romande.

En fait, en passant d'une distribution simple à une distribution conditionnelle, on change de référentiel. L'espace des possibilités n'est plus mais R, et c'est ce que traduit sa position de diviseur dans (6). Dans R, l'événement X = a dont on cherche à évaluer la probabilité se trouve correspondre à l'événement joint X = a, Y = R dans , comme le montre la figure 1.

Naturellement, on a également P(Y|X) = P(X Y) / P(X), d'où la formule symétrique:

    (7)

En combinant (6) et (7), nous obtenons la formule de Bayes:

                        (8)

Nous reviendrons ultérieurement sur ces deux résultats.


Recherche:
 dans ce site:
   
   
   
 Rechercher
Annuaires      Site map

Anthropole - CH-1015 Lausanne  - Suisse  -  Tél. +41 21 692 29 73  -  Fax  +41 21 692 29 15