Théorème de Moivre-Laplace

Une planche de Galton illustre le fait que la loi binomiale tende vers la loi normale.

En théorie des probabilités, selon le théorème de Moivre-Laplace, si la variable X n {\displaystyle X_{n}} suit une loi binomiale d'ordre n {\displaystyle n} et de paramètre p ] 0 , 1 [ {\displaystyle p\in ]0,1[} , alors la variable

Z n = X n n p n p ( 1 p ) {\displaystyle Z_{n}={\frac {X_{n}-np}{\sqrt {np(1-p)}}}}

converge en loi vers une loi normale centrée et réduite N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} .

Abraham de Moivre fut le premier à établir ce théorème en 1733 dans le cas particulier : p = 1 2 {\displaystyle p={\frac {1}{2}}}  ; et Laplace a pu le généraliser en 1812 pour toute valeur de p {\displaystyle p} comprise entre 0 et 1. Il s'agit d'un cas particulier du théorème central limite.

Démonstration

La démonstration repose sur l'identification de la loi limite par l'étude des fonctions caractéristiques des variables binomiales.

Démonstration du théorème de Moivre-Laplace

Soit X n {\displaystyle X_{n}} une suite de variables binomiales X n B ( n , p ) {\displaystyle X_{n}\sim {\mathcal {B}}(n,\,p)} .

La fonction caractéristique de X n {\displaystyle X_{n}} est :

φ X n ( t ) = ( p e i t + q ) n {\displaystyle \varphi _{X_{n}}(t)=\left(p\mathrm {e} ^{\mathrm {i} t}+q\right)^{n}}
Celle de Z n = X n n p n p q {\displaystyle Z_{n}={\frac {X_{n}-np}{\sqrt {npq}}}} est :
φ Z n ( t ) = ( p e i t n p q + q ) n e i t n p n p q {\displaystyle \varphi _{Z_{n}}(t)=(p\mathrm {e} ^{\frac {\mathrm {i} t}{\sqrt {npq}}}+q)^{n}\mathrm {e} ^{\frac {-\mathrm {i} tnp}{\sqrt {npq}}}}

Calculons le logarithme de cette fonction :

ln φ Z n ( t ) = n ln [ ( p e i t n p q + q ) ] i t n p n p q = n ln [ ( p ( e i t n p q 1 ) + 1 ) ] i t n p n p q {\displaystyle \ln \varphi _{Z_{n}}(t)=n\ln \left[(p\mathrm {e} ^{\frac {\mathrm {i} t}{\sqrt {npq}}}+q)\right]-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}=n\ln \left[(p(\mathrm {e} ^{\frac {\mathrm {i} t}{\sqrt {npq}}}-1)+1)\right]-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}} .

On développe l'exponentielle au 2e ordre, il vient :

ln φ Z n ( t ) n ln [ 1 + p ( i t n p q t 2 2 n p q ) ] i t n p n p q {\displaystyle \ln \varphi _{Z_{n}}(t)\approx n\ln \left[1+p\left({\frac {\mathrm {i} t}{\sqrt {npq}}}-{\frac {t^{2}}{2npq}}\right)\right]-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}} .

On développe ensuite le logarithme au 2e ordre, on trouve :

ln φ Z n ( t ) n ( i p t n p q p t 2 2 n p q + p 2 t 2 2 n p q ) i t n p n p q = t 2 2 q + p t 2 2 q = t 2 2 q ( p 1 ) = t 2 2 {\displaystyle \ln \varphi _{Z_{n}}(t)\approx n\left({\frac {\mathrm {i} pt}{\sqrt {npq}}}-{\frac {pt^{2}}{2npq}}+{\frac {p^{2}t^{2}}{2npq}}\right)-{\frac {\mathrm {i} tnp}{\sqrt {npq}}}=-{\frac {t^{2}}{2q}}+{\frac {pt^{2}}{2q}}={\frac {t^{2}}{2q}}(p-1)=-{\frac {t^{2}}{2}}} .

On a démontré que :

ln φ Z n ( t ) t 2 2 {\displaystyle \ln \varphi _{Z_{n}}(t)\approx {\frac {-t^{2}}{2}}}
et on déduit que
φ Z n ( t ) e t 2 2 {\displaystyle \varphi _{Z_{n}}(t)\approx \mathrm {e} ^{\frac {-t^{2}}{2}}} .

C'est la fonction caractéristique de la loi normale centrée réduite N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} .

Application

Autrement dit, si X n {\displaystyle X_{n}} suit une loi binomiale de paramètres n et p et si Φ {\displaystyle \Phi } est la fonction de répartition de N ( 0 , 1 ) {\displaystyle {\mathcal {N}}(0,1)} alors, pour tout réel t, on a :

lim n P ( X n n p n p q t ) = Φ ( t ) {\displaystyle \lim _{n\to \infty }\operatorname {P} \left({\frac {X_{n}-np}{\sqrt {npq}}}\leq t\right)=\Phi (t)}

ce qui signifie que, pour n assez grand,

P ( X n n p n p q t ) Φ ( t ) {\displaystyle \operatorname {P} \left({\frac {X_{n}-np}{\sqrt {npq}}}\leq t\right)\approx \Phi (t)}

ce qui donne, en posant t = x n p n p q {\displaystyle t={\frac {x-np}{\sqrt {npq}}}} , l'approximation suivante pour la probabilité d'avoir au plus x {\displaystyle x} succès :

P ( X n x ) Φ ( x n p n p ( 1 p ) ) {\displaystyle \operatorname {P} (X_{n}\leq x)\approx \Phi \left({\frac {x-np}{\sqrt {np(1-p)}}}\right)}

Cette approximation est bonne en général pour n p ( 1 p ) 10 {\displaystyle np(1-p)\geq 10} .

Pratiquement, il faut cependant faire attention au fait que les variables X n {\displaystyle X_{n}} sont discrètes. Graphiquement, cela se traduit par le fait que les extrémités des bâtons du diagramme de la loi binomiale X n B ( n , p ) {\displaystyle X_{n}\sim {\mathcal {B}}(n,\,p)} sont proches de la courbe de densité de la loi normale N ( n p , n p q ) {\displaystyle {\mathcal {N}}(np,npq)} . On peut obtenir une valeur approchée de P ( X n = x ) {\displaystyle \mathrm {P} (X_{n}=x)} par le calcul de la surface sous la courbe de densité comprise entre les droites d'abscisse x 1 2 {\displaystyle x-{\frac {1}{2}}} et x + 1 2 {\displaystyle x+{\frac {1}{2}}} .

P ( X n = x ) P ( x 1 2 n p n p q N x + 1 2 n p n p q ) {\displaystyle \operatorname {P} (X_{n}=x)\approx \operatorname {P} \left({\frac {x-{\frac {1}{2}}-np}{\sqrt {npq}}}\leq N\leq {\frac {x+{\frac {1}{2}}-np}{\sqrt {npq}}}\right)}
P ( X n x ) P ( N x + 1 2 n p n p q ) {\displaystyle \operatorname {P} (X_{n}\leq x)\approx \operatorname {P} \left(N\leq {\frac {x+{\frac {1}{2}}-np}{\sqrt {npq}}}\right)}

On appelle cette procédure la « correction de continuité ».

Exemple

On considère la suite de variables X n B ( 50 , 0 , 3 ) {\displaystyle X_{n}\sim {\mathcal {B}}(50,\,0{,}3)}  ; on a alors n p = 15 {\displaystyle np=15}  ; n q = 35 {\displaystyle nq=35}

D'après les tables, la valeur exacte pour P ( X n = 10 ) = 0,038 619 {\displaystyle \mathrm {P} (X_{n}=10)=0{,}038\,619} .

La formule d'approximation avec une loi N ( n p , n p q ) = N ( 15 , 10 , 5 ) {\displaystyle {\mathcal {N}}(np,{\sqrt {npq}})={\mathcal {N}}(15,{\sqrt {10{,}5}})} donne le résultat :

P ( 9 , 5 15 10 , 5 N 10 , 5 15 10 , 5 ) {\displaystyle \operatorname {P} \left({\frac {9{,}5-15}{\sqrt {10{,}5}}}\leq N\leq {\frac {10{,}5-15}{\sqrt {10{,}5}}}\right)}

soit

P ( 1 , 7 N 1 , 39 ) = P ( 1 , 39 N 1 , 7 ) = 0,955 4 0,917 7 = 0,037 7 {\displaystyle \operatorname {P} (-1{,}7\leq N\leq -1{,}39)=\operatorname {P} (1,39\leq N\leq 1{,}7)=0{,}955\,4-0{,}917\,7=0{,}037\,7}

L'erreur d'approximation est faible.

Pour P ( X n 10 ) = 0,078 9 {\displaystyle \mathrm {P} (X_{n}\leq 10)=0{,}078\,9} , l'approximation usuelle fournit

P ( N 1 , 39 ) = P ( N 1 , 39 ) = 1 P ( N 1 , 39 ) = 0,082 3 {\displaystyle \mathrm {P} (N\leq -1{,}39)=\mathrm {P} (N\geq 1{,}39)=1-\mathrm {P} (N\leq 1{,}39)=0{,}082\,3}

Sans correction de la continuité de l'approximation, on aurait :

P ( N 10 15 10 , 5 ) = P ( N 1 , 54 ) = 1 P ( N 1 , 54 ) = 0,061 8 {\displaystyle \operatorname {P} \left(N\leq {\frac {10-15}{\sqrt {10{,}5}}}\right)=\operatorname {P} (N\leq -1{,}54)=1-\operatorname {P} (N\leq 1{,}54)=0{,}061\,8}

Cette dernière valeur est assez imprécise.

Voir aussi

Bibliographie

  • Denis Lantier, Didier Trotoux, « La Loi des grands nombres : le théorème de De Moivre-Laplace », dans Contribution à une approche historique de l'enseignement des mathématiques : actes de la 6e université d'été interdisciplinaire sur l'histoire des mathématiques, Besançon, Presses universitaires de Franche-Comté/université de Franche-Comté, coll. « Les publications de l'IREM de Besançon », 1995, 490 p. (ISBN 2-909963-136 et 978-2909963136), p. 259-294 [lire en ligne] [PDF].

Articles connexes

  • icône décorative Portail des probabilités et de la statistique