Cours_Stats.dvi - C. Holtzmann

1. 6. 2. 1. 6. 3. 1. 6. 4. 1. 6. 5. 1. 6. 1. 6. O. Pk. P(X = XK). PK. > Pk = pi + p2 + ... + pn = 1. k=1. -. TDA V. 1. P(X = 0) = P(X = 1) = P(X = 2) = P(X. = 3) = >. X. PX. PX.
188KB taille 8 téléchargements 134 vues
Cours de statistiques L1 - so iologie

Deuxième semestre 2008 / 2009

Table des matières 0 Modèle des tirages : lois binomiale et hypergéométrique

1

I

Variables aléatoires dis rètes . . .

II

Tirages ave remises : loi binomiale 5

III Tirages sans remise : loi hypergéométrique . . . . . . . . . . . . . . . . . . . . . . . . . .

1

7

Chapitre 5 Modèle des tirages : lois binomiale et hypergéométrique

I

Variables aléatoires dis rètes

On onsidère une expérien e E et on note Ω l'ensemble de tous ses résultats. Exemple :

Une urne ontient le même nombre de boules blan hes et de boules noires. L'expérien e onsiste à retirer su

essivement (ave remises) trois boules de l'urne. L'ensemble des résultats possibles de l'expérien e est :  Ω = (BBB), (BBN ), (BN B), (N BB), (BN N ), (N BN ), (N N B), (N N N ) .

Rappel : Les parenthèses autour de haque résultat indiquent une notion d'ordre. Ainsi, pour le résultat (N, B, B), on sait qu'on a d'abord tiré une boule noire puis deux boules blan hes, su

essivement. Commentaires :

Lorsque l'on réalise une expérien e, ontrairement à l'observation d'une série de données statistiques, on n'est généralement pas du tout ertain du résultat que l'on va obtenir. On peut dire que la résultat est totalement aléatoire. Néanmoins, l'obtention des résultats n'est pas non plus totalement haotique. Lorsque l'on lan e un dé à six fa es numérotées de 1 à 6, on ne s'attend pas à obtenir omme résultat un ensemble de ouleurs, mais bien des hires allant de 1 à 6. ! ! !

Dans e hapitre, nous allons ainsi nous donner les outils né essaires à l'étude minimale d'une expérien e. Cette étude va onsister à ֒→ essayer de prévoir e qui va arriver, ֒→ déterminer quelle sera la probabilité pour qu'un tel événement se produise. Nous aurons besoin, dans un premier temps, d'un outil in ontournable, la variable aléatoire. Définition :

Une variable aléatoire X , asso iée à une expérien e E , est une valeur qui,

omme son nom l'indique, varie selon le résultat de l'expérien e obtenu. Exemple :

Sur l'exemple pré édent, on onsidère la variable aléatoire X égale au nombre de boules blan hes dans le tirage. Observons l'ensemble Ω des résultats :  Ω = (BBB), (BBN ), (BN B), (N BB), (BN N ), (N BN ), (N N B), (N N N ) .

On onstate que l'on peut avoir 0 boules blan hes (par exemple pour le résultat (N, N, N )) ou 1 boule blan he (par exemple pour le résultat (B, N, N ) ou (N, B, N )), ou en ore 2 ou 3 boules blan hes. Les valeurs possibles de X sont don i i 0,1,2 et 3. Définition : U

ne variable aléatoire sera dite dis rète si elle ne prend qu'un nombre ni de valeur ( omme dans le as i-dessus). Pour la suite de e hapitre, an d'établir des formules générales s'appliquant à tous les as possibles, nous allons noter x1 , x2 , . . . , xn les n valeurs possibles d'une variable aléatoire dis rète X . Remarque :

Exemple :

On lan e un dé à six fa es équilibré. Les résultats de l'expérien e seront Ω = {1, 2, 3, 4, 5, 6}.

I i, on aura don par exemple x1 = 1, x2 = 2, x3 = 3, . . . . Commentaires :

Dans l'exemple i-dessus, omme le dé est équilibré, haque hire a une han e égale d'apparaître (on dira que haque as est équiprobable). Toutefois, au un d'entre eux n'apparaîtra à oup sûr ! Si on pose X la variable aléatoire donnant le résultat du lan é de dé, on pourra don dé rire l'expérien e en indiquant, pour haque valeur de X , quelle est la probabilité pour qu'elle apparaisse. On é rira don que : P(X = 1) = P(X = 2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) =

On lira par exemple, pour P(X = 1) =

2

1 6

:

1 6

"La probabilité de l'événement X = 1 vaut 16 ." ou ֒→ "Il y a une han e sur six pour que X soit égal à 1." ֒→

On appellera la liste omplète la loi de probabilité de X . Définition :

La loi de probabilité d'une variable aléatoire dis rète X est la donnée du tableau suivant : valeurs de X PX

x1 x2 ··· P(X = x1 ) P(X = x2 ) · · ·

xk ··· P(X = xk ) · · ·

xn P(X = xn )

On notera ette loi PX . Exemple :

Dans le as du lan é d'un dé équilibré à six fa es, on obtient don la loi de probabilité de la variable X : valeurs de X 1 2 3 4 5 6 1 6

PX

1 6

1 6

1 6

1 6

1 6

An de simplier les notation, on notera souvent pk pour désigner P(X = xk ). Remarque :

Remarque :

La présentation de la loi de probabilité d'une variable aléatoire

dis rète se fait de manière analogue à une variable statistique. Les probabilités des valeurs des variables aléatoires jouent alors le rle des fréquen es pour les variables statistiques. D'ailleurs, de la même manière que pour les fréquen es, on a que la somme des probabilités pk est égale à 1 : n X

pk = p1 + p2 + · · · + pn = 1.

k=1

(On pourra vérier sur le tableau de la loi de probabilité du lan é de dé.) Exemple :

On reprend le premier exemple de l'urne ontenant le même nombre de boules blan hes et boules noires. On obtient les probabilités suivantes : P(X = 0) =

1 , 8

3 P(X = 1) = , 8

P(X = 2) =

3 8

et

P(X = 3) =

1 . 8

La loi de probabilité de X est don valeurs de X 0 1 2 3 PX

1 8

3 8

3 8

1 8

3

Commentaires :

An de mieux omprendre la suite, nous allons ee tuer un parallèle entre l'étude des séries statistiques et l'étude des variables aléatoires au travers d'un exemple. Exemple :

On onsidère un dé équilibré à 6 fa es. L'expérien e onsiste à lan er e dé. On appelle X la variable aléatoire qui donne le hire obtenu. On réitère 18 fois ette expérien e. Voi i un résumé de trois des 618 résultats possibles, respe tivement donnés sous forme de série statistique : F ace 1 Ef f. 3 F r. 16

2 3

3 3

4 3

5 3

1 6

1 6

1 6

1 6

6 Total 3 18 1 1 6

F ace 1 Ef f. 3 F r. 16

F ace 1 Ef f 9 1 Fr 2

2 2

3 2

4 4

5 4

1 9

1 9

2 9

2 9

2 5

3 2

4 1

5 1

5 18

1 9

1 18

1 18

6 Total 0 18 0 1

6 Total 3 18 1 1 6

Au un de es résultats n'était prévisible à l'avan e, mais pour ha un d'entre eux, on peut al uler une moyenne, une varian e et un é art-type. Pour les trois as su

essifs, on obtient omme moyenne m1 = 3, 5, m2 = 1, 9, m3 = 3, 7. Quand les résultats sont à peu près équilibrés, ( e qui est le as du premier et du troisième tirage), les moyennes sont très pro hes. Ce phénomène s'explique mathématiquement. Naturellement, plus on réitère l'expérien e, plus les résultats vont avoir tendan e à s'équilibrer. Aussi, la moyenne va être de plus en plus pro he de l'équilibre idéal qui est elui du premier as. On s'attend don à avoir une moyenne qui tend à se rappro her de 3, 5 dans notre as. On appellera e nombre l'espéran e de la variable X . Cette notion, ommentée i i sur un exemple, est dénie mathématiquement grâ e aux formules i-dessous (qui ressemble très fortement aux formules de moyenne.) Définition :

L'espéran e d'une variable aléatoire dis rète X est la valeur E(X) =

n X

pk × xk = p1 × x1 + · · · + pn × xn .

k=1

C'est une généralisation naturelle de la notion de moyenne. On dénit également la varian e et l'é art-type d'une variable aléatoire dis rète : Var(X) =

n X k=1

4

2 pk × xk − E(X)

et

σ(X) =

p

Var(X).

Exemple :

Pour la variable aléatoire de l'exemple des urnes, on a : E(X) =

1 3 3 1 × 0 + × 1 + × 2 + × 3 = 1, 5 8 8 8 8

et 1 8

3 8

3 8

1 8

Var(X) = ×(0−1, 5)2 + ×(1−1, 5)2 + ×(2−1, 5)2 + ×(3−1, 5)2 = 0, 75.



Exer i e :

Reprendre le as du lan é de dé traité depuis le début du hapitre et vérier mathématiquement le résultat annon é de E(X) = 3, 5. Dans ertaines as, on pourra ren ontrer l'abus de vo abulaire "moyenne" à la pla e de "espéran e". (Par exemple dans la page 3 du formulaire.)

Remarque :

II

Tirages ave remises : loi binomiale

On se pla e dans la situation suivante : une urne ontient N boules dont N1 blan hes. On désigne par X la variable aléatoire égale au nombre de boules blan hes obtenue dans un tirage (aléatoire) ave remises de n boules de ette urne. Remarque :

Les valeurs de X vont ainsi de 0 à n.

N

On note p = 1 la proportion de boules blan hes dans l'urne et q = 1 − p = N la proportion de boules non blan hes.

N − N1 N

Proposition :

La loi de probabilité de la variable X est donnée par la formule :   n k P(X = k) = p (1 − p)n−k k

pour toute valeur k omprise entre 0 et n. Pour le fon tionnement du oe ient binomial la table1 du formulaire, page 6. Remarque :

n k ,

se référer à

La formule i-dessus est donnée sans démonstration. Ceux qui le souhaitent peuvent essayer de démontrer ette formule en prenant tout d'abord des petits as (n = 1, 2, 3) pour mieux omprendre. Remarque :

5

Définition :

Dans ette situation la loi de la variable X est appelée paramètres n et p. On note X B(n, p).

loi binomiale de

Proposition :

1. L'espéran e d'une variable X qui suit une loi binomiale B(n, p) est E(X) = n × p. 2. Si B(n, p), alors Var(X) = n × p × (1 − p) = n × p × q et σ(X) = pX n × p × (1 − p).

Remarquons que la taille de la population totale (notée N ) n'intervient pas dans les formules données i-dessus. Exemple :

Dans une population, la proportion de fumeurs est de 35%. On hoisit (ave remises) au hasard un é hantillon de 16 personnes. Nous allons al uler la probabilité qu'il y ait entre 4 et 7 fumeurs dans et é hantillon. On note X la variable aléatoire égale au nombre de fumeurs dans un tel é hantillon. Comme le hoix a été fait ave remises, X suit une loi binomiale. Plus pré isément, on a X B(16; 0, 35). Pour toute  valeur 0 6  k 6 16, on sait don que n k 16 P(X = k) = p (1 − p)n−k = (0, 35)k (0, 65)16−k . k k La probabilité her hée est don P(4 6 X 6 7) = P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7)     16 16 4 16−4 = (0, 35) (0, 65) + (0, 35)k (0, 65)16−5 4 5     16 16 k 16−6 + (0, 35) (0, 65) + (0, 35)k (0, 65)16−7 6 7 = 0, 1553 + 0, 2008 + 0, 1982 + 0, 1524 = 0, 7067.

Commentaires :

Pour la al ul des probabilités pour une loi binomiale, on présentera plutt les résultats sous forme de tableau. Quelques exemples sont donnés

i-dessous, où on reprend les donnés de l'exemple pré édent.

Pour trouver : ֒→

P(4 6 X 6 7) : 16 k P(X = k) k 4 1820 1820 × (0, 35)4 (0, 65)16−4 = 0, 1553 5 4368 4368 × (0, 35)5 (0, 65)16−5 = 0, 2008 6 8008 8008 × (0, 35)6 (0, 65)16−6 = 0, 1982 7 11440 11440 × (0, 35)7 (0, 65)16−7 = 0, 1524

6

Puis P(4 6 X 6 7) = 0, 1553 + 0, 2008 + 0, 1982 + 0, 1524. P(X > 14) : On a P(X > 14) = P(X = 15) + P(X = 16).

֒→

k 15 16

16 k

P(X = k) 1820 × (0, 35)15 (0, 65)1 = 1, 5 × 10−5 4368 × (0, 35)16 (0, 65)0 = 3, 3 × 10−7

16 1

D'où P(X > 14) = 1, 5 × 10−6 + 3, 3 × 10−8 ≈ 0, 00015%. ֒→ P(X > 2) : On a P(X > 2) = P(X = 2) + P(X = 3) + P(X = 4) + . . . + P(X = 16).... C'est un peu long ! ! Pour simplier les al uls, rappelons que la somme de toutes les probabilités fait 1. Autrement dit, on obtient P(X > 2) = 1 − P(X < 2) = 1 − P(X = 0) − P(X = 1). Le al ul donne P(X > 2) ≈ 1.

III

Tirages sans remise : loi hypergéométrique

On se pla e dans la situation suivante : une urne ontient N boules dont N1 blan hes. On désigne par X la variable aléatoire égale au nombre de boules blan hes obtenue dans un tirage (aléatoire) sans remise de n boules de ette urne. N N − N1 On note p = 1 la proportion de boules blan hes dans l'urne et q = 1 − p = N N la proportion de boules non blan hes. Proposition :

La loi de probabilité de la variable X est donnée par la formule : P(X = k) =

N1  k

∗ N n

N −N1  n−k



, pour toute valeur k inférieure à N1 et n.

Définition :

On dit que la variable X suit une loi hypergéométrique et n. On note X H(N, N1, n).

de paramètres N , N1

Proposition :

1. L'espéran e d'une variable X qui suit une loi hypergéométrique H(N, N1 , n) est E(X) = n × p. 2. Si X H(N, N1 , n), alors Var(X) = n × p × (1 − p) × NN−n −1 et σ(X) = q p N −n n × p × (1 − p) × N −1 . Remarque :

Un in onvénient de la loi hypergéométrique est le fait que la 7

taille de la population (notée N ) intervient dans les formules. Or, la population est souvent très grande et on ne onnaît d'ailleurs pas toujours sa taille exa te. s'appelle le oe ient d'exhaustivité. On Le oe ient N −1 peut démontrer que, lorsque e oe ient est pro he de 1, la loi de probabilité de la loi hypergéométrique est pro he de elle d'une loi binomiale. Dans e as, on pourra utiliser les formules de la loi binomiale même si le tirage est sans remise. r

Remarque :

N −n

Exemple :

Reprenons l'exemple pré édent en supposant ette fois que l'on hoisit l'é hantillon sans remise et que la taille de la population est N = 1000. Le nombre de fumeurs de la population est don N1 = 1000 × 0, 35 = 350. On note en ore X la variable aléatoire égale au nombre de fumeurs dans un é hantillon de 16 personnes. Comme le hoix a été fait sans remise, X suit ette fois une loi hypergéométrique. Plus pré isément, on a X H(1000; 350; 16). Pour toute valeur 0 6  k 6 16, on sait don que  P(X = k) =

N1 k

×

N −N1 n−k

N n

=

350 k

La probabilité her hée est don

650 16−k  1000 16

×

.

P(4 6 X 6 7) = P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) 350 650 350 650 350 650 × × × = 4 100012 + 5 100011 + 6 100010 + 16

16

16

= 0, 7109.

r

N −n = N −1

r

350 650 × 7 9 1000 16

1000 − 16

Le oe ient d'exhaustivité vaut i i = 0, 9925. On 1000 − 1 aurait don pu utiliser la loi binomiale. Plus pré isément, omme le oe ient d'exhaustivité est pro he de 1, on peut dire que X est pro he de la loi binomiale B(n; p) = B(16; 0, 35). On est alors dans la as de l'exemple pré édent et on obtient don P(4 6 X 6 7) ≃ 0, 7067. Commentaires :

De la même manière que pour la loi binomiale, on présentera les résultats sous forme de tableau.

8