S'abonner
decoration
decorationdecoration

Intervalle de fluctuation (p est connu)

Dans cette vidéo, nous allons aborder la notion d'intervalle fluctuation. Pour cela nous allons d'abord introduire la notion d'échantillon.

Échantillons

Un échantillon est une série statistique extraite d'une série statistique de plus grande taille. Par exemple, si notre série statistique est la population de Paris, il n'est pas pratique, et des fois impossible, de travailler avec un nombre de termes aussi grand, on va en garder qu'une partie, ce que l'on appelle un échantillon. On appellera série statistique d'origine la population pour faire la distinction entre les deux séries ainsi obtenues.

Définition

Un échantillon d'une série statistique est une sélection de termes choisis au hasard dans la population.

Exemple

On souhaite connaître la répartition homme/femme dans la ville de Paris. Comme il est impossible de recenser toute la population de la ville, on va choisir un échantillon de 10001000 personnes et étudier la répartition homme/femme de cet échantillon.

Intervalle de fluctuation

Supposons que l'on connaisse à l'avance la probabilité d'un événement, comme p=0.5p=0.5 dans l'obtention de "pile" dans un jet de pièce. Pourtant, même en sachant qu'on a une chance sur deux d'avoir pile ou face, on va rarement obtenir 5050 fois pile et 5050 fois face. Imaginons que l'on fasse 5050 lancers, et que l'on répète 55 fois cette expérience. Le tableau suivant résume la situation :

[TABLEAU PILEFACE]

Notre probabilité d'obtenir pile varie de 0.40.4 à 0.60.6. On dit que c'est la fluctuation de pp car pp fluctue autour de sa valeur connue de 0.50.5. Pourquoi pp varie-t-il autant ? On sait que si on jetait la pièce un nombre infini de fois, on aurait p=0.5p=0.5 à chaque fois. Or on se retrouve à faire le jet seulement 100100 fois, donc le hasard est plus présent quand l'échantillon est petit.

Mais il est pourtant irréaliste de répéter chaque expérience un nombre infini de fois. On est donc obligé de prendre en compte ces fluctuations dues au petit nombre de l'échantillon. C'est comme si on sacrifiait de la précision sur pp à chaque fois que l'on réduisait notre nombre d'essais.

Y-a-t-il un juste milieu ? Un nombre raisonnable d'essais à faire sans trop amplifier les fluctuations de pp ? C'est de ça que nous parle l'intervalle de fluctuation. Il nous donne, comme son nom l'indique, un intervalle dans lequel pp se trouvera dans 95%95\% des cas, en fonction de notre nombre d'essai.

Définition

  • L'intervalle de fluctuation un intervalle dans lequel pp se retrouvera dans 95%95\% des cas.

  • Cet intervalle se résume au cas où 0.2p0.80.2 \leq p\leq 0.8 et la taille de l'échantillon n25n \geq 25.

  • Cet intervalle se calcule ainsi :

I=[p1n;p+1n]I=\left[ p - \frac{1}{\sqrt{n}};p+\frac{1}{\sqrt{n}} \right]

Regardons de plus près cette formule. La borne inférieure est p1np - \dfrac{1}{\sqrt{n}}. Avec un échantillon de n=100n =100, cela devient simplement p1100=p110=p0.1p - \dfrac{1}{\sqrt{100}}=p - \dfrac{1}{10}=p-0.1. Ce qui veut dire que dans 95%95\% des cas, pp ne va pas être plus petit que p0.1p-0.1.

La borne supérieure est p+1np+\dfrac{1}{\sqrt{n}}. Avec un échantillon de n=100n=100, cela devient simplement p+1100=p+110=p+0.1p+\dfrac{1}{\sqrt{100}} = p+\dfrac{1}{10}=p+0.1. Ce qui veut dire que dans 95%95\% des cas, pp ne va pas être plus grand que p+0.1p+0.1.

Donc pour un lancer de pièce avec p=0.5p=0.5 d'obtenir pile, et avec un échantillon de 100100, pp sera dans 95%95\% des cas compris entre p0.1=0.4p-0.1=0.4 et p+0.1=0.6p + 0.1 = 0.6. On a donc notre intervalle de fluctuation qui vaut :

I=[p1n;p+1n]=[0.50.1;0.5+0.1]=[0.4;0.6]I = \left[ p-\frac{1}{\sqrt{n}};p+\frac{1}{\sqrt{n}} \right] = [0.5-0.1;0.5+0.1]=[0.4;0.6]
lumix

Si la fréquence de l'échantillon se retrouve en dehors de l'intervalle de fluctuation, on dira que cette fréquence n'est pas cohérente avec la probabilité pp.

Exemple

On s'intéresse à la population mâle des truites dans une rivière. Calculer l'intervalle de fluctuation et déduire si les échantillons de n=100n=100 truites sont cohérents avec la probabilité p=0.4p=0.4.

[TABLEAU]

On a p=0.4p = 0.4 et n=100n=100, on peut donc appliquer la formule pour calculer l'intervalle de fluctuation :

I=[p1n;p+1n]=[0.40.1;0.4+0.1]=[0.3;0.5]I=\left[ p-\frac{1}{\sqrt{n}};p+\frac{1}{\sqrt{n}}\right]=[0.4-0.1;0.4+0.1]=[0.3;0.5]

La fréquence de l'échantillon 11 vaut f1=0.36[0.3;0.5]f_1=0.36\in [0.3;0.5]. La fréquence 11 est donc cohérente avec p=0.4p=0.4.

La fréquence de l'échantillon 22 vaut f2=0.4[0.3;0.5]f_2 = 0.4 \in [0.3;0.5]. La fréquence 22 est donc cohérente avec p=0.4p=0.4.

La fréquence de l'échantillon 22 vaut f3=0.62>0.5f_3 = 0.62 > 0.5. La fréquence 33 est donc incohérente avec p=0.4p=0.4.

Revenir au chapitre
Commentaires

Christele

0
il y a 4 ans
nj
Répondre