Dans cette vidéo, nous allons aborder la notion d'intervalle fluctuation. Pour cela nous allons d'abord introduire la notion d'échantillon.
Un échantillon est une série statistique extraite d'une série statistique de plus grande taille. Par exemple, si notre série statistique est la population de Paris, il n'est pas pratique, et des fois impossible, de travailler avec un nombre de termes aussi grand, on va en garder qu'une partie, ce que l'on appelle un échantillon. On appellera série statistique d'origine la population pour faire la distinction entre les deux séries ainsi obtenues.
Un échantillon d'une série statistique est une sélection de termes choisis au hasard dans la population.
On souhaite connaître la répartition homme/femme dans la ville de Paris. Comme il est impossible de recenser toute la population de la ville, on va choisir un échantillon de personnes et étudier la répartition homme/femme de cet échantillon.
Supposons que l'on connaisse à l'avance la probabilité d'un événement, comme dans l'obtention de "pile" dans un jet de pièce. Pourtant, même en sachant qu'on a une chance sur deux d'avoir pile ou face, on va rarement obtenir fois pile et fois face. Imaginons que l'on fasse lancers, et que l'on répète fois cette expérience. Le tableau suivant résume la situation :
[TABLEAU PILEFACE]
Notre probabilité d'obtenir pile varie de à . On dit que c'est la fluctuation de car fluctue autour de sa valeur connue de . Pourquoi varie-t-il autant ? On sait que si on jetait la pièce un nombre infini de fois, on aurait à chaque fois. Or on se retrouve à faire le jet seulement fois, donc le hasard est plus présent quand l'échantillon est petit.
Mais il est pourtant irréaliste de répéter chaque expérience un nombre infini de fois. On est donc obligé de prendre en compte ces fluctuations dues au petit nombre de l'échantillon. C'est comme si on sacrifiait de la précision sur à chaque fois que l'on réduisait notre nombre d'essais.
Y-a-t-il un juste milieu ? Un nombre raisonnable d'essais à faire sans trop amplifier les fluctuations de ? C'est de ça que nous parle l'intervalle de fluctuation. Il nous donne, comme son nom l'indique, un intervalle dans lequel se trouvera dans des cas, en fonction de notre nombre d'essai.
L'intervalle de fluctuation un intervalle dans lequel se retrouvera dans des cas.
Cet intervalle se résume au cas où et la taille de l'échantillon .
Cet intervalle se calcule ainsi :
Regardons de plus près cette formule. La borne inférieure est . Avec un échantillon de , cela devient simplement . Ce qui veut dire que dans des cas, ne va pas être plus petit que .
La borne supérieure est . Avec un échantillon de , cela devient simplement . Ce qui veut dire que dans des cas, ne va pas être plus grand que .
Donc pour un lancer de pièce avec d'obtenir pile, et avec un échantillon de , sera dans des cas compris entre et . On a donc notre intervalle de fluctuation qui vaut :
Si la fréquence de l'échantillon se retrouve en dehors de l'intervalle de fluctuation, on dira que cette fréquence n'est pas cohérente avec la probabilité .
On s'intéresse à la population mâle des truites dans une rivière. Calculer l'intervalle de fluctuation et déduire si les échantillons de truites sont cohérents avec la probabilité .
[TABLEAU]
On a et , on peut donc appliquer la formule pour calculer l'intervalle de fluctuation :
La fréquence de l'échantillon vaut . La fréquence est donc cohérente avec .
La fréquence de l'échantillon vaut . La fréquence est donc cohérente avec .
La fréquence de l'échantillon vaut . La fréquence est donc incohérente avec .