Vous êtes sur la page 1sur 11

Test du khi-deux et de student

Test du khi-deux ou Loi de Pearson


La loi du 2 à n degrés de libertés est celle suivie par la somme Xi2 (∑Xi2) lorsque les Xi
désignent n variables aléatoires normales centrées réduites indépendantes. Sa densité est
donnée par : n x
1  1 
( x )  x2 e 2
( 2  ) n  (n / 2 )
si n est un entier positif Avec Г(n) = (n - 1)!

si non (x)  0

Courbe représentative de la densité pour n = 4


La probabilité que 2 soit inférieur à un réel a (seuil de probabilité) donné positif
est : n x
1
n 1 
2  x) 
P(  a  x 2 e 2 dx est tabulée
( 2  ) n  (n / 2) 0
L'espérance mathématique de la loi du 2 est n, sa variance est 2n.
Lecture de tables
Les tables de la loi 2 font intervenir deux paramètres qui sont le degré de liberté n et le seuil
de risque a.

P( X   2 )a
n, a
Le nombre de degrés de liberté (ddl) est égal au nombre de composantes indépendantes de la
statistique du χ2.
Les tests du chi-deux sont des tests d'hypothèses statistiques non-paramétriques. Ils tirent leur
nom du fait que l'on lit l‘écart critique dans la table de la loi du chi-deux. Ils sont
essentiellement au nombre de trois :

Le test du chi-deux d'ajustement, ou d'adéquation, qui compare globalement la distribution


observée dans un échantillon statistique à une distribution théorique.
Le test du chi-deux d'indépendance, qui teste si deux caractères d'une population sont
indépendants.
Le test du chi-deux d'homogénéité, qui teste si des échantillons sont issus d'une même
population.

chi² calculé = somme (Effectif réel - Effectif théorique)² / Effectif Théorique

• si χ2cqlculé ≤ χ2seuil, l’hypothèse H0 ne peut être rejetée: distributions des effectifs


théoriques et observés ne sont pas significativement différentes.

• si χ2calculé > χ2seuil , l’hypothèse H0 est rejetée au seuil de signification α et


l’hypothèse H1 est acceptée.
Exemple de calcul de khi – deux d’ajustement

Pour tester si un dé n’est pas truqué, on le jette 150 fois et on note les résultats obtenus :

1 2 3 4 5 6
17 26 38 22 25 22

En posant comme hypothèse nulle « le dé n’est pas truqué », on s’attend à ce que les effectifs
observés ne diffèrent pas des effectifs théoriques, qui sont 25, 25, 25,…, 25 (150 divisé par 6)

On fixe le seuil de significativité à 10% par exemple Le nombre de degrés de liberté est égal à
6–1=5
On lit dans la table que Χ20.90 à ν = 5 est 9.24

Dans notre cas, 10.08 > 9.24, on rejette H0 (et on conclut que le dé est truqué) avec 10 chances
sur 100 de se tromper.

On travaille à 5%, on lit Χ20.95 à ν = 5 : 11.1 et dans ce cas 10.08 < 11.1, on ne rejette pasH0 .
Loi de Student
Il s’agit encore d’une loi dérivée de la loi normale, très utilisée dans les tests statistiques. On
considère une première variable aléatoire X, distribuée selon une loi normale centrée réduite,
puis une seconde variable Y, indépendante de X, distribuée selon un χ2 à n degrés de liberté.

La loi de Student (ou loi de Student-Fisher) est utilisée lors des tests de comparaison de
paramètres comme la moyenne et dans l’estimation de paramètres de la population à partir
de données sur un échantillon.

Soit X une variable aléatoire suivant une loi normale réduite N(0,1) et Y une variable aléatoire
suivant une loi de Pearson à n degrés de liberté n2 , X et Y étant indépendantes, on dit alors
que la variable aléatoire :
X
tn 
y
n

est distribuée selon une loi de Student à n degrés de liberté (ddl), notée t(n).
n 1 n 1
1 t2  2
2  C(n) (1  t )

2
f ( x)  (1  )
n B(1 / 2, n / 2) n n
La courbe correspondante est symétrique autour de 0, et converge vers celle de la loi
normale lorsque n tend vers l’infini.

Cette loi est centrée, mais non réduite : la variance n  1 est supérieure à 1.
2
Lorsque n croît, en pratique pour n > 30, la variance peut être prise égale à 1, et la
distribution assimilée à celle d’une loi normale centrée réduite.

Le seuil a correspond à P( t > t (α:n )), c'est-à-dire la probabilité que t égale ou dépasse une
certaine valeur critique, définie en fonction du seuil de probabilité et du nombre de degrés
de liberté.

Attention, le seuil peut être unilatéral ou bilatéral!!!

Si le seuil est bilatéral, la notation est la suivante: P(t > t (a/2:n))

Ou : P ( T < - t ) = a /2 = P ( T > t )
Quelques exemples
A) Trouver la probabilité en connaissant les valeurs de t(α:n)

1. P(t24 > 2,492) = ? C'est-à-dire: quelle est la probabilité que la valeur de t pour 24 degrés de
liberté soit plus grande que 2,492?

On voit que la probabilité est unilatérale. La table de t:


n = 24
t(a;24) = 2,492
a unilatérale -------------> a = 0.01

2. P(t29 < 1,699) = ? C'est-à-dire: quelle est la probabilité que


la valeur de t pour 29 degrés de liberté soit plus petite que
1,699?

On voit que la probabilité est unilatérale, mais qu'on cherche la réciproque de la valeur de
la table: n = 29
t(a;29) = 1,699
a unilatérale -------------> a = 0.05 -------------> 1 – a = 0,95
3. P(|t15| > 2,947) = ? C'est-à-dire: quelle est la probabilité que la valeur absolue de t pour 15
degrés de liberté soit plus grande que 2,947?

a) Probabilité unilatérale ou bilatérale?


b) On voit que la probabilité est bilatérale. Table de t:
n = 15
t(a;15) = 2,947
a bilatérale -------------> a = 0.01
4. P(t6 > –1,943) = ? C'est-à-dire: quelle est la probabilité que t pour 6 degrés de liberté soit
plus grand que –1,943?
a) Probabilité unilatérale ou bilatérale?

b) On voit que la probabilité est unilatérale, mais qu'il va falloir prendre la réciproque de la
valeur a donnée par la table de t:
n=6
t(a ; 6) = –1,943 = 1,943 par symétrie
a unilatérale -------------> a = 0.05 -------------> 1 – a = 0,95
5. P(l t22 l> t (α /2:22) ) = 0,05
a) Probabilité unilatérale ou bilatérale?
b) On voit que la question est bilatérale.
n = 22
a = 0.05
a bilatérale -------------> t (a/2;22) = t (0.025;22) = ± 2,0739

6. P(t30 > t (α : 30) ) = 0,25


a) Probabilité unilatérale ou bilatérale?
b) On voit que la question est unilatérale.
n = 30
a = 0.25
a unilatérale -------------> t (a;30) = t (0,25;30) = 0,683

7. P(t22 > t (α ;22) ) = 0,95


a) Probabilité unilatérale ou bilatérale?

b) On voit que la question est unilatérale.


n = 22
a = 0.05
a unilatérale -------------> t(a;22) = t(0.05;22) = 1,717
-------------> t(a;22) = t(0.95;22) = –1,717
8. P(t43 > t ( α ; 43) ) = 0,05
a) Probabilité unilatérale ou bilatérale?
b) On voit que la question est unilatérale.
n = 43
a = 0.05
a unilatérale -------------> 43 n'est pas dans la table de t !!!

Il va donc falloir interpoler!

A) À défaut d’avoir t (0,05:43) nous avons:


t(0,05:40) = 1,684
t(0,05:60) = 1,671
Il faut donc interpoler entre ces valeurs.

Pour une augmentation de 60 – 40 = 20 degrés de liberté, il y a une diminution de


1,684 –1,671 = 0,013 de la valeur de t pour un seuil de 0,05.

Chaque degré de liberté de plus occasionne donc une diminution de


0,013/20 = 0,00065 de la valeur de t.

Comme on doit aller de 40 à 43, il faut donc soustraire 3* 0,00065 = 0,00195 de t(0,05;40)
Cela donne: t(0,05;43) = 1,684 – 0,00195 = 1,68205 » 1,682

Vous aimerez peut-être aussi