Vous êtes sur la page 1sur 5

Cours (7) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

LES STATISTIQUES INFERENTIELLES

(test de Student)

Linfrence statistique est la partie des statistiques qui, contrairement la statistique descriptive, ne se contente pas de dcrire des observations, mais extrapole les constatations faites un ensemble plus vaste et permet de tester des hypothses sur cet ensemble ainsi que de prendre des dcisions. Un test statistique est un mcanisme qui permet de trancher entre deux hypothses au vu des rsultats d'un chantillon. Soient H0 et H1 deux hypothses (H0 est appele hypothse nulle, H1 hypothse alternative), dont une et une seule qui est vraie. La dcision consiste retenir H0 ou H1. Pour un test bilatral, nous pouvons mettre les hypothses suivantes :

Hypothse nulle, H0 : pA = pB Hypothse alternative, H1 : pA pB.

Pour un test unilatral, les hypothses deviennent :


Hypothse nulle, H0 : pA = pB Hypothse alternative, H1 : pA > pB ou pA < pB

I.

LES TESTS PARAMETRIQUES

Un test est dit paramtrique si son objet est de tester une hypothse relative un ou plusieurs paramtres d'une variable alatoire qui suit la loi normale ou ayant un effectif important (n > 30).

1. Le test de Student
Ce test permet de comparer : une moyenne d'un chantillon une valeur donne les moyennes de deux chantillons indpendants les moyennes de deux chantillons apparis.

Cours (7) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

L'emploi de ce test reste subordonn en gnral deux conditions d'application importantes qui sont la normalit et le caractre alatoire et simple des chantillons. La premire condition n'est toutefois pas essentielle lorsque les chantillons ont des effectifs suffisants (en pratique, la valeur de 30 est souvent retenue) pour assurer la quasi-normalit des distributions d'chantillonnage des moyennes. En plus, de ces deux conditions, nous devrons supposer, dans certains tests relatifs aux moyennes, l'galit des variances des chantillons considres.

a. Cas d'un seul chantillon


Le test de Student cas d'un seul chantillon est aussi appel test de conformit, ce test a pour but de vrifier si notre chantillon provient bien d'une population avec la moyenne spcifie, 0, ou s'il y a une diffrence significative entre la moyenne de l'chantillon et la moyenne prsume de la population. Exemple: Une usine veut vrifier le bon fonctionnement de ces machines car l'usure des machines peut impliquer une dviation aux normes imposes. Nous tirons alatoirement un certain nombre d'lments de la production, nous calculons la moyenne et nous comparons celle-ci avec la norme impose. Les hypothses tester sont :

hypothse nulle : H0 : = 0 hypothse alternative : o H1 : > 0 (test unilatral droite) o H1 : < 0 (test unilatral gauche) o H1 : 0 (test bilatral symtrique)

Conditions d'application du test de Student : Le caractre de l'chantillon tant suppos alatoire, l'hypothse de normalit de la variable X doit tre vrifie (par exemple) avec le test de Kolmogorov-Smirnov si n < 30. Calcul : Soit X une variable alatoire distribue selon une loi normale, la variable alatoire dfinie ci-dessus suit une loi de Student avec n - 1 degrs de libert.

tobs =

Cours (7) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

o 0 est la moyenne de la population spcifie par H0, est la moyenne de l'chantillon, S est la variance de l'chantillon et n est la taille de l'chantillon On compare la valeur calcule de t (tobs) avec la valeur critique approprie de t avec n - 1 degrs de libert. On rejette H0 si la valeur absolue de tobs est suprieure cette valeur critique.

Les valeurs critiques pour diffrents degrs de libert et diffrents seuils de signification sont donnes par la table de Student. Pour un test unilatral, nous prendrons la valeur tn-1,1- de la table et pour un test bilatral, nous prendrons tn-1,1- /2.

b. Cas de deux chantillons indpendants


Etant donn deux chantillons de taille n1 et n2, on admet qu'ils ont t prlevs dune mme population relativement la variable tudie, ces deux chantillons ayant t prlevs indpendamment l'un de l'autre ? Les hypothses tester sont :

hypothse nulle : H0 : 1 = 2 hypothse alternative qui prend trois formes : o H1 : 1 > 2 (test unilatral droite) o H1 : 1 < 2 (test unilatral gauche) o H1 : 1 2 (test bilatral)

Conditions d'application :

Les deux chantillons sont indpendants entre eux, sont alatoires et ont n 1 et n2 units indpendantes (cette condition est d'ordinaire satisfaite en utilisant une procdure de randomisation ; procdure pour laquelle on affecte au hasard chaque individu un groupe exprimental). La variable alatoire suit une loi normale ou elle a des effectifs suprieurs 30. Il est aussi ncessaire de vrifier l'galit des variances des chantillons (grce au test de Fisher). Cette condition est indispensable pour des effectifs ingaux.

Remarques: Plusieurs auteurs ont montr que l'hypothse de normalit est d'importance relativement secondaire dans le test d'galit de deux moyennes. En effet, dans certaines limites, la nonnormalit des populations ne modifie pas sensiblement les risques d'erreur de premire et deuxime espce. Ceci est vrai surtout pour les distributions symtriques, mme trs diffrentes des distributions normales. De mme, l'hypothse d'galit des variances n'est
3

Cours (7) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

pas fondamentale au point de vue pratique lorsque les effectifs des chantillons sont gaux. En raison de cette faible sensibilit du test la non-normalit et l'ingalit des variances, on dira qu'il s'agit, pour des effectifs gaux, d'un test robuste. Par contre, lorsque les effectifs des chantillons sont ingaux, il est absolument indispensable de s'assurer de l'galit des variances et, si cette hypothse n'est pas vrifie, il est indispensable d'utiliser une mthode adapte ces circonstances. On peut notamment procder une transformation de variable, destine stabiliser les variances, et utiliser ensuite le test de Student. Cependant, ce cas d'ingalit des variances est assez rare. Mode de calcul : On calcule la valeur t observ (tobs) qui suit une variable alatoire de Student aux degrs de libert (ddl = n1 + n2-2).

tobs = o et sont les moyennes des deux chantillons, Sp la variance commune. Cette dernire statistique correspond la variance S de la population parentale. Elle est gale :

avec

Ce qui revient :

Sp =

Si les effectifs des chantillons sont gaux, la valeur de t devient :

tobs = La valeur de t est compare la valeur critique approprie de t (dans la table de Student) avec (n1 + n2 - 2) degrs de libert. On rejette H0 si la valeur absolue de tobs est suprieure cette valeur critique. Si le test est unilatral, nous prendrons la valeur tn1 + n2 - 2,1de la table de Student. S'il est bilatral, nous prendrons la valeur tn1+n2-2,1.

c. Cas de deux chantillons apparis:


Le test de Student pour observations paires sert comparer les moyennes de deux populations, dont chaque lment de l'une des populations est mis en relation avec un lment
4

Cours (7) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

de l'autre. Par exemple, il peut s'agir de comparer deux traitements, les donnes tant considres comme des paires d'observations (premire observation de la paire recevant le traitement 1 et deuxime observation recevant le traitement 2). Aspects mathmatiques : Soit xij l'observation j pour la paire i (j = 1,2 et i = 1,2,...,n). Pour chaque paire d'observations on calcule la diffrence di = xi2 - xi1. Le test statistique est dfini par :

tobs = o n est le nombre de paires d'observations, observations et Sd la variance. est la moyenne des diffrences entre les

Le test de Student pour observations paires est un test bilatral. Les hypothses sont :

H0 : 1 - 2 = 0 (il n'y a pas de diffrence entre les traitements) H1 : 1 - 2 0 (il y a une diffrence entre les traitements)

On rejette l'hypothse nulle au seuil de signification si : |tobs| > tn-1,1- /2 o tn-1,1- /2 est la valeur de la table de Student avec n - 1 degrs de libert. Conditions d'application :

les chantillons ont t tirs alatoirement la population des diffrences doit suivre une loi de Gauss. Cette condition est moins restrictive que celle de normalit des deux populations.

Vous aimerez peut-être aussi