Vous êtes sur la page 1sur 5

Cours (5) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

LE TRAITEMENT STATISTIQUE

I.

Les types de traitements statistiques en fonction des questions-problmes (QP)

Dans une recherche, on se pose toujours une ou plusieurs questions qu'il s'agira de rsoudre. Le chercheur met alors une solution qu'il croit possible (hypothse). Une hypothse (H) peut tre considre comme une rponse possible la question-problme. D'autre part, toute question implique au moins une variable qu'il s'agit didentifier ainsi que ses modalits et le type d'chelle correspondant. Il existe plusieurs types de questions-problmes qui se diffrencient plus ou moins nettement mais qui impliquent des traitements statistiques diffrents:

A. Recherche de description
Ce type de questions invite le chercheur de dcrire les caractristiques d'une ou plusieurs variables sur un chantillon ou une population. Il s'agira de collecter, prsenter, rsumer les informations juges ncessaires et adquates. Exemples: QP1: Quel est le poids moyen de mon chantillon ? Hypothse: Le poids moyen se situera en dessous d:. 100 kg. QP2: Quelle est la rpartition de mon chantillon au niveau de la nationalit ? Hypothse: Il y aurait davantage de Tunisiens, puis des Maghrbins et enfin quelques autres nationalits. QP3: Quelle est la rpartition observe des sujets en fonction de leur poids par rapport au sexe ? Hypothse: Il y aura plus d'hommes qui pseront plus lourds.

B. Recherche d'estimation
Il s'avre souvent impossible d'examiner une population entire. On recourt alors un chantillon que l'on espre reprsentatif de cette population. Le problme de savoir si les caractristiques d'un chantillon observ correspondent bien aux caractristiques de la population de rfrence est un problme d'estimation.
1

Cours (5) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

C. Recherche de comparaison
Lorsque dans un chantillon, nous avons des groupes par rapport une variable, il est lgitime de se demander si ces groupes sont similaires ou non. Autrement dit, les rsultats obtenus dpendent-ils de la formation des groupes ?

D. Recherche de liaison
Si plusieurs variables diffrentes sont observs sur un mme chantillon, nous cherchons tudier la relation (la liaison) entre ces variables. Si deux variables savrent relies, ce sont des variables interdpendantes, c..d, l'une peut expliquer l'autre.

II.

Les procdures avant tout traitement statistique

Les procdures exprimentales avant tout traitement statistique consiste : 1. poser une question de recherche 2. mettre une hypothse 3. laborer une procdure exprimentale pour tester une hypothse La suite de la procdure consiste : 1. constituer un ou de plusieurs chantillons 2. choisir des procdures statistiques dfinir lhypothse nulle choisir le seuil de signification choisir le test

III.

Les mesures prendre avant tout traitement statistique

Pour choisir un test statistique, il est ncessaire de dfinir: 1. les types de variables (qualitatives / quantitatives) 2. le nombre de variables 3. la taille de lchantillon 4. la loi de rpartition (normale ou non) 5. les mesures rptes ou non (nombre de facteurs)

Cours (5) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

IV.

Le recueil des donnes

Les donnes sont rassembles dans un tableau double entre comprenant autant de lignes que d'units d'observation indpendantes ( les sujets dtude ); autant de colonnes que de "variables" ou de mesures caractrisant chacune des units d'observation. Le tableau ainsi constitu se nomme un tableau de codage des donnes Les lignes de du tableau reprsentent les units d'observation. Les observations sont ralises sur un nombre limit d'units ou d'individus dans le but de tirer des conclusions applicables une population entire. Ce nombre limit d'units d'observation forme lchantillon. Les colonnes du tableau de codage reprsentent les variables. Une variable, c'est une quantit ou qualit susceptible de fluctuations ou encore une grandeur laquelle on peut attribuer plusieurs valeurs diffrentes . Au minimum, une variable a toujours deux modalits ou deux fluctuations. Ainsi, la variable sexe possde deux modalits: fille et garon. Exemple : La variable degr de concentration peut tre estime sur une chelle de valeur cinq degrs; elle a alors cinq modalits (trs faible, faible, moyen, fort, trs fort). Les variables places en colonne dans le tableau de codage seront accompagnes d'une lgende de codage reprenant l'ensemble de l'information ncessaire pour pouvoir reconnaitre la signification prcise de n'importe quel code dans n'importe quel endroit du tableau. Exemple : La lgende mentionne le numro de la variable, son nonc explicite et un code pour chaque modalit. V 10 : sexe, 1= homme, 2 = femme

V.

Le choix du test statistique


Pour les liens entre variables qualitatives, le choix du test dpend de la taille de lchantillon :
pour un chantillon de taille normale (effectifs calculs > 5) : test de khi 2 pour un chantillon de taille rduite (effectifs calculs > 3) : test de khi2 corrig (correction de Yates) pour un chantillon de taille trs rduite (effectifs calculs < 3) : le test exact
3

Cours (5) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

Pour les liens entre une variable qualitative et une variable quantitative le choix du test dpend :
sil sagit de comparaison de deux moyennes : o comparaison de deux moyennes observes o comparaison dune moyenne observe une moyenne thorique si les effectifs sont suffisamment grands (n>30) o la loi de rpartition est normale (faire ventuellement un test de normalit) : cest le test t de Student qui devrait tre retenu.

options du test : - comparaison dune moyenne observe et dune moyenne thorique (one population) ou de deux moyennes observes (two populations) - mesures apparies (paired) ou non apparies (unpaired) - comparaison unilatrale (one-tailed) ou bilatrale (two-tailed) Les effectifs sont faibles et la rpartition nest pas normale (faire ventuellement un test de normalit) : ce sont les tests non paramtriques qui devront tre retenus.

Les options : sries non apparies :

test W de Wilcoxon test U de Mann et Whitney test C1 de Fisher-Yates-Terry sries apparies :

test T de Wilcoxon sil sagit de comparaison de plusieurs moyennes (>2) si la loi de rpartition de probabilit est normale pour la variable mesure (faire ventuellement un test de normalit) : cest lanalyse de la variance (ANOVA) qui devrait tre retenue. options : ANOVA plusieurs facteurs
4

Cours (5) de statistiques distance,

labor par Zarrouk Fayal,

ISSEP Ksar-Said, 2011-2012

tests post-hoc : Mthode de Bonferonni (test t) : recommand pour un usage gnral, si les comparaisons ne sont pas trop nombreuses. Mthode de Tukey (test t) : utiliser lorsque toutes les comparaisons paire par paire sont intressantes. Mthode de Dunnet : utiliser lorsque lon compare le groupe contrle avec les autres groupes, mais pas les autres groupes en eux. Mthode de Sheff (test F) : utiliser pour les comparaisons compliques si la loi de rpartition de probabilit nest pas normale pour la variable mesure (faire ventuellement un test de normalit) : ce sont les tests non paramtriques qui devront tre retenus.

Les tests de normalit proposes : Martinez-Iglewicz (Kolmogonov-Smirnov) Agontino Omnibus Agostino-Skewness (si n>8) Agostino-Kurtosis (si n>20)

Pour les liens entre deux variables quantitatives


une des deux distributions lies au moins est normale avec une variance constante : cest le test de corrlation (test de Bravais-Pearson) ou le test de rgression qui dtermine si la pente est statistiquement significative de 0. si aucune des variables lies nest normale et de variance constante (petits chantillons) : cest le test non paramtrique de corrlation des rangs (test de Spearman)