Vous êtes sur la page 1sur 39

Vrification des donnes

Entre des donnes


Donnes brutes
Nom sexe Houle, N. Note score R 30 27 31 28 age 21 25 23 24

Fichier Excel

A f Darcy, T. B m Petit, M. C m Legrand, P. A f . . . . . Baron, C. B m

29

24

Data window

Premires vrifications

Vrification du fichier de donnes


Donnes manquantes

Exclusion des variables ou des cas gnrant un pourcentage important de donnes manquantes Remplacement des valeurs manquantes

Moyenne de groupe Rgression

Valeurs extrmes

Univaries Multivaries

Influence des valeurs extrmes

Examine <nom de variable>

Valeurs extrmes univaries (SPSS - Explore)

Valeurs extrmes multivaries

Normalit de distribution
Number of valid observations (listwise)=454.00 Variable Mean Std Dev Kurtosis S.E. Kurt Skewness S.E. Skew Minimum Maximum <nom de variable> 9.649 7.642 11.157 .229 2.755 .115 1.00 58.00

Distribution normale => Coefficient de dissymtrie (skewness) = 0 et Coefficient daplatissement (kurtosis) = 0

Vrification de normalit SPSS Explore

Homocdasticit

Homognit de la variance: La variance dune variable dpendante est la mme pour les diffrents niveaux de la variable indpendante
Homocdasticit: La variance des scores pour une variable est la mme pour toutes les valeurs dune autre variable Manque de Homocdasticit

Non normalit dune des variables


Ex: ge et salaire (salaire est biais positivement)

Plus derreur de mesure pour certains niveaux dune des variables


Ex: des personnes dune certain ge sont plus proccupes avec leur sant et donnent donc des informations plus fiables ce sujet

Solutions

Taille de lchantillon

Normalit: Une Anova avec plus de 20 dferreur est assez robuste dans le cas de violation de normalit Homognit des variances: Taille des groupes gale -> peu problmatique Taille ingale (Fmax: rapport entre la variance la plus large et la variance la plus petite)

rapport entre la cellule la plus importante et la cellule la plus petite env. 4 pour 1: Fmax 10 rapport entre la cellule la plus importante et la cellule la plus petite plus important: Fmax < 3

Transformations

Transformations

Transformation logarithmique

Interprtation des rsultats

Le test statistique

Quelles sont les informations fournies par un test statistique?

Un test statistique rpond la question: Est-ce que la diffrence entre le groupe exprimental et le groupe contrle est telle que lon puisse conclure quelle nest pas due au hasard? La rponse dpend:

de la taille deffet du nombre de sujets du test statistique utilis du niveau alpha fix

MAGIC
Magnitude la taille de leffet est-ce que linfluence de la VI sur la VD est importante? Articulation le degr de dtail nonc facilit de tirer des conclusions utiles (ex les moyennes des cinq groupes A,B,C,D,E ne sont pas les mmes vs les moyennes des groupes C,D,E sont significativement diffrentes des moyennes de A et B bien que ceux-ci ne diffrent pas entre eux ou on observe une augmentation linaire des moyennes de A E Generality validit externe permet la gnralisation des rsultats Interestingness limportance thorique est-ce que ltude fournit des nouvelles connaissances? Credibility validit interne la qualit de loprationnalisation des variables, contrle des artefacts potentiels

Significatif ou non

Exemples:

Le rsultat est significatif au niveau de .07 Le rsultat est marginalement significatif Bien que le rsultat ne soit pas significatif au niveau conventionnel de .05, il suggre que ...

Tukey (1991):
.05 < p < .15 the difference leans in the ... direction

.15 < p < .25 there is a hint regarding the direction

Style
Style conservateur

nutilise jamais des tests unidirectionnels nutilise quune seule analyse prdtermine nexclue jamais de valeurs extrmes vite de se concentrer sur un seul rsultat en particulier, surtout sil est favorable ne dvie jamais dun seuil de signification pr-tabli

Prsentation des rsultats

Analyse de la variance
F 2,28 3.71, p .037, 2 .21

Degres de libert (effet, erreur)

Valeur p

Valeur F

Eta2 = taille deffet

Les tableaux et les figures


PSY7102

Les erreurs les plus communes

Rpter les mmes informations dans une figure, un tableau, ou bien dans le texte Prsenter des tableaux ou des figures qui sont incomprhensibles sans l aide du texte Prsenter des donnes dans des tableaux ou des figures sans discuter de leur signification dans le texte

Les tableaux
Quand ? Pour des petites sries de donnes peu complexes Comment ?

Mettre les informations dans les colonnes et les lignes dans un ordre logique (p.ex: dans lordre de limportance des items) Choisissez un nombre de chiffres raisonnable (p.ex: 3578 plutt que 3578,887, 1,34 plutt que 1,3434562) Arrangez les items tel que les comparaisons importantes soient faciles faire

APA

Emplacement

Aprs les notes de bas de page, la fin du document Dans le texte on signale: ---------------------Insert Table 1 here ---------------------Chiffres arabes sans suffixes (donc 5 et 6 la place de 5a et 5b) Doit dcrire de manire prcise les variables indpendantes et dpendantes tel que le lecteur sait ce qui est prsent sans avoir recours au texte (ex: Mean log-transformed post-auricular reflex magnitude as a function of emotional facial expression and expresser sex )

Numrotation

Titre

Figures

Pour des fins de vrification et dinterprtation des donnes Pour des fins de communication des rsultats

Ne en 1323 Allemagne ( louest de Riez), France


Mort le 11 juillet 1382 Lisieux, France

Stem-and-leaf Plot (Tracs


en arborescence)
Exemple: Un enseignant a demand 10 lves d'indiquer combien de livres ils avaient lu au cours des 12 derniers mois. Voici leurs rponses :

12, 23, 19, 6, 10, 7, 15, 25, 21, 12


Tige Feuille 0 67 1 0259 2 1235

Cette forme de prsentation des donnes permet facilement de dtecter des distributions problmatiques

Box Plot

Ce type de figure est construit partir de la mdiane, des deux quartiles et des valeurs extrmes Les valeurs extrmes se retrouvent plus de 1.5 espaces interquartiles en bas ou en haut des quartiles Les valeurs extrmement extrmes se retrouvent plus de 3 espaces interquartiles en bas ou en haut des quartiles

Box Plot : exemple

Comparaison des sries des donnes

Communication des rsultats


Prsentation claire avec des symboles distincts Supprimez des informations non essentielles viter trop de points sur l chelle

Ne mettez pas dinformations supplmentaires (ex: lgende) dans la rgion des donnes
Quand des symboles ou des lignes chevauchent, utiliser des moyennes qui aident la discrimination visuelle Faire plusieurs essais afin de voir quel type de graphique communique le mieux les donnes

suite

Deux graphiques clairs sont mieux quun graphique surcharg par des donnes ou des symboles Il est acceptable de se servir dun graphique complexe sil permet de visualiser un rsultat complexe Quand plusieurs graphiques devraient tre compars il faut quils aient la mme chelle Il est possible dindiquer ltendue de mesure (ex: 0-200) sur le titre de laxe et de la commencer avec une autre valeur afin damliorer la rsolution Voir aussi: http://www.statcan.ca/francais/edu/power/ch9/first9_f.htm

Exemple I

Problme: peu de donnes avec un patron simple -> mieux sous forme de tableaux

Exemple II

Problme: demande le jugement des longueurs relatives, ce qui est plutt difficile

Capacits cognitives impliques dans la lecture de figures


Position sur une chelle commune Position sur des chelles identiques mais non alignes Longueur Angle/pente Surface Volume Gradation des couleurs

Exemple III

APA

Impression

Trs bonne qualit sur une feuille 8 x 11.5 Emplacement: Aprs les tableaux (pages non numrotes) Dans le texte on signale: ----------------------Insert Figure 1 here ----------------------La lgende est sur la page de la figure et ne fait pas partie du titre Chiffres arabes Sur une feuille part (la dernire page numrote du document)

Numrotation

Titres

Vous aimerez peut-être aussi