Vous êtes sur la page 1sur 18

IMAD 2019-2020

Démarche hypothético-déductive

1) Circonscrire l’objet de recherche


Parcimonie, précision, testabilité, réfutabilité

2) Construire l’objet de recherche


Plans expérimentaux
Type Spec Metodo
Groupe indé 1 VI ET comparer Attribution aléatoire /
deux groupes diff. Appariement
systématique

Simple à mesure rép. 1 VI ET un seul groupe Plus efficace pour petits Nombre de
dans 2 conditions groupes. Contre- participants réduits
balancement pour éviter mais VP augmentées
retest

PAGE 1
TOUTES LES Vis manipulées ?

Oui, TOUTES Non, …

1 VI Invoquée au moins TOUTES Vis invoquées

Plan expérimental Plan quasi-expérimental Plan corrélationnel

Combien de VI ?

1 Plusieurs

Plan Simp Plan Factoriel

Sujets sont exposés à ?

UNE seule moda VI Toutes les moda VI

Plan à grps indépendants Plan à mesures répétées

PAGE 2
Tableaux / Graphiques
Type Graphique Def + metodo
Echelle nominale ou Diagramme à secteur Camembert, surtout
ordinale utilisé pour freq. Relatives
Diagramme Linéaire Rectangle divisé en autant
de parties que de modalité
Diagramme bandes Axes x,y / même
rectangulaire épaisseur, epace égal
Echelle de rapports ou Diagramme en bâton Similaire diagramme à
d’intervalles avec peu bandes rectangulaires,
de valeur (quant. avec un segment de droite
discrète) plutôt qu’un rectangle
Echelle de rapports ou Histogramme
d’intervalles avec
beaucoup de valeurs
(quant. discrètes avec
bc valeur)
Polygone de fréquence
Courbe fréq relatives
cumulées
Echelles avec peu de Diagramme à bande
modalités rectangulaires chevauchée
Echelles avec bc Diagramme de dispersion Peut être complémenté
modalités avec histogrammes et
boxsplots

Alphabet
Fréquences absolues : Nombre total de données qui présentent une modalité

Fréquences relatives : échantillon

Pop Ech
Médiane Md md
Moyenne µ m
Variance σ2 s2
Score Z Z z
Phi Φ
Khi carré χ2
Seuil alpha α

PAGE 3
3) Analyse empirique
Types de variables

Variable invoquée : caractéristiques naturelles

Variable provoquée : manipulée par la personne faisant la recherche

Echelle de mesure
Echelle Variable Origine Unité Utilité Relations Calcul MTC
autorisé
Nominale Qual. Aucune Aucune Coder =, ≠ Aucune Mode

Ordinale Qual ou 1ere Les Ordonner <,> =, ≠ Aucune Mode,


quant. Moda écarts Médiane
ne sont
pas
égaux
D’intervalles Quant. 0 relatif Ecarts Evaluer <,>,=, ≠ +, - Mode,
sont médiane,
égaux moyenne
De rapports Quant. 0 Ecarts Evaluer <,>,=,≠ +, -, x, ÷ Mode,
Absolu égaux Médiane,
moyenne

PAGE 4
Mesure de tendance centrale
Mode : Distribution unimodale – seul choix p/ échelle nominale
Valeur la plus fréquente (ou classe modale si groupées)

Médiane : Centre de position

• Au moins ordinale
• Vérif si distrib normale avec moyenne
• Distrub. Asymétriques et unimodales
 Qualitatif ordinale => n/2 si pair
=>(n+1) /2 si impair
 Quantitatifs => Moyenne de n/2 et (n/2) +1 si pair

Moyenne : Se prête bien aux statistiques inférentielles

∑𝑛𝑛
𝑖𝑖=1 𝑋𝑋𝑋𝑋
𝑛𝑛 (𝑜𝑜𝑜𝑜 𝑁𝑁 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝)

Mesure de dispersion
Etendue : Très sensible aux valeurs extrêmes (non robuste)
Echelles ordinales ou supérieures
Différence entre la valeur la plus élevée et la plus faible

Variance Ecarte entre valeurs des données et centre d’équilibre (moy)


Echelles d’intervalles ou supérieurs
Pas la même échelle que la variable car au carré
∑𝑁𝑁
𝑖𝑖=1(𝑋𝑋𝑖𝑖− 𝜇𝜇𝑥𝑥 )
2
𝜎𝜎 2 𝑥𝑥 =
𝑁𝑁

Ecart-type Echelles d’intervalles ou de rapports


Même unité que la variable
Racine carré de la variance
2
𝜎𝜎 = √𝜎𝜎 2

Ecart interq. Plus robuste que la variance


Utilisée avec les boxplot
Echelles ordinales ou supérieurs

Mesure de positions
Rangs Position d’une donnée dans une série statistique ordonnée.
Echelles ordinales ou supérieures

Quantiles Valeurs qui divisent une série statistique


Même proportion de données (quartiles 25 %, quintiles 20 %)
Ordinales ou supérieures

PAGE 5
Le score Z Score standardisé
Combien d’écarts-type au-dessus ou au-dessous de la moyenne
Echelles d’intervalles ou supérieures
Score compris entre -3 et 3
Valeur sans unité : 𝒎𝒎𝒛𝒛 = 𝟎𝟎 𝒔𝒔𝒛𝒛 = 𝟏𝟏
𝑋𝑋𝑖𝑖 −𝜇𝜇𝑥𝑥
𝑍𝑍𝑖𝑖 =
𝜎𝜎𝑥𝑥

Calcul des probabilités

Type de Variables

Qualitative + Quant discrète Quantitative discrète


(peu) (PLEIN) + continue

Distribution normale ?
Tableau Fréquence
(modalités ou valeurs)

Non Oui

Tableau Fréquence Table de la distrib normale


(intervalles de valeur)

1) Calculez le score Z
2) Trouver la proba.

PAGE 6
Distribution normale
Loi normale : Variable quantitative continue
Variance et moyenne doivent être proche

Distribution normale centrée réduite : Centrée à 0


Probabilités proportionnelles
N(0,1) (Moyenne 0, variance 1)
Standardiser ne rend pas normal

Marche à suivre pour résolution d’exercices :

1. Dessiner courbe normale


2. Localiser moyenne
3. Localiser endroit approx du score
4. Hachurer surface à estimer
5. Employer la table

PAGE 7
Probabilités, généralités
Evènements indépendants Occurrence de l’un n’a pas d’influence sur l’autre

Mutuellement exclusifs Ne peuvent se produire en même temps

Exhaustifs Incluent toutes les issues de la variable aléatoire

Etapes d’un test statistique

Voie de gauche Rejet H0 =inférieur seul

Voie de droite = Inverse

Probabilités,propriétés
1. Entre 0 et 1
2. Loi additive des probabilités : Si mutuellement exclusifs
Pr(𝐴𝐴 𝑜𝑜𝑜𝑜 𝐵𝐵) = Pr(𝐴𝐴) + Pr (𝐵𝐵)
3. Sommes des probabilités événements indépendants, mutuellement
exclusifs et exhaustifs est : 1.
a) Variable aléatoire est non continue :Variables qual. et quant discrètes
b) Variable aléatoire est continue : Variable quantitative continue

PAGE 8
Décision rejet H0, H1
La vérité
Décision H0 (Non-rejet) Pas H0 (Rejet)
Rejet H0 Erreur type 1 (Pr = Alpha Rejet correct
Faux positif)
Non Rejet H0 Non rejet correct Erreur type II (Faux nég)

Corrélations et mesures d’association


Corrélation : VI Quant Discrète et continue, qual. Ordinale. Var ordonnées
Association : Variables qual. Nominales (catégories)

But Descriptif : Avoir un chiffre résumant la relation entre variables


But en soi : Interpréter, la mesure répond à recherche
Mesure de la taille d’effet
Etape intermédiaire (ex. analyse factorielle)

Type de variable :

• V1 : Quat. Continue ; V2 : Quant. continue =


rPearson ou rSpearman (si postulat Pearson non respecté)
• V1 : rangée ; V2 ; Rangée rSpearman ou Tau Kendall
• V1 : quantitative continue ; V2 dichotomique Coefficient bisérial de points
• V1 : Dichotomique ; V2 : Dichotomique Coefficient phi (Φ)
• V1 :> 2 modalités (nominale / ordinale) ; V2 : >2 modalités (nominale /ordinale)
Φ Cramér

Distribution du χ2

PAGE 9
K= Degrés de liberté (DDL)
Estime la probabilité d’avoir obtenu les résultats observés si H0 était valable

Postulats : 1) Indépendance des observations


2) Fréquences attendues ≥ 5
3) Inclusion des non-occurrences
O = fréq. Observées
E= fréq. Espérées (attendues)

χ2 d’ajustement χ2 d’indépendance

1 Variable qualitative 2 Variable qualitative

𝐻𝐻1: 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐴𝐴 ≠ 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐵𝐵 𝐻𝐻1: 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐴𝐴 ≠ 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐵𝐵

𝐻𝐻0: 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐴𝐴 = 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐵𝐵 𝐻𝐻0: 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐴𝐴 = 𝑛𝑛𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚é𝐵𝐵

∑(𝑂𝑂−𝐸𝐸)2
Calculer valeur de test VT 𝑥𝑥 2 =
𝐸𝐸

Trouver valeur critique selon ddl et seul

Ddl = Modalités - 1 Ddl = (L-1)(C-1)

Décision Comparer VT obtenue avec VC


VT > VC => Rejet H0
VT < VC => Non rejet H0

𝑥𝑥 2
𝑥𝑥 2 Taille d’effet ∅ = �
Taille d’effet 𝜔𝜔 = � 𝑛𝑛(𝑞𝑞−1)
𝑛𝑛
q=min(L,C)

PAGE 10
Corrélation de Pearson
2 variables quantitatives continues (ou discrète avec beaucoup de valeurs)
Déterminer si évolution commune, liens entre cause comportement /comportement
-1 à 1

Postulats : Linéaire
Absence de valeurs extrêmes bivariées
Graphiques : Diagramme de dispersion (scatterplot)
Histogrammes / Boxplots

Deux façons de calculer : 1) Score bruts via covariance


Covariances ne sont pas comparables
elles dépendent des échelles de calculs
La personne a-elle un score supp ?

∑𝑁𝑁
𝑖𝑖=1(𝑋𝑋𝑖𝑖− 𝜇𝜇𝑥𝑥 )(𝑦𝑦𝑖𝑖 −𝜇𝜇𝑦𝑦 ) ∑𝑁𝑁
𝑖𝑖=1(𝑥𝑥𝑖𝑖− 𝑚𝑚𝑥𝑥 )(𝑦𝑦𝑖𝑖 −𝑚𝑚𝑦𝑦 )
𝜎𝜎𝑥𝑥,𝑦𝑦 = 𝑆𝑆𝑥𝑥,𝑦𝑦 =
𝑁𝑁 𝑛𝑛−1

2) Avec les scores standardisés


𝑠𝑠𝑋𝑋,𝑌𝑌
𝑟𝑟𝑥𝑥,𝑦𝑦 =
𝑠𝑠𝑥𝑥 𝑠𝑠𝑦𝑦

3) Directement avec les scores standardisés


𝑥𝑥𝑖𝑖−𝑚𝑚𝑥𝑥 𝑦𝑦𝑖𝑖−𝑚𝑚𝑦𝑦
∑𝑛𝑛
𝑖𝑖=1 −
𝑆𝑆𝑥𝑥 𝑆𝑆𝑦𝑦
𝑟𝑟𝑋𝑋,𝑌𝑌 =
𝑛𝑛−1

Corrélation = produit moyen des scores standardisés


Ne dit rien sur la causalité
Ne dit rien sur la moyenne
Relation linéaire
Une paire de variable génère uniquement une corrélation
Diagramme de dispersion est indispensable

Corrélation de Spearman
Postulats : Utilisé si Postulats Spearman sont enfreints
Qualitatives ordinales ou quantitatives
Transforme score => estimateur robuste de 𝑟𝑟𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃

Calculs : Comme 𝑟𝑟 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 mais sur les rangs


(Attention ex aequos)

PAGE 11
Tau de Kendall
Mesure d’association basée sur nombre de concordances et discordances dans paires
d’observation (exemple des juges). Observation si variable sont en lien avec les rangs
des autres.

−1 ≤ 𝑟𝑟 𝑡𝑡 ≤ 1

𝑐𝑐 𝑑𝑑
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑒𝑒𝑒𝑒 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 ∶ 𝑟𝑟 𝑡𝑡 = −
𝑐𝑐 + 𝑑𝑑 𝑐𝑐 + 𝑑𝑑
𝑐𝑐 − 𝑑𝑑 2𝑑𝑑
𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 ∶ 𝑟𝑟 𝑡𝑡 = = 1−
𝑛𝑛(𝑛𝑛 − 1)/2 𝑛𝑛(𝑛𝑛 − 1)/2

𝒓𝒓𝒕𝒕 𝒎𝒎𝒎𝒎𝒊𝒊𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍𝒍 𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒑𝒑𝒕𝒕 𝒒𝒒𝒒𝒒𝒒𝒒 𝒓𝒓𝑺𝑺𝑺𝑺 𝒅𝒅𝒅𝒅 𝒑𝒑𝑺𝑺𝑺𝑺

Corrélation bisériale de points


1 variable quantitative
1 variable qualitative (dichotomique)

Calcul : Transformer variable dichotomique en muette


Corrélation de Pearson =>
Coeff corrélation bisériale de point : 𝒓𝒓𝒃𝒃𝒃𝒃
Attention au signe, dépend du codage dicho

Lien avec RLS La variable muette x, la droite de régression est


𝑦𝑦 = 𝑏𝑏0 + 𝑏𝑏1 (𝑥𝑥)
𝑝𝑝𝑝𝑝é𝑑𝑑
Intercept = 𝑏𝑏0 = 𝑏𝑏0 + 𝑏𝑏1 (0) = 𝑦𝑦𝑥𝑥=0 = 𝑚𝑚𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑟𝑟ô𝑙𝑙𝑙𝑙
𝑝𝑝𝑝𝑝é𝑑𝑑
valeur en (x=1) = 𝑏𝑏0 + 𝑏𝑏1 × 1 = 𝑏𝑏0 + 𝑏𝑏1 = 𝑦𝑦𝑥𝑥=1 = 𝑚𝑚𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
ainsi, pente = 𝑏𝑏1 = 𝑚𝑚𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 − 𝑚𝑚𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐ô𝑙𝑙𝑙𝑙

PAGE 12
Coefficient d’association Φ
Deux variables dichotomiques

Calcul Coder les deux variables


Corrélation de pearson
Valeur absolue (Attention au codage)

Lien avec Test indé khi carré Pearson Elles posent les mêmes questions => lien math

𝑥𝑥2
𝑟𝑟 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 = Φ = �
𝑛𝑛

Φ2 = mesure de la taille d’effet du test d’ind. Du khi carré de Pearson


Φ2 = 0 => 𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙, 𝑝𝑝𝑝𝑝𝑝𝑝 𝑑𝑑 ′ 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣
Φ2 = 1 => 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 parfaite𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙𝑙𝑙 2 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣,

−1 ≤ Φ ≤ 1

Φ de Cramer
Ne s’applique qu’au tableau 2x2 (variables dichotomiques)

𝑥𝑥 2
Calcul : Φc = �
𝑛𝑛(𝑞𝑞−1)
q = minimum entre L et C

Dans le 2x2 on retombe sur le Φ


Prob meilleure mesure d’association entre 2 variables qualitatives nominales ou ordinales
Ne dépend pas trop de la taille table
Magnitude, mesure de la taille d’effet du test d’indépendance du khi carré de Pearson

Rapports de cotes
Adapté sur une modalité a de faibles fréquences

PAGE 13
SYNTHESE MESURE D’ASSOCIATIONS

Oui

Lien linéaire, sans


Corrélation de
données extrêmes
Pearson
bivariée
2 variables quantitatives
Corrélation de
Non Spearman

Données en
rangs Tau de Kendall

Mesures d’association 1 quantitative + 1 qualitative Corrélation


bisériale de
points

Rapports de cotes

Oui Coefficient
Φ
2 variables qualitatives 2 modalités
chacune ?

Non

Φ de Cramér

PAGE 14
Régression linéaire simple
2 variables quantitatives
Prédiction score
Hypothèses : ℎ0 ∶ 𝛽𝛽0 = 0
𝛽𝛽1 = 0
ℎ1 ∶ 𝛽𝛽0 ≠ 0
ℎ1 ∶ 𝛽𝛽0 ≠ 0

Equation : 𝑌𝑌 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 En stats (erreur, individu) :𝑌𝑌 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝑒𝑒𝑖𝑖

Pour échantillon e = r car résidus et plus erreur

Postulats : Linéarité (scatterplot)


Postulats sur les résdus 𝑟𝑟𝑖𝑖 ~ 𝑁𝑁(0; 𝜎𝜎 2 )
Distribués normalement
Centrés en 0
Variance des résidus est constante pour toutes
les valeurs du prédicteur
Mesure du prédicteur sans erreur (methodo)

Coefficient de détermination dans la RLS (𝑅𝑅2)


Mesure la proportion de variance Y qui est expliquée par sa relation avec VI

𝑟𝑟 2 = (𝑟𝑟𝑥𝑥,𝑦𝑦 )2
𝑝𝑝𝑝𝑝é𝑑𝑑
R est le coeff de corrélation entre 𝑦𝑦𝑖𝑖 𝑒𝑒𝑒𝑒 𝑦𝑦𝑥𝑥𝑥𝑥

r est une estimation biaisée de p, 𝑹𝑹𝟐𝟐 est une estimation biaisée du coeff de
détermination dans la population

Si trop peu de sujet et ou plusieurs prédicteurs => coef dét ajusté, voir si trop biaisé :

𝑛𝑛 − 1
𝑅𝑅 2 = 1 − (1 − 𝑅𝑅 2 )(
(𝑛𝑛 − 𝑝𝑝 − 1)

Tableau de Statistique de test


Qui Comment
Pearson T de Student à n- 2 ddl
Spearman T de Student à n- 2 ddl
Kendall Z => N(0,1)
Bisériale de point T de Student à n- 2 ddl
Coeff d’association 𝚽𝚽 T de Student à n- 2 ddl
RSL T de Student à n- 2 ddl

PAGE 15
Test t de student

Test T de student Test T de student à deux Test t de Student à deux


à un échantillon échantillons non appariés échantillons appariés

Comparaison des moyennes

Echantillon vs Entre 2 groupes Entre même groupe


réf (moyenne) dans 2 conditions
différentes

𝑋𝑋1 𝑒𝑒𝑒𝑒 2 ~ 𝑁𝑁 (𝑋𝑋1 − 𝑋𝑋2 ) ~ 𝑁𝑁


𝑋𝑋 ~ 𝑁𝑁
Tous les 𝑥𝑥1𝑖𝑖 𝑒𝑒𝑒𝑒 2𝑖𝑖 indépendants Indépendance paires
Tous les 𝑥𝑥𝑖𝑖 x1,x2
indépendants 𝜎𝜎𝑥𝑥21 = 𝜎𝜎𝑥𝑥22 (Homogénéité
variance, Levene) 𝜌𝜌𝑥𝑥1 , 𝑥𝑥2 ≠ 0

Histogramme
Histogramme Histogramme
boxplot
boxplot boxplot
scatterplot

Hypothèses => 𝐻𝐻0 ∶ 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 = 𝐻𝐻1: 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 ≠

Décision => P-valeur < ou > seuil ? Rejet ou non H0 ?

4) Confirmation / Infirmation
2 voies A) Valeur test => p valeur associée
Comparer au seuil alpha (5%,1%,1 ‰)
Pour rejeter => 𝑝𝑝 < 𝛼𝛼

B) Valeur critique statistique associée à 𝛼𝛼


Comparer à la valeur de test

PAGE 16
5) Conclusion
Rejet ou non rejet = décision statistique

Interprétation = psychologique => retour au sujet de l’hypothèse

PAGE 17

Vous aimerez peut-être aussi