Académique Documents
Professionnel Documents
Culture Documents
Démarche hypothético-déductive
Simple à mesure rép. 1 VI ET un seul groupe Plus efficace pour petits Nombre de
dans 2 conditions groupes. Contre- participants réduits
balancement pour éviter mais VP augmentées
retest
PAGE 1
TOUTES LES Vis manipulées ?
Combien de VI ?
1 Plusieurs
PAGE 2
Tableaux / Graphiques
Type Graphique Def + metodo
Echelle nominale ou Diagramme à secteur Camembert, surtout
ordinale utilisé pour freq. Relatives
Diagramme Linéaire Rectangle divisé en autant
de parties que de modalité
Diagramme bandes Axes x,y / même
rectangulaire épaisseur, epace égal
Echelle de rapports ou Diagramme en bâton Similaire diagramme à
d’intervalles avec peu bandes rectangulaires,
de valeur (quant. avec un segment de droite
discrète) plutôt qu’un rectangle
Echelle de rapports ou Histogramme
d’intervalles avec
beaucoup de valeurs
(quant. discrètes avec
bc valeur)
Polygone de fréquence
Courbe fréq relatives
cumulées
Echelles avec peu de Diagramme à bande
modalités rectangulaires chevauchée
Echelles avec bc Diagramme de dispersion Peut être complémenté
modalités avec histogrammes et
boxsplots
Alphabet
Fréquences absolues : Nombre total de données qui présentent une modalité
Pop Ech
Médiane Md md
Moyenne µ m
Variance σ2 s2
Score Z Z z
Phi Φ
Khi carré χ2
Seuil alpha α
PAGE 3
3) Analyse empirique
Types de variables
Echelle de mesure
Echelle Variable Origine Unité Utilité Relations Calcul MTC
autorisé
Nominale Qual. Aucune Aucune Coder =, ≠ Aucune Mode
PAGE 4
Mesure de tendance centrale
Mode : Distribution unimodale – seul choix p/ échelle nominale
Valeur la plus fréquente (ou classe modale si groupées)
• Au moins ordinale
• Vérif si distrib normale avec moyenne
• Distrub. Asymétriques et unimodales
Qualitatif ordinale => n/2 si pair
=>(n+1) /2 si impair
Quantitatifs => Moyenne de n/2 et (n/2) +1 si pair
∑𝑛𝑛
𝑖𝑖=1 𝑋𝑋𝑋𝑋
𝑛𝑛 (𝑜𝑜𝑜𝑜 𝑁𝑁 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑝𝑝𝑝𝑝𝑝𝑝)
Mesure de dispersion
Etendue : Très sensible aux valeurs extrêmes (non robuste)
Echelles ordinales ou supérieures
Différence entre la valeur la plus élevée et la plus faible
Mesure de positions
Rangs Position d’une donnée dans une série statistique ordonnée.
Echelles ordinales ou supérieures
PAGE 5
Le score Z Score standardisé
Combien d’écarts-type au-dessus ou au-dessous de la moyenne
Echelles d’intervalles ou supérieures
Score compris entre -3 et 3
Valeur sans unité : 𝒎𝒎𝒛𝒛 = 𝟎𝟎 𝒔𝒔𝒛𝒛 = 𝟏𝟏
𝑋𝑋𝑖𝑖 −𝜇𝜇𝑥𝑥
𝑍𝑍𝑖𝑖 =
𝜎𝜎𝑥𝑥
Type de Variables
Distribution normale ?
Tableau Fréquence
(modalités ou valeurs)
Non Oui
1) Calculez le score Z
2) Trouver la proba.
PAGE 6
Distribution normale
Loi normale : Variable quantitative continue
Variance et moyenne doivent être proche
PAGE 7
Probabilités, généralités
Evènements indépendants Occurrence de l’un n’a pas d’influence sur l’autre
Probabilités,propriétés
1. Entre 0 et 1
2. Loi additive des probabilités : Si mutuellement exclusifs
Pr(𝐴𝐴 𝑜𝑜𝑜𝑜 𝐵𝐵) = Pr(𝐴𝐴) + Pr (𝐵𝐵)
3. Sommes des probabilités événements indépendants, mutuellement
exclusifs et exhaustifs est : 1.
a) Variable aléatoire est non continue :Variables qual. et quant discrètes
b) Variable aléatoire est continue : Variable quantitative continue
PAGE 8
Décision rejet H0, H1
La vérité
Décision H0 (Non-rejet) Pas H0 (Rejet)
Rejet H0 Erreur type 1 (Pr = Alpha Rejet correct
Faux positif)
Non Rejet H0 Non rejet correct Erreur type II (Faux nég)
Type de variable :
Distribution du χ2
PAGE 9
K= Degrés de liberté (DDL)
Estime la probabilité d’avoir obtenu les résultats observés si H0 était valable
χ2 d’ajustement χ2 d’indépendance
∑(𝑂𝑂−𝐸𝐸)2
Calculer valeur de test VT 𝑥𝑥 2 =
𝐸𝐸
𝑥𝑥 2
𝑥𝑥 2 Taille d’effet ∅ = �
Taille d’effet 𝜔𝜔 = � 𝑛𝑛(𝑞𝑞−1)
𝑛𝑛
q=min(L,C)
PAGE 10
Corrélation de Pearson
2 variables quantitatives continues (ou discrète avec beaucoup de valeurs)
Déterminer si évolution commune, liens entre cause comportement /comportement
-1 à 1
Postulats : Linéaire
Absence de valeurs extrêmes bivariées
Graphiques : Diagramme de dispersion (scatterplot)
Histogrammes / Boxplots
∑𝑁𝑁
𝑖𝑖=1(𝑋𝑋𝑖𝑖− 𝜇𝜇𝑥𝑥 )(𝑦𝑦𝑖𝑖 −𝜇𝜇𝑦𝑦 ) ∑𝑁𝑁
𝑖𝑖=1(𝑥𝑥𝑖𝑖− 𝑚𝑚𝑥𝑥 )(𝑦𝑦𝑖𝑖 −𝑚𝑚𝑦𝑦 )
𝜎𝜎𝑥𝑥,𝑦𝑦 = 𝑆𝑆𝑥𝑥,𝑦𝑦 =
𝑁𝑁 𝑛𝑛−1
Corrélation de Spearman
Postulats : Utilisé si Postulats Spearman sont enfreints
Qualitatives ordinales ou quantitatives
Transforme score => estimateur robuste de 𝑟𝑟𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃
PAGE 11
Tau de Kendall
Mesure d’association basée sur nombre de concordances et discordances dans paires
d’observation (exemple des juges). Observation si variable sont en lien avec les rangs
des autres.
−1 ≤ 𝑟𝑟 𝑡𝑡 ≤ 1
𝑐𝑐 𝑑𝑑
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑒𝑒𝑒𝑒 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 ∶ 𝑟𝑟 𝑡𝑡 = −
𝑐𝑐 + 𝑑𝑑 𝑐𝑐 + 𝑑𝑑
𝑐𝑐 − 𝑑𝑑 2𝑑𝑑
𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 ∶ 𝑟𝑟 𝑡𝑡 = = 1−
𝑛𝑛(𝑛𝑛 − 1)/2 𝑛𝑛(𝑛𝑛 − 1)/2
PAGE 12
Coefficient d’association Φ
Deux variables dichotomiques
Lien avec Test indé khi carré Pearson Elles posent les mêmes questions => lien math
𝑥𝑥2
𝑟𝑟 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 = Φ = �
𝑛𝑛
−1 ≤ Φ ≤ 1
Φ de Cramer
Ne s’applique qu’au tableau 2x2 (variables dichotomiques)
𝑥𝑥 2
Calcul : Φc = �
𝑛𝑛(𝑞𝑞−1)
q = minimum entre L et C
Rapports de cotes
Adapté sur une modalité a de faibles fréquences
PAGE 13
SYNTHESE MESURE D’ASSOCIATIONS
Oui
Données en
rangs Tau de Kendall
Rapports de cotes
Oui Coefficient
Φ
2 variables qualitatives 2 modalités
chacune ?
Non
Φ de Cramér
PAGE 14
Régression linéaire simple
2 variables quantitatives
Prédiction score
Hypothèses : ℎ0 ∶ 𝛽𝛽0 = 0
𝛽𝛽1 = 0
ℎ1 ∶ 𝛽𝛽0 ≠ 0
ℎ1 ∶ 𝛽𝛽0 ≠ 0
Equation : 𝑌𝑌 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 En stats (erreur, individu) :𝑌𝑌 = 𝛽𝛽𝑜𝑜 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝑒𝑒𝑖𝑖
𝑟𝑟 2 = (𝑟𝑟𝑥𝑥,𝑦𝑦 )2
𝑝𝑝𝑝𝑝é𝑑𝑑
R est le coeff de corrélation entre 𝑦𝑦𝑖𝑖 𝑒𝑒𝑒𝑒 𝑦𝑦𝑥𝑥𝑥𝑥
r est une estimation biaisée de p, 𝑹𝑹𝟐𝟐 est une estimation biaisée du coeff de
détermination dans la population
Si trop peu de sujet et ou plusieurs prédicteurs => coef dét ajusté, voir si trop biaisé :
𝑛𝑛 − 1
𝑅𝑅 2 = 1 − (1 − 𝑅𝑅 2 )(
(𝑛𝑛 − 𝑝𝑝 − 1)
PAGE 15
Test t de student
Histogramme
Histogramme Histogramme
boxplot
boxplot boxplot
scatterplot
4) Confirmation / Infirmation
2 voies A) Valeur test => p valeur associée
Comparer au seuil alpha (5%,1%,1 ‰)
Pour rejeter => 𝑝𝑝 < 𝛼𝛼
PAGE 16
5) Conclusion
Rejet ou non rejet = décision statistique
PAGE 17