Académique Documents
Professionnel Documents
Culture Documents
AU : 2020-21
Rappels statistiques
Statiqtique Bivariée
a) Test d’indépendance
1. Variable aléatoire à caractère qualitatif :
Comparaison de plusieurs répartitions observées
2. Variable aléatoire quantitative
Régression simple
Régression du second degré
Test de signification de corrélation
Précision de la corrélation
Statistique bivariée
V- Test d’indépendance :
5.1 Variable aléatoire à caractère qualitatif :
43
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
. .
. .
. .
. .
²
O ij C ij
2
C ij
ddl l 1r 1
3- On lit le ² théorique dans la table au seuil de signification choisi α et si:
² ² H0 est rejetée : il y a une dépendance entre les variables, et si
² < ² H0 est acceptée : il y a une indépendance entre les variables.
44
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
²
25 20,49
2
215 216,9
2
200 201,84
2
60 61,47
2
15 19,51
2
207 205,81 2
194 192,15 2
60 58,52 2
45
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
Les graphes suivants indiquent les 3 cas de dépendance qui peuvent se présenter entre 2
variables aléatoires x et y:
y y
x x
Liaison fonctionnelle linéaire Liaison non fonctionnelle
(dépendance idéale) (Indépendance)
y
y = ax + b
x
Liaison fonctionnelle
expérimentale
C’est cette dernière liaison fonctionnelle qui va faire l’objet d’étude dans ce qui suit:
Déterminer une corrélation entre 2 VA revient à caractériser leur degré de dépendance par
un coefficient numérique.
Régression simple
On cherche á trouver une liaison mathématique entre les variables Y et X, qui peut être
un modèle déterministe traitant des variable déterministes « prises » sans perturbation ε
ou bien un modèle stochastique (probabiliste) traitant des variables aléatoires soumises á
l’expérimentation affectés á un risque d’erreur donné.
Yi = a Xi + b modèle déterministe.
Yi = a Xi + b+ i modèle stochastique (probabiliste).
Avec
Notre objectif est de déterminer le model stochastique qui semble être plus proche á la
réalité, Y = a X + b + avec l’hypothèse que i = 0.
46
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
y
y=ax+b
yi
e
yi*
xi x
e y i y *i 0
y
i y*i ² soit le minimum possible (méthode des moindres carrés).
y y = 0
i
*
i
y i ax i b 0
y ax b 0
i i
y i a x i Nb 0 N : taille de l’échantillon
47
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
y x
y a x Nb b a
i i
i
N N
b y aX
X : moyenne de la variable X
Y : moyenne de la variable Y
y i
y i* ² y i axi b ²
y i axi y ax ²
y i y a xi x ²
yi y a 2 xi x ² 2a yi y xi x
2
a
yi y 2 a 2 xi x ² 2a yi y xi x 0
a
y yx x
i i
x x ² i
y yx x
i i
N Covx, y
a
x i x ²
Var x
N
Exemple: soit un échantillon avec la distribution suivante :
xi 2 5 7 10 12 14
yi 7 11 14 18 20 23
48
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
y
C
x x ² x x ²y y
i i i
x x ² N x x
i
2
i
4
b
x x ²y y
i i
x x ² i
N.C
a
x i x ²
Coefficient de corrélation
L’intensité de la corrélation entre les variations de x et celles de y est mesurée par le
coefficient de corrélation de Pearson qui est un terme sans dimension, il est exprimé en
% et compris entre -1 et +1. Il vaut +1, ou -1 dans le cas d’une liaison fonctionnelle, il
vaut 0 dans le cas où il y a une indépendance (pas de corrélation) entre X et Y.
y
y = -ax + b
y = ax + b
x
49
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
r
Cor x, y
x i x y i y
Cor x, y
Var x .Var y xi x ².y i y² x . y
Remarque : Dans la pratique on utilise parfois le r², qui est évidemment positif [0,1], et
est appelé coefficient de détermination.
50
Polycopie de Biostatistique Pr. Azouzi B. AU : 2020-21
Rappels statistiques
r
t n2
1 r2
Puis comparer ce t ainsi avec le tα de Student lu á partir de la table de Student au seuil α et
avec un ddl = n- 2. H0 sera rejetée indiquant une corrélation significative quant t ≥ tα
51