Académique Documents
Professionnel Documents
Culture Documents
Dr Zourkaléni Younoussi
objectifs
• On s’intéresse maintenant à l’étude
simultanée de deux variables, notées X et Y,
observées sur le même échantillon.
• Il s’agit de mettre en évidence des liaisons
éventuelles entre les deux variables;
• Introduire des graphiques spécifiques
exprimant cette liaison.
• Introduire des caractéristiques numériques
spécifiques exprimant cette liaison.
introduction
• On s’intéresse à deux variables X et Y.
• Ces deux variables sont mesurées sur le n unité
d’observation.
• Pour chaque unité statistique, on obtient donc
deux mesures.
• La série statistique est alors une suite de n
couples des valeurs prises par les deux
variables sur chaque individu: (X1, Y1), . .,
(Xi, Yi),… (Xn, Yn).
introduction
• Chacune des deux variables peut être, soit
quantitative, soit qualitative.
• Nous allons examiner trois cas:
• Les deux variables sont quantitatives.
• Les deux variables sont qualitatives.
• Une variable quantitative et une variable
qualitative
Deux variables quantitatives
• Représentation graphique des deux variables
• Pour étudier la liaison entre deux variables
quantitatives (discrètes), on commence par
faire un graphique.
• Ce graphique s’appelle « nuage de points ».
• L’allure générale des nuages peut nous
indiquer s’il existes ou non une liaison entre
les deux variables.
Représentation graphique: les nuages des points
• Cov(XY)= sXY=Sxy=1/n£(xi-x')(yi-y')=1/n£(xiyi)-
(x'y')
• Comme la variance, la covariance n'a pas de
signification concrète
• Dans le cas de la variance, on doit passer à l'écart-
type pour avoir un indicateur interprétable; dans
celui de la covariance, il faudra passer au
coefficient de corrélation linéaire
Coefficient de corrélation linéaire
• Corr(X,Y)=rxy=Sxy/SxSy
• rxy=coefficient de corrélation linéaire
• Sxy=covariance de X et Y
• Sx=Écart-type de X
• S'y=Écart-type de Y
Coefficient de corrélation linéaire
• Rxy= coefficient de corrélation linéaire
• Sxy= Covariance de X et Y
• Sx= Ecart-type de X
• Sy= Ecart-type de Y
Interprétation du coefficient de corrélation linéaire
Xi 4 10 16 8 20 24 14 6 18 22
Yi 2 5 8 4 10 12 7 3 9 11
Questions
1) représentez le nuage de points
2) calculer le coefficient de corrélation entre X et
Y
3) déterminer la droite de régression de Y en
fonction de X
4) déterminer la qualité de cet ajustement
5) établissez sur la base de modèle le nombre de
jours d’absence pour un fonctionnaire qui a 26
ans de service
1) représentez le nuage de points
Valeur des Y
14
12
10
8 Valeur des Y
6
0
0 2 4 6 8 10 12
2) calculer le coefficient de corrélation entre X et Y
Xi 4 10 16 8 20 24 14 6 18 22 T:14
2
Yi 2 5 8 4 10 12 7 3 9 11 T:71
XiYi 8 50 128 32 200 288 98 18 162 242 T:122
6
X² 16 100 256 64 400 576 196 36 324 484 T:245
2
Y² 4 25 64 16 100 144 49 9 81 121 T:613
3) déterminer la droite de régression de Y en fonction de X
Deux variables quantitatives
tableau,
• Nj représente le nombre de Xj nj1 ------- njk ------- njK nj
fois que la modalité xj
apparaît,
XJ nJ1 ------ nJk ------- nJK nJ
• Nk représente le nombre de
fois que la modalité yk
apparaît T n1 -------- nk -------- nK n
G 20 40 60 120
G 30*20/200
F 12 24 44 80
G 18 36 66 120
A B C D
53 50 52 59
47 54 56 60
47 53 57 59
49 51 60 52
48 49 56 64
52 52 55 58
50 51 53 63
46 55 54 61
Relation entre Y variable quantitative
continue et X variable catégorielle
• Si le rendement (Y) ne dépendait que de la
variété des plantes (X), le rendement de chaque
variété de blé serait différent des autres et n’y
aurait aucune différence de rendement sur les
parcelles plantées d’une même variété.
• En d’autre terme, les rendements des 4 variétés
seraient différents et homogènes: dans ce cas,
Y(le rendement) serait totalement et
exclusivement fonction de X (la variété plantée).
Relation entre Y variable quantitative
continue et X variable catégorielle
• Dans les faits, le rendement dépend aussi d’autres
facteurs comme la qualité des sols, l’humidité et
l’ensoleillement des parcelles… et il y’a donc des
différences de rendement entre celle plantée de la
même variété de blé comme le montre le tableau.
• La relation entre Y, variable quantitative, et X
variable catégorielle est forte si, pour l’ensemble
des classes de X les moyennes de Y sont très
différentes et les variances autour ces moyennes
petites.
Relation entre Y variable quantitative
continue et X variable catégorielle
• Intensité de la relation= sce interclasses/sce
totale
• Celle-ci varie entre:
• 0 pas de relation (moyennes de classes
confondues variation intra-classes importante)
• relation absolue (forte différence des
moyenne, très faible sce intra-classes)
Relation entre Y variable quantitative
continue et X variable catégorielle
• Sce: Somme des Carrés des Ecarts
• Sce totale: nSy²
• Sce interclasses=
• Où K est le nombre des classes de X
• Ng= effectif de la classe g
• Mg= la moyenne de la classe g
• M= la moyenne générale
Relation entre Y variable quantitative
continue et X variable catégorielle
• Sce totale= Sce interclasses + Sce intra-classes
• Sce interclasses (long à calculer) s’obtient
souvent par la relation:
• Sce interclasses= Sce totale – Sce intra-classe
Relation entre Y variable quantitative
continue et X variable catégorielle
Tableau 2: Moyenne et variance des rendements des quatre
variétés de blé
Variété Nombre de Rendement Variance de Sce* aux
parcelles moyen rendement moyennes
A 8 49 5,5 44
D 8 60,5 5,25 42
F(0)=Pr(X<0)=0
F(1)=Pr(X<1)=1/4
F(2)=Pr(X<2)=Pr(X=0)+Pr(X=1)=1/4+1/8=3/8
F(3)=Pr(X<3)=Pr(X=0)+Pr(X=1)+Pr(X=2)=1/4+1/8+1/8=4/
variable aléatoire continue
• Une variable aléatoire est dite continue si elle
peut prendre toute les valeurs possibles entre
les limites données.
• Exemple: la distance d’un projectile dans un
tir.
• La fonction de répartition est:
• F(x)=Pr{X<x}
variable aléatoire continue
• On définit la probabilité pour que X prenne une valeur
appartenant à l’intervalle [a,b[
• Pr{a< ou =X<b}= F (b)-F(a)
• La probabilité d’un point au sens mathématique est nulle.
Par exemple dans le cas du projectile on dira entre deux
distances données, il y a une infinité non dénombrable de
distances possibles.
• On définit une densité de probabilité de la variable
aléatoire pour une valeur de x
• f(x)=F’(x) , en supposant que F(x) est dérivable, avec f(x)
positive ou nulle.
variable aléatoire à deux dimensions
• On peut considérer à la fois le nombre de
fleurs X et le nombre Y de feuilles de la plante.
Le couple (X,Y) est une variable à deux
dimensions
• Pr{X=x et Y=y}=Pxy :loi de probabilité du
couple (X,Y)
• Les distribution marginales sont:
• Px.=Pr{X=x} et Py.={Y=y}
variable aléatoire à deux dimensions
• Les distributions conditionnelles sont telle que:
• Pr{X=x/Y=y}=Pxy/P.y (probabilité pour que X=x sachant
que Y=y)
• Pr{Y=y/X=y}=Pxy/Px.
• La fonction de répartition est définie par:
• F(x, y)=Pr{X<x et Y<y) pour X et Y discrètes ou
continues
• Lorsque X et Y sont continues il est possible de définir
la probabilité pour que (X et Y) soit dans un rectangle :
Pr{a<X<b et c<Y<d}
Espérance mathématique
• L’ Espérance mathématique est une moyenne
des valeurs possibles de x pondérées de ses
valeurs
• De façon générale, si X est une variable
aléatoire discrète prenant n valeurs x1,x2,…xn
avec les probabilités p1,p2,…pn on définit son
Espérance mathématique par: E(x): {xi.p(xi).
Espérance mathématique
• Exemple: calculez l’ espérance mathématique
de la variable aléatoire nombre de fleurs par
plante
• E(X)= 0*1/4 + 1*1/8 + 2*1/8 + 3*3/8 + 4*1/8 =
16/8 =2 fleurs
• En moyenne
Exo Espérance mathématique
• Un chef de service commercial estime avoir
une probabilité de 0,6 de faire gagner 50 000
000F Cfa à une entreprise en faisant une
opération. Si cette opération est manqué, la
perte est de 10 000 000F Cfa. Quelle est l’
Espérance mathématique du gain ?
correction
xi 50 M -10 M
XiP(x) 30 M -4 M
E(x) = 30M - 4M
E(x) = 26M
Exo Espérance mathématique
• E(X)=0+1/2+1/2=1
Espérance mathématique
• Propriété:
• Pour deux variables aléatoires quelconques:
E(X+Y)=E(X)+E(Y)
• E(XY)=E(X)*E(Y)
• E(ax+b)=aE(X)+b avec a et b des constantes
Variance et moment d'une variable
aléatoire
• La variance d'une variable aléatoire V(X) est
l'espérance mathématique du carré de l'écart à
l'espérance mathématique
• V(X)=E([X-E(x)]²)
• On définit l'écart-type de la variable aléatoire
comme la racine carrée de la variance
ox=√V(X)
• On définit les moments d'ordre q d'une
variable aléatoire mq=E(Xq)
Variance et moment d'une variable
aléatoire
• L'espérance mathématique est le moment
d'ordre 1
• V(X)=m2-m1²
• V(X+Y)=V(X)+V(Y)+2cov(X,Y). Avec cov(X,Y)=
E([X-E(X)][Y-E(Y)])
• V(aX)=a²V(X)
Loi binomiale
• Lorsque les éventualités se réduisent à une
alternative: succès ou échecs, la variable aléatoire
«nombre de succès» suit une loi de probabilité
appelée loi binomiale, si:
• Chaque épreuve donne lieu à deux éventualités
exclusives de probabilité constante p(succès) et
donc q=1-p(échec)
• Les épreuves répétées sont indépendantes
• La variable binomiale X est une somme de variable
Bernoulli ou variables indicatrices
Exo loi binomiale
• Une variable de Bernoulli X à la loi de
probabilité suivante:
• Pr(X=X) ou X prend les valeurs 0(échec) et
1(succès)
• D'où E(X)=P et V(X)=p-p²=p(1-p)=pq
Correction
• Loi de probabilité de Bernoulli
X 0 1
P(x) q p
XiP(x) 0 p
• E(X)=£xip(xi)=0+p=p
• E(X)=p
• V(X)=m2-m1²
• m2=£xi²p(xi)=0+p
• m2=p
• m1=p
• V(X)=p-p²=p(1-p) or 1-p=q
• V(X)=pq
• Cette loi dépend de deux paramètres n et p,
c'est pourquoi on la note B(n,p)
• Caractéristiques de B(n,p):
• E(X)=np et V(X)=npq
Loi de Poisson
• On appelle processus de Poisson, la réalisation
d'événements aléatoires dans le temps et dans
l'espace, obéissant aux conditions suivantes:
• La probabilité de réalisation de l'événement au
cours d'une petite période où sur une portion de
l'espace ∆t est proportionnelle à ∆t, soit p∆t;
• elle est indépendante de ce qui s'est produit
antérieurement ou à côté;
Loi de Poisson
• la probabilité de deux apparitions sur le même
∆t est négligeable
• Exemple 1: des événements qui se réalisent de
façon aléatoire dans le temps: appels
téléphoniques sur un central; pannes de
machines; arrivées à un péage d'autoroute ou
à un guichet de vente; peuvent être
considérés comme réalisées par un processus
de Poisson
Loi de Poisson
• Exemple 2: des événements qui se réalisent de façon
aléatoire dans l'espace: répartition des points au hasard
sur une droite; Bosquets, observées dans une zone
peuvent être considérés comme réalisées par un
processus de Poisson
• Le nombre X d'événements aléatoires sur un intervalle T
est alors une variable aléatoire qui suit une loi de
poisson
• X prend les valeurs 0,1,2,3 ... mais en principe se peut
être infini, toutefois la probabilité diminue lorsque x
augmente
Table de la loi de poisson
• L'établissement de la table permet de
constater que la répartition est toujours
dissymétrique et que la probabilité tend
rapidement vers zéro lorsque x augmente
• On lit par exemple la loi de poisson de
paramètre 2, la probabilité pour que X=0 est
0,1353
Exo loi de poisson
• Pour X suivant une loi de poisson de
paramètre 4, quelle est la probabilité pour que
X soit inférieur à 8 ? Quelle est la probabilité
pour que X soit compris entre 4 et 10
Loi binomiale
• On parle de loi binomiale ou loi de Laplace-
Gouss ou encore deuxième loi de Laplace,
lorsque l'on a à faire à une variable aléatoire
continue dépendant d'un grand nombre de
causes indépendantes dont les effets
s'additionnent et dont aucune n'est
prépondérante
Loi binomiale
• Exemple 1: les dimensions de pièces fabriquées
dépendant:
• au règle de l'appareil de fabrication
• des variations auxquelles elle est soumise
• de l'homogénéité de la matière première
• de la température de l'humidité
• Lorsque tous ces facteurs sont indépendants et
qu'aucun n'est prépondérants, on peut supposer que
les dimensions des pièces suivent une loi normale
Loi binomiale
• Exemple 2: des erreurs de mesure, des temps
nécessaires pour accomplir le même travail....
Suivent également dans certaines conditions,
une loi normale
• La loi de probabilité dépend de deux
paramètres m et o et on l'écrit N(m,o)
• L'espérance mathématique, la médiane et le
mode sont égaux à m et l'écart-type est égal à
o
Loi binomiale
• On a l'habitude d'effectuer un changement de
la variable:
• T(X-m/o) cette loi est notée N(0,1)
• L'espérance mathématique, la médiane et son
mode sont égaux à 0 et son écart-type à 1
Variable de la loi normale
• C'est cette loi normale centrée réduite qui est
souvent tabulée mais il existe aussi une table de
fonction de répartition t
• On lit sur le table de la loi normale centrée
réduite la valeur de t telle que Pr(|T|
>1,96)=0,05
• Il est bon de connaître les résultats suivants:
• Pr(-1,96<T<1,96)=0,95
• Pr(-2,58<T<2,58)=0,99
Variable de la loi normale
• Pr(-1,96<T<1,96)
• Pr(|T|<1,96)?
• Pr(|T|>1,96)=0,05
• Pr(|T|>1,96)+Pr(|T|<1,96)=1
• Pr(|T|<1,96)=Pr(|T|>1,96) -1
• Pr(|T|<1,96)=1-0,05
• Pr(|T|<1,96)=0,95
Variable de la loi normale
• Pr(-2,58<T<2,58)=0,99
• Pr(|T|<2,58)?
• Pr(|T|>2,58)+Pr(|T|<2,58)=1
• Pr(|T|<2,58)=Pr(|T|>2,58) -1
• Pr(|T|<2,58)=1-0,01
• Pr(|T|<2,58)=0,99
• IL existe aussi une table de la fonction de répartition de t
F(T)=Pr(T<t)
• On lit, par exemple, que la probabilité pour que T doit inférieur à
0,83 est 0,7967
• Lorsque t est négatif on raisonne par symétrie: la probabilité pour
que T soit inférieur à -0,83 est=1-0,7967=0,2033
Exercice lecture de table
• T suit une loi N(0,1) quelle est la probabilité:
• Pour que T<1,2 ?
• Pour que 0,8<T<1,2 ?
• Pour que T<-1,2 ?
• Pour que -0,4<T<1,5 ?
• X est une variable aléatoire qui suit une loi
normale de moyenne 3 et d'écart-type 2
• Calculer les probabilités suivantes: Pr(1≤X≤2)