Vous êtes sur la page 1sur 95

Statistique descriptive bivariée

Dr Zourkaléni Younoussi
objectifs
• On s’intéresse maintenant à l’étude
simultanée de deux variables, notées X et Y,
observées sur le même échantillon.
• Il s’agit de mettre en évidence des liaisons
éventuelles entre les deux variables;
• Introduire des graphiques spécifiques
exprimant cette liaison.
• Introduire des caractéristiques numériques
spécifiques exprimant cette liaison.
introduction
• On s’intéresse à deux variables X et Y.
• Ces deux variables sont mesurées sur le n unité
d’observation.
• Pour chaque unité statistique, on obtient donc
deux mesures.
• La série statistique est alors une suite de n
couples des valeurs prises par les deux
variables sur chaque individu: (X1, Y1), . .,
(Xi, Yi),… (Xn, Yn).
introduction
• Chacune des deux variables peut être, soit
quantitative, soit qualitative.
• Nous allons examiner trois cas:
• Les deux variables sont quantitatives.
• Les deux variables sont qualitatives.
• Une variable quantitative et une variable
qualitative
Deux variables quantitatives
• Représentation graphique des deux variables
• Pour étudier la liaison entre deux variables
quantitatives (discrètes), on commence par
faire un graphique.
• Ce graphique s’appelle « nuage de points ».
• L’allure générale des nuages peut nous
indiquer s’il existes ou non une liaison entre
les deux variables.
Représentation graphique: les nuages des points

• Il consiste à considérer deux axes


perpendiculaires, l’axe horizontal représentant
la variable X et l’axe vertical la variable Y;
• Puis à représenter chaque individu observé i
par le point d’abscisse Xi et d’ordonnée Y.
• L’ensemble de ces points est appelé « nuage
de points »
Exemple 1: on mesure le poids Y et la taille X de 20 individus

Yi (poids) Xi(taille) Yi(poids) Xi(taille)


60 155 75 180
61 162 76 175
64 157 78 173
67 170 80 175
68 164 85 179
69 162 90 175
70 169 96 18O
70 170 96 185
72 178 98 189
73 173 101 187
Nuage de point
Valeur des X
200
180
160
140
120
Valeur des X
100
80
60
40
20
0
0 5 10 15 20 25
Calcul d’un indice
• Il faux définir un indicateur (ou un indice)
rendant compte numériquement de la
manière dont les deux variables considérées
varient simultanément.
• Autrement dit, il s’agit de définir un indice de
liaison entre les deux variables considérées.
• Cet indice est le coefficient de corrélation
linéaire . Il insiste la définition préalable de la
covariance.
La covariance
• La covariance est la moyenne des produits des
écarts aux moyennes (dans chaque produit,
chacun de deux écarts est relatif à l’une de
deux variables considérées)
• On peut, là encore retenir son expression sous
la forme suivante: c’est la moyenne des
produits moins le produit des moyennes.
La covariance

• Cov(XY)= sXY=Sxy=1/n£(xi-x')(yi-y')=1/n£(xiyi)-
(x'y')
• Comme la variance, la covariance n'a pas de
signification concrète
• Dans le cas de la variance, on doit passer à l'écart-
type pour avoir un indicateur interprétable; dans
celui de la covariance, il faudra passer au
coefficient de corrélation linéaire
Coefficient de corrélation linéaire
• Corr(X,Y)=rxy=Sxy/SxSy
• rxy=coefficient de corrélation linéaire
• Sxy=covariance de X et Y
• Sx=Écart-type de X
• S'y=Écart-type de Y
Coefficient de corrélation linéaire
• Rxy= coefficient de corrélation linéaire
• Sxy= Covariance de X et Y
• Sx= Ecart-type de X
• Sy= Ecart-type de Y
Interprétation du coefficient de corrélation linéaire

• Le Coefficient de corrélation linéaire prend des


valeurs comprises entre -1 et 1
• Le signe du coefficient : indique le sens de la
liaison.
• Ainsi, une valeur positive indique que les deux
variables ont tendance à varier dans le même sens.
• Au contraire, une valeur négative indique que les
deux variables ont tendance à varier en sens
opposés
Interprétation du coefficient de corrélation linéaire

• La valeur absolue du coefficient : indique


l’intensité de la liaison.
• Plus cette valeur absolue est proche de 1, plus
le liaison est faible
• Ainsi, un coefficient de corrélation linéaire de
0,9 indique une liaison très forte
• Ainsi, un coefficient de corrélation linéaire de
0,5 indique une liaison moyenne.
• Les valeurs -1 et 1 correspondent à une liaison
de corrélation linéaire parfaite
• Exemple: a partir du tableau de l’exemple
poids-taille, calculer le coefficient de
corrélation linéaire et interpréter le résultat
Le coefficient de corrélation
Yi (poids) Xi(taille) YiXi Yi(poids) Xi(taille) YiXi
60 155 9300 75 180 13500
61 162 9882 76 175 13300
64 157 10048 78 173 13494
67 170 11390 80 175 14000
68 164 11152 85 179 15215
69 162 11178 90 175 15750
70 169 11830 96 18O 17280
70 170 11900 96 185 17760
72 178 12816 98 189 18522
73 173 12629 101 187 18887
TOTAL 1549 3458 269833
Tableau de calcul d’apres les données de l’exemple
Yi(poids) Xi(taille) Xi² Yi² YiXi
1 60 155 24250 3600 9300
2 61 162 26244 3721 9882
3 64 157 24649 4096 10048
4 67 170 28900 4489 11390
5 68 164 26896 4624 11152
6 69 162 26244 4761 11178
7 70 169 28561 4900 11830
8 70 170 28900 4900 11900
9 72 178 31684 5184 12816
10 73 173 29929 5329 12629
11 75 180 32400 5625 13500
12 76 175 30625 5776 13300
13 78 173 29929 6084 13494
14 80 175 30625 6400 14000
Moyennes et corrélation
nature indicateur
Moyenne Y 77,45
Moyenne X 172,9
Variance Y 154,O475
Écart-type de y 12,4115873
Variance X 85,19
Écart-type X 9,2298429
Covariance (X,Y) 100,545
Coefficient de corrélation 0,87768534
Droite de régression linéaire
• Lorsque deux variables quantitatives sont
correctement corrélées (|rxy| voisin de 1) et;
• Que l’on peut considérer, a priori, que l’une
est cause de l’autre.
• Il est alors assez naturel de chercher une
fonction de X approchant Y , ‘’le mieux
possible’’.
Droite de régression linéaire
• La méthode statistique permettant de trouver
une telle fonction s’appelle la régression de Y
sur X.
• On considère que la variable X est explicative
et que la variable Y est dépendante.
• L’équation de la droite de régression est:
• Y=b+ax.
droite de régression
• r² : coefficient de détermination
• Le coefficient de détermination mesure le
pourcentage de variance du nuage de points
pris en compte par la régression : (0,88)² dans
le cas de notre exemple.
• Le coefficient de détermination mesure la
qualité de l’ajustement et il varie entre
• 0 (indépendance totale entre X et Y)
• 1(dépendance linéaire absolue)
Considérons un échantillon de 1O fonctionnaires (ayant 40 et 50 ans) d’un
ministère. Soit X le nombre d’année de service et Y le nombre de jours
d’absence pour une raison de maladie (au cours de l’année précédente)
déterminé pour chaque personne appartenant à l’échantillon.

Xi 4 10 16 8 20 24 14 6 18 22

Yi 2 5 8 4 10 12 7 3 9 11
Questions
1) représentez le nuage de points
2) calculer le coefficient de corrélation entre X et
Y
3) déterminer la droite de régression de Y en
fonction de X
4) déterminer la qualité de cet ajustement
5) établissez sur la base de modèle le nombre de
jours d’absence pour un fonctionnaire qui a 26
ans de service
1) représentez le nuage de points
Valeur des Y
14

12

10

8 Valeur des Y
6

0
0 2 4 6 8 10 12
2) calculer le coefficient de corrélation entre X et Y

Xi 4 10 16 8 20 24 14 6 18 22 T:14
2
Yi 2 5 8 4 10 12 7 3 9 11 T:71
XiYi 8 50 128 32 200 288 98 18 162 242 T:122
6
X² 16 100 256 64 400 576 196 36 324 484 T:245
2
Y² 4 25 64 16 100 144 49 9 81 121 T:613
3) déterminer la droite de régression de Y en fonction de X
Deux variables quantitatives

• Si les Deux variables x et y sont quantitatives, alors les


données observées sont une suite de couples de variables
• (X1 , Y1),…,(Xi , Yj),…, (Xn ,Yn),
• Chacune de deux variable prend comme valeurs des
modalités qualitatives.
• Les valeurs distinctes de x et y sont notées
respectivement
• X1,…, Xj,…, Xj.
• Et
• Y1,…, Yk,…Yk.
Tableau de
contingence
• Les nj et nk sont appelés les Y1 -------- Yk -------- YK total

effectifs marginaux. Dans ce X1 n11 ------ n1k ------- n1K n1

tableau,
• Nj représente le nombre de Xj nj1 ------- njk ------- njK nj
fois que la modalité xj
apparaît,
XJ nJ1 ------ nJk ------- nJK nJ
• Nk représente le nombre de
fois que la modalité yk
apparaît T n1 -------- nk -------- nK n

• Njk représente le nombre de


fois que les modalités xj et
yk apparaissent ensemble.
Exemple de Tableau de contingence
• On s’intéresse à une
éventuelle relation Bien Asse Pass Tota
z able l
entre le sexe de 200 bien
élèves et la mention
obtenue au Bac
F 10 20 50 80

G 20 40 60 120

Total 30 60 110 200


Exemple: tableau de fréquence
Bien Assez Passable Total
bien
Femme 0,05 O,1 0,O25 0,4

Homme 0,1 0,2 0,3 0,6

Total 0,15 0,3 0,55 1


Profils lignes et profils colonnes
• Un Tableau de contingence s’interprète
toujours en comparant des fréquences en
ligne ou des fréquences en colonne (appelés
aussi profils lignes et profils colonnes)
• Les Profils lignes sont définis par:

• Et les profils colonnes sont définis par:


Profils lignes et profils colonnes
bien Assez bien passable total
Profils en colonne
Femme 0,33 0,33 0,45 0,40
Homme 0,67 0,67 0,55 0,6O
total 1 1 1 1

bien Assez bien passable total


Profils en lignes
Femme 0,13 0,25 0,63 1,00
Homme 0,17 0,33 0,50 1,00
total 0,15 0,30 0,55 1,00
Effectif théoriques
• On cherche souvent une interaction entre les
lignes et les colonnes, un lien entre les
variables. Pour mettre en évidence, on
construit un tableau d’effectifs théorique qui
représente la situation où les variables ne sont
pas liées (indépendance) les effectifs observés
njk ont les mêmes marges que les effectifs
n*jk. Les effectifs théorique sont construits de
la mesure suivante : n*jk=nj.n.k/n
Tableau des effectifs théorique
Bien Assez Bien Passable Total

F 80*30/200 80*60/200 80*110/200

G 30*20/200

Total 30 60 110 200


Tableau des effectifs théorique
Bien Assez Bien Passable Total

F 12 24 44 80

G 18 36 66 120

Total 30 60 120 200


Ecarte-type à l’indépendance
• Enfin, les écart-type sont définis par
ejk=njkn*jk
Tableau des Ecarte-type à l’indépendance
Bien Assez Passable Total
Bien
F 10-12=-2 20-24=-4 50-44=6 80-80=0

G 20-18=2 40-36=4 60-66=-6 120-120=0

Total 30-30=0 60-60=0 120-110=0 200-200=0


Khi-deux

• la dépendance de tableau amène au moyen


du Khi-deux
• de (j-1) (k-1) degré de liberté défini par
Calcul de Khi-deux
sexe e²jn

Bien Assez Passable total


bien
F 0,33 0,67 0,82 1,82

G 0,22 0,44 0,55 1,21

Total 0,55 1,11 1,36 3,03


Test de dépendance par le Khi-deux
• Khi-deux =3,03
• Le nombre de degré de liberté est(2-1)(2-1)=2
• Si le Khi-deux observé est inferieur au Khi-
deux de la table, on retient l’indépendance et
dans le cas contraire, on le rejette.
Relation entre Y variable quantitative
continue et X variable catégorielle
• la méthode utilisée pour préciser la Relation
entre Y variable quantitative continue et X
variable catégorielle est l’analyse de la
variance
• Dans ce cas, l’analyse de la variance permet de
répondre à la question suivante «
Relation entre Y variable quantitative
continue et X variable catégorielle
• Intensité de la relation
• Considérons une expérience fréquemment faite par
les agronomes pour tester le rendement de
différentes variées d’une même culture.
• Le tableau 1 représente le rendement en hectare (Y
variable quantitative continue) de quatre variétés de
blé (X variable qualitative à 4 modalités codées
A,B,C,D).
• Chacune des 4 variétés a été plantée sur 8 parcelles
d’une même exploitation expérimentale
Relation entre Y variable quantitative
continue et X variable catégorielle
Le tableau 1 : le rendement à l’hectare de quatre variétés de blé

A B C D
53 50 52 59
47 54 56 60
47 53 57 59
49 51 60 52
48 49 56 64
52 52 55 58
50 51 53 63
46 55 54 61
Relation entre Y variable quantitative
continue et X variable catégorielle
• Si le rendement (Y) ne dépendait que de la
variété des plantes (X), le rendement de chaque
variété de blé serait différent des autres et n’y
aurait aucune différence de rendement sur les
parcelles plantées d’une même variété.
• En d’autre terme, les rendements des 4 variétés
seraient différents et homogènes: dans ce cas,
Y(le rendement) serait totalement et
exclusivement fonction de X (la variété plantée).
Relation entre Y variable quantitative
continue et X variable catégorielle
• Dans les faits, le rendement dépend aussi d’autres
facteurs comme la qualité des sols, l’humidité et
l’ensoleillement des parcelles… et il y’a donc des
différences de rendement entre celle plantée de la
même variété de blé comme le montre le tableau.
• La relation entre Y, variable quantitative, et X
variable catégorielle est forte si, pour l’ensemble
des classes de X les moyennes de Y sont très
différentes et les variances autour ces moyennes
petites.
Relation entre Y variable quantitative
continue et X variable catégorielle
• Intensité de la relation= sce interclasses/sce
totale
• Celle-ci varie entre:
• 0 pas de relation (moyennes de classes
confondues variation intra-classes importante)
• relation absolue (forte différence des
moyenne, très faible sce intra-classes)
Relation entre Y variable quantitative
continue et X variable catégorielle
• Sce: Somme des Carrés des Ecarts
• Sce totale: nSy²
• Sce interclasses=
• Où K est le nombre des classes de X
• Ng= effectif de la classe g
• Mg= la moyenne de la classe g
• M= la moyenne générale
Relation entre Y variable quantitative
continue et X variable catégorielle
• Sce totale= Sce interclasses + Sce intra-classes
• Sce interclasses (long à calculer) s’obtient
souvent par la relation:
• Sce interclasses= Sce totale – Sce intra-classe
Relation entre Y variable quantitative
continue et X variable catégorielle
Tableau 2: Moyenne et variance des rendements des quatre
variétés de blé
Variété Nombre de Rendement Variance de Sce* aux
parcelles moyen rendement moyennes
A 8 49 5,5 44

B 8 51,875 3,609 28,872

C 8 55,375 5,485 43,88

D 8 60,5 5,25 42

ensemble 32 54,1875 24,088 770,816


Relation entre Y variable quantitative
continue et X variable catégorielle
• Sce intra-classes= 770,816
• Sce intra classes est la sommes de sce pour les quatre
variétés: 44+28,870+43,88+42=158,75
• Sce interclasses vaux donc:
• 770,816-158,75=612,066
• L’intensité de la variation est donc:612,066/770,816=0,79
• La variété de blé explique 79% de l’inégalité de
rendement entre groupe de parcelles témoigne (21%
l’étant par d’autre variable, qualité des sols et des
parcelles).
Relation entre Y variable quantitative
continue et X variable catégorielle
• Teste de significativité: le F de Fisher-Snedecor
• Si les données sont issues d’un échantillon dont
on veut généraliser les résultats à l’ensemble de
la population, alors il faut procéder à un teste de
significativité des différences interclasses.
• Celle-ci ne sera généralisable que si la différence
des moyennes interclasses ( l’effet systématique)
est nettement supérieur
Relation entre Y variable quantitative
continue et X variable catégorielle
• H0: hypothèse d’indépendance Y et X
• Si la quantité calculée est inferieure à la valeur
lue dans la table, on accepte l’hypothèse
d’indépendance (pas de relation entre Y et X)
• Si la valeur lui est supérieur ou égale, on
rejette l’hypothèse d’indépendance et on
accepte l’hypothèse probable d’une relation
(pas nécessairement forte) entre Y et X.
Relation entre Y variable quantitative
continue et X variable catégorielle
• Le F de Fisher- Snedecor a deux degrés de liberté,
k-1 en ligne et n-k en colonne. K représente le
nombre de modalité de la variable catégorielle et
n le nombre total d’observations.
• Dans l’exemple: k=4 et n=32
• On définit
• Carré moyen interclasses= SCE interclasses/k-1
• Carré moyen intra-classes= SCE intra-classes/n-k
Relation entre Y variable quantitative
continue et X variable catégorielle
• F calculé = carré moyen interclasses/carré
moyen intra-classes
• carré moyen interclasses=612,066/3=204
• carré moyen intra-classes=158,75/28=5,6
• F=204/5,6=36,4
Relation entre Y variable quantitative
continue et X variable catégorielle
• La table de Fisher-Snedecor
• Pour un risque d’erreur= 0,05
• Un degré de liberté en ligne de 3
• Un degré de liberté en colonne de 28
• Nous indique une valeur plafond de 8,64
• F calculé étant supérieur à F lu dans la table, on
rejette l’hypothèse d’indépendance entre X et
Y : on conclut, à un effet systématique de la
variété de blé sur les rendements.
Notions rapides sur les variables aléatoir
Définition d’une probabilité
• La probabilité d’un évènement est le rapport
entre le nombre des cas favorable sur le
nombre de cas possible.
• C’est une quantité toujours comprise entre 0 et
1
• La probabilité 0 correspond à un évènement
impossible
• La probabilité 1 correspond à un évènement
certain
Exercices: probabilité
• Exo1: Supposons que la naissance d’un garçon
soit aussi possible que celle d’une fille, quel
est la probabilité d’avoir une fille ?
• Un couple a une fille, quelle est la probabilité
que le deuxième enfant soit une fille ?
Exercices: probabilité
• Exo2: on joue à pile ou face avec une pièce
parfaite. 1) quelle est la probabilité de faire pile
lorsqu’on joue une fois ? 2) quelle est la
probabilité de faire pile une fois lorsqu’on joue
deux fois ?
• Solution
• 1) Pr(P)=1/2
• 2) on peut faire soit pile et face soit face et pile
• ½*½+½*½=½
Définition d’une variable aléatoire
• Toute mesure d’une grandeur dont les valeurs
dépendantes du hasard et une variable
aléatoire.
• Exemple: une plante peut avoir de 0 à 4 fleurs
avec les probabilité suivantes ¼ pour 0; 1/8
pour 1; 1/8 pour 2; 3/8 pour 3; 1/8 pour 4.
• Le nombre des fleurs est une variable
aléatoire X
Définition d’une variable aléatoire
• La distance d’un projectile dans un tir
• Le nombre de malades sur un nombre
important des personnes
• Le revenu moyen de dix contribuables tirés au
sort parmi ceux rattachés à un centre d’impôt
etc.
• Une variable aléatoire peut être discrète ou
continue
Définition d’une variable aléatoire discrète

• Une variable aléatoire est dite discrète lorsqu’elle ne


prenne que certaines valeurs; le cas du nombre des fleurs
• On appelle loi de probabilité ou « distribution » de la
variable aléatoire X la fonction définie par: Pr{X=x} pour x
appartenant à un domaine de définition.
• Ici on distingue X, nom de la variable aléatoire, de x l’une
de ses valeurs possibles.
• La loi de probabilité d’une variable aléatoire peut se
présentée sous la forme d’une formule mathématique:
• Pr(X=x)=P(x)
variable aléatoire discrète
• On appelle fonction de répartition ou «
fonction cumulative » d’une variable aléatoire
X la fonction définie par :
• F(x)=Pr{X<x}
• Exemple 1: la fonction de répartition de la
variable aléatoire nombre des fleurs par
plante.
La loi de la probabilité de la variable
aléatoire X: nombre des fleurs par plante
x 0 1 2 3 4 5

P(x) 1/4 1/8 1/8 3/8 1/8

F(x) 0 1/4 ¼+1/4 ¼+1/8+1 1/8+1/8+ 1


/8 1/8+3/8

F(0)=Pr(X<0)=0
F(1)=Pr(X<1)=1/4
F(2)=Pr(X<2)=Pr(X=0)+Pr(X=1)=1/4+1/8=3/8
F(3)=Pr(X<3)=Pr(X=0)+Pr(X=1)+Pr(X=2)=1/4+1/8+1/8=4/
variable aléatoire continue
• Une variable aléatoire est dite continue si elle
peut prendre toute les valeurs possibles entre
les limites données.
• Exemple: la distance d’un projectile dans un
tir.
• La fonction de répartition est:
• F(x)=Pr{X<x}
variable aléatoire continue
• On définit la probabilité pour que X prenne une valeur
appartenant à l’intervalle [a,b[
• Pr{a< ou =X<b}= F (b)-F(a)
• La probabilité d’un point au sens mathématique est nulle.
Par exemple dans le cas du projectile on dira entre deux
distances données, il y a une infinité non dénombrable de
distances possibles.
• On définit une densité de probabilité de la variable
aléatoire pour une valeur de x
• f(x)=F’(x) , en supposant que F(x) est dérivable, avec f(x)
positive ou nulle.
variable aléatoire à deux dimensions
• On peut considérer à la fois le nombre de
fleurs X et le nombre Y de feuilles de la plante.
Le couple (X,Y) est une variable à deux
dimensions
• Pr{X=x et Y=y}=Pxy :loi de probabilité du
couple (X,Y)
• Les distribution marginales sont:
• Px.=Pr{X=x} et Py.={Y=y}
variable aléatoire à deux dimensions
• Les distributions conditionnelles sont telle que:
• Pr{X=x/Y=y}=Pxy/P.y (probabilité pour que X=x sachant
que Y=y)
• Pr{Y=y/X=y}=Pxy/Px.
• La fonction de répartition est définie par:
• F(x, y)=Pr{X<x et Y<y) pour X et Y discrètes ou
continues
• Lorsque X et Y sont continues il est possible de définir
la probabilité pour que (X et Y) soit dans un rectangle :
Pr{a<X<b et c<Y<d}
Espérance mathématique
• L’ Espérance mathématique est une moyenne
des valeurs possibles de x pondérées de ses
valeurs
• De façon générale, si X est une variable
aléatoire discrète prenant n valeurs x1,x2,…xn
avec les probabilités p1,p2,…pn on définit son
Espérance mathématique par: E(x): {xi.p(xi).
Espérance mathématique
• Exemple: calculez l’ espérance mathématique
de la variable aléatoire nombre de fleurs par
plante
• E(X)= 0*1/4 + 1*1/8 + 2*1/8 + 3*3/8 + 4*1/8 =
16/8 =2 fleurs
• En moyenne
Exo Espérance mathématique
• Un chef de service commercial estime avoir
une probabilité de 0,6 de faire gagner 50 000
000F Cfa à une entreprise en faisant une
opération. Si cette opération est manqué, la
perte est de 10 000 000F Cfa. Quelle est l’
Espérance mathématique du gain ?
correction
xi 50 M -10 M

P(x) 0,6 0,4

XiP(x) 30 M -4 M

E(x) = 30M - 4M
E(x) = 26M
Exo Espérance mathématique

• Loi de probabilité du nombre de garçons dans


une famille de 2 enfants.
• Espérance mathématique
• fonction de répartition
• GG GF FG FF
• 1/2*1/2 1/2*1/2 1/2*1/2 1/2*1/2
• 1/4 1/4 1/4 1/4
• 2 1 1 0
Exo Espérance mathématique
X 0 1 2

P(x) 1/4 1/2 1/4

XiP(x) 0 1/2 1/2

F(X) 0 1/4 3/4

• E(X)=0+1/2+1/2=1
Espérance mathématique
• Propriété:
• Pour deux variables aléatoires quelconques:
E(X+Y)=E(X)+E(Y)
• E(XY)=E(X)*E(Y)
• E(ax+b)=aE(X)+b avec a et b des constantes
Variance et moment d'une variable
aléatoire
• La variance d'une variable aléatoire V(X) est
l'espérance mathématique du carré de l'écart à
l'espérance mathématique
• V(X)=E([X-E(x)]²)
• On définit l'écart-type de la variable aléatoire
comme la racine carrée de la variance
ox=√V(X)
• On définit les moments d'ordre q d'une
variable aléatoire mq=E(Xq)
Variance et moment d'une variable
aléatoire
• L'espérance mathématique est le moment
d'ordre 1
• V(X)=m2-m1²
• V(X+Y)=V(X)+V(Y)+2cov(X,Y). Avec cov(X,Y)=
E([X-E(X)][Y-E(Y)])
• V(aX)=a²V(X)
Loi binomiale
• Lorsque les éventualités se réduisent à une
alternative: succès ou échecs, la variable aléatoire
«nombre de succès» suit une loi de probabilité
appelée loi binomiale, si:
• Chaque épreuve donne lieu à deux éventualités
exclusives de probabilité constante p(succès) et
donc q=1-p(échec)
• Les épreuves répétées sont indépendantes
• La variable binomiale X est une somme de variable
Bernoulli ou variables indicatrices
Exo loi binomiale
• Une variable de Bernoulli X à la loi de
probabilité suivante:
• Pr(X=X) ou X prend les valeurs 0(échec) et
1(succès)
• D'où E(X)=P et V(X)=p-p²=p(1-p)=pq
Correction
• Loi de probabilité de Bernoulli
X 0 1

P(x) q p

XiP(x) 0 p

• E(X)=£xip(xi)=0+p=p
• E(X)=p
• V(X)=m2-m1²
• m2=£xi²p(xi)=0+p
• m2=p
• m1=p
• V(X)=p-p²=p(1-p) or 1-p=q
• V(X)=pq
• Cette loi dépend de deux paramètres n et p,
c'est pourquoi on la note B(n,p)
• Caractéristiques de B(n,p):
• E(X)=np et V(X)=npq
Loi de Poisson
• On appelle processus de Poisson, la réalisation
d'événements aléatoires dans le temps et dans
l'espace, obéissant aux conditions suivantes:
• La probabilité de réalisation de l'événement au
cours d'une petite période où sur une portion de
l'espace ∆t est proportionnelle à ∆t, soit p∆t;
• elle est indépendante de ce qui s'est produit
antérieurement ou à côté;
Loi de Poisson
• la probabilité de deux apparitions sur le même
∆t est négligeable
• Exemple 1: des événements qui se réalisent de
façon aléatoire dans le temps: appels
téléphoniques sur un central; pannes de
machines; arrivées à un péage d'autoroute ou
à un guichet de vente; peuvent être
considérés comme réalisées par un processus
de Poisson
Loi de Poisson
• Exemple 2: des événements qui se réalisent de façon
aléatoire dans l'espace: répartition des points au hasard
sur une droite; Bosquets, observées dans une zone
peuvent être considérés comme réalisées par un
processus de Poisson
• Le nombre X d'événements aléatoires sur un intervalle T
est alors une variable aléatoire qui suit une loi de
poisson
• X prend les valeurs 0,1,2,3 ... mais en principe se peut
être infini, toutefois la probabilité diminue lorsque x
augmente
Table de la loi de poisson
• L'établissement de la table permet de
constater que la répartition est toujours
dissymétrique et que la probabilité tend
rapidement vers zéro lorsque x augmente
• On lit par exemple la loi de poisson de
paramètre 2, la probabilité pour que X=0 est
0,1353
Exo loi de poisson
• Pour X suivant une loi de poisson de
paramètre 4, quelle est la probabilité pour que
X soit inférieur à 8 ? Quelle est la probabilité
pour que X soit compris entre 4 et 10
Loi binomiale
• On parle de loi binomiale ou loi de Laplace-
Gouss ou encore deuxième loi de Laplace,
lorsque l'on a à faire à une variable aléatoire
continue dépendant d'un grand nombre de
causes indépendantes dont les effets
s'additionnent et dont aucune n'est
prépondérante
Loi binomiale
• Exemple 1: les dimensions de pièces fabriquées
dépendant:
• au règle de l'appareil de fabrication
• des variations auxquelles elle est soumise
• de l'homogénéité de la matière première
• de la température de l'humidité
• Lorsque tous ces facteurs sont indépendants et
qu'aucun n'est prépondérants, on peut supposer que
les dimensions des pièces suivent une loi normale
Loi binomiale
• Exemple 2: des erreurs de mesure, des temps
nécessaires pour accomplir le même travail....
Suivent également dans certaines conditions,
une loi normale
• La loi de probabilité dépend de deux
paramètres m et o et on l'écrit N(m,o)
• L'espérance mathématique, la médiane et le
mode sont égaux à m et l'écart-type est égal à
o
Loi binomiale
• On a l'habitude d'effectuer un changement de
la variable:
• T(X-m/o) cette loi est notée N(0,1)
• L'espérance mathématique, la médiane et son
mode sont égaux à 0 et son écart-type à 1
Variable de la loi normale
• C'est cette loi normale centrée réduite qui est
souvent tabulée mais il existe aussi une table de
fonction de répartition t
• On lit sur le table de la loi normale centrée
réduite la valeur de t telle que Pr(|T|
>1,96)=0,05
• Il est bon de connaître les résultats suivants:
• Pr(-1,96<T<1,96)=0,95
• Pr(-2,58<T<2,58)=0,99
Variable de la loi normale
• Pr(-1,96<T<1,96)
• Pr(|T|<1,96)?
• Pr(|T|>1,96)=0,05
• Pr(|T|>1,96)+Pr(|T|<1,96)=1
• Pr(|T|<1,96)=Pr(|T|>1,96) -1
• Pr(|T|<1,96)=1-0,05
• Pr(|T|<1,96)=0,95
Variable de la loi normale
• Pr(-2,58<T<2,58)=0,99
• Pr(|T|<2,58)?
• Pr(|T|>2,58)+Pr(|T|<2,58)=1
• Pr(|T|<2,58)=Pr(|T|>2,58) -1
• Pr(|T|<2,58)=1-0,01
• Pr(|T|<2,58)=0,99
• IL existe aussi une table de la fonction de répartition de t
F(T)=Pr(T<t)
• On lit, par exemple, que la probabilité pour que T doit inférieur à
0,83 est 0,7967
• Lorsque t est négatif on raisonne par symétrie: la probabilité pour
que T soit inférieur à -0,83 est=1-0,7967=0,2033
Exercice lecture de table
• T suit une loi N(0,1) quelle est la probabilité:
• Pour que T<1,2 ?
• Pour que 0,8<T<1,2 ?
• Pour que T<-1,2 ?
• Pour que -0,4<T<1,5 ?
• X est une variable aléatoire qui suit une loi
normale de moyenne 3 et d'écart-type 2
• Calculer les probabilités suivantes: Pr(1≤X≤2)

Vous aimerez peut-être aussi