Académique Documents
Professionnel Documents
Culture Documents
STATISTIQUE
I- VOCABULAIRE STATISTIQUE
Exemple :
Le nombre de contraventions des automobiles de la ville de douala au
mois de Décembre 2020 est recensé comme suit :
Nombre de Nombre
contraventions d’automobiles
0 8
1 24
2 12
3 60
4 80
5 16
TAF :
1- Qu’elle est la population étudiée ?
2- Qu’elle est la caractéristique étudiée sur cette population ?
Qu’elle valeur où modalité peut prendre cette caractéristique ?
3- Est-ce un caractère quantitatif ou qualificatif ?
4- Quelle est la taille de cette population ?
Solution :
1- La population étudiée est l’automobile de la ville de douala
2- La caractéristique étudiée sur cette population est le nombre de
contraventions. La valeur où modalité que peut prendre cette caractéristique est
0, 1, 2, 3,4 Et 5.
3- C’est un caractère quantitatif
4- La taille de cette population est 200
1- La distribution distraite
On aura ici :
Le diagramme en bâton
Le diagramme en escalier ou cumulatif .
a- Le diagramme en bâton
Exemple : le nombre d’enfant par ménage dans une ville donnée se présente
comme suit :
Nombre Nombre
d’enfant de
ménages
0 890 000
1 1 000 000
2 1 149 000
3 254 000
TAF : présenter le diagramme en bâton
Solution :
254 000
1 149 000
1 000 000
890 000
0 1 2 3
b- Le diagramme en escalier
Cela se fait avec les effectifs cumulés croissants ou fréquences
cumulés croissantes.
Nombres d’enfants Nombres de ménages Effectifs cumulés croissants
0 890 000 890 000
1 1 000 000 1 890 000
2 1 149 000 3 039 000
3 254 000 3 293 000
N= 3 293 000 ce nombre est pair P= 3 293 000/2. P= 1 646 500. Pour 0
enfant on a un effectif cumulé de 890 000 et pour 1 enfant on a 1 890 000 ; ce
qui signifie que la Pème et la P+1ème ont pour médiane 1.
Solution :
3 293 000
3 039 000
1 890 000
890 000
0 1 2 3 4
2- La distribution continue
a- L'histogramme
Il permet de représenter l’importance relative de chaque classe au
point de vue des effectifs ou des fréquences.
SOLUTION :
25
20
15
22
10
5
8
6
5 5
4
0
100 200 300 400 500 600
b- Le polygone statistique
Lorsqu’on joint les milieux des côtés supérieurs des rectangles représentatifs de
l’histogramme on obtient le polygone statistique.
Remarque : il faut distinguer les distributions avec les classes d’amplitudes
égales et inégales
Amplitude (ai) = b-a
Lorsque les classes sont d’amplitudes inégales on a les densités (di)
Di effectif (ni)
Amplitude (ai)
25
20
15
22
10
5
8
6
5 5
4
0
100 200 300 400 500 600
a- Le mode ou dominante
Il correspond à la modalité qui représente l’effectif ou la fréquence le
(la) plus élevé(e). En distribution on parle de la classe modale [500-600].
Pour l’application numéro 1 : le mode est 1.
b- La médiane
Elle est l’élément qui partage la série statistique en deux sous-
ensembles d’effectifs égaux à condition que la série soit place par ordre de
grandeur. On distinguera :
Selon que la série statistique soit paire
12, 8, 0 , 15 , 7 ,9 ,8, 10. On classe d’abord par ordre croissant.
0, 7, 8, 8, 9, 10, 12, 15
8+9 = 8,
2
Selon que la série statistique soit impair 14, 12, 8, 0, 15, 7, 9, 8, 10.
On classe par ordre croissant.
0, 7, 8, 8, 9, 10, 12, 14, 15. La médiane est égale à 9
P € N → 2P pour les nombres pairs
→2P + 1 pour les nombres impairs
Rang = 50
2
Rang médiane = 25
Interpolation linéaire
23 <25 <28
400 < Me < 500
Me−400 25−23 Me−400 2 100× 2
=
500−400 28−23
→
100
= 5
→ Me – 400 = 5
Me = 440f
Conclusion : 50% des honoraires ne dépassent pas 440 000. 100 : 2 =
50%
c- Les quartiles
Ils représentent chacune des modalités partageant la série en quatre
groupes comprenant le même nombre d’observations.
Solution : déterminons les quartiles de l’application précédente
Calcul du 1er quartile
50
Rang : 2 =12‚5 → 12 <12.5 <17
Q1 = 210f
Conclusion : 25% des médecins ont des honoraires inférieurs à 210 000f
28<37.5<50
Q3−500 37 ‚5−28 Q3−500 9 ‚5 100× 9 ‚5
600−500
= 50−28
→
100
= 22 → Q3 – 500 = 22
Q3 = 543‚18
Conclusion : 75% des médecins ont des honoraires inférieurs à 543 180f
d- Les moyennes
n:
1 1
M =∑
❑
( nici ) → M= ❑ x 18700 → M= 374 000
i=1 N 50
IV −LESCARACTERISTIQUES DE DISPERSION
1- L’étendu de la série
C’est la différence entre la valeur la plus grande et la valeur la plus
petite 600 à 3 600. Mais cet étendu ne rend pas compte de la dispersion parce
qu’elle dépend uniquement des valeurs extrêmes qui peuvent être des
accidentels.
σ = √ V (x)
Devoir : les tranches d’âges des salariés d’une entreprise sont les suivantes :
Âges Nombre de
salariés
[20 -25] 3
[25-30] 9
[30-35] 12
[35-40] 12
[40-45] 6
[45-50] 3
[50-55] 1
[55-60] 1
TOTAL 47
CHAPITRE 2 : LES PREVISIONS DE
LA DEMANDE
I- L’AJUSTEMENT LINEAIRE
COV(x; y) = XY – ( X ¿ ¿. (Y )
V(x) = E ( x 2 ¿ – (E ( x ¿ ¿ 2)
2 ❑
xi xi
E ( x 2 ¿=∑ → E(x) =∑ n
n
yi❑
Y =∑
n
❑
xi. yi
XY = ∑
n
Y =a ¿ + b b = Y −a ¿
b−ajustement de X en fonction de Y
X = a’.y + b’
COV ( x ; y )
a’ = V ( y)
COV(x; y) = XY – ( X ¿ ¿. (Y )
V(x) = E ( y 2 ¿ – (E ( y ¿ ¿2)
2 yi 2 yi❑
E ( y ¿=∑ → E(y) =∑ n
n
yi❑
Y =∑
n
xi. yi❑
XY = ∑
n
X =a ' ¿ + b’ b’ = X −a ¿
II−LA CORRELATION LINEAIRE
Elle établit le niveau de lien qu’il y’a entre les variables étudiées.
COV ( x ; y )
r= √ a . a ' OU r=
σx . σy
SOUTION :
1- Le nuage des points
Valeur des Y
60
50
40
30
20
10
0
3 4 5 6 7 8 9
o Equation de X en fonction de Y
COV (x ; y )
Y = a(x) + b avec a= V (x )
o Equation de X en function de Y
COV ( x ; y )
X = a’.y + b’ avec a’ = et b’ = X −a ¿
V ( y)
Exercice 2 : On donne le tableau à double entrée suivant relatif à la série double
suivante : machines de même nature utilisées par les industriels de taille
moyenne dans la ville de douala ; classés en pourcentage sous les deux
caractères suivants :puissance de la machine en terme d’exécution et durée
moyenne d’utilisation en année.
X désigne la puissance de la machine en terme d’exécution t Y désigne la durée
de vie moyenne
Xi 2 3 4
TOTAL
YI
20 0 8 30 38
25 5 20 7 32
30 25 3 2 30
TOTAL 30 31 39 100
T.A.F :
1- présenter le nuage des points ;
2- Equation des droites de régressions de Y en fonction de X puis
de X en fonction de Y ;
3- Calculer le coefficient de corrélation linéaire et en déduire le
coefficient d’amélioration;
SOLUTION :
1- Nuage des points
40
30
20
10
0
0 1 2 3 4 5 6
XY =
( 20 x 0 x 2 ) + ( 4 x 30 x 20 )+ ( 3 x 20 x 8 ) + ( 2 x 25 x 30 )+ ( 4 x 7 x 25 ) + ( 3 x 20 x 25 )+ ( 2 x 25 x 30 )+ ( 4 x 2 x 30 ) +(3 x 3 x 30
100
XY = 73‚4
o «équation de Y en fonction de X
(2 ) ( 2)
n (2 ) ( 2 ) +31 x(3) +39 x(4)
¿ . xi 30 x (2)
X =∑ → → X 2 =10‚ 23
2 2
X =¿
i=1 N 100
(2 ) ( 2)
n ( 2) ( 2 ) +32 x ( 25 ) + 30 x ( 30 )
¿ . xi 38 x ( 20 )
Y =∑ → → Y 2=622
2 2
Y =¿
i =1 N 100
COV ( x ; y )
a=¿
V (x)
COV(x; y) = XY – ( X ¿ ¿. (Y )
b = 24 ‚ 6−¿-3‚83x3 ‚ 09 ¿ → b = 36‚44
Y = −3‚83(x) + 36‚44
o Equations de X en fonction de Y
V(y) = 622 − (24 ‚ 6)2 → V(y) = 16‚84
−2‚614
a '=¿
16 ‚ 84
→ a’ = −0‚15
Yt−P Yt + P
- Si K est impair on aura : Mt = 2
+…+Y1+ 2
b- La méthode Mayer
Confère application.
Ils sont adaptés à diverse aptitudes du décideur face aux risques possible.
Exemple : On doit choisir le meilleur des trois projets d’investissement i1, i2,
et i3 pour lesquelles les VAN ont étés calculées en fonctions des trois
événements E1, E2, et E3 susceptible de se produire et dont dépendent les Cash-
Flows.
Ei E1 E2 E3
I1 60 0 −90
I2 120 −60 0
I3 −15 90 30
1- Critère de LA PLACE
Le critère n’est autre que celui de l’espérance mathématique des VAN calculée
dans l’hypothèse discutable de l’équiprobabilité.
1 1 1
I1 = E(VAN x i1) → i1= 3 (60) + 3 (0) + 3 (-90)
→ i1 = -10
1 1 1
I2 = E(VAN x i2) → i2= 3 (120) + 3 (-60) + 3 (0)
1 1
→ i2 = 20 I3 = E(VAN x i3) → i3= 3 (-15) + 3
1
(90) + 3 (30) → i3 = 35
Conclusion: le choix c’est i3 à cause de son espérance qui est supérieur aux
autres.
C’est le critère du décideur prudent avers (qui n’aime pas le risque qui
privilégie la sécurité. Il consiste a prendre la VAN minimum de chaque
investissement et a retenir celui donc la VAN est la plus élevée.
Solution :
I1 = -90
I2 = -60
3- Critère de MAXIMAX
I2 = 120
I3 = 90
Ei E1 E2 E3
I1 120 – 60 = 60 90 – 0 = 90 120
I2 120 – 120 = 0 90 + 60 = 150 30
I3 120 − (− 15 = 90 – 90 = 0 0
135)