Académique Documents
Professionnel Documents
Culture Documents
THEMES :
STATISTIQUE DESCRIPTIVE
STATISTIQUE PREVISIONNELLE
TECHNIQUE DENQUETE ET DE SONDAGE
2011
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------NB : Ce document a t prpar spcialement pour la DRA DA. Toute reproduction intgrale ou partielle de son contenu ncessite le
consentement des auteurs.
SOMMAIRE
Gnralits :................................................................................................................................
I.
II.
III.
IV.
V.
Dfinitions :...................................................................................................................
Apport de la statistique aux conomistes : .....................................................................
Les limites de la mthode statistique : ..........................................................................
Le vocabulaire utilis en statistique : ...........................................................................
Quelques symboles mathmatiques utiliss : .................................................................
2
2
2
2
3
5
6
6
6
7
7
8
9
11
12
12
12
12
23
25
27
28
28
29
31
33
33
35
37
37
38
39
43
47
47
48
49
49
50
50
52
GENERALITES :
I. Dfinitions :
4.
Il ne faut pas oublier que la statistique nest quun outil au service de
Oconomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse
conomique des rsultats.
Les mmes causes # les mmes effets.
Les corrlations mmes trs parfaites ne signifient pas toujours
quil y a interdpendance entre les phnomnes tudis.
2. Unit statistique :
Une population se compose dlments chaque lment est appel
unit statistique.
EX : la population dtudiants : lunit statistique est un tudiant.
3. Caractre statistique :
&est le critre retenu pour tudier une population
Continu
quantitatif
discontinu, discret
Qualitatif
Un caractre est dit quantitatif lorsquil est mesurable
Continu : cest un caractre qui peut prendre toutes les valeurs
Gun intervalle donn.
EX : ge
Il peut tre
5.
6. Frquence relative :
&est la part des effectifs dune modalit.
EX : 200/600=33/100 est la frquence relative de premire modalit
7. Srie statistique :
Distribution de frquences, distribution de statistiques ou tableau statistique,
Fest un tableau qui nous donne lensemble des valeurs mesurant le caractre.
EX :
sexe
Masc.
Fm.
total
Effectifs
200
100
300
Salaires (dh)
[40-60[
[60-70[
[70-80[
total
Effectifs
10
25
05
40
Nombre
Genfants
2
3
4
5
total
Arbre de
mnages
18
28
10
4
60
Srie simple.
8. Classes :
On appelle classe un groupement de valeurs du caractre selon des intervalles
qui peuvent tre gaux ou ingaux.
Pour chaque classe on peut dfinir :
Nbre dtudiants
10 x1
25 x2
12 x3
4 x4
x
3
3. Frquence relative :
Fi = effectif de la modalit i / effectif total
4. /oprateur somme (
Notation : n variables
n
x1+ x2 + xi .+ xn= xi
i =1
Proprits :
n
axi = a xi
i =1
i =1
a + xi =
a xi = n a.
xi
i =1
5. /opration de produit : (
X1.x2.x3.xn =
xi
i =1
Proprit :
n
a = a
i =1
axi = a xi
n
i=1
i =1
I. Le diagramme en btons :
On sen sert pour reprsenter des sries caractre discret.
Cordonn
Nombre denfants Nombre de mnage
40 .
0
25
30 .
1
42
20 .
2
38
.
10
3
15
. . . . . . .Les valeurs de
4
6
0123456
caractre
5
Total
Abscisse
128
50%
45%
Srie1
40%
35%
30%
25%
20%
15%
10%
5%
0%
Allemands
Franais
Espagnoles
Autres
III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont
regroupes en classe.
a.
Cas ou les intervalles de classe sont gaux :
50%
45%
40%
Allemands
Franais
Espagnoles
Autres
35%
30%
25%
20%
15%
10%
5%
0%
1
Remarque :
1)
Lorsque une des limites de classe nest pas prcise dans un tableau il
convient de prendre comme intervalle de classe le mme que celui de la classe
suivante ou prcdente.
2)
La surface des rectangles est proportionnelle leur effectif.
b.
Srie1
20
15
10
0
1
. . . . . . . .
0 10 20 30 40 50 60
Remarque :
1)
La surface sous le polygone = la surface de lhistogramme.
2)
Lorsquil y a un trs grand nombre de classe, lintervalle de classe devient de
plus en plus petit et le polygone de frquences se transforme en cours de frquence.
Courbe de frquences
Salaire
xi
Xi cumuls
Xi cumuls
[10-20[
[20-30[
[30-40[
[40-50[
[50-60[
[60-70[
Total
9
13
22
10
7
4
65
9
22
44
54
61
65
Moins de la borne
suprieure
65
56
43
21
11
4
Plus de la
borne
infrieure
Remarque :
On obtiendrait le mme graphique si on remplace les frquences absolues par les
frquences relatives (les pourcentages)
Courbe cumule dcroissante
Courbe cumule croissante
70
60
50
40
30
20
10
0
1
NB de mnage
5
10
30
20
65
Xi cumuls
5
15
45
65
<=xi
Xi cumuls
65
60
50
20
>=xi
Xi
65
40
20
10
Xi
0 1 2 3 4 5
a)
Les principes
parfaitement repr
Si on connat
Si on connat
M
e
O
b)
X
Le diagramme polaire :
Juillet
1999
55
53
65
50
43
41
35
30
34
40
45
55
2000
65
75
72
40
42
38
32
34
38
40
33
45
Avr
.
30 .
20 .
10
.
. . . . . . . . ..
. . . . . . . . . . . .
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
10 .
20 .
30.
Jan
Oct.
FR
All
Esp
Autr es
x1 + x2 + ....... + x + ...... + xn
n
xi
: Une moyenne arithmtique simple
n
Lorsque les observations sont groupes c'est--dire que lon observe
: =
i =n
N1 fois X1
N2 fois X2
La moyenne arithmtique scrit :
x1 + x1 + ..... + x2 + x2 + ......
n1 + n2 + .... + n n
ni xi
e
=
i =n
ni
i =1
A-2 Application
Exercice1 : soit la srie de notes suivante : 2-6-12-10-12-10-10-6
2 + 6 + 12 + 10 + 12 + 10 + 10 + 6 68
=
8
8
= 85,
Exercice2 : soit la srie des notes de lexercice qui peut tre prsente de la
manire
suivante :
Notes xi
Effectifs ni
ni xi
=
68
= 85,
8
ni xi
=
i =1
2
6
10
1
2
3
2
12
30
12
total
2
8
24
68
age
3155
= 35
[20
[25
[30
[35
Annes
85,
88
Moyenne de lage ou lage moyen
Ni
[25
[30
[35
[40
Centre de
classe xi
ni xi
8
10
20
25
22,5
27,5
32,5
37,5
180
275
650
937,5
[40 [45 15
[45 [50 10
42,5
47,5
637,5
475
TOTAL 88
3155
Ex
Xi
Xi
Xi
Xi
4
24
24
24
36
36
36
a=1
Xi = Xi
a=6
a =6
; i = 4
; i = 6
x = x + ax
i
0
i
X0 = nouvelle origine
a : n.chelle
;i : n. variable
Ex :
Xi
X0
14
= 4
22
Xi
*
5
*
'
Si on pose x = x + ax
0i
x' =
xi x0
a
La moyenne arithmtique :
=
n
x
i i
ni
)+
ni x0
'
axi
ni
+
=
x
ni
= x0 + a
a
ni
ni xi
'
'
ni xi
ni
'
'
x +
a i avec
i =
i i
0
X0= n origine
a: n chelle
'
xi : n variable
'
= x + ax
0
i
Calculez la moyenne
avec changement du
variable
x0 = 37,5 cest le centre
de classe modale
a= 5
[i =( xi - x0)/5
Age
20-25
25-30
30-35
35-40
40-45
45-50
total
effictifs xi
8
22,5
10
27,5
20
32,5
25
37,5
15
42,5
10
47,5
88
x i= (xi- x0)/a
-3
-2
-1
0
1
2
ni*xi
-24
-20
-20
0
15
20
-29
'
'
i i
= 37,5+5(-29/88)=35,8 ans
STATISTIQUE DESCRIPTIVE
x + ...... + ni x i + nn xn
x
i i
ni
ni xi
nx
1
n 2 x2
ni
2 2
+ ......... +
ni
ni
n n xn
ni
= f i xi + f 2 x2 + ........ + f n xn
ni
ni
frquence relative
xi
10
11
12
13
14
fixi
=12,7
Ni
5
8
10
12
5
40
fi
0,125
0,20
0,25
0,30
0,125
f ix i
1,25
1,6
2,5
3,6
0,75
12,7
B- La moyenne gomtrique :
b-1 Dfinition
tant donne n observations connues individuellement (x1,x2,x3,,,,,,,,,,, xn)
on appelle moyenne gomtrique simple de ces n observations la grandeur G t.p :
G= n X .1 X
.....2
i =n
G=
x
i 1=
Xn = ( X .1 X
....2
Xn)
1/n
1
n
b-2 calcul de G
lorsque les observations sont groupes ; chaque pondr Xi sera pondr
par leffectif correspondant, la moyenne gomtrique scrit :
G=
G= X 1n .1 X 2 n 2.X 3n3....Xn
X .1 X .1 X 1* X .2 X .2 X 2 * X 3 * X
3X 3
N= n1+n2 +..+nn
nn
Xn = (
)X .1 X .2 X .....3
log G = 1/n log (X1.X2..Xn)
G= n X .1 X
....2
= 1/n [
Xn
1/ n
log Xi
Log G=
Ni
n n
=
G
)x
n2
.x2 n ........xn
x 2n2 .......x nn n
1
n
1
1
(
1
x) log
logG
=
1
x. n .....
. x ........
n
(xlo
g
n
n
n1
=
nx
lo1 g.
n x + +.n.....
+
1
2
xi
2nlog
i log
n n i
n
og G =
Application :
calculer la
moyenne gomtrique
7 31,6
log G =
= 0 914,5
8
G = 100,9145 = ,8 2
xi
2
6
10
12
C-
ni
1
2
3
2
log xi
0,301
0,772
1
1,158
ni log xi
0,301
1,556
3,0
2,158
la moyenne harmonique :
c-1 Dfinition
tant donne n observations connues individuellement x1,x2,x3 ..xn
on appelle moyenne hormique le nombre H tel que :
1
+ ...... + 1
x2
x1
1
=
H
xn
H =
xi
xi
.1
+
x
+ ..... + nn . 1
xn
1
xi
n1 + n2 +
...... n
c-2 Application
xi
ni
2
6
10
12
total
1
2
3
2
8
1/ xi
0,5
0,166
0,1
0,083
xi
ni.1/ xi
0,5
0,332
0,2
0,166
1,298
x
xi
ni
8
H =
,1 298i
8
= 6 16,
1, 298
c-3 Remarque
1
i
=
ni
n
xi
1
i
xi
n .X
i
avecX i =
Q =
+ xn
.....
Q =
Q =
Q=
2
i
.xi
n
.xi
Application :
2
xi
Ni
Xi
Ni. Xi
2
6
10
12
1
2
3
2
4
36
100
144
4
72
300
288
total
=
2
n
i .x
664
8
83
ni
Q = 83 = 91.
Q2 =
n .x
n
.X
664
2
avecX = xi
i
moyenne dordre r
M =
x1 + x2 + ........ + xn
1
n
x1 + x2 + .... + xn
r =
n
Si r= 1 M 11 =
x1 + x + x + ....... + x
2
3
n
n
= M 1
si r= 2 M 2 = x1 + x2 + ....... + xn
2
n
1
si r= -1 M 11 = x1
si r= 0.
d.2-
M 2 2= Q 2
1
+ x2 + ...... + x
n
n
=Q
1
1
1
M 1 = H = H
M1 =H
M 0 = G
c--d
4
9
9 +4+9+ 4
= ,6 ;5 G
9*4 = 6
=
4
moyenne arithmtique du primtre =26 =6,5 * 4
6*4
moyenne gomtrique : surface =36 =6*6 6,5 * 6,5
Gnralits :
Dune manire gnrale, on retient la moyenne arithmtique quand les variables
Vadditionnent, et on utilise la moyenne gomtrique lorsque les variables se
multiplient.
Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h.
100 +
100 + 160
Vitessemoy =
=
=
taledistonceto
160
1
1
tempstotal
100 160 100. +160
+
50 80
50
80
MH =
n
i
1
n
i .
xi
La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par
les distances.
Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.
Vitesse
moy.
=
(
)
+ (3 )8 0
taldistonceto
1
50
=
tempstotal
1+3
n ix
in
i
G =3 1
,1
8 + 10 + 12
3 = 10
Dmonstration : x
x=
x n x = xi n
i
=0
n
Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne
quadratique
(0 )2 (2 )2
Q2 =
=
Q
= 3
= 16,
b-2- Calcul de ME :
Cas dune variable discrte
Si la srie a un nombre impair de terme
75 62 57 12 18
Me =57
Si la srie a un nombre pair
12 25 32 44 52 69
Intervalle Mdian [32-44]
On prend le centre de lintervalle comme la mdiane :
Cas dune srie de classes :
Salaires
10-15
15-20
20-25
25-30
Total
Effectifs
9
25
32
16
82
Effectifs cumuls
9
34
66
82
ni
2
2me tape : on repre la classe de Me :
Il sa git de trouver la classe laquelle appartient le 41me individu,
pour cela on classe les individus par ordre croissant des salaires, ce qui revient
construire la colonne des effectifs cumuls.
.
Me
[20-25], on peut calculer avec plus de prcision Me en faisant une
interpolation linaire.
3me tape : linterpolation linaire :
On connat les salaires des 34 individus 20
On connat les salaires des 66 individus 25
Le 41me individus cest le 7me individus que je rencontre dans la classe 20 -25,
son salaire sera obligatoirement gal 20 + supplment que lon calcule par
interpolation.
En supposant que les 32 individus de la classe 20-25 sont rpartis dune manire
uniforme dans la classe
20-25 puis sont spars par la mme quantit de salaire
On raisonne alors de la manire suivante :
Si pour 32 individus nous avons un cart de salaire de 5 DH
Pour 1 individu
5/32
Pour 7
individus
5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moiti des effectifs gagnent plus de 21,09 DH et lautre moiti gagne (moins de
21,09 DH)
b-4-Remarque :
Salaire
10 15
15 - 20
20 - 25
25 - 30
Xi
9
25
32
16
Xi
9
34
66
82
Total Xi =82
Me
20
41 34
25 20 = 66 34
Me =
7 5 + 20 21
32
ni
3
18
7
4
Mo =14
Srie
Uni modal
Xi
2
17
33
39
51
Mo = 17
Ni
4
16
15
16
8
Mo = 39
Srie bimodale
Srie plurimodale (srie plusieurs modes)
ni
9
25
32
16
82
( 32
25
) *
Xi
1
2
5
2
10
Ni * Xi
1
32
85
36
154
X = 154 / 10 = 15,4
X = 153 / 9 = 17
2-La mdiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la mdiane ne change pas quand on augmente la valeur
dune observation qui lui est infrieure
15 22 34 41 60
1 2 34 41 60
122
34
41
110
3-Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est
utile, en particulier quand on cherche la valeur la plus typique dune srie :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.
Srie 1 : 9
11
= 10
Srie 2 : 5
Srie 3 : 1
15
= 10
19
X = 10
Les 3 sries ont la mme moyenne : 10 et portant ils sont
diffrents lunes des autres.
Dans la 1re srie ; les valeurs du caractre sont proches de la
moyenne. La moyenne est reprsentative.
Dans la 3 me Srie les valeurs du caractre sont loignes de la
moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les
valeurs sont proches ou loignes de la valeur centrale.
Ce nombre est appel caractristiques de dispersion.
I. /intervalle de variation ou ltendue :
Cest la diffrence entre la plus grande valeur du caractre et la plus
petite. Lintervalle de variation = Val MAX Val MIN
= 10 srie 2
= 18 Srie 3
= 2 Srie 1
Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il
dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes.
EX :
17.1820.60.Age
1000 tudiants
=3
= 60 17 = 43
(20,5 - 9) = 11,5
Ni Cum
9
34
66
82
Augmentation de 5 DH
Augmentation 5/25 DH
5/25 * 11,5
Calcul de Q3
Rang : 82*3/4 =61,5
Classe = [20-25]
Interpolation : si 32 individus
augmentation de 5 DH
01 Individu
Augmentation de 5/32
Ca =
ni xi x /
ni
ni
xi
12
17
36
24
11
100
57,5
62,5
67,5
72,5
77,5
ni * xi
690
1062,50
2430
1740
852,50
6775
xi x
ni xi x
10,25
5,25
0,25
4,75
9,75
123
89,25
9
114
107,25
442,5
= 67.75 Kg
ni( xi x) /
ni
ni( xi x) 2 /
ni
B- Application :
Le mme tableau prcdent
(xi- )2
ni*(xi- )2
105,0625
27,5625
0,0625
22,5625
95,0625
1260,75
468,5625
2,25
541,50
1045,6875
3318,75
ni =
3318.75/100 =5.76
ni( xi x) /
C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cfficient de
variation = /
Ex :
=67.75 Kg / =(5.76/67.75) *100= 8.5%
Ex 2 :
Soient 2 modles dampoules lectrique dont on a relev les dures de
vie.
Modle 1 : Dure de vie moyenne 1400 H.
Modle 1 : Dure cart-type =100 H
Modle 2 : Dure de vie moyenne 1800 H.
Modle 2 : Dure cart-type = 250 H
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------PHYTO CONSULTING / HANDASSA AGRI BUREAU
Page 32 sur 60
Modle I
Modle II
6/ =100/1400 = 7%
250/1800 *100 = 14%
Le modle I est plus faible que le modle II
Formule dveloppe :
2
Donc
=
ni xi
ni
Poids
55-60
60-65
65-70
70-75
75-80
ni
xi
xi2
ni * xi2
12
17
36
24
11
100
57,5
62,5
67,5
72,5
77,5
330625
390625
455625
525625
600625
39675
66406,25
164025
126150
66068,75
462325
=5.76
19
.
A- La mdiale
Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la
mdiale est la valeur du caractre qui partage en deux parties gales le produit
cumul de ni xi.
Si xi dsigne un salaire
Ni dsigne le nombre de salaris
nixi
C- application
salaire
10-15
15-20
20-25
25-30
total
ni
8
25
32
16
82
xi
12.5
17.5
22.5
27.5
nixi
112.5
437.5
720
440
1710
nixi
112.5
550
1270
1710
M= ML ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linaire
720 5dh
1dh 5/720dh
(855-550) =3055 5/720*305dh
ML = 22.12dh
M = ML - ME
= 22 ,12 - 21,09 1dh
salaire
ni
Fi%
Fi% *n
xi
nixi
Nixi%
10-15
11
11
12.5
112.5
6.6
15-20
25
30.5
41.5
17.5
437.5
25.6
20-25
32
39
80.5
22.5
720
24.1
25-30
total
16
82
13.5
100
100
27.5
440
1710
25.7
Nixxi%cum
6.6
32.2
74.3
100
: Diagonal de lg
galit
: Aire de concentration
Remarques :
1) si 10% de la popula
lation touchent 10% du revenu, 20% de la
population touchennt 20% du revenu. Dans le cas dune rpartition
artition
galitaire du salairee, laire de concentration serait confondue avec
diagonal.
2) Dans le cas dune repartions
re
illgalitaire parfaite des salairess,
(comme dans le cass thorique ou 0.1% de la population toucherait
cherait
99.99% de la massee salariale : la courbe
Aire de concentration
C=
Aire du triangle ABC
Aire de G
C=
5000(100*100/2)
On peu estimer laire de concentration de la manire suivant :
Aire de concentration = 5000-(S1+S2+S3+S3)
B
S=1/2 a*b
S1 = (116.6)
S2= (41.5-11)/2(6.6+32.2)
S3= (80.5-41.5)/2(32.2+74.3)
S4 = (100-80.5)/2(74.3+100)
A
A
Si = 4404
n
S = n/2(a+b)
b
Remarque : 0<c<1
c = 0 Concentration lev
c = 1 Concentration faible
notion de tableau
t
de contingence :
A. une distributio
bution statistique double
Cest une distri
stribution ou lobservation seffectue selon 2 caractr
actres.
EX : Rpartition des tudiants selon la taille et lge
Rpartition
R
des logements selon le nbre de pices et
e superficie
10-30
30
30-50
50-70
70-80
total
superficie
nbr de piece
1
2
3
4
5
total
3
1
1
14
1
16
3
7
10
6
20
4
7
6
17
18
12
17
6
57
B. distributionss marginales
Ce sont les distributions relatives
relative la seul variable X ou Y
a- la rpartition des logemen
ments selon le nombre de pices (X)
Nbre de
Nbre de
e logement
pices (x)
1
4
2
18
3
12
4
17
5
6
total
57
Cette distribution qui concerne
concern la seule variable x est applle distribution marginale
mar
(marginal
car on la trouve la marge du
d tableau statistique)
On peut calculer la moyenne
ne de cette distribution, (et sa signification est le nbre
nbr de pices
moyenne par logement)
Moyenne appele moy.marginal
ginale note
b- la rpartition des logem
ments selon la superficie :
superficie y
10-30
30-50
50-70
70-80
total
Nbre de logements
4
16
20
17
57
Cette distribution qui conceerne la seule variable y est appele distributionn marginale on peut
calculer la moyenne (qui exxprime la surface moy des logements) applle mooy.marginal note
C. Les distribution
tributions conditionnelles :
On appelle distribution Conditionnelle
Con
la distribution ou lon a pos une con
ondition sur lune
des variables.
Ex : Rparation de logement
ements de 30-50m
Cette distribution est appel
ele Distribution Conditionnelle parce que lon ne sintresse quaux
logements qui satisfont la coondition de surface 30-50 m2.
On peut calculer la moyennne de cette distribution (c-a-d le nombre moyen de pices des
logts de 30-50 m2) on appellle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
alcule
Remarque il existe autant dee distributions conditionnelles relatives au caractr
actre x que le
caractre y a de modalits
IIx
X1
X2
Xi
Xk
gnralis
alisation du tableau de contingence
ences :
y
Y1
Y2
.
Yj
.
X11
X12
.
X1j
.
.
.
X21
X2j
.
.
.
Xi1
Xij
Xi2
.
Xk1
.
Xkj
.
Xk2
x. 1
x.2
.
x.j
.
x1 x2 . . . xk = les modalits de
d x
y1 y2 . . . yk = les modalits de
d y
x1 .effectifs pour la 1 re modal
alits de x et pour toutes les modalits de y
Ym
X1m
X2m
Ximm
Xkm
x. m
total
X1.
X2.
Xi.
Xk. total
x..
La distribution marginale de X :
X(xi)
.
.
Total
X i.
X1.
X2.
.
.
Xi.
Xk.
X..
La distribution marginale de y :
y(xi)
1y
2y
.
.
iy
y
m
Total
Xj.
X.1
X.2
.
.
X.i
Xm.
X..
Xij
X1j
X2j
.
.
Xij
Xkj
X.j
.
.
Total
y
1y
2y
.
.
iy
y
m
Total
Xij
Xi1
Xi2
.
. Xij
Xim
74
83
Total
1
1
1
1
1
1
1
1
6
Xi.
42
51
60
62
1
1
1
1
1
1
Nous avons un ensemble de points un nuage statistique qui nous indique que les prix est
les quantits voluent selon la mme tendance.
Il est possible de schmatiser ce nuage :
-Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil faudra
trouver.
a=pente de droite
b=ordonne lorigine
Une telle droite est appelle droite de rgression D(x)
A=coefficient de rgression
La rgression cest le fait de relier y x par une fonction
Calcule des paramtres de la droite de rgression :
La droite de rgression idale doit tre de telle manire que la somme des erreurs
destimation doit tre la plus faible possible, | yi yi | doit tre minimum.
Pour viter les valeurs absolues, on convient de calculer les carrs des erreurs. La
droite de rgression doit tre telle que :
(yi yi) 2 minimum, et on appelle cela la condition des moindres carrs.
yi
xi
Xi
X
Le paramtre a Que nous cherchons correspond la pente de la droite de rgression qui passe
par le point moyen M ( ; ).
Procdons un changement dorigine, et prenons comme nouvelle origine le point moyen
M(x ; ), les nouvelles cordonnes deviennent :
Xi = xi
Yi = yi -
La droite de rgression a pour quation y = ax
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------PHYTO CONSULTING / HANDASSA AGRI BUREAU
Page 41 sur 60
(xi ) 2
b= -a
D Application:
Prix(x)
Qts(y)
70
72
75
51
77
60
80
62
86
74
33
83
481
372
xxii
a=
( xi x)( y i y)
_
( xi x)2
x = 481 / 6 = 80
x= n
y = 372 / 6 = 62
Trouver
xi -
-10
-5
-3
0
6
13
Dy (x).
yi -
-20
-11
-2
0
12
21
(xi- ) (yi - )
200
55
6
0
72
273
606
(xi- )
100
25
9
0
36
169
339
a = 1/a aa = 1
2me cas : les 2 droite font entre elles un angle trs faible :
STATISTIQUE DESCRIPTIVE
Application : calculer le coefficient de corrlation dune autre faon (existe-t-il un lien entre y
et x).
Prix
70
75
77
80
86
33
Qt
42
51
60
62
74
83
x x
y-
(x x ) (yi - )
(x x ) 2 (yi - ) 2
606
339
1110
339 1110
2
xi yi
a=
x)( y y)
( xi
x
i
x) 2
(x i
x y
i
(x
339
x)( y y)
= 1.79
a =
606
=
= 606
y) 2
(y i
= 0.545
1110
2
:Remarque : lorsquon crit
= a. a r = racine a .a, nous avons une expression trs
positif. Comment trouver alors le signe dune corrlation ?
Rponse : le sens de la corrlation est donne par le signe de a et a.
Si a et a sont >0 le produit a.a >0 corrlation positive.
Si a et a sont <0 le produit a.a>0 corrlation ngative.
On peut dire dune corrlation quelle est trs satisfaisante partir 0.86.
On peut dire dune corrlation quelle parfaite partir de 0.96.
IV formule facilitant les calculs :
1/ calcul de a :
N
, N = xi yi - xi x y
a = (xi ) (yi - ) =
D
x
i+
2
(xi x)
xi
Or x =
N
yi
On remplace : N =
xi = n x
yi = n
xi yi - n x -n x + n x
xi yi n x y
N=
D=
(xi x ) 2 =
(xi 2 2xi x + x2 ) =
xi2 2 x xi + n x 2
= xi2 2n x 2 + n x 2
2
2
D = xi n
Donc a =
xi yi n x y
2
x2 n x
Formule dveloppe
xi
yi
xi2
Xi yi
2 calcul de r :
xi yi n
r2= a.a
a=
xi2 n 2
xi yi n
a =
yi 2 n 2
Donc
r=
a * a'
V Autre formule de r :
[
(xi ) (yi - )] 2
r=
(xi ) 2 (yi - ) 2
Or
(xi ) 2
2
x=
(xi ) 2 = n2x
(yi ) 2
2
(yi ) 2 = n2 y
y=
(xi ) (yi )
Donc r ==
2
[( xi x)( yi y)]
n 2 . 2 x. 2 y
(xi ) (yi )
Cov (xy)
n
Cov (xy)
r scrit : r =
x.y
n.x. y
1
120
130
144
157
2
148
162
178
196
3
155
169
186
210
4
120
132
145
160
Lajustement analytique.
B.
1 matrices transposes :
1 3 4
A=
2 -1 5
2 Laddition :
1 -1 3
+
2 4 1
(aij) + (bij) =
Proprits :
-
A=
0 4 3
1 2
3 -1
4 5
1 3 6
=
3 -1 -1
5 3 0
(aij + bij)
commutativit
association
lment neutre
lment symtrique
la matrice nulle
t (a+b) = ta+tb
3- Multiplication par un rel :
1 -1 3
3 -3 9
3*
=
2 4 1
6 12 3
Dmographie Taux de mortalit, taux de natalit, population par province, par nationalit.
Culture
tudes
Sports
I.
La population cible est l'ensemble de tous les objets que l'on tudie.
Une unit statistique est un objet de cette population.
Un chantillon est une partie choisie d'une population.
II.
Exemp
mples:
1. tude portant sur la la
angue maternelle des Qubcois:
la population est l'ensemb
ensemble des Qubcois
et la caractristique est
e la langue maternelle.
III.
tapes
s d'une enqute statistique :
1. Dterminer la populatio
ulation cible et les caractristiques de cette populati
ation que l'on veut
tudier.
2. Dterminer la manire
ire dont l'chantillon va tre prlev.
EXERCICES
OBJECTIFS VISES :
1.
2.
3.
4.
moyenne.
mdiane
mode
quartiles
5.
calcul et interprtation des caractristiques de dispersion :
variance
cart type
coefficient de variation
Exercice 1 :
1.
2.
3.
4.
Exercice 3 :
La rpartition par ge dune population dun centre de vacances est comme suit :
Classe dage (en annes)
effectifs
0-5
16
5-15
42
15-25
44
25-35
40
35-45
30
45-55
32
55-60
15
60-75
36
75-100
15
1. tracer lhistogramme de cette distribution
2. calculer lcart type et donner sa signification
3. on dsire rajeunir cette population en invitant au centre des vacances des
personnes de la classe [25-35[.combien faudrait-il en faire venir pour que
la moyenne de la population soit de 35 ans.
Exercice 4 :
1.
2.
3.
4.
Nombre de propritaires
24
36
22
18
14
6
Partie I :
prciser le caractre tudi et prciser sa nature.
donner la signification de du centre de la 2me classe.
dterminer rapidement la mdiane et donner sa signification
dterminer algbriquement le mode et donner sa signification
calculer la superficie moyenne et lcart type. Que peut on conclure ?
dterminer le 1er et le 9 me dcile et donner leurs significations
Partie II :
1. dterminer graphiquement la concentration foncire dans cette rgion agricole,
Calculer lindice de GINI
2. dterminer algbriquement la concentration
3. dterminer graphiquement le pourcentage des propritaires dont la superficie des
terres est infrieure la mdiale.
1.
2.
3.
4.
5.
6.
Exercice 6 :
Pendant 9 annes les bnfices dune entreprise ont augment :
Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?
Exercice 7 :
Le tableau suivant donne la rpartition des salaires mensuels des cadres dune
entreprise :
Salaires en 1000DH
6-8
8-10
10-16
16-22
22-30
30-34
34-38
total
II
1.
2.
3.
4.
OBJECTIFS VISES :
Calcul de la fonction linaire
calcul et commentaire du coefficient de corrlation
interprtation des distributions marginales
interprtation des distributions conditionnelles
Exercice 8 :
Une entreprise a prsent ses dpenses de publicit et ses chiffres pour les 6
dernires annes dans le tableau suivant (en 106 DH)
Dpenses de publicit
Chiffre daffaires
2
10
4
16
10
50
14
120
18
140
24
210
Exercice 9 :
22
7
0
29
15
38
7
60
9
22
30
61
46
67
37
150
Exercice 10 :
Le tableau suivant donne la rpartition des salaris dune entreprise de btiment selon le
nombre denfants charge X et les salaires mensuels perus y en milliers de DH
Nombre de pices Y
1-3
3-5
5-9
Nombre denfants X
1
4
8
16
2
6
12
24
3
6
12
3
4
2
4
8
1. donner la distribution marginale de la variable X
2. donner la distribution conditionnelle de la variable Y lie la modalit 4 de X.
3. que signifient les valeurs 16 et 3 souligne dans le tableau
4. vrifier de deux manires diffrentes que les deux variables sont indpendantes.
Dites dans ce cas est gal le coefficient de corrlation linaire : r (sans le
calculer.
5. calculer la variance marginale de Y.
Exercice 11 :
Une tude ralise dans un club sportif concernant le poids et la taille de 124 adhrents
a fourni les informations suivantes :
poids en Kg Y
50-60
60-65
65-75
75-80
taille en mtres X
1,60-1,70
1,70-1,75
1,75-1,80
1,80-1,90
1,90-2,00
12
?
9
?
3
7
6
8
7
5
6
8
8
5
3
4
3
4
6
3
de y 2
_
Exercice 12 :
Ventes
40
30
42
46
44
38
Frais de publicit
1.1
0.8
1.2
1.4
1.3
1.1
1. dterminer une fonction linaire qui donne le montant des ventes lorsquon
connat les frais de publicit.
2. quel serait le montant des ventes si les frais de publicit atteindront
3500DH.
3. dterminer sil y a ou non une liaison entre les ventes et les frais de
publicit.