Vous êtes sur la page 1sur 27

Plan de cours de statistique descriptive

.CH I: Rappels sur les indices simples

.CH II:Les indices synthétiques

.Principe de l'indice synthétique -2-1

.Les indices de LASPEYERS -2-2


.Définition:2-2-1
.Calcul de l'indice :2-2-2
.A : Indice de prix
.B : Indice de la quantité

.Les indices de PAASCH -2-3


.Définition:2-3-1
.Calcul de l'indice:2-3-2
.A:indice de prix
.B: indice de quantité

.Exemple des indices officiels -2-4


.indice de prix de consommation : 2-4-1
.indice de prix de la production industrielle : 2-4-2

.CH III : les caractéristiques de dispersion

.limites des caractéristiques de position -3-1


.l'étendue -3-2

.l'intervalle interquartile -3-3

.l'écart – type -3-4

.l'écart – absolu moyen -3-5

.la variance -3-6

.CH IV : la concentration

.CH V : l'ajustement linéaire

.CH VI : la corrélation

1
CH I : Les Indices simples

:I- Notions
:Exemple-1

:On considère le prix d'un litre de lait en


.DH et 2004 : 5,60 DH 5,20 : 2000
.Q = Calculer le rapport du prix au lait en 2004 par rapport à 2000
R= P04/P00 = 5,60 : 5,20 = 1,07 à cœfficient signifié que la quantité de lait achetée en
.2000 à 1 DH, et en 2004 à 1,07 DH
On multiplie le rapport par 100, on obtient l'indice simple du prix de lait en 2004/2000.
1,07 x 100 = 107
:On considère
.L’année 2000 : année de base
I00/00 = (5,20 : 5.20) x 100=100
.L'année 2004 : année en cours
I04/00 = (5,60 : 5,20) x 100 =107
:On calcul le taux de variation
)% x 100 = [(107 – 100)/100] x 100 = + 7 ]I00/00 : )I04/00 – I00/00([
.Donc : le prix d’ un litre de lait a augmenté de 7 % en 2004/2000

:DEFINITION -2
L’indice simple permet de mesurer l'évolution d'une grandeur. Il est déterminé
par le rapport entre deux valeurs d'une même grandeur (le prix du lait par exemple) dans
.deus situations différentes

Avec : t0 : Année de base


.t1 : Année en cours

I t 1/ t 0 = (G1 : G0) x 100

:II- Propriétés des indices

.Propriétés caractérisant les indices -1


.1ère propriété: Identité -
Il y a identité si : I t1/ to = 100
AN: en t0 : G0 = 5 DH et en t1 : G1 = 5 DH donc G1 = G0 = 5 DH
I t1/t0 : (5 : 5) x 100 = 100
.La grandeur en t1 prend la même valeur qu'en t0

2
.2eme propriété : Réversibilité -

:Il y a réversibilité si
xAN:
[(I t0/t1) : 100] = 1 ou bien (I t1/ t2DH
p : 5.60 DH et p  : 5.20
) = 1 : I t0/t1 ]100 : )I t1/t2([
04 00

x (I00/04 : 100) = [((5,6 : 5,2) x 100) : 100] x [((5,2 : 5,6) x 100) : 100] = 1 )I04/00 :100(

(1: I00/04) = [1 : (5,2 : 5,6)] = 5,6 : 5,2 = I 04/00

.3éme propriété : transférabilité-

: Il y a transférabilité si

t0 t1 t2

x [(It0/t1) : 100] = It2/t0 : 100 ]100 : )I t1/ t0([

t0 : G0 : 5,2 DH

t1 : G1 : 5,4 DH

t2 : G2 : 5,6 DH

100] x [(It0/t1) : 100] = [((5,4 : 5,2) x 100) : 100] x [((5,6 : 5,4) x 100) : 100] : )I t1/ t0(
100 : ]x 100 )5,2 : 5,6([ =
100 : )I t2 / t0( =

3
CH II : les indices synthétiques
I- Indices synthétiques simples (ISS)
:Exemple -1

On a deux méthodes
2000 2004
produits
Pain (14) 1,10 1,30
Lait (12) 5,20 5,60
La moyenne des L'indice desHuile (12) 8 10
F: indices moyennes
calculer L'ISS de 2004 T.A.
?par rapport à 2000

:a- la moyenne des indices

L'indice du pain  : I04/00 = (1,30 : 1,10) x 100 =118,18 -


L'indice du lait  : I04/00 = (5,60 : 5,20) x 100 =107,69 -
L'indice de l’huile : I04/00 = (10 : 8) x 100 =125 -

ISS 04/00 = (118,18+107,69+125) : 3


ISS04/00 =116,95

Interprétation : les prix des 3 produits ont augmenté de 16,95% en 2004/2000

ISS t1/ to = Σ Ii : Npr


)Aveci=1i = produits(
)Npr : Nombre de produit(

:b- L'indice des moyennes


la moyenne des prix pour 2000 = (1,10 + 5,20 + 8) : 3 = 4,76 *

la moyenne de prix pour 2004 = (1,30 + 5,60 + 10) : 3 = 5,63 *

Iss 04/00 = (5,63 : 4,76) x 100 = 118.27

.Interprétation : les prix des 3 produits ont augmenté de 18,27 % en 2004/2000

ISS t1/t0 = [(Σ Gi / t1) : N] : [(Σ Gi/t0) : N]

.Remarque: La méthode la plus utilisée est la moyenne des indices

4
.Définition-2
ISS regroupent en un seul nombre, plusieurs indices simples de même nature. Il est simple dans
la mesure où chaque valeur des indices simples n'entre qu'une seule fois dans le calcul de l'indice
.synthétique simple

:II- L'indice synthétique pondéré


:Exemple-1

Années 2000 2004


Prix (DH) Quantité (unité) Prix (DH) Quantité (unité)
Produite
Pain (14) 1,10 60 1,30 40
Lait (12) 5,20 4 5,60 6
Huile (12) 8 3 10 2

:A- Indice de LASPEYRES


))Pondération avec les donnés de l'année de base

A1- l'indice de prix (IP)


Lp04/00 = [(1,30 x 60 + 5,60 x 4 + 10 x 3) : (1,10 x 60 + 5,20 x 4 + 8 x 3)] x 100
Lp04/00 = [(78 + 22,4 + 30) : (66 + 20,8 + 24)] x 100
Lp04/00 = (130,4 : 110,8) x 100
Lp04/00
Donc = 117,68
les prix ont augmenté de 17,68 % en 2004/2000

Σ P i t1 x Qi to
Lpt1/ t0 = x 100
Σ Pi to x Qi to

.A2- l'indice de quantité (Lq)


Lq 04/00 = [(40 x 1,10 + 6 x 5,20 + 2 x 8) : (60 x 1,10 + 4 x 5,20 + 3 x 8)] x 100
Lq 04/00 = [(44 + 31,2 + 16) : (66 + 20,8 + 24)] x 100
Lq 04/00 = (91,20 : 110,8) x 100

Iq04/00 = 82,31

Taux = [(82,31 – 100) : 100] x 100


T= -17,69

Σ Q i t1 x Pi to
Lq t1 / t0 = x 100
Σ Qi to x Pi to

5
: B- L'indice de Pasch

B1: L'indice des prix (Pp)

Pp04/00 = [(1,30 x 40 + 5,60 x 6 + 10 x 2) : (1,10 x 40 + 5,20 x 6 + 8 x 2)] x 100

Pp04/00=[(52 + 33,6 + 20) : (44 + 31,20 + 16)] x 100

Pp04/00 = (105,60 : 91,20) x 100


Pp= 115,78
Donc les prix ont augmenté de 15.78 en 2004/2000

Σ P i t1 * Qi to
Ppt1/ t0 = x 100
Σ Pi to * Qi to
:B2- L'indice de quantité (Pq)

.Pq04/00 = [(40 x 1,30 + 6 x 5,60 + 2 x 10) : (60 x 1,30 + 4 x 5,60 + 3 x 10)] x 100

Pq04/00 = [(52 + 33,60 + 20) : (78 + 22,40 + 30)]

Pq04/00 = (105,60 : 130,40) x 100


Pq = 80,98

Taux = [(80,98 – 100) : 100] x 100

Les
T=quantités
- 19.02 ont baissé de 19,02 % en 2004/2000

Σ Q i t1 x Pi to
Pq t1/ t0 = x 100
Σ Qi to x Pi to

 Fin de correction

:Exercice d'application -2

6
:Les exportations marocaines pour les 8 premiers mois des années 1994-1995

Années 1994 1995


Prix unitaire Quantité Prix unitaire Quantité
Produits )M.DH( (MT) )M.DH( (MT)
Produits alimentaires 7.04 849.1 9 736.3
Produits énagtiques 1.47 307.6 1.64 428.8
Produites miness antres 0.48 1832.3 0.44 2413.6
que les phosphetes

?T.A.F: calculer et interpréter


Lp 95/94-1
Lq 95/94 -2
Lp 95/94 -3
Lq 95/94 -4

Pi95 * Qi 94 Pi95 * Qi 95 Qi95 * Pi 94 Qi95 * Pi 94


7941.9 6626.7 5183.55 5977.66
504.46 703.23 630.34 452.17
806.21 1061.98 1158.52 879.5
TOTAL: 8952.57 8391.91 6972.41 7309.33

Lp = Σ Pi 95 * Qi 94 * 100 -1
Σ Pi94 * Qi 94

Lp 95/94 = 8952.57 * 100 Lp95/94= 122.48


7309.33

Lq = Σ Qi 95 * Pi 94 * 100 - -2
Σ Qi94 * Pi 94

Lp 95/94 = 6972.4 * 100 Lq95/94= 95.4


7309.3

.les quantités exportés ont baissé de 4.61% en 95/94 *

Conclusion: La baisse des quantités exportées est dûe à une hausse des prix des produits
.exportés

7
Pp 95/94= Σ Pi 95 * Qi 95 * 100 -3
Σ Pi94 * Qi 95

Pp 95/94= 8391.91 * 100


6972.41

Pp95/94= 120.35

.les prix des produits exportés ont augmenté de 20.35% en 95/94 *

Pq 95/94= Σ Qi 95 * Pi 95 * 100 -4
Σ Qi94 * Pi 95

Pq 95/94= 8391.91 * 100


8952.57
Pq95/94= 93.73

.les quantités exportés ont baissé de 6.27% en 95/94 *

:III- Exemple d'indices officiels


:A- l'indice du coût de la vie

l'indice mesure la variation relative des prix dans le temps et dans l'espace de produits *
.destinés à la consommation finale de la population à revenus modestes

:le nombre de produits retenus •


la variation relative des prix est mesurée à l'aide d'un échantillon de 385 articles
.représentant l'ensemble des produits concernés
:les points d'observation •
les prix des produits retenus sont observes dans on échantillons de 11grandes
,villes:agadir,casablanca,fés,kennitra,laâyoune,marrakech,meknes,oujda
.rabat,Tanger et tetouan
:le mode de calcul et l'année de base •
.l'indice est calculé selon la pondération de laspeyres à partir de l'année de base 1989
:Indice général du coût de la vie

pondération 2002 2003 I02*pond I03* pond

8
Alimentation 44.82 164.2 166.4 7359.44 7458.04
Habillement 6.34 166.2 167.6 1053.70 1062.58
Habitation 14.29 165.0 167.0 2357.85 2386.43
Equipement ménager 5.00 139.2 139.8 696.00 699.00
Soins médicaux 5.44 144.1 146.7 783.90 798.04
Transports et communica 7.79 163.4 163.7 1272.88 1275.22
Loisirs et culture 5.67 164.8 168.1 934.41 953.12
Autres biens et services 10.76 170.3 172.1 1832.42 1851.79
Indice général =ICV 100.00 16290.6 16484.22

:pour calculer l'ICV, ont calculent la moyenne des pondérés des indices élémentaires *

ICV02= (164.2 * 44.82)+(166.2 * 6.34)+(……..)+(170.3*10.76)


100
ICV02= 16.290,6 = 162.9dh → le coût de la vie augmenté de 62.9% en 02/89
100

ICV03= (166.4 * 44.82)+(167.6* 6.34)+(……..)+(172.1*10.76)


100
ICV03= 16.484,22 = 164.8dh → le coût de la vie augmenté de 64.8% en 03/89 100

:b- l'indice des prix à la production industrielle

cet indice permet comme son nom l'indique de mesurer les variation des *
.prix à la production des produits industriels,énergétiques et miniers

• :les prix à la production


les prix des produits concernes sont des prix "sortie-usine",hors taxe .dans le cas ou le
prix sortie-usie est difficile à déterminer du fait de l'éloignement du service commercial
.de l'usine de production,on retient le prix à la sortie du service commercial

• :Le nombre de produits retenus


L'échantillon des produits retenus pour l'élaboration de cet indice est composé de 171
articles représentant l'ensemble des produits ayant fait l'objet d'une transformation sur le
territoire marocain.ces produits sont classés selon les branches de la comptabilité
.nationale

• :Le points d'observation


Les prix sont observés auprés de 105 entreprises et 2 administration/ville répartie sur 5
:villes

9
;casablanca 91 -
; mohammedia 4 -
;rabat 4 -
safi 2 -
.kénitra 1 -

• :Le mode de calcul et l'année de base


L'indice est calculé selon la pondération de laspeyers a partir de la période de base
.juillet 75-juin 76 indice des prix à la production industrielle , énergétique et minière

:l'indice des prix à la production *


l'évolution de l'indice moyen des prix à la production des industries manufacturières a
fait apparaître en 2003 une hausse de 1.3% au lieu d'une baisse de 1.2% une année
auparavant et un taux d'accroissement annuel moyen de 2.3% au cours de trois années
precedentes.cette évolution est attribuable,pour prés de deux tiers.au coût du raffinage
du pétrole qui après une diminution de 9.7% en 2002. a enregistre en moyenne annuelle
une augmentation de 3.1% cet accroissement est imputable au renchérissement de 15%
des cours internationaux du pétrole, lequel a été atténué en grande partie par la
.dépréciation du dollar

Pondérations Variations en % des indices moyens des


Groupes de produits )% en( prix à la production industrielle
2001 2003

La progression des prix à la production des industries de transformation, à l'éxclusion


du raffinage du pétrole, n'a pas dépassé 0.9% et a résulté principalement de la hausse de
2.1% des prix des industries alimentaires.
En effet, en dehors des hausses notables,respectivement de 2.9% et de 1.3%, des
industries métallurgiques et chimiques,les prix industriels ont enregistre des
accroissement modérés. Voire, des baisses. Les diminutions les plus importantes ont
concerne les prix du papier et du carton et ceux du caoutchouc et des plastiques, qui ont
fléchi respectivement de 2.1% et de 1.7% ainsi que les prix de l'industrie textile qui ont
baisse de 0.4%.

10
CHIII: les caractéristiques de dispersion
I- limites des caractéristiques de position:
1- exemple:
Supposant que nous avons à comparer du salaire horaire accordé par 2
entreprises:
E/se A: 22 - 22.8 - 24.8 - 26 - 27.2.
E/se B: 18.8 - 19.3 - 24.8 - 25.6 - 34.4.

T.A.F: déterminez les caractéristiques de tendance centrale X et Me?

* Médiane = Me de L'E/se A: 24.8


* Médiane = Me de L'E/se B: 24.8

22+22.8+24.8+26+27.2
* la moyenne = X A = = 24.5
5
22+22.8+24.8+26+27.2
* la moyenne = X B = = 24.5
5
Commentaire: les deux séries statistiques ont la même Me et la même X mais on ne
peut pas conclure que les 2 entreprises accordent le même salaire. En effet dans
l’entreprise B les salaires horaires sont plus étalés ; plus dispersés que dans l’entreprise
A.

II- Utilité des caractéristiques de dispersion:


Ce sont des paramètres qui permettent de mesurer la distribution des valeurs d'une
série statistique autour de la valeur centrale (Me ou X).

11
Elles permettent de faire des comparaisons entre 2 on plusieurs séries statistiques.

III- les caractéristiques de dispersion:


1-L'étendue:
1-1- Exemple:
EA = 27.2 – 22 = 5.2dh
EB = 34.4 – 18.8 =15.6dh

1-2- Définition:
* L'étendue est la différence entre deux valeurs extrêmes de la série classée dans l'ordre
croissant ou décroissant.
E = Vmax - Vmin

Limites: L'étendue renseigne uniquement sur la dispertion du faite que l'on tient
compte, toutes les valeurs extrêmes de la serie statistiques.

2- L'intervalle interquartile : I.Q = Q3 – Q1


…………………………………………………………………………..
……………………………………………………………………………..
Les quartiles Q1, Q2 et Q3 partagent l'ensemble des valeurs croissant en quatre parties de
même effectif, ou bien contenant chacune au plus 25%.

La signification des quartiles:


* Q1 = c'est la valeur de la variable statistiques telle que (les observations sont classés
dans un ordre croissant ou décroissant).25% des observations sont inférieures < à Q1 et
75% sont supérieures > à Q1.

 Q2 = Médiane:
 Q3 = c'est la valeur de la variable statistique telle que 75% des observations sont
< à Q3 et 25% des observations sont > à Q3.

2-1- Définition:
 L'intervalle interquartile est la différence entre Q3 et Q1. elle correspond à 50% de
la population. En note IQ = Q3 –Q1.

2-2- Exemple:
Dépense de consommation d'un échantillon de 40 familles.
Classes de la dépense Effectif (Ni) Ni. Cum. Croissante
[0000-0500[ 2 2
[0500-1000[ 14 16
[1000-1500[ 13 29
[1500-2000[ 4 33
[2000-2500[ 3 36
[2500-3000[ 2 38

12
[3000-3500[ 2 40
Total N=40 *****************
2-3- Détermination de Q1:
*par calcul:
N 40
Q1 4 = 4 = 10
Nous cherchons les dépenses de consommation de la 10éme famille.

2<10<16 16-2→ 1000-500 14→ 500


500<Q1<1000 10-2→ Q1-500 08→ Q1-500
8*500
Q1-500 = = 285.71dh Q1=500+285.71= 785.71dh
14

2-4-Détermination de Q3. *par le calcul:


Nx3 40x3 120
Q3 4 = 4 = 4 = 30
Nous cherchons les dépenses de consommation de la 30éme famille.
29<30<33 33 – 30 → 2000 – 1500 4 → 500
1500<Q3<2000 30 - 29 → Q3 – 1500 1 → Q3-1500

500 x 1
Q3 – 1500 = = 125dh Q3 = 1500 + 125 =1625dh
4

 pour méthode graphique:( voir 1ér graphique)

13
2-5- Lecture:
* Q1 = 25% des familles concernées dépensent mensuellement moins de 785.87dh et
75% dépensent mensuellement plus de 785.87dh.
*Q3 =75% des familles concernées dépensent mensuellement mois de 1625dh et
25% des familles dépensent mensuellement plus de 1625dh.
2-6- Détermination de l'intervalle interquatilles (IQ).

IQ= Q3 – Q1 = 1625 – 785.71 = 839.29dh


Lecture: l'amplitude 839.29dh contient 50% des familles concernées.

Remarque: L’intérêt du calcul de l’intervalle (IQ) n'apparaît vraiment que lorsque en


fait la comparaison entre deux séries statistiques.

3- L'écart absolu moyen EX, (dispersion au tour de X)


3-1- série simple : Ni =1
* Exemple: Distribution du salaire horaire dans l'entreprise B.

Xi en DH Xi - X Xi -X
18,8 -5.64 5.64
19,2 -5.24 5.24
24,2 -0.24 0.24
25,6 1.16 1.16
94,4 9.96 9.96

T=122.2 ****************** 22.30

Lecture: en moyenne, les salaires horaires s'écartent de 4,46dh du salaire moyenne.


 Définition:
L'écart absolu moyen noté " EX " est la moyenne arithmétique des écarts de la variable
par rapport à la moyenne arithmétique.
 Exemple: Nombre d'enfants à charge pour 200 familles.

14
xi ni xi.ni xi-x xi-x .ni
1 40 40 1.86 74.4
2 56 112 0.86 48.16
3 48 144 0.14 6.72
4 28 112 1.14 31.92
5 12 60 2.14 25.68
6 10 60 3.14 31.4
7 4 28 4.14 16.56
8 2 16 5.14 10.28

totaux 200 572 12.56 245.12


∑ xi . ni 572
X= = = 2.86 enfants
N 200
EX=∑│xi.x│.ni = 245.12 = 1.22 enfants = 1 enfant
N 200
Lecture: en moyenne le nombre d'enfants à charge s'écarte d’ 1 enfant du nombre
d'enfants à charges par famille.

3-3- Série continues:


Exemple:
classes ni ci ci x ni ci - x ci - x .ni
(14-15( 5 14.5 72.5 1.2 6
(15-16( 16 15.5 248 0.2 3.2
(16-17( 7 16.5 115.5 0.8 5.6
(17-18( 2 17.5 35 1.8 3.6

totaux 30 64 471 4 18.4


∑ ci x ni 471
X= = = 15.7 ans
N 30
EX = ∑│ci.x│.ni = 18.4 = 0.61ans = 7 mois
N 30
Lecture: ou moyenne l'âge des élèves de la 1.T.G.C s'écartent de 7 mois de l'âge
moyenne des élèves de 1T.G.C.

4- L'écart type:
4-1 Série simple n = 1:
 Exemple: salaire horaire accordé par l'entreprise B en DH.
Xi (Xi – X) (Xi –X) 2

15
18,8 -5.6 31.36
19,2 -5.2 27.04
24,2 -0.2 0.04
25,6 1.2 1.44
94,4 10 100

T = 122.2 ************* 159.88


∑xi 122,2
X= = = 24,5
∑ ni ou N 5
La variance:
∑(xi –x)2 159,88
V(x) = = = 31,97
∑ ni ou N 5
L'écart – type: 6(x)= v(x) = 31.97 = 5.65dh
Remarque: la variance V(x) n’a aucune signification statistique ce n'est qu'une étape
intermédiaire de calcul.
Lecture: En moyenne le salaire horaire distribué par l'entreprise B s’écarte de 5,65dh
du salaire moyen.
4-2- série discrète:
* Exemple: nombre d'enfants à charge pour 200 familles
xi ni Xi ni (xi-x) (xi-x) 2 (xi-x)2. ni
1 40 40 -1.86 3.45 138
2 56 112 -0.86 0.73 40.88
3 48 144 0.14 0.01 0.48
4 23 112 1.14 1.29 36.12
5 12 60 2.14 4.57 54.84
6 10 60 3.14 9.85 98.5
7 4 28 4.14 17.13 68.52
8 2 16 5.14 26.41 52.80

totaux N=200 572 490.14


∑ xi.ni 572
X= = = 2,86
N 200
∑ (xi –x) .ni
2
159,88
V(x)= = = 2.45
∑ niouN 200
6(x)= V(x) = 2.45 = 1.56 _ 2 enfants
Lecture: En moyenne le nombre d'enfants à charge s'écarte de 2 enfants à peut prêt du
nombre moyen d'enfants.
*Exemple: Répartition des élèves 1:T.G.C selon l'Age.
classes ni ci ci.ni (ci - x) (ci - x) 2 (ci-x)2. ni
(14-15( 5 14.5 72.5 -1.2 1.44 7.2
(15-16( 16 15.5 2.48 -0.2 0.04 0.64

16
(16-17( 7 16.5 115.5 0.8 0.64 4.48
(17-18( 2 17.5 35 1.8 3.24 6.48
totaux N=30 471 5.36 18.8
∑ ci x ni 471
X= = = 15.7
N 30
∑ (xi –x)2. ni 18.8
V(x)= = = 0.62
∑ ni ou N 30
6(x) = V(x) = 0.62 = 0.79 = 9 mois.

Lecture: En moyenne l'âge des élèves de 1 T.G.C s’écarte de 9 mois à peu près de l'âge
moyen des élèves.

CHIII: La concentration.
I- La courbe de Lorenz:
1-Exemple:
Soit la répartition des propriétaires dans une zone rurale selon la superficie d'exploitation en hectares:
Superficie Nombre de Ci Fi % FiCC % Superficie Ci x ni*100 qiCC %
En Propriétaires Globale
hectare (ni) (Ci x ni) ∑ ci x ni
2-6 52 4 26 26 208 7 7
6-10 96 8 48 74 768 25 32
10-30 34 20 17 91 680 22 54
30-90 12 60 6 97 720 23 77
90-150 6 120 3 100 720 23 100
totaux 200 212 100 3096 100

Axe de abscisses axe des ordonnées


ni x 100 52 x 100
Fi = (exp1 = 26%)
N 200
Lecture :
1- 34 propriétaires possèdent des exploitations dont la superficie est de 10 hectares à
moins de 30 hectares.
2- 34 propriétaires ont les exploitations dont la superficie moyenne est de 20
hectares.
3- 17% des propriétaires possèdent des exploitations dont la superficie est de 10 à
moins 30 hectares.
4- 91% des propriétaires possèdent des exploitations dont la superficie est de 2 à
moins 30 hectares.
5- 680 hectares sont divisées en exploitation de 10 à moins 30 hectares est
procédées par 34 propriétaires ou bien 17% des propriétaires.

17
6- 22% de la superficie globale divisées en exploitation de 10 hectares à moins 30
hectares sont possédés par 17% des propriétaires.
7- 91% des propriétaires possèdent 54% de la superficie globale.
(Représentation Graphique : Voir annexe :….)
Interprétation:
 la répartition des exploitations entre les propriétaires est inégalitaire puisque la
courbe de concentration est largement en dessus de la diagonale (ligne d'égalité).
 Il y'a donc une forte concentration. en effet 91% des propriétaires ne possèdent
que 54% des exploitations, alors que 9% de propriétaires possèdent 46% de ces
exploitations.

II- l'indice de Gini (IG):

1- Exemple (précèdent)
2- détermination de l'IG.
a- calcul de la surface S
 elle s'agit de la surface du triangle OÄB:
100 x 100
S= S = 500
2

b- calcul de S2:
S2 = s1 + s2 + s3+ s4+ s5 hxb
[S1] → forme d'un triangle L’aire = (h=hauteur b = base)
26 x 7 2
S1 = = 91
2 (B + b) x h
( s1 ; s2 ; s3 ; s4 ; s5 ): Forme de trapèze: aire = .
2

S2 = (7+32) x (74-26) B = (grande base)


2 b = (petite base)
h = (hauteur)
39 x 48 1872
S2 = =
2 2
S2 = 936
(32+54) x (91-74) 86 x 17 1462
S3 = = = = 731
2 2 2
(54+77) x (97-91) 131 x 6 786
S4 = = = = 393

18
2 2 2
(77+100) x (100-97) 177 x 3 531
S5 = = = = 265.5
2 2 2
S2 = 91 + 936 + 731 + 393 + 265.5

S2 = 2416.5
C- calcul de S1 (aire de concentration).
S1 = S – S2
S1 = 5000 - 2416.5
S1 = 2583.5
d- Calcul de l’indice de Gini :

S – S2 S S2
IG = → IG = -
S S S

S2
Ou bien IG = 1 –
S

Aire de concentration
IG =
5000
5000-2416.5
A.N: IG = = 0.52
5000
2416.5
Ou IG = 1 - IG = 0.52
5000
Commentaires:
- il y’a une concentration moyenne dans la répartition des exploitations. Il y’a donc présence
d’inégalité dans cette répartition.
Remarque :
- L’IG est un nombre sans démentions.
- Elle est toujours compris entre O (concentration nulle) et 1 (concentration totale).
- Plus l’indice se rapproche de O plus il traduit une faible concentration et plus il se rapproche
de 1 plus il traduit une forte concentration.
-Cas possibles de la courbe de Lorenz

19
Principe de construction de la courbe de lorenz.
On construit un carré dont les côtés sont gradués de 0 à 100 sur la base, prise
comme axe des abscisses. On portera les fiCC% sur la hauteur prise comme axe des
ordonnés.
On portera les qicc%. (ci x ni / ∑ ci x ni.) On placera, après avoir tracé la diagonale
principale les points représentant les couples :
(fi CC% ; qi CC% ) la courbe de concentration s’obtient en joignant l’ensemble des
points ainsi tracées.

20
CH V : L’Ajustement linéaire.

Introduction :

- Lorsqu’une série statistique mise en jeu deux variable X i et Yi et que sa représentation


fait apparaître une tendance, il est utile de l’exprimer par une fonction mathématique qui
traduit en mieux la tendance générale.
- On procèdera alors à un ajustement.
- Ajuster un ensemble de points : consiste à déterminer une courbe C aussi proche que
possibles de l’ensemble des points N.
- Dans le cas de l’ajustement linéaire la courbe C est une droite.

I- Ajustement linéaire Graphique.

1- Exemple :
Le responsable de la production pense que l’augmentation du salaire favorise la quantité
des pièces fabriquées. Pour convaincre le chef de l’entreprise il met à sa disposition les
résultats qui sont issus de l’observation de 18 ouvriers. Ces résultats sont les suivants :

Salaire horaire Nombre de pièces défectueuses par


(Xi) moi (Yi)
4 20
4.5 19
5 17
5.5 15
6 13
6.5 12
7 11
7.5 10
8 10
8.5 8
9 7
10 6

21
11 6
12.5 5
13 3
14 2
14.5 1
15 1

161.5 166

Représentation graphique (Voir Annexe…..)


Principe :
Instinctivement on est amené à tracer sur un graphique à main levée une droite tel que
se compense les écarts positifs on négatifs des points observés à la droite obtenue.
 L’équation de la droite d’ajustement est y= ax + b, est déterminée à partir des
coordonnées de deux points.
- On choisi deux points A (4 ; 20) B (15 ; 1)
- On obtient ainsi : 1 : 20 = a * 4 +b
2 : 1 = a * 15 +b
Donc : 2 – 1 → a .15 + b = 1
_
a .4 + b = 20
= 11.a + o =-19
-19
a =
11

a = -1.72 : Coefficient directeur de la droite.

- On remplace « a » par sa valeur dans l’une des 2 équations :


→ 1 = a * 15 + b
↔ 1 =-1.72 * 15 + b
1 = -25.8 + b donc Y = 1.72 x + 26.8
b = 1+25.8
b = 26.8

2) Définition :

 l’ajustement linéaire graphique consiste à remplacer un nuage de points par une


droite qui donne une image assez correcte du nuage de points.

II- ajustement par la méthode des moindres carrés :


 principe : l’ajustement linéaire par la méthode des moindres carrés permet de
déterminer l’équation de la droite de l’ajustement de telle sorte que la somme des
carrés des écarts de chaque points à cette droite soit minimale.

22
 Si on appelle X1, X2, Xn les abscisses des points et Y1,Y2,…Yn les ordonnés
des points.
 La droite des moindres carrés passent par les points de coordonnées (X, Y) et
ayant pour coefficient directeur « a »

Y=ax+b
 a et b soit des paramètres d’ajustement.

∑ (xi - x) (yi - y)
a=
∑ (xi –x)2
b=y–ax ∑ Xy
Ou avec X = (xi - x). a=
Y = (yi - y) ∑X2

a= ∑(xi –x) (yi – y) = ∑(xi yi –xiy- x yi + x y)=


∑ (xi –x)2 ∑ (xi2 - 2.x x+x2 )

a= ∑xi yi –∑xiy- ∑x yi + ∑x y
∑ xi2 -∑ 2.xi.x+∑x2

a= ∑xi yi –yN-x-x Nyi + Nxy FIN


∑ xi2 2x,Nx+Nx2

A= ∑XiYi - NXY
X2 - NX2∑
B = Y- -AX
 Donc l’équation de la droite d’ajustement est y = ax + b
 Le responsable de la production pense que l’agmentation du salaire favorise la
qualité des pieces fabriquées pour convaincre le client de l’entreprise il met à sa
disposition les résultats issus de l’observations de 18 ouvriers.ces résultats sont
les suivante

Salaire horaire Nombre de pieces X,y X2 Y2
X délecteuses par
moi
y
4 20 80 16 400
4.5 19 85.5 20.25 361
5 17 85 25 289
5.5 15 78 30.25 225

23
6 13 78 36 169
6.5 12 77 42.25 144
7 11 75 49 121
7.5 10 80 56.25 100
8 10 68 64 100
8.5 8 63 72.25 64
9 7 60 81 49
10 6 66 100 36
11 5 62.5 121 36
12.5 3 69 156.25 25
13 2 25 169 9
14 1 14.5 196 4
14.5 1 15 210.25 1
15 1 225 1
161.5 166 113.7 1869.75 2134

A = ∑ Xi = 161.5 = 8.97
N 18

Y = ∑ yi = 166 = 9.22
N 18
A = ∑xi Yi –Yxy = 1137 – 18 * 8.97 *9.22
∑ Xi2 NX2 1669.75-18*(8.97)2

A = -351.66
221.47

A = -1.58

B = Y –ax b= 9.22 – (-1.58 * 8.97)


B = 9.22 + 14.17
B = 23.39

Donc l’équation de la droite d’ajustement est Y = - 1.56x+ 23.39

 pour tracer d’ajustement.on  permet deux points :

- si : x=o y = ?


y = b = 23.39 le 1 point a (0.23.39)

- si : y=o x= ?


-1.58x + 23=o
-1.58x=-23.39
X=23.39 = 14.80

24
1.58

Chap VI : la corrélation

I- Notion de covariance :
1- formule :

Q existe –il une relation ou non entre x et y ?


R ou calcul la covariance

Cov (x.y) = 1/N ∑ (Xi – X)(yi-y)


Cov (xi y ) = 1/n (∑ xi yi – N X Y )

 si cov (x.y)>0 : les deux variables x et y varient dans le même sens (si
 si cov (x y) <0 : les deux variables x et y varient le même en sens inverse ( si
 si cov (x y) = 0 : les variables x et y sont indépendentes.

25
AN : (même exemple de l’ajustement linéaire)
Cov (x y) = ∑ xi yi – nx y
N

= 1157 – 18 * 8.97 * 9.22 = - 19.53 < 0


18

Donc : les deux variable x et y varient en sens inverse.

2- remarque :
* la covariance ne donne de sens que sur la liaison entre les caractères
x et y

II- coefficient de corrélation linéaire


1-forme

cov (x y) = 5 Avec :
5y * 6 = 6x
N (∑ xiyi – Nx y)/1 = 5

- si on simplifie par 1/N


=5

 cov (x y) = ∑ ( xi – x)(ui-y)
= ∑ xiyi – n x y
 ∑ (xi – x) = ∑ ( xi – 2x xi + x)
2

= ∑ xi – n x2

*∑ ( yi – y)2 = ∑ yi2 – n y2

D’où
xi yi – n x y ∑ = 5

2-définition :
 le coefficient de corrélation permet de mesurer l’intensité de la liaison entre x et
y.

3- signification :
* -1<5<1 le signe de 5 indique, comme la covariance le sens de la liaison entre x et y

26
4 indique l’intensité de la liaison

 plus 5 est proche 1 → plus forte entre x et y.


 plus 5 est proche 0 → la liaison est faible entre x et y.

AN : 5 = ∑ xi yi – N x y

5 = 1137 – 18 * 8.97 * 9.22

5 = -351.66

5 = -351.66 = -351.66
14.88*24.57 365.60

0.96 - = 5

- 0.96 = 0.96 → forte liaison négative

27

Vous aimerez peut-être aussi