Académique Documents
Professionnel Documents
Culture Documents
Population statistique :
Une population statistique est l'ensemble sur lequel on effectue des
observations.
• Variable quantitative
• Variable qualitative
1.2. Types de Variables statistiques
Variable quantitative :
Une variable statistique est quantitative si ses valeurs sont des nombres exprimant
une quantité, sur lesquels les opérations arithmétiques (somme, etc...) ont un sens.
Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou modalités, s'expriment de
façon littérale ou par un codage sur lequel les opérations arithmétiques telles que
moyenne, somme, ... , n'ont pas de sens.
ni correspond au nombre
x2 n2 f2 d’observations (effectif) ayant
comme valeur xi
… … … fi correspond à la fréquence
(pourcentage) d’observations
n
xp np fp ayant comme valeur xi : f = n
i
i
S1p n 1
2.2: Les Distributions de Fréquences
2.2.1. Distributions non groupées (suite)
• Données ordinales et xi ni fi Ni Fi
quantitatives
discontinues. x1 n 1 f 1 N1 F 1
• x1 est la plus petite
valeur, xp la plus grande x2 n 2 f 2 N2 F 2
des valeurs observées.
• Effectifs cumulés.
– N2 = n2+n1 … … … …. …
• Fréquences cumulées. xp n p f p Np F p
– F2 = f2+f1
S1p n 1
2.2: Les Distributions de Fréquences
2.2.1. Distributions non groupées (suite)
xi ni fi Ni Fi Ni est l’effectif cumulé c’est dire le
nombre d’observations ayant des
valeurs inférieures ou égales à xi :
x1 n 1 f 1 N1 F 1
x2 n 2 f 2 N2 F 2 Fi est la fréquence cumulée c’est à
dire la fréquence des observations
ayant des valeurs inférieures ou
… … … …. … égales à xi :
xp n p f p Np F p
S1p n 1
2.2: Les Distributions de Fréquences
2.2.2. Distributions groupées
❑ Classes: L’orsque le caractère X quantitatif discret ou continu comprend un
grand nombre de valeurs, il est recommandé de regrouper ces valeurs en
intervalles appellés Classes
▪Les valeurs extrêmes d’une classe sont appelées bornes des classes.
▪Les classes sont mutuellement exclusives.
▪L'amplitude de la classe ou intervalle ou module de classe :
D= borne supérieure - la borne inférieure.
▪Le point central ou encore point médian est situé à mi chemin entre
les bornes. Ci = Binfi +Di/2
2.2: Les Distributions de Fréquences
2.2.2. Distributions groupées
▪L'intervalle de classe est généralement constant, toutefois, on
utilise parfois une amplitude variable notamment pour les classes
des valeurs extrêmes.
▪En cas de classes d'amplitudes différentes, la densité de
180
160
160
Modalités Effectifs Fréquences % 140
Bleu 60 0.200 20,0 120
Noir 160 0,533 53,3 100
Noisette 40 0,133 13,3 80
60
Vert 40 0,133 13,3 60
40 40
Total : 300 1 100 40
20
0
Bleu Noir Noisette Vert
1. Distributions non cumulées
1.1. Distribution non groupées
❑Données quantitatives discrètes
- Diagramme en bâtons
❑ On trace parallèlement à l'axe des ordonnées, en regard des xi qui sont
portés en abscisse, un segment de longueur proportionnel à n
25
nombre nombre de
d'enfants familles (ni) 20
(xi)
0 10 15
1 20
2 15 10
3 5
4 3 5
>4 0
0
0 1 2 3 4 >4
[3 – 5[ 615 700
[10 – 20 [ 92 500
0
3
30
50
Classes Effectifs Amplitude Effectifs 350
Effectif rectifié
ni ai rectifiés 300
ni /ai
250
[0 – 3[ 830 3 276,7
[3 – 5[ 615 2 307,5 200
HISTOGRAMME
[5 – 10[ 510 5 102,0 150
[10 – 20 [ 92 10 9,2
[20 – 30[ 63 10 6,3 100
30
50
0
3
1.Distributions non cumulées
1.2. Distribution groupées
❑ Données quantitatives
– Histogramme (exemple)
30
50
0
3
La surface = ai (n
×i/ai) est de 830 unités
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles
400
x xi ni Ni N(x) N’i N ’(x)
− 0 360
350
300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
2 2 95 313 142
313 47 150
35 348 47
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2
5 5 360 0
0
+ -2 -1 0 1 2 3 4 5 6
2.3.2.Distributions cumulées
x
− [ei – ei+1[ Fi F’i
F(x) F’i F’(x)
?
0 0 1 1
[0-3[ 0,391 1,000 1,000
0,9
3 0,391 0,609
[3-5[ 0,680 0,609 0,609 0,8
Fi
5 0,680 0,320 0,7
[ 5 - 10 [ 0,920 0,320 0,320
0,920 0,080
0,6 F’i
10 [10 - 20 [ 0,963 0,080 0,080 0,5
50 1 0 0,1
+ -10
0
0 10 20 30 40 50 60
Les Distributions graphiques
RESUME
VARIABLE QUALITATIVE VARIABLE QUANTITATIVE
Nominale Ordinale Discrète Continue
Effectifs ou Fréquences
Diagramme en bâtons Histogramme
Diagramme en barres Diagramme en barres
Diagramme circulaire Modalités dans Courbes cumulatives des effectifs ou des fréquences
l ’ordre
IV. Paramètres Statistiques
Paramètres statistiques
Un paramètre statistique permet de résumer par une seule quantité numérique une
information contenue dans une distribution d’observations.
1. Le Mode
❑Le mode Mo(x), d’une série ou distribution
statistique est la valeur pour laquelle l’effectif ou
la fréquence est le plus élevé
❑Une classe modale Mo(x) est une classe de
densité maximale
❑On distingue entre Mode « absolu » et Mode « relatif »
I. Paramètres de tendance centrale et de position
1. LE MODE
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6
900 1400 1900 2400 2900 3500 ou plus...
1. LE MODE
Si la distribution présente 2 ou plus maxima relatifs, on dit qu'elle est bimodale ou
plurimodale.
La population est composée de plusieurs sous-populations ayant des caractéristiques
de tendance centrale différentes.
90
80
140
70
120
60
100
50
80
40
60
30
40 20
20 10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 4000 4500 ou
plus...
1. LE MODE
I. Paramètres de tendance centrale et de position
2. La Médiane
La médiane M est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".
3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9
2. La Médiane
❑ De manière générale
F(x) F(x)
xi ni Fi xi ni Fi
0 0
0 103 0,286 0 103 0,286
0,286 0,286
M 1 115 0,606 Intervalle médian 1 77 0,500
0,606 0,500 0,5
2 95 0,869 M = milieu = 1,5 2 95 0,764
3 35 0,967
0,869 0,764
3 35 0,861
0,967 0,861
4 10 0,994 4 10 0,889
0,994 0,889
5 2 1 5 40 1
1 1
I. Paramètres de tendance centrale ou de position
3. La Moyenne
1 n
Série brute x 1 , x 2 , … , xn x = xi
n i=1
1 k k
x = n i x i = fi x i
n i=1 i=1
I. Paramètres de tendance centrale et de position
4. Le quartiles
❑ Le quartile fait partie des quantiles.
❑ On appelle quantiles d'ordre k les (k-1) valeurs qui divisent les
observations en k parties d'effectifs égaux.
4. Les quartiles
❑ un quartile est chacune des trois valeurs qui divisent les données
triées en quatre parts égales, de sorte que chaque partie
représente 1/4 de l'échantillon de population.
❖ le 1er quartile est la donnée de la série qui sépare les 25 % inférieurs des
données (notation Q1) ;
4. Les quartiles
o Série Brute
❑ Pour déterminer les quartiles Q1 et Q3, on procède un peu de la même façon
que pour la médiane. On dresse la liste de toutes les valeurs de la série par
ordre croissant, chaque valeur étant répétée autant de fois que son effectif.
❖ L'écart interquartile:
▪ L'écart interquartile est l'écart entre le 1er et le 3ème quartile:
II. Paramètres de Dispersion
1. Les mesures de dispersion absolue
❖ La variance:
▪ La variance σ2 d'une variable statistique est la moyenne pondérée des
carrés des écarts à la moyenne:
❖ L'écart-type :
▪ L'écart-type σ est la racine carrée de la variance
II. Paramètres de Dispersion
1. Les mesures de dispersion relative
▪ Pour caractériser la distribution des valeurs d'une variable statistique, on
utilise généralement une mesure de tendance centrale et une mesure de
dispersion.
▪ Dans la grande majorité des cas, on caractérise la distribution des valeurs
par la moyenne et l'écart-type.
▪ Si l'écart-type d'une variable est égal à 10, peut-on dire que les données
sont très dispersées? Bien sûr, cela dépend de l'ordre de grandeur des
données. Il est donc nécessaire parfois de mesurer la dispersion relative