Vous êtes sur la page 1sur 65

Réalisé par : Addar fatima zahra

2023-2024 FSK
La statistique descriptive

La statistique descriptive a pour objet la collecte, la


caractérisation, l'analyse et l'interprétation d'observations
relatives à des phénomènes concernant des ensembles plus
ou moins importants d'objets, d'événements ou
d'individus. L’objectif est de faire « parler » les chiffre
afin de prendre une décision.
☑Population
☑Échantillon
☑Individu ou unité statistique
☑Caractère ou variable statistique
☑Modalité
☑Effectif
☑Fréquence
☑Série statistique
☑Distribution statistique
Ensemble des éléments sur lesquels porte une étude
statistique. Les éléments de la population sont appelés unités
statistiques (ou individus),
Une unité statistique peut être un être humain (étudiant,
salarié, femme, …), un être vivant quelconque (animal,
plante, microbe,…), ou un objet (ville, produit, industrie,
table, machine,…),
Il est souvent impossible, pour des raisons pratiques
ou pour des raisons de coût, d'observer la population
de façon exhaustive et l'étude est alors faite sur un
échantillon prélevé d’une population
C’est un sous-ensemble (une partie) prélevé d’une
population. les résultats obtenus sont extrapolés à la
population mère.
⚫ Éléments de la population ou de l’échantillon
⚫Chaque individu de la population peut être étudié par
rapport à un ou plusieurs traits ou caractéristiques ou
critères appelés caractères ou variables statistiques.
⚫Une variable statistique peut être qualitative ou
quantitative.
🗸Si la variable étudiée est mesurable numériquement,
on dit qu’il est quantitative (âge, poids, taille,
salaire,…).
🗸Par contre, si le caractère étudié est non mesurable
numériquement, on dit qu’il est qualitatif (sexe, niveau
d’étude, état matrimonial, nationalité, …).
 Valeur que peut prendre une variable statistique.
Par exemple, la variable « sexe » comporte deux
modalités (masculin, féminin);
la variable « état matrimonial » comporte quatre
modalités (célibataire, marié, divorcé et veuf);
la variable âge comporte plusieurs valeurs (1,2,3,
… , 99, …).
On distingue deux sortes de variables quantitatives : les
Variables Statistiques Discrètes et les Variables Statistiques
Continues .
⚫ Variable statistique est discrète si l’ensemble de ses
modalités est fini ou dénombrable (le plus souvent contient des
valeurs entières). Exemple : nombre d’enfant par ménage,
nombre de pièces par appartement, nombre de véhicules par
ménage,...
⚫ Une variable statistique est continue si elle peut prendre
n’importe quelle valeur dans un intervalle donné. Autrement
dit, si l’ensemble de ses modalités n’est pas dénombrable.
Exemples: L’âge, la taille, le poids d’un individu, le salaire, les
dépenses publicitaires,…
Un caractère qualitatif peut être:
⚫Ordinal : si ses modalités peuvent être naturellement
ordonnées exemple : satisfaction plus ou moins grande
après l’achat d’un produit;
⚫Nominal : si ses modalités ne peuvent être
naturellement ordonnées exemple : état matrimoniale,
couleur des yeux,...
Qualitative Quantitative
si ses valeurs ne sont pas numériques (par si ses valeurs sont numériques ou bien
exemple le sexe, les catégories socio- peuvent être ordonnées de manière
professionnelles, etc.). logique. :

Discrète Continue
Nominale ordinale
VSD VSC
Nombre d’individus ayant la même modalité.
Effectif d’une population (n)
Nombre d’individus formant une population.

n = ∑ ni
Proportion d’individus ayant la même modalité.

fi = ni
n
Remarque :
la fréquence d’une population est toujours égale à 1.
∑fi=1
⚫Une série statistique est la suite des modalités
d’une population donnée.
⚫Une population peut être étudiée selon une
seule variable : on parle alors de série simple .
⚫Lorsqu’on s’intéresse à étudier deux variables
en même temps sur une même population : on
parle dans ce cas de série double.
LA MOYENNE STATISTIQUE

C’est le quotient de la somme des produits ni × xi


par leur nombre (effectif total N )
n1 x1  n2 x2  n3 x3  ...  n p x p
x
N
xi : valeurs du caractère ou centres de classe,
ni : effectif de xi,
N : effectif total.
Exemple 1 : Caractère discret
Compléter la dernière colonne du tableau suivant
Nombre
Nombre de
d’enfants par Produits(ni xi)
familles(ni)
famille(xi)
1 8 1×8 = 8
2 9 2×9 = 18
3 6 3×6 = 18
4 3 4×3 = 12
5 2 5×2 = 10
6 1 6×1 = 6
Total 29 72
b. Quelle est la réponse la plus fréquente ?
La réponse la plus fréquente est 2

c. Quel est le mode de cette série ?


le mode de la série est donc 2.
l’effectif correspondant est 9.
d. Calcul de la moyenne
72
x  2,5
29
Exemple 2 : Caractère quantitatif continu

1. Tableau
Classe Nombre Fréquences en Centre de
Amplitudes
d'âge d'employés n i % classe x i n i xi
[18; 20[ 5850
[ 20; 25[ 13050
[25; 30[ 16125
[30; 35[ 12450
[35; 40[ 9125
[40; 45[ 7800
[45; 50[ 6525
[50; 60[ 3825
Total 74750
2. Pourcentage d’employés ayant moins de 30 ans
7,83 + 17,46 + 21,57 = 46,86
Pourcentage d’employés ayant plus de 40 ans
10,43 + 8,73 + 5,12 = 24,28
Pourcentage d’employés ayant entre 25 et 45 ans
21,57 + 16,65 + 12,21 + 10,43 = 60,86
3. Calcul de l’âge moyen

n1 x1  n2 x2  n3 x3  ...  n p x p
x
N
2 446 838
x 74 750
= 32,73 ans
la médiane
La médiane est la valeur du caractère étudié
qui partage en deux parties égales l’effectif total.

50 % de l’effectif total 50 % de l’effectif total

Effectif correspondant à
la médiane de la série
Détermination de la médiane:

Dans le cas d’un caractère discret


•Si l’effectif total est impair, la médiane est la
valeur du caractère situé au milieu de la série.
Exemple : Série de prix de vente

PV en
12 17 21 25 32 40 70

Le prix médian est 25 €.
•Si l’effectif total est pair, la médiane est la
demi-somme des deux valeurs centrales du caractère.

Exemples : Nombre d’achats journaliers


Nombr
42 56 68 76 84 92
e

68  76
M  e
 72
2
Le nombre d’achats médian est de 72
Comme pour les séries simples, il est possible de
calculer la variance pour chacune des
coordonnées de la série
Population Échantillon
N

 (X
n
 X)  i
2
i ( x  x ) 2

 i 1
s i 1
N n1
⚫ Il s’agit d’un certain nombre de rectangles ou de
bandes verticales égal au nombre de modalités. La
base (ou la largeur) de chaque rectangle est la même
et la hauteur (ou la longueur) est proportionnelle à
l’effectif (ou à la hauteur). Ce type de représentation
facilite les comparaisons.
Exemple : Les dépenses culturelles et de loisirs en 2013 et en 2014

2013 2014
Télévision, Hi-Fi, vidéo, photo 7,2 6,8
Informatique 9,4 9,1
Disques, cassettes, pellicules photo 2,7 2,3
Presse, livres et papeterie 13.9 13,6
Services culturels (1) 17.0 17,5
Jeux, jouets, articles de sport 12.0 12,1
Jardinage, animaux de compagnie 12.5 12,8
Services récréatifs et sportifs(2) 10,4 10,6
Jeux de hasard 9,9 10,1
Autres biens culturels et de loisir 4,9 4,9
Total 100,0 100,0
1) Cinéma, spectacles vivants, musées, abonnements
audiovisuels (y compris redevance TV), développements
de tirage de photos, etc.
(2) Sport, location de matériel sportif, fêtes foraines, parcs
d'attractions,
⚫Représenter graphiquement les dépenses culturelles et
de loisirs en 2013 et en 2014.

Corrigé
⚫Le diagramme en tuyaux d'orgue représentant les dépenses
par catégorie pour chaque année est le suivant :
⚫Application: à partir de l’application 1, établir le
diagramme en tuyaux d’orgue.
Répartition des 20 personnes selon l'état
matrimonial
0,6

0,5

0,4

0,3

0,2

0,1

0
Il est formé d’un certain nombre de segments
(ou bâtons) dont les hauteurs sont
proportionnelles aux effectifs (ou fréquences)
des modalités associées.
Application: à partir de l’application 2, établir
le diagramme en bâtons.
Répartition des ménages selon le nombre
d'enfants
ni

7
6
5
4
3
2
1
0
 Si le diagramme en bâtons est une représentation des
fréquences ou des effectifs simples, la courbe cumulative est
une représentation des fréquences ou des effectifs cumulés.
 La courbe cumulative est construit comme suit:
 On trace un axe vertical (axe des ordonnées) qui représente Fi
(ou Ni) et un axe horizontal (axe des abscisses) qui représente
xi;
 À chaque modalité xi on associe, par un point, la fréquence
cumulée Fi; à chaque intervalle on trace une ligne droite.
Application: à partir de l’application 3, établir le
diagramme en escaliers.
100 Répartition des ménages selon 100
Fi

90 le nombred’enfants 90
80
75
70
60
50
45
40
30
20 20
10
5
0
0 1 2 3 4 5 6
Nombre d’enfants xi
 Une fois le diagramme est construit, sa lecture peut être
faite de la manière suivante: la fréquence cumulée d’une
modalité xi correspond à la proportion d’individus dont le
caractère est inférieur à xi. Autrement dit:
F(xi) = f (X < xi).
 Dans notre application, la lecture du diagramme donne:
⚫ 5% correspond à la proportion des ménages ayant moins de
1 enfant (OU 5% des ménages n’ayant pas d’enfant) .
⚫ 75% correspond à la proportion des ménages ayant moins
de 4 enfants (OU 75% des ménages ayant 0, 1, 2, 3 enfants)
Dans le cas où les amplitudes sont égales,
l’histogramme est un diagramme composé de
rectangles verticales dont les hauteurs sont
proportionnels aux fréquences (ou aux
effectifs) et dont les bases sont égales à
l’amplitude de la classe associée.
Application: à partir de l’application 3, établir
l’histogramme adéquat.
Répartition des salariés selon le salaire
fi

0,5

0,4

0,3

0,2

0,1

0
35 70
70 105 140
xi
Dans le cas où les amplitudes sont différentes, l’histogramme est
un diagramme composé de rectangles verticales dont les hauteurs
sont proportionnels aux fréquences corrigées fi’(ou aux effectifs
corrigés) et dont les bases sont égales à l’amplitude de la classe
associée.
hi= fi’= fi x
⚫ Application: établir l’histogramme convenable à
l’application 3 (en regroupant les 2 dernières classes).
Le tableau statistique correspondant est le suivant:

Classes fi ai li fi'
[0; 35[ 0,30 35 1 0,30
[35; 70[ 0,45 35 1 0,45
[70; 140[ 0,25 70 2 0,13
Total 1 ar= 35 -- %
 Répartition des salariés selon le salaire
 0,5
fi

 0,4

 0,3

0,2 0,45
0,3
0,1
0,13
0
35 70 140
xi
 Comme dans le cas d’une «V.S.D.», la courbe cumulative est
une représentation des fréquences ou des effectifs cumulés.
 La courbe cumulative est construit comme suit:
 On trace un axe vertical (axe des ordonnées) qui représente Fi
(ou Ni) et un axe horizontal (axe des abscisses) qui représente
xi;
 À chaque borne supérieure d’une classe « ei » on associe, par
un point, la fréquence cumulée Fi; puis on joigne les points
ainsi obtenus.
Application: à partir de l’application 3, établir la
courbe cumulative.
Répartition des salariés selon le salaire
fi

100%
100%
90%
80% 75%
70%
60%
50%
40% 30%
30%
20%
10% 0%
0%
0 35 70 140
xi
Indicateurs de dispersion
1. Étendue d’une série statistique
L’étendue (E) d’une série statistique est la différence entre la
plus grande valeur du caractère (Maximum) et la plus petite
(Minimum).
E = Max - Min

Exemple: L’étendue des notes, 2; 15; 8; 16; 8; 11; 18 est:

E = 18 – 2 = 16

Retour
Indicateurs de dispersion
2. Quartiles
Le premier quartile Q1:
plus petite valeur du caractère correspondant au moins au
quart de l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; N/4 = 4,5 arrondi à l’entier supérieur 5
La 5e note est 7
Le premier quartile Q1 = 7:
Il y a au moins 25% des notes inférieures ou égales à 7

Retour
Indicateurs de dispersion

Le deuxième quartile Q2:


plus petite valeur du caractère correspondant au moins à la
moitié de l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; N/2 = 9
La 9e note est 10
Le deuxième quartile Q2 = 10:
Il y a au moins 50% des notes inférieures ou égales à 10

Retour
Indicateurs de dispersion
La médiane Me:
valeur du caractère correspondant au moins à la moitié de
l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; est pair donc 10  10
Me   10
2
Ici, la médiane Me = Q2 = 10
Il y a autant de notes inférieures à 10 que supérieures à 10

Retour
Indicateurs de dispersion

Le troisième quartile Q3:


plus petite valeur du caractère correspondant au moins au
trois quarts de l’effectif total
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18; N×0,75 = 13,5 arrondie à l’unité supérieure 14
La 14e note est 15
Le troisième quartile Q3 = 15.
Il y a au moins 75% des notes inférieures ou égales à 15

Retour
Indicateurs de dispersion

Le quatrième quartile Q4:


plus petite valeur du caractère correspondant au moins à
l’effectif total; c’est le Max
Exemple:
Notes obtenues par 18 élèves d’une classe, rangées par ordre
croissant:
2;2; 3; 4; 7; 8; 8; 9; 10; 10; 12; 13; 14; 15; 15; 16; 17; 20.
N = 18;
La 18e note est 20
Le quatrième quartile Q4 = 20.
100% des notes sont inférieures ou égales à 20

Retour
Autres exemples de calculs d’indicateurs
 Série quantitative discrète avec peu
de valeurs

Exemple 1:
Notes d’un élève, rangées par ordre croissant:
2; 2; 3; 9;10;12;13;14;15;16;17; 20
Me 12,5
12 notes

12×0,25 = 3 donc Q1 = 3 qui est la 3e valeur;


12×0,50 = 6 donc Q2 = 12 qui est la 6e valeur;
12×0,75 = 9 donc Q3 = 15 qui est la 9e valeur;
Autres exemples de calculs d’indicateurs

2; 2; 3; 9;10;12;13;14;15;16;17; 20
Me 12,5
12 notes

12  13
N = 12: Me   12, 5
2
Le quatrième quartile Q4 = 20.
100% des notes sont inférieures ou égales à 20
 Série quantitative discrète avec de nombreuses de valeurs

Temps d'écoute en nombre de jeunes Effectif cumulé


Produits ni×xi
heure (xi) (ni) total
1 45 45×1 = 45 45
1,5 120 120×1,5 = 180 165
2 60 60×2 = 120 225
2,5 134 134×2,5 = 335 359
3 165 165×3 = 495 524
3,5 122 122×3,5 = 427 646
4 78 78×4 = 312 724
4,5 65 65×4,5 = 292,5 789
5 71 71×5 = 355 860
Total N = 860 2 564,5

La moyenne: 2564, 5


x  2, 98
860
Le temps moyen est de 2,98 heures soit ( 2h58min48s)
 Série quantitative discrète avec de nombreuses de valeurs

Temps d'écoute en nombre de jeunes Effectif cumulé


Produits ni×xi
heure (xi) (ni) total
1 45 45×1 = 45 45
1,5 120 120×1,5 = 180 165
2 60 60×2 = 120 225
2,5 134 134×2,5 = 335 359
3 165 165×3 = 495 524
3,5 122 122×3,5 = 427 646
4 78 78×4 = 312 724
4,5 65 65×4,5 = 292,5 789
5 71 71×5 = 355 860
Total N = 860 2 564,5

L’effectif total est 860 (nombre pair), donc la médiane Me


est la moyenne des valeurs des 430e et 431e rangs. Cette
médiane, ici, est égale à 3 heures
 Série quantitative discrète avec de nombreuses de valeurs

Temps d'écoute en nombre de jeunes Effectif cumulé


Produits ni×xi
heure (xi) (ni) total
1 45 45×1 = 45 45
1,5 120 120×1,5 = 180 165
2 60 60×2 = 120 225
2,5 134 134×2,5 = 335 359
3 165 165×3 = 495 524
3,5 122 122×3,5 = 427 646
4 78 78×4 = 312 724
4,5 65 65×4,5 = 292,5 789
5 71 71×5 = 355 860
Total N = 860 2 564,5

L’étendue de cette série est: Retour


E = Max – Min = 5 – 1 = 4 heures
 Premier quartile Q1
Retour
Temps d'écoute en Effectif cumulé
heure (xi) total
1 45
1,5 165  860  0,25  215  225
2 225
2,5 359
3 524 On prend comme rang
3,5 646 du premier quartile Q1
4 724
l’effectif cumulé qui suit
4,5 789
immédiatement 215; soit
5 860 225; donc Q1 = 2 h
Total
 Deuxième quartile Q2
Retour
Temps d'écoute en Effectif cumulé
heure (xi) total
1 45
1,5 165  860  0,50  430  524
2 225
2,5 359
3 524 On prend comme rang
3,5 646 du deuxième quartile Q2
4 724
l’effectif cumulé qui suit
4,5 789
immédiatement 430; soit
5 860 524; donc Q2 = 3 h
Total
 Troisième quartile Q3
Retour
Temps d'écoute en Effectif cumulé
heure (xi) total
1 45
1,5 165  860  0,75  645  646
2 225
2,5 359
3 524 On prend comme rang
3,5 646 du troisième quartile Q3
4 724
l’effectif cumulé qui suit
4,5 789
immédiatement 430; soit
5 860 646; donc Q3 = 3,5 h = 3h
Total
30 min
 Calcul des quartiles d’une série quantitative à valeurs
continues
 Exemple: Calculons les quartiles de la série suivante
Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26
[30; 40[ 10 36
[40; 50[ 14 50
Total 50

On commence par compléter la colonne des effectifs cumulés


et la cellule de l’effectif total N.

Retour
Calcul du premier quartile Q1

Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26

[30; 40[ 10 36
[40; 50[ 14 50
Total 50

 50  0, 25  12, 5  26
Donc Q1 est compris dans l’intervalle [20; 30[

Retour
Calcul du premier quartile Q1

Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26

[30; 40[ 10 36
[40; 50[ 14 50
Total 50

30  20
Q1  20   (12,5  11)  21
15
Retour
Calcul du deuxième quartile Q2

Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26

[30; 40[ 10 36
[40; 50[ 14 50
Total 50

 50  0,50  25  26
Donc Q2 est compris dans l’intervalle [20; 30[

Retour
Calcul du deuxième quartile Q2

Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26

[30; 40[ 10 36
[40; 50[ 14 50
Total 50

30  20
Q2  20   (25  11)  29,33
15
Retour
Calcul du troisième quartile Q3

Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26

[30; 40[ 10 36
[40; 50[ 14 50
Total 50

 50  0,75  37, 5  50
Donc Q3 est compris dans l’intervalle [40; 50[

Retour
Calcul du troisième quartile Q3

Caractère Effectif Effectifs cumulés

[10; 20[ 11 11
[20; 30[ 15 26

[30; 40[ 10 36
[40; 50[ 14 50
Total 50

50  40
Q3  40   (37,5  36)  41,1
14
Retour

Vous aimerez peut-être aussi