Académique Documents
Professionnel Documents
Culture Documents
CHAPITRE V.
INFORMATION CHIFFREE – STATISTIQUE DESCRIPTIVE
I. Information chiffrée.
1. Proportions.
2. Evolutions.
1. Proportion (fréquence).
Définition 1 :
Une population est un ensemble d’individus ou d’éléments.
Son nombre d’individus ou d’éléments est appelé effectif de la population.
Une sous-population A d’une population E est une partie des individus de E.
Définition 2 :
La proportion p d’une sous-population A par rapport à une population E est le quotient p = \f(nA;nE,
où nA est l’effectif de A et nE est l’effectif de E. C’est un nombre réel compris entre 0 et 1.
Remarque : Une proportion peut s’exprimer sous forme décimale, fractionnaire ou en pourcentage.
Définition 3 :
A est une sous-population d’une population E.
Le complémentaire de A dans E, noté A , est la sous-population de E dont les
individus n’appartiennent pas à A.
Propriété 1 :
Si on note p(A) et p( A ) les proportions respectives de A et de A dans E, alors : p( A ) + p(A) = 1.
Propriété 2 :
Soient p(A), p(B), p(A ∩ B) et p(A ∪ B) les proportions respectives de A, B, A ∩B et A ∪ B, alors :
p(A ∪ B) + p(A ∩ B) = p(A) + p(B).
Propriété3 :
A et B sont deux sous-populations d’une population E telles que A est incluse dans
B et B est incluse dans E.
Si p est la proportion de A dans B et p’ la proportion de B dans E, alors
la proportion de A dans E est le produit p p’.
Méthode 1 : Savoir exploiter la relation entre effectifs, proportions et pourcentages.
Exemple :
Dans un restaurant, parmi les 64 clients, 36 ont choisi une entrée à base de poisson, 37,5 % des
clients ont choisi un plat à base de poisson et 25% une entrée et un plat à base de poisson.
1. Calculer la proportion des clients du restaurant ayant choisi une entrée à base de poisson.
p= \f(36;64= 0,5625.
Donc il y a 56,25 % de clients ayant choisi une entrée à base de poisson.
3. Déterminer la proportion des clients ayant choisi une entrée ou un plat à base de poisson.
On note E l’ensemble des clients ayant choisi une entrée à base de poisson et P l’ensemble des
clients ayant choisi un plat à base de poisson.
p(E ∪P) = p(E) + p(P) – p(E ∩P)
p(E ∪P) = 0,5625 + 0,375 – 0,25
p(E ∪P) = 0,6875.
Donc il y a 68,75 % de clients ayant choisi une entrée ou un plat à base de poisson.
4. Déterminer la proportion des clients n’ayant choisi ni entrée, ni plat à base de poisson.
p( E ∪ P ) = 1 –p (E ∪P)
p( E ∪ P ) = 1 – 0,6875
p( E ∪ P ) = 0,3125.
Donc il y a 31,25 % de clients n’ayant choisi ni une entrée ni un plat à base de poisson.
Exemple :
Dans le top 10 des smart phones les plus vendus en 2018 sur le marché mondial, on ne trouve que deux
marques : A et S. La marque A détient 53% du marché parmi ce top 10 et son modèle i8+ représente
19,7% des smart phones de marque A vendus. Le modèle s9+ de la marque S représente 20% des
smart phones de même marque vendus.
1. Déterminer la part du modèle s9+ dans le top 10.
p(S) = 1 –p(P) = 1 –\f(53;100= 1 – 0,53 = 0,47.
La marque S représente donc 47 % des modèles dans le top 10.
Le modèle s9+ représente : 0,20 x 0,47 = 0,094.
Donc le modèle s9+ représente 9,4 % des modèles dans le top 10.
2. Evolutions.
Lors d’une évolution, on appelle Vi la valeur initiale et Vf la valeur finale. Vi et Vf sont positives.
Définition 1 :
La variation absolue de Vi à Vf est la différence Vf – Vi.
La variation relative ou le taux d’évolution t de Vi à Vf est : t =\f(Vf – Vi;Vi.
Remarques :
Un taux d’évolution peut s’écrire sous différentes formes (fractionnaire, décimale ou en pourcentage).
Si t est écrit en pourcentage, alors t =\f(Vf – Vi;Vi x 100.
Si t 0, alors il s’agit d’une augmentation et si t 0, alors on a une diminution de la grandeur.
Propriétés :
t désigne un nombre réel strictement supérieur à -1.
Une évolution de taux t se traduit par la formule : Vf = (1 + t) x Vi.
Le nombre C = 1 + t est appelé le coefficient multiplicateur de Vi à Vf.
Remarques :
Un coefficient multiplicateur n’a pas d’unité.
Si C 1, alors l’évolution est une augmentation ou une hausse.
Si C 1, alors l’évolution est une diminution ou une baisse.
Si C = 1, alors l’évolution est stable.
3. Baisse de 16% suivie d’une baisse de 8%, puis d’une hausse de 24%.
Coefficient multiplicateur associé à la baisse de 16% : C1 = 1 –\f(16;100 = 0,84.
Coefficient multiplicateur associé à la baisse de 30% : C2 = 1 –\f(8;100 = 0,92.
Coefficient multiplicateur associé à la hausse de 24% : C3 = 1 + \f(24;100 = 1,24.
Coefficient multiplicateur global : CG = C1 x C2 x C3 = 0,84 x 0,92 x 1,24 0,9583.
Taux d’évolution global : tG = CG– 1 = 0,9583 – 1 = – 0,041 7.
Donc le taux d’évolution global associé est une baisse de 4,17%.
Exemple :
Déterminer le taux d’évolution réciproque arrondi à 0,1% près, des évolutions suivantes.
1. Hausse de 20%.
Coefficient multiplicateur associé à la hausse de 20% : C = 1 + \f(20;100 = 1,2.
1
Coefficient multiplicateur réciproque : Crec = = \f(1;1,2 0,8333.
C
Taux d’évolution réciproque : trec = Crec– 1 0,833 3 – 1 – 0,166 7.
3. Augmentation de 12,5%.
Coefficient multiplicateur associé à l’augmentation de 12,5% : C = 1 + \f(12,5;100 = 1,125.
1
Coefficient multiplicateur réciproque : Crec = = \f(1;1,125 0,8889.
C
Taux d’évolution réciproque : trec = Crec – 1 0,8889 – 1 –0,1111.
4. Diminution de 36%.
Coefficient multiplicateur associé à la diminution de 36% : CM= 1 – \f(36;100 = 0,64.
1
Coefficient multiplicateur réciproque : Crec = = \f(1;0,64 1,5625.
C
Taux d’évolution réciproque : trec = Crec – 1 = 1,5625 – 1 = 0,562 5.
1. Vocabulaire.
Définition 1 :
Une étude statistique commence par le recueil de données concernant un caractère (ou une variable)
sur les individus d’une population.
Le caractère étudié prend un certain nombre de valeurs, qui peuvent être numériques ou non.
Lorsque le caractère étudié prend des valeurs numériques (exemples : notes, tailles, âges, …), le
caractère est dit quantitatif :
Si le caractère prend n’importe quelle valeur dans un intervalle donné, il est dit continu.
Si le caractère prend des valeurs isolées, il est dit discret.
Dans le cas contraire, le caractère est dit qualitatif (nationalité, couleurs, …)
2. Effectif.
Tableau de données :
Valeurs du caractère x1 x2 … xp
Effectif n1 n2 … np
Fréquence f1 f2 … fp
Définition 2 :
Le nombre d’individus de la population chez lesquels on observe la valeur xid’un caractère est
l’effectif de cette valeur.
i= p
∑ ni
L’effectif total N est le nombre d’individus de la population : N = n1+ n2+ . . . + np = i=1 .
L’effectif cumulé croissant (respectivement décroissant) de xi est la somme des effectifs des
valeurs inférieures (respectivement supérieures) ou égales à xi.
3. Fréquence.
Définition 3 :
La fréquence f d’une valeur du caractère est le quotient de l’effectif de cette valeur par
l’effectif total :
Fréquence de la valeur = \f(Effectif de la valeur;Effectif total ou fi = \f(ni;N.
La fréquence cumulée croissante (respectivement décroissante) de xi est la somme des
fréquences des valeurs inférieures (respectivement supérieures) ou égales à xi.
Propriétés :
La fréquence est un nombre compris entre 0 et 1.
La somme des fréquences de toutes les valeurs d’un caractère est égale à 1.
La distribution des fréquences d’une série statistique prenant un petit nombre de valeurs est
l’ensemble des fréquences de toutes les valeurs du caractère.
La fréquence d’un événement est la somme des fréquences des valeurs du caractère pour
lesquelles l’événement est réalisé.
4. Représentations graphiques.
Définition 4 :
Le nuage de points est l’ensemble des points placés dans un repère dont les abscisses sont les
valeurs du caractère et les ordonnées sont les effectifs (ou les fréquences) correspondant(e)s.
La courbe ou le polygone des fréquences cumulées (dé)croissantes est obtenue en reliant par
un segment les points qui ont pour abscisses les valeurs du caractère étudié et comme ordonnée
les fréquences cumulées (dé)croissantes correspondantes.
Remarque :
Lorsque les données sont réparties en classes, l’abscisse des points de la courbe des FCC est la borne
supérieure de chaque classe.
Pour la courbe des FCD, c’est la borne inférieure.
Définition 4 (suite) :
L’histogramme est réservé aux séries statistiques regroupées en classes par intervalles. Il est
constitué de rectangles dont les bases correspondent aux intervalles et dont les aires sont
proportionnelles aux effectifs ou aux fréquences des classes.
a. Paramètres de position.
Mode et classe modale.
Définition 5 :
Le mode est la valeur ayant le plus grand effectif. Il peut y avoir plusieurs modes.
Si les données sont regroupées par classe de même amplitude, on parle de classe modale.
Moyenne.
Définition 6 :La moyenne est le nombre, notée x , tel que x = \f(n1x1+ n2x2+ … + np xp;N = \f(1;N x .
Remarque : Si le caractère est quantitatif continu, c’est-à-dire si les valeurs sont regroupées en
classes, pour calculer la moyenne on choisit comme valeurs du caractère les centres
des classes et comme effectif l’effectif des classes.
Propriété :
On peut calculer la moyenne à partir de la distribution de fréquences :
i= p
x ∑ f i xi
= f1x1+ f2x2+ . . . + fpxp = i=1 .
Démonstration :
On sait que : x = \f(n1x1+ n2x2+ … + np xp;N = \f(n1;N x x1 + \f(n2;N x x2 + … + \f(np;N x xp =f1x x1 +
f2x x2 + … + fpx xp.
Médiane.
Définition 7 :
Les valeurs du caractère étant rangées par ordre croissant, la médiane, notée Me, est une valeur qui
partage la série en deux ensembles de valeurs de même effectif.
Quartiles.
Définition 8 :
Le premier quartile (respectivement le troisième quartile) de la série, noté Q1 (respectivement, noté
Q3) est la plus petite valeur de la série telle qu’au moins 25% (respectivement 75%) des valeurs de la
série lui soient inférieures ou égales.
b. Paramètres de dispersion.
Etendue.
Définition 9 :
L’étendue d’une série statistique est la différence entre la plus grande et la plus petite des valeurs
du caractère.
Ecart type.
Définition 10 :
La variance est le réel positif, noté V, défini par :
V = x;\s\up8(x;\s\up8(x;\s\up8(\f(n1 (x1– = x;\s\up8(\f(;N.
La variance est la moyenne des carrés des écarts entre la moyenne de la série et les valeurs de la
série.
L’écart type est le réel positif, noté , défini par : = .
Propriété :
L’écart type mesure un écart moyen autour de la la moyenne d’une série statistique.
Ainsi, pour deux séries de même moyenne, celle dont l’écart type est le plus faible a ses données plus
homogènes (plus groupées autour de la moyenne).
Remarques :
La variance est égale à la moyenne des carrés des écarts à la moyenne.
L’écart type et la moyenne ont la même unité.
Ecart interquartile.
Définition 11 :
L’écart interquartile est la différence Q3 – Q1.
L’écart interquartile est moins sensible que l’étendue aux valeurs extrêmes.
6. Résumés statistiques.
Exemple :
On donne la série suivante :
Valeur 10 11 12 13 14 1 16 17 18
5
Effecti 2 3 2 2 4 3 2 1 2
f
Choisir ce couple, c’est prendre en compte toutes Choisir ce couple, c’est partager la série en sous-
les valeurs. Plus l’écart type est petit, plus les groupes de 25%. Plus l’écart interquartile est
valeurs de la série sont « resserrées » autour de faible, plus les valeurs de la série sont
la moyenne. « resserrées » autour de la médiane.
2.b. Calculer l’écart type de la série 1 puis celui de la série 2. Comparer les deux séries.
Ecart type : 1 7,07.
2 5.
Donc la série 2 est plus homogène que la série 1. La série 1 est plus dispersée.
Exemple 2 :
On considère les séries S1 et S2 suivantes :
Si le graphique est « en cloche », on peut évaluer graphiquement la valeur de la moyenne ; elle est
alors proche des valeurs associées aux effectifs les plus élevés.
On peut comparer les écarts types de deux séries en observant si les valeurs sont rapprochées de la
moyenne ou au contraire dispersées.