Académique Documents
Professionnel Documents
Culture Documents
PARTIE 1 :
On relève les chiffres d’affaires en millions d’euros de 200 entreprises du secteur du bien être et de la
santé pour l’année 2000. Les données sont présentées dans le tableau suivant :
Xi ni ci fi ai 5×fi /ai Ni Fi
[20 ;25 [ 25 22,5 0,125 5 0,125 25 0,125
[25.30[ 45 27,5 0,225 5 0,225 70 0,35
[30 ;40[ 55 35 0,275 10 0,1375 125 0,625
[40 ;50[ 55 45 0,275 10 0,1375 180 0,9
[50 ;80[ 20 65 0,1 30 0,0167 200 1
TOTAL 200 1
x=
∑n i × xi
= ∑ f i × xi = 37,5
n
On prend comme valeur xi les centres des classes notées ci.
• Pour déterminer le mode : on prend la classe pour laquelle la fréquence par unité
d’amplitude est la plus élevée, c'est-à-dire la classe modale : [25.30[.
• Pour le calcul de la médiane : on a besoin des effectifs cumulés Ni ou des fréquences
cumulées Fi. La médiane correspond à la valeur de N i = 100 ou de Fi = 0,5. On réalise
ensuite une interpolation linéaire :
MED − 30 100 − 70
=
40 − 30 125 − 70
⇒ MED = 35,45
3. Représentez graphiquement le diagramme des fréquences simples. Quel est son nom ?
Attention, pour représenter le diagramme des fréquences simples, qui s’appelle un histogramme,
on prend en compte les fréquences par unité d’amplitude comme pour le calcul du mode : cas
continu avec classes inégales.
4. La distribution est-elle symétrique ?
1
La distribution n’est pas symétrique puisque le mode, la moyenne et la médiane ne sont pas égaux.
Comme la moyenne est supérieure à la médiane qui elle-même est supérieure au mode, la
distribution des dissymétrique à droite (vers les valeurs fortes).
Pour s’en assurer, on peut calculer le coefficient de Yule et Kendall :
(Q3 + Q1 − 2 × ME )
CY =
( Q3 − Q1 )
Q1 − 25 50 − 25
=
Avec 30 − 25 70 − 25
⇒ Q1 = 27,77
Q3 − 40 150 − 125
=
Et 50 − 40 180 − 125
⇒ Q3 = 44,54
Donc CY = 0,08. Comme il est positif, on prouve bien la dissymétrie à droite de la distribution.
PARTIE 2 :
On dispose des chiffres d’affaires moyens du secteur pour les années 2000 à 2006. On veut étudier
l’impact éventuel des dépenses en publicité sur ce chiffre d’affaires. On reporte les données dans le
tableau ci-dessous :
Année X Y x−x y−y (
( x − x) × y − y ) ( x − x) 2
( y − y) 2
2
51 − 38
La variation en % est donc : × 100 = 34,2
38
r=
∑(x −x × y−y) ( ) our =
cov( x; y )
= 0,95
∑ (x − x ) × 2
∑(y − y) 2 Var ( X ) × Var (Y )
Comme r est très proche de 1, l’ajustement linéaire de la série est justifié. La qualité de la
régression sera très bonne.
a=
∑ ( x − x ) × ( y − y ) oua = cov( x; y ) = 0,027
∑ ( x − x) var( x )
2
b = y − a × x = −12,1
Donc y = 0,027x-12,1
Pour un niveau de dépenses de 3 millions d’euros, on doit remplacer x par 3000 (X est exprimé en
milliers d’euros).
y = 0,027×3000 – 12,1 = 68,9 millions d’euros.