Vous êtes sur la page 1sur 80

Module

: Statistique

Chapitre 1 : Statistique
Descriptive
Semestre 1
Année scolaire : 2021 ‐2022

Pr Hamid El Ouardi

1
Objectifs pédagogiques
 Savoir reconnaitre une série statistique;

 Savoir représenter graphiquement une série statistique;

 Savoir calculer les différents paramètres d’une série


statistique;

 Savoir analyser les différents paramètres d’une série


statistique;

 Savoir résoudre les exercices et les problèmes liés aux séries


statistiques.

 Savoir étudier les séries doubles et la corrélation

2
Pr H. El Ouardi
Plan du chapitre

Séance 1
 Etude des séries statistiques simples
 Représentations graphiques
 Paramètres
 Analyse des paramètres
 Exemples
Séance 2
 Etude d’une série doubles
 Corrélation
 Exemple

3
Pr H. El Ouardi
Cours 1

 Éléments de statistique
descriptive

4
Pr H. El Ouardi
Quelques fondateurs (1)

Pierre de Fermat Blaise Pascal Jacques Bernouilli


(1601 - 1665) (1623 - 1662) (1654 - 1705)

Abraham de Moivre Thomas Bayes


(1667 - 1754) (? - 1763)

5
Quelques fondateurs (2)

Karl Friedrich Gauss Francis Galton


(1777 - 1855) (1822 - 1911)

Karl Pearson Ronald Fisher


(1857- 1936) (1890 - 1962)
6
Buts

• Ensembles de méthodes dont le but est de présenter


les données pour que l'on puisse en prendre
connaissance facilement.
• Cela peut concerner :
–une variable à la fois : statistique à une dimension,
–deux variables à la fois : statistique à deux dimensions,
–plus de deux variables à la fois : statistique
multidimensionnelle.

7
Pr H. El Ouardi
Statistique descriptive

• Ces méthodes comportent :


– Les tableaux : distributions de fréquences.
– Les diagrammes : graphiques.
– Les paramètres statistiques :
• Réduction des données à quelques valeurs
numériques caractéristiques.

8
Pr H. El Ouardi
• 3 Types de données :
– Qualitatives (présence ou absence d’une
caractéristique)
• Ordinales ou Binaires,
• Nominales.
– Quantitatives (compte ou mesure)
• Discontinues,
• Continues.

9
Pr H. El Ouardi
Distributions de fréquences
• Concernent les 3 types de données avec des points communs et
des points spécifiques à chacun des types.
• Séries statistiques (tout type de données) :
– Enumération des résultats :
• Exemples :
– Couleurs des cheveux : blond, brun, blond, noir….
– Nombre d’enfants dans les familles : 1, 2, 1, 4, 0 ….
– Séries statistiques ordonnées :
• Ne concernent que les données quantitatives
et ordinales
• Enumération du plus petit au plus grand
– Exemple : Nombre d’enfants : 0, 1, 2, 4 ….
• Le nombre total d’observations est l’effectif. Il est noté n
(certain le note N).

10
Pr H. El Ouardi
Distributions non groupées

xi ni fi
• Données
– qualitatives, x1 n1 f1
– quantitatives
x2 n2 f2
discontinues
• Formellement, ces … … …
tableaux ne concernent
pas les données
xp np fp
quantitatives continues.
n 1

11
Pr H. El Ouardi
Distributions non groupées
xi ni fi Chaque ligne correspond à
une valeur observée
différente. Il y a p valeurs
x1 n1 f1 différentes observées.

ni correspond au nombre 
x2 n2 f2 d’observations (effectif) ayant 
comme valeur  xi   

… … … fi correspond à la fréquence 
(pourcentage) d’observations 
xp np fp ayant comme valeur  xi :
ni
fi 
Total n 1 n

12
Pr H. El Ouardi
Distributions non groupées

• Données ordinales et xi ni fi Ni Fi
quantitatives
discontinues. x1 n1 f1 N1 F1
• x1 est la plus petite
valeur, xp la plus grande
des valeurs observées. x2 n2 f2 N2 F2
• Effectifs cumulés.
N2 = n2+n1 … … … …. …
• Fréquences cumulées.
F2 = f2+f1 xp np fp Np Fp
Total n 1
13
Pr H. El Ouardi
Distributions non groupées

xi ni fi Ni Fi
Ni est l’effectif cumulé c’est dire le
x1 n1 f1 N1 F1 nombre d’observations ayant des
valeurs inférieures ou égales à xi :
i
N   n
x2 n2 f2 N2 F2 i
j1
j

Fi est la fréquence cumulée c’est à


… … … …. … dire la fréquence des
observations ayant des valeurs
xp np fp Np Fp inférieures ou égales à xi :
i
Fi  
j 1
f j

Total n 1
14
Pr H. El Ouardi
Distributions groupées

• Les valeurs sont mises en classes.


• Toutes les distributions relatives à des
variables continues doivent être considérées
comme des distributions groupées, puisque
l'infinité de valeurs admissibles est
condensée en un nombre fini de mesures en
fonction de la précision de la méthode de
mesure utilisée.

15
Pr H. El Ouardi
A propos des classes
• Leurs valeurs extrêmes sont appelées bornes des
classes.
• Les classes sont mutuellement exclusives.
• L'amplitude de la classe ou intervalle ou module de
classe :
= borne supérieure - la borne inférieure.

16
Pr H. El Ouardi
A propos des classes
• L'intervalle de classe est généralement constant,
toutefois, on utilise parfois une amplitude variable
notamment pour les classes des valeurs extrêmes.
• En cas de classes d'amplitudes différentes, la
densité de fréquence ni/ i permet de comparer
les effectifs ou les fréquences d'une classe à
l'autre.
• la densité de fréquence est utilisée pour tracer
l’histogramme.

17
Pr H. El Ouardi
Données quantitatives continues

• Remarques :
– Si l’on mesure le poids d’un nouveau né avec une
précision de 1g, l’enfant qui pèse 3500g a en fait un
poids compris entre [3499,5 g et 3500,5 g[.
3500 g représente le centre de la classe.
– Si l’on mesure l’âge en années pleines des individus,
une personne de 20 ans a un âge compris entre [20
ans (inclus) et 21 ans[ (exclu).
20 ans représente la borne inférieure de la classe.

18
Pr H. El Ouardi
Distribution groupée

• On remplace la colonne xi par une colonne qui


comprend soit les bornes de classes, soit le
centre de classe ou la borne inférieure de la
classe (données temporelles comme l’âge en
années pleines).

19
Pr H. El Ouardi
Exemple

Classe Ci ni fi Ni Fi
[140-160[ 150,0 10 0,05 10 0,05
[160-165[ 162,5 20 0,10 30 0,15 Pour les calculs, le
[165-170[ 167,5 30 0,15 60 0,30 centre de classe Ci est
utilisé en remplacement
[170-175[ 172,5 45 0,23 105 0,53 de xi sauf de façon
usuelle pour l’âge
[175-180[ 177,5 40 0,20 145 0,73 (données temporelles).
[180-185[ 182,5 35 0,18 180 0,90
[185-190[ 187,5 15 0,08 195 0,98
[190-200[ 195,0 5 0,03 200 1,00

20
Pr H. El Ouardi
Formules
ni
fi 
n p = nombre de valeurs différentes observées


p
n  i 1
ni


p
i 1
fi  1

 
n p
Total des valeurs  i 1
xi , i 1
n ix i
  i 1 i i
n 2 p 2
Total des carrés des valeurs i 1
x , i n x

21
Pr H. El Ouardi
En pratique

• Pour les calculs des paramètres statistiques


usuels des données quantitatives et uniquement
de ce type de données.
• On complète la distribution par :
– Une colonne ni * xi pour calculer le total,
– Une colonne ni * xi2 pour calculer le total des carrés.

22
Pr H. El Ouardi
Les graphiques représentent les distributions

• Distributions non cumulées


–Distributions non groupées
• Données qualitatives :
– Diagramme sectoriel
Angle au centre proportionnel à ni (ou fi).
• Données quantitatives discrètes
– Diagramme en bâtons
On trace parallèlement à l'axe des ordonnées, en regard des xi qui sont
portés en abscisse, un segment de longueur proportionnel à ni
– Polygone des fréquences
Ligne brisée joignant les bâtons.
Fréquences absolues / fréquences relatives.
23
Pr H. El Ouardi
Exemple : Données qualitatives

• Diagramme sectoriel
Répartition des groupes sanguins
Groupes 
sanguins ni fi
A 35 35%
B 9 9%
16 A
35 B
O 40 40%
O
AB 16 16%
40 9 AB
100 100%

• Calcul de l’angle : a=n*360/N


24
Pr H. El Ouardi
Exemple : Donnée quantitative discontinue

nombre nombre de
25

d'enfants familles (ni) 20

(xi)
0 10 15

1 20
2 15 10

3 5
4 3 5

>4 0
0
0 1 2 3 4 >4

Polygone des fréquences

25
Pr H. El Ouardi
Les graphiques représentent
les distributions
• Distributions non cumulées
– Distributions groupées
• Données quantitatives
– Histogramme :
 Composé de rectangles ayant comme base
l'intervalle de classe et comme hauteur la densité
de fréquence (ni/i).
 La surface est proportionnelle à ni.

26
Pr H. El Ouardi
Les graphiques représentent
les distributions
• Distributions cumulées
– Uniquement pour des données quantitatives
• Polygone des fréquences :
– Distributions non groupées = escalier.
– Distributions groupées = ligne brisée.
• Histogrammes.

27
Pr H. El Ouardi
Exemple : Histogramme
90
Densité 80
Classe ni (*10) 70
[140-160[ 10 5 60
[160-165[ 20 40 50
40
[165-170[ 30 60 30
[170-175[ 45 90 20
[175-180[ 40 80 10
[180-185[ 35 70 0
140 160 170 180 190 200
[185-190[ 15 30
[190-200[ 5 5

28
Pr H. El Ouardi
Aspects de la distribution

• Distribution non cumulée :


60
– en forme de : Cloche, J, U ; 50

– À une seule bosse, à plusieurs bosses ; 40

– …….
30

20

• Symétrie – Aplatissement. 10

0
1 2 3 4 5 6 7 8 9 10

29
Pr H. El Ouardi
Les paramètres statistiques

• Paramètres de position Paramètres de l’échantillon


– Valeurs centrales
• Moyenne arithmétique E n
• Les autres moyennes
– géométrique s o
– harmonique
– quadratique
t i
• Médiane Le + souvent i t
• Mode
• Médiale m a
– Les fractiles a m
• Quartiles
• Percentiles t i
• Paramètres de dispersion i t
– Amplitude ou étendue o s
– Ecart interquartiles
– Variance, Ecart type n E
– Coefficient de variation
Paramètres de la population
• Paramètre d'aplatissement et de symétrie
30
Les mesures de tendance centrale

Il existe trois principales mesures de tendance centrale

1) Mode

2) Médiane

3) Moyenne arithmétique

1) Fractiles

31
Moyenne Arithmétique

Population m (mean) Echantillon x (average)

• Appelée moyenne notée x


–Paramètre central qui concerne bien évidemment
uniquement des variables quantitatives.
–Dans l’unité de la variable.
–Calculable quelque soit la loi qui régit la distribution.
–Somme des valeurs (T) divisée par le nombre de
mesures (n).
–Suivant la forme de présentation des observations,
différentes formules de calcul peuvent être employées.

32
Pr H. El Ouardi
Moyenne arithmétique

• On note : p p
ni
n : Nombre total de
mesures. n   ni fi  f i 1
p : Nombre de i 1 n i 1
valeurs différentes
n p p

x n x  n  fix i
observées.
ni : Nombre T i ou i i
d’occurrences de la
i 1 i 1 i 1
valeur observée i.
p
fi : Fréquence T
(pourcentage) de la
valeur observée i.
x
n
 fx
i 1
i i

33
Pr H. El Ouardi
Moyenne arithmétique

34
Pr H. El Ouardi
Distribution des moyennes de plusieurs
échantillons (Voir Echantillonnage)
• La moyenne de l'échantillon est le meilleur
estimateur de la moyenne de la population.
• La distribution des moyennes de petits
échantillons (n<30) indépendants tirés de la
même population suit une loi normale si la
distribution de la variable est normale.
• Au-delà de 30, la distribution des moyennes suit
une loi normale sans condition sur la distribution
de la variable.

35
Pr H. El Ouardi
Exemple

• Soit la série correspondant aux tailles en cm


de 6 étudiants : 160,170,180,180, 190, 200.

n = 6; T = 160+170+180+180+190+200 = 1080

1080
x  180 cm
6

36
Pr H. El Ouardi
Exemple

Le nombre de familles enquêtées


nombre nombre de
est de 53.
d'enfants familles Le nombre total d’enfants est
(xi) (ni) ni*xi de 77.
0 10 0
La moyenne du nombre d’enfants
1 20 20 par famille est de 77/53 = 1,45.
2 15 30
3 5 15 Attention aux arrondis ici si on
arrondit à une décimale la
4 3 12 moyenne est de 1,5 enfants par
Total 53 77 famille.

37
Pr H. El Ouardi
Exemple
• Les étudiants de première année de L1 santé sont répartis dans 3
amphithéâtres avec les données ci-dessous. Quelle est la
moyenne de l’âge en L1 santé ?

Moyenne  Les effectifs étant différents dans


de l'âge  les 3 groupes, la moyenne
Effectifs en années
recherchée n’est pas la moyenne
Amphi 1 1000 18,1
Amphi 2 500 19,5 des moyennes.
Amphi 3 1000 18,3 •On calcule le total de l’âge des 3
groupes réunis : T = 18,1*1000+
500*19,5+ 18,3*1000 =46 150.
•L’effectif total est de 2 500.
•La moyenne recherchée est
46150/2500 =18,5 ans
38
Pr H. El Ouardi
La médiane

• La médiane notée Me est telle que la moitié des


observations lui sont inférieure (ou égale) et la
moitié supérieure (ou égale) : xi tel que Fi = 0,5.
– Sur les distributions symétriques unimodales en
cloche (normales par exemple) la médiane est égale à
la moyenne et au mode.
– Paramètre peu sensible aux valeurs extrêmes.

39
Pr H. El Ouardi
La médiane : calcul

• Sur une distribution non groupée :


–Si n impair, la médiane est l'observation de rang (N+1)/2
–Si n est pair, tout nombre entre xN/2 et xN/2+1
convient. On prend la moyenne (pondérée en cas d'ex-
aequo) entre ces deux valeurs.
• Sur une distribution groupée, la classe médiane est
celle qui contient la médiane.
–Détermination graphique.
–En admettant que les observations soient réparties
uniformément dans cette classe, on réalise une
approximation linéaire. (Interpolation linéaire)

40
Pr H. El Ouardi
Exemple

Classe ni Ni Fi
[140-160[ 10 10 0,05
[160-165[ 20 30 0,15
[165-170[ 30 60 0,30
[170-175[ 45 105 0,53
[175-180[ 40 145 0,73
[180-185[ 35 180 0,90
[185-190[ 15 195 0,98
[190-200[ 5 200 1,00
Total 200

41
Pr H. El Ouardi
Mode

• Mode encore appelé valeur dominante :


– Correspond à la valeur la plus fréquente. xi
correspondant au ni (ou fi) maximum.
– Il peut y avoir un ou plusieurs modes.

• Rappel :
– Dans les distributions en cloche, unimodales
symétriques, mode, médiane et moyenne sont
confondus.

42
Pr H. El Ouardi
Fractiles
• Quartiles
– Q1: xi tel que Fi = 0,25 => 1/4 des valeurs lui sont
inférieures, 3/4 lui sont supérieures.
– Q2 = Médiane.
– Q3 : xi tel que Fi = 0,75 => 3/4 des valeurs lui sont
inférieures, 1/4 lui sont supérieures.
• Détermination graphique.
• Interpolation linéaire (cf médiane).

• Percentiles
– 10ième percentile : xi tel que Fi = 0,10

43
Pr H. El Ouardi
Remarques
• On a :
–50% des individus qui ont des valeurs en dehors de
l’intervalle Q1-Q3 et 50% à l’intérieur.

–25% des individus qui ont des valeurs comprises entre


Q1 et Me.
–25% des individus qui ont des valeurs comprises entre
Me et Q3.
–25% des individus qui ont des valeurs inférieure à Q1
–25% des individus qui ont des valeurs supérieures à
Q3

–Ceci permet rapidement de se rendre compte si la


distribution est symétrique ou non.

44
Pr H. El Ouardi
Paramètres de dispersion

1) Amplitude ou étendue
2) Ecart interquartiles
3) Variance et écart type
4) Coefficient de variation

45
Pr H. El Ouardi
Amplitude ou étendue

• Ecart entre la valeur de l'observation maximale


et celle de l'observation minimale.

46
Pr H. El Ouardi
Ecart interquartiles (EIQ)

• EIQ = Q3 -Q1

• Englobe 50% des observations

• On utilise parfois l'écart semi-interquartile


(Q3-Q1)/2

47
Pr H. El Ouardi
Variance et écart type
• La variance (variance) d'une série ou d'une
distribution de fréquences est la moyenne
arithmétique des carrés des écarts à la moyenne
n n

(x  x)
i
2
n (x  x)
i i
2

V  i1 ou V  i1
n n
• C'est par rapport à la moyenne que la somme des
carrés des écarts est la plus faible.
• La variance de l'échantillon est souvent notée V.

48
Pr H. El Ouardi
Variance et écart type
• Le numérateur de la variance est appelé somme des
carrés des écarts et noté SCE.
• L'écart type (Sx) est la racine carré de la variance.
On l'appelle également déviation standard
(standard deviation). Il est dans l'unité de la
variable.
• Variance et écart type sont indépendants des
translations (changement d ’origine) mais pas des
multiplications (changement d'unité).

– Si y = a . x + b, on a Sy = |a| .Sx

49
Pr H. El Ouardi
Formules
p p
n i
n  
i1
n i fi 
n
 i1
fi  1
n p p
T  i1
x i  
i1
n ix i  n 
i1
fi
n p
U   i1
x 2
i ou  i1
n ix 2
i

p
T
x 
n
  i1
fix i

N
T 2
SCE   i1
n i (x i  x) 2
 U 
n
SCE
S x 
n
50
Pr H. El Ouardi
Ecart type

• Souvent noté aussi

σ  Sx

51
Pr H. El Ouardi
Coefficient de variation

• CV est le rapport écart type divisé par la


moyenne.
• CV est un nombre pur, sans unités.
• CV est totalement indépendant des unités.
• Le CV permet de comparer la variabilité de
distributions de variables qui ne sont pas dans
les mêmes unités.

52
Pr H. El Ouardi
Travaux Dirigés

Exercice 1
Densité de fréquence, mode, médiane,
quartiles, moyenne, écart type

53
Pr H. El Ouardi
Données
Le tableau ci-dessous présente les résultats d’une enquête effectuée en France en
2003 sur le salaire des ingénieurs diplômés par tranche de salaire selon le sexe,
Tranche de salaire Proportion
(euros) Femmes Hommes
Moins de 30 000 19,9% 6,2%
de 30 000 à 40 000 33,3% 17,0%
de 40 000 à 50 000 22,2% 16,8%
de 50 000 à 60 000 10,7% 13,9%
de 60000 à 70000 6,6% 12,1%
de 70000 à 80000 3,2% 8,3%
de 80000 à 90000 1,3% 6,2%
de 90000 à 100000 0,3% 4,3%
de 100000 à 110000 0,4% 3,6%
Plus de 110000 2,1% 11,6%
Total 100,0% 100,0%
Source : enquête Conseil National des Ingénieurs et Scientifiques de France
CNISF 2003 « Les salaires des ingénieurs diplômés » – Koubi Malik, Mazars Marjorie, Insee

Calculez toutes les statistiques qui sont nécessaires pour la description exhaustive
des données (le mode, la médiane, les quartiles, la moyenne, la variation, écart type,
54
Pr H. El Ouardi
Cours 2

Eléments de statistique Double :


Corrélation et ajustement

55
Pr H. El Ouardi
Statistique descriptive à 2
dimensions
•Objectif : mettre en évidence les relations
qui existent entre deux séries
d'observations.

–Nature des variables : les deux variables peuvent


être quantitatives, qualitatives ou l'une
quantitative et l'autre qualitative.
–Deux variables mesurées chez le même individu
par exemple poids et taille; poids et couleur des
yeux, présence d’un cancer et éthylisme...

56
Pr H. El Ouardi
Corrélation et droite
d’ajustement
Cours et formules

57
Statistiques doubles
•Il courant d’étudier une population à l’aide de plusieurs caractères.

•On se limite à 2 caractères : (Xi, Yi )


• Distribution statistique sous la forme :

X1 X2 . . Xn
Y1 Y2 Yn

Il est facile de calculer la moyenne et la variance


( où l’écart type de la distribution ( Xi) et de la distribution (Yi).

58
Statistiques doubles

Distribution statistique sous la forme :

X est une variable pouvant prendre n modalités


X1, X2,………………….. ………………….,Xn,

Y est une variable pouvant prendre p modalités


Y1, Y2,………………….. ………………….,YP,

On construit le tableau de contingence:

59
Qui représente la distribution d’effectif du couple ( X, Y).

X\Y Y1 . . . Yp Total

X1 n11 n1p n1.

Xn nn1 nnp nn.

total n.1 n.p n..=N

60
La dépendance (corrélation)

• Lorsqu’une distribution présente 2


caractères, il est parfois légitime de se
demander s’il existe un lien entre eux.

• On s’interroge alors sur la possible


dépendance, dans un sens ou dans l’autre de
ces deux variables.

61
L’ajustement linéaire

• L’ajustement à une courbe se fait généralement en


minimisant les carrés des distances des points du nuage à
la courbe.

• L’ajustement à une droite (ajustement linéaire) est le plus


fréquemment utilisé. Cependant, il faut garder à l’esprit
qu’il n’est pas toujours adapté.

62
Nuage de points et ajustements

• Lorsque le nuage de points présente une forme allongée,


l’ajustement linéaire (une droite permet de résumer au mieux
l’allure générale du phénomène) est acceptable :

63
Nuage de points et ajustements

• Mais la forme du nuage peut suggérer d’autres types de


courbes.

Nous ne pouv ons pas afficher l’image.

Nous ne pouv ons pas afficher l’image.

64
Droites de régression (méthode des moindres carrés)

• Il s’agit de déterminer 2 droites D et D’ telles que, pour chacune d’elles,


les distances prises entre chaque point du nuage et la droite soient les
plus petites possibles.
• Les distances di et dj entre la droite et chaque point du nuage sont prises
parallèlement aux axes.

65
La détermination de l’équation des droites D et D’

• Si l’on note y=ax+b l’équation de D alors pour déterminer


les valeurs de a et b, il faut minimiser l’expression :

• On obtient ainsi la valeur de a (pente de la droite D) :

66
La détermination de l’équation des droites D et D’

• Or, on sait que les droites D et


D’ passent par le point moyen
de coordonnées ( ), ce qui
permet de déterminer les
valeurs de b et b’ une fois
connues les valeurs de a et a’.

67
Le coefficient de corrélation linéaire

• La plus ou moins grande


dépendance entre les deux
variables x et y peut être
appréhendée par la valeur de
l’angle que forment les
droites de régression D et D’.

• Plus cet angle est ouvert,


moins la liaison est forte.

68
Coefficient de corrélation linéaire
• Pour traduire l’intensité de la liaison par un nombre, on
utilise le coefficient de corrélation linéaire dont le carré est
égal au produit des pentes des droites de régression :
r² = aa’

D’où

-1 ≤ r ≤ 1

69
Coefficient de corrélation linéaire

• Il y a une forte corrélation linéaire entre x et y quand r


est voisin de + 1 ou – 1.

• Quand r est nul, cela suggère une indépendance.

• Un lien de dépendance entre deux séries est jugé


significatif à partir du moment où en valeur absolue r
est supérieur à 0,87 (r² ≥ 0,76).

70
Coefficient de corrélation linéaire

71
Coefficient de corrélation linéaire

72
Représentation graphique
le nuage de points

• Le graphique en nuage de
points permet de mettre en
évidence la relation entre 2
variables. En abscisses, on
porte la variable explicative
X et en ordonnée, la variable
expliquée Y.

73
De la dépendance à la causalité

• La détermination
d’une droite des
moindres carrés ne
signifie pas qu’un
lien de causalité
existe entre les 2
variables.

74
Soit la distribution d’effectif du couple ( X, Y).

X\Y Y1 . . . Yp Total

X1 n11 n1p n1.

Xn nn1 nnp nn.

total n.1 n.p n..=N

75
N
1
x 
N

i  1
n i. x i,
N
1
y 
N
 i  1
n .i y i

x 
N
1
 n 
2 2
v ( x )  i. x i  ,
N i  1

 ( x )  v ( x )

y 
N
1
 n  2 2
v ( y )  .i y i  ,
N i  1

 ( y )  v ( y )
76
Exercices 1
numéro Y X
1 3 6
2 10 12
3 6 8
4 7 8
5 4 7
6 8 10
7 9 11
8 2 4
9 5 7
10 1 3

Existe-t-il une liaison linéaire entre les deux variables quantitatives X et Y ?

77
Exercice 2
Une enquête menée pour le compte d’une entreprise a permis d’établir le
nombre d’acheteurs d’un produit selon le montant de son prix de vente :

prix de vente en euros xi 1 1, 5 2 3 4


nombre d’acheteurs en milliers yi 3, 75 2, 8 2 1 0, 5

a) Représenter le nuage de points associé à la série dans un repère orthogonal.

b) Donner l’équation de la droite d’ajustement de y en x obtenue par la méthode des


moindres carrés.

c) On pose zi = (0, 75xi − 3, 16)2.

Donner une équation de la droite d’ajustement de y en z.


En déduire que la nouvelle estimation de y en fonction de x est donnée par y = 0, 313x2
− 2, 64x + 6, 062.
d) Utiliser les deux ajustements pour estimer le nombre d’acheteurs
potentiel pour un produit vendu 2,50 euros.
e) Quel est le meilleur des deux ajustements ?

78
Exercice 3

Tableau de contingence donnant


l’évolution du salaire mensuel net
en fonction de l’âge

79
Calcul pratique dans un tableau de contingence:

X \Y 15-25 25-30 30-35 35-40 40-45 45-50 50-55 55-65

5000-6000 300 150 120 300 200 150 100 0

6000-7000 120 200 250 100 50 10 10 0

7000-8000 50 300 350 100 120 20 10 10

8000-9000 0 110 300 250 150 180 100 40

9000-10000 0 0 100 180 230 260 100 20


10000-12000 0 0 0 230 200 150 80 40

12000-20000 0 0 10 200 400 300 200 150

Vous aimerez peut-être aussi