Vous êtes sur la page 1sur 26

Statistiques descriptives

1
Ibrango Idrissa

12 mai 2013

1. Doctorant à l’UPB/UFR-ST/ISEA
Table des matières

1 Introduction 2

2 Séries statistiques à une variable 3


2.1 Vocabulaire statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.1 Population . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.2 Variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Effectifs - Fréquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.1 Effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2.2 Fréquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 Regroupement en classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.4 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.4.1 Représentations des variables quantitatives discrètes . . . . . . . . . . . . . . . 6
2.4.2 Représentations des variables quantitatives continues . . . . . . . . . . . . . . . 6
2.4.3 Représentations de variables qualitatives . . . . . . . . . . . . . . . . . . . . . . 7
2.5 Caracteristiques de position et de dispersion . . . . . . . . . . . . . . . . . . . . . . . . 8
2.5.1 Caractéristiques de position ou paramètre de position . . . . . . . . . . . . . . 8
2.5.2 Caractéristiques (ou paramètres) de dispersion . . . . . . . . . . . . . . . . . . 11
2.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3 Séries Statistiques à deux Variables 16


3.1 Tableau de données, nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1.1 Tableaux de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1.2 Nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1.3 Point moyen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2 Ajustement Affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2.1 Ajustement à la règle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2.2 Ajustement Affine par la méthode de Mayer . . . . . . . . . . . . . . . . . . . . 17
3.2.3 Ajustement Affine par la méthode des Moindres Carrés . . . . . . . . . . . . . 18
3.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4 Indices Statistiques 25

1
Chapitre 1

Introduction

Selon le Petit Robert, on désigne par le terme statistique, l’ensemble des techniques d’interprétation
mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs
est impossible, à cause de leur grand nombre ou de leur complexité.
Une étude statistique comprend quatre étapes :
1. Le recueil des données : il s’effectue lors d’une enquête. Celle-ci peut porter sur tous les
sujets concernés par l’étude et est appelée dans ce cas recensement. Dans la plupart des cas,
compte tenu du coût trop lourd d’un recensement, on effectue une enquête partielle (portant sur
une partie des sujets) appelée sondage. Dans ce second cas, pour que les informations obtenues
soient intéressantes, il faut que le sondage soit effectué avec certaines règles. La théorie des
sondages s’intéresse à la manière de choisir, parmi tous les sujets, ceux sur lesquels faire porter
l’étude statistique. Dans ce cours cet aspect ne sera pas abordé.
2. Le dépouillement des données : il consiste à rassembler les données et à les organiser par
exemple sous forme de tableaux, les classer, les coder . . .
3. Traitement des données : c’est lors de cette étape qu’interviennent les techniques statis-
tiques. Le but de cette étape est de retirer un maximum d’information des données. On distingue
deux branches principales en statistique :
(a) La statistique descriptive vise principalement deux objectifs :
– d’une part, la représentation graphique des données en alliant à la fois la lisibilité de
la représentation et la fidélité aux données ;
– d’autre part, le résumé des données par des caractéristiques numériques.
(b) La statistique inductive ou inférentielle consiste à faire des extrapolations à partir
d’un échantillon. Elle suppose que le phénomène étudié peut être décrit par un modèle
mathématique permettant d’approcher les propriétés de ce phénomène. Le choix de ce
modèle est bien sûr un problème important puisqu’il doit représenter au mieux la réalité.
Les méthodes utilisées en statistique inductive font appel au calcul des probabilités.
4. L’interprétation des résultats : il s’agit d’une étape délicate nécessitant une bonne connais-
sance du phénomène étudié et des méthodes statistiques utilisées.

2
Chapitre 2

Séries statistiques à une variable

Dans le cadre d’une étude préalablement définie, la statistique descriptive a pour but, à partir d’un
recueil de données, de mettre en forme ces données (tableaux, graphiques) et de les résumer à l’aide
de valeurs caractéristiques (moyenne, médiane, écart-type,. . . ).

2.1 Vocabulaire statistique


2.1.1 Population

Avant toute enquête statistique, il faut définir avec précision la population que l’on souhaite étudier.
Il s’agit de l’ensemble concerné par l’étude effectuée. Une population peut être un ensemble de person-
nes, d’objets, de situations, de pays,... On note souvent Ω (oméga majuscule) la population étudiée.
Un élément de la population s’appelle un individu ou une unité statistique, on note souvent ω (oméga
minuscule) un individu quelconque.

Exemple 2.1 : Si on fait le recensement des Burkinabés, la population est l’ensemble de tous les
Burkinabés et un individu est un Burkinabé.

Le nombre d’éléments de la population s’appelle la taille de la population. Lorsque la population est


trop vaste pour que l’on puisse réaliser une étude exhaustive (par exemple pour des raisons de "coût"
trop important ou par manque de temps), on est amené à effectuer un sondage et à ne considérer qu’une
partie de la population. Cette partie est appelée échantillon. Le nombre d’individus de l’échantillon
est appelé taille de l’échantillon, et notée n. (C’est dans ce cadre qu’interviendra ultérieurement la
statistique inférentielle qui permettra de dire si on peut étendre les résultats obtenus sur l’échantillon
étudié à la population entière.)

2.1.2 Variable

Un renseignement demandé, une question posée est appelé variable en statistique (champ en In-
formatique et caractère en Sciences Humaines). On notera souvent X la variable étudiée. Pour qu’une
question posée soit considérée comme une variable, il faut que toutes les réponses possibles soient ex-
primables, et que chaque individu ne puisse donner qu’une seule réponse concernant le renseignement
demandé.
Les valeurs possibles de la variable sont appélées "modalités" de X.
En considérant l’ensemble des modalités, on distingue différents types de variables :

3
1. qualitatif : il n’y a pas d’ordre numérique dans les valeurs de X.
Ex : sexe, nationalité, couleur, . . .
2. quantitatif : et dans ce cas elle peut être
– discrète si elle ne prend que des valeurs isolées (i.e on peut dénombrer ou énumérer les valeurs
de X).
Ex : nombre d’enfants d’une famille, nombre de pièces d’un appartement, . . .
– continue si elle prend toutes les valeurs d’un intervalle.
Ex : poids d’un individu, taille d’un individu, salaire d’une personne, . . .

Exercice 2.1 :
Dans les exemples suivants, donner la population, un individu de la population, la variable étudiée et
le type de cette variable :
1. On souhaite connaître les catégories socioprofessionnelles de la population active au Burkina en
1930.
2. On veut étudier la répartition des entreprises du Burkina selon leur taille (petite, moyenne ou
grande) en 1973.
3. On mesure le P.N.B dans chaque pays de l’Union Africaine en 2013.
4. On s’intéresse aux billets en circulation dans le monde et à leur valeur à la Bourse (convertie
en Euros) au 01/01/2000.
5. On s’intéresse à l’âge des étudiants inscrits en licence d’histoire.
6. On compte le nombre de personnes par logement dans la ville de Bobo en 1999.

2.2 Effectifs - Fréquences


2.2.1 Effectifs

Pour chaque modalité de la variable on compte le nombre d’individus ayant cette modalité. Le résultat
obtenu s’appelle l’effectif de la modalité.
Soient (x1 , x2 , . . . , xp ) les valeurs ou modalités distinctes prises par X. On appelle donc effectif de la
p
X
modalité xi le nombre ni d’éléments de Ω correspondant a la modalité xi . On note n = ni l’effectif
i=1
total.

2.2.2 Fréquences

L’effectif d’une modalité ne sufft pas à rendre compte de l’importance de cette modalité dans la
population. Il faut donc pour chaque modalité comparer ni et n. On appellera fréquence de la modalité
ni ni
xi , le quotient , que l’on notera fi : fi =
n n
p
X
On a 0 ≤ fi ≤ 1 et fi = 1.
i=1

2.3 Regroupement en classe


Lorsqu’une variable a beaucoup de modalités (c’est souvent le cas avec les variables quantitatives), on
est amené à regrouper de façon cohérente des modalités avant de faire un traitement statistique. On

4
dit que l’on fait un regroupement en classes. L’amplitude d’une classe est la longueur de l’intervalle.
Un regroupement par classes doit vérifier :
– deux classes quelconques sont disjointes et la réunion des classes recouvre l’ensemble des modal-
ités.
– les classes n’ont pas forcément la même amplitude.
xi + xi+1
Le centre de la classe [xi , xi+1 [ est ci = et son amplitude est ai = xi+1 − xi .
2

Exercice 2.2
Les effectifs des salariés de 72 entreprises d’une région pour l’année 1997 ont été relevés et sont les
suivants :
3 33 2 11 5 21 2 13 8 23 6 11
7 26 3 14 9 31 1 12 1 50 36 14
3 5 28 8 10 7 34 6 13 3 27 2
12 1 30 1 11 40 9 16 4 23 5 15
51 5 12 57 45 49 54 40 30 17 9 2
10 35 48 28 12 2 15 33 51 17 19 20
1. Effectuer le dépouillement (ou dénombrement) des observations en complétant le tableau
suivant :
Nombre de salariés : xi Nombre d’entreprises : ni
1 4
2 5
.. ..
. .
57 1
Total 72
2. Pour les 72 entreprises, on a recensé 40 valeurs possibles du caractère étudié qui est le nombre
de salariés. L’effectif correspondant à chaque modalité est très faible et le plus souvent égal à 1
ou 2. Il serait donc plus judicieux de réaliser des regroupements en ce qui concerne le nombre de
salariés de façon à obtenir des effectifs plus conséquents. On décide d’effectuer des regroupements
par classe de 10 en partant de 0. Compléter le tableau suivant :
Nombre de salariés : xi Nombre d’entreprises : ni Centre de classe : ci
[0 ; 10[ 27 5
[10 ; 20[
[20 ; 30[
[30 ; 40[
[40 ; 50[
[50 ; 60[
Total 72 ...

2.4 Représentations graphiques


Une fois le tableau statistique établi, on cherche à rendre celui-ci plus "lisible" c’est-à-dire à représenter
les informations qu’il contient sous forme de graphiques. C’est un procédé largement utilisé dans tous
les médias. Ces graphiques ont pour seul but de représenter de manière plus attrayante le tableau
statistique. A partir de chaque graphique on peut reconstruire le tableau statistique (il n’y a donc pas
de perte d’information). Les représentations graphiques sont diverses et dépendent principalement du
type de variable étudiée.

5
2.4.1 Représentations des variables quantitatives discrètes
Les diagrammes en bâton

Les diagrammes en bâtons servent à représenter les effectifs ou les fréquences de l’ensemble des
modalités d’une variable quantitative discrète. Pour tracer un diagramme en bâtons, on choisit tout
d’abord deux axes perpendiculaires et une échelle pour chacun de ces axes. L’axe des abscisses (ou
axe horizontal) sert à porter les modalités de la variable et l’axe des ordonnées (axe vertical) est l’axe
des effectifs ou des fréquences suivant le cas. Il suffit ensuite de tracer en chaque modalité un trait
vertical (bâton) dont la hauteur correspond à la valeur de l’effectif ou de la fréquence.
Exemple de diagramme en bâtons
effectif ou fréquence

1
caractère
0 1 2 3 4 5 6 7

2.4.2 Représentations des variables quantitatives continues


Les histogrammes

Les histogrammes servent à représenter les effectifs ou les fréquences d’une variable quantitatives
continues.
Comme pour les diagrammes précédents, on choisit, pour tracer un histogramme, deux axes perpen-
diculaires et une échelle pour chacun. Sur l’axe des abscisses (axe horizontal) sont portées les valeurs
de la variable, c’est-à-dire les différentes classes de cette variable. Une fois choisie une échelle pour cet
axe, les positions des bornes de classes doivent respecter cette échelle. Sur l’axe des ordonnées sont
portées les valeurs des effectifs ou des fréquences. En face de chaque classe, on trace un "rectangle"
dont la hauteur est égale à l’effectif (ou à la fréquence) de cette classe.

Exemple d’histogramme

6
effectif ou fréquence

1
caractère
0 1 2 3 4 5 6 7

Attention : Avant de tracer l’histogramme, il convient de vérifier si les classes ont mêmes amplitude.
Sinon il faut corriger les effectifs.
ni × am
L’effectif corrigé n0i de la classe i est n0i = où ai est l’amplitude de la classe i et am est
ai
l’amplitude minimale.

2.4.3 Représentations de variables qualitatives


Les diagrammes en colonnes

Pour tracer un diagramme en colonnes, dans un repère dont les axes sont orthogonaux, on gradue l’axe
vertical en partant de 0 pour le point d’intersection des 2 axes. Chaque modalité de la variable est
représentée par un rectangle dont la base est située sur l’axe horizontal, et dont la hauteur est égale à
l’effectif de la modalité. L’axe horizontal n’est pas muni d’une échelle, puisque les modalités n’ont pas
ici de valeurs numériques. Les modalités sont régulièrement espacées sur cet axe. L’axe des ordonnées
(axe vertical) est l’axe des effectifs ou des fréquences suivant le cas. En face de chaque modalité figure
une colonne (un rectangle) dont la hauteur correspond à la valeur de l’effectif ou de la fréquence.

Les diagrammes en secteurs et les diagrammes en barre

Les diagrammes en secteurs et les diagrammes en barre servent (comme les diagrammes en colonnes)
à représenter les effectifs ou les fréquences d’une variable en secteurs sont plus souvent appelés qualita-
tive. Les diagrammes camemberts. Les diagrammes en secteurs se présentent sous la forme d’un disque
(ou d’un demi-disque) divisé en k secteurs (k étant le nombre de modalités de la variable) : l’angle
(ou l’aire ce qui revient au même) de chaque secteur est proportionnel à l’effectif ou à la fréquence
de la modalité qu’il représente. Il suffit donc de construire le tableau de proportionnalité consistant à
passer de la colonne des fréquences à la colonne des angles (en degrés) en multipliant par 360. (L’angle
correspondant à un disque complet ayant pour mesure 360 degrés).
Les diagrammes en barre sont construits sur le même principe mais sous la forme d’un rectangle divisé
en k sous-rectangles dont les aires sont proportionnelles aux effectifs ou fréquences des modalités qu’ils

7
représentent.

Exercice 2.3 : Voici un tableau d’effectifs donnant la production mondiale d’or en 1937.

Continents Europe Asie Afrique Amérique Océanie


Production en tonnes 176 87 431 350 56

1. Calculer la part de production de chaque continent sur la production totale ( à exprimer en


pourcentage).
2. On décide de représenter cette série par un diagramme circulaire. Exprimer chaque pourcentage
obtenu précédemment en degrés.
3. Représenter un cercle de centre O. A l’intérieur de ce cercle reporter les différents secteurs qui
correspondent aux différents dépenses de fonctionnement en utilisant vos résultats en degrés et
un rapporteur.

2.5 Caracteristiques de position et de dispersion


Problème : on donne une série statistique discrète X = (xi , ni )1≤i≤p . Quelle est la valeur qui résume
au mieux ?

2.5.1 Caractéristiques de position ou paramètre de position

Mode : Le mode ou dominante Mo correspond à la modalité qui représente l’effectif (ou la fréquence)
le plus élevé.
Le mode est d’un intérêt pratique incontestable dans la mesure où il représente le cas le plus courant,
la valeur type qui mérite d’être particulièrement étudiée.
Le mode d’une série à variable discrète correspond à l’abscisse du bâton le plus élevé du diagramme
des effectifs.

Nombre d’enfant xi Nombre de ménage ni


0 890 000
Ex : 1 1 149 000 Mo =
2 979 000
3 254 000

Lorsque nous avons une variable continue, si les amplitudes sont égales, l’effectif le plus élevé corre-
spond à la classe modale et le mode Mo est le centre de cette classe. Si les amplitudes sont inégales,
la classe modale est celle qui est associée à l’effectif corrigé n0i le plus élevé et le mode est le centre de
cette classe.

Ex : Répartition des dépannage d’un secteur en éléctroménager en fonction de leur durée.

8
Durée en minutes xi Nombre de dépannages ni
[0, 20[ 4
[20, 40[ 36
[40, 60[ 64
Mo =
[60, 80[ 80
[80, 100[ 58
[100, 120[ 24
[120, 140[ 14

Ex : Salaire mensuel des ouvriers d’une entreprise en 1998.

Salaire en francs xi Nombre d’ouvriers ni


[6 500, 6 700[ 21
[6 700, 7 100[ 49
Mo =
[7 100, 7 300[ 45
[7 300, 7 700[ 24
[7 700, 8 300[ 6

La médiane : La médiane Me est l’élément qui partage la série statistique en deux sous ensembles
d’effectifs égaux. La série doit être classée par ordre de grandeur croissant.
a. Série statistique à variable discrète
– Premier cas : le nombre d’observations n est impair.
Soit les 9 notes obtenues lors d’un examen de statistiques par un étudiant :
8, 8, 9, 10, 12, 13, 14, 15 et 16.
L’effectif n = 9. On peut écrire n = 2p + 1 = 2 × 4 + 1. La médiane est la (p + 1)e valeur de
la série, soit ici la 4 + 1 = 5e valeur de la série. Me = 12 ?
– Deuxième cas : le nombre d’observation est pair.
Soit les 8 notes obtenus par un étudiant :
8, 9, 10, 12, 13, 14, 15 et 16.
L’effectif n = 8 peut s’écrire n = 2p = 2 × 4.
La médiane se situe donc ici entre 12 et 13. L’intervalle 12-13 est appelé intervalle médian. La
médiane peut être choisie au milieu de cet intervalle. Soit Me = 12, 5.
b. Série à variable continue
Pour déterminer la médiane par calcul il convient de suivre la démarche suivante :
– calculer les effectifs cumulés croissants (fréquences cumulées croissantes) ;
– déterminer la classe qui contient la médiane ;
– déterminer la médiane par interpolation linéaire.
Effectif cumulé croissant : ECCc−1 < n/2 < ECCc
Classe médiane : ei < Me < ei+1
avec : ECCc−1 = effectif cumulé croissant de la classe précédent celle de la médiane
ECCc = effectif cumulé croissant de la classe de la médiane.
On écrit alors

M e − ei n/2 − ECCc−1
=
ei+1 − ei ECCc − ECCc−1

9
d’où
ei+1 − ei
Me = ei + × (n/2 − ECCc−1 ).
ECCc − ECCc−1

Graphiquement, le point d’intersection des polygones des effectifs (ou fréquences) cumulés croissants
et des effectifs (ou fréquences) cumulés décroissants a pour abscisse la médiane.

Exercice 2.4 : calculer la médiane Me des durées de dépannages précédentes par calcul et graphique-
ment.

Les quartiles : Les quartiles représentent chacun des modalités qui partagent la série en quatre
groupes comprenant le même nombre d’observations.
– Le premier quartile Q1 est la modalité de la variable qui partage la série de manière à ce que 25%
des observations aient une valeur inférieure et que 75% aient une valeur supérieure. Le calcul est
identique à celui de la médiane.
– Le deuxième quartile correspond à la médiane.
– Le troisième Q3 est la modalité de la variable qui partage la série de manière à ce que 75% des
observations aient une valeur inférieure et que 25% aient une valeur supérieure. Le calcul est
identique à celui de la médiane.

Moyenne (Arithmétique)
Soit X = (xi , ni )1≤i≤p , une série statistique. On appelle moyenne (arithmétique ou moyenne si aucune
confusion n’est à craindre) le nombre m défini par :
p
1X n1 x1 + n2 x2 + . . . + np xp
m = ni xi =
n i=1 n

on note aussi m = X̄ = E(X).

Remarques
p
X
1. X̄ = fi xi
i=1
2. Si les valeurs ont été regroupées en classes statistiques, alors les ni sont supposés regroupés au
centre ci de la classe. On applique alors la définition avec la série (ci , ni ) où ci = centre de
[xi , xi+1 [.

Propriétés : Soient a, b deux réels, X, Y deux séries. On a :

aX¯+ b = aX̄ + b et X +
¯ Y = X̄ + Ȳ ;

on dit que la moyenne est linéaire.

Comparaison du mode, de la médiane, de la moyenne :


Selon l’usage que l’on veut en faire chacun des trois paramètres présente des avantages et des incon-
vénients.

10
– Le mode est facile à déterminer et existe toujours même si le caractère est qualitatif. Mais il
apporte une information réduite, sauf lorsqu’une l’emporte nettement sur les autres. Il dépend
aussi du groupement en classe.
– La moyenne donne une information plus riche qui permet de prendre certaines décisions. Par
exemple, la connaissance de l’espérance de vie des hommes de 40 ans (c’est-à-dire la moyenne
du temps qui leur reste à vivre) permet de fixer les tarifs des cotisations d’assurance vie. Mais
la moyenne est influencée par les valeurs extrêmes.
– La médiane est facile à calculer et elle est très peu influencée par les valeurs extrêmes. C’est un
avantage notamment en économie où les valeurs extrêmes proviennent souvent d’erreurs dans la
collecte de l’information. Il arrive aussi qu’on ne connaisse pas la limite supérieure de la dernière
classe (par exemple propriétés agricoles d’une superficie > 100ha). Dans ce cas on ne peut pas
calculer la moyenne, mais on peut calculer la médiane.

Exercice 2.5
Une station service d’une grande surface a rélevé pendant une semaine, la demande exprimée en litre
de chacun de ses clients. On a obtenu le tableau suivant dans lequel xi désigne le demande en litres
et ni le nombre de clients associés. On suppose que dans chaque classe la répartition de la population
est uniforme.
xi [5,15[ [15,25[ [25,35[ [35,45[ [45,55[ [55,65[ [65,75[ [75,85[
ni 11 45 158 223 273 132 44 4

1. Calculer la moyenne arithmétique.


2. Déterminer les quartiles et faites une interprétation.
3. Calculer le pourcentage des clients dont la demande est comprise entre 30 et 60 litres.
4. Représenter l’histogramme de cette série dans un repère orthogonal. On prendra pour unités
graphiques :
1cm pour 10 litres sur l’axe des abscisses.
1cm pour 20 clients sur l’axe des ordonnées.
5. Déterminer la classe modale et le mode de la série.

2.5.2 Caractéristiques (ou paramètres) de dispersion

Exemple : soit la distribution de salaire suivante dans deux entreprises E1 et E2 :

E1 32 32,80 34,80 36 37,20


E2 28,80 29,20 34,80 35,60 44,40

– On note que les salaires médians de E1 et E2 sont les mêmes : Me = 34, 80.
– De même le salaire moyen est le même dans E1 et E2 : m = 34, 56.
– Cependant on ne peut pas conclure que les entreprises accordent des salaires comparables. Dans
E2 les mesures des salaires sont plus étalées, plus dispersées que dans E1.
– D’où le calcul des paramètres de dispersion.

Etendue : L’étendue de la série appelée intervalle de variation ou range, est la différence entre la
valeur la plus grande et la valeur la plus plus faible prise par la variable.

11
e = valeur maximum - valeur minimum = xp − x1 .

Le calcul est plus simple mais ce paramètre est insuffisant pour étudier la dispersion d’une série statis-
tique en profondeur car il dépend uniquement des valeurs extrèmes qui peuvent être accidentelles.

L’écart interquartile : I = Q3 − Q1
Ce paramètre, qui est la différence entre le troisième et le premier quartile, permet d’estimer la dis-
persion autour des valeurs centrales. En effet, 50% des observations ont leurs valeurs situées dans cet
intervalle.

Variance et écart type


Ce sont les paramètres de dispersion les plus employés.

a. La variance : La variance est la moyenne des carrés des écarts entre les données et leur moyenne
p
1X
arithmétique. Elle est notée et définie par : V = ni (xi − x̄)2 .
n i=1

b. L’écart type : C’est la racine carrée de la variance σ = V .
Un écart type de valeur faible signifie que les données sont fortement concentrées autour de la
moyenne arithmétique. Inversement un écart type de forte valeur signifie que les données sont
très dispersées sur toute l’étendue de la série.
L’intervalle compris entre X̄ − 2σ et X̄ + 2σ contient toujours au moins 75% des observations
du caractère.
p
1X
c. Propriétés : V = ni x2i − (x̄)2
n i=1
V (aX + b) = a2 V (X)
σ(aX + b) = |a|σ(X).
σ(X)
c. Coefficient de variation : c’est le rapport .

e. Définitions : Une variable X est dite réduite si et seulement si sa variance V (X) = 1.
Une variable X est dite centrée si et seulement si sa moyenne X̄ = 0.
Une variable X est dite centrée réduite si et seulement si X̄ = 0 et σ(X) = 1.

Conclusion : La variance ou l’écart type est le meilleur paramètre de dispersion. Il fait intervenir
toutes les données de la série.

12
2.6 Exercices
Exercice 1 :corrigé
Des élèves ont participé à une dictée. Voici le nombre de fautes relevées pour chacun :

8 3 2 6 6 3 1 8 8 8
5 0 5 4 4 1 2 1 9 9
4 8 0 2 2 2 2 5 8 8
8 1 7 8 7 7 8 4 7 7
9 4 3 0 0 4 0 9 3 3

1. Effectuer un dépouillement de ses valeurs.


2. Déterminer la variable et son type. Quelle est la taille de l’échantillon.
3. Déterminer le mode.
4. Déterminier l’étendue.
5. Déterminer la moyenne et l’écart-type.

Exercice 2 :corrigé
une étude sur l’âge des femmes mariées d’un quartier d’une grande ville a fourni les informations
suivantes :

Âge [18 ;28[ [28 ;38[ [38 ;48[ [48 ;58[ [58 ;68[ [68 ;78[ [78 ;88[ [88 ;98[
Effectifs 4 15 16 9 8 4 3 1
1. Décrire cette étude statistique : population, individu, échantillon (taille), variable (type), modal-
ités, classe modale.
2. Calculer les fréquences, puis les fréquences cumulées.
3. Construire un histogramme de la variable âge.
4. Construire le polygone cumulatif des fréquences.
Exercice 3 :corrigé
Le tableau d’effectifs suivant donne le temps de séjour moyen dans une même habitation pour 100
ménages :
Temps de séjour moyen (en année) Nombre de ménages
[0 ;3[ 45
[3 ;5[ 18
[5 ;10[ 16
[10 ;20[ 11
[20 ;50[ 10
1. Préciser quelle est la population étudier et donner sa taille.
2. Quelle est la variable étudiée ? Préciser son type.
3. Calculer les effectifs cumulés associés à cette variable.
4. Calculer la médiane de cette variable.
5. Déterminer les 1er et 3ième quartiles. Que signifie concrètement ces valeurs ?

13
Exercice 4 :corrigé
On donne la série statistique suivante : distribution en février 2009 des salaires (xi ) en milliers de
francs d’une entreprise. Le tableau donne les effectifs (ni ) en fonction des salaires (xi ) :
xi [150 ;160[ [160 ;170[ [170 ;180[ [180 ;190[ [190 ;200[ [200 ;210[ [210 ;220[ [220 ;230[ [230 ;240[
ni 30 20 105 175 120 50 30 15 5
1. Représenter cette série par le diagramme qui convient. Quel est le mode ?
2. Calculer Me la médiane de cette série statistique.
3. Evaluer la masse salariale totale S1 et calculer le salaire moyen.
4. Le conseil d’administration de cette entreprise décide, pour le mois de mars 2009, d’une aug-
mentation de 10 pourcent des salaires puis d’une prime uniforme de 5 300 francs. Soient xi et yi
les salaires en milliers de francs respectivement en février et en mars d’un employé.
a) Exprimer yi en fonction de xi .
b) Quel est le salaire moyen des nouveaux salaires ? Evaluer la nouvelle masse salariale S2 .
c) Sachant que Monsieur X a un salaire égal à 186 800 francs en mars, quel était son salaire en
février ?

Exercice 5 :corrigé
Le repreneur éventuel d’une entreprise de vente par correspondance en difficulté, a demandé à celle-ci
de lui fournir des informations sur la distribution des commandes passées par les clients selon leur
montant. Le service commercial de l’entreprise a retrouvé une étude effectuée sur un échantillon de
250 commandes. Cette étude fournit les résultats suivants :

Montant (xi ) [50 ;200[ [200 ;500[ [500 ;1000[ [1000 ;2000[ [2000 ;5000[ [5000 ;10000[
Effectif (ni ) 36 50 54 52 n5 n6

Les nombres de commande n5 et n6 relatifs aux deux dernières classes sont illisibles. On précise par
ailleurs que le montant moyen des commandes est de x̄ = 1662.
1. Déterminer n5 et n6 .
2. Calculer l’écart-type σ de cette série statistique.
Exercice 6 :corrigé
La direction générale de l’agriculture et de la forêt nous donne la répartition par tranche d’âges des
chefs d’exploitations agricole d’une région.

Classes d’âges Exploitations


[20 ;30[ 2 742
[30 ;40[ 8 063
[40 ;50[ 9 569
[50 ;60[ 10 660
[60 ;70[ 15 913

1. Définir la population étudiée, l’individu et le caractère ainsi que les modalités de celui-ci.
2. Tracer le graphique représentatif de cette série statistique.
3. Etablir le tableau statistique complet (effectifs cumulés croissants et décroissants, fréquences
cumulés croissantes et décroissantes).
4. Quelle est la proportion des chefs d’exploitations qui ont :

14
– Moins de 40 ans.
– Entre 30 et 60 ans.
– Au moins 50 ans.
5. Représenter les polygones cumulatifs des fréquences sur un même graphique.
6. Déterminer par calcul la médiane Me et vérifier graphiquement.

Exercice 7 :corrigé
Dans une entreprise de 200 salariés le salaire mensuel moyen d’un homme est de 1 600 euros avec un
écart-type de 400 euros ; celui d’une femmes est de 1 100 euros avec un écart-type de 300 euros.
1. Sachant que le salaire mensuel moyen d’un salarié quelconque de l’entreprise est de 1 400 euros,
déterminer le nombre d’hommes et de femmes de cette entreprise.
2. Comparer les dispersions des salaires mensuels homme et femme.
Exercice 8 :corrigé
Les produits de la société NATURA Industries sont fabriqués à partir d’extraits naturels de plantes
de la zone sud de la ville de Bobo-Dioulasso. Ces produits se déclinent en :
– produits d’hygiène,
– produits pour le corps,
– produits pour le visage.
Le réseau de distribution est composé d’agents commerciaux et de distributeurs agréés au plan na-
tional et de représentants à l’extérieur du pays.
Dans le but de faire un bilan à mi-parcours, il vous est demandé d’établir le bilan des ventes du premier
semestre de l’année 2012 à partir des tableaux ci-dessous :

Ventes au Burkina Faso pour le premier semestre 2012 (en millions de F CFA) :
Catégorie de produits Centre Nord Sud Ouest Est
Produits pour le visage 42 12 8 17 4
Produits pour le corps 37 20 26 14 11
Produits d’hygiène 18 16 12 19 4

Ventes à l’étranger pour le premier semestre 2012 (en millions de F CFA) :


Catégorie de produits Zone UEMOA Zone Afrique Reste du monde
Produits pour le visage 132 96 36
Produits pour le corps 84 76 12
Produits d’hygiène 24 47 108

1. Présenter dans un tableau les totaux des ventes par catégorie de produits pour le Burkina et
pour l’étranger et le total semestriel par catégorie de produits.
2. Représenter ces totaux semestriels (total semestriel de chaque catégorie de produits) par un
graphique et donner le dominant.

15
Chapitre 3

Séries Statistiques à deux Variables

3.1 Tableau de données, nuage de points


On observe que, dans certains cas, il semble exister un lien entre deux caractères d’une population,
par exemple entre le poids et la taille d’un nouveau né, entre l’épaisseur d’un mur et sa résistance
thermique, entre le chiffre d’affaires et le montant des charges d’une entreprise, entre la consommation
et la vitesse d’une voiture . . .
Pour étudier d’éventuelles liaisons, on est amené à s’intéresser simultanément à deux caractères x et
y d’une même population. On définit une série statistique à deux variables x et y prenant des
valeurs x1 , . . . , xi , . . . , xn et y1 , . . . , yi , . . . , yn .

3.1.1 Tableaux de données

Exemple 1
Le mur d’une habitation est constitué par un paroi en béton et une couche de polystyrène d’épaisseur
variable x (en cm). On a mesuré, pour une même épaisseur de béton, la résistance thermique y de ce
mur en m2 par watt pour différentes valeurs de x. On a obtenu les résultats suivants :

xi 2 4 6 8 10 12 15 20
yi 0,83 1,34 1,63 2,29 2,44 2,93 4,06 4,48

Exemple 2
Pour un certain type de véhicule, on a relevé les consommations moyennes et les vitesses correspon-
dantes suivantes :

vitesse xi en km/h 10 20 30 40 50 60 70 80 90
consommation yi en l/100km 16,5 11,5 9,0 7,5 6,8 6,6 7,0 7,5 9,0

3.1.2 Nuage de points

Le plan étant muni d’un repère orthogonal, nous pouvons associer au couple (xi , yi ) de la série
statistique double le point Mi de coordonnées xi et yi .
L’ensemble des points Mi obtenus constitue le nuage de points représentant la série statistique.
Dans l’exemple 1, on obtient le nuage suivant : exercice
Dans l’exemple 2, on obtient le nuage suivant : exercice

16
Le nuage étant dessiné, on peut essayer de trouver une fonction f telle que la courbe d’équation
y = f (x) «passe le plus près possible» des points du nuage : c’est le problème d’ajustement.
Dans l’exemple 1, on peut penser que, en première approximation, il est possible de tracer une droite
D au voisinage de ces six points. On dit alors que l’on a un ajustement affine.
Dans l’exemple 2, un ajustement affine ne convient pas ; on peut penser à «approcher» le nuage par
une parabole.
Dans ces deux exemples, on vient d’ observer qu’il y’a un lien (en statistique, on dit une corrélation)
entre les points, donc entre leurs coordonnées xi et yi .
Ce n’est pas toujours le cas : on trouve des nuages dont les points sont dispersés de façon quelconque,
lorsqu’il n’existe aucun lien entre xi et yi ; par exemple, xi est la taille et yi le nombre de frères et
soeurs d’un individu d’un groupe donné.

3.1.3 Point moyen

Lorsqu’on pense pouvoir réaliser un ajustement affine d’un nuage, il peut sembler intéressant, avant
de tracer la droite, de placer le point dont l’abscisse est la moyenne des abscisses xi et l’ordonnée, la
moyenne des ordonnées yi .

Définition
On appelle point moyen d’un nuage de n points Mi de coordonnée (xi , yi ) le point G de coordonnées :
n n
1X 1X
xG = x̄ = xi et yG = ȳ = yi
n i=1 n i=1

Dans l’exemple 1, vérifier que le point moyen est G(9, 625; 2, 5)

3.2 Ajustement Affine


3.2.1 Ajustement à la règle

Dans l’exemple 1, on se propose, à partir des mesures effectuées, de faire des prévisions de résistance
pour d’autres épaisseurs. Un moyen d’y parvenir est de tracer au jugé une droite D passant le plus
près possible des points du nuage, d’équation de la forme y = ax + b .
Pour réaliser le tracé de D, on peut utiliser une règle transparente et la disposer suivant la direction
constatée, en s’efforçant d’équilibrer les nombres de points situés de part et d’autre suivant les abscisses
croissantes.

3.2.2 Ajustement Affine par la méthode de Mayer

Partageons le nuage de l’exemple 1 en deux nuages de quatre points tels que 2 ≤ xi ≤ 8 pour le
premier, et 10 ≤ xi ≤ 20 pour le second. Déterminer les valeurs approchées, arrondies à 10−2 , des
coordonnées des points moyens G1 et G2 de ces deux nuages partiels.
La droite (G1 G2 ), ou droite de Mayer, constitue une «bonne» droite d’ajustement dans le cas où le
nuage est allongé.
Vérifier qu’une équation de (G1 G2 ) est y = 0, 21x + 0, 47.

17
Quelle résistance thermique peut-on espérer obtenir avec une couche de polystyrène de 10 centimètres
d’épaisseur ?
Remarque : La droite de Mayer passe toujours par le point moyen du nuage.
Le vérifier sur cet exemple.

3.2.3 Ajustement Affine par la méthode des Moindres Carrés

On considère une série statistique à deux variables représentée, dans un repère d’origine O, par un
nuage de n points Mi (xi , yi ) paraissant justifier un ajustement affine.
Le problème est de déterminer quelle droite est susceptible de remplacer «au mieux» ce nuage de
points.

a) Covariance d’une série statistique double

La covariance de la série statistique double de caractères x et y est le nombre réel


n
1X
cov(x, y) = (xi − x̄)(yi − ȳ)
n i=1

Il existe une autre formule, plus commode pour les calculs


n
1X
cov(x, y) = xi yi − x̄ȳ
n i=1

b) Equations de droites de régression

On montre que :
La droite de régression D de y en x a pour équation y = ax + b où le coefficient directeur est

cov(x, y)
a= et où b vérifie ȳ = ax̄ + b
V (x)

La droite D passe donc par le point G(x̄, ȳ) du nuage.

La droite de régression D0 de x en y a pour équation x = a0 y + b0 où le coefficient directeur est

cov(x, y)
a0 = et où b0 vérifie x̄ = a0 ȳ + b0
V (y)

La droite D0 passe donc elle aussi par le point G(x̄, ȳ) du nuage.

Exemple 3
Une entreprise fabrique et vend des lots de circuits électroniques. Le tableau suivant indique le pour-
centage y de circuits d’un lot qui ont une panne au cours de x semestres d’utilisation :

xi 1 2 3 4 5 6 7 8 9 10
yi 0 2 4 8 11 14 17 20 23 27

Déterminer une équation de la droite de régression de y en x.

18
c) Coefficient de Corrélation Linéaire

Afin d’apprécier la qualité d’un ajustement affine, nous allons introduire un nouveau paramètre.

Définition
Le coefficient de corrélation linéaire d’une série statistique double de variables x et y est le nombre r
cov(x, y)
défini par : r =
σ(x) × σ(y)

Propriétés
1. r est un nombre réel, qui est du même signe que cov(x, y) ;
cov(x, y) cov(x, y)
2. Puisque a = et a0 = , alors cov(x, y), r, a et a0 sont de même signe ;
V (x) V (y)
3. On admet que −1 ≤ r ≤ 1.
Remarque.
1. Il existe une «bonne» (ou une «forte») corrélation entre x et y lorsque |r| est suffisamment voisin
de 1.
2. Dans chaque secteur technologique ou économique, on choisit pour quelles valeurs de r la corréla-
tion est jugée suffisante pour pouvoir effectuer un ajustement affine par la méthode des moindres
carrés.
3. Pour |r| ≥ 0, 70, on admettra que l’on peut effectuer un ajustement affine.

19
3.3 Exercices
Exercice 1 :corrigé
Dans la série statistique ci-dessous, deux valeurs ont été effacées. On connait par contre, le point
moyen G par ses coordonnées : xG = 7, 5 et yG = 12, 6.
xi 8,2 7,4 6,1 9
Pouvez-vous retrouver les valeurs manquantes ?
yi 15 12,1 16,3 12
Exercice 2 :corrigé
Le tableau ci-dessous donne le montant annuel des dépenses du régime général de la société sociale,
en milliards de franc de l’année 1991 à l’année 2000.
Rang de l’année xi 1 2 3 4 5 6 7 8 9 10
Dépense yi 147,42 155,35 165,10 170,13 182,33 183,09 189,95 194,83 203,37 222,27
1. a) Dessiner le nuage de points Mi (xi , yi ) dans un repère orthogonal adapté.
b Déterminer les coordonnées de G, point moyen du nuage. Placer le point G.
2. Le modèle étudié dans cette question sera appelé «droite de Mayer»
a) G1 désigne le point moyen des 5 premiers points du nuage et G2 celui des 5 derniers points.
Déterminer les coordonnées de G1 et G2 . Placer ces points sur le graphique précédent et tracez
la droite (G1 G2 ). Le point G appartient t-il à cette droite ?
b) Donner l’équation de la droite (G1 G2 ) sous la forme y = ax + b
10
X
c) Calculer la somme des carrés des résidus pour cet ajustement : S1 = [yi − (axi + b)]2
i=1
Exercice 3 :corrigé
Lors d’une étude statistique sur une série double portant sur 12 points, on a obtenu :
X X X X X
xi = 117; yi = 22, 2; xi yi = 255, 8; x2i = 1421; yi2 = 46, 74

1. Calculer les coordonnées du point moyen


2. Calculer la variance de x, celle de y, et la covariance de x et y.
Exercice 4 :corrigé
Le propriétaire d’une pompe d’essence se propose de rechercher s’il existe une liaison entre le nombre
de litres achetés et la puissance des véhicules de ses clients. Pour cela il relève pour dix voitures de
tourisme le nombre de litres achetés (Y) et le nombre de chevaux fiscaux (X) du véhicule. Il obtient
les observations suivantes :
X 4 4 5 6 7 6 10 8 5 5
Y 10 13 20 25 10 15 38 30 12 15
1. Construire le nuage de points de cette série double.
Origine (4,10). Unités : 2cm pour un chiffre ; 1cm pour 2 litres.
2. Par la méthode des moindres carrés, déterminer la droite d’estimation de Y en X.
3. Calculer le coefficient de correlation linéaire de cette série.
Un ajustement linéaire est-il justifier ?
4. Estimer la puissance d’un véhicule dont le propriétaire a demandé 33 litres.

Exercice 5 :corrigé
L’observation de la comptabilté analytique de l’entreprise STATIC nous donne les renseignements
suivants en milliers de francs.

20
Chiffres d’affaires annuel Charges totales
608 632
688 656
752 664
832 680
928 688
512 616
448 600
544 616

1. Représenter la série par un nuage de points.


2. Calculer le coefficient de corrélation linéaire entre le chiffre d’affaire et les charges. Interpréter.
3. Déterminer l’équation de la droite de régression linéaire par la méthode des moindres carrés et
la représenter sur le graphique.
4. Calculer le montant des charges sur un chiffre d’affaire de 900 000 francs.

Exercice 6 :corrigé
Le tableau suivant donne l’évolution des frais de publicité xi et du chiffre d’affaire yi d’une entreprise
pendant huit années consécutives. xi et yi sont exprimés en millions d’euros.

Rang de l’année xi yi
1 2 52
2 2,3 59
3 2,6 60
4 2,9 65
5 3,2 70
6 3,5 72
7 3,8 73
8 4,1 75

1. Construire le nuage de points représentant cette série dans un repère convenablement choisi (xi
en abscisse, yi en ordonnée).
2. On se propose de procéder à un ajustement affine de ce nuage. on considère les points moyens G1
et G2 des sous-nuages obtenus respectivement pour les quatre premières valeurs et les quatres
dernières. Préciser les coordonnées de G1 et G2 . Tracer la droite (G1 G2 ).
3. Exprimer l’équation de cette droite.
4. (a) Vérifier que les valeurs de xi sont des termes successifs d’une suite arithmétique dont on
précisera la raison. En admettant que cette évolution se poursuive, déterminer le montant
des frais de publicité pour l’année de rang 10.
(b) Estimer graphiquement, au million d’euros près, le chiffre d’affaire prévisible de cette en-
treprise pour l’année de rang 10, en supposant que l’évolution observée entre les années de
rang 1 et 8 se poursuive les années suivantes.

Exercice 7 :corrigé
Le tourisme en Europe en 19x est résumé par le tableau ci-après :

21
Pays Nombre de touristes (millions) x Recette (dizaines de millions de francs) y
Allemagne 4.9 45
Espagne 4.1 7
France 5.5 40
Italie 8.6 50
Suisse 4.6 25
1. Représenter le nuage de points et indiquer si un ajustement linéaire est vraisemblable.
2. Etablir les équations des droites de régression de y en fonction de x et de x en fonction de y.
3. Calculer le coefficient de corrélation linéaire r entre x et y.
4. Estimer les recettes totales pour un pays qui accueille 8.2 millions de touristes.
Estimer le nombre de touristes acceuillis par un pays qui a réalisé 375 millions de recettes
globales.
Exercice 8
On a procédé à l’ajustement affine d’un nuage de points (X, Y ). Les équations obtenues sont les
suivantes :
Droite d’ajustement de Y en X,
D : Y = X + 30

Droite d’ajustement de X en Y ,
1
D0 : X = Y + 60
4
1. Calculer le coefficient de corrélation linéaire.
2. Calculer les moyennes arithmétiques de X et Y .
3. Calculer la covariance entre X et Y sachant que la variance de Y est égale à 40.
4. Calculer la variance de X.
Exercice 9 :
Une maison d’édition a ouvert le 1er Janvier 2002 sur internet, un site de vente par correspondance.
Le tableau suivant donne l’évolution du nombre de livres vendus par mois en milliers.
Mois Janvier 2002 Janvier 2003 Juillet 2003 Janvier 2004 Avril 2004
Rang du mois xi 1 13 19 25 28
Nbre de livre yi 1,2 2,5 3,5 5,1 6
1. Représenter le nuage de points (xi , yi ) dans un repère (unités graphiques : 1cm représente deux
mois en abscisse et 1cm représente 500 livres en ordonnée).
2. l’allure du nuage permet d’envisager un ajustement exponentiel plutôt qu’un ajustement affine.
Pour cela, on pose : zi = ln(yi ). Après l’avoir recopié, completer le tableau suivant où zi est
Rang du mois xi 1 13 19 25 28
arrondi 10−3 .
zi = ln(yi ) 1,253
3. a) Calculer le coefficient de corrélation linéaire de r(x, z) de x et z. Conclure.
b) Ecrire une équation de la droite d’ajustement affine (D) de z en x par la méthode des moindres
carrés. les coefficients seront arrondis à 10−2 .
4. Déduire de la question précédente une relation entre y et x. Les coefficients seront arrondis à
10−2
5. En supposant que cette évolution se poursuive de cette façon :
a) donner une estimation du nombre de livres qui seront vendus en janvier 2005 ;

22
b) à partir de quel mois peut-on prévoir que le nombre de livres vendus dépassse 13 000 ?
Exercice 10 : :corrigé
Une machine est achetée à 3 000 euros. Le prix de revente y, exprimer en euros, est donné en fonction
du nombre x d’années d’utilisation par le tableau suivant :

xi 0 1 2 3 4 5
yi 3 000 2 400 1920 1356 1229 983

Ajustement affine
1. Représenter le nuage de points associé à la série statistique (xi , yi ) dans un repère orthogonal
du plan. Les unités graphiques sont 2cm pour une année sur l’axe des abscisses et 1cm pour 200
euros sur l’axe des ordonnées.
2. Calculer le pourcentage de dépréciation du prix de revente après les trois premières années
d’utilisation.
3. Donner une équation de la droite de régression (∆) de y en x obtenue par la méthode des
moindres carrés.
4. Représenter la droite (∆) dans le repère précédent.
Ajustement exponentiel
On pose z = ln y et on admet qu’une équation de la droite de régression de z en x est z = −0, 22x+8, 01.
1. Déterminer une expression de y en fonction de x de la forme y = Ax .B où A est un réel arrondi
à 10−2 et B est un réel arrondi à l’unité.
2. En admettant que y = 0, 80x .3011, déterminer après combien d’années d’utilisation le prix de
revente devient inférieur ou égal à 500 euros.
Comparaison de deux ajustements
Après 6 années d’utilisation le prix de revente d’une machine est de 780 euros. Des deux ajustements
précédents, quel est celui qui semble le mieux estimer le prix de revente après 6 années d’utilisation ?

Exercice 11
L’objet de cet exercice est de déterminer un prix d’équilibre.
Partie A
Une étude statistique a permis de réléver les résultats suivants, où xi représente le prix de vente
unitaire en euros et yi la quantité demandée, en centaines d’unités, de ce produit.

Prix unitaire en euros xi 1.1 1.25 1.4 2 2.45 3


Quantité en centaines yi 9.75 8.50 4.50 3.00 2.60 2.50

1. Représenter le nuage de points de cette série.


Vu la disposition des points, on ne cherche pas à remplacer ce nuage par une droite, c’est à dire
à réaliser un ajustement affine. On effectue le changement de variable Yi = ln yi où ln désigne la
fonction logarithme népérien.
2. Compléter, après l’avoir reproduit, le tableau de valeurs dans lequel les valeurs de Yi seront
arrondies à 10−2 .
xi 1.1 1.25 1.4 2 2.45 3
Yi = ln yi 2.28 2.14

23
3. Donner le coefficient de corrélation linéaire r de la série statistique (xi , Yi ). On donnera la
valeur décimale approchée arrondie à 10−2 . Le résultat trouver permet d’envisager un ajustement
affine ?
4. Donner par la méthode des moindres carrées une équation de la droite d’ajustement de Y en
x sous la forme Y = ax + b ; on donnera une valeur approchée de a arrondie à 10−2 et b sera
arrondie à l’entier.
5. En déduire une estimation de la quantité demandée y, en centaines d’unités, en fonction du prix
unitaire x, sous la forme y = ke−αx où k et α sont des constantes ; k est à arrondir à l’entier.
6. En déduire la quantité demandée que l’on peut estimer pour un prix unitaire de 2.92 euros. On
donnera la valeur arrondie à une unité près.

Partie B : recherche du prix d’équilibre.


Dans cette partie on considère que la demande exprimée en centaines d’unités pour un prix unitaire
de x euros en f (x), où f est la fonction définie sur l’intervalle [1; 3] par f (x) = 20.e−0.7x . De mème
l’offre exprimer en centaines d’unités pour un prix unitaire x en euros est g(x), où g est la fonction
définie sur l’intervalle [1; 3] par g(x) = 0.15x + 2.35.
1. On désigne par f 0 la fonction dérivée de f .
(a) Calculer f 0 (x). En déduire le sens de variation de f sur l’intervalle [1; 3].
(b) Tracer sur la figure précédente les représentations graphiques (C) et (∆) des fonctions f et
g.
(c) Déterminer graphiquement en faisant apparaitre les tracés utiles, une valeur approchée,
arrondie à 10−1 , de l’abscisse du point d’intersection de (C) et (∆).
2. Soit la fonction h définie sur l’intervalle [1; 3] par h(x) = f (x) − g(x).
(a) Etudier le sens de variation de la fonction h sur l’intervalle [1; 3].
(b) En déduire, en justifiant, que l’équation h(x) = 0, admet dans l’intervalle [1; 3] une solution
unique, notée σ, dont on donnera la valeur décimale approchée arrondie à 10−2 .
(c) Donner, à 10−2 près, le prix d’équilibre en euros, c’est-à-dire le prix pour lequel l’offre et la
demande sont égales. Calculer l’offre correspondant au prix d’équilibre.

24
Chapitre 4

Indices Statistiques

25

Vous aimerez peut-être aussi