Vous êtes sur la page 1sur 8

Statistiques `

a deux variables

EXERCICE 1. etude statistique


On utilisera les fonctions de la calculatrice. Le d
etail des calculs nest pas demand
e.
Une etude statistique a permis de relever les resultats suivants, o`
u xi represente le prix de vente unitaire en
euro et yi la quantite demandee, en centaines dunites, de ce produit.
Prix unitaire en euros xi

1,1

1,25

1,4

2,45

Quantite en centaines yi

9,75

5,50

4,50

3,00

2,60

2,50

Le plan est rapporte `


a un rep`ere orthogonal (O, i , j ) dunites graphiques : 5 cm pour 1 euro en abscisse
et 1 cm pour 1 centaine dunites en ordonnee. Le nuage de points Mi , de coordonnees (xi ; yi ) est represente
sur la feuille annexe. Vu la disposition des points, on ne cherche pas `a remplacer ce nuage par une droite,
cest-`
a-dire `
a realiser un ajustement affine.
On effectue le changement de variable Yi = ln yi o`
u ln designe la fonction logarithme neperien.
1) Recopier et completer le tableau avec les valeurs de Yi qui seront arrondies `a 102 pr`es.
2) Donner le coefficient de correlation lineaire r de la serie statistique (x, ; Yi ). On en donnera la valeur
decimale approchee `
a 102 pr`es par defaut. Le resultat trouve permet denvisager un ajustement affine.
3) Donner, par la methode des moindres carres, une equation de la droite de regression de Y en x sous la
forme Y = ax + b ; on donnera la valeur decimale approchee de a `a 102 pr`es par defaut, b sera arrondi
a lentier le plus proche.
`
4) En deduire une estimation de la quantite demandee yi en centaines dunites, en fonction du prix unitaire
x, sous la forme y = k ex o`
u k et sont des constantes ; k sera arrondi `a lentier le plus proche.
5) En deduire la quantite demandee que lon peut estimer pour un prix unitaire de 2,90 euros. On donnera
la valeur arrondie `
a une unite pr`es.

EXERCICE 2. Une societe veut vendre des machines destinees `a certaines entreprises. Le prix de vente
minimal est fixe `
a 10000 euros. Le nombre previsible, y, de machines vendues, est fonction du prix propose,
en millier deuros, x. Une enquete aupr`es de clients potentiels a donne les resultats suivants :

xi : prix propose pour une machine en milliers deuros

10

12,5

15

17,5

20

yi : nombre previsible de machines vendues au prix propose

100

85

62

42

28

25
11

1)
1.1) Representer les six points du nuage sur le graphique.
yi
1.2) On pose zi = ln(
). Donner les valeurs de zi arrondies au milli`eme le plus proche.
zi 6
1.3) Donner une equation de la droite de regression de z en x ; les coefficients seront arrondis au
milli`eme le plus proche.
1.4) En deduire une expression approchee de y de la forme y = (x 6)ex .

EXERCICE 3. Une entreprise fabrique et commercialise un produit rare. Sa production mensuelle, qui
ne peut exceder 7 tonnes, est notee X (en tonnes) le co
ut total de cette production mensuelle est note Y (en
100Y
MF). On rappelle que 1 MF = 106 F. On pose : Z = e 25 . On a etabli le tableau suivant :

19,2

20,1

27,5

32,2

40,6

57,3

25,33

24,43

18,17

15,06

10,76

5,52

1) Calculer, `
a 103 pr`es, les coefficients de correlation lineaire entre X et Y dune part, entre X et Z
dautre part, et commenter les resultats obtenus,
2) Determiner une equation de la droite de regression de Z en X. (On arrondira chacun des coefficients
a 102 pr`es).
`
3) Utiliser le resultat de la question precedente pour obtenir une expression de Y en fonction de X.

EXERCICE 4. Avant la commercialisation dun nouveau syst`eme dalarme, la societe SECUPRO realise
une enquete aupr`es des entreprises de la region Rhone-Alpes afin de determiner le nombre dacheteurs
potentiels du logiciel en fonction de son prix de vente. Les resultats de cette enquete sont donnes dans le
tableau suivant :
xi : prix en centaine deuros

12

15

18

yi : nombre dacheteurs potentiels

200

100

50

20

10

Lallure du nuage de points de la serie (xi ; yi ) conduit `a poser zi = ln yi .


1) Completer apr`es lavoir reproduit le tableau suivant, en arrondissant les valeurs de zi au milli`eme le
plus proche :
xi

12

15

18

zi = ln yi
2) Donner la valeur arrondie `
a 103 pr`es du coefficient de correlation lineaire de la serie. Un ajustement
affine est-il justifie ?
3) Determiner une equation de la droite de regression de z en x, sous la forme z = ax + b, a sera arrondi
au centi`eme le plus proche et b arrondi `a lentier le plus proche.
4) Deduire, du resultat obtenu `
a la question precedente, une expression de y en fonction de x. Utiliser
cette expression pour estimer le nombre dacheteurs potentiels du logiciel si le prix de vente est de
1000 euros.
EXERCICE 5. On a releve le chiffre daffaires annuel dune societe depuis 8 ans. Les resultats sont
donnes dans le tableau suivant, o`
u xi est le rang de lannee et yi le chiffre daffaires correspondant, en
millions deuros.
Annees

1996

1997

1998

1999

2000

2001

2002

2003

Rang de lannee : xi

Chiffre daffaires annuel : yi

7,5

9,2

11

18,3

22,5

31

43

On renonce a` un ajustement affine pour ce nuage de points. On effectue le changement de variable zi = ln yi


(ln designe le logarithme neperien).
1)
1.1) Completer, apr`es lavoir reproduit, le tableau suivant dans lequel on fera figurer les valeurs
approchee de zi , arrondies `
a 103 .

Rang de lannee : xi
zi = ln yi

1,609

1.2) Determiner, `
a laide dune calculatrice, le coefficient de correlation lineaire r de la serie statistique
(xi ; zi ). Arrondir r `
a 103 . Le resultat obtenu permet denvisager un ajustement affine.
2) Determiner, `
a laide dune calculatrice, lequation de la droite de regression de z en x sous la forme
z = ax + b, o`
u a et b sont `
a arrondir `a 103 .
3) En deduire une expression de y en fonction de x de la forme y = ekx o`
u et k sont des constantes `
a
arrondir `
a 103 .
4) En deduire une estimation, arrondie `a 101 du chiffre daffaires de lentreprise, en millions deuros,
pour lannee 2004.
EXERCICE 6. Les poids moyens en grammes dembryons de lapins observes apr`es t jours de gestationsont
les suivants
:
ti

14

16

18

20

22

24

26

28

30

pi

0,16

0,37

0,94

1,61

2,52

11

25

40

60

1) Construire le nuage de points


: t en abscisse, p en ordonnee; on choisira convenablement les unites. Un
ajustement lineaire vous semble -t-il justifie?
2) On introduit la variable auxiliaire yi = ln pi
2.1) Construire le nouveau nuage de points (ti ;yi )
2.2) Determiner le coefficient de correlation lineaire.
2.3) Ajuster ce nuage de points au moyen dune droite par la methode des moindres carres.
2.4) En deduire lexpression de p (poids de lembryon de lapin ) en fonction de t. Quelle prevision
peut-on faire pour t=34 jours.

EXERCICE 7. Une chane de magasins commercialise ces lampes de salon ; elle souhaite etudier levolution
du nombre de lampes vendues en fonction du nombre de magasins dans lesquels la lampe est proposee. Le
tableau suivant presente cette evolution.

Nombre de magasins xi
Nombre de lampes vendues yi

15
60

40

70

90

100

150

254

362

504

615

810

On decide dajuster cette serie statistique `a deux variables par la methode des moindres carres.
1) Determiner `
a laide de la calculatrice le coefficient de correlation de cette serie. Est-on dans des
conditions satisfaisantes pour realiser un ajustement affine ?
2) Determiner `
a la calculatrice une equation de la droite de regression de y en x sous la forme y = mx + p
avec m et p arrondis `
a 102 pr`es.
3) En deduire une estimation du nombre de lampes vendues, si la chane presente celles-ci dans 400 magasins.
EXERCICE 8.
Les parties A, B et C sont independantes. Toutes les valeurs arrondies seront donnees `a 103 pr`es.
Partie A
En France, le nombre dabonnements `
a lInternet haut debit est donne, en millions, dans le tableau suivant :

Periode

1er trimestre 2003

2e trimestre 2003

trimestre 2003

4e trimestre 2003

x = rang de la periode

y = nombre dabonnements en millions

2,236

2,450

2,790

3,524

(*) source ART Autorite de Regulation des Telecommunications.


1) Recopier et completer le tableau suivant, les resultats seront arrondis au milli`eme.
x rang de la periode

z = ln y

2) Donner le coefficient de correlation de z en x. Que peut-on en conclure ?


3) Determiner, par la methode des moindres carres, une equation de la droite dajustement de z en x.
Aucun calcul intermediaire nest exige.
4) En supposant la meme progression de lInternet haut debit, estimer le nombre dabonnements en millions
au troisi`eme trimestre 2004.
5) Exprimer y en fonction de x sous la forme y = AeBx o`
u A et B sont des reels arrondis au milli`eme.
Partie B
En janvier 2003, une enquete dans une universite a montre que 7 % des etudiants disposaient personnellement
de lInternet haut debit. On interroge 100 etudiants. On suppose que leffectif de luniversite est suffisamment
important pour que les interrogations soient considerees comme independantes. Soit X la variable aleatoire
qui mesure le nombre detudiants disposant de lInternet haut debit.
1) Expliquer pourquoi X suit une loi binomiale et preciser ses param`etres .
2) Calculer la probabilite P (X = 5).
3) On admet que X peut etre approchee par une variable X1 suivant une loi de Poisson.
3.1) Quel est le param`etre de cette loi de Poisson ?
3.2) Determiner les probabilites P (X1 = 5) et P (X1 > 7).
3.3) Determiner la probabilite quil y ait au plus 5 etudiants disposant de lInternet haut debit.
Partie C
En septembre 2004, une enquete semblable a montre que 50 % des etudiants disposaient de IInternet haut
debit. On interroge 100 etudiants. Soit Y la variable aleatoire qui mesure le nombre detudiants disposant
de lInternet haut debit.
1) Expliquer pourquoi Y suit une loi binomiale et preciser ses param`etres.
2) On admet que Y peut etre approchee par une variable aleatoire Y1 suivant une loi normale.
2.1) Justifier que Y1 suit la loi normale N(50 ; 5).
2.2) Determiner la probabilite P (45 Y1 55).
2.3) Determiner la probabilite quil y ait au moins 40 etudiants disposant de lInternet haut debit. On
calculera P (Y1 39, 5).
EXERCICE 9. Ajustement affine
Un institut de recherche demographique a etudie levolution de la population dune grande ville. Les resultats
de cette etude sont donnes dans le tableau suivant o`
u ti designe le rang de larmee et o`
u pi designe leffectif
de la population, en millions dhabitants au cours de la meme annee.
Rang de lannee : ti

10

15

20

25

Effectif : pi

5,6

6,1

6,8

7,6

8,4

On renonce `
a un ajustement affine pour ce nuage de points. On effectue le changement de variable yi = ln pi (ln
designe le logarithme neperien).

4
1) Completer, apr`es lavoir reproduit, le tableau suivant dans lequel les valeurs approchees sont `a arrondir
a 103 .
`
Rang de lannee : ti

10

15

20

25

yi = ln pi

2) Determiner, `
a laide dune calculatrice, le coefficient de correlation lineaire de la serie statistique (ti , yi ).
Arrondir `
a 103 .
3) Determiner, `
a laide dune calculatrice, une equation de la droite de regression de y en t sous la forme
y = at + b, o`
u a et b sont `
a arrondir `
a 103 .
4) En deduire une expression de p en fonction de t de la forme p = ekt o`
u la constante sera arrondie `
a
1
2
10 et la constante k sera arrondie `
a 10 .
5) A laide du resultat du 4., donner une estimation de leffectif de la population lannee de rang 35.
Arrondir `
a 101 .
EXERCICE 10.
Les deux parties de cet exercice peuvent
etre trait
ees de fa
con ind
ependante.
A. Ajustement affine
On a releve les valeurs, en tonnes, de loffre et de la demande de ce produit pour differents prix de la tonne.
Les resultats figurent dans le tableau suivant :
Prix de la tonne, en euros : xi

10

10,5

11

11,7

13

15

17

Demande, en tonne : yi

11,5

10,5

9,9

9,1

7,9

6,5

5,1

Offre, en tonne : zi

3,5

4,5

4,9

5,3

5,8

6,2

6,5

1) On pose Yi = ln yi et Zi = ezi . Completer, apr`es lavoir reproduit, le tableau de valeurs dans lequel les
valeurs approchees sont `
a arrondir `
a 103 .
xi

10

10,5

11

11,7

13

15

17

Yi = ln yi
Zi = ezi

2)
2.1) Determiner, `
a laide de la calculatrice, une equation de la droite de regression de Y en x sous la
forme Y = ax + b o`
u a est `
a arrondir `a 102 et b `a 101 .
2.2) En deduire une expression de y en fonction de x.
3)
3.1) Determiner, `
a laide de la calculatrice, une equation de la droite de regression de Z en x sous la
0
forme Z = a x + b0 o`
u a0 et b0 sont `a arrondir `a lunite.
3.2) En deduire une expression de z en fonction de x.
EXERCICE 11. Une entreprise fabrique des chaudi`eres de deux types :

des chaudi`eres dites hh a


` cheminee ii,

des chaudi`eres dites hh `


a ventouse ii.
Les quatre parties de cet exercice peuvent
etre trait
ees de fa
con ind
ependante.

A. Ajustement affine
Le nombre de chaudi`eres fabriquees lors des annees precedentes est donne par le tableau suivant :
Rang de lannee : xi

Nombre de chaudi`eres fabriquees par milliers : yi

15,35

15,81

16,44

16,75

17,19

17,30

5
1) A laide dune calculatrice, determiner:
1.1) le coefficient de correlation lineaire de la serie statistique double de variables x et y; arrondir `
a
2
10 ;
1.1) determiner une equation de la droite de regression de y en x, sous la forme y = ax + b, o`
u a sera
arrondi `
a 103 et b sera arrondi `a lunite.
2) En supposant que la tendance observee se poursuive pendant deux annees, estimer le nombre de
chaudi`eres qui seront fabriquees lannee de rang 7.

B. Probabilites conditionnelles
Lentreprise a fabrique en un mois 900 chaudi`eres `a cheminee et 600 chaudi`eres `a ventouse. Dans ce lot, 1 %
des chaudi`eres `
a cheminee sont defectueuses et 5 % des chaudi`eres `a ventouse sont defectueuses. On prel`eve
au hasard une chaudi`ere dans la production de ce mois. Toutes les chaudi`eres ont la meme probabilite detre
prelevees.
On consid`ere les ev`enements suivants :

A:

hh

La chaudi`ere est `
a cheminee ii;

B:

hh

La chaudi`ere est `
a ventouse ii;

D:

hh

La chaudi`ere presente un defaut ii.

1) Determiner P (A), P (B), P (D/A) et P (D/B).


2) Calculer P (D A) et P (D B).
3) En remarquant que D = (D A) (D B) et que les evenements D A et D B sont incompatibles,

calculer P (D) et P (D).


C. Loi normale
Soit X la variable aleatoire qui, `
a chaque chaudi`ere `a cheminee prelevee au hasard dans la production, associe
sa duree de fonctionnement en annees. On admet que X suit la loi normale de moyenne 15 et decart type
3. Une chaudi`ere est dite hh amortie iisi sa duree de fonctionnement est superieure ou egale `a 10 ans.
Calculer la probabilite quune chaudi`ere prelevee au hasard dans la production soit hh amortie ii; arrondir `
a
103 .

D. Intervalle de confiance
On consid`ere un echantillon de 100 chaudi`eres prelevees au hasard dans un stock important. Ce stock est
assez important pour quon puisse assimiler ce tirage `a un tirage avec remise. On constate que 94 chaudi`eres
sont sans aucun defaut.
1) Donner une estimation ponctuelle de la frequence inconnue p des chaudi`eres de ce stock qui sont sans
aucun defaut.
2) Soit F la variable aleatoire qui, `
a tout echantillon de 100 chaudi`eres prelevees au hasard et avec remise
dans ce stock, associe la frequence des chaudi`eres de cet echantillon qui
r sont sans aucun defaut.
p(1 p)
, o`
u p est la frequence
On suppose que F suit la loi normale de moyenne p et decart type
100
inconnue des chaudi`eres du stock qui sont sans aucun defaut.
Determiner un intervalle de confiance de la frequence p avec le coefficient de confiance 95 %. Arrondir
les bornes `
a 102 .
3) On consid`ere laffirmation suivante : hh la frequence p est obligatoirement dans lintervalle de confiance
obtenu a` la question 2 ii.
Est-elle vraie ? (On ne demande pas de justification.)
EXERCICE 12. Ajustement affine Une etude a ete realisee sur le solde moyen des comptes courants
dentreprises clientes dun important groupe bancaire. Les resultats de cette etude sont donnes dans le
tableau suivant : x designe un montant en centaines de milliers deuros, n designe le nombre de milliers
dentreprises qui ont un compte courant dont le solde est superieur ou egal `a x.

0,3

0,6

0,9

1,2

1,5

1,81

0,79

0,32

0,15

0,078

0,031

1) Completer apr`es lavoir reproduit le tableau suivant dans lequel les valeurs approchees sont `a arrondir
a 102
`
x

0,3

0,6

0,9

1,2

1,5

1,81

0,79

0,32

0,15

0,078

0,031

z = ln n
2) Determiner, `
a laide de la calculatrice, une equation de la droite de regression de z en x sous la forme
z = ax + b, o`
u a et b sont `
a arrondir `a 102 .
3) En deduire une expression de n en fonction de x de la forme n = ekx o`
u la constante k sera arrondie
a 102 .
`
4) A laide du resultat du 3, donner une estimation du nombre dentreprises dont le compte courant a un
solde moyen superieur ou egal `
a 250000 euros.
EXERCICE 13. Afin detudier la vitesse de dilution dune substance toxique dans latmosph`ere, des
prel`evements sont effectues ; le tableau ci-dessous donne la concentration en substances, exprimee en
particules par litre (p.p.l), ainsi que le temps, exprime en heures :
Temps : t en heures

10

12

14

Concentration : y en p.p.l.

192

111

47

34

11

1) Representer le nuage de points associe `a cette serie double (t,y).


2) En posant z = ln y, donner dans un tableau les valeurs de la se rie double (t,z) ( ln designe le logarithme
neperien).
3) Calculer le coefficient de correlation lineaire de cette se rie (t,z), on donnera les resultats fournis par la
machine concernant la moyenne et lecart-type des series t et z.
4) Determiner une equation de la droite dajustement de z en t, obtenue par les methode des moindres
carres.
5) Deduire de la question precedente une relation liant t en y de la forme y = BAt
6) Evaluer le temps au bout duquel la concentration est de 40 p.p.l. Ve rifier graphiquement le resultat.

EXERCICE 14. Une serie de mesures sur un echantillon de 7 individus, portant sur lanalyse de 2
caract`eres x et y, a donne les resultats suivants :
x

1,08

1,18

1,26

1,31

1,39

1,44

1,46

1,70

1,88

2,04

2,19

2,31

2,40

2,51

1) Calculer le coefficient de correlation lineaire entre les deux variables x et y. Y-a-t-il presomption de
correlation ?
2) Etablir, par la methode des moindres carres, lequation de la droite de regression de y en x.
3) Quelle prevision peut-on faire de la valeur y si x prend la valeur 2 ?
Remarque
: La coherence des resultats depend, en partie, de la precision des calculs effectues.

EXERCICE 15. La Federation Francaise de Franchise a publie le nombre de franchises etablis en France
entre 2000 et 2005. Le tableau suivant, o`
u ti designe le rang de lannee, donne, en milliers, le nombre yi de
ces franchises, au premier janvier de chaque annee.
Annee

2000

2001

Rang de lannee : ti

Nombre de franchises : yi

30,63

31,781

2002

2003

2004

2005

34,745

36,773

39,51

3
33,26

1) On effectue le changement de variable : xi = t2i . Completer, apr`es lavoir reproduit, le tableau suivant
:
xi = t2i
yi

30,63

31,781

33,26

34,745

36,773

39,51

2) Determiner, `
a laide dune calculatrice, le coefficient de correlation lineaire de la serie statistique de
variables x et y. Arrondir `
a 102 .
3)
3.1) Determiner, `
a laide dune calculatrice, une equation de la droite de regression de y en x, sous la
forme y = ax + b, o`
u a et b sont `a arrondir `a 103 .
3.2) En deduire une expression de y en fonction de t.
4) A laide de la question precedente :
4.1) Donner une estimation du nombre de franchises installes en France au premier janvier 2008 ;
4.2) Estimer lannee au cours de laquelle, le nombre de franchises installes en France depassera, pour
la premi`ere fois, les 60000.