Vous êtes sur la page 1sur 29

S3 – STATISTIQUES INFERENTIELLES – TD et Exercices CORRIGES

I. LOIS DISCRETES

TD1 : Reconnaître et utiliser une loi hypergéométrique


On pioche simultanément 8 lettres dans l'alphabet, puis on les inspecte une par une.
Le succès, pour une lettre tirée, est : "c'est une voyelle".
La variable aléatoire X donne, à l'issue de l'expérience, le nombre de succès.

a. Justifier que X suit une loi hypergéométrique et donner ses paramètres.


* L’univers est partitionné en un événement et son contraire (succès = voyelle ; échec =
consonne). N = 26, a = 6.
* Le tirage des lettres s’effectue sans remise et l’ordre n’importe pas.
* Au bout de 8 essais (n = 8), X désigne le nombre de succès.

La loi de X est donc H(8 ; 6 ; 26).

b. Calculer p(X = 0), p(X = 4), p(X = 8).


C 0 × C8 C 4 × C4
p ( X = 0 ) = 6 8 20 ≈ 0, 0806 ; p ( X = 4 ) = 6 8 20 ≈ 0, 0465 ; p ( X = 8 ) impossible
C26 C26

c. Calculer l'espérance et l'écart type de X , puis interpréter l'espérance.


a 6 a (N − a ) N − n 6 × 20 18
E ( X ) = n = 8 × ≈ 1, 846 ; V ( X ) = n = 8× × ≈ 1, 0225
N 26 N 2
N−1 262 25
σ ( X ) = V ( X ) ≈ 1, 0112
L’espérance montre que le plus probable est d’obtenir deux voyelles en piochant simultanément 8
lettres dans l’alphabet. En moyenne : 1,846 succès par pioche.

d. Représenter graphiquement cette loi de probabilité (bâtons)


TD2 : Reconnaître et utiliser une loi binomiale
Une roue de type "roulette" est divisée en 26 secteurs de même taille. 6 secteurs sont blancs et les
autres sont rouges. Après avoir fait tourner la roue, le succès est : "elle s'arrête sur un secteur blanc".
La variable aléatoire X donne, à l'issue de 8 essais d'affilée, le nombre de succès.

a. Justifier que X suit une loi binomiale et donner ses paramètres.


* L’univers est partitionné en un événement et son contraire (succès et échec).
* A chaque essai, la probabilité de succès est invariable : p = 6/26.
* Au bout de 8 essais (n = 8), X désigne le nombre de succès.

La loi de X est donc B(8 ; 6/26).

b. Calculer p(X = 2). Obtenir sur la calculatrice la liste des probabilités de toutes les valeurs de X.
k 8−k
 6   20 
Formulaire : p(X = k) = C kn × p k × qn − k ; dans les conditions de l’exercice : = C8k ×   ×   ;
 26   26 
2 6
 6   20 
ainsi : p(X = 2) = C28 ×   ×   ≈ 0,3089.
 26   26 
Sur la calculatrice :
On saisit manuellement les valeurs k possibles en List1 : 0, 1, 2, 3, 4, 5, 6, 7, 8
On saisit la formule générale en List2 : 8CList1*(6/26)^List1*(20/26)^(8-List1)

c. Représenter graphiquement cette loi de probabilité (bâtons)

d. Calculer l'espérance et l'écart type de X, puis interpréter ces valeurs.

E(X) = np = 8×6/26 ≈ 1,846 ; σ(X) = npq ≈ 1,192


On s’attend à 1,846 succès, en moyenne, tous les 8 essais.
L’événement « 2 succès » est donc le plus probable.

En ajoutant et en retranchant l’écart type à la moyenne, on construit un intervalle qui englobe les
événements « de loin » les plus probables.
Ici, l’intervalle formé est, en arrondissant, [0,6 ; 3], qui englobe les valeurs 1, 2 et 3.
Dans la grande majorité des cas, nous aurons 1, 2 ou 3 succès en 8 essais.
TD3 : Utiliser une loi de Poisson
La loi de la variable aléatoire X est binomiale de paramètres n = 50 et p = 0,06.

a. Calculer (liste calculatrice) p(X = i) pour i entier de 0 à 7.

On saisit manuellement les valeurs i demandées en List1 : 0, 1, 2, 3, 4, 5, 6, 7


On saisit la formule générale en List2 : 50CList1*0,06^List1*0,94^(50-List1)

b. Justifier l'approximation de cette loi par une loi de Poisson dont on déterminera le paramètre.

Donc il existe une loi de Poisson dont les résultats sont proches de la réalité.
λ = np = 3. La loi de Poisson à utiliser est la loi P(3).

c. Donner, à l'aide de la table de la loi de Poisson, les probabilités demandées plus haut.
Comparer à celles obtenues par une loi binomiale.

Dans la table de la loi de Poisson, on peut lire :

On remarque de légers décalages avec les probabilités


trouvées en question a., mais ces deux listes sont similaires.

d. En utilisant la formule page précédente (loi de Poisson), obtenir ces probabilités sur une nouvelle
liste de votre calculatrice.

On saisit la formule générale en List3 : e^(-3)*3^List1÷List1!


Exercice 1
Le rayon fruits d'une enseigne de grande distribution propose 24 espèces de fruits, dont 8 sont de
label bio. Un contrôle consiste à choisir au hasard 10 espèces de fruits. La variable aléatoire X donne
le nombre d'espèces bio sélectionnées, parmi les 10.

1) Donner, en justifiant, la loi de probabilité de X.


Pour une espèce sélectionnée, il y a deux issues : bio (succès) ou pas bio (échec).
On suppose que les dix espèces à sélectionner doivent être différentes, donc nous avons un tirage
sans remise. a = 8, N = 24, n = 10.
X compte les succès au bout de 10 essais. La loi de X est donc H(10 ; 8 ; 24).

2) Calculer l'espérance mathématique et l'écart-type de X.


E(X) = 10×8/24 = 3,333 espèces bio.
V(X) = 10×8/24×16/24×14/23 = 1,3527. σ(X) = 1,163 espèce bio

3) Quelle est la probabilité que moins de deux espèces sélectionnées soient bio ?
p(X < 2) = p(X = 0) + p(X = 1) = 0,0041 + 0,0467 = 0,0508.

Exercice 2
Un automobiliste rencontre sur son trajet 5 feux tricolores à la suite, identiques dans leurs durées :
le feu vert dure 40 secondes, le feu orange/rouge dure 20 secondes.
Malheureusement, ces feux ne sont pas synchronisés, et l'état de l'un n'a aucune influence sur l'état
du suivant.

1) Lorsque l'automobiliste arrive au niveau du premier feu, quelle est la probabilité que celui-ci soit
vert ?
Sur une plage d'une minute, le feu vert dure les deux tiers du temps.
A un instant quelconque indéterminé, le feu a 2 chances sur 3 d'être vert. p = 2/3

2) Déterminer la probabilité pour que, dans son trajet, il ait rencontré tous les feux au vert.
Ici, on répète 5 fois de suite la même expérience.
A chaque fois, la probabilité de succès est p, 2/3.
On désigne par X la variable aléatoire comptant le nombre de succès (feux verts) sur 5 tentatives.
Alors la loi de X est B(5 ; 2/3)
5 0 5
2 1 2
p ( X = 5 ) = C ×   ×   =   ≈ 0, 1317
5
5
3 3 3

3) Quelle est la probabilité pour qu'il ait eu un et un seul feu rouge ?


Au moins deux feux rouges ?
4 1 4
2 1 2 1
p ( X = 4 ) = C ×   ×   = 5 ×   × ≈ 0, 3292
4
5
3 3 3 3
p ( X ≤ 3) = 1 − p ( X = 5) − p ( X = 4 ) ≈ 0, 5391

4) A combien de feux verts peut-il s'attendre, en moyenne, à chaque trajet ?


E(X) = np = 5×2/3 = 3,333 feux verts environ, en moyenne.
Exercice 3
Le pouvoir germinatif d'une graine d'une certaine espèce est 0,8 (probabilité de germer).
1) On sème 8 graines. Quelle est la probabilité pour que…
a) 5 graines exactement germent ?
On répète 8 fois la même expérience, dont le succès a pour probabilité p = 0,8.
X sera la v.a. comptant le nombre de graines germées sur les 8 semées.
Alors la loi de X est B(8 ; 0,8).
p ( X = 5 ) = C 85 × ( 0, 8 ) × ( 0, 2 ) ≈ 0, 1468
5 3

b) Au moins 7 graines germent ?


p ( X ≥ 7 ) = C78 × ( 0, 8 ) × ( 0, 2 ) + C88 × ( 0, 8 ) × ( 0, 2 ) ≈ 0, 5033
7 1 8 0

2) Quand une graine est germée, la probabilité pour que les limaces détruisent le jeune plant est 0,4.
a) Calculer la probabilité pour qu'une graine semée donne un plant bon à repiquer.
Il faut, pour une graine, l'événement "la graine germe ET sachant qu'elle a germé, les limaces
ne le détruisent pas". (on pourrait aussi construire un arbre, dont seule une des branches nous
intéresse ici)
La probabilité cherchée est 0,8×0,6 = 0,48.
b) Combien devra-t-on semer de graines pour que la probabilité d'avoir au moins un plant bon à
repiquer soit supérieure à 0,99 ?
La variable aléatoire Y compte ici les plants bons à repiquer (psuccès = 0,48) parmi n graines
semées. La loi de Y est B(n ; 0,48).
L'événement contraire de celui de la question est plus simple :
Il faut que p(Y = 0) soit inférieure à 0,01.
p (Y = 0 ) < 0, 01 ⇔ Cn0 × ( 0, 48 ) × ( 0, 52 ) < 0, 01
0 n

ln ( 0, 01 )
⇔ 1 × 1 × ( 0, 52 ) < 0, 01 ⇔ n >
n

ln ( 0, 52 )
On doit donc avoir n > 7,042, il faut semer au moins 8 graines.

Exercice 4
D'après un sondage, 80 % des acheteurs d'un produit A se déclarent satisfaits.
Sur un groupe de 10 acheteurs du produit, choisis au hasard, quelle est la probabilité que :

a. Tous soient satisfaits ?


La probabilité p qu'un acheteur pris au hasard soit satisfait est 80% = 0,8.
Si on choisit 10 acheteurs, on répète 10 fois l'expérience à l'identique.
Soit X la variable aléatoire comptant le nombre d'acheteurs satisfaits sur les 10,
alors la loi de X est B(10 ; 0,8).
p ( X = 10 ) = C10
10 × ( 0, 8 ) × ( 0, 2 ) = ( 0, 8 )
10 0 10
≈ 0, 1074

b. 80 % soient satisfaits ?
p ( X = 8 ) = C10 × ( 0, 8 ) × ( 0, 2 ) = 45 × ( 0, 8 ) × ( 0, 2 ) ≈ 0, 3020
8 8 2 8 2

c. Au moins 80 % soient satisfaits ?


p ( X ≥ 8 ) = p ( X = 8 ) + p ( X = 9 ) + p ( X = 10 ) = 0, 3020 + C10 × ( 0, 8 ) × ( 0, 2 ) + 0, 1074 ≈ 0, 6778
9 9 1
Exercice 5
6 % des français sont clients de l'opérateur de téléphonie mobile "MAUVE".
Lors d'un sondage, on interroge 50 français sur leur opérateur de téléphonie mobile. La population
étant très grande, on peut assimiler le choix de ces 50 personnes à un tirage avec remise.
La variable aléatoire X donne le nombre de clients de "MAUVE" parmi ces 50 personnes.

1) a. Donner, en justifiant, la loi de probabilité de X.


Pour chaque personne il y a deux issues : client (p = 0,06) (succès) ou pas client (q = 0,94).
La probabilité de succès est invariable sur les 50 personnes interrogées et X compte le nombre
de succès sur 50 essais. La loi de X est donc B(50 ; 0,06).
b. Quelle est la probabilité que la proportion de 6 % soit respectée à l'issue du sondage ?
6% de 50 personnes = 3 personnes. p(X = 3) = 0,2311
c. Quelle est la particularité de la probabilité trouvée à la question précédente ?
C'est la probabilité la plus forte, car E(X) = 50×0,06 = 3
d. Quelle est la probabilité qu'aucune des 50 personnes ne soit cliente de "MAUVE" ?
p(X = 0) = 0,04533
e. Quelle est la probabilité qu'il y ait au moins 4 clients de "MAUVE" ?
p(X ≥ 4) = 1 - p(X ≤ 3) = 1 - 0,6473 = 0,3527

2) Ici, on ne connaît pas le nombre de personnes que l'on va interroger. Combien de personnes
faudrait-il interroger pour que la probabilité qu'il y ait au moins un client de "MAUVE" dépasse 99 % ?
p(X = 0) < 0,01 ssi 0,94n < 0,01 ssi n > ln(0,01)/ln(0,94) ssi n > 74,43
Il faut interroger au moins 75 personnes.

Exercice 6
Le nombre de micro-ordinateurs vendus chaque jour dans le magasin HIGHTECH suit la loi de Poisson
de paramètre 4. Calculez la probabilité que dans une journée :

a. On ne vende aucun ordinateur


p ( X = 0 ) ≈ 0, 01832
b. On vende au moins 1 ordinateur
p ( X ≥ 1) = 1 − p ( X = 0 ) ≈ 0, 98168
c. On vende 2 ordinateurs
p ( X = 2 ) ≈ 0, 14653

Exercice 7 (Déterminez X, n, p, justifiez la loi de Poisson)


Lors d'un sondage national portant sur un grand nombre d'individus, seulement 2 % des personnes
acceptent de ne pas rester anonymes.
Le sondeur a répété 250 fois la même expérience : choisir au hasard une personne, dans une
population très grande, avec une probabilité de succès (accepte de ne pas rester anonyme) quasi
fixe de 2% = 0,02. La v.a. X compte le nombre de succès au bout de ces 250 essais. Alors la loi de X
est B(250 ; 0,02).
Vérifions les conditions de passage à une loi de Poisson :
n > 30 ? Oui ; p < 0,1 ? Oui ; npq < 10 ? npq = 250×0,02×0,98 = 4,9 < 10
B(250 ; 0,02) peut donc être approximée par P(5).
Sachant que l'un des sondeurs a interrogé 250 personnes, calculez la probabilité que :

a. Ces 250 personnes souhaitent rester anonymes


p ( X = 0 ) ≈ 0, 00674
b. Au moins 5 personnes acceptent de ne pas rester anonymes.
p ( X ≥ 5) = 1 − p ( X = 0 ) − p ( X = 1) − p ( X = 2 ) − p ( X = 3) − p ( X = 4 ) ≈ 0, 5595

Exercice 8
Une boîte contient 250 allumettes. Elle a été exposée à l’humidité, si bien que 20% des allumettes
sont inutilisables : elles ne s’allumeront pas.
On choisit au hasard 10 allumettes. Le nombre total (250) étant beaucoup plus grand, on pourra
assimiler ce tirage comme étant avec remise. La variable aléatoire X désigne le nombre de celles qui
s’allumeront, parmi les 10.

1. Montrer que la loi de X est binomiale et donner ses paramètres et son espérance.
Lorsqu'une allumette est choisie, le succès (elle s'allume) a pour probabilité p = 0,8 (et q = 0,2).
On tire avec remise n = 10 allumettes et X compte le nombre k de succès parmi les 10.
La loi de X est donc B(10 ; 0,8). E(X) = np = 8.

2. Calculer la probabilité des événements suivants :


a. Aucune ne s’allume
p ( X = 0 ) = C100 × 0, 80 × 0, 210 = 0, 210 ≈ 10−7

b. Toutes s’allument
p ( X = 10 ) = C10
10
× 0, 810 × 0, 20 = 0, 810 ≈ 0, 1074

c. Au moins trois ne s’allument pas


p ( X < 8 ) = 1 − p ( X > 7 ) = 1 − p ( X = 8 ) − p ( X = 9 ) − p ( X = 10 )
= 1 − 0, 3020 − 0, 2684 − 0, 1074 ≈ 0, 3222

3. a. Déterminer les probabilités ci-dessus en se basant sur une loi de Poisson de paramètre λ bien
choisi.
λ = E(X) = 8
p(X = 0) = 0,00034
p(X = 10) = 0,09926 et p(X < 8) = p(X = 0) + p(X = 1) + ... + p(X = 7) = 0,45296

b. Expliquer les différences observées entre les résultats des questions 2. et 3.a.
La loi de Poisson est plutôt inexacte, car les conditions d'approximation de la loi binomiale vers
une loi de Poisson ne sont pas respectées :
il faut n > 30, or n = 10, il faut p < 0,1, or p = 0,8…
Par contre, npq < 10 est respectée, car npq = 1,6.
Exercice 9
Dans une population très nombreuse, on rencontre en moyenne 0,4 % de non-voyants.

1) Dans un échantillon de 100 personnes, quelle est la probabilité de n'avoir aucun non-voyant ?
Qu'il y en ait au moins 2 ?
On répète 100 fois la même expérience : choisir un individu au hasard avec une probabilité
p = 0,4% = 0,004 qu'il soit non-voyant (succès).
La population étant très grande, on considère que p est invariable, ce qui signifie que le tirage est
assimilé "avec remise" et qui nous autorise une loi binomiale.
Soit X la v.a. qui compte le nombre de non-voyants sur les 100 personnes.
La loi de X est B(100 ; 0,004).
p ( X = 0 ) = C100 × ( 0, 004 ) × ( 0, 996 ) = ( 0, 996 )
0 100 100
0
≈ 0, 6698
p ( X ≥ 2 ) = 1 − p ( X = 0 ) − p ( X = 1) = 1 − 0, 6698 − C100 × ( 0, 004 ) × ( 0, 996 ) ≈ 0, 06123
1 1 99

2) Répondre à ces questions en justifiant puis utilisant la loi de Poisson appropriée.


n > 30 ; p < 0,1 ; npq = 0,3984 < 10. Donc B(100 ; 0,004) est à peu près P(0,4)
D'après la table de la loi de Poisson (λ = 0,4) :
p ( X = 0 ) ≈ 0, 6703
p ( X ≥ 2 ) = 1 − p ( X = 0 ) − p ( X = 1) = 1 − 0, 67032 − 0, 26813 ≈ 0, 06155
Ces résultats, légèrement faussés, sont tout de même très proches de la réalité (binomiale).
S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

II. LOI NORMALE

TD5 : Lecture de la table de la loi normale centrée réduite


en vert : ce qui est directement lisible dans la table du formulaire
« = » en rouge : on retourne le problème : p(U > -) = p(U < +) ou p(U < -) = p(U > +)

p(U < 1) = 0,8413


p(U < 1,96) = 0,9750
p(U < 2,58) = 0,9951
p(U > 1) = 1 - p(U < 1) = 1 - 0,8413 = 0,1587
p(U > 1,63) = 1 - p(U < 1,63) = 1 - 0,9484 = 0,0516
p(U > 0,35) = 1 - p(U < 0,35) = 1 - 0,6368 = 0,3632
p(1 < U < 2) = p(U < 2) – p(U < 1) = 0,9772 - 0,8413 = 0,1359
p(0,42 < U < 1,07) = p(U < 1,07) – p(U < 0,42) = 0,8577 - 0,6628 = 0,1949
p(U < -1) = p(U > 1) = 1 - p(U < 1) = 1 - 0,8413 = 0,1587
p(U < -0,88) = p(U > 0,88) = 1 - p(U < 0,88) = 1 - 0,8106 = 0,1894
p(U > -0,5) = p(U < 0,5) = 0,6915
p(U > -2,23) = p(U < 2,23) = 0,9871
p(-1,85 < U < -1,07) = p(1,07 < U < 1,85) = p(U < 1,85) – p(U < 1,07) = 0,1101
p(-1,12 < U < 0,6) = p(U < 0,6) – p(U < -1,12) = p(U < 0,6) – p(U > 1,12)
= p(U < 0,6) – (1 - p(U < 1,12)) = 0,5943

TD6 : Calculs de probabilités dans le cas général


Déterminer les probabilités demandées, dans les lois normales données :

1. loi de X : N(50 , 10). Calculer p(X < 60), p(X < 43), p(45 < X < 55)
60 − 50
p(X < 60) = p(U < ) = p(U < 1) = 0,8413
10
43 − 50
p(X < 43) = p(U < ) = p(U < -0,7) = 1 – p(U < 0,7) = 0,2420
10
45 − 50 55 − 50
p(45 < X < 55) = p( <U< ) = p(-0,5 < U < 0,5)
10 10
= p(U < 0,5) – p(U < -0,5) = p(U < 0,5) – (1 - p(U < 0,5)) = 0,3830

2. loi de X : N(3 , 0,45). Calculer p(X > 4), p(X < 2,55), p(3,2 < X < 3,7)
4 −3
p(X > 4) = p(U > ) = p(U > 2,22) = 1 - p(U < 2,22) = 0,0132
0, 45
2, 55 − 3
p(X < 2,55) = p(U < ) = p(U < -1) = 1 – p(U < 1) = 0,1587
0, 45
3, 2 − 3 3, 7 − 3
p(3,2 < X < 3,7) = p( <U< ) = p(0,44 < U < 1,56)
0, 45 0, 45
= p(U < 1,56) – p(U < 0,44) = 0,9406 – 0,6700 = 0,2706
TD7 : Passage de lois discrètes à une loi normale
Justifiez le passage à une loi normale, puis calculez les probabilités :

1. 30 % des PME d'une région exportent. Si on choisit 80 PME au hasard, quelle est la
probabilité que plus de 30 exportent ?

* On choisit une entreprise : elle exporte (succès, p = 0,3) ou non (échec, q = 0,7).
* p est invariable d’une entreprise à une autre, car on imagine que le nombre total
d’entreprises du secteur est très grand et qu’interdire la répétition ne modifie que très peu
la proportion d’entreprises qui exportent, au fur et à mesure du choix de 80 d’entre elles.
* X est le nombre d’entreprises qui exportent, sur un choix aléatoire de 80 entreprises.
La loi de X est donc : B(80 ; 0,3).

* n > 30 ? OUI, n = 80
* npq > 5 ? OUI, npq = 16,8
Donc : B(80 ; 0,3) ≈ N(24 ; 4,1)

30 − 24
p(X > 30) = p(U > ) = p(U > 1,46) = 1 – p(U < 1,46) = 0,0721
4, 1

Quelle est la probabilité que 30 exportent ?

Pour la probabilité d’une valeur ponctuelle, on aura tendance à utiliser directement la loi
80 × 0, 3 × 0, 7
binomiale : p(X = 30) = C30 ≈ 0,03285.
30 50

Il existe aussi un moyen d’utiliser la loi normale :


29, 5 − 24 30, 5 − 24
p(X = 30) = p(29,5 < X < 30,5) = p( <U< ) = p(1,34 < U < 1,585)
4, 1 4, 1
= p(U < 1,585) – p(U < 1,34) = 0,9435 – 0,9099 = 0,0336

2. Le nombre d'articles vendus journellement est distribué suivant une loi de Poisson de
paramètre 25. Quelle est la probabilité, un jour donné, que moins de 20 articles soient vendus ?

La loi de X est : P(25)


* λ > 20 ? OUI, λ = 25
Donc : P(25) ≈ N(25 ; 5)

20 − 25
p(X < 20) = p(U < ) = p(U < -1) = 1 – p(U < 1) = 0,1587
5
Exercice 10 (avec solutions)
La variable X “masse (kg) d’un nouveau-né” est distribuée selon la loi N(3,1 ; 0,5).
1. Quelle est la probabilité qu’un nouveau-né pèse plus de 4 kg ?
changement de variable : U = (X – 3,1)/0,5 est distribuée selon la loi N(0 ; 1).
Avec x = 4 : u = (4 – 3,1)/0,5 = 1,8 ; table : F(1,8) = p(U < 1,8) = 0,9641.
réponse : p(X > 4 kg) = p(U > 1,8) = 1 – 0,9641 = 0,0359.
2. Quelle est la probabilité qu’un nouveau-né pèse moins de 3 kg ?
changement de variable : U = (X – 3,1)/0,5 est distribuée selon la loi N(0 ; 1).
Avec x = 3 : u = (3 – 3,1)/0,5 = -0,2 ; table : F(0,2) = p(U < 0,2) = 0,5793.
réponse : p(X < 3 kg) = p(U < -0,2) = 1 - p(U < 0,2) = 1 – 0,5793 = 0,4207.
3. Quelle est la probabilité qu’un nouveau-né pèse entre 3 et 4 kg ?
formule de l’intervalle : p(a < X < b) = p(X < b) – p(X < a).
réponse : p(3 < X < 4) = p(X < 4) – p(X < 3) = 0,9641 – 0,4207 = 0,5434.

Exercice 11
1. La variable U est distribuée selon la loi N(0 ; 1).
a. Calculer :
* p(U < 0,86) = 0,8051 * p(U > 1,96) = 1 – 0,975 = 0,025
* p(U > -1,39) = p(U < 1,39) = 0,9177
* p(-0,63 < U < 0,63) = p(U < 0,63) – p(U < -0,63) = p(U < 0,63) – (1 - p(U < 0,63))
= 2p(U < 0,63) – 1 = 0,4714
b. Donner la valeur u0 telle que :
* p(U < u0) = 0,8944 : u0 = 1,25 (table)
* p(-u0 < U < u0) = 0,98 ⇔ 2p(U < u0) – 1 = 0,98 ⇔ p(U < u0) = 0,99 ⇔ u0 = 2,33

2. La variable X est distribuée selon la loi N(25 ; 7).


a. Calculer :
35, 5 − 25
* p(X > 35,5) = p(U > ) = p(U > 1,5) = 1 – p(U < 1,5) = 1 – 0,9332 = 0,0668
7
18 − 25
* p(X < 18) = p(U < ) = p(U < -1) = 1 – p(U < 1) = 1 – 0,8413 = 0,1587
7
b. Donner la valeur x0 telle que : p(X > x0) = 0,0516
p(U > u0) = 0,0516 ⇔ p(U < u0) = 0,9484 ⇔ u0 =1,63
x 0 − 25
= 1,63 ⇔ x0 = 25 + 1,63×7 = 36,41
7
Exercice 12
Une société fabrique des gyrophares pour tous types d’engins, en grandes quantités.
La probabilité qu’un gyrophare soit défectueux est p = 0,04.
Au cours de la production, on prélève un échantillon aléatoire de 600 gyrophares. X est la variable
aléatoire qui donne le nombre de gyrophares défectueux parmi ces 600.
1. Montrer que la distribution de la variable X est binomiale et donner ses paramètres.
Chaque gyrophare est soit défectueux (succès), soit non, avec une probabilité de succès
invariable : p = 0,04. La variable X est le nombre de succès parmi 600 articles.
Donc, la loi de X est B(600 ; 0,04).
2. Montrer qu’on peut approximer cette loi par une loi normale.
n > 30 (600) et npq > 5 (23,04), donc une loi normale approche correctement cette loi
binomiale.
3. Déterminer µ et σ, moyenne et écart type de la variable X selon cette loi normale.
np = 24 et npq = 4,8. La loi normale est N(24 ; 4,8).
4. Calculer alors, avec la precision premise par la table, la probabilité d’avoir au moins 27
gyrophares défectueux parmi les 600.
27 − 24
p(X > 27) = p(U > ) = p(U > 0.625) = 1 – 0,734 = 0,266
4, 8

Exercice 13
Un agent commercial doit faire du démarchage par téléphone. En moyenne, un appel sur cinq
conduit à une commande.
1. Soit X la variable aléatoire “nombre de commandes passes après 60 appels”.
a. Donner le nom et les paramètres de la loi de probabilité de X.
Un appel se conclut par une commande (succès) ou pas. La probabilité de succès,
invariable, est p = 1/5 = 0,2. Donc, la loi de X est binomiale : B(60 ; 0,2).
b. Justifier que cette loi peut être approximée par une loi normale, dont on donnera
les paramètres.
n > 30 (60) et npq > 5 (9,6), donc nous pouvons utiliser une loi normale à la place de la
loi binomiale. np = 12 et npq = 3,098. La loi normale est N(12 ; 3,098).
c. En utilisant cette loi normale, calculer les probabilities suivantes :
15 − 12
* p(X > 15) = p(U > ) = p(U > 0,97) = 1 – 0,8340 = 0,1660
3, 098
10 − 12
* p(X < 10) = p(U < ) = p(U < -0,65) = 1 – 0,7422 = 0,2578
3, 098
* p(X = 12) peut être calculée avec la loi normale ou avec la loi binomiale.
N(12 ; 3,098) : p(X = 12) = p(11,5 < X < 12,5) = p(-0,16 < U < 0,16) = 0,1272
B(60 ; 0,2) : p(X = 12) = C1260 0, 2120, 848 = 0,1278
2. Quel est le nombre minimal d’appels qu’on doit passer pour avoir au moins 75% de
chances d’obtenir au moins 15 commandes ?
Avec n appels, la loi de X est B(n ; 0,2), approximée par N(0,2n ; n × 0, 2 × 0, 8 ), c’est à
dire N(0,2n ; 0,4 n ). Le changement de variable, entre X et U, est :
X − 0, 2n
U= .
0, 4 n
D’un autre côté, la table de la loi normale centrée réduite nous informe que u0 doit être
inférieur à -0,68 pour que p(U > u0) dépasse 75%.

x0 − 0, 2n
Nous devons donc avoir < -0,68 ⇔ 0,2n – 0,272 n – 15 > 0.
0, 4 n
On peut tester quelques valeurs de n, ou résoudre cette équation (on pose n = N², et on
résoud 0,2N² - 0,272N – 15 > 0).
On trouve que n doit être supérieur à 87,73 :
Il faut passer 88 appels pour avoir 75% de chances d’obtenir au moins 15 commandes.

Exercice 14
On suppose qu’en moyenne on se fait contrôler une fois tous les 20 voyages en bus.
M.A fait 800 voyages par an.
1. Quelle est la probabilité que M.A. soit contrôlé entre 30 et 50 fois dans l’année ?
Chaque voyage conduit à un contrôle (succès, probabilité invariable : p = 1/20 = 0,05) ou non.
Soit X le nombre aléatoire de contrôles durant 800 trajets. La loi de X est B(800 ; 0,05).
n > 30 (800) et npq > 5 (38), donc nous sommes en droit d’utiliser une loi normale à la
place de la loi binomiale. np = 40 et npq = 6,164. La loi normale est N(40 ; 6,164).
p(30 < X < 50) = p(-1,62 < U < 1,62) = 2×0,9474 – 1 = 0,8948

2. M.A voyage toujours sans billet. L’abonnement annuel serait 320 €.


A combien la compagnie doit-elle fixer l’amende pour qu’au moins 75% des fraudeurs aient
meilleur compte de prendre un abonnement ? 99% ?
75% : Cherchons le nombre de contrôles x0 que l’on a 75% de chances de dépasser :
p(U > u0) = 0,75 donne u0 = -0,675 et, par changement de variable : x0 = 35,84.
75% des gens seront contrôlés au moins 35 fois.
Donc, 35 amendes doivent coûter plus cher que l’abonnement (320 €), soit une amende de
9,15 €.

99% : Cherchons le nombre de contrôles x0 que l’on a 99% de chances de dépasser :


p(U > u0) = 0,99 donne u0 = -2,33 et, par changement de variable : x0 = 25,66.
99% des gens seront contrôlés au moins 25 fois.
Donc, 25 amendes doivent coûter plus cher que l’abonnement (320 €), soit une amende de
12,80 €.
S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

III. ECHANTILLONNAGE

TD8 : Distributions d'échantillonnages


1. Dans une population normale de moyenne 120 et d’écart type 40,
on prélève des EAS de tailles n = 10 et n = 50.

a. Quelle loi suit la distribution d'échantillonnage des moyennes des échantillons de taille 10 ? 50 ?

Soit X la variable « valeur d’un individu quelconque dans la population », de loi N(120 ; 40).
La variable X désigne donc la valeur moyenne d’un échantillon quelconque de n individus.
40
En EAS, la loi de X est N(120 ; ).
n
Pour n = 10 : N(120 ; 12,65) et pour n = 50 : N(120 ; 5,657).

b. Représenter schématiquement ces deux distributions de moyennes sur un même graphique.

(la plus étalée est celle dont l’écart type est le plus grand)

c. Quelle est la probabilité pour qu'un échantillon de taille 10 ait une moyenne supérieure à 130 ?

130 − 120
p( X > 130) = p(U > ) = p(U > 0,79) = 1 – p(U < 0,79) = 1 - 0,7852 = 0,2148
12, 65

d. Même question pour un échantillon de taille 50.

130 − 120
p( X > 130) = p(U > ) = p(U > 1,77) = 1 – p(U < 1,77) = 1 – 0,9616 = 0,0384
5, 657
2. Dans la population mondiale, on a compté environ 3,38 milliards de femmes contre 3,12
milliards d'hommes. P est la v.a. donnant la proportion de femmes dans les échantillons de taille
100 personnes.

a. Quelle est la loi de probabilité de P ?

3, 38
La proportion de femmes dans le monde était alors : π = = 0, 52 .
6, 5
Considérant que l’on est en EAS (manifestement, la population est plus de 20 fois plus
grande que l’échantillon), la loi de P est :
 π (1 − π )   0, 52 × 0, 48 
N π ,  = N  0, 52 ;
  = N ( 0, 52 ; 0, 04996 ) .
 n   100 
 
(on attend majoritairement des échantillons contenant 52% de femmes, plus ou moins 5%)

b. Quelle est la probabilité que dans un échantillon de 100 personnes il y ait plus d'hommes que
de femmes ?

Cette situation signifie P < 0,5.


0, 5 − 0, 52
p(P < 0,5) = p(U < ) = p(U < -0,40) = 1 – p(U < 0,40) = 1 – 0,6554 = 0,3446.
0, 04996
Il y a 34,46% de chances que notre échantillon contienne plus d’hommes que de femmes.

Exercice 15
Dans une chaîne de fabrication d’ampoules électriques, on admet que la durée
de vie d’une ampoule est une variable aléatoire normale de moyenne 900
heures et d’écart type 80 heures.
Calculer la probabilité pour que dans un échantillon aléatoire simple de 100
ampoules la durée de vie moyenne des ampoules dépasse 910 heures.

Soit X la variable "durée de vie d'une ampoule", de loi N(900 ; 80).


X désignera donc la "durée de vie moyenne d'un échantillon de 100 ampoules" et sa loi est
N(900 ; 80/√100) = N(900 ; 8).
p( X > 910) = p(U > (910-900)/8) = p(U > 1,25) = 1 - p(U < 1,25) = 1 - 0,8944 = 0,1056

Exercice 16
Un candidat a obtenu 55 % des suffrages exprimés à une élection.
1) Quelle est la probabilité d'avoir, dans un échantillon de 100 personnes, moins de 50 % de voix ?

La proportion de personnes ayant voté pour le candidat, dans les échantillons de taille 100,
est une variable aléatoire réelle P dont la loi est N (0,55 ; √(0,55×0,45/100)) = N (0,55 ; 0,04975)
p(P < 0,5) = p(U < (0,5-0,55)/0,04975) = p(U < -1,005) = 1 - 0,8425 = 0,1575
2) Même question pour un échantillon de 2000 personnes.

Ici, la loi de P est N (0,55 ; 0,01112)


p(P < 0,5) = p(U < -0,05/0,01112) = p(U < -4,5) < 0,0001

3) Combien de personnes faut-il interroger pour que la probabilité que moins de 50 % d'entre elles
aient voté pour lui passe en-dessous de 1 % ?

Reprenons le raisonnement dans le sens contraire :


p(U < -u0) < 0,01 signifie que p(U > u0) < 0,01, donc que p(U < u0) > 0,99 ce qui est vrai lorsque u0
vaut au moins 2,33.
P −π
Le changement de variable entre P et U est U = .
0, 55 × 0, 45
n
2
P −π −0, 05 0, 55 × 0, 45  0, 05  0, 55 × 0, 45
Il faut donc que < −2, 33 ⇔ > ⇔  >
0, 55 × 0, 45 −2, 33 n  2, 33  n
n
2 2
 2, 33  n  2, 33 
 0, 05  > 0, 55 × 0, 45 ⇔ n > 0, 55 × 0, 45 ×  0, 05  ≈ 537, 46
   
Il faut interroger au moins 538 personnes pour que la probabilité que moins de 50% d'entre
elles aient voté pour ce candidat passe en-dessous de 1%.

Exercice 17
Dans une région, pendant la période estivale, on admet que le nombre de touristes présents dans
une journée suit une loi normale de moyenne 50 000 et d'écart-type 8 000.
1) La préfecture estime que le tourisme est "gérable" (accueil, environnement, nuisances, …)
lorsque la probabilité d'accueillir moins de 55 000 personnes dans une journée dépasse 70 %. Est-
ce le cas ?

p(X < 55000) = p(U < (55000-50000)/8000) = p(U < 0,625) = 0,734
Cette probabilité est donc supérieure à 70%.

2) Elle souhaite réfléchir sur la base d'échantillons de 10 journées de vacances.


a) Quelle loi suit la variable X : "nombre moyen journalier de vacanciers dans un échantillon de 10
jours" ?

X a pour loi N(50000 ; 8000/√10) = N(50000 ; 2530)

b) Quelle est la probabilité que, dans un tel échantillon, le nombre journalier moyen de vacanciers
soit inférieur à 55 000 ?

p( X < 55000) = p(U < (55000-50000)/2530) = p(U < 1,98) = 0,9761


Exercice 19
Une population, contenant de nombreux individus, passe un test de Q.I. Les résultats forment une
variable aléatoire X normale de moyenne m = 102 et d’écart type s = 15.

1) Quelle est la probabilité pour qu'un individu pris au hasard ait un QI inférieur à 100 ?

p(X < 100) = p(U < -2/15) = p(U < -0,13) = 1 - p(U < 0,13) = 1 - 0,5517 = 0,4483

2) On veut analyser les résultats de quelques échantillons de cette population. Pour cela, on
formera des groupes de 20 individus, choisis par échantillonnage aléatoire simple (EAS), et on
calculera le QI moyen de chaque groupe.
a. Donner les paramètres de la loi normale selon laquelle se distribuent les QI moyens de tous
les échantillons possibles de taille 20.

moy : 102 ; écart type : 15/√20 = 3,354

b. Quelle est la probabilité pour que notre groupe sélectionné ait un QI moyen inférieur à 100 ?

p( X < 100) = p(U < -2/3,354) = p(U < -0,60) = 1 - p(U < 0,60) = 1 - 0,7257 = 0,2743

c. Au lieu de 20, combien d'individus faudrait-il choisir au hasard pour avoir moins de 5% de
risque que le QI moyen de ce nouveau groupe soit en-dessous de 100 ?

prob < 0,05 ssi p(U < u) > 0,95 avec u positif et valant 2/(15/√n) = 2√n /15 ssi u ≥ 1,65 (1,645
valable) ssi √n > 1,65×15/2 ssi n > 153,1. Il faut choisir au moins 154 personnes.

3) a. En regard du résultat de la question 1, quelle est la proportion d'individus de la population


dont le QI est inférieur à 100 ?

Sur la population, π = 0,4483.

b. Quelle est la probabilité pour que sur un groupe de 20 personnes cette proportion dépasse
50 % ?

La variable P, proportion d'individus de QI < 100 dans un échantillon de 20 personnes, a pour


 π (1 − π ) 
loi N  π ,  = N (0,4483 ; 0,1112)
 n 
 
p(P > 0,5) = p(U > (0,5-0,4483)/0,1112) = p(U > 0,465) = 1 - 0,679 = 0,321
autre valeur de u acceptée : 0,46 qui donne 1 - 0,6772 = 0,3228
S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

IV. ESTIMATION

TD9 : Estimations ponctuelles et intervalles de confiance


Un échantillon d'entreprises d'un secteur a donné la série statistique suivante :
chiffre d'affaires (M€) [0 ; 2[ [2 ; 3[ [3 ; 4[ [4 ; 5[ [5 ; 7[
effectifs 6 12 17 10 5

a. Donner une estimation ponctuelle du CA moyen et de l'écart type du CA de l'ensemble des


entreprises de ce secteur.

n
estimation de µ : µˆ = x ≈ 3,41 M€ ; estimation de σ : σˆ = s ≈ 1,358 M€
n −1

b. Donner une estimation de leur CA moyen par intervalle de confiance, au niveau de confiance de
95 %.

σ est supposé inconnu ; on fait donc intervenir une loi de Student.


ddl = n – 1 = 49 ; confiance : 95%, donc α = 0,05 ; ainsi : t = 2,010 (table de la loi de Student)
 s s   1, 3442 1, 3442 
Iα =  x − t ; x +t  = 3, 41 − 2, 01 × ; 3, 41 + 2, 01 ×
 n −1 n −1   7 7 
= [3,024 ; 3,796] (M€).

c. Donner une estimation ponctuelle de la proportion d'entreprises dont le CA dépasse 4,5 M€.

D’après le tableau, 10 entreprises ont un CA dépassant 4,5 M€,


soit une proportion de l’échantillon : p = 10/50 = 0,2.
Estimation ponctuelle de π : πˆ = p = 0, 2

d. Donner une estimation de cette proportion par intervalle de confiance au seuil de risque de 1 %.

 p (1 − p ) p (1 − p ) 
On se servira de Iα =  p − u ; p+u .
 n n 
loi N(0, 1) ; confiance : 99%, soit risque α = 0,01 et donc on cherche u tel que p(U < u) = 0,995 :
u = 2,58.

 0, 2 (1 − 0, 2 ) 0, 2 (1 − 0, 2 ) 
Iα =  0, 2 − 2, 58 ; 0, 2 + 2, 58  = [0,054 ; 0,3459] = [5,4% ; 34,59%].
 50 50 
Exercice 20
On a pesé le raisin sur 10 souches prises au hasard dans une vigne et on a obtenu les
résultats suivants en kilogrammes : 2,4 ; 3,2 ; 3,6 ; 4,1 ; 4,3 ; 4,7 ; 5,3 ; 5,4 ; 6,5 ; 6,9.
1. Calculer la masse moyenne et l’écart type de cet échantillon.
La moyenne de la série est 4,64 kg et son écart type 1,348 kg.
(calculatrice : mode stat, 1 variable)
2. Estimer la variance de la population dont ont été extraites ces souches.
2 n 2 10
σ = s = × 1, 3482 = 2, 019
n −1 9
3. Donner un intervalle de confiance de la moyenne de la population au risque de 0,05.
L'écart type de la population étant inconnu, la loi de référence sera celle de Student :
X −µ
La loi de la variable T = est la loi de Student à 9 degrés de liberté.
S
n −1
L'intervalle de confiance de µ au seuil de 5% est :
 s s 
I0,05 =  x − t ; x +t où t = 2,262 (ddl = 9 et α = 0,05)
 n −1 n − 1 
 1, 348 1, 348 
I0,05 = 4, 64 − 2, 262 × ; 4, 64 + 2, 262 × = [3, 624 ; 5, 656 ]
 3 3 
4. Calculer le nombre minimum de souches qu’il aurait fallu étudier pour que cet intervalle ait une
amplitude de 1 kg en supposant que la variance estimée est bien celle de la population.
L'hypothèse que la variance estimée (2,019) est bien celle de la population nous permet de
construire un intervalle de confiance sur la base d'une loi normale :
 σ σ  σ
Iα =  x − u ;x +u  dont u est la demi-amplitude.
 n n n
σ
On nous impose donc : u = 0,5.
n
Or u = 1,96 car α = 5%, et σ = 2, 019 ≈ 1, 421 kg par hypothèse.
σ
u = 0,5 donne n ≈ 5, 57 et n = 31,02
n
Il faut donc un échantillon d'au moins 31 souches pour que l'amplitude de l'intervalle de
confiance devienne inférieure à 1 kg.

Exercice 21
Un laboratoire souhaite analyser l'état de contamination des arbres par les pluies acides dans un
territoire donné. Pour cela, un échantillon de 100 arbres a été examiné : 8 arbres sont touchés.
Donner une estimation de la proportion π d'arbres touchés dans la population de ce territoire, par
intervalle de confiance au seuil de risque de 10 %.
La proportion p relevée dans l'échantillon est 0,08.
L'intervalle de confiance de π, proportion de la population, au seuil de 10% est :
 0, 08 × 0, 92 0, 08 × 0, 92 
0, 08 − 1, 645 ; 0, 08 + 1, 645  = [ 0, 03537 ; 0, 1246 ] .
 100 100 
Exercice 22
Dans la gestion d’un silo à blé, on s’interroge sur le stock de sécurité à prévoir pour « être sûr » à
99 % de pouvoir satisfaire le client à tout moment. Pour cela, pendant 15 semaines, on observe la
consommation hebdomadaire de blé (en tonnes) c’est à dire la quantité de blé retirée du silo
chaque semaine. On obtient les résultats suivants :
Consommation en tonnes 4,6 4,7 4,8 4,9 5 5,1 5,2 5,3
Effectifs (nombre de semaines) 1 0 2 3 5 2 1 1

1) Déterminer la moyenne x et l’écart type s de cette série.


x = 4,973 et s = 0,1652 , en tonnes

2) Soit X la variable aléatoire qui, à une semaine passée ou future, associe la consommation de blé
(en tonnes) cette semaine-là. On suppose que la loi de X est normale N (µ, σ).

a. Déduire de la question 1) l'estimation ponctuelle de µ et celle de σ.


n 15
Estimations : µˆ = x = 4, 973 t et σˆ = s ≈ 0, 1652 ≈ 0, 1710 t
n −1 14

b. Dans la loi normale munie des deux paramètres trouvés en question 2)a., quelle valeur de X a-t-
on 99% de chances de ne pas dépasser ? Conclure sur la question générale de l'énoncé.
Pour la loi N (0 ; 1), p(U < 2,33) = 0,9901.
Valeur de X correspondant à u = 2,33 : x = 2,33σ + µ = 5,371
On peut estimer en première approche qu'avec un stock de secours hebdomadaire de 5,371
tonnes on pourra satisfaire la clientèle dans 99% des cas.

3) a. En utilisant l’échantillon de 15 semaines, déterminer une estimation de µ par un intervalle de


confiance à 99%. (on considérera, et c'est le cas, que σ est inconnue)
X −µ
σ étant inconnu, on utilise la variable T = décrite par la loi de Student à 14 ddl.
S
n −1
L'intervalle cherché est :
I = [4,973 - 2,977×0,1652/√(14) ; 4,973 + 2,977×0,1652/√(14)] = [4,842 ; 5,104]

b. Quelle est la probabilité que m soit supérieure à la borne supérieure de cet intervalle ?
p(µ > 5,104) = 0,5%
Exercice 23
Une entreprise veut se spécialiser dans la livraison de colis volumineux. Elle fait un état de ceux
qu'elle a déjà eu l'occasion de transporter et le considère comme un échantillon représentatif de
l'ensemble des colis futurs.
série statistique des colis déjà transportés :
volume en m³ 0,2 à 0,4 0,4 à 0,5 0,5 à 0,6 0,6 à 1
effectifs (nb colis) 15 40 60 10

1) Donner une estimation ponctuelle de la moyenne et de l'écart type du volume des futurs colis.

volume en m³ 0,3 0,45 0,55 0,8


effectifs (nb colis) 15 40 60 10
3
x = 0,508 et s = 0,1181 , en m
Estimation ponctuelle de µ : 0,508 m³.
Estimation ponctuelle de σ : 0,1181×√(125/124) = 0,1185 m³.

2) Estimer le volume moyen des futurs colis par un intervalle de confiance à 99%.

σ étant inconnu, on détermine le coefficient t d'une loi de Student à 124 ddl au seuil de 1% :
t = 2,576.
I = [0,508 - 2,576×0,1181/√124 ; 0,508 + 2,576×0,1181/√124] = [0,4807 ; 0,5353]
loi normale acceptée, au lieu de Student, avec u = 2,58

3) Dans cette question, on considère que l'écart type des futurs colis est connu et vaut l'estimation
que vous en avez faite dans votre réponse à la question 1.
A quel niveau de confiance correspondrait un intervalle d'amplitude 0,05 m³ ? Interpréter.

La demi-amplitude de cet intervalle de confiance est u×0,1185/√125 = 0,0106u et doit valoir


0,025 d'après l'énoncé. Donc u doit valoir 2,36.
p(-2,36 < U < 2,36) = 2×0,9909 - 1 = 0,9818
Le niveau de confiance cherché est 98,18%, pour un intervalle d'amplitude 0,05 qui est donc
[0,483 ; 0,533].
Il y a donc 98,18% de chances que le volume moyen des futurs colis soit dans cet intervalle.
S3 – STATISTIQUES INFERENTIELLES – CORRIGES des EXERCICES

V. TESTS

TD10 : Test du χ² d'adéquation à une distribution théorique uniforme


On effectue 120 lancers d'un même dé. On obtient les résultats suivants:
nombre obtenu 1 2 3 4 5 6
effectif observé 26 15 14 24 25 16
Peut-on considérer au vu de cet échantillon que le dé est juste (non truqué) au seuil de 0,02 (2 %) ?

Organisons un tableau :
nombre obtenu 1 2 3 4 5 6
effectif observé 26 15 14 24 25 16
effectif théorique 20 20 20 20 20 20
( obs − th )
2

1,8 1,25 1,8 0,8 1,25 0,8 7,7


th

Hypothèse nulle : la distribution observée est conforme à la théorie

Variable de décision :
Valeur de la variable aléatoire χ² calculée entre l'échantillon et la théorie : χ²calc = 7,7

Détermination de la zone de non rejet de H0 :


Seuil de risque : α = 1 - p = 2% Nombre de ddl : k - 1 = 5
Valeur de la variable aléatoire χ² limite avant rejet : χ²lim = 13,39

Comparaison et décision :
Au seuil de 2%, on ne peut rejeter H0.
Dit autrement : on ne peut dire avec 98% de confiance que le dé est truqué.
TD11 : Test unilatéral de conformité à une moyenne (σ connu)
Un marchand de légumes veut changer de fournisseur. Le nouveau fournisseur prétend que ses
haricots mesurent 10 cm en moyenne.
Si cette valeur est plausible, voire si l'estimation qu'on peut en faire est supérieure, alors le
marchand décidera de choisir ce fournisseur. Son choix sera contraire si un échantillon donne une
moyenne trop basse. Le marchand fixe son seuil de risque a à 5%.
Soit X la variable aléatoire "taille d'un haricot en cm", distribuée suivant N (µ , 2,3).
Nous prenons un échantillon de n = 25 haricots. La moyenne de cet échantillon est x = 9,5 cm.

H0 : µ = 10 N (10 ; ) = N (10 ; 0,46)


H1 : µ < 10
X − 10
N (0 ; 1)
0, 46
α = 5%

ulim = -1,645
car p(U < 1,645) = 0,95 -1,645 0
implique p(U < -1,645) = 0,05
9,24 10

x − 10 9, 5 − 10
uobs = = ≈ −1, 09
0, 46 0, 46

xlim = 10 − 1, 645 × 0, 46 ≈ 9, 24

* Décision :
La moyenne observée (9,5 cm) ne se trouve pas dans la zone de rejet.
Au seuil de 5%, on ne peut rejeter l’hypothèse nulle, selon laquelle la taille moyenne des
haricots de la population vaut 10 cm (ou plus).
C’est à dire : on ne peut affirmer avec 95% d’assurance que cette moyenne est inférieure à
10 cm.
TD12 : Test bilatéral de conformité à une moyenne (σ inconnu)
Une carrière doit exploiter 300 tonnes de minerai en moyenne journalière.
On admet que la masse journalière de minerai extrait se distribue normalement.
Des quantités examinées sur 10 jours ont donné les résultats suivants, en tonnes :
302 287 315 322 341 324 329 345 392 289
Peut-on considérer au vu de cet échantillon que l'exploitation est conforme, au risque α de 1% ?

H0 : µ = 300 St (300 ; ) = St (300 ; 9,74)


H1 : µ ≠ 300 X − 300
St (0 ; ddl = 9)
9, 74
α = 1%

0,5% 0,5%
±tlim = ±3,25
par lecture directe -3,25 0 3,25
sur la table de Student
268,35 300 331,65
pour 1-p = 0,01

x − 300 324, 6 − 300


tobs = = ≈ 2, 526
9, 74 9, 74

xlim = 300 ± 3, 25 × 9, 74 ≈ 331, 65 ou 268, 35

* Décision :
La moyenne observée (324,6 t/jour) ne se trouve pas dans la zone de rejet.
Au seuil de 1%, on ne peut rejeter l’hypothèse nulle, selon laquelle la production moyenne
est conforme à 300 t/jour.
C’est à dire : on ne peut affirmer avec 99% d’assurance que cette moyenne ne l’est pas.
Exercice 24
Expérience : on lance un dé trois fois de suite. Le succès est : faire 5 ou 6.
X est la variable aléatoire qui prend pour valeurs 0, 1, 2 ou 3 : nombre de succès à l'issue de
l'expérience. On admettra que P(X = 0) = 8/27, P(X = 1) = 12/27 et P(X = 3) = 1/27.
Enfin, on réalise l'expérience 54 fois.

1. Compléter le tableau suivant :


succès obtenus 0 1 2 3 total
nombre théorique d'expériences 16 24 12 2 54
nombre réel observé d'expériences 14 20 16 4 54
ex : « 0 succès » s’obtient en moyenne 8 fois tous les 27 essais, donc 16 fois sur 54

2. En effectuant un test du χ², dire, au seuil de 5 %, si les résultats observés sont compatibles avec
les résultats théoriques attendus.
Hypothèse nulle H0 : le dé n'est pas truqué
calcul des Khi² partiels : (obs - th)²/th
0,25 0,6667 1,3333 2 total : 4,25

Valeur de la variable aléatoire K² observée sur l'échantillon : Khi²calc = 4,25


Valeur du Khi² limite à ne pas dépasser, au seuil de 5%, avec 3 ddl : Khi²lim = 7,815
Décision : Au seuil de 5%, on ne peut rejeter H0. (On prendrait plus de 5% de risques en rejetant
l'hypothèse nulle de conformité des résultats observés).

Exercice 25 Les parties 1 et 2 sont indépendantes.


Dans cinq groupes français du même secteur, on a relevé le budget annuel alloué à la promotion
sur internet comparativement au budget annuel global alloué à la promotion :
entreprise A B C D E
budget internet (k€) 47 55 58 63 72
budget global (k€) 558 545 587 560 585

Rassemblons dans un tableau les éléments chiffrés dont nous aurons besoin :
entreprise A B C D E
budget internet (k€) 47 55 58 63 72
budget global (k€) 558 545 587 560 585
taux int/global observé 0,084229 0,100917 0,098807 0,1125 0,123077
10% du budget global 55,8 54,5 58,7 56 58,5
χ² partiels 1,387814 0,004587 0,008348 0,875 3,115385

Partie 1
1. Déterminer dans cet échantillon la proportion d'entreprises pour lesquelles le budget
internet dépasse 10% du budget global.
3 entreprises sur 5 sont dans ce cas, soit une proportion p = 3/5 = 0,6.

2. a. Déterminer l'intervalle de confiance à 95% de la proportion qui pourrait être observée


dans l'ensemble des groupes français du même secteur.
La formule donne, avec p = 0,6 et u = 1,96 : I = [0,1706 ; 1,0294]
(on peut remarquer que cet intervalle est très large puisqu'une proportion est
systématiquement comprise entre 0 et 1 ; l'intervalle dépasse même 1 !)
b. Cet ensemble se compose en fait de 58 groupes. Combien, au minimum, peut-on dire avec
un degré de confiance de 80 % qu'ils ont un budget internet dépassant 10% du budget global ?

La probabilité d'être inférieur à ce nombre vaut 20%. C'est donc la borne inférieure d'un
intervalle de confiance à 60%, pour lequel u = 0,85.
0, 6 × 0, 4
La proportion correspondante est 0, 6 − 0, 85 = 0, 4138
5
et 41,38% de 58 entreprises donnent 24 entreprises.

Partie 2
Effectuer un test du Khi-deux pour dire, au seuil de 5%, si les budgets internet observés pour
ces cinq entreprises sont conformes à un budget internet valant 10% de leur budget global.

Le tableau au-dessus donne les Khi² partiels obtenus, dont le total vaut 5,391 (Khi²calc).
Pour 4 ddl et un seuil de 5%, la table donne Khi² limite = 9,488.
Donc au seuil de 5% on ne peut rejeter l'hypothèse qu'en France le budget internet
représente 10% du budget global de communication.

Exercice 26
Une étude a été conduite dans un échantillon de 50 entreprises de plasturgie. Sur chacune d'elles,
on a relevé le résultat net de l'année 2009. La liste des résultats nets forme une variable que l'on
note R, exprimée en M€. Le tableau ci-dessous donne une répartition par classes des entreprises :
Résultat net R (M€) [-1 ; 1[ [1 ; 1,5[ [1,5 ; 2[ [2 ; 3[ [3 ; 5[
effectifs (nombre d'entreprises) 3 10 18 15 4

Partie 1
1. Donner la moyenne et l'écart type de la distribution statistique ci-dessus (à l'aide des centres
des classes).
x = 1,950 et σ = 0,8761

2. Ces 50 entreprises représentent un échantillon aléatoire simple pris parmi un grand nombre
d'entreprises. Donner un intervalle de confiance à 99% du résultat net moyen de la population
d'entreprises (on notera que l'écart type de la population est inconnu).

σ étant inconnu, on recherche le coefficient t (Student) à 49 ddl, pour α = 1% : 2,680.


L'intervalle cherché est alors : [1,615 ; 2,285].

Partie 2
L'objectif consiste ici à dire s'il est plausible que la distribution des résultats nets des 50
entreprises est en accord avec la distribution normale N(2 ; 0,9) pour la population.

1. Soit une variable aléatoire X de loi normale de moyenne 2 et d'écart type 0,9.
a. Calculer les probabilités suivantes :
p(-1 < X < 1) ; p(1 < X < 1,5) ; p(1,5 < X < 2) ; p(2 < X < 3) ; p(3 < X < 5).

p(-1 < X < 1) = p(-3,33 < U < -1,11) = 0,1335 - 0 = 0,1335


p(1 < X < 1,5) = p(-1,11 < U < -0,56) = 0,2877 - 0,1335 = 0,1542
p(1,5 < X < 2) = p(-0,56 < U < 0) = 0,5 - 0,2877 = 0,2123
p(2 < X < 3) = p(0 < U < 1,11) = 0,8665 - 0,5 = 0,3665
p(3 < X < 5) = p(1,11 < U < 3,33) = 1 - 0,8665 = 0,1335
b. Montrer que si ces probabilités étaient respectées dans l'échantillon de 50 entreprises, alors
on obtiendrait la distribution d'effectifs théoriques suivante : 6,675 ; 7,71 ; 10,615 ; 18,325 ;
6,675 (dans l'ordre du tableau).

En multipliant les probabilités trouvées précédemment par 50, on trouve bien la liste
(6,675 ; 7,71 ; 10,615 ; 18,325 ; 6,675).

2. a. Effectuer un test d'adéquation du Khi-2, en comparant la distribution des effectifs observés


et celle des effectifs théoriques, pour dire au seuil de 5% si on peut considérer que la loi de R est
N (2 ; 0,9).

En comparant la liste d'effectifs observés (3 ; 10 ; 18 ; 15 ; 4) à la liste théorique ci-dessus, on


obtient la liste des Khi-2 partiels : (2,023 ; 0,6802 ; 5,138 ; 0,6033 ; 1,072).
Le Khi-2 calculé en est la somme : 9,517.
Pour une loi du Khi-2 à 4 ddl avec α = 5%, on trouve sur la table Khi-2 limite = 9,488.
En conclusion, on peut rejeter, au seuil de 5%, l'hypothèse selon laquelle le résultat net a
pour loi N (2 ; 0,9).

b. Que signifie ce seuil de 5% pour votre conclusion ?

En rejetant cette hypothèse d'adéquation, on prend moins de 5% de risque de se tromper.

Exercice 27
L'examen de 320 familles ayant 5 enfants s'est traduit par la distribution du tableau suivant.
Ce résultat est-il compatible avec l'hypothèse que la naissance d'un garçon et d'une fille sont des
événements équiprobables ?
5 garçons 4 garçons 3 garçons 2 garçons 1 garçon 0 garçon
enfants
0 fille 1 fille 2 filles 3 filles 4 filles 5 filles
effectif 18 56 110 88 40 8

La difficulté vient ici du calcul des effectifs théoriques attendus, car cela nous impose de
calculer les probabilités que dans une famille de cinq enfants on ait tant de garçons et tant de
filles (dans la situation « garçon/fille équiprobables). Commençons par cela.

Un enfant est une fille (succès, p = 0,5 est invariable) ou un garçon (échec, q = 0,5).
Au bout du choix de cinq enfants (n = 5), X désigne le nombre de succès.
La loi de X est donc B(5 ; 0,5) et l’application de la formule en loi binomiale permet d’obtenir
les probabilités de toutes les valeurs possibles de X (voir tableau ci-dessous : « prob »).
Enfin, il suffira de multiplier ces probabilités par 320 pour obtenir les nombres de familles
théoriquement attendus dans chaque catégorie (« eff th »).

5 garçons 4 garçons 3 garçons 2 garçons 1 garçon 0 garçon


enfants
0 fille 1 fille 2 filles 3 filles 4 filles 5 filles
eff obs 18 56 110 88 40 8
prob 0,03125 0,15625 0,3125 0,3125 0,15625 0,03125
eff th 10 50 100 100 50 10
Khi2 6,4 0,72 1 1,44 2 0,4

Le Khi2 total de ce tableau est : Khi²calc = 11,96


Valeurs des Khi² limites à ne pas dépasser :
ddl 1% 2% 5% 10%
5 15,09 13,39 11,07 9,236

Au seuil de 2%, on ne peut rejeter H0.


On peut rejeter H0 à un seuil de risque au moins égal à 5% d'après la table.
Le seuil de risque correspondant à χ² = 11,96 est compris entre 2% et 5% ; autrement dit : on
peut se permettre de rejeter l'hypothèse nulle d'équiprobabilité avec un niveau de confiance
de 95%, mais pas de 98%.

Exercice 28
Un fabricant de cordes affirme que les objets qu’il produit ont une tension de rupture moyenne de
300 kg et un écart type égal à 30 kg. On admet que la tension de rupture suit une loi normale. Des
expériences faites sur 10 cordes ont permis de constater les tensions de rupture suivantes :
251 277 255 305 341 324 329 314 272 289
Peut-on considérer au vu de cet échantillon que le fabricant remplit son engagement d’une
tension moyenne de rupture égale à 300 kg ? (au risque 10 % de répondre non à tort)

On décide de considérer qu’une corde remplit son rôle lorsque sa tension de rupture (sa
résistance) vaut au moins 300 kg. On procédera donc à un test unilatéral : H0 « la tension moyenne
vaut 300 kg » et H1 (rejet de H0) « la tension moyenne est inférieure à 300 kg ».

L’écart type des tensions de rupture, dans la population des cordes produites, est inconnu. Nous
aurons donc à utiliser une loi de Student pour ce test de conformité.

Données de l’échantillon : x = 295,7 kg et s = 30 kg.


Selon l’hypothèse nulle, les tensions moyennes des échantillons possibles de 10 cordes se
30 X − 300
répartissent autour de 300 kg avec un écart type de = 10 kg, et la variable T = suit
9 10
une loi de Student à 9 ddl.

La zone de rejet se situe d’un seul côté de la moyenne, en-dessous, et contient 10% des
échantillons possibles. La valeur de T correspondante est : -1,383. (attention, le formulaire est
calibré pour des tests bilatéraux !)
La valeur de X correspondante, limite de la zone de rejet, est 300 – 1,383×10 = 286,17 kg.

Notre échantillon a montré une moyenne supérieure à cette limite ; nous ne pouvons donc
affirmer au seuil de 10% que les cordes de ce fabricant ne sont pas assez résistantes. (nous
pouvons penser qu’elles ne sont pas assez résistantes, mais avec moins de 90% de confiance).

Exercice 29
Sur 1000 candidats français au baccalauréat pris au hasard, 675 ont réussi. Tester au seuil de 10 %
l’hypothèse selon laquelle le taux de réussite en France est de 70 %.
On décide de considérer que le test est positif lorsque le taux vaut au moins 70%. On procédera
donc à un test unilatéral : H0 « le taux vaut 70% » et H1 (rejet de H0) « le taux est inférieur à 70% ».

On teste une proportion, la loi à utiliser est donc la loi normale.


Selon l’hypothèse nulle, les proportions relevables dans les échantillons de 1000 personnes se
distribuent normalement autour de 70%, plus précisément selon la loi :
 0, 7 × 0, 3 
N  0, 7 ;  = N ( 0, 7 ; 0, 01449 ) .
 1000 

La zone de rejet se situe d’un seul côté du taux idéal de 70%, en-dessous, et contient 10% des
échantillons possibles. La valeur de U correspondante est : -1,28. (car p(U < 1,28) = 0,9 implique
p(U < -1,28) = 0,1).

La valeur correspondante du taux limite (zone de rejet) est 0,7 – 1,28×0,01449 = 0,6815.
Or, la proportion relevée dans notre échantillon de 1000 personnes est p = 67,5%.

On peut donc affirmer au seuil de 10% que le taux de réussite a été inférieur à 70% (« au seuil de
10% » : on a au moins 90% de confiance dans le rejet de H0).

Exercice 30
Dans plusieurs pays, les prévisions météorologiques sont données sous forme de probabilité.
La prévision « la probabilité de pluie pour demain est de 0,4 » a été faite 50 fois au cours de
l’année et il a plu 26 fois. Tester l’exactitude de la prévision au risque de 5 %.

On décide de considérer que le test est positif lorsque le taux est proche de 0,4. On procédera
donc à un test bilatéral : H0 « le taux vaut 0,4 » et H1 (rejet de H0) « le taux est différent de 0,4 ».

On teste une proportion, la loi à utiliser est donc la loi normale.


Selon l’hypothèse nulle, les proportions relevables dans les échantillons de 50 jours se distribuent
normalement autour de 0,4, plus précisément selon la loi :
 0, 4 × 0, 6 
N  0, 4 ;  = N ( 0, 4 ; 0, 06928 ) .
 50 

La zone de rejet se situe de part et d’autre de 0,4 et contient de chaque côté 2,5% des échantillons
possibles. La valeur de U correspondante est : ±1,96. (car p(U < 1,96) = 0,975 implique p(U > 1,96)
= 0,025 = 2,5%).

Les valeurs correspondantes du taux limite (zone de rejet) sont 0,4 ± 1,96×0,06928 = 0,2642 et
0,5358. Or, la proportion relevée dans notre échantillon de 50 jours est p = 26/50 = 0,52.

On ne peut donc pas rejeter, au seuil de 5%, l’exactitude de la prévision (il y a moins de 95% de
chances que la prévision soit inexacte).

Vous aimerez peut-être aussi