Vous êtes sur la page 1sur 20

Année universitaire 2021-2022

Licence Informatique, 2ème année

PROBABILITES ET STATISTIQUE INFERENTIELLE


POUR L’INFORMATIQUE

Dr. SORO Brahima

"Ce n'est pas le jour du combat qu'on aiguise sa lance !" (Proverbe Peuhl)
Chapitre 1

Estimation parameTRIQUE
Position du problème :
 Problème 1 :
o Dépense moyenne d’un habitant de Yamoussoukro par jour
‟m” inconnue
o Taille moyenne des étudiants de UIYA : ”m‟ inconnue
 Problème 2 :
o J’étudie un caractère X dans une population ; je sais que X
suit la loi L de moyenne ‟m : inconnue ” et d’écart-type ”б :
inconnu‟ : L (m ; б).
Résolution du problème :

Sondage dans la population (échantillon de taille n)


X1 ; X2 ; X3 ;. . ; Xn

Résultats du sondage

∑𝑥𝑖
Moyenne 𝑥̅ = 𝑛

Ecart-type бx = √vx

Retrouver m et б à partir de 𝑥̅ et 𝜎𝑥

I- DEUX LOIS FONDAMENTALES DE LA STATISTIQUE

1. Théorème (Loi faible de grands nombres)


On considère une suite {Xn }de variables aléatoires indépendantes définies sur un
même espace probabilisé ayant même variance finie V(X) et même espérance E(X).
La loi faible des grands nombres stipule que : pour tout réel 𝜀 strictement positif, la
1 n
probabilité que la moyenne empirique : ̅Xn = n Σi=1 Xi s’éloigne de l’espérance E(X) d’au
moins ε tend vers 0 quand n→ +∞.
Page 1 sur 19
̅ n − E(X)| ≥ 𝜀) = 0
∀ 𝜀 > 0, lim 𝑃(|X
n→∞

̅ n − E(X)| < 𝜀) = 1
∀𝜀 > 0, lim 𝑃(|X
n→∞

Autrement dit, lorsqu’on fait un sondage aléatoire dans une population, plus on
augmente la taille de la moyenne de l’échantillon ̅
Xn se rapproche de celle de la
population. On dit que Xn converge en probabilité vers E(X).
2. Théorème central limite (TCL)

̅ n − E[X
X ̅n]
→+∞ 𝑁(0; 1)
̅n )
√V(X

II- ESTIMATION PONCTUELLE

1. Estimation, estimateur
Exemple : Soit X la variable aléatoire désignant la dépense d’un étudiant de la
L2-IGL
x1=300 ; x2=250 ; x3=400 ; x4=500 ; x5=1000 ; x6=600
Pour l’individu N⁰1, X1 est une variable désignant sa dépense (c’est X mais pour
l’individu 1)
x1=300 est une réalisation de X1 (c’est une valeur possible de X1).
(300 ;250 ;400 ;500 ;1000 ;600) est une réalisation du vecteur aléatoire (X1 ; X2 ; X3 ;
X4 ; X5 ; X6).
La dépense moyenne des six (06) étudiants est :
∑6i=1 xi 300 + 250 + 400 + 500 + 1000 + 600
x̅ = =
6 6
x̅ = 508,33
x̅ Est une fonction de xi, i=1,…,6
x̅= f (x1, x2, x3, x4, x5, x6)
1 n
x̅ est une réalisation de la variable aléatoire : ̅
Xn = n Σi=1 Xi

La v.a ̅
Xn est appelée une statistique.
Définition 1.
Une statistique est une transformation des données de l’échantillon (X1 ,X2,…,Xn).
Un estimateur de θ est une fonction construite à l’aide des {Xi} :
Tn = t(X1, X2,…,Xn)

Page 2 sur 19
Une estimation est une réalisation tn = t(x1, x2, …, xn).

On note la valeur numérique de cette estimation par θ̂ = t(x1, x2, …, xn)


Exemple :
1 n
̅)2 ; n ∑ni=1 Xi sont des statistiques.
VX = n ∑i=1(Xi − X

2. Qualité d’un estimateur


Il n’existe pas de ‘’meilleur estimateur’’ mais il existe des critères de comparaison.
a) Estimateur sans biais

m (vraie valeur) =E(T1) E(T2)≠m )


E(T1) = m T2 est un estimateur biaisé
Biais=0
T1 est un estimateur sans biais

Définition 2.
Un estimateur Tn d’un paramètre θ est dit sans biais (ESB) lorsque son espérance
mathématique est égale à la valeur vraie du paramètre : E(Tn)= 𝛉 .
Biais de Tn = E(Tn) - 𝛉 = 𝟎
Interprétation.

Si Tn est un estimateur de θ (biaisé ou non) alors une estimation de θ est une valeur
possible de l’estimateur Tn .
b) Précision d’un estimateur

On veut estimer θ :

Page 3 sur 19
𝐓𝐧𝟏 𝐓𝐧𝟐
2,33 2,33
v Valeurs
Valeurs pas trop
2,50 2,30
cohérentes 10,30 2,31
7,1 3,32

Tn2 est précis que Tn1


Si l’on répète l’estimation sur un autre échantillon, on souhaite obtenir une
estimation cohérente, donc peu de variation d’un échantillon à l’autre : on parlera
d’efficacité.
On mesure généralement la précision d’un estimateur par l’erreur quadratique
moyenne :

EQM (Tn) = V (Tn) +[𝐄(𝐓𝐧 ) − 𝛉]2


EQM (TN) = V (Tn) +[𝐁𝐢𝐚𝐢𝐬(𝐓𝐧 )]2

Exercice 1: on considère un échantillon indépendant identiquement distribué


(X1 ; X2 ;… ;Xn) d’une v.a. X tel que E(X)=m et V(X)=σ2. On suppose σ2 connue, m∈ ℝ
étant le paramètre inconnu.
̅ n et Z̅n = 1 (Xn+Xn-1)
X
2

1) Montrer que ̅
Xn et Z̅n sont des estimateurs de la moyenne m.
2) Qui de ̅
Xn ou Z̅n choisirez-vous pour approcher m ?

3. Estimation de la moyenne m d’une population-mère


̅ n est un estimateur sans biais
D’après l’exercice précédent, la moyenne empirique X
de la moyenne de la population-mère m.
Une estimation ponctuelle de m est donc une valeur de 𝑋̅𝑛 .

4. Estimation ponctuelle de la population p d’une population-mère


Exemple : soit p la population d’étudiant de l’UIYA ayant plus d’un smartphone.
 On prélevé un échantillon de taille n dans l’ensemble des étudiants

Soit Xi = 1, si l’individu i à plus d’un smartphone


Xi = 0, sinon avec i =1, 2, … ,n.
Alors Xi~B(p), pour i =1, 2, … ,n (Loi de Bernoulli de paramètre p)

Page 4 sur 19
La variable aléatoire ∑ni=1 Xi désigne alors le nombre d’étudiants ayant plus d’un
smartphone et ∑𝐧𝐢=𝟏 𝐗i~B(n ;p) (Loi binomiale de paramètres n et p)
𝟏
 𝐧
Soit la variable aléatoire Fn= 𝐧 𝚺𝐢=𝟏 𝐗 𝐢 désigne la proportion d’individu ayant
plus d’un smartphone. On a :
1
n 1 n
E(Fn) = E (n Σi=1 Xi ) = n E(Σi=1 Xi )

Comme ∑𝑛𝑖=1 𝑋i~B(n ;p) alors E (Σi=1


n
Xi )= np.
𝟏
D’où E(Fn) = 𝐧 × 𝐧𝐩 = 𝐩

Ainsi est Fn un estimateur sans biais de p.


Interprétation : Pour estimer la proportion p d’un caractère dans une population, il
suffit de prélever avec remise (sondage avec remise) un échantillon n et calculer la
fréquence fe du caractère dans cet échantillon puis l’attribuer à p.

5. Estimation ponctuelle de l’écart-type 𝛔 d’une population-mère


Exercice : Désignons par
n n
1 1
S = ∑(Xi − m)2 = ∑ Xi 2 − m2
2
n n
i=1 i=1
n n
1 1 2
X n )2 = ∑ X i 2 − ̅
S′2n = ∑(Xi − ̅ Xn
n n
i=1 i=1

1- Montrer que si m est connue, alors S 2 est un estimateur sans biais de la


variance σ².
2- Montrer que si m est inconnue, alors S 2 est un estimateur biaisé de la variance
σ².
3- En déduire un estimateur sans biais de σ² que l’on notera Sn2 .

III- APPLICATION DES LOIS FONDAMENTALES

1- Application 1 : loi de la moyenne d’un échantillon


Considérons une variable aléatoire X de moyenne m inconnue, de variance 𝜎2 (finie)
connue ou non. Soient X1, X2,…, Xn, n variables aléatoires indépendantes et
identiquement distribuées (i.i.d) de même loi que X.
a) Cas ou 𝝈2 est connue
Si n est grand d’après le théorème centrale limite ; on a :
̅ ̅n ]
Xn − E[X
→𝑛∞ 𝑁(0; 1)
̅n )
√V(X

Page 5 sur 19
or 𝜎2
V(𝑋̅𝑛 )= 𝑛 𝑒𝑡 E(𝑋̅𝑛 )=m

√𝑛(𝑋̅𝑛 −𝑚)
D’ou : →𝑛∞ 𝑁(0; 1)
𝜎

Remarque:
 n est grand dès que n ≥ 30
 Pour le petit échantillon (n ≤ 30), le résultat reste vrai si X suit la loi normale
 Pour un tirage exhaustif (sans remise), il faut corriger la variance :
𝑁−𝑛 𝜎2
V(𝑋̅𝑛 )=𝑁−1 ∗ 𝑛 ou N est la taille de la population-mère et n est la taille de
l’échantillon

b) Cas ou 𝝈2 est inconnue


Désignons par :
1 𝑛
 La variance empirique : S2= 𝑛 ∑𝑖=1(𝑋i-m)2
1 𝑛
 La variance empirique modifiée : Sn2= ∑𝑖=1(𝑋i-𝑋̅𝑛 )2
𝑛−1
1 𝑛
 Sn’2= = 𝑛 ∑𝑖=1(𝑋i-𝑋̅𝑛 )2 : La variance d’un échantillon

Théorème : (Théorème de Cochran)


Soit X1,…,Xn, n la variables aléatoires indépendantes et identiquement distribuées
de même loi N(m, 𝜎2) ; alors on a :
 ̅ n et Sn2 sont des variables aléatoires indépendantes
X
σ2
 ̅
Xn ~ N(m, n )
n s2
 ~ X2 (n) : la loi du Khi-deux à n degré de liberté
σ2
̅ n −m)
√n(X
 ~T(n − 1): la loi de Student à n-1 degrés de liberté.
Sn

2- Application 2 : loi de la moyenne d’un échantillon


Etablir le théorème de Moivre-Laplace.

Page 6 sur 19
3- Application 3 : loi de la variance d’un échantillon

Page 7 sur 19
IV- ESTIMATION PAR INTERVALLE DE CONFIANCE
Objectif :
On préférera un encadrement de la valeur inconnue à estimer ϴ, suivant un seuil de
confiance fixé a priori, 1-α (en pratique 95% ou 99%). On cherche a et b tels que
P(a≤ 𝚹 ≤ b) = 1-α ; 0 < α < 1
Une fonction pivotale pour ϴ est une fonction des observations X = (X1 , X2 , …Xn ) et du
paramètre ϴ, dont la loi ne dépend pas de ϴ.
Pour construire un I.C. il faut:
1- Trouver une fonction pivotale 𝚷(𝐗 𝟏 , 𝐗 𝟐 , …𝐗 𝐧 , 𝚹 ).
2- Déterminer a et b tels que P(a≤ 𝚷(𝐗 𝟏 , 𝐗 𝟐 , …𝐗 𝐧 , 𝚹 ) ≤ b) = 1-α
(a et b indépendants)
3- Résoudre en ϴ l’inéquation 𝐚 ≤ 𝚷(𝐗 𝟏 , 𝐗 𝟐 , …𝐗 𝐧 , 𝚹 ) ≤ b et déduire un I.C. pour de
niveau 1-α.

Théorème.(admis)
Si la loi de probabilité de la fonction Π(.) est symétrique par rapport à 0 et unimodale,
alors l’intervalle [a ; b] minimal est celui correspondant à
b= -a = 𝒛𝟏−𝛂/𝟐 , où 𝑧1−α/2 est le quantile d’ordre 1 − α/2 de la loi de Π(.).

Aller aux T.D.

Chapitre 2

Page 8 sur 19
TESTS D’HYPOTHESES STATISTIQUES
Une hypothèse statistique est une affirmation concernant certaines caractéristiques
d’une population telles que la valeur d’un ou plusieurs paramètre (moyenne,
variance…), la forme de la distribution (normale, Poisson…).
Un test d’hypothèse ou test statistique est une démarche conduisant à élaborer une
règle de décision permettant de faire un choix entre deux hypothèses ; il existe deux
grandes familles :
 Les tests paramétriques qui portent sur le paramètre de distribution
(moyenne, proportion, variance).
 Les tests non paramétriques dans le cas de variables qualitatives,
ordinales…
Position du problème :
Le problème posé est le choix, au vu d’observations fournies par un échantillon de
taille n, entre une hypothèse nulle notée H0 et une alternative notée H1.
On supposera qu’une seule de ces deux hypothèses est vraie.

H0 : La taille moyenne de la classe est m=1,74


Test
H1 : m ≠ 1,74

Objectif : choisir entre H0 et H1 (fin de test)


 Choisir n individus x1, x2, …,xn
 Utiliser les informations de (x1, x2, …,xn) pour élaborer le test
Les tests du Khi-deux sont les tests les plus utilisés.

I. TEST D’INDEPENDANCE DU KHI-DEUX

1. Définition
On teste H0 indépendant entre les variables contre les H1 dépendant entre les
variables.
2. Nombre de degré de liberté
Le nombre de degré de liberté est donne par :

Page 9 sur 19
𝜈 = (𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑙𝑖𝑔𝑛𝑒𝑠 − 1)(𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑜𝑙𝑜𝑛𝑛𝑒𝑠 − 1)
𝜈 = (𝑟 − 1)(𝑠 − 1)
Il s’agit du nombre de colonnes(r) et de lignes(s) du tableau de contingence ; le seuil
de test est soit 1% ;5% ou 10%.

3. Tableau des valeurs théoriques


Les valeurs théoriques sont déterminées par :


𝑛𝑖 ∗ 𝑛𝑗
𝑛𝑖𝑗 = , ∀𝑖𝑗
𝑁
Le Khi-deux calculé est donné par la formule :
𝑠
𝑟 ′
(𝑛𝑖𝑗 −𝑛𝑖𝑗 )2
𝑥𝑐2 =∑ ∑ ′
𝑛𝑖𝑗
𝑖=1
𝑗=1


Ou nij représente les effectifs du tableau initial et 𝑛𝑖𝑗 les effectifs theoriques.

4. La règle de décision
On « rejette » l’hypothèse nulle si 𝑥𝑐2 > 𝑥𝛼2
En revanche, H0 est « accepté » si 𝑥𝑐2 < 𝑥𝛼2

Exercice d’application :
Etudier au risque 𝛼 = 5% la liaison entre les caractere d’etre un commercial et la
personnalité. Les observations sur 120 individus ont permi d’etablir le tableau
suivant :
Introverti Extraverti Total
Apte 14 34 48
Inapte 31 41 72
Total 45 75 120

Solution
 Etape 1 : construction du test :

H0 : la personnalité d’un individu (extraverti ou


introverti) et le fait d’être un bon commercial ne sont
pas lié.
H1 : être un bon commercial et la personnalité sont
liés.

Page 10 sur 19
 Etape 2 : calcul du nombre de degré de liberté :
𝜈 = (𝑟 − 1)(𝑠 − 1)
𝜈 = (2 − 1)(2 − 1)
𝜈=1
 Etape 3 : tableau des valeurs théoriques :


𝑛𝑖 ∗ 𝑛𝑗
𝑛𝑖𝑗 =
𝑁

𝑛1. ∗ 𝑛.1 48 ∗ 45
𝑛11 = = = 18
𝑁 120

𝑛1. ∗ 𝑛.2 48 ∗ 75
𝑛12 = = = 30
𝑁 120

𝑛2. ∗ 𝑛.1 72 ∗ 45
𝑛21 = = = 27
𝑁 120

𝑛2. ∗ 𝑛.2 72 ∗ 75
𝑛22 = = = 45
𝑁 120

𝑛
𝑛

(𝑛𝑖𝑗 −𝑛𝑖𝑗 )2
𝑥𝑐2 = ∑ ∑ ′
𝑛𝑖𝑗
𝑖=1
𝑖=1

(14 − 18)2 (34 − 30)2 (31 − 27)2 (41 − 45)2


𝑥𝑐2 = + + + = 2,37
18 30 27 45
 Etape 4 : règle de décision :
2 (1)
On a : 𝛼 = 5% et 𝜈 = 1 𝑥0,05 = 3,841
2 (1)
𝑥𝑐2 = 2,37 < 𝑥0,05 = 3,841

Donc H0 est accepté ; la personnalité et être un bon commercial ne sont pas lié(e)s au
seuil de 5%.
II. TEST D’ADEQUATION DU KHI-DEUX
1. Définition
A partir d’une distribution empirique donnée caractérisée par les valeurs xi d’une
variable aléatoire X regroupée en classe ou non de leurs fréquences(effectifs) absolues
associées NI, la question qui est posée ici est d’admettre ou non l’ajustement de la
variable X par la loi théorique pressentie, discrète ou continue.
2. Définition du test

Page 11 sur 19
On test H0, on accepte l’ajustement contre H1, on refuse l’ajustement.
3. Construction de la variable de décision
Les données relatives à X sont reparties en classes « i »(1≤ 𝑖 ≤m) comme le montre le
tableau ci-dessous, chacune d’entre elle correspondant à une valeur xi ou à un
intervalle [𝑥𝑖 ; 𝑥𝑖+1 [. Les fréquences absolues empiriques(observées), soient Ni, et les
fréquences théoriques induisent par laquelle on test l’ajustement (𝑁𝑝𝑖 𝑎𝑣𝑒𝑐 𝑃𝑖 = 𝑃(𝑋 =
𝑥𝑖 )) ou
𝑝𝑖 = 𝑃(𝑥𝑖 ≤ 𝑋 ≤ 𝑥𝑖+1 ) et 𝑁 = ∑𝑚
𝑖=1 𝑁𝑖 sont mentionnées face à face.

Classes i Effectifs Probabilités Effectifs


observés théoriques théoriques
1 N1 P1 NP1

i NI Pi NPi

m Nm Pm NPm
(𝑵𝒊 −𝑵𝑷𝒊 )𝟐
La distance du Khi-deux est : 𝒙𝟐𝒄 = ∑𝟏𝒊=𝟏 ; dont on montre la convergence, pour
𝑵𝑷 𝒊
N grand et H0 est vrai, vers ma loi de Khi-deux à n-1 de liberté.
4. Nombre de degré de liberté
Définition
La convergence n’est admise que si les effectifs théoriques 𝑁𝑃𝑖 > 5.

On regroupera donc les classes d’effectifs inférieurs à 5 avec les classes successifs, la
valeur du nombre degré de liberté 𝝂 = 𝒎 − 𝟏 étant à apprécier une fois ces
regroupements préalable effectués.
Si dans la détermination de la loi théorique, il est nécessaire d’estimer k paramètre, il
convient de diminuer d’autant le nombre degré de liberté, égal à 𝝂 = (𝒎 − 𝟏) − 𝒌.
Remarque :
 k=1, pour une loi de Poisson
 k=2, pour une loi normale

5. Règle de décision
On rejette l’hypothèse nulle si 𝑥𝑐2 > 𝑥𝛼2

Page 12 sur 19
En revanche, H0 est accepté si 𝑥𝑐2 < 𝑥𝛼2
Exemple : La distribution statistique ci-dessous indique pour une machine le
nombre de jours de panne, sans panne :
Nombre de pannes Nombre de jours
0 21
1 18
2 7
3 3
4 1

Par quelle loi théorique peut-on ajuster cette distribution empirique ?


Vérifier la qualité de cet ajustement au seuil de 5%.

Solution :
Soit X, la variable désignant le nombre de panne sur cette machine
On a :
𝑛
1
𝑥̅ = ∑ 𝑛𝑖 𝑥𝑖
𝑁
𝑖=1

(0 ∗ 21) + (1 ∗ 18) + (2 ∗ 7) + (3 ∗ 3) + (4 ∗ 1)
𝑥̅ =
21 + 18 + 7 + 3 + 1

𝑥̅ = 0.9

𝑛
1 2
𝑣(𝑥) = ∑ 𝑛𝑖 𝑥𝑖2 − 𝑥
𝑁
𝑖=1

(02 ∗ 21) + (12 ∗ 18) + (22 ∗ 7) + (32 ∗ 3) + (42 ∗ 1)


𝑣(𝑥) = − 0.92
21 + 18 + 7 + 3 + 1

𝑣(𝑥) = 0.97
D’après la théorie des nombres de pannes sur une machine est évènement rare :de
plus 𝑥 ≅ 𝑣(𝑥𝑖 ) = 0.9. La loi de Poisson a une telle caractéristique.
 Etape 1 : Définition du test

H0 : X~ P (0.9)

H1 : ne suit pas la loi de


Poisson Page 13 sur 19
 Etape 2 : Construction de la variable de décision
𝑃𝑖 = 𝑃(𝑋 = 𝑥𝑖 )
0.9𝑥𝑖
𝑃𝑖 = 𝑒 −0.9 ∗ avec 𝑥𝑖 ∈ {0,1,2,3,4}
𝑥𝑖

𝒙𝒊 𝑵𝒊 Probabilité Effectifs
théoriques (𝑷𝒊 ) théoriques
(𝑵𝑷𝒊 )
0 21 0.4065 20.325
1 18 0.3659 18.2905
2 7 0.1646 8.2300
3 3 0.0493 2.465
4 1 0.0111 0.555
Total 50 0.9974 49.8655
Le quatrième effectif théorique : 𝑵𝑷𝒊 = 𝟐. 𝟒𝟔𝟓 < 𝟓
On regroupe les classes 4 et 5 : 𝑵𝑷𝒊 = 𝟐. 𝟒𝟔𝟓 + 𝟎. 𝟓𝟓 = 𝟑. 𝟎𝟐 < 𝟓
Dans ce cas, on regroupe donc les classes 3,4 et 5
𝑵𝑷𝒊 = 𝟖. 𝟐𝟑𝟎𝟎 + 𝟐. 𝟒𝟔𝟓 + 𝟎. 𝟓𝟓 = 𝟏𝟏. 𝟐𝟓
𝒙𝒊 𝑵𝒊 𝑵𝑷𝒊 (𝑁𝑖 − 𝑁𝑃𝑖 )2
𝑁𝑃𝑖
0 21 20.325 0.0224
2 18 18.2905 0.0046
2,3 et 4 11 11.25 0.0055
Total 50 49.8655 2
𝑥𝑐𝑎𝑙𝑐𝑢𝑙é = 0.0325

 Etape 3 : Nombre de degré de liberté


𝝂 = (𝒎 − 𝟏) − 𝒌
𝝂 = (𝟑 − 𝟏) − 1
𝝂=𝟏
 Etape 4 : Règle de décision
2 (1) 2
On a : 𝑥0.05 = 3.841 or 𝑥𝑐2 < 𝑥0.05 (1)
Donc H0 est accepté alors le nombre le nombre de panne peut-être ajuster par la loi
de Poisson de paramètre 0.9.

Page 14 sur 19
TRAVAUX DIRIGeS

Exercice 1 :
Une entreprise de construction mécanique fabrique de pièces de moteur de voiture
pour un grand constructeur automobile. Les exigences du client sont les suivantes :
les pièces doivent faire 20cm de diamètre. Une fois le procédé bien calibré, la
fabrication démarre. Le processus est alors supposé, lorsqu’il est en fonctionnement
normal, fabriquer des pièces dont le diamètre X suit une loi normale de moyenne 20cm,
et d’écart-type 0.1mm. Nous dirons que le processus est alors en fonctionnement
normal.
Afin de suivre le bon déroulement de la fabrication, le contrôleur qualité prélève 5
pièces toutes les heures, en mesure le diamètre et calcule la moyenne des 5 diamètres.
Voici les résultats trouvés sur une journée complète de 24h : 19.993, 19.993,
19.994, 19.995, 20.004, 19.985, 19.990, 19.990, 19.996, 19.993, 20.000, 20.006,
19.991, 19.992, 19.995, 19.992, 20.002, 20.002.
1- Peut-on utiliser ces résultats pour estimer l’espérance et la variance du diamètre
des pièces produites par l’entreprise ? Si oui, faites-le.
2- Soit X𝑖 la moyenne des 5 mesures au temps i. Quelle devrait être la loi de X̅ 𝑖 si le
processus était en fonctionnement normal ?
3- Donner un intervalle [b𝑖𝑛𝑓 , b𝑠𝑢𝑝 ], symétrique autour de la valeur cible de 20cm,
auquel doit appartenir la variable ̅ X𝑖 avec une probabilité de 99.7%.
4- Construire une carte de contrôle (cf. votre cours) sur la moyenne de la production,
en utilisant les deux bornes b𝑖𝑛𝑓 et b𝑠𝑢𝑝 comme limite. Le procédé est-il resté sous
contrôle toute la journée ?

Exercice 2 :
Afin de respecter une certaine norme, un fabricant de piles électroniques doit produire
des piles dont la durée de vie moyenne doit être de 170 heures au moins.
Le fabricant LONGLIFE affirme que la durée de vie moyenne du matériel qu’il s’apprête
à livrer est de 170 heures.
Le chargé du contrôle qualité prélève alors au hasard un échantillon de taille n=
100 piles et observe une durée de vie moyenne de 158 heures avec un écart-type
empirique 𝑠𝑛 de 30 heures.

1- Déterminer un intervalle de confiance de niveau 0.99 pour la durée


de vie moyenne m.
2- Peut-on accuser ce fabricant de publicité mensongère ?
Exercice 3 :
On a pesé 10 palettes de briques de la même fabrication ; et on a obtenu les résultats
suivants (kilogrammes)

Page 15 sur 19
759, 750, 755, 756, 761, 765, 770, 752, 760, 767
On admet que ces résultats sont issus d’une population distribuée selon une loi
normale d’espérance µ et de variance σ².
1- Donner une estimation ponctuelle de l’espérance et de la variance du poids d’une
palette de brique.
2- Construire un intervalle de confiance pour µ avec les niveaux de confiance 0.90 et
0.99.
3- Quel niveau de confiance choisir pour avoir un intervalle de confiance deux fois
plus étroit que celui obtenu avec une confiance de 0.9 ?
4- Supposons maintenant que l’on connaisse la variance, donnée par le constructeur
: σ² = 42. Que cela change-t-il sur vos intervalles de confiances ? Recalculez-les si
besoin.
5- Combien de palettes de briques aurait-on dû mesurer pour que la longueur de
l’intervalle de confiance, de niveau de 95%, n’excède pas 0, 5kg (en supposant que
les estimations des moyennes et variances ne changent pas).
Exercice 4 :
Lors d’un sondage précédant les élections présidentielles, 500 personnes ont été
interrogées. Bien que ce ne soit pas le cas en pratique, on suppose pour simplifier les
calculs que les 500 personnes représentent un échantillon indépendant et
identiquement distribué de la population française. Sur les 500 personnes, 150 ont
répondu vouloir voter pour le candidat C1, et 140 pour le candidat C2.
1- Donner une estimation ponctuelle des intentions de votes, sous la forme d’un
pourcentage.
2- Donner un intervalle de confiance à 95% pour chacun des deux intentions de
votes.
3- Peut-on prédire l’élection d’un candidat ?
Exercice 5 :
Pour juger de la teneur en magnésium d’une eau minérale, on a effectué 10 mesures :
248 246 246 247 247 249 247 250 248 245 (mg pour 10 litres). La
teneur étudiée est supposée être une variable aléatoire normale d’espérance µ et de
variance σ².
1- Déterminez un intervalle de confiance sur µ pour un niveau de confiance de
0.95.
2- Trouver la valeur σ0 de σ qui n’aurait que 5 chances sur 100 d’être dépassée.
Exercice 6 :
Une firme nationale de sondages d’opinion a effectué pour le compte d’une compagnie
d’assurance, une étude sur les besoins financiers et la satisfaction des clients. Dans
la section du questionnaire concernant les fonds communs de placement, on demande
aux clients de donner la valeur (en euros) de tous les fonds communs de placement
qu’ils possèdent. Voici les résultats pour un échantillon aléatoire de 20 clients :

Page 16 sur 19
Fond commun de placement
93850 121500 166675 173000 81580
172450 80515 191000 105630 192100
151975 148000 173400 138330 142500
149660 120225 149375 131170 85600

On suppose que la valeur actuelle des fonds communs de placement est distribuée
normalement.
1- Donner une estimation ponctuelle de la valeur moyenne des fonds communs de
placement des clients.
2- On appelle parfois l’erreur-type l’écart-type de l’estimateur utilisé. Quelle est-elle
ici ?
3- Déterminez un intervalle de confiance ayant une probabilité de 95% de contenir
la vraie valeur du montant moyen des fonds communs de placement.
Exercice 7 :
Un fabricant de téléviseurs achète un certain composant électronique à un
fournisseur. Un accord entre le fournisseur et le fabricant stipule que la durée de vie
de ces composants doit être égale à 600 heures au moins. Le
fabricant qui vient de recevoir un lot important de ce
composant veut en vérifier la qualité. Il tire au hasard un échantillon de
16 pièces. Le test de durée de vie pour cet échantillon donne les résultats suivants :
620 570 565 590 530 625 610 595 540 580 605 575 550 560 575 615

On admettra que la durée de vie de ces composants suit une loi normale.

1- Le fabricant doit-il accepter le lot? (On choisit un risque de première


espèce égal à 5 %.)
2- Quel est le risque de deuxième espèce?

Exercice 8 :
Un fabricant de téléviseurs achète un certain composant électronique à un
fournisseur. Un accord entre le fournisseur et le fabricant stipule que la durée de vie
de ces composants doit être égale à 600 heures au moins. Le fabricant qui vient de
recevoir un lot important de ce composant veut en vérifier la qualité. Il tire au hasard
un échantillon de16 pièces. Le test de durée de vie pour cet échantillon donne les
résultats suivants :

620 570 565 590 530 625 610 595 540 580
605 540 580 605 575 550 560 575 615
On admettra que la durée de vie de ces composants suit une loi normale.
1- Le fabricant doit-il accepter le lot? (On choisit un risque de première espèce
égal à 5 %.)
2- Quel est le risque de deuxième espèce ?

Page 17 sur 19
Exercice 4 :
Un ingénieur risque crédit, employé dans une société spécialisée dans le crédit à la
consommation, veut vérifier l’hypothèse selon laquelle la valeur moyenne des
mensualités de ses clients est de 200 euros. Un échantillon aléatoire de 144 clients,
prélevé aléatoirement dans la base de données, donne une valeur moyenne estimée à
193.74 euros et un écart-type estimé à 48.24 euros.
1- Quelles sont les hypothèses statistiques associées à la problématique du
comptable et quel type de test faut-il mettre en œuvre pour l’aider à prendre une
décision statistiquement correcte ?
2- Peut-il conclure, au niveau de confiance 95%, que la valeur moyenne postulée
des stocks est correcte ?
3- Faîtes le schéma des régions de rejet et de non rejet de l’hypothèse nulle H0 en y
notant les valeurs critiques calculées à la question précédente.
4- Représenter sur ce schéma la p-value associée à ce test. Que vaut-elle ?
5- En utilisant la p-value, quelle aurait été la réponse à la question 2 pour un risque
de première espèce α = 10%.
Exercice 5 :
Pour comparer les proportions de personnes atteintes par la grippe en ville et à la
campagne, deux échantillons ont été mesuré :
- sur 100 personnes habitant une grande agglomération, on a observé une
proportion f0 = 0.24 de sujets ayant eu la grippe,
- sur 80 personnes habitant à la campagne, on a observé une proportion f1 =
0.20 de sujets ayant eu la grippe. Les citadins sont-ils plus atteints par la
maladie que les ruraux ? (α = 0.05)
Exercice 6 :
Une machine est réglée pour fabriquer des plaques de chocolats d’un poids ‘’moyen’’
de 250g. Soucieux de ce problème, le service de contrôle de qualité demande une
vérification de la machine. Le poids de 10 plaques de chocolats est observé. On obtient
les mesures suivantes qui vous sont immédiatement transmises : poids observés 256
245 253 250 295 251 248 247 252 249
Quelle est votre conclusion ?
Exercice 7 :
Une société de vente à distance demande à l’un de ses ingénieurs marketing de
modéliser le nombre d’appels téléphoniques par heure reçus sur le standard dédié aux
commandes, dans le but d’optimiser la taille de celui-ci. Les nombres d’appels, relevés
sur une période de 53 heures, ont été les suivants :
Nombre d’appels 𝑥𝑖 0 1 2 3 4 5 6 7 8 9 et
plus
Occurence 𝑁𝑖 1 4 7 11 10 9 5 3 2 1

Page 18 sur 19
1- Estimer la moyenne et la variance du nombre d’appels. Quelle type de loi semble
le mieux décrire ce nombre d’appel ?
2- Tester l’ajustement à cette loi au risque 5%.
3- Sachant qu’une hôtesse d’accueil téléphonique peut traiter jusqu’à 7 appels par
heure, combien d’hôtesses doit-on employer pour pouvoir répondre à 95% des
appels téléphoniques ?
Exercice 8 :
Sur 2000 personnes interrogées dans le Nord, 1040 disent acheter régulièrement des
vêtements sur le site internet de VetiLille. Sur 1500 interrogées dans le reste de la
France, 615 disent acheter sur ce site. Est-ce que ces résultats permettent de soutenir
que ce site séduit autant les habitants du Nord que du reste de la France (risque de
5%) ?

Page 19 sur 19

Vous aimerez peut-être aussi