Vous êtes sur la page 1sur 38

Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Fascicule du cours
& des travaux dirigés

Statistiques Inférentielles

Semestre 2
Année Universitaire : 2023-2024

Classes : L1MA & L1CD

Enseignants : Mizen. F._Hrabi. H._Sifaoui. S 1

Chargé du cours : M. Farhat MIZEN 1


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Chapitre 1 -VARIABLE ALEATOIRE


I. NOTION DE PROBABILITE
1. Probabilité
Un nombre compris entre 0 et 1 représentant la chance de réalisation d’un événement parmi d’autres
possibles, lors d’une expérience aléatoire.
2. Expérience aléatoire
Une expérience aléatoire est une expérience dont on ne peut pas prévoir le résultat de façon certaine
(on dit aussi « épreuve aléatoire »).
L’ensemble de tous les résultats possibles (éventualités) d’une expérience aléatoire forme l’ensemble
fondamental de cette expérience ou encore l’univers ; qu’on notera « Ω ».
3. Evènement (événement aléatoire) : On appelle événement (aléatoire), toute partie de l’univers
« Ω ». Il s’agit donc d’un sous ensemble de Ω.
II. CALCUL DE PROBABILITE
P(E) = (Nombre de cas favorables à E) / (Nombre de cas possibles)
P(E) = Card (E) / Card (Ω) et on note │E│/│Ω│
Ainsi, la probabilité d’un événement est le rapport entre le nombre de cas favorables de cet événement
et le nombre total de cas possibles de l’expérience
III. NOTION DE VARIABLE ALEATOIRE
On appelle Variable Aléatoire (V.A) le résultat caractéristique d’une épreuve aléatoire représentant
(décrivant) un caractère bien déterminé.
IV. LOI DE PROBABILITE : (Distribution de probabilité)
2
1. Cas d’une variable aléatoire discrète
On appelle loi de probabilité d’une V.A discrète, la relation qui fait correspondre à chaque valeur de la
variable X, sa probabilité de réalisation. Il s’agit ainsi de l’ensemble des couples (x i, pi) tq ∑ pi = 1 ;
souvent représenté par un tableau.
Exemple 1
Dans un jeu de « pile ou face » un individu A donne 4 DT à B, chaque fois que le côté « pile »
apparaît et reçoit 2 DT dans le cas ou c’est le côté « face » qui apparait.
Quel serait la loi de probabilité du Gain (résultat) de l’individu A ?
Exemple 2
Soit X la V.A : « Résultat d’un jet d’un dès non truqué »
1- Déterminer la loi de probabilité de X
2- Donner une représentation graphique de cette loi.
2. Cas d’une variable aléatoire continue
On appelle loi de probabilité d’une V.A continue, la fonction qui permet de déterminer la probabilité
que cette variable appartienne à un intervalle. Cette fonction est dite fonction de densité de
probabilité, notée f(x) et qui peut être représentée par une courbe. C’est ainsi l’ensemble des couples
(xi,f (xi)) tq f(x) dx = 1
Rq : 0 ≤ f(x) ≤ 1
V. FONCTION DE REPARTITION
La fonction de répartition ou fonction cumulative F d’une V.A X est la fonction qui associe à toute
valeur x de X ; la probabilité que la variable X soit inférieure ou égale à x : F(x) = P(X≤x)
1. Propriétés
 0 ≤ F(x) ≤ 1 (puisque F est une probabilité)
 Lim F(x) = 0 &lim F(x) = 1

Chargé du cours : M. Farhat MIZEN 2


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

x→ - ∞ x→ + ∞
 P(x1 ≤ X ≤ x2) = P (X≤x2) – P(X≤x1) = F(x2) – F(x1)
 P (X≥x ) = 1 - P(X≤x) = 1 – F(x)
 F est une fonction croissante sur [0,1].
2. Notion d’espérance et de variance
2.1. Cas d’une variable aléatoire discrète
E(X) = ∑ xi pipouri = 1,2,...,n

V(X) = = E(X2) – [ E(X)] 2


Exemple
Calculer pour l’exemple précédent l’espérance mathématique et la variance.
2.2. Cas d’une variable aléatoire continue

E(X) = (xf(x)) dx

V(X) = (x – E(X))2 f(x) dx

Ou encore, V(X) = = E(X2) – [E(X)] 2 Avec E(X2) = x2f(x) dx


Propriétés
 E (a X + b) = a E(X) + b
 V (a X + b) = a2 V(X)
 Soient X1 et X2 deux V.A : E(X1 + X2) = E(X1) + E(X2) 3
 E(X1 - X2) = E(X1) - E(X2)
 Pour X1 et X2 deux V.A indépendantes : V (X1 + X2) = V(X1) + V(X2)
 V(X1 - X2) = V(X1) + V(X2)

Chargé du cours : M. Farhat MIZEN 3


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Travaux Dirigés N°1


EXERCICE 1 RECESSION 0.2 12 - 10
CONFLIT 0.1 -5 18
Le chef de rayon téléphones portables d’un
magasin spécialisé a observé pendant plusieurs Vous décider de choisir comme indicateur de
semaines le nombre de téléphones portables risque l’écart type du taux de rentabilité.
vendus : 1. Calculer pour chaque type d’actions (RS,
Nbrde tél. 0 1 2 3 4 5 6 7 8 9 10 SG) l’espérance mathématique et l’écart type
portables
Nbrde 13 10 13 7 12 16 8 9 5 6 1 du taux de rentabilité. Selon l’indicateur retenu
semaines
quels titres achetez-vous.
1. Soit X « la variable aléatoire qui représente 2. En considérant que les taux de rentabilité
le nombre de téléphones portables vendus » des deux titres sont indépendants ; calculer la
a. Vérifier que X est une variable aléatoire rentabilité espérée et le risque encouru par
discrète a. Un portefeuille comportant
b. Déterminer la loi de probabilité de X b. Moitié de titres RS et moitié de titres
c. Calculer les moments (Espérance et SG
Variance) de X. c. 70% des titres RS et 30% de titres SG.
2. Soit X1, X2,…………X52 les variables 3. Faites une comparaison personnelle des
aléatoires mesurant le nombre des ventes deux portefeuilles.
hebdomadaires de téléphones portables pour EXERCICE 3
une année. On considère que ces 52 semaines L’oral d’un examen comporte 20 sujets
ont la même espérance et la même variance et possibles. Un candidat tire au hasard trois
qu’elles sont indépendantes. sujets ; parmi ces trois sujets il choisit le sujet 4
a. Soit Y « la variable aléatoire qui qu’il désire traiter. Ce candidat a révisé
mesure le nombre de ventes seulement 12 sujets. On considère la variable
annuelles de téléphones aléatoire X « Nombre de sujets révisés parmi
portables » ; Calculer E(Y) et V(Y) les trois sujets tirés ».
b. Pour l’année les charges fixes sont 1. Quelle est la loi de X
de 1200 dinars pour Y téléphones 2. Calculer l’espérance et l’écart type de X.
portables vendus. Les charges 3. Quelle est la probabilité pour que le candidat
variables sont de 80.Y et le chiffre obtienne au moins un sujet révisé.
d’affaires et CA =300Y. EXERCICE 4
3. Calculer l’espérance et la variance du Vous consultez les journaux financiers, les
bénéfice de cette entreprise. titres de participation des sociétés ‘MD ‘et ‘KJ’
EXERCICE 2 retiennent votre attention. Un intermédiaire en
Vous souhaitez effectuer des placements en bourse vous informe que les taux de
actions, les titres des sociétés RS et SG rendements globaux enregistrés pour un certain
retiennent votre attention. nombre de semaines passées ont été comme
En consultant les journaux financiers vous suit :
constatez que les taux de rentabilité des titres → Pour la société MD
sont des variables aléatoires dont les
Tx de Rten % -10 -2 3 7 10 15
distributions de probabilités résultent des
différents états de l’économie. Les données ont Nb de semaines 18 5 9 21 17 10
été regroupées dans le tableau ci-dessous : → Pour la société KJ
Etat de Pi Tx de Rtéde Tx de Rtéde SG
l’économie RS en % en % TxdeRten % -11 -5 2 8 9 10
CROISSANCE 0.4 10 15
STABILITE 0.3 -2 6 Nb de semaines 10 15 18 16 11 10

Chargé du cours : M. Farhat MIZEN 4


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

1. Déterminer les lois de probabilité de chacun 4. Quel serait votre choix selon le critère de
des taux de rendement pour ces deux sociétés rentabilité, et selon le critère du risque ?
2. Calculer l’espérance et l’écart type des EXERCICE 5
rendements de chacune des deux sociétés. Le gain annuel espéré (exprimé en milliers de
3. Dans quelle société vous choisissez dinars) d’une entreprise est une VA dont la loi
d’effectuer des placements si : de probabilité est la suivante :
a. Vous utilisez le critère de rentabilité. X -2 -1 0 1 2
b. Vous utilisez le critère du risque. P(X=x) a 1/4 b 1/4 c
c. Vous utilisez le critère de rationalité : le 1. Sachant que la distribution est symétrique et
coefficient de variabilité. que la V(X) = 1; déterminer le gain annuel
Votre conseiller vous conseille, pour minimiser moyen espéré sur un grand nombre d’années
le risque, de diversifier votre portefeuille. Il passées.
vous propose deux possibilités : 2. Soit Y le gain espéré pour la même
- Le premier portefeuille se compose de : entreprise et dans les mêmes conditions de
60% des titres de MD et 40% des titres marché si l’entreprise procède à des actions de
de KD. mise à niveau bien appropriées
- Le second portefeuille se compose de : Sachant maintenant que Y est définie par : Y =
40% des titres de MD et 60% des titres 2X2 + 1 ; déterminer sa loi de probabilité, son
de KD. espérance et sa variance.

Chargé du cours : M. Farhat MIZEN 5


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Chapitre II -LOIS USUELLES DE PROBABILITE

I. LOI BINOMIALE (loi discrète)


Soit une épreuve aléatoire dans laquelle il n’existe que deux résultats possibles, l’un étant qualifié de
favorable et l’autre de défavorable (SUCCES & ECHEC).
Soit « p » la proportion du cas favorable, q = 1 – p celle du défavorable. On réalise n épreuves
identiques et indépendantes et on notera X, la variable aléatoire : « nombre de résultats favorables ».
La probabilité que cette variable prenne une valeur particulière x est :
P(X=x) =Cnx .px .q(n-x )
Cette relation définit la loi Binomiale de probabilité. Elle dépend de deux paramètres ‘n’ et ‘p’.
1. Conditions d’application de la loi
→L’épreuve est dichotomique, elle ne comporte que deux résultats possibles.
→Les répétitions de cette épreuve sont mutuellement indépendantes, ainsi la probabilité du cas
favorable p est constante.
2. Caractéristiques de la loi
Soit X une variable aléatoire qui suit une loi binomiale de paramètres n et p.
On notera alors : X ß (n,p)
Les caractéristiques de cette loi sont : E (X) = np et V (X) = np (1-p) = npq → σ = √ npq
Exemple 1
Grâce aux tarifs réduits de toutes sortes, 90% des voyageurs de la compagnie de transport TTT
bénéficient de tarifs réduits. Chaque soir, un contrôleur prend les billets de 5 passages choisis au
6
hasard dans 5 voitures différentes, et note le nombre X de billets à tarif réduit qu’il trouve parmi eux.
Déterminer la probabilité qu’il trouve un seul billet à tarif réduit, puis la loi de X, son espérance et sa
variance.
Explication
Regarder un billet constitue une épreuve ayant deux issues possibles :
Tarifs réduit (avec une probabilité p = 0,9)
Tarifs non réduit (avec une probabilité q = 1-p = 0,1)
Cette épreuve est répétée 5 fois, et l’on peut supposer les épreuves indépendantes. X, nombre de
billets à tarif réduit obtenus au cours de ces 5 épreuves, suit donc la loi binomiale de paramètres 5 et
0,9.
On a donc P(X=x) = C51 .0,91 .0,14 = 0,00045
Remarque : dans cet exemple, les tirages sont effectués sans remise (le contrôleur ne vérifie pas
plusieurs fois le billet d’un même passager), on peut admettre cependant que les épreuves sont
indépendantes dans la mesure où les passagers sont choisis « au hasard » dans une population assez
grande pour que la proportion de passagers bénéficiant d’un tarif réduit reste la même à chaque tirage.
La formule P(X=x) = C5k .0,9k .0,15-kappliquée à tous les entiers entre 0 et 5 nous permet de donner le
tableau suivant :
K 0 1 2 3 4 5
P(X=x) 0,00001 0,00045 0,00810 0,07290 0,32805 0,59049
On peut vérifier que l’on a ∑ (X = k) = 1.
−¿¿
Espérance : E(X) = ∑ k P(X=k) = 4,5 = np et Variance : V(X) = ∑ k2 P(X=k) –( x )2= 0,45 = √ npq
L’espérance de X est de 4,5 billets, et sa variance est égale à 0,45.
Exemple 2

Chargé du cours : M. Farhat MIZEN 6


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Soit une machine qui produit des pièces défectueuses en proportion p=10%. On choisi 5 pièces au
hasard et on observe si chaque pièce est défectueuse ou non. Quelle est la probabilité d’avoir :
- 0pièce défectueuse.
- Au moins 1 pièce défectueuse.
- Au plus 2 pièces défectueuses.
Remarque
Soient : X1  (n1, p) et X2 (n2,p) : 2 V.A indépendantes, on a alors
Y = X1 + X2  (n1+ n2 , p).
Si n = 1 ; X  (1, p) ≡  (p)On parle d’un cas particulier de la loi inomiale : soit la loi de
ernouilli. Ainsi, la loi inomiale est la répétition n fois de la loiernouilli,
La valeur de probabilité d’une V.A qui suit la loiinomialepeut être lue directement à partir d’une
table statistique de la loiinomiale.
Exemple
Soit un processus de contrôle de qualité qui repose en une dernière étape sur l’observation par
échantillonnage d’une partie de la production. Le chef de contrôle sépare entre 3 types de produits
ayant tous le même risque de défectuosité, soit 5%.
Sachant qu’il procède, périodiquement, au prélèvement de 25 articles du type 1, 20 articles du type 2
et 15 articles du type 3 (proportionnellement à leurs quantités produites).
1. Caractériser les V.A « X1, X2, X3 » indiquant « le nombre d’articles défectueux respectivement dans
le premier, le deuxième et le troisième prélèvement » : leurs lois, leurs espérances, et leurs écarts
types. On suppose que les Xi sont indépendants. 7
2. Calculer chacune des probabilités d’observer 1 article défectueux du type 1, la probabilité
d’observer 1 article défectueux du type2 et la probabilité d’observer 1 article défectueux du type 3
parmi ceux observés.
3. Caractériser la V.A Y « nombre d’article défectueux observés lors du contrôle quelques soient
leurs types-».
4. Calculer la probabilité d’obtenir 3 articles défectueux –un de chaque type-.
5. Que peut-on déduire ?

II. LOI DE POISSON (loi discrète)


1. Exemple
Une fabrication en série présente, en moyenne 1,5% de produits défectueux. Un contrôle est effectué
sur un lot de 30 articles choisis au hasard.
1. Quelle est la probabilité d’obtenir dans ce lot 2 articles défectueux ?
2. Quelle est la probabilité d’obtenir dans ce lot 1 article défectueux ?
3. Comparer les valeurs des probabilités trouvées (dans 1. et 2.)Par celles qu’on peut trouver par la

relation P(X=x) =
2. Définition
Loi de poisson : Cette loi, étudiée par « Siméon Dénis Poisson-1837 » est apparue comme un cas de la
loi binomiale quand n est grand ; p est petit et (np)est moyenc.à.d. quand le nombre d’épreuves
répétées augmente alors que la probabilité de succès est faible. Ainsi, la loi de poisson est qualifiée
de « loi des évènements rares ». En effet, on peut, sous certaine conditions, remplacer (approximer)

Chargé du cours : M. Farhat MIZEN 7


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

la loi inomiale (n,p) par la loi de Poisson de même espérance mathématique P(np).En pratique, on
admet que cette approximation est satisfaisante pour : n≥30 & p<0,1.
Notons : λ = np c'est-à-dire la valeur moyenne de la variable
( λ ) x -λ
On aura pour X P(λ)P(X=x) = .e
x!
3. Conditions d’application de la loi
1erCas
Les conditions d’application de la loi binomiale sont réunies.
La probabilité du cas favorable est faible (p<0,1).
Le nombre des épreuves est grand (n≥30).
« np » est moyen ( np≤ 15 )
Evènement aléatoire qui suit la loi de poisson par approximation à partir de la loi inomiale.
4. Exemple
Dans un test de contrôle qualité, on a procédé aux observations suivantes d’un lot de 50 pièces. Le
taux de défectuosité relevé étant de 6%.
1. Calculer la probabilité d’obtenir 10 pièces défectueuses dans le lot choisi.
2. Quel est le nombre moyen de pièces défectueuses qu’on peut estimer avoir et quel en est l’écart
type.
2ème Cas
Il s’agit dans ce cas (et non exclusivement) de la loi du nombre de réalisation de circonstances (cas)
indépendantes d’un évènement rare dans un certain laps de temps du temps ( exemples : nombre 8
d’accidents du travail dans une usine pendant une période T ; nombre d’arrivées d’étudiants en classe
pendant la période de déroulement du cours – après un quart d’heure- ; nombre d’appels téléphoniques
pendant un intervalle de temps, le nombre d’arrivées par heure à un guichet d’une compagnie
aérienne, le nombre de pots de café vendus en une journée,…).
Exemple 1
Dans un magasin au centre ville avec 6 caisses, 60 clients sont en moyennes servis par un quart
d’heure.
1. Quelle est la probabilité qu’il y ait 15 clients servis par caisse en un quart-d’heure ?
2. Quelle est la probabilité qu’il y ait 30 clients servis par caisse en une demi-heure ?
Exemple 2
Supposons qu’il arrive en moyenne 3 voitures par minute à un poste de péage d’une autoroute. Quelle
est la probabilité qu’exactement 5 voitures se présentent au poste de péage en 1 min ?
5. Caractéristiques de la loi
Soit X une V.A tel que X suit P(λ) : les paramètres caractéristiques de cette loi sont :
E(X) = λ et V(X) = λ d’où X =
Remarque
Soient : X1suit P(λ1) et X2suit P(λ2) : 2 V.A indépendantes, on a alors Y = X1 + X2 suitP(λ1 +λ2) .
La valeur de la probabilité d’une V.A qui suit la loi de poisson peut être lue directement à partir d’une
table statistique de la loi de poisson.
En pratique,
pratique on pratiquer la distribution de Poisson si les conditions suivantes sont satisfaites :
 Le nombre moyen (λ) d’occurrences (cas) demeure constant dans chaque unité de temps ou de région ;
 La probabilité d’observer plus d’une occurrence dans un petit intervalle de temps ou une petite région
est négligeable (presque nulle) ;

Chargé du cours : M. Farhat MIZEN 8


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

 Le nombre d’occurrences dans tout intervalle de temps ou dans une région ne dépend pas du nombre
d’occurrences dans un autre intervalle de temps ou une autre région.
 Ces conditions apparaissent un peut difficile à cerner par la seule voie théorique. Ainsi, nous nous
limiterons pour le présent cours à la condition d’applications citées ci-dessus dans 1°-(1er et 2 ème
CAS)pour parler de l’application de la loi de Poisson. Ceci ne forme pas une négligence au risque
d’erreur possible puisque nous allons voir dans le dernier chapitre « tests d’hypothèses non
paramétriques » un test permettant, entre autres, de vérifier objectivement –par calcul selon
desstandards- la distribution d’une variable aléatoire donnée selon une loi de probabilité usuelle bien
déterminée.

III. Loi NORMALE (loi continue)


Une V.A continue X suit la loi normale d’espérance
m et de d’écart type  si elle admet pour densité la
fonction f définie sur R par :

f(x) =
On note : X N (m, σ)
1. Propriétés
f (x) ≥ 0, |R f(x) dx = 1
Pour noter qu’une variable suit une loi normale
d’espérance ‘m’ et d’écart type’ ‘σ’.

9
2. Caractéristiques de la loi
Analytiquement
Si X est une V.A qui suit N (m, σ)
AlorsE(X) = m et V(X) = σ2
Rq : La fonction y = f(x) est entièrement définie et connue dès l’instant ou l’on connaît les valeurs des
paramètres m et σ.
Graphiquement
La courbe représentative de la loi Normale a l’allure d’une courbe en cloche : elle est symétrique par
rapport à « m » abscisse pour lequel elle passe par un maximum et elle admet l’axe des x comme
asymptote.
3. Conditions d’application de la loi
1er Cas
Les facteurs de variations de X sont nombreux
Les fluctuations de X dues à ces différents facteurs sont indépendantes les uns des autres
Les fluctuations de X dues à ces différentes facteurs doivent être suffisamment petites et
approximativement du même ordre de grandeur.
2ème Cas
Sous certaines conditions plusieurs autres lois de probabilité convergent vers la loi Normal (d’ailleurs
c’est de ce fait que cette loi tire son importance)
4. Loi Normale Centrée Réduite N(0,1)
Si une V.A continue T suit la loi normale centrée réduite (c.à.d. ‘’m=0 et =1”) a pour densité

f(t) =

Chargé du cours : M. Farhat MIZEN 9


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

On considère la variable aléatoire X suit N (m, ) on veut calculer la probabilité suivante : P(X ≤x1).
Le problème c’est qu’on ne dispose pas d’une table de probabilité pour les différentes lois Normales
(suivant les valeurs de m et σ) car il faudra prévoir une infinité.
Ainsi, et à fin de faciliter l’usage de la loi Normale pour une V.A
X N (m, σ) ; on définit une nouvelle variable :

Cette nouvelle VA obéit à une loiNormale puisque Z est une fonction linéaire de X qui est une
variable Normale (m, σ).

Sa moyenne est donnée par * E(Zi) = E[ ]= = =0

Sa variance est de : * V(Zi) = V = V(Xi) = 2 = 1


Puisque les xi d’une V.A suivant la loi Normale sont indépendants
D’où ZiN (0, 1) Z est une V.A Normale centrée réduites

→ Ainsi, la probabilité qu’on cherche à déterminerP(X ≤x1) sera :

10
P(X ≤x1) = P(X – m ≤ x1 – m) = P[ ≤ ] = P[Z ≤ z1]

Avec, z1 = . Cette dernière probabilité sera déterminée à partir de la table de la loi Normale
Remarques
1. L’intérêt de ce changement de variable est qu’il permet de ramener n’importe quelle distribution
normale à une même loi de probabilité qui est la loi normale centrée réduite N (0 , 1) pour laquelle on
dispose d’une table de probabilité.
2. L’airelimitée par la courbe représentative de la fonction de densité (distribution) de probabilité est

« f(x)dx = 1 »
3.La fonction de répartition d’une VA : F(zα) = P( Z ≤ zα ) sera notée par Π : c.à.d. que P( Z ≤ zα ) =
Π (zα).
4. Lecture de la table N (0 ,1) et de sa courbe :
Pour avoir la probabilité qui correspond à z α = 1,57 il faut lire l’intersection de laligne 1,5 et de la
colonne 0,07 ( : 1,57 = 1,5 + 0,07).Ainsi P (Z ≤ 1,57) =Π (1,57) = 0,9418
Π (1,57) se représente par l’aire de la portion du plan située entre {l’axe des abscisses et la courbe de
la densité de probabilité de Z (de la part de l’axe des ordonnées)}
&{- et la droite verticale d’équation x = 1,57 (de la part de l’axe des abscisses)}.
1. La valeur de Π (zα) ne peut être que lue à partir de la table de la loi Normale. Pour la trouver sur la
table il faut que la valeur de « zα » soit positive: zα ≥ 0.
SINON,pour des valeurs de zα ≥ 0 : P (Z ≤ - zα) = P (Z ≥ z α)= 1 - P (Z ≤ z α) =1 - Π (zα) D’où Π (-zα) =
1 - Π (zα)

Chargé du cours : M. Farhat MIZEN 10


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

2. Dans le cas où on connaît la valeur de Π (zα) et on cherche à déterminer la valeur de zα: pour la
trouver cette dernière sur la table il faut que la valeur de Π (zα) ≥ 0,5. SINON, il faut procéder aux
transformations précédentes (5°-)
1- P (z1 ≤ Z ≤ z2) = P (Z ≤ z2) – P(Z ≤ z1) = Π (z2) - Π (z1)
2- P (|Z| ≤ zα ) = P(-zα ≤ Z ≤ zα)
3- SI X1suit N(m1, 1) et X2suit N(m2, 2)

ET {X1 et X2} sont indépendantesALORS, X1 + X2 suit N (m1+m2, )

ET, X1 - X2N (m1- m2, )


4- SIX suit N (m,) et a > 0
ALORS, aX + b suit N(am+b, a)
Application
Soit X suit N (100 ; 10).
1/ Comment arrive-t-on à déterminer la Probabilité de P(X ≤ xi)
2/ Calculer les probabilités suivantes :
P(X ≤ 110), P(X ≥ 105), P (110 ≤ X ≤ 120), P ( |X| ≤ 110) et P(X ≤ 90)
IV. APPROXIMATION PAR UNE LOI NORMALE
SI la V.A discrète X qui suit (n,p) et si l’une des conditions suivante est réalisée :
n « grand » :≥ 30 & p et q voisins de 0,5
OUnp> 15 et nq> 15
OUnpq> 10 11

ALORS, On peut approcher la loi Normale de paramètres np et c.à.d.

X devient : X suit N (np, )


SI la V.A discrète X suit P(λ) et si λ est « grand » (λ> 10),
ALORS, on peut approcher la loi de X par la loi Normale de paramètre λ et c.à.d.
X devient : X suit N (λ, )
V. APPROXIMATIONS DES LOIS
Loi réelle Loi approchée Conditions d’approximation
inomiale(n, p) De Poisson P (np) n≥30 ,p≤0,1 et np ≤ 10
n≥30 et p voisines de 0,5
inomiale(n,p) Normale N(np, ) OU {np> 15 et nq> 15}
OUnpq> 10
De Poisson P(λ) NormaleN (λ, ) λ > 10
COMPLEMENT
1. LA LOI KHI – DEUX : (X2)
Contrairement aux autres lois, que nous avons présentées, la loi Khi- deux (et par la suite la loi de
Student) est définie par des transformations sur d’autres variables aléatoires et non directement par
leur d.d.p.
1.1. Définition
Soient X1 , X2,…, Xn des V.A indépendants, chacune étant distribuée suivant la loi Normale Centrée
Réduite : Xisuit N(0,1) ∀ ;

Chargé du cours : M. Farhat MIZEN 11


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

n
Soit X= ∑ x i2= x12+ x22+ … + xn2
i=1

La loi de X est appelée loi de Khi-deux à « n » degrés de libertés et on note X suit X2(n)
1.2. Caractéristique
X suit X2(n) E(X) =n et V(X) =2n
Graphiquement : la courbe de la loi X2n’est pas symétrique.
2. LA LOI DE STUDENT
2.1. Définition
Soient X et Y : deux variables aléatoires Indépendantes suivant respectivement la loi N (0,1) et la
loiX2 (n).
Xsuit N (0,1)et Ysuit X2(n)

Considérons la variable
La loi de T est appelée loi de Student ; à n degrés de liberté (n=nombre de variables indépendantes
dans Y)
T suit St (n)

2.2. Caractéristiques : E(X) = 0, V(X) = pour n > 2

12

Chargé du cours : M. Farhat MIZEN 12


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

13

Annexe : Table de la loi Normale

Chargé du cours : M. Farhat MIZEN 13


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Travaux dirigés N° 2
EXERCICE 1 EXERCICE 4 :
Un professeur a dix étudiants et pose trois Une entreprise fournit à un client des
questions. Sachant que le professeur interroge petites tiges métalliques dont la longueur doit
au hasard, quelle est la loi de probabilité du se situer dans l’intervalle [8cm, 12 cm].
nombre de questions posées à un étudiant Toutefois le procédé de fabrication de
particulier (bien déterminé) dans chacun des l’entreprise produit des tiges de longueur
cas suivants : moyenne de 10 cm et d’écart type 1cm ; on
Le professeur n’a pas de mémoire admet que la longueur est distribuée
Le professeur a de la mémoire normalement. Si une tige est longue, elle peut
EXERCICE 2 : être coupée pour rencontrer les normes mais un
Le directeur d’une agence de location de coût supplémentaire de 0.250 DT la tige. Si
voitures affirme que la probabilité qu’une de la tige est trop petite, elle doit être rejetée.
ses voitures louées ait un accident dans la 1- Sur une fabrication de 10 000 tiges, combien
journée est de 0.01 ; alors que l’un de ses devront être jetées ?
chauffeurs déclare que la probabilité qu’une 2- S’il en coûte 500 DT pour fabriquer 1000 tiges
des voitures louées ait un accident dans une et que le prix de vente unitaire est de 0.900 DT.
journée est 0.16. ( la probabilité qu’une voiture A quel profit l’entreprise doit elle s’attendre de
louée ait plus d’accident par jour est supposée faire pour une fabrication de 10 000 tiges.
nulle). Les accidents sont supposés EXERCICE 5 :
indépendants les uns des autres. On sait qu’une distribution normale est telle
Chaque jour 1000 voitures de l’agence sont en que :P( X< 100) = 0,9772 et P(X < 70) =
circulation. Soit R la VA égale le nombre de 0,1587
voitures de location de l’agence ayant un Calculer l’espérance mathématique et l’écart
accident dans une journée. type. 14

1- On suppose que cette probabilité est égale à EXERCICE 6 :


0.01 La note à un test d’aptitude passé par un
a- Identifier la loi de probabilité de R, en déduire groupe de 200 étudiants en début d’année est
E(R) et V(R) supposé suivre une loi normale de moyenne 9
b- Calculer P( R=4) et P( R≤5) et d’écart type 2. L’enseignant décide de faire
2- On suppose maintenant que la probabilité des séances de rattrapage pour les étudiants
qu’une voiture louée ait un accident est 0.16 et dont les notes sont les plus faibles mais il ne
que le nombre de voitures mis en circulation peut encadrer que 30 étudiants.
est 250. Identifier de nouveau la loi suivie par Quelle est la note limite permettant à un
R et calculer P(R=36), P( R ≤36) et P( 26≤ R étudiant de bénéficier des cours de rattrapage ?
≤30) EXERCICE 7 :
EXERCICE 3 : Un bureau de réservation reçoit, entre 10h00 et
Le comité de sécurité d’une entreprise a 12h00, en moyenne 1,2 appels téléphoniques
établie que le nombre d’accidents de travail en par minute.
une journée étant d’une moyenne de 1,6. On modélise ce phénomène par une variable
1- Déterminer la probabilité d’observer plus de aléatoire X. Déterminer :
deux accidents par jours. 1. La probabilité pour qu’entre 11 h 00 et 11 h 01,
2- Déterminer la probabilité d’observer plus de on ait :0 appel, 1 appel et 2 appels,
deux et moins de cinq accidents par jour 2. La probabilité de recevoir 4 appels entre 11 h
3- Déterminer l’espérance et la variance 00 et 11 h 02.
concernée. EXERCICE 8
4- Sachant que le nombre d’accidents en une Une entreprise de fabrication d’ampoules
journée est indépendant du nombre d’accidents électriques afin de contrôler la qualité d’une
de travail en une autre journée, déterminer la nouvelle gamme d’ampoules économiques, a
loi de probabilité de la variable aléatoire Y choisi au hasard un échantillon de 40 unités.
« nombre d’accidents de travail en une trois Sachant que le risque de défectuosité résultant
journées » ; ainsi que E(Y) et V(Y). des conditions de stockage des articles est de
Chargé du cours : M. Farhat MIZEN 14
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

5%, et que la production sera acceptée si le b) calculer la probabilité de l’événement (Y >


nombre d’unités défectueuses ne dépasse pas 4 1920)
unités, quelle serait alors la probabilité c) calculer la probabilité de l’événement (1920
d’acceptation du présent stock. <Y < 1940)
EXERCICE 9 5- trouver le nombre entier « a » tel que la
Dans une étude de comportement d’achat de probabilité de l’événement (Y < a) soit égale à
consommateurs, on suppose qu’à chaque heure 0.975
« 4 » unités en moyenne sont vendues d’un EXERCICE 11
produit. On suppose que les achats de ce L’hypermarché « PROMO+ », nouvellement
produit à des temps différents sont implanté auprès d’une grande agglomération,
indépendants les uns des autres. procède de temps à autre à des sondages
1) Quelle est la loi de probabilité de X « nombre aléatoires afin de mieux connaître sa clientèle.
d’unités de ce produit vendues en 30 minutes La taille des échantillons est de 275. Lors du
(mn) » ? dernier sondage qui a porté sur un échantillon
2) Calculer son Espérance et sa Variance. de 275 ménages différents, il s’est avéré que 55
3) Calculer la probabilité de vendre moins de 3 des interrogés sont des clients de
unités en 30 mn. « PROMO+ ».
4) Le magasin est ouvert 7 heures 30 mn par jour. 1) Donner la loi de probabilité de X « nombre des
Quelle est la loi de probabilité de Y « nombre clients de PROMO+ », si l’on admet
d’unités vendue par jour » ? l’hypothèse que la vraie proportion « p» des
5) Par quelle loi peut on approximer la loi de Y. clients de cet hypermarché dans cette
EXERCICE 10 : agglomération est de 15% et calculer
On s’intéresse aux ventes journalières d’un l’espérance E(X) et la variance V(X).
article A, commercialisé par un magasin de 2) En déduire la loi de probabilité de f n = X/n, son
gros. Le réapprovisionnement quotidien du espérance E(fn) et sa variance V(fn). 15

magasin permet de reconstituer le stock initial 3) Par quelle loi peut on approximer la loi de X?
de l’articles A, chaque matin de jour ouvrable. justifier.
Pour chaque jour ouvrable la probabilité de 4) En déduire une approximation de la loi de fn.
rupture de stock est de 0.05. Il y a On rejette maintenant l’hypothèse que la vraie
indépendance entre les différentes ruptures de proportion « p» des clients étant de 15%.
stock possibles. 5) Donner une estimation ponctuelle de la
Soit X la variable aléatoire qui, à chaque proportion des clients de « PROMO+ ».
prélèvement de 50 jours ouvrables, associe le 6) En déduire le changement à apporter à
nombre de jours, sur les 50, ou il y a rupture de l’approximation de la loi de X obtenue.
stock en article A 7) En déduire le changement à apporter à
1- Déterminer la loi suivie par X et calculer son l’approximation de la loi de fn obtenue.
espérance mathématique 8) Donner une estimation par intervalle de
2- Calculer la probabilité de l’événement (X = 2), confiance de la proportion des clients de
puis celle de l’événement (X  2) « PROMO+ » avec un niveau de confiance de
3- On décide d’approcher la loi de X par la loi de 90%.
poisson de même espérance calculer avec cette EXERCICE 13
approximation la probabilité de l’événement Soit une unité production qui fabrique des tiges
(X = 2). Que peut-on conclure avec une longueur suivant la loi normale de
4- Soit Y la variable aléatoire qui, à chaque jour moyenne 10 cm et un écart type de 1cm. Le
ouvrable associe le nombre d’articles vendus. chef de cette unité veut établir une norme de
On admet que Y suit approximativement une contrôle qui consiste à fixer une longueur
loi normale de moyenne 1800 et d’écart type maximale et une longueur minimale à
200 et que les ventes des différentes journées considérer comme limites de tolérance pour
sont indépendantes l’ensemble des tiges acceptables.
a) calculer la probabilité de l’événement (Y < 1) Quelle est la longueur maximale à tolérer pour
1940) que la probabilité qu’une tige soit rejetée parce
qu’elle est assez longue (sa longueur dépasse la
Chargé du cours : M. Farhat MIZEN 15
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

limite maximale tolérée) ne représente que 1) Calculer la probabilité qu’il y ait 50 étudiants
0,025. servis en un ¼ d’heure.
2) Quelle est la longueur minimale à tolérer pour 2) Quelle approximation peut on envisager dans
que la probabilité qu’une tige soit rejetée parce ce cas?
qu’elle est assez courte (sa longueur est Le directeur du restaurant cherche à étudier le
inférieure à la limite minimale tolérée) ne besoin de recrutement supplémentaire. Il juge
représente que 0,025. qu’il y aurait besoin d’un nouvel ouvrier s’il
EXERCICE 14 : trouve que moins de 45 étudiants sont servis en
« ROULETABILLE » est une entreprise qui un ¼ d’heure.
fabrique des roulements avec un diamètre 3) Calculer la probabilité qu’il y ait un nouveau
suivant la loi normale de moyenne 10 mm et recrutement.
un écart type de 1mm. Le directeur Technique EXERCICE 16 :
veut établir une norme de contrôle qui consiste Le processus de fabrication d’un outillage a
à fixer un diamètre maximal et un diamètre donné 10% de produits défectueux.
minimal à considérer comme limites de 1. Trouver de deux méthodes la probabilité
tolérance pour l’ensemble des roulements que dans un échantillon de 40 outils, pris
acceptables. au hasard, deux exactement seront
1) Quel est le diamètre maximal à tolérer pour défectueux.
2. Caractérisez la variable en question.
que la probabilité qu’un roulement soit rejeté
parce que son diamètre est assez long (son EXERCICE 17 :
diamètre dépasse la limite maximale tolérée) Une étude, effectuée lors de l’élaboration d’un
ne représente que 0,005. Projet de Fin d’Etudes au restaurant de l’ISET
2) Quel est le diamètre minimal à tolérer pour que de Djerba, a relevée qu’en moyenne 20
la probabilité qu’un roulement soit rejetée étudiants sont servis en un quart d’heure (15
parce que son diamètre est assez court (son 16
min).
diamètre est inférieur à la limite minimale 1- Quelle est la probabilité qu’il y
tolérée) ne représente que 0,005. ait 50 étudiants servis en une demi-heure ?
EXERCICE 15 2- Caractérisez la variable utilisée.
Le directeur d’un restaurant universitaire veut EXERCICE 18 :
estimer l’effectif des étudiants fidèles au repas Identifier lesquelles des variables suivantes
du restaurant. Il estime pour chaque étudiant la obéissent à une loi binomiale et si tel est le cas,
probabilité qu’il prend son repas dans le déterminer les paramètres de cette loi.
restaurant universitaire pour une journée est de a) La distribution de la langue maternelle dans un
0,6. On suppose qu’il y a indépendance entre pays s’établit ainsi :
les décisions des étudiants. - Français : 65,3 %
A. ) Afin de mieux construire des prévisions des - Anglais : 21,7 %
comportements des étudiants, il procède à une - Allemand : 13 %
enquête auprès de 100 étudiants. On définit les variables aléatoires suivantes
Soit X « nombre d’étudiants prenant leurs pour un échantillon choisi avec remise de 100
repas régulièrement (fidèles) au restaurant personnes et on définit :
universitaire ». - X : nombre de personnes dans l’échantillon
1) Déterminer la loi de X. dont le langage maternel est le français.
2) Calculer son espérance et son écart type. - Y : nombre de personnes dans l’échantillon
3) Par quelle loi peut on approximer la loi de X. dont le langage maternel est l’anglais.
justifier. - W : nombre de personnes dans l’échantillon
4) Calculer la probabilité que le nombre dont le langage maternel n’est le français ni
d’étudiants fidèles au restaurant universitaire l’anglais.
dépasse la moitié des interrogés. b) On lance, en même temps, 5 dés bien
B. ) On s’intéresse maintenant à la variable Y : équilibrés.
« nombre d’étudiants servis en un ¼ d’heure ». Soient :
On admet que Y suit la loi de Poisson avec λ = - X : nombre de faces « 6 »
45. - Y : nombre de résultats pairs.
Chargé du cours : M. Farhat MIZEN 16
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

- W : nombre de paires observées sur chacun des b) Le professeur cherche la probabilité de


dés. compter au moins 25 réussites dans sa classe.
c) Une urne contient 15 boules dont 9 sont Calculer cette probabilité.
blanches, les autres etant noires. EXERCICE 23:
On tire successivement trois boules au hasard Le kilométrage annuel moyen réalisé par les
et sans remise de la boule tirée. véhicules d’une entreprise suit une
La variable aléatoire X représentant le nombre N(15.000 ;6.000).
de boules tirées. Rechercher :
EXERCICE 19 : a) La probabilité que les véhicules parcourent
1% des pièces produites par une machine sont moins de 25.000 Km par an.
défectueuses. On choisit au hasard et avec b) La probabilité que les véhicules parcourent
remise un échantillon de 50 pièces d’un lot de plus de 25.000 Km par an.
5.000 pièces produites par cette machine. c) La probabilité que les véhicules parcourent au
Soit X : la variable aléatoire représentant le moins de 25.000 Km par an.
nombre de pièces défectueuses dans d) Le nombre maximum de Km parcourus par les
l’échantillon. véhicules sachant qu’il a 4,65% de chance de le
a) Déterminer la loi de distribution de la réaliser.
probabilité de X et identifier ses paramètres. e) Le nombre minimum de Km parcourus par les
b) Calculer la probabilité de ne retrouver aucune véhicules sachant qu’il a 4,65% de chance de le
pièce défectueuse parmi les 50 pièces choisies. réaliser.
c) Calculer la probabilité que le nombre des f) Le nombre de Km annuel maximum à
pièces défectueuses dépasse 1. parcourir par les véhicules sachant qu’ils l’ont
d) Calculer l’espérance et l’écart type de la réalisé avec une probabilité de 50%.
variable Aléatoire X. EXERCICE 24 :
EXERCICE 20 : « Radio-FM » est l’une des radios libres qui 17

Soit X une variable aléatoire qui obéit à une loi émet sur la région Sud-est de la Tunisie où la
normale de moyenne 100 et écart type 15. concurrence est assez vive. Les animateurs de
XN(100 ;15) « Radio-FM » souhaitent connaître son
Calculer les probabilités suivantes : audience auprès des étudiants de l’Université
P(100 ≤ X ≤ 120), P(X ≤ 130), P(X > 130), du Sud afin de mieux cerner le profil des
P(X < 90), P(X ≥ 90), P(90 < X ≤ 100) et P(90 auditeurs. Pour se faire, ils ont interrogé un
≤ X ≤ 115) échantillon de 400 étudiants pour déterminer
EXERCICE 21 : s’ils sont ou non des auditeurs de « Radio-
Le salaire annuel des employés d’une FM ». Il s’est avéré que 100 étudiants parmi les
entreprise est distribué selon une loi normal : étudiants interrogés sont des auditeurs de
N(18.000 ;4.000) « Radio-FM ».
Si on considère un de ses employés (choisi au 1) Donner la loi de probabilité de X « nombre
hasard), quelle est la probabilité : d’auditeurs de « Radio-FM », si l’on admet
a) qu’il s’agisse d’un employé qui gagne plus de l’hypothèse que la vraie proportion « p»
20.000 D d’auditeurs de cette radio dans cette région est
b) qu’il s’agisse d’un employé qui gagne au de 12%.
moins 18.500 D 2) Calculer l’espérance et la variance de X.
c) qu’il s’agisse d’un employé qui gagne entre 3) En déduire la loi de probabilité de fn = X/n.
17.000 D et 17.500 D 4) Calculer l’espérance et la variance de fn.
EXERCICE 22 : 5) Par quelle loi peut on approximer la loi de X?
Dans un établissement universitaire, le taux de justifier.
réussite est de 74%. Le professeur d’un groupe 6) En déduire une approximation de la loi de fn.
de 35 élèves pense que ce groupe se situe On rejette maintenant l’hypothèse que la vraie
exactement dans la moyenne. proportion « p» des clients étant de 12%.
a) Identifier la variable aléatoire, ses valeurs 7) Donner une estimation ponctuelle de la
possibles, sa nature et sa loi de probabilité. proportion clients de « Radio-FM ».

Chargé du cours : M. Farhat MIZEN 17


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

8) En déduire le changement à apporter à 7 Déterminer x1 et x2 tel que P(X<x1) = 2.5%


l’approximation de la loi de X obtenue. et P(X>x2) = 2.5%.
9) En déduire le changement à apporter à EXERCICE 26
l’approximation de la loi de fn obtenue. Dans un centre de thalassothérapie, le soin
10) Donner une estimation par intervalle de apporté aux clients est tel que, en moyenne, le
confiance de la proportion d’auditeurs des nombre de clients insatisfaits n’est que de 8
auditeurs de « Radio-FM » avec un niveau de clients sur 100.
confiance de 95%. Cette année, on vient d’interroger au hasard
EXERCICE 25 500 clients qui ont fréquenté le centre.
Une chaîne d’agence de voyage désire étudier Soit X la variable aléatoire : nombre de clients
la qualité de ses prestations de service. Pour ce insatisfaits dans l’échantillon de 500 clients.
faire, elle fait établir par un bureau d’études la 1) Quelle est la loi de probabilité de X.
distribution empirique des arrivées de la 2) Préciser son espérance et sa variance.
clientèle à un guichet, en notant le nombre de 3) Déterminer la probabilité des événements
personnes (xi) entrant, pour chacune de n = suivants :
2 000 périodes de 5 minutes choisies a- moins de 4 clients insatisfaits.
aléatoirement dans les 3 heures les plus b- plus de 3 clients sont insatisfaits.
chargées de la journée. Le tableau suivant a été c- exactement 3 clients sont insatisfaits.
obtenu : d- au moins 2 clients sont insatisfaits.
xi ni 4) La loi trouvée peut elle être approximée par
0 163 d’autres lois. Justifier et calculer les
1 418 probabilités précédentes.
2 500
3 437
5) Déterminer x1 et x2 tel que P(X<x1) = 2.5%
4 270 et P(X>x2) = 2.5%.
EXERCICE 27 18
5 128
6 57 Dans un hôtel, le niveau élevé de service offert
7 19 est tel que, en moyenne le nombre de clients
8 6 insatisfaits n’est que de 30 clients sur 1000.
9 2
Cette année, on vient d’interroger au hasard
1) Calculer la moyenne et la variance 200 clients qui ont fréquenté l’hôtel. Soit X la
2) À quelle loi théorique estimez-vous pouvoir variable aléatoire « nombre de clients
ajuster la distribution observée appels reçus ? insatisfaits dans l’échantillon ».
Justifier. 1) Quelle est la loi de probabilité de X ?
3) Calculer les probabilités suivantes : 2) Préciser son espérance et sa variance
P (X = 3) ; P (X ≤ 10) ; P(X < 10) ; P(X ≥ 5) et 3) Calculer P(X = 2), P(X<2), P(X>=2).
P(X>5). 4) Par quelle loi peut on approximer la loi de la
4) Déterminer la loi de probabilité de la variable aléatoire X ? Justifier et préciser le(s)
variable X « nombre de client reçus par paramètre(s) de cette loi.
l’agence » sachant que les résultats de cette 5) Calculer les probabilités précédentes et
observation sont valables pour tous les clients conclure ?
reçus par les autres guichets qui sont au 6) Si le nombre de clients insatisfaits est, en
nombre de 9 (c’est à dire 10 guichets). moyenne, égale150 clients sur 1000, par quelle
5) Trouver une approximation possible de la loi peut on approximer la loi de X ? Préciser
loi suivie par X. le(s) paramètre(s) de cette loi.
6) Calculer P(X<25), P(X>15), P (15<X<20). 7) Trouver x1 et x2 tel que P(x1<X<x2) =
99%.

Chargé du cours : M. Farhat MIZEN 18


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Chapitre 3 - L’Echantillonnage

I. L’ECHANTILLONNAGE ET L’INFERENCE STATISTIQUE


Le but de l’analyse statistique est d’apporter de l’information sur des phénomènes insuffisamment
connus, afin de permettre de tirer des conclusions ou de prendre des décisions plus éclairées
relativement à ces phénomènes. Cette analyse statistique s’effectue sur une masse de données
numériques (concernant le phénomène étudié) qu’il faut collecter d’une façon adéquate. Le plus
souvent, cette masse de données numériques résulte de l’observation d’une partie seulement de la
population concernée, c’est-à-dire que l’analyste ne dispose que d’une information partielle sur le
phénomène étudié. D’une façon générale, l’inférence statistique est constituée de l’ensemble des
méthodes statistiques qui ont pour but de tirer des conclusions, ou d’aider à prendre des décisions au
sujet d’une population à partir d’une information partielle. Cependant, on réserve souvent l’expression
« inférence statistique » à une classe de méthodes statistiques plus spécifiques. En effet, lorsqu’on
s’intéresse à une population, on l’étudie en fonction d’un (ou de plusieurs) caractère commun à
chaque unité de la population et appelé « variable statistique ». Chacune de ces variables suit une
certaine distribution et possède certaines caractéristiques. On appelle paramètre toute caractéristique
d’une variable statistique ou de sa distribution (il peut s’agir, par exemple, d’une moyenne, d’un écart
type, d’un mode, etc.…). Face à une population, on considère que la situation d’incertitude dans
laquelle on est placé vient du fait que l’on ne connaît ni la distribution de la variable statistique
considérée, ni l’un ou plusieurs paramètres de cette variable. Par la suite, on réserve l’expression
« inférence statistique » à la classe des méthodes statistiques qui, à partir d’un échantillon aléatoire
19
prélevé de la population, permettent de tirer des conclusions soit sur la distribution d’une variable
étudiée dans cette population, soit sur un paramètre de cette variable, ou encore sur tout autre aspect
de cette variable. L’inférence portant sur un paramètre est appelée inférence paramétrique, et
l’inférence portant sur tout autre aspect de la variable est appelée inférence non paramétrique.

1. Rôle de l’échantillonnage dans l’inférence


L’inférence vise essentiellement à généraliser l’information partielle,tirées d’un échantillon, au niveau
de toute la population. Ainsi, l’échantillonnage est une étape essentielle dans la procédure qui permet
de tirer des conclusions sur une population, et dans celle qui conduit au choix d’une action.
2. Erreuréchantillonnal
On est conscient du fait qu’en généralisant à toute la population, l’information partielle obtenue d’un
échantillon, on introduit une erreur plus ou moins grande appelée « erreur échantillonnale ». La
grandeur de cette erreur dépend évidemment de la taille de l’échantillon mais aussi de la façon dont il
est tiré. Plus l’échantillon en question sera représentatif de la population,c’est-à-dire meilleure sera
l’image qu’il en donnera, plus l’erreur sera faible. Il existe plusieurs méthodes pour obtenir un
échantillon représentatif d’une population.
3. Raisons pour lesquelles il faut échantillonner
Il ya de nombreuses raisons qui peuvent justifier le recours à un échantillonnage plutôt qu’à un
recensement ; nous allons en souligner quelques-unes dans ce qui suit :
 Lorsque la population est infinie, on ne peut évidemment en observer qu’une partie ; autrement
dit, la seule possibilité consiste alors à procéder par échantillonnage.
 Choisir un échantillon requiert moins d’efforts, donc coûte moins cher que de procéder à un
recensement. Parfois, s’il est très important d’obtenir des informations précises et complètes
sur une population. Il peut être justifié d’observer toute la population même si elle est grande :
c’est le cas pour les recensements périodiques des habitants d’un pays. Cependant, dans la
Chargé du cours : M. Farhat MIZEN 19
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

majorité des cas, le coût d’un recensement est disproportionné par rapport à la valeur de
l’information qu’il peut fournir.
 Le recours à l’échantillonnage s’impose lorsque le fait d’observer une unité de la population
entraîne la destruction de cette unité. Par exemple, lorsqu’on veut connaître la durée de vie
moyenne d’un certain lot d’ampoules électriques, chaque ampoule choisie est observée
jusqu’au moment où elle ne fonctionne plus, de telle sorte que le fait d’observer tout le lot
entraînerait la destruction de ce dernier.
 Souvent, on a besoin d’obtenir rapidement de l’information en vue d’une prise de décision qui
ne peut être retardée, et une information partielle s’avère suffisante pour prendre cette
décision. Dans ces cas-là, l’échantillonnage permet d’obtenir une information adéquate
beaucoup plus rapidement que le recensement.
 Si le recensement est effectué correctement, il devrait fournir une information parfaite sur la
population, puisqu’il élimine toute erreur échantillonnal. Cependant, dans le cas de grandes
populations, il peut arriver que le fait d’observer toute la population entraîne plus d’erreurs (de
nature non échantillonnal) que celui de n’en observer qu’une partie. En effet, le recensement
d’une grande population requiert beaucoup de travail, et cette tâche qui nécessite le concours
de plusieurs personnes est souvent de caractère répétitif et assez fastidieuse. De plus, lorsque
la nature de l’information désirée nécessite qu’on interviewe des gens, il peut facilement se
glisser des erreurs d’interprétation dans les questions et les réponses. La qualité des données
impliquées dans un recensement pouvant être très considérable, les chances qu’il se glisse des
erreurs dans leur enregistrement et leur compilation sont grandes. Pour toutes ces raisons, il
20
peut arriver que l’information obtenue d’un échantillon soit beaucoup plus fiable que celle
obtenue d’un recensement.

II. LES METHODES D’ECHANTILLONNAGE


Il existe plusieurs méthodes pour choisir un échantillon d’une population.Cesméthodes peuvent être
regroupées en deux grandes catégories : échantillonnage non aléatoire et échantillonnage aléatoire.
1. Echantillonnage non aléatoire : échantillonnage par jugement
2. Echantillonnage aléatoire
3. Autres méthodes d’échantillonnages
3.1. L’échantillonnage stratifié
3.2. L’échantillonnage systématique
3.3. L’échantillonnage par grappes(ou par amas)

III. ESTIMATION PONCTUELLE


Cette technique consiste à estimer un paramètre  de la population à l’aide d’un seul nombre déduit
des résultats de l’échantillon, ce nombre est appelé estimateur ponctuel de  et sera noté « T ».
Un estimateur doit posséder certaines qualités ou propriétés afin de fournir une bonne estimation.
1. Critère de choix de l’échantillon
L’échantillon doit être un échantillon aléatoire simple E.A.S c.à.d. que les individus constituants cet
échantillon sont choisis au hasard (d’une manière aléatoire).
2. Critèresde choix de l’estimateur « T »
ESTIMATEUR SANS BIAIS : E(T) = 
ESTIMATEUR CONVERGENT : lim V(T) = 0
n +

Chargé du cours : M. Farhat MIZEN 20


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

ESTIMATEUR EFFICACE :
* En terme absolu : Si sa variance est la plus faible parmi les variances des autres estimateurs sans
biais possibles.
* En terme relatif : Soient T1 et T2 deux estimateurs sans biaistq
V(T1) V(T2) * E(T1) = E(T2) = 
* V(T1)  V(T2)

T1 est plus efficace que T2.
Exercice
XN (m,) ; les xi sont indépendantes.

1- Montrer que « » est un estimateur sans biais et convergent de ‘m’


2- Montrer que « F » est un estimateur sans biais et convergent de ‘p’
3. Nature et distribution d’échantillonnage de T
3.1. Distribution d’échantillonnage d’une moyenne échantillonnal
* THEOREME CENTRALE LIMITE
On sait que X est une V.A sans pour autant connaître sa loi de probabilité. Pour identifier cette loi il
faut recourir au T.C.L :
Si on prélève un échantillon aléatoire de taille n, d’une population dont les éléments possèdent un
caractère X ; l’espérance E(X) = m et variance V(X)=2 ;

Alors la distribution d’échantillonnage de la variable aléatoires tend à rapprocher d’une loi 21

normale d’espérance E ( ) = m et de variance V ( )=

X N (E ( ) ; ) Ainsi N (m, ).
On remarque que l’écart type de x est en fonction de l’écart type de la population «  ». Un problème
peut ainsi se poser lorsqu’on ne connaît pas cet écart type de la population. Dans ce cas il faut estimer
cet écart type par celui calculé au niveau de l’échantillon et noté par « S » :

S2 = D’où,S=

Ainsi, la distribution d’échantillonnage de peut changer selon la taille de l’échantillon. 3 cas sont
possibles :
1er Cas :  connu alors pour :

N (m ; )  Z= N ( 0; 1)
2ème
Cas :  inconnu et n  30, alors pour :

N(m ; ) Z = N ( 0; 1)
Chargé du cours : M. Farhat MIZEN 21
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

3ème Cas : inconnu et n  30,alors pour :

Z= St (n-1)
3.2. Distribution d’échantillonnage d’une proportion « échantillonnal »
On considère une proportion caractérisée par une proportion « p » d’individu possédant un certain
caractère qualitatif. Si on prélève au hasard différents échantillons de cette population on remarque
que la proportion « f » d’individus possédants ce caractère qualitatif varie d’un échantillon à un autre,
on peut donc lui attribuer une V.A. ‘F’.
Le T.C.L. peut s’étendre, et on aura :
Pour un échantillon de taille n  30 on a :

F N(p ; )  N (0 ;1)

Or p est inconnu
inconnu F = est inconnu

On l’estime par

22

D’où pour n  30 : on a  N (0 ; 1)
En effet ; …
NB : Si  de la population est inconnu (Cas de la moyenne) →

Son estimateur correcte est S = : Ecart type corrigé.


En effet; l’écart type de l’échantillon, qu’on note par ’, est un estimateur biaisé de  :

(’)2 = c.à.d.’ =

Tout calcul fait, on trouve que : E (’2) =


’2 est un estimateur biaisé de 2. Pour le corriger (c.à.d. annuler ou neutraliser le biais) on va
utiliser :

S2 =  E(S2) = E(’2)
E(S2) = 2
S2 est un estimateur sans biais de 2

S est un estimateur sans biais de  ; avec S = . ’


Chargé du cours : M. Farhat MIZEN 22
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

23

Chargé du cours : M. Farhat MIZEN 23


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

IV. L’ESTIMATION PAR INTERVALLE DE CONFIANCE


L’estimation par intervalle d’un paramètre inconnu  consiste à construire à partir d’un estimateur T
choisi, un intervalle dans lequel on a un pourcentage de chance d’y trouver la vraie valeur du
paramètre. L’intervalle de confiance est défini par deux limites auxquelles est associée une certaine
probabilité de contenir la vraie valeur du paramètre.
P (LI  LS) = 1- 
LI : Limite inférieure de l’intervalle de confiance (Soit par exemple « a »)
LS : Limite supérieure de l’intervalle de confiance (Soit par exemple « b »)
 : Niveau de confiance
→ On cherche à déterminer [a, b] tq P (ab) = 1- 
→ On doit déterminer d’abord le cas auquel correspond l’exercice c.à.d.déterminé l’expression de Z
à utiliser.
Remarquons que [a, b] est centré par T : c.à.d. que la construction d’un intervalle de confiance [a, b]
se fait autour de la valeur que prend l’estimateur ponctuel.
1. Cas de la moyenne
Pour déterminer un I.C pour la moyenne nous avons besoin de connaître l’expression exacte de la
distribution Z à utiliser, ainsi que sa loi.

En effet, sa formule générale sera de la forme Z= = .


24
3 Cas peuvent se présenter :
1er Cas :  de la population est connu

Z = N(0,1)
(0,1)
Exercice d’application 1
Une entreprise de conserves désire connaître le poids moyen des boîtes qu’elle fabrique. Des testes
effectués il y a 2 ans permettent de considérer que le poids d’une boîte est distribué normalement avec
une variance de 9.
Un test sur un échantillon de 16 boîtes a donné un poids moyen de 219 gr. Estimer par intervalle de
confiance le poids moyen de l’ensemble des boîtes fabriquées avec un N .C de 95 %.
2ème Cas : «  » de la population est inconnu & « n  30 »

Z = N(0,1)
(0,1)
Exercice d’application 2
Une entreprise de conserve désire connaître le poids moyen des boîtes qu’elle fabrique. Un test sur un
échantillon de 36 boîtes a donné un poids moyen de 219 gr avec un écart type de 1,5 gr.
Estimer par intervalle de confiance le poids moyen des boîtes avec un niveau de confiance de 99%.
3ème Cas : «  » de la population est inconnu & « n 30 »

Chargé du cours : M. Farhat MIZEN 24


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Z = St(n-1)
(n-1)
Exercice d’application 3
Une entreprise de conserve désire connaître le poids moyen des boîtes qu’elle fabrique. Un test sur un
échantillon de 9 boîtes a donné un poids moyen de 219 gr avec un écart type de 1,5 gr.
Estimer par intervalle de confiance le poids moyen des boîtes avec un niveau de confiance de 99%.
2. Cas d’une proportion
Pour déterminer un intervalle de confiance pour une proportion on utilise la distribution suivante (avec
n  30) :

Z= avec F= X / n
 (n 30 )

Estimée par l’expression : N(0, 1)


Exemple
Dans une banque, on a effectué un sondage pour connaître l’opinion des clients sur un nouveau
service aux agences. D’une liste de 6000 clients de la banque on extrait 150, sur ces 150 clients
interrogés 45 étaient satisfaits de ce service. 25
Déterminer un intervalle de confiance pour la vraie proportion des clients qui sont satisfaits de ce
nouveau service avec un N.C de 99%.
V. LA DETERMINATION DE LA TAILLE DE L’ECHANTILLON
La taille de l’échantillon est liées à :
→ La marge d’erreur maximale E (ou précision p) qu’on va tolérer : c.à.d. la différence en valeur
absolue entre le paramètre à estimer et son estimateur.
Ex :  - m ou  F - p d’une manière générale  T - 
→ Le niveau de confiance exigé dans l’étude.
Certes E est la différence entre la valeur approximative (estimée) ‘T’ et la vraie valeur réelle du
paramètre ‘’ ; en valeur absolu : E =  T - 
1. Cas de la moyenne : E=  - m
On suppose que  est connu

On sait que : -  m  +

-  m- 

 - m
Ainsi la valeur maximale que peut prendre l’erreur de l’estimateur par rapport à la vraie valeur (x par

rapport à la moyenne) est de

D’où E = : Marge d’erreur maximale.


Chargé du cours : M. Farhat MIZEN 25
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Dans le cas ou  de la population est connu :

E=  =  n=
Dans le cas ou  de la population est inconnu : → On l’estime par S et on suppose que n va être  à
30 qui reste à vérifier après les calculs et on calcul à priori par

E=

 n= OU tq

Exemple
On veut estimer la durée de vie moyenne d’un dispositif électronique. D’après le bureau de recherche
et développement l’écart type de la durée de vie de ce dispositif serait de 100 heures. Déterminer le
nombre d’essais requis pour estimer avec un niveau de confiance de 95%, la durée de vie moyenne
d’une grande production de ce dispositif de sorte que la marge d’erreur dans l’estimation n’excède pas
50 heures.
2. Cas d’une proportion : E=  F - p
Dans le cas de l’estimation d’une proportion on sait que :

p-Z F p+Z


26

-Z F-p Z

 F – p  Z

Ainsi, la valeur maximale de  F - p estZ

Par conséquent, la marge d’erreur maximale E = Z


Objectif → n = ?

E=Z  =

n = tq
NB : Si on a une inflation sur la valeur approximative de ‘p’ on va l’utiliser. Sinon, on utilise la valeur
de « 0,5 ».

Chargé du cours : M. Farhat MIZEN 26


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Travaux dirigés n°3


EXERCICE 1 : montré que 180 étudiants sont intéressés par cette
N° Individu Xi option.
Individu n°1 20 a) Donner une estimation ponctuelle de la vraie
Individu n°2 25 proportion des étudiants qui vont choisir cette
Individu n°3 23 option dans toutes les I.S.E.T. pour le semestre
Individu n°4 21 prochain.
Individu n°5 25 b) Donner une estimation par intervalle de
Calculer la valeur de la moyenne X puis la valeur confiance pour cette proportion au niveau de
de l’écart type corrigé S de l’échantillon précédent. confiance de 95%.
EXERCICE 2 : 2- Déterminer la taille de l’échantillon qui permet
Quels sont les estimateurs ponctuels corrects d’obtenir un intervalle de confiance de largeur 0,2
respectivement de la moyenne ; de la proportion et sachant qu’une estimation ponctuelle de p a donnée
de l’écart type. Donner leurs formules (sans faire la la valeur 0,6. Le niveau du risque est fixé à 5% (on
démonstration). suppose que cette taille sera ≥30).
II / Pour des raisons de disponibilité de places ;
EXERCICE 3 : l’administration faisait une étude sur la distribution
Un pédagogue veut étudier l’effet du fait de se de la « moyenne semestrielle » des étudiants qui
réveiller le matin assez tôt sur le rendement en ont choisi cette nouvelle option. On a pu confirmer
révision. Il se met alors en accord avec un groupe qu’elle (la « moyenne semestrielle ») suit une loi
d’étudiants sur le chronométrage de leurs activités normale de paramètres m et σ (les deux inconnus).
et déduit les résultats suivants : Un questionnaire établit auprès des 180 étudiants
 A partir de l’observation d’un échantillon de 60 concernés a donné une « moyenne semestrielle »
heures de révision, il trouve qu’un exercice type moyenne : x de 12 et un écart type corrigé de 1.
nécessite le matin tôt une durée moyenne de 20 min 1- Donner une estimation par intervalle de
avec un écart type de 5 min. confiance pour cette moyenne avec un niveau
de confiance de 95%. 27
 A partir de l’observation d’un échantillon de 70
heures de révision, il trouve qu’un exercice type 2- En déduire une estimation par intervalle de
nécessite au cours de la journée –autre que le matin confiance pour cette moyenne au niveau de
tôt- une durée moyenne de 30 min avec un écart confiance de 99%.
type de 10 min. 3- Que peut-on conclure.
1) Estimer un intervalle de confiance de la durée
III
moyenne d’un exercice type du matin tôt avec un
Les responsables de cette orientation étant pressés
niveau de confiance de 97%.
par le temps et veulent savoir s’il est nécessaire de
2) En déduire la durée moyenne d’un exercice type
faire un nouveau recrutement, occasionnel, de
d’une révision au cours de la journée avec un
personnel pour accélérer le traitement des dossiers.
niveau de confiance de 97%.
Soit Y la variable aléatoire indiquant la durée de
L’observation des résultats d’un échantillon de 100
traitement d’un dossier.
étudiants parmi ceux qui révisent le matin tôt a
Un test sur un échantillon aléatoire de 11 dossiers a
donné une proportion estimée de 0,9 pour ceux qui
ont réussi leur semestre. donné les valeurs suivantes : = 10 min et
3) Donner une estimation par intervalle de confiance
pour la vraie proportion de ceux qui ont réussi leur
semestre parmi ceux qui révisent le matin tôt avec = 40, (avec i=1,2,….,11)
un niveau de confiance de 95%. Donner un intervalle de confiance pour la durée
EXERCICE 4 : moyenne d’exécution d’un dossier d’orientation
La Direction Générale des Instituts Supérieurs des avec un niveau de confiance de 95%.
Etudes Technologiques prévoit de lancer une EXERCICE 5
nouvelle option, pour permettre à ses outputs de Ulysse Hyper Distribution (UHD) est un groupe
saisir les nouvelles opportunités de spécialisé dans la grande distribution. Il vient
l’environnement économiques, soit l’option d’acheter la marque « Bonprix » (devenue
d’ « Assistant PME-PMI » pour les étudiants admis « Champion »). Depuis l’achat de cette marque, le
au 2ème Niveau G.E. groupe a commencé à réaliser chaque année une
I/ enquête de satisfaction auprès d’un échantillon
1- Un sondage auprès d’un échantillon de 300 aléatoire de 300 clients.
étudiants des différents I.S.E.T. de la Tunisie a En 2007, 276 personnes se sont déclarées
« satisfaites » ; en 2008, ce chiffre monte à 282.
Chargé du cours : M. Farhat MIZEN 27
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

1) Donner le loi de X « nombre de clients confiance de 97% sachant que la taille de la


satisfaits » et calculer E (X) et son écart type de population est de 7000. (On supposera que cette
2007 et 2008. taille sera ≥ 30 )
2) Donner la loi de F. Montrer que E (F) = p, V (F) EXERCICE 9 :
= pq/n. Calculer E (F), V (F) et l’écart type en 2007 Déterminer la taille d’échantillon qui permet
et 2008. d’obtenir un intervalle de confiance -pour la vraie
3) Par quelle (s) loi (s) peut on approximer F. moyenne- de largeur 0,24 et avec un niveau de
Justifier. confiance de 97% sachant que l’écart type de la
4) Donner un intervalle de confiance du taux de population étant connu et d’une valeur de 0,7.
satisfaction de l’ensemble de la clientèle en 2007 et EXERCICE 10 :
2008 avec un seuil de confiance de 97%. Justifier. Après la correction d’une épreuve d’examen
5) En déduire un intervalle de confiance de nombre comportant un grand nombre de copies, on constate
de clients satisfaits en 2007 et 2008. que les notes ont pour moyenne 12 et un écart type
EXERCICE 6 : de 3. On se propose de prélever un échantillon
On se propose d’étudier le corps électoral d’un aléatoire de 100 copies.
département 1. Quelle est la probabilité d’avoir la moyenne d’un
1/ Lors d’un sondage, sur un échantillon de 200 tel échantillon supérieure à 12,5 ?
personnes, on a recueilli 84 intentions de vote en 2. Quelle est la probabilité d’avoir la moyenne d’un
faveur du parti A. Soit F la proportion de votes tel échantillon comprise entre 12,5 et 12,9 ?
pour A. donner un intervalle de confiance pour p au EXERCICE 11 :
niveau 95%. Une machine fabrique des disques en grande série.
2/ Avec un second échantillon de 100 personnes, on On suppose que la variable aléatoire X qui à chaque
a obtenu 45 intentions de vote pour A. En disque tiré au hasard, associe son diamètre suit la
réunissant les deux échantillons, donner un loi normale N(12,8 ; 2,1).
intervalle de confiance pour p au niveau de 95%. 1. Quelle loi suit la variable aléatoire X , qui à tout
3/ Déterminer la taille de l’échantillon qui permet échantillon aléatoire de taille n=100 associe la
d’obtenir un intervalle de confiance de largeur 0,02 moyenne des diamètres des disques de cet
28
sachant qu’une estimation ponctuelle de p a donné échantillon.
la valeur 0,4. Le niveau de confiance est fixé à 2. Déterminer un intervalle centré en 12,8 tel que la
95%.
4/ Pour mieux cerner la population votant pour A. variable aléatoire X prenne ses valeurs dans cet
On suppose que l’âge des individus suit une loi intervalle avec la probabilité 0,95.
normale de paramètres m et σ. 3. On se propose de prélever un échantillon aléatoire
 a- Le premier échantillon de taille n = 20 a donné de taille n. Déterminer n pour que la moyenne des
une moyenne d’âge de 45 ans et un écart type de 9 diamètres des disques de l’échantillon ne s’écarte
ans. Donner un intervalle de confiance pour m au pas de plus de 0,2 mm avec une probabilité de 0,95.
niveau de confiance de 98%. EXERCICE 12 :
 B- Le second de taille n = 100 a donné une Une machine automatique fabrique des pièces en
moyenne d’âge de 47 ans et un écart type de 9 ans. grande quantité.
Donner un intervalle de confiance pour m au 1. On choisi au hasard un lot de 10.000 pièces et on
niveau de confiance. mesure les longueurs en mm. On constate que la
EXERCICE 7 : distribution de ce lot est normale de moyenne =
Le nombre moyen annuel d’accidents de travail 250 mm et un écart type de 1,94. On examine un
dans une entreprise est une variable suivant une loi échantillon de 36 pièces de ce lot (tirage s’effectue
de poisson de paramètre λ inconnu. avec remise). Quelle est la probabilité que la
Une entreprise d’assurance désire estimer ce moyenne de cet échantillon soit extérieure à
nombre. l’intervalle [249,1 ; 250,9] ?
Sur un échantillon de 500 employés ; elle a observé 2. On fabrique maintenant un nouveau lot de pièces.
un nombre d’accidents moyen de 2 avec un On règle la machine pour que la longueur des
estimation corrigée de la valeur de l’écart type de pièces suive une loi normale de moyenne 400 et
2,4. d’écart type 1,94. La longueur d’une pièce est
Déterminer un intervalle de confiance pour λ de acceptable si elle est comprise entre 397 et 403
niveau 95%. mm. Quel est le pourcentage de pièces dont la
EXERCICE 8 : longueur est acceptable.
Déterminer la taille d’échantillon qui permet EXERCICE 13 :
d’obtenir un intervalle de confiance -pour la vraie
proportion- de largeur 0,24 et avec un niveau de
Chargé du cours : M. Farhat MIZEN 28
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

0n sait que chez les joueurs de football, la compte environ 125 000. Les résultats sont les
fréquence cardiaque, au repos, est normalement suivants :
distribuée. Dépenses alimentaires Nombre clients
Afin d’estimer la moyenne de cette variable pour la De 60 D à mois de 80 8
population totale des joueurs, on observe un De 80 D à moins de 120 18
échantillon de 150 de ces joueurs. La fréquence De 120 D à moins de 160 26
cardiaque moyenne de cet échantillon est de 67 et De 160 D à moins de 180 22
sa variance est de 24. De 180 D à moins de 220 24
Estimer la fréquence cardiaque moyenne pour tous De 220 D à moins de 260 12
les joueurs de football avec un intervalle de De 260 à moins de 300 10
confiance de 95% de certitude. 1) Calculer une estimation ponctuelle de la
EXERCICE 14 : moyenne et de l’écart type des dépenses
Dans une banque, on suppose que le solde des alimentaires mensuelles.
comptes courants suit une loi normale de paramètre 2) Donner une estimation de la moyenne des
µ et σ. On considère un échantillon de taille égal à dépenses alimentaires mensuelles par un intervalle
50 comptes on obtient une moyenne de 130 DT et de confiance avec un risque d’erreur de 5% et 1%.
un écart type de 28 DT. EXERCICE 18
Donner une estimation de la moyenne de la Une entreprise de restauration travail sur le
population (µ) par intervalle de confiance ayant un lancement d’un nouveau produit. L’étude réalisée
terme d’erreur ne dépassant pas 5%. auprès de 200 personnes comportait cette
EXERCICE 15 : question : « A quel prix achèteriez-vous ce
On veut estimer l’espérance mathématique µ des produit ? »
notes des étudiants d’un campus universitaire. On Les résultats sont résumés dans le tableau suivant :
sait que l’écart type σ des notes de tous les Prix Nombre de réponses
étudiants de ce campus est égal à 2,3. Moins de 7 D 12
Quelle est la taille minimum de l’échantillon De 7 à moins de 8 29
d’étudiants qu’on doit prendre si on veut obtenir un De 8 à moins de 9 48 29
intervalle de confiance de 95% et dont la longueur De 9 à moins de 10 54
ne dépasse pas 0,1. De 10 à moins de 11 35
EXERCICE 16 De 11 à moins de 12 13
Pour évaluer l’effet d’une formation des personnels 12 et plus 9
sur leur productivité moyenne, nous avons procédé 1) Donner une estimation ponctuelle du prix moyen
à un calcul des quantités moyennes produites par accepté pour ce nouveau produit par l’ensemble des
travailleur chaque semaine. Sur un échantillon de acheteurs potentiels (sachant que le centre du
20 observations, la production moyenne enregistrée dernier intervalle est de 12,5) et de l’écart type.
par travailleur étant de 300 unités par semaine avec 2) Déterminer un intervalle de confiance de la
un écart type de 30 unités. moyenne des prix acceptés par l’ensemble des
1- Estimer par Intervalle de Confiance la acheteurs au coefficient de confiance de 95%.
productivité moyenne avec un Niveau de Confiance EXERCICE 19
de 97% . Une société de restauration réalise tous les ans une
2- Estimer par Intervalle de Confiance la enquête de satisfaction auprès d’un échantillon
productivité moyenne avec un Niveau de Confiance aléatoire de 200 clients.
de 95% . Interprétez. En 2004, 169 personnes se sont déclarées
Afin de ne pas dépasser l’erreur de 10 « satisfaites » ou « très satisfaites » ; en 2005, le
unités et obtenir un NC de ‘95%’, nous allons chiffre se monte à 178.
procéder à l’augmentation de la taille de 1) Donner le loi de X « nombre de clients
l’échantillon. satisfaits » et calculer E (X), V(X) et σ Xde 2004 et
3- Que doit être la nouvelle taille de 2005.
l’échantillon, sachant que l’écart type corrigé
observé est de 40 unités et que le nombre total des
« jours -travailleurs » ouvrables à partir de la date 2) Donner la loi de fn= et calculer E (fn), V (fn)
d’achèvement de la formation (population
(notée ) et de 2004 et 2005.
concernée) est de 300 jours.
3) Par quelle loi peut on approximer fn
EXERCICE 17
4) Donner un intervalle de confiance du taux de
Une enquête de dépenses en alimentation a été
satisfaction de l’ensemble de la clientèle en 2004 et
réalisée auprès de 120 clients d’une chaîne
2005 avec un risque d’erreur de 5%.
d’hypermarché ayant un portefeuille client qui en
Chargé du cours : M. Farhat MIZEN 29
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

5) Peut-on conclure que le taux de satisfaction de la


clientèle a augmenté entre 2004 et 2005 ?
Chapitre 4 - TESTS D’HYPOTHESES
I- TESTS D’HYPOTHESES PARAMETRIQUES
1- PRINCIPE GENERAL DU TEST :
Dans les chapitres précédents nous avons expliqué comment nous pouvons estimer les paramètres
inconnus d’un modèle au moyen d’une statistique définie à partir de l’échantillon aléatoire.
Dans le contexte d’un test d’hypothèse paramétrique, on ne suppose pas que le paramètre est
complètement inconnu mais que l’on a, au départ, une certaine connaissance de la (les) valeur(s) du
paramètre et l’on essaie d’en vérifier la véracité.
Le problème consiste à choisir l’une des deux hypothèses Ho ou H1.
Exemples :
H o : θ = θo H o : θ = θo H o : θ = θo
H 1 : θ ≠ θ1 H1 : θ <θo H1 : θ >θo
En effet, un test d’hypothèse ou test statistique est une démarche qui a pour but de leur définir une
règle de décision, permettant sur la base de résultats d’un échantillon de constituer un choix entre les
deux hypothèses.
→ Ho : est l’hypothèse à laquelle on croît le plus
→ H1 : c’est l’hypothèseque l’on ne voudrait pas rejeter sans que nous ayons suffisamment
d’évidence.
Toutefois, on peut connaître les erreurs de décision. Deux types de décisions erronées, peuvent
découler : 30
► On appelle erreur de première espèce le fait de rejeter à tort Ho.
La probabilité correspondante à cette erreur est appelée « Risque de premier espèce ».
On écrit : α = P {Rejeter Ho / Ho est vraie}
= P {Décider H1 / Ho est vraie}
= P {Décider H1 / θ = θo}
► On appelle erreur de seconde espèce le fait de rejeter à tort H1.
La probabilité correspondante à cette erreur est appelée « Risque de second espèce ».
On écrit : β = P {Rejeter H1 / H1 est vraie}= P {Décider Ho / θ ≠ θo}
DECISION RETENUE
Ho H1
Ho est * Bonne Décision, « Probabilité = 1–α » * Décision erronée :Erreur de première espèce,
REALITE

vraie « Probabilité = α »
H1 est *Décision erronée : Erreur de second * Bonne Décision, « Probabilité = 1- β›
vraie espèce, « Probabilité = β›
Notons les Définitions suivantes :
* Niveau (seuil) de signification d’un test : C’est la probabilité de rejeter Ho quand elle est vraie →
C’est le risque de 1er espèce.
On note α = Niveau de signification du test.
= P {Rejeter Ho / Ho est vraie}.
* Puissance d’un test : C’est la probabilité de rejeter Ho quand elle est fausse.
On note : η = Puissance du test = P {Rejeter Ho / Ho est fausse}.
= 1- P {Accepter Ho / Ho est fausse}
=1–β
* Région Critique d’un test : C’est la région de rejet de Ho.
* Règle de décision :
Chargé du cours : M. Farhat MIZEN 30
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

- SI la valeur calculée à partir de l’échantillon appartient à la région critique, on rejette H o.


- SINON, on décide cette hypothèse H0.
2- TESTS PARAMETRIQUES USUELS :
a) Sur une moyenne :
Il faut toujours faire recours à (définir) la statistique (Distribution d’échantillonnage) Z convenable à
utiliser parmi les 3 cas possibles (déjà connu).Nous allons considérer un test sur une moyenne m
d’une population de variance σ2 connue au niveau α .

→ La statistique utilisée : Z = N (0, 1).


H0 :L’hypothèse nulle : m=mo
H1 : L’hypothèse alternative : Rejet des H0SI :
1er Cas : H1 : m < mo

 Décider H1 Si < mo – :(  Région critique)


 Sinon Ho est vraie (Retenue).

2ème Cas : H1 : m > mo

 Décider H1 Si > mo + c.à.d Région critique.


 Sinon Ho est vraie (Retenue). 31

3ème Cas : H1 : m ≠ mo

 Décider H1 Si [ mo – ; mo + ]

 Décider H0 Sinonc.à.d [ mo - ; mo + ]

Rq : Tq _ Z α/2 est la valeur de la table N(0,1) théorique tqП(Z α/2 ) = 1- .


_ Z α est la valeur de la table N(0,1) théorique tqП(Z α/2 ) = 1- α.
Exemple 1:
L’an dernier le salaire hebdomadaire moyen payé par les entreprises aux analystes en informatique
était de 350 D. Cette année, à pareille date, un échantillon aléatoire des salaires de 25 analystes en
informatique a donné les résultats suivants : X = 358 D et 2 = 100. Si l’on suppose que les
salaires des analystes sont distribuées normalement, peut-on conclure que le salaire moyen a augmenté
d’une façon significative au seuil de α=0,05 ?
Exemple 2:
Soit une machine de remplissage des boîtes de détergent en poudre. En principe, le poids des boîtes
est de 500 grammes avec un écart type stable de 5 grammes. Supposant que le contre maître de la
production vienne d’avertir le responsable de la procédure d’inspection qu’à son avis, les boîtes
remplies au cours de la dernière heure lui semblent insuffisamment remplies. Pour confirmer ou
réfuter l’opinion du contremaître, on tire un échantillon aléatoire de 25 boîtes dans la production de la
dernière heure, et l’on trouve un poids moyen X = 497 g. En supposant que le poids est distribué

Chargé du cours : M. Farhat MIZEN 31


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

normalement, est-ce que l’information obtenue par cet échantillon permet de confirmer l’opinion du
contremaître au niveau de 5% ?
b) Sur une proportion :
Dans une population, on considère un caractère C tel qu’une proportion « p » des individus présente
ce caractère.On dispose d’un échantillon de taille n sur lequel on a calculé la proportion f des
éléments(des individus) de l’échantillon ayant le caractère C. 3 Cas sont possibles :

Notons d’abord que pour n≥ 30 ; « Z à utiliser= N (0,1) »comme on aura une indication sur
p, soit « p0 » : on gardera cette expression initiale en remplaçant « p » par la valeur de « p0 » « Z =

N (0,1) »

ou encore : « Z = N (0,1) »
H0 :l’hypothèse nulle : p=p0
H1 : l’hypothèse alternative (Rejet de H0) ; soient :
1er cas : H0 : p=p0contre H1 : p<p0

32
SIF <p0 – Zα , F Région CritiqueDécider H1 c’est-à-dire Rejet de H0
SINON : Décider H0
2ème cas :H0 : p=p0contre H1 : p>p0

SIF>p0 + Zα ,F à la Région CritiqueTel que π (Zα) = 1- α Décider H1


SINON Décider H0
3ème cas : H0 : p=p0 contre H1 : p≠p0

ϵ
SI F [p0 – Zα/2 ; p0+ Zα/2 ] , avec π (Zα/2) = 1- ALORSDécider H0


SI F [p0 – Zα/2 ; p0+ Zα/2 ]Décider H1
Exemple 1 :
Une entreprise envisage de lancer sur le marché un nouveau produit. Elle lance une campagne de
publicité et estime que 60% des personnes touchées par cette campagne achèteront au moins une fois
ce produit.
Tester cette hypothèse au seuil de risque 1%, sachant que sur un échantillon de 350 personnes
interrogées, 182 se sont déclarées prêtes à acheter cette purée.
Exemple 2:
Le fournisseur de barquettes en aluminium garantit que 99% des barquettes sont étanches. Celles-ci
sont livrées par camion, en très grand nombre, une fois par mois. Un échantillon de 500 barquettes est
observé à chaque livraison pour tester l’hypothèse H 0 : p=0.01 contre celle qu’elle soit
significativement dépassée ou p : la proportion réelle de barquettes non étanches sur l’ensemble des
livraisons
Chargé du cours : M. Farhat MIZEN 32
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Le test est choisi de sorte que seules les proportions trop élevées conduisent à refuser H0.
Au seuil de risque 5%, quelle décision prendra-t-on si l’on trouve 7 barquettes défectueuses sur un lot
de 500 ?

II- TESTS D’HYPOTHESES NON PARAMETRIQUES


1- TEST DU KHI-DEUX APPLIQUE A L’ETUDE DE L’INDEPENDANCE DE DEUX
CARACTERES :
Sur une population Ω on étudie simultanément 2 caractères, qualitatifs ou quantitatifs. On dispose
d’un échantillon de cette population.
Les effectifs partiels observés sur cet échantillon sont données dans un tableau de contingence à n
lignes et p colonnes et sont notés O1, O2,………………… , On p.
Valeurs ou Modalités du premier caractère
Caractère 2 ……… ………
Caractère 1 O1 O2 Op
…………… Op+1 Op+2
…… …… …… …… ……
…… … …… … ……
…………… On p
On utilise par la suite la VA calculée : X2calculée

33

X2calculée =
Appelée indicateur d’écart du X2 entre la distribution théorique et la distribution observée.On veut
tester l’hypothèse H0 : « les deux caractères sont indépendants » au seuil de risque α. Pour cela, on
calcule d’abord les effectifs théoriques que l’on aurait si les deux caractères étaient indépendants et
s’il n’y avait pas de fluctuations d’échantillonnage.
On admettra que X2calculée suit la loi du Khi- deux (X2) à (n-1)(p-1) degrés de liberté avec : n = nombre
de lignes et p = nombre de colonnes dans le tableau des effectifs partiels.
REGLE DE DECISION :
À partir du degré de liberté de l’exemple et du niveau du risque α retenu nous lisons à partir de la table
de X2 la valeur X2α qu’on appelle aussi X2théorique et on la compare à celle calculée (ou encore
observée) :
Si X2calculée > X2α (théorique)-- On rejette H0 --- Les deux variables sont liées.
Si X2calculée < X2α (théorique) -- On accepte H0--- Les deux variables sont indépendantes.
Procédure d’application du test
Test du Khi-deux : Une distribution statistique étant donnée (à partir d’un échantillon de taille n), l’objectif
est de comparer les effectifs observés sur cet échantillon et les effectifs théoriques que l’on aurait sur
ce même échantillon sous certaines hypothèses.Une telle comparaison permet, par exemple, de
décider (à un seuil de risque donné) si l’on doit ou non rejeter l’hypothèse qu’une variable, étudiée sur
un échantillon non exhaustif extrait d’une population Ω.
Exemple 1:
Un atelier de couture voudrait faire l’économie des frais d’entretien de ses machines à coudre. En
1995, sur 200 machines utilisées dans les mêmes conditions, 50 seulement ont été régulièrement

Chargé du cours : M. Farhat MIZEN 33


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

révisées. Fin 1995, on a constaté que pendant l’année écoulée 27 machines ont dû subir au moins une
réparation au cours de l’année, dont 11 avaient été entretenues. Tester, au seuil de risque 5%, si
l’entretien permet bien de réduire les pannes (ou même de les éliminer).
2- TEST DU KHI-DEUX APPLIQUE A LA COMPARAISON DE DEUX DISTRIBUTIONS :
Soit X une V.A définie sur une population Ω.
On dispose d’un échantillon de taille n, extrait de cette population :
Les observations, obtenues sur cet échantillon, sont réparties en « k » classes,
Les effectifs observés sont notés O1, O2, …..Ok ; leur somme vaut n.
On veut tester l’hypothèseH H0 : « X suit une certaine loi théorique »au seuil de risque α. Pour
cela, on calcule d’abord les effectifs théoriques que l’on aurait si X suivait exactement la loi théorique
supposée, et s’il n’y avait pas de fluctuations d’échantillonnage. Ces effectifs théoriques sont notés T 1,
T2, ….Tk et leur somme vaut n. On utilise par la suite la VA calculée : X2calculée

X2calculée = appelée indicateur d’écart du X 2 entre la distribution théorique et la


distribution observée.
On admettra que X2calculée suit la loi du Khi- deux (X2) à (k-1-p) degrés de liberté avec : p=le nombre
de paramètres qu’il a fallu estimer à partir de l’échantillon pour déterminer la loi de X.
La même RÈGLE DE DÉCISIONque
DÉCISION dans le titre précédent reste valable.
Exemple 1:
Une entreprise coupe du bois destiné à la fabrication de meubles. Une machine électrique coupe des 34

planches dont la longueur en centimètres est notée X. sur un échantillon de 400 planches, on a relevé
les longueurs suivantes, réparties en 5 classes :
Longueur (Ti) Nombre de planches(Oi)
170, 180 10
180,190 52
190,210 270
210,220 50
220, 230 18
Nous nous proposons d’utiliser ces données pour déterminer si l’on peut penser que la longueur des
planches coupées par cette machine suit par exemple une loi Normale.
Une étude graphique permet d’avoir une idée de la loi suivie par la variable étudiée.
Le test du Khi-deux (ou X2) permet d’évaluer par le calcul la qualité de cet ajustement.
Parreprésentation graphique de la distribution :
Dans le cas d’une série classée, on étudie si l’histogramme évoque par la forme décrite par les
sommets des battons celles d’une courbe représentative de la probabilité d’une loi classique (usuelle).
Suite de l’exemple :
Tracer l’histogramme de la série donnée précédemment et commenter.
Remarques :
Le test X2 s’applique à des effectifs et non à des fréquences.
Les effectifs théoriques de chaque classe doivent être supérieurs à 5. Si ce n’est pas le cas, regrouper
plusieurs classes consécutives entre elles.
Les Ti sont des effectifs « fictifs » et ne sont pas nécessairement entiers. Leur somme doit être à la
somme de des Oi
X2 est une V.A : il s’agit d’une réalisation qui dépend de l’échantillon utilisé pour le test.
Pour procéder à un ajustement de la loi de la variable étudiée, il faut :
Chargé du cours : M. Farhat MIZEN 34
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

 Choisir la loi ;
 Choisir les paramètres : soit à priori, soit à partir de l’échantillon
La conclusion à obtenir à partir de ce test n’est pas une certitude. D’une part il ya un risque d’erreur,
d’autre part plusieurs ajustements différents peuvent être acceptables. De plus plusieurs variables dont
la liaison est logiquement insensée, peuvent être déclarées dépendantes par les simples calculs du test
X2 .
Exemple 2 :
Sur un échantillon de 30 paquets de 100 vis de basse qualité, on a compté dans chaque paquet le
nombre de vis défectueuses. On a obtenu les résultats suivants :
Nombre de vis défectueuses Effectif observé (nombre de paquets)
0 4
1 7
2 9
3 6
4 4
Au seuil de 5% cet échantillon est-il compatible avec l’hypothèse que le nombre X de vis défectueuses
par paquet suit une loi de poisson de paramètre 2 ?

35

Chargé du cours : M. Farhat MIZEN 35


Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Travaux dirigés n4
EXERCICE 1 d’un échantillon « j » de 100 tiges
Une association d’automobilistes affirme que
le coût de fonctionnement annuel moyen d’une donne = 9.95 cm avec un écart type
automobile est de 3600D avec un écart type de corrigé Sj= 1cm. Le contrôleur veut
800D. Pour vérifier cette affirmation, on décider si la différence « – » doit
prélève un échantillon de 64 automobilistes être jugée significative ou seulement dû
chez qui on trouve un coût de fonctionnement aux fluctuations d’échantillonnage.
annuel moyen de 3950. Au niveau de 2. Au seuil de risque 5% peut-on affirmer que
signification de α = 0,05 peut on accepter les tiges produites dans les deux journées
l’affirmation de l’association ? « i » et « j » sont de même longueur
EXERCICE 2 moyenne.
Une joueuse de golf pratique son sport préféré 3. En déduire si la production de la
à tous les jours. Son score pour un parcours de journée « j » est conforme à la norme de
18 tours est une variable aléatoire qui obéit à longueur.
une loi normale d’écart type 7. Elle affirme que EXERCICE : 5
son score moyen de 80. On prélève un Une étude de qualité menée au sein de
échantillon de 20 scores et on trouve un score l’université privée s’est intéressée à
moyen de 82. Au niveau de signification α = l’évaluation du taux d’encadrement « = nombre
0,05, peut on accepter l’affirmation de cette des enseignants / nombre des étudiants en
joueuse ? P.F.E ». Le responsable de cette étude affirme
EXERCICE 3 qu’un taux d’encadrement de « 0.5 » donne
Dans une usine on remplit des sacs de sucre de une bonne appréciation de la qualité
façon à ce que le poids moyen soit de 5 Kg. d’encadrement.
Au moment de livrer de la production, le En effet, il estime à partir d’un échantillon de 36

directeur de l’usine se rend compte d’une 50 institutions observées que le taux


erreur dans l’ajustement des machines ce qui a d’encadrement moyen étant « f = 0.4 ».
causé une augmentation du poids du sucre Donner la décision à propos du jugement de la
versé dans les sacs. Le directeur décide alors de qualité d’encadrement relevée par ces résultats,
prélever un échantillon de 100 sacs dans cette en admettant un niveau de risque α =1%, et en
production et de peser le contenue afin de utilisant le test d’hypothèse suivant : Ho : p =
vérifier s’il y a vraiment un dérèglement, après 0.5 contre H1 : p < 0.5
les mesures, le directeur obtient des valeurs de EXERCICE : 6
Le gérant de l’entreprise MN se propose
5,030 Kg pour et S. d’offrir des sachets de café d’un poids moyen
Le directeur peut –il conclure qu’il y a un de ‘7 kg’. Une semaine après le déclanchement
dérèglement s’il utilise un test de niveau de de l’exécution, le chef d’usine se met à vérifier
confiance de 5% ? le respect de cette norme : sur un échantillon de
EXERCICE 4 300 sachets ; il relève un poids moyen de ‘6.9
L’usine U fabrique des tiges dont la norme de kg’ avec un écart type corrigé de l’échantillon
longueur moyenne est de 10 cm. Le de ‘0.1 kg’.
contrôleur de qualité se met au prélèvement Tester, au seuil de risque α =5%, si le service
d’un échantillon de 100 tiges chaque jour. Il de conditionnement a respecté la norme
enregistre pour l’échantillon « i » de la journée préétablie du poids par sachet.
« i » une longueur moyenne = 10.05 cm EXERCICE 7 :
avec un écart type corrigé Si= 1cm. Dans le cadre de l’évaluation du niveau du
1. Tester pour cette journée « i » si développement durable d’un pays, des
l’ensemble des tiges produites respecte spécialistes se mettent à la mesure du facteur
la norme de longueur sachant que la « développement humain ». Ils affirment que
stratégie du contrôle admet de travailler l’un des facteurs qui peuvent favoriser ce
avec un risque de 5%.Pour une autre dernier est l’utilisation consciente des moyens
journée « j » un nouveau prélèvement de média et de communication par les jeunes.
A ce propos ils consultent un directeur de foyer
Chargé du cours : M. Farhat MIZEN 36
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

universitaire qui confirme que le temps moyen catégorie). Ainsi, il serait inutile de l’éditer si
alloué par étudiant à suivre des programmes cette proportion étant statistiquement inférieure
sans intérêt instructif (TV ou internet) est de 3 à 20%.
heures par jour. Ils se mettent alors à Afin de juger la dite utilité, le responsable
l’observation du comportement d’un procède à deux tests :
échantillon de 100 étudiants au foyer et 1. Le premier ; porte sur un échantillon de
trouvent que le temps moyen alloué par 200 cadres supérieurs a donné 36 lecteurs
étudiant à suivre ces programmes est de 2,92 du journal.Tester, au seuil de 5%, l’utilité
heures par jour avec un écart type d’ 1 heure. de l’édition du journal économique
spécialisé aux cadres supérieurs.
Ils décident de donner une note négative à ce
2. Le second ; porte sur un échantillon de 200
comportement si la déclaration du directeur du individus de professions libérales a donné
foyer est réelle. Elle sera positive si la réalité 30 consultants du journal.Tester, au seuil
est significativement inférieure à cette de 5%, l’utilité de l’édition du journal
déclaration. économique spécialisé à la profession
1. Tester, au risque de 7%, si la note à libérale.
obtenir serait négative par le test EXERCICE 9
suivant :H0: m = 3H1: m < 3 Les L’entreprise MN procède à un diagnostic
responsables du foyer procèdent, à cet Qualité du système management. Le directeur
effet, à une compagne de sensibilisation informe le contrôleur de Qualité que le nombre
de l’importance des programmes moyen d’absence par mois étant de 5
instructifs dans le développement travailleurs avec un écart type de 2. Ce dernier
humain. Ils jugent que l’observation procède à la vérification de cette information
(et / ou l’écoute) d’un temps moyen d’1 sur un échantillon de 300 jours ouvrables. Et
heure par jour des programmes trouve que le nombre moyen d’absence par
instructifs est le minimum nécessaire et 37
mois dans cet échantillon de 6.
que si cette valeur est significativement 1. Tester au seuil de 5% si le contrôleur
dépassée nous pouvons nous attendre à juge que l’affirmation du directeur est
un bon potentiel du développement de réelle ou que la réalité dépasse
leur niveau d’instruction.L’observation largement sa valeur.
de nouveau d’un échantillon de 100 Après la mise en place du système de
étudiants qui ont étaient ciblés par la management Qualité, le directeur veut
dite compagne a donné un temps étudier son effet sur le taux d’absentéisme.
moyen alloué par jour aux programmes Ce taux était avant cette action de 0,16. Le
instructifs de 1,2 heures par étudiant directeur se met à calculer le taux
d’absence sur un échantillon de 40 jours
avec un écart type de 0,5 heure.
ouvrables et remarque à ce fait un taux de
2. Tester, au risque de 1%, si l’on peut 0,10.
s’attendre à un bon potentiel du 2. Peut-il affirmer, au seuil de 1%, que le
développement du niveau nouveau taux d’absence est
d’instruction par le test suivant : H0: m significativité inférieur à 0,16 ?
= 1 contre H1: m > 1 EXERCICE 10 :
EXERCICE 8 Les spécialistes affirment que l’un des facteurs
On s’intéresse aux proportions respectives de qui peut favoriser l’amélioration du niveau
cadres supérieurs et de professions libérales scientifique des étudiants est la lecture. A ce
lisant un certain journal économique spécialisé. propos ils consultent le directeur d’un institut
Pour savoir s’il est opportun de conserver ces universitaire qui confirme que le temps moyen
actifs dans la même catégorie alloué par étudiant à la lecture est de 4 heures
socioprofessionnelle du fichier clientèle de par jour. Ils se mettent alors à l’observation du
l’éditeur, on décide d’effectuer un test de comportement d’un échantillon de 280
proportion. Un responsable considère que étudiants au foyer et trouvent que le temps
l’édition du journal spécialement à une moyen alloué par étudiant à la lecture est de
catégorie est utile si la proportion de ceux qui 3,5 heures par jour avec un écart type d’ 1,5
le consultent atteint les 20% (de cette heure.
Chargé du cours : M. Farhat MIZEN 37
Institut Supérieur des Etudes Technologiques de Djerba. Cours Statistique Inférentielle.

Tester, au risque de 5%, les deux hypothèses différents et enregistre les quantités vendues
suivantes : H0: m = 4 contre H1: m < 4 comme suit:
EXERCICE 11 : Ventes en fonction du prix
A partir de statistiques compilées dans le passé, Type du fer Prix (X) Quantités
on sait que 40% des individus d’une certaine à repasser Vendues (Y)
région achètent le savon de marque « SAV ». Type 1 18 25
On vient de terminer une compagne Type 2 20 35
publicitaire dans cette région faveur de ce Type 3 32 21
dernier et pour en vérifier l’efficacité, on tire Type 4 40 15
un échantillon aléatoire de 500 personnes de la Type 5 50 14
région, et on leur demande si maintenant elles 1- Quelle est la variable indépendante et quelle est
achètent ou non ce savon. la variable dépendante ?
Si 235 personnes répondent « oui », peut-on 2- Calculer le coefficient de corrélation linéaire r
conclure que la compagne publicitaire a été (interpréter sa valeur absolu).
efficace au niveau de signification α = 0,05 ? 3- Déterminer la meilleure droite d’ajustement
EXERCICE 12 linéaire : Y = a X + b.Interpréter la valeur de
Un commerçant veut estimer des mesures « â ».
relatives à la satisfaction de sa clientèle à 4- Si le commerçant décide d’offrir un
propos de la diversité de ses produits. D’un sixième type à un prix de 28 DT, quelle serait
questionnaire distribué sur 10 régions ; il a pu la quantité de fer à repasser à vendre
relever la distribution des scores moyens mensuellement de ce type ?
accordés par région suivante : EXERCICE 15
Score moyen par Effectif Observé Oi
Une étude de marché au près de 500 épiciers
région = « Xi »
4 2 mettant en relation les critères de choix de
38
6 3 leurs fournisseurs et leurs intentions de fidélité
7 4 à ces fournisseurs a donné le tableau croisé
9 1 suivant :
Total 10 Critère de Intention defidélité Total
Tester, avec un risque α = 5%, si le score choix du Non Fidélité Fidèle
moyen par région : ‘X’ suit β (10 ; 0.5). fournisseur fidèle moyenne
EXERCICE 13 Connaissance 5 20 100 125
Le responsable d’une superette a établi la du fournisseur
distribution empirique des arrivées de la Prix 70 150 30 250
clientèle (xi) pendant 25 jours (n). Le tableau Diversité et 25 30 70 125
suivant a été obtenu : qualité des
xi ni produits
0 5 Total 100 200 200 500
1 8 Peut-on affirmer, au seuil de risque de 5%, que
2 6 ‘l’intention de fidélité’ des épiciers à leurs
3 3 fournisseurs dépend du ‘critère de choix du
4 2
5 1 fournisseur’ ?
= 25
1) Calculer la moyenne et la variance.
2) À quelle loi théorique estimez-vous pouvoir
ajuster la distribution observée des arrivées de
clients au seuil du risque de 1%?
EXERCICE 14
Un commerçant de fer à repasser veut étudier
le type de corrélation entre le prix en DT des
produits qu’il commercialise et les quantités
vendues mensuellement. Il observe alors pour
5 types de fer à repasser qu’il offre à des prix

Chargé du cours : M. Farhat MIZEN 38

Vous aimerez peut-être aussi