Vous êtes sur la page 1sur 55

STATISTIQUE INFÉRENTIELLE

RAPPELS
La population : est la totalité des unités de n’importe quel genre ayant en commun certaines propriétés justifiant
leur appartenance à la population. La population peut être finie ou infinie et les mesures que l’on utilise pour
décrire une population sont des paramètres
L’échantillon : est un sous-ensemble de la population étudiée et les mesures que l’on utilise pour le décrire sont
appelées des statistiques
La statistique descriptive : repose sur l’observation des phénomènes concrets (passés). Son but est de résumer,
structurer l’information sous forme graphique ou numérique. Elle se fait généralement sur des échantillons
Les données recueillies ne sont pas considérées comme une information complète, mais une information partielle
d’une population. Il est alors naturel de supposer que les données sont des réalisations de variables aléatoires, qui
ont une certaine loi de probabilité. Cette approche nécessite des outils mathématiques plus pointus de théorie des
probabilités
RAPPELS
La population : est la totalité des unités de n’importe quel genre ayant en commun certaines propriétés justifiant
leur appartenance à la population. La population peut être finie ou infinie et les mesures que l’on utilise pour
décrire une population sont des paramètres
L’échantillon : est un sous-ensemble de la population étudiée et les mesures que l’on utilise pour le décrire sont
appelées des statistiques
La statistique descriptive : repose sur l’observation des phénomènes concrets (passés). Son but est de résumer,
structurer l’information sous forme graphique ou numérique. Elle se fait généralement sur des échantillons
Les données recueillies ne sont pas considérées comme une information complète, mais une information partielle
d’une population. Il est alors naturel de supposer que les données sont des réalisations de variables aléatoires, qui
ont une certaine loi de probabilité. Cette approche nécessite des outils mathématiques plus pointus de théorie des
probabilités
RAPPELS
La population : est la totalité des unités de n’importe quel genre ayant en commun certaines propriétés justifiant
leur appartenance à la population. La population peut être finie ou infinie et les mesures que l’on utilise pour
décrire une population sont des paramètres
L’échantillon : est un sous-ensemble de la population étudiée et les mesures que l’on utilise pour le décrire sont
appelées des statistiques
La statistique descriptive : repose sur l’observation des phénomènes concrets (passés). Son but est de résumer,
structurer l’information sous forme graphique ou numérique. Elle se fait généralement sur des échantillons
Les données recueillies ne sont pas considérées comme une information complète, mais une information partielle
d’une population. Il est alors naturel de supposer que les données sont des réalisations de variables aléatoires, qui
ont une certaine loi de probabilité. Cette approche nécessite des outils mathématiques plus pointus de théorie des
probabilités
RAPPELS
La probabilité : est un outil de calcul mathématique permettant de modéliser des phénomènes où le hasard
intervient et d´écrire des expériences aléatoires
Une variable aléatoire X est une fonction qui associe à chaque évènement élémentaire de l’expérience aléatoire
de l’ensemble de départ (Ω) un nombre réel dans l’ensemble d’arrivée (E)
Par convention, on note toujours les variables aléatoires par des lettres majuscules (X) et les valeurs qu’elles
prennent dans une réalisation par des lettres minuscules (xi)
Chaque fois qu’on a une variable aléatoire X, on lui associe sa loi de probabilité. C’est une fonction telle que
f(x) = p(x=xi)
Il existe des lois de probabilités dites usuelles ou théoriques auxquelles l’utilisateur peut se référer en identifiant
le modèle approprié de ses données et utiliser les résultats de la loi choisie
La loi la plus fréquente décrivant les phénomènes naturels est la loi normale
RAPPELS
La probabilité : est un outil de calcul mathématique permettant de modéliser des phénomènes où le hasard
intervient et d´écrire des expériences aléatoires
Une variable aléatoire X est une fonction qui associe à chaque évènement élémentaire de l’expérience aléatoire
de l’ensemble de départ (Ω) un nombre réel dans l’ensemble d’arrivée (E)
Par convention, on note toujours les variables aléatoires par des lettres majuscules (X) et les valeurs qu’elles
prennent dans une réalisation par des lettres minuscules (xi)
Chaque fois qu’on a une variable aléatoire X, on lui associe sa loi de probabilité. C’est une fonction telle que
f(x) = p(x=xi)
Il existe des lois de probabilités dites usuelles ou théoriques auxquelles l’utilisateur peut se référer en identifiant
le modèle approprié de ses données et utiliser les résultats de la loi choisie
La loi la plus fréquente décrivant les phénomènes naturels est la loi normale
RAPPELS
La probabilité : est un outil de calcul mathématique permettant de modéliser des phénomènes où le hasard
intervient et d´écrire des expériences aléatoires
Une variable aléatoire X est une fonction qui associe à chaque évènement élémentaire de l’expérience aléatoire
de l’ensemble de départ (Ω) un nombre réel dans l’ensemble d’arrivée (E)
Par convention, on note toujours les variables aléatoires par des lettres majuscules (X) et les valeurs qu’elles
prennent dans une réalisation par des lettres minuscules (xi)
Chaque fois qu’on a une variable aléatoire X, on lui associe sa loi de probabilité. C’est une fonction telle que
f(x) = P(x=xi)
Il existe des lois de probabilités dites usuelles ou théoriques auxquelles l’utilisateur peut se référer en identifiant
le modèle approprié de ses données et utiliser les résultats de la loi choisie
La loi la plus fréquente décrivant les phénomènes naturels est la loi normale
RAPPELS
La loi normale est très importante en statistique : plusieurs phénomènes ont une loi de probabilité très proche de la
loi normale servant pour les modéliser. De plus, elle est souvent utilisée pour faire des approximations dans le
domaine de l’estimation et des tests d’hypothèses
La fonction de densité de probabilités de la loi normale a la forme d’une « courbe en cloche ». Il existe toute un
ensemble de courbes [A, B] dépendant de m (ou µ ) et σ. La loi est notée N(m, σ) ou (µ, σ)
Il faudrait une table pour calculer les probabilités pour chaque courbe, d’où la notion de loi normale standardisée
La loi standardisée est appelée loi normale centrée réduite, et notée N (0, 1), avec une seule courbe (C)
Donc si X suit N (m, σ), on pose Z = et Z suit N (0, 1)

A B C
RAPPELS
La loi normale est très importante en statistique : plusieurs phénomènes ont une loi de probabilité très proche de la
loi normale servant pour les modéliser. De plus, elle est souvent utilisée pour faire des approximations dans le
domaine de l’estimation et des tests d’hypothèses
La fonction de densité de probabilités de la loi normale a la forme d’une « courbe en cloche ». Il existe toute un
ensemble de courbes (A, B) dépendant de m (ou µ ) et σ. La loi est notée N(m, σ) ou (µ, σ)
Il faudrait une table pour calculer les probabilités pour chaque courbe, d’où la notion de loi normale standardisée
La loi standardisée est appelée loi normale centrée réduite, et notée N (0, 1), avec une seule courbe (C)
Donc si X suit N (m, σ), on pose Z = et Z suit N (0, 1)

A B C
PROPRIÉTÉS DE CALCUL DES PROBABILITÉS DANS LE CAS D’UNE LOI
NORMALE CENTRÉE RÉDUITE

déterminé à partir de la table Z

a b
STATISTIQUE DESCRIPTIVE/STATISTIQUE INFÉRENTIELLE
STATISTIQUE INFÉRENTIELLE
En pratique, il est souvent observé que les études statistiques ne se font pas sur l’ensemble de
la population mais sur un échantillon extrait de la population pour plusieurs raisons, notamment :
la taille de la population peut être très importante et le coût de l’enquête serait trop important (coût et
temps);
l’accès à tous les individus de la population est matériellement impossible (population de grande taille ou
indéfinie)

Les paramètres (notamment la moyenne, l’écart type, la proportion d’un caractère) de la


population sont ainsi estimés à partir de l’observation d’un échantillon. ce problème fait partie
de la théorie de l’estimation et c’est ce qu’on appelle statistique inférentielle
La manière de recueillir les données d’un échantillon à partir d’une population fait l’objet de la
théorie d’échantillonnage [étude des liaisons qui existent entre une population et les
échantillons de cette population]
THÉORIE D’ÉCHANTILLONNAGE
REPRÉSENTATIVITÉ DE L’ÉCHANTILLON

 la théorie de l’échantillonnage étudie les liens entre une population et des échantillons de cette population. à
partir d’informations relatives à la loi d’une variable X pour une population donnée, on en déduit le
comportement d’échantillons aléatoires simples relatifs à cette variable
 Un bon échantillon doit constituer une image réduite de l’ensemble de la population (représentatif), dans le cas
contraire l’échantillon est biaisé
 Différentes méthodes d’échantillonnage sont proposées et qui dépendent notamment de l’objectif de l’étude en
plus d’autres facteurs
 la méthode d’échantillonnage a plus simple et la plus importante est l’échantillonnage aléatoire simple où les
tirages sont équiprobables et indépendants les uns des autres. Dans ce cas, les observations deviennent des
variables aléatoires pour lesquelles des lois de probabilités sont associées
THÉORIE DE L’ÉCHANTILLONNAGE
THÉORIE DE L’ÉCHANTILLONNAGE :
REPRÉSENTATIVITÉ DE L’ÉCHANTILLON
Échantillonnage
aléatoire simple
Méthodes les
Échantillonnage plus utilisées
systématique
M. Probabilistes
(aléatoires)
Échantillonnage
stratifié

Échantillonnage en
grappe
Méthodes d’échantillonnge
Échantillonnage de
convenance

Échantilonnage par
quota
M. Non
probabilistes (non
aléatoires)
Échantillonnage
selon le jugement

Échantillonnage de
boule de neige
THÉORIE DE L’ÉCHANTILLONNAGE :
MÉTHODES D’ÉCHANTILLONNAGE PROBABILISTES
chaque individu statistique a la même chance de figurer dans l’échantillon
Dans l’échantillonnage aléatoire simple :
1) On numérote chacune des unités statistiques qui compose
la population de 1 à N
2) On sélectionne aléatoirement le nombre d’unités
statistiques voulues afin de former l’échantillon (ex. À l’aide
d’Excel ou table des nombres au hasard)

Dans l’échantillonnage systématique :


1) On calcule le pas d= N/n
2) On sélectionne aléatoirement un premier nombre
compris entre 1 et d
3) Les autres unités statistiques sont choisies à intervalle
constant [ = pas] par rapport au choix de la première
unité statistique
MÉTHODES D’ÉCHANTILLONNAGE PROBABILISTES
chaque individu statistique a la même chance de figurer dans l’échantillon

Dans l’échantillonnage stratifié :


1) On subdivise la population en sous-groupes
homogènes, ou strates (en fonction de l’âge, ou
sexe…)
2) On choisit ensuite un échantillon aléatoire dans
chacune des strates.
3) Chaque strate est représentée dans l’échantillon
proportionnellement à son importance dans la
population.
Dans l’échantillonnage en grappe :
1) On subdivise la population en sous-populations internes
hétérogènes et externes homogènes appelées grappes.
Les grappes sont homogènes à l’extérieur car elles
semblent être regroupées selon des critères communs,
mais sont intérieurement hétérogènes parce que les sous-
populations au sein des grappes ont des compositions
différentes.
2) On sélectionne au hasard un certain nombre de grappes
THÉORIE DE L’ÉCHANTILLONNAGE
DISTRIBUTION D’ÉCHANTILLONNAGE DE

Population

K échantillons à n individus

X1 X’’’’1
X2 X’’’’2
X’’1
X3 X’1 X’’’’3
X’’2
. X’2 .
X’’3
Xn X’3 X’’’’n
.
.
X’n
X’’n ………………….
Échantillon 1
Échantillon k
Échantillon 2 Échantillon 3

Chaque échantillon est caractérisé par sa moyenne qui peut être proche ou éloignée de la moyenne de la
population.
On définit alors X une variable aléatoire qui associe la moyenne de l’ échantillon
EXEMPLE

On effectue une étude démographique sur la fécondité chez la femme citadine et on considère la variable
aléatoire X qui désigne le nombre d ’enfants par famille.
On s’intéresse au nombre moyen d’enfants par famille. Pour cela, on prélève 5 échantillons aléatoires

On remarque que le nombre moyen d’enfants par famille prend des valeurs différentes selon l’échantillon
considéré; la moyenne est donc une variable aléatoire
DISTRIBUTION D’ÉCHANTILLONNAGE DE
 La distribution d’échantillonnage de correspond à la distribution de probabilité de toutes les valeurs possibles de la moyenne .
on a ainsi les résultats suivants :
 L’espérance mathématique de (= moyenne des moyennes de chaque échantillon) est :

 L’écart type est :

 D’après le théorème central limite, la distribution d’échantillonnage de la moyenne d’échantillon peut être approchée par une
distribution de probabilité normale, lorsque la taille de l’échantillon (n) devient importante (population considérée comme infinie avec
N>>30). Cela est également vrai dans le cas où l’échantillonnage se fait avec remise pour une population finie.
Le théorème reste valable pour un échantillonnage sans remise mais pour une taille de la population assez grande
Donc X suit approximativement N ( , )
DISTRIBUTIONS D’ÉCHANTILLONNAGE DE LA MOYENNE DES
PROPORTIONS P
 L’espérance mathématique de p est :

 l’écart type de p est :

est appelé : l’erreur type de la proportion


APPLICATION
Une machine fabrique des disques en grande série. On suppose la variable aléatoire X qui à chaque disque tiré
au hasard associe son diamètre qui suit la loi normale N (µ ; σ) avec µ = 9,2mm et σ = 1,8mm
1) Quelle est la loi de probabilité de X qui à tout échantillon de taille n = 81 associe la moyenne des
diamètres des disques
2) Déterminer un intervalle centré en 9,2 telle que les valeurs de la variable aléatoire appartiennent à cet
intervalle avec une probabilité de 0,95
THÉORIE DE L’ESTIMATION
THÉORIE DE L’ESTIMATION

 L’estimation désigne le procédé par lequel on détermine les valeurs inconnues des paramètres d’une population
à partir des données d’un échantillon. (c’est la statistique inférentielle)
 Pour cela, il faut passer par des variables aléatoires dont on connait les lois de probabilité. Les informations
fournies par un échantillon ne sont interprétables que si elles sont accompagnées d’informations quantitatives
fixant le degré de confiance qu’on peut leur accorder
L’estimation des paramètres de la population peut se faire de deux manières :
 Estimation ponctuelle
 Estimation par intervalle de confiance
ESTIMATION PONCTUELLE DES PARAMÈTRES DE LA POPULATION
(MOYENNE, ÉCART TYPE ET PROPORTION)
 Soit X une variable aléatoire définie sur la population mère Ω de taille N chez qui on veut estimer la moyenne µ, l’écart
type σ et la proportion p d’individus possédant un caractère donné
 On prélève un échantillon E de taille n de cette population et on suppose que l'on a calculé la moyenne µe (m ou x) ,
l'écart-type σe (s) et la proportion f de cet échantillon
 Une estimation ponctuelle de la moyenne µ de la population est :

 Une estimation ponctuelle de l'écart-type σ de la population est :

 Une estimation ponctuelle de la proportion p de la population est :


Remarque : ces estimateurs doivent répondre à 3 propriétés :
 non biaisés (la variance de l’échantillon est un estimateur biaisé de la variance de la population. Pour la débiaiser, on
multiplie par n/n-1)
 Précis
 convergents
ESTIMATION DE LA MOYENNE PAR INTERVALLE DE CONFIANCE
On cherche un intervalle qui contient la moyenne de la population avec un coefficient de confiance C choisi à priori (en
général 95% ou 99%), à chaque coefficient ou seuil de confiance on associe un seuil de risque α tel que C = 1 – α (si C =
0,95, α = 0,05)

1er cas, la moyenne µ de la population inconnue et l’écart type σ connu


On prélève un échantillon E de taille n de cette population et on suppose que l'on a calculé la moyenne µe
D’après la théorie de l'échantillonnage, la variable aléatoire X qui associe la moyenne calculée dans l’échantillon (de taille
n ≥ 30) suit approximativement une loi normale
connu
connu
inconnu
Cela implique que :

z dépend du pourcentage de confiance choisi ; z = (1- α/2) ; [2π(z) - 1 = 1 – α = C]


z est déterminée par lecture inverse de la table Z (loi normale centrée réduite)

pour un seuil de confiance de 95% par exemple, α = 0,05 et z = 1,96


Intervalles de confiance d’une variable aléatoire
selon une distribution de loi normale
ESTIMATION DE LA MOYENNE PAR INTERVALLE DE CONFIANCE

Nous avons encadré x alors que nous cherchons µ, pour ceci on soustrait d’abord µ puis x de l’inégalité et on
obtient :

L’intervalle de confiance de µ au seuil de confiance C est donc : Ic = [x – z ;x+z ]


APPLICATION
Après des essais, on peut supposer que la résistance à l’éclatement d’un certain type de réservoirs est une V.A.
suivant une loi normale de moyenne µ inconnue et d’écart-type égal à 4 kg/cm2 . des essais sur un échantillon de
9 réservoirs donnent une résistance moyenne à l’éclatement égale à 215 kg/cm2 .
Question : établir un intervalle de confiance pour la résistance moyenne à l’éclatement, au niveau de risque de 5
%
APPLICATION
Après des essais, on peut supposer que la résistance à l’éclatement d’un certain type de réservoirs est une V.A.
suivant une loi normale de moyenne µ inconnue et d’écart-type égal à 4 kg/cm2 . des essais sur un échantillon de
9 réservoirs donnent une résistance moyenne à l’éclatement égale à 215 kg/cm2 .
Question : établir un intervalle de confiance pour la résistance moyenne à l’éclatement, au niveau de 5 %

L’intervalle de confiance de la moyenne de la résistance au seuil de risqué de 5% (ou au seuil de confiance de


95%) est :
I95% = [ 212,3866 ; 217,6133]
Autrement dit, la moyenne a 95% de chance d’appartenir à cet intervalle.
ESTIMATION DE LA MOYENNE PAR INTERVALLE DE
CONFIANCE
2er cas, la moyenne µ et l’écart type σ de la population inconnus

Dans le cas où l’écart type de la population est inconnu, on le remplace par son estimation ponctuelle à savoir :
ESTIMATION DE LA MOYENNE PAR INTERVALLE DE CONFIANCE
CAS DES PETITS ÉCHANTILLONS (N<30)

Dans le cas d’échantillon de petite taille (n<30), avec une distribution normale ou au moins symétrique des
données dans l’échantillon,
on utilise la variable centrée-réduite t de student pour définir l’intervalle de confiance qui est ainsi :

Les variables t sont indiquées dans la table de student.


Pour lire la valeur t, il faut prendre en compte le risque d’erreur
α et le degré de liberté (ddl). Le degré de liberté= (n – 1)
ESTIMATION DE LA PROPORTION PAR INTERVALLE DE CONFIANCE
CAS DES GRANDS ÉCHANTILLONS (n ≥ 30 ou np ≥ 5 ET nq>5)

On cherche un intervalle qui contient la proportion (p) des individus de la population pour un caractère donné avec un seuil de confiance choisi
au préalable C = 1 - α (alpha = seuil de risque)

Comment procéder ? :

On prélève un échantillon E de taille n de cette population et on suppose que l'on a calculé la fréquence (f ) du caractère étudié

D’après le théorème central limite, la variable aléatoire F qui associe la proportion d’individus possédant ce caractère dans l’échantillon suit
approximativement une loi normale N (p, )

Cela implique que :

On cherche à trouver l’intervalle pour p, on doit donc l’encadrer

L’intervalle de confiance dans lequel on a une probabilité (choisie à l’avance, 0,9 ; 0,95 ; 0,99…) de trouver la proportion p est :
APPLICATION (2)

Une machine coupe des chevilles dont 8% sont inutilisables. On prélève un échantillon de 100 chevilles.
Soit F la variable aléatoire qui associe la proportion de chevilles inutilisables dans l’échantillon
1) Quelle est la loi de probabilité de F
2) Donner un intervalle de confiance de la proportion d’appareils inutilisables au seuil de risque de 3%
TESTS D’HYPOTHÈSES
TESTS D’HYPOTHÈSE

Le test d’hypothèse permet de vérifier statistiquement si une différence observée


entre un échantillon et une population ou entre deux échantillons est réelle ou due
au hasard.
Plusieurs cas de figures peuvent être étudiés : test de conformité, test
d’homogénéité, test de parité
Test d'hypothèse est une démarche qui fournit une règle permettant de décider
si une hypothèse est confirmée ou rejetée.
TESTS D’HYPOTHÈSES
SITUATION DU PROBLÈME
1) On peut avoir un paramètre de référence, mais lorsqu’on fait nos mesures, on trouve des valeurs différentes
de la norme fixée à priori ; cette différence est elle due au hasard ou vraiment il y a un problème responsable
de cette différence ? Test de conformité
TESTS D’HYPOTHÈSES
SITUATION DU PROBLÈME
2) À partir des observations (mesures) faites sur 2 ou de plusieurs échantillons, on se retrouve avec des
caractéristiques différentes (la moyenne par exemple), on se demande alors est ce que cette différence est due
au hasard ou vraiment il y a une différence significative qui montre que ces échantillons proviennent de
populations différentes ?

Population
Test d’homogénéité

Échantillon Échantillon Échantillon


1 2 3

m1 m2 m3
TESTS D’HYPOTHÈSES
SITUATION DU PROBLÈME
3) On se confronte parfois à comparer les paramètres d’un échantillon avant et après un traitement, ou deux
traitements différents sur des échantillons de la même population, et on se demande si la différence des résultats
observés est significative ou non

Population

Échantillon sous Échantillon sous


traitement traitement
médicamenteux A médicamenteux B

53% de succés 47% de succés

Cette différence est significative ou due simplement au hasard ?


TESTS D‘HYPOTHÈSE
Résolution du problème
Par des tests statistiques, on peut vérifier si les différences observées sont dues au hasard ou plutôt sont
significatives et dues à d’autre facteurs
Le principe de ces tests c’est proposer des hypothèses et les vérifier, c’est ce qu’on appelle les tests d’hypothèse
ÉTAPES À SUIVRE POUR UN TEST D’HYPOTHÈSE
1) Formulation de l’hypothèse nulle (H0) et l’hypothèse alternative (H1)
2) Fixation du seuil de risque qui correspond au risque de rejeter à tort H0 et détermination de la loi de
probabilité de la variable aléatoire sur la population, déduire la distribution de la variable aléatoire sur
l’échantillon puis de la variable centrée réduite
3) Détermination de la zone d’acceptation de H0
4) Comparaison de la valeur calculée avec la zone d’acceptation ou rejet de H0
5) Décision
6) Interprétation
FORMULATION DES HYPOTHÈSES :
CAS DE COMPARAISON DE MOYENNES
 L’hypothèse nulle H0 est formulée exprimant que la différence observée est due au hasard, puis une hypothèse H1 dite
alternative ou complémentaire exprimant le contraire
 Cela revient à dire que H0 doit être formulée comme une égalité (par exemple de la moyenne observée et la moyenne
théorique µ = µ0). C’est sur la base de cette hypothèse que les calculs seront effectués
 L’hypothèse complémentaire H1 peut se formuler de différentes façons selon l’objectif de la comparaison. Les trois tests
les plus courants sont :
 test bilatéral (H1 : µ ≠ µ0) , dans ce cas on admet, sous H1, l’existence d’une différence dans un sens ou dans l’autre
 Test unilatéral, dans ce cas on admet , sous H1, l’existence d’une différence dans un seul sens à gauche ou à droite
 Test unilatéral à gauche (H1 : µ < µ0)
 Test unilatéral à droite (H1 : µ > µ0)
Le choix d’un test unilatéral ou bilatéral doit être fait à l’avance et dépend de la question qui nous intéresse

 Si H0 est acceptée par exemple, cela traduit seulement qu’il n’y a pas d’évidence nette pour que H0 soit fausse
APPLICATION

Quelles sont l’hypothèse nulle et hypothèse alternative dans chacun des exemples suivants ?
1) Un fabricant se vante de proposer des tubes à essai d’une durée de vie supérieure à 2000h de chauffage. a
l’aide d’un échantillon de 100 tubes testés, on estime la durée de vie moyenne à 1975h, avec un écart-type
de 130h, peut-on affirmer, au risque 5%, que le fabriquant a raison ?
2) Un laboratoire pharmaceutique désire étudier les effets secondaires potentiels d’un médicament sur le taux
de cholestérol des patients. cent volontaires sains sont donc choisis pour tester le médicament.
(a) avant l’expérience, le taux de cholestérol moyen de ces volontaires est de 2.02 ± 0.2g/l. le taux de
cholestérol moyen dans la population étant de 2 g/l, vérifier que cet échantillon est représentatif au risque
5%.
(b) (b) après un mois de traitement, seuls 97 volontaires reviennent faire un test. leur taux moyen de cholestérol
est passé à 2.09 g/l avec un écart-type d’échantillon de 0.25g/l. la différence est-elle significative au risque
5% ? au risque 1% ?
FIXATION DU SEUIL DE RISQUE :
ERREUR DE 1ère ESPÈCE (ALPHA), ERREUR DE 2ème ESPÈCE (BETA)

α Est la probabilité de rejeter H0 sachant qu’elle est vraie

β Est la probabilité d’accepter H0 sachant qu’elle est fausse

Au seuil de risque alpha choisi, on lit sur la table la valeur de z ou de t selon la taille de l’échantillon
DÉTERMINATION DE LA ZONE D’ACCEPTATION DE H0
CAS D’UN TEST BILATÉRAL
 Dans le cas d’une distribution normale, la variable aléatoire X suit la loi normale donc
déterminer la zone d’acceptation de H0 revient à chercher l’intervalle auquel devrait appartenir la moyenne
de l’échantillon avec un seuil de risque prédéfini ( α )

 Il faut donc déterminer les bornes de l’intervalle en procédant de


la même manière que la détermination de l’intervalle de confiance
pour la détermination des paramètres de la population
CRITÈRES DE DÉCISION

 On détermine si la valeur calculée de la moyenne à partir de l’échantillon appartient ou non à cet intervalle
DÉTERMINATION DE LA ZONE D’ACCEPTATION DE H0
& CRITÈRES DE DÉCISION DANS LE CAS D’UN TEST UNILATÉRAL
Dans le cas d’un test unilatéral, le même principe est gardé sauf qu’au lieu de chercher un intervalle d’acceptation de H0, on cherche la
statistique (z) au-delà ou en deçà de laquelle on accepte H0

 Si on opte pour un test unilatéral gauche, on cherche la borne (b) tel que P(X < b) = α ⇐⇒ P(Z < )=α
On centre et on réduit
la variable

 Si x est supérieure à b, on accepte H0

 Si x est inférieure à b, on rejette H0

 Si on opte pour un test unilatéral à droite, on cherche (b) α α


tel que = 1- α 1- α 1- α

 Si x est inférieure à b, on accepte H0

 Si x est supérieure à b, on rejette H0


APPLICATION (1)
Un fabriquant de papier affirme que l’épaisseur du papier est de 0,05mm, si la valeur moyenne du papier
diffère de cette norme, un ajustement de l’appareil doit être fait. Un échantillon de 100 papier est tiré
aléatoirement et la moyenne obtenue de l’épaisseur du papier est 0,051mm avec un écart type de 0,002 mm;
1) En considérant que la distribution de l’épaisseur du papier suit la loi normale, au risque de 5%, l’appareil
nécessite ou non un ajustement ?
2) Répondre à la même question en considérant que la taille de l’échantillon est de 25 avec une moyenne de
l’épaisseur de 0,052mm et un écart type de 0,003mm
APPLICATION 2
Un fabricant se vante de proposer des tubes à essai d’une durée de vie supérieure à 2000h de chauffage. a
l’aide d’un échantillon de 100 tubes testés, on estime la durée de vie moyenne à 1975h, avec un écart-type
de 130h,
Peut-on affirmer, au risque 5%, que le fabriquant a raison ?
TESTS SUR LES PROPORTIONS
 Nous nous proposons de tester si la proportion p d’éléments dans la population présentant un certain
caractère qualitatif peut être ou non considérée comme égale à une valeur hypothétique p0.
 On étudie une variable X, qui représente le nombre k de succès parmi n tirages (par exemple, le nombre k
de filles sur n = 100 naissances). On note f = k/n et on veut vérifier si les observations concordent avec une
loi théorique de probabilité de succès p0 . la loi théorique de X est une loi binomiale de probabilité p pour n
tirages ; on peut raisonner en étudiant si p0 est dans l’intervalle de confiance de p, ou par un test.
Pour utiliser la convergence de la loi binomiale vers la loi normale, il faut toujours que n > 30, avec np0 > 5
et n(1 − p0) > 5
 On procède de la même manière que pour la moyenne en suivant les mêmes étapes

 Pour un test bilatéral, les bornes de l’intervalle d’acceptation de H0 sont

Vous aimerez peut-être aussi