Académique Documents
Professionnel Documents
Culture Documents
SEMESTRE 3
Rodrigue FOSSI
i
PROBABILITÉS ET STATISTIQUES Francis DJANNA KOFFI / Rodrigue
UE : IUT GMP34 CULTURE SCIENTIFIQUE ET HUMAINE
DUREE: 24 Heures
ÉQUIPE PÉDAGOGIQUE
OBJECTIFS GENERAUX
(i) Effectuer une étude statistique et modéliser sous la forme d’une ou deux variables ou
dimensions
OBJECTIFS SPECIFIQUES
(i) Représenter une série statistique à une variable et interpréter les caractéristiques de
position et de dispersion.
(ii) Représenter une série statistique à deux variables et effectuer un ajustement affine Y en
X.
(iii) Dénombrer, modéliser et calculer une situation aléatoire à l’aide des probabilités et
variables aléatoires en utilisant les différentes loi quantitatives (Binomiale, Poisson et
Normale).
vii
vii
vii
vii
Une série statistique à une variable est en général constituée d’un grand nombre de valeurs,
donc d’un grand nombre d’informations, difficiles à appréhender d’un seul coup. Un des
premiers buts de la statistique descriptive est de représenter cet ensemble de valeurs sous
une forme plus synthétique de façon à rendre plus accessibles les informations que l’on
souhaite tirer de cette série de données. Pour cela, on utilise des tableaux numériques et/ou
des graphiques. Il faut bien noter que le type de tableau et de graphique utilisé dépend du
type de données à représenter et que certaines informations peuvent alors être
définitivement perdues.
1.1.2.1. Définitions
Un caractère est qualitatif s’il est lié à une observation ne faisant pas l’objet d’une mesure; il
est: ordinal si les observations peuvent être ordonnées ; nominal sinon.
Un caractère est quantitatif s’il est mesurable ; il est : discret si les valeurs observées sont
isolées ; continu s’il peut prendre toute valeur d’un intervalle réel (on traite comme continu
tout caractère discret dont on a regroupé les valeurs dans des classes).
On constitue et on étudie une série statistique à une variable (ou à une dimension)
lorsqu’on s’intéresse aux valeurs d’un seul caractère sur une population donnée.
1.1.2.2. Représentations
La collecte des données conduit à établir un tableau à deux colonnes dit tableau des données
ponctuelles. Dans la première colonne figurent tous les individus observés; dans la seconde,
sont indiquées les valeurs correspondantes du caractère observé.
Ce tableau, souvent important et lourd à gérer, est pratiquement toujours remplacé par le
tableau de distribution des observations. Dans la première colonne se trouvent les valeurs
distinctes du caractère ; dans la seconde, pour chacune de ces valeurs, se trouve la liste des
individus pour lesquels le caractère prend cette valeur. En général moins long que le tableau
de données ponctuelles, ce tableau permet de mieux appréhender l’ensemble des valeurs
observées tout en conservant la même information.
L’effectif n est le nombre de fois où la modalité numéro i a été observée. La fréquence est
Représentations graphiques
Les caractères qualitatifs peuvent être représentés par des diagrammes à bandes des
diagrammes à secteurs, des bandes subdivisées de longueur fixe, ou des diagrammes
figuratifs.
Représentations associées à un caractère quantitatif discret
- Tableau de distribution d’effectifs et/ou de fréquences
Les valeurs observées sont en général rangées en ordre croissant. Les fréquences cumulées
croissantes cumulent les fréquences associées aux valeurs du caractère inférieures (ou
égales) à . Ainsi :
vii
1.2.1. Introduction
Dans le cas des caractères quantitatifs, on cherche souvent à résumer l’ensemble des valeurs
observées par une ou deux valeurs seulement, selon les buts poursuivis par l’analyse
statistique.
Définitions
On dispose d’un tableau d’effectifs (ou de fréquences) (i; xi ; ni ou fi,) où j est le numéro, x
la valeur et n1 l’effectif (J la fréquence) de la i-ième donnée. La moyenne arithmétique de la
série statistique est donnée par la formule :
= =
vii
centres des classes ; dans ce cas la valeur obtenue n’est, en général, qu’une valeur
Remarque : La moyenne arithmétique s’exprime dans la même unité que les valeurs
observées mais elle n’a aucune raison d’être égale à l’une d’entre elles, même d’être une
valeur observable.
Elle n’est pas robuste, c’est-à-dire qu’elle est sensible aux variations des valeurs extrêmes:
par exemple, une modification de la valeur minimum 1CC maximum) entraîne une
Propriétés :
En effet: = =0
vii
Cette formule, facile à démontrer, montre que, contrairement à ce que pensent certains, la
moyenne de la série obtenue en fusionnant deux séries statistiques n’est pas, en général,
égale à la moyenne de leurs moyennes arithmétiques. Cela n’est vrai que lorsque
dans le cas contraire, il s’agit donc de la moyenne des moyennes pondérées par les
coefficients .
On peut étendre la formule au cas de p échantillons de valeurs d’un même caractère, chacun
de taille n et de moyenne m. La moyenne m de la série statistique, de taille n, obtenue en
fusionnant toutes les valeurs des p échantillons, est donnée par (formule MP).
• P4 : soient (xi)1 ≤ i ≤ n une série statistique, a et b deux réels. On considère la série statistique
= +
Soient (xi)1 ≤ i ≤ n et (yi)1 ≤ i ≤ n deux séries statistiques de même nature. On considère la série
vii
1.2.2.2. Quantiles
Définitions
• Soit α un réel compris entre 0 et 1 (ou 0% et 100%). Un quantile d’ordre α est tout réel
satisfaisant simultanément :
La médiane, notée Me, est le quantile d’ordre 50%. Elle partage la série en deux séries de
même taille.
Ces trois quartiles, ainsi que les valeurs extrêmes de la série, peuvent être représentés
graphiquement à l’aide de boîtes à moustaches.
Les boîtes à moustaches (ou à dispersion, Box plots en anglais) sont des représentations
ses quartiles (Q25, Me, Q75). Sur une échelle horizontale (ou verticale),
(3) on ajoute les «moustaches », c’est-à-dire des segments s’étendant de la valeur minimale
au premier quartile et du dernier quartile à la valeur maximale.
vii
De plus, on peut tenir compte de la taille des populations concernées en traçant les
rectangles d’une largeur proportionnelle à la racine carrée de celle-ci (voir TP 1.2, p. 25).
c) Mode
On appelle mode(s) d’une distribution statistique non groupée la (les) valeur(s) observée(s)
d’effectif maximum. On le note généralement Mo.
Pour une distribution groupée, on appelle classe(s) modale(s) la (les) classe(s) de densité
maximum.
1.2.3 Techniques
a) Comment calculer la moyenne d’une série statistique à une variable?
(2) diviser le total par le nombre de valeurs observées (effectif total de la série).
(3) totaliser tous les effectifs ce qui donne l’effectif total n de la série,
(2) se ramener au cas ii. ou iii. en remplaçant valeurs par centres des classes.
v. Si on sait que la série est obtenue par agrégation de plusieurs séries statistiques d’effectif
et moyenne connus,
1.3.1 Introduction
Résumer une série statistique par une caractéristique de position est en général trop
restrictif. Ainsi, deux étudiants ayant obtenu respectivement 9, 10, 11 et 2, 10, 18 aux
contrôles de mathématiques ont même note moyenne (ou médiane). Mais, si on peut juger
que le premier a des « résultats moyens », cela est moins net pour le second
1.3.2.1. Écart-type
Théorème 1.1
vii
= -2 +
Pour un tableau de données ponctuelles, il suffit de remplacer, dans les formules ci-dessus,
tous les par 1. Pour un tableau d’effectifs de classes, on remplace les par les centres
des classes.
L’écart-type s’exprime dans la même unité que les valeurs observées et mesure la dispersion
autour de la moyenne . Plus l’écart type est grand, plus la dispersion des observations
L’écart interquartile est le nombre Q75 – Q25. L’écart interdécile est le nombre Q90 – Q10..
L’écart intercentile est le nombre Q99 – Q1.
L’e.a.m. par rapport à la moyenne est la moyenne des écarts absolus à la moyenne:
L’e.a.m. par rapport à la médiane est la moyenne des écarts absolus à la médiane:
vii
1.3.2.4. Étendue
1.3.3. Techniques
vii
2.1.1. Introduction
Sur une même population d’effectif n, on peut être amené à étudier m caractères différents.
Les n x m valeurs prises par ces caractères pour chaque individu de la population définissent
une statistique multi variée à m dimensions.
Cette section précise comment représenter une telle statistique dans le cas m = 2 de façon à
appréhender au mieux les données. Le but général est de mettre en évidence:
2.1.2.1. Définition
vii
Lorsqu’un certain nombre d’observations sont identiques, il peut être judicieux de présenter
les données dans un tableau à double entrée. On reporte les p valeurs distinctes de X en
lignes et les q valeurs distincte de Y en colonnes. À l’intersection de la ième ligne et de la ième
Valeurs de Y … …
Valeur X
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
vii
On a:. = = = n.
2.1.2.3. Stéréogramme
Soit (X, Y) une série statistique à deux variables quelconques connue par son tableau de
contingence (xi ; yi ; nij)1 ≤ i ≤ p, 1 ≤ j≤ p,
vii
Lorsque les deux caractères étudiés sont quantitatifs, on peut simplifier cette représentation
graphique en deux dimensions en traçant un nuage de points.
L’ensemble des points , de coordonnées (xi ; yi )1 ≤ i ≤ n dans le plan rapporté à un repère
Les individus qui se ressemblent sont représentés par des points confondus ou proches les
uns des autres. La liaison éventuelle entre X et Y est suggérée par la forme du nuage de
points. Par exemple, des points quasiment alignés indiquent une liaison affine entre les
caractères...
Lorsque des points se superposent, on ajoute entre parenthèses leur effectif sur la
La figure ci-dessous donne une représentation graphique du nuage de points défini par le
tableau de contingence de l’exercice 2.1.
Pour comparer ces vecteurs et essayer d’établir d’éventuelles relations entre eux, on est
amené à utiliser la distance dite euclidienne, ce qui revient à privilégier les notions de
moyenne arithmétique et d’écart type comme on l’a vu au TP 1.1 p. 22.
En notant le vecteur dont toutes les coordonnées sont égales à 1, on introduit les vecteurs
dont toutes les coordonnées sont égales à la moyenne de la série X et dont toutes
= - et = -
vii
est représenté par un vecteur dont le support [O A) est un segment horizontal, avec A
= =
où σ(X) est l’écart type de la série statistique X. De même , est représente par un vecteur
= =
Cos( , ) = Cos( , )= =
vii
(En effet, on rappelle que est un vecteur unitaire de même sens que Leurs
)= .
2.1.3. Techniques
• Si les caractères ne sont pas tous les deux quantitatifs, utiliser un logiciel permettant de
réaliser des stéréogrammes.
• Si les caractères sont quantitatifs, construire un nuage de points en portant les valeurs du
premier sur l’axe des abscisses et celle du second sur l’axe des ordonnées. Lorsque des
points sont superposés, indiquer leur nombre entre parenthèses. On peut aussi indiquer,
lorsque le dessin n’est pas trop chargé, sous forme d’étiquettes attachées à chacun des
points, le nom (ou un code correspondant) des individus observés représentés par ces points.
vii
Le point de vue géométrique précédent permet d’introduire une notion importante pour
l’étude des séries statistiques à deux dimensions: la corrélation linéaire. On s’intéresse alors
S’il existe une liaison fonctionnelle affine entre Y et X du type Y = aX + b (a E ℝ*, b ℝ),
et sont colinéaires. On dit alors que les caractères X et Y sont parfaitement corrélés.
vii
non de même sens. Autrement dit, il existe une liaison fonctionnelle affine entre Y et X du
type Y = aX + b avec b =
A contrario, si les vecteurs et sont orthogonaux (cosinus nul), on dit que les caractères
. =0 - ). - )
=0
Entre ces deux situations extrêmes, l’écart angulaire des vecteurs V et V (ou plus
précisément son cosinus) fournit une mesure du degré de corrélation linéaire entre les deux
caractères étudiés.
Définitions
Sachant que cos 30° = 0,866 et cos 60°= , ce critère graphique se traduit
numériquement par:
vii
2.2.2.2. Covariance
Définition
En généralisant la notion de variance définie pour une série statistique à une dimension, on
introduit la notion de covariance d'un couple statistique (X, Y) :
ou
Théorème 2.1
(5) 𝜌 = Cos ( )=
Démonstration.
(4) On développe les produits dans la définition de la covariance, on reconnaît les formules
Cov(X,Y) =
=
vii
(5) =
corrélation est négative si Cov(X,Y) < 0 𝜌 < 0 (les caractères varient en sens opposés, B
2.2.3. Techniques
vii
(2) Calculer Cov(X, Y) à laide de la formule énoncée dans la propriété 4 ci-dessus. Cov (X,
Y)
(3) Calculer
2.3.1. Introduction
Lorsque les deux caractères X et Y sont quantitatifs, il arrive fréquemment que l’on souhaite
établir une relation fonctionnelle entre eux.
déterminer une fonction f de la variable X dont la représentation graphique soit «la plus
Le plus souvent cette proximité s’entend au sens des moindres carrés et la fonction f est de
type affine.
On peut bien entendu chercher aussi à « expliquer» X par Y (c’est-à-dire à prévoir les
valeurs de X à partir de celles de Y supposées connues), en effectuant une régression de X
en Y. On prendra garde que l’une ou l’autre de ces régressions peut ne présenter aucun
intérêt, voire être dénuée de sens, selon le contexte étudié.
vii
sont les écarts verticaux (parallèles à l’axe des y) entre les points de et ceux de . Ils
mesurent les erreurs que l’on commet en remplaçant les valeurs observées y par les valeurs
La méthode des moindres carrés (appliquée aux écarts verticaux) consiste à déterminer la
fonction f qui rend minimum la quantité : (donc qui rend minimum la variance
Dans le cas où le nuage présente une forme allongée et linéaire, on choisit affine :
de Y en X.
Remarque. On peut être ramené à ce cas après une transformation des données ; par
exemple, en posant u = ln x et/ou v = ln y.
régression de Y en X.
De la même façon, en minimisant la somme des carrés des écarts horizontaux, la méthode
des moindres carrés fournit une équation de la droite de régression de X en Y du type
vii
X en Y.
Ces ajustements sont justifiés si la valeur absolue du coefficient de corrélation linéaire est
proche de 1. En pratique
Théorème 2.2 (calcul des coefficients de régression). Soit (X, Y) un couple de variables
statistiques quantitatives à variances non nulles.
Alors les coefficients de régression affine sont donnés par les formules suivantes:
a=
a’ =
et . On note
= le vecteur de coordonnées - )
vii
= - celui de coordonnées ( -= - - - )
La méthode des moindres canés (appliquée aux écarts verticaux) consistent à déterminer les
= ²
Cette somme de deux canés indépendants est minimale lorsque chacun de ses termes est
minimal.
et son modèle affine ont alors même moyenne. Or, de la propriété P4 (voir p). On déduit
= d’où: =
vii
figure 2.8).
distance HB est minimum, c’est-à-dire si, et seulement si, H est la projection orthogonale de
sur (OA).
=0
. =0
= 0
vii
de coordonnées .
).
V(Y) = V( ) + V(E)
vii
sont orthogonaux ou encore que le triangle OHB est rectangle en H (voir figure 2.8). Le
théorème de Pythagore assure que: 0B² = OH² + HB² soit:
annoncée.
On a donc :
= = =
Dou: D = ².
2.3.3. Techniques
puis a’ = et b’ =
2.4.1. Introduction
Pour utiliser la fonction affine définissant la droite de régression de Y cri X afin d’interpoler
ou d’extrapoler des valeurs de Y en fonction de nouvelles valeurs de X, il est recommandé
de s’assurer que le coefficient de détermination de (X. Y) est «bon» (c’est-à-dire supérieur à
0,75). Mais cela n’est pas toujours suffisant. Outre un contrôle graphique, il est bon de
s’assurer également que les erreurs commises en utilisant le modèle affine pour les valeurs
de X connues sont suffisamment faibles et paraissent aléatoires.
On appelle résidus standardisés les écarts réel-modèle, divisés par une estimation non
vii
Où s se déduit de :
s² = ²
Tout résidu standardisé jugé significativement différent de 0 met en évidence les faiblesses
du modèle de prévision, à moins que la valeur observée ne puisse être considérée comme
aberrante, ce dont on cherchera à s’assurer.
2.4.3. Technique
puisque 𝜌²
(3) Calculer : s = ou s =
vii
Dénombrer
Comment déterminer le nombre de cas dans des situations comportant plusieurs choix 7
Comment vérifier que deux événements sont indépendants pour une probabilité?
3.1. DÉNOMBRER
3.1.1. Introduction
Cette section donne les réponses, sans démonstration, à ces questions de dénombrement que
ion retrouve ensuite dans certains calculs de probabilité.
Soit n un entier, on note n! (factorielle n) le produit de tous les entiers non nuls inférieurs ou
égaux à n et par convention O! = 1.
3.1.2.1. Arrangements
vii
Permutations
Un arrangement avec répétitions de p éléments choisis parmi n est une liste (ordonnée), avec
répétitions éventuelles des éléments.
3.1.2.2. Combinaisons
𝜌 éléments.
Propriétés
vii
( = (formule du binôme)
Une combinaison avec répétitions de 𝜌 éléments choisis parmi n est une liste non ordonnée,
avec répétitions éventuelles des éléments.
= =
3.1.3. Techniques
3.1.3.1. Comment déterminer le nombre de cas dans des situations comportant plusieurs
choix?
Modèles usuels
Avec remise
Principe additif
vii
Principe multiplicatif
Pour dénombrer un produit cartésien d’ensembles, ce qui revient à faire un choix, puis (et)
un autre, puis un autre, etc., on effectue le produit des cardinaux de chaque ensemble.
3.2.1. Introduction
Lorsqu’on jette un dé ordinaire en l’air, on est certain qu’il va retomber et s’immobiliser sur
l’une de ses faces, mais on est incapable de prévoir exactement laquelle. De nombreuses
situations semblent obéir à cette dualité: d’une part des aspects prévisibles, déterministes,
nécessaires ; d’autre part des aspects imprévisibles, aléatoires, contingents.
On décrit une situation aléatoire bien définie à l’aide du langage des événements qui permet
de préciser les objets d’étude. En modélisant les événements par des ensembles, on dispose,
grâce au langage des ensembles, d’un outil de calcul sur les événements.
La notion de probabilité, enfin, répond au besoin de définir une mesure sur les ensembles
(représentant des événements) permettant de quantifier la chance qu’ont les événements
d’être réalisés ou non.
Ce chapitre introduit les principales notions du calcul des probabilités dans le cadre des
ensembles finis. Elles seront étendues aux ensembles infinis d’événements dans le chapitre
suivant.
Définitions
Expérience aléatoire: mise en œuvre, dans des conditions bien définies (protocole) d’un
processus évolutif pour un système (matériel ou modèle) dont l’état final est observable
(expérience concrète) ou imaginable (expérience abstraite) mais imprévisible. Un tel état
final est appelé résultat de l’expérience aléatoire.
vii
Si on jette aléatoirement un dé à jouer (à six faces) sur une table plane, l’état final du dé
(après son immobilisation à plat sur la table) peut être caractérisé par le numéro porté par sa
face supérieure mais aussi par l’orientation de celle-ci. En général on ne s’intéresse qu’au
numéro et on n’envisage donc que six issues à cette expérience. Tout résultat correspondant
à un cinq sur la face supérieure, quelle que soit l’orientation de celle-ci, détermine l’issue
Si le résultat d’une expérience aléatoire détermine une issue i. on dit que i est réalisée.
Si l’une des issues d’un événement E est réalisée, on dit que E est réalisé.
Événement élémentaire: événement qui n’est réalisé que par une seule issue de l’épreuve
aléatoire. Il est représenté par un singleton inclus dans 𝛀.
Opérations logiques
Soient E et F deux événements liés à une épreuve aléatoire représentés respectivement par
deux parties A et B de l’univers 𝛀;
réalisation de F;
Définition
Soit 𝛀 un univers fini associé à une épreuve aléatoire l’ensemble des parties de 𝛀, noté
P(𝛀), représente l’ensemble de tous les événements.
Une probabilité sur 𝛀 est une application P de P(𝛀) dans [0; 1] telle que:
i. P(𝛀) 1
si alors P (A B) = P (A) + P ( B)
Conséquences
Donc P(Ø) = 0
vii
et =1
3.2.3. Techniques
Définition
On dit que P est l’équiprobabilité définie sur 𝛀 si P est la probabilité sur Q qui associe à tout
événement élémentaire la même valeur.
vii
Technique
Soit P l’équiprobabilité définie sur 𝛀 univers fini à n éléments. Pour calculer P(A) lorsque
(2) Calculer
A Ø=Ø A Ø =A
vii
A A= Ø A A =A
A B=B A A B=B A
= = (lois de De Morgan)
A B C) = (A B C) A B C) = (A B C)
A B C) = (A B C) A B C) = (A B C)
) =Ø ) =𝛀
si B C A alors A B = B si B C A alors A B = A
Technique
(2) Modéliser E par une expression ensembliste. Cette traduction se fait en remplaçant les
«et » par des « », les « ou » par des « » et les négations par des complémentaires.
vii
3.3.1. Introduction
Pour cela elle introduit la définition d’une nouvelle probabilité (dite probabilité
conditionnelle) à partir d’une première probabilité définie sur l’univers.
Pour tout événement B, PA(B) est aussi notée P(BA) et lue « probabilité de B, sachant que
A est réalisé» ou, en abrégé, «probabilité de B, sachant A ».
Propriété
Définition
Les travaux de Bayes s’inscrivent dans les tentatives des mathématiciens pour déterminer la
probabilité des causes par les effets observés.
Dans le cas particulier traité ci-après, on suppose connue u priori la distribution des
probabilités de n événements AL, causes possibles d’un événement E et réalisant une
partition de l’univers Q, ainsi que les n probabilités de E conditionnées par chaque A5. La
formule de Bayes fournit alors la distribution a posteriori des probabilités de chaque A5
sachant que E est réalisé.
Théorème 3.3. Soient Q un univers fini et E, A1, A2, …, An, n + 1 événements tels que :
i. P(E) O et ) O
iii. =𝛀
vii
P( )
Puisque P( ) O on a P( ) = P( ) x P( )
).
Pour calculer P(E) on utilise une relation ensembliste : E est la réunion disjointe de tous les
ce qui s’écrit E
E) = E) E) ... E)
vii
= ... E
= E puisque
donc:
P(E)= P = = =
3.3.3. Techniques
3.3.3.1. Comment vérifier que deux événements sont indépendants pour une probabilité ?
Soient A et B deux événements d’un même univers 𝛀 et P une probabilité définie sur 𝛀.
vii
vii
Modéliser un caractère quantitatif dans une situation aléatoire à l’aide d’une variable
aléatoire discrète ou continue
Calculer les paramètres d’une somme ou d’une différence de deux variables aléatoires
Comment calculer l’espérance et l’écart type d’une somme ou d’une différence de deux
variables aléatoires
4.1.1. Introduction
X est une application de 𝛀 dans ℝ qui, à tout individu w, associe un réel x = X( ) E X(𝛀)
observée et sa fréquence.
Supposons maintenant que l’on tire au hasard un individu w dans cette population 𝛀 pour
consigner la valeur x du caractère. Ne pouvant pas prévoir quel individu précis sera tiré, on
ne peut pas prévoir non plus la valeur x qui sera consignée. On aimerait donc, comme on l’a
fait au chapitre 3 pour les individus, disposer d’un moyen d’attribuer une probabilité aux
éléments de X(𝛀), valeurs prises par le caractère X.
L’idée est de transporter sur X(𝛀) la probabilité sur 𝛀 construite pour modéliser la situation
aléatoire correspondant au tirage aléatoire d’un individu.
De même qu’un caractère quantitatif peut être discret ou continu (voir chapitre I), on parlera
de variable aléatoire discrète ou continue. Mais cela oblige à considérer des univers infinis
dénombrables (comme N) ou non dénombrables (comme ℝ). On admettra qu’il est possible,
comme pour les univers finis, de définir une probabilité sur de tels ensembles 𝛀 en prenant
comme ensemble des événements 2(𝛀) pour les univers dénombrables et un ensemble
(appelé tribu) vérifiant les propriétés adéquates pour les univers non dénombrables.
Définition 1
Soit љ une famille non vide de sous-ensembles de 𝛀. љ est une algèbre de Boole (ou
vii
Lorsque Q est infini, les opérations peuvent porter sur une infinité dénombrable
d’événements et il devient nécessaire d’étendre la notion d’algèbre de Boole.
Définition 2
Soit Ҝ une algèbre de Boole définie sur 𝛀 on dit que Ҝ est une tribu si, pour toute suite
1. Si est une tribu et A1, A2,…, An, ... une suite infinie dénombrable d’éléments de alors:
vii
Lorsque 𝛀 est infini et muni d’une tribu T de parties de Q représentant des événements,
toute union infinie dénombrable peut représenter aussi un événement. On étend alors la
notion de probabilité, définie sur les ensembles finis au chapitre 3, en ajoutant la condition
iii. suivante.
Définition
Une probabilité sur 𝛀 est une application P de Ґ dans [0; 1] telle que
i. P(𝛀) = 1
Théorème 4.3. Soit P une probabilité définie sur (𝛀, Ґ) elle vérifie les propriétés
équivalentes suivantes:
Démonstration. On vérifie tout d’abord que les deux propriétés sont bien équivalentes. Si on
pose on voit que est une suite décroissante si, et seulement si, est une
1- et comme =1-
= = = =
vii
aléatoire, et l’ensemble de tous les événements associés à cette épi-cuve ( est soit P(𝛀),
On définit une variable aléatoire (à valeurs réelles), sur 𝛀, en associant à chaque résultat de
l’épreuve aléatoire un nombre réel (par exemple une mesure).
telle que, pour tout , l’ensemble de tous les ayant x pour image par X est un
événement, c’est-à-dire : { 𝛀 et X( ) = x}
En fait, cette condition imposée à X est toujours vérifiée lorsque 𝛀 est fini ou dénombrable ;
il convient de la vérifier seulement lorsque 𝛀 est infini non dénombrable.
Conséquence
Pour toute partie A de l’ensemble des valeurs X(𝛀), l’ensemble de wus les avant une image
par X appartenant à A est un événement, c’est-à-dire :
vii
Si ( ) est un espace probabilisé et X une variable aléatoire définie sur cet espace, on
Sait que, par définition, (A) est un événement de cet espace et p = p est bien
P(X(𝛀)) [0; 1]
vii
Lorsque X est discrète, toute partie A de X (Q) est un ensemble fini ou dénombrable de
valeurs (k K C N). Pour définir , il suffit donc de connaître ({ }) pour toute valeur
La loi de probabilité d’une variable aléatoire discrète X est la donnée, pour chaque valeur
P (X = ) pour tout .
vii
:ℝ [0; 1]
où représente l’événement réalisé par tout élément de 𝛀 dont la valeur par X est
inférieure ou égale à
Dans le cas où X(𝛀) est fini, en supposant les valeurs classées en ordre croissant,
• ou bien ≥ et F(x) = 1.
On montrera en effet que pour toute variable aléatoire continue X, on a quel que soit x ,
((x}) P(X= x) = 0.
Par contre, on sait que toute partie A de X(𝛀) doit être engendrée (par union et/ou
La loi de probabilité d’une variable aléatoire continue peut ainsi être définie à l’aide de sa
fonction de répartition :
:ℝ [0; 1]
• = 0 et =1
• F est dérivable sur (sauf peut être sur un ensemble fini ou dénombrable I de réels pour
vii
aléatoire X. On peut donc aussi définir la loi de probabilité de X à l’aide d’une fonction
• ,
• est continue sur R (sauf peut être en tin nombre fini, ou dénombrable, de réels pour
• existe et vaut I.
P(a b) = P( b) - P( a) = =
vii
et on sait que
Donc =
à condition que, dans ce cas, la série Soit convergente (Analyse, chapitre li), sinon
vii
sa variance par:
vii
4.1.3.1. Comment déterminer la loi de probabilité d’une variable aléatoire? Cas des
variables aléatoires discrètes
On suppose connus tous les événements élémentaires pour i E J, ainsi que leur
probabilité .
(J ⊆ I)
4.2.1. Introduction
Lorsqu’une situation aléatoire met en jeu une variable aléatoire, les réponses aux questions
qu’on se pose dérivent en général des connaissances qu’on a de la loi de probabilité de
celle-ci. Dans la pratique (et les programmes scolaires !) de nombreuses situations se traitent
grâce à quelques lois particulières dont il suffit de connaître les propriétés loi binomiale
(l’univers des valeurs possibles est fini). loi de Poisson (I’ univers des valeurs possibles est
infini dénombrable) t loi normale (l’univers des valeurs possibles est infini non
dénombrable). vii
Modèle
On effectue n tirages avec remise dans une urne contenant deux catégories de boules, des
blanches en proportion p (0 < p < 1) et des rouges en proportion q (p + q = 1). La
probabilité d’obtenir une boule blanche à l’issue de chaque épreuve de Bernoulli
correspondant à ces tirages est donc p.
On considère la variable aléatoire X dénombrant les boules blanches à l’issue des n tirages.
Loi de probabilité de X
Dire que X suit la loi binomiale de paramètres n et P (on note X B (n, p)) signifie donc
Espérance
vii
n-1
Écart-type
4.2.3. Techniques
Il existe des tables (pour quelques valeurs de n et p) et des logiciels qui donnent accès
vii
4.2.3.1. Comment vérifier qu’une variable aléatoire suit une loi binomiale ?
avec P(M) = p et P( ) = q = l - p;
(2) Conclure
4.3.1. Introduction
La loi de Poisson est utilisée lorsque l’étude porte sur un phénomène rare. Elle apparaît dans
les processus de Poisson comme la limite, lorsque n tend vers l’infini, des lois binomiales
vii
i. la probabilité pour que E apparaisse au cours d’une courte période de l’unité de temps de
durée Δt est proportionnelle à cette durée et indépendante de la période choisie ; ce qu’on
traduit par P(E survient entre t et t + Δt) = λΔt où À est un réel strictement positif;
ii. la probabilité pour que E apparaisse plus d’une fois au cours de cette période peut être
considérée comme nulle.
En décomposant l’unité de temps en n intervalles dc durées égales à Δt. on a Δt = l/n et, quel
que soit t, P(E survient entre t et t + 1/n) = λ/n. D’après la condition ii. E apparaît k fois au
cours de l’unité de temps (0 ≤ k ≤ n) s’il survient au cours de k intervalles élémentaires de
durée 1/n. Il en résulte que X suit la loi binomiale de paramètres n et λ /n. Lorsque Δt 0,
Loi de probabilité de X
Dire que X suit une loi de Poisson de paramètre λ, λ (on note X (λ)) signifie donc
Espérance
En effet en posant
Écart-type
vii
Comme
vient
4.3.2.2. Utiliser une loi de Poisson pour approcher une loi binomiale
La loi binomiale B(n, p) peut être approchée par la loi de Poisson P(λ) avec λ = np lorsque n
restant fini.
Lorsque
Cette approximation est surtout utile lorsqu’on ne possède pas de logiciel de calcul... (Ce
qui est encore le cas aux examens et concours !) vii
Soit λ , et X (λ))
11 existe des tables (pour des valeurs de λ< 10, voir page 221) et des logiciels qui donnent
accès directement à la loi de probabilité de X (calcul de P(X = k) pour k o N) et à sa
fonction de répartition (calcul de P(X k)) pour tout À.
4.4.1. Introduction
La loi normale (ou loi de Laplace-Gauss) s’applique en général à une variable aléatoire
continue représentant un caractère résultant de nombreux facteurs indépendants, dont les
effets s’additionnent, mais dont aucun n’est prépondérant. Elle est caractérisée par deux
paramètres qui sont justement la moyenne et l’écart type du caractère.
vii
Loi de probabilité de X
Espérance et écart-type
vii
4.4.2.2. Propriété
variable, ramener les calculs sur toute loi normale aux calculs sur cette seule loi.
X(𝛀) = ℝ
Loi de probabilité de U
Dire que U suit la loi normale centrée réduite (on note signifie que, pour tout
Espérance et écart-type
σ(X) = 1
type
Cela signifie que pour tout réel t, tend vers ∏(t) lorsque n tend vers l’infini.
4.4.2.5. Utiliser une loi normale pour approcher une loi binomiale
Pour n très grand (n ≥100), p pas trop proche de 0 ou 1, et n p q >3. La loi normale
constitue une bonne approximation de la loi binomiale. C’est-a-dire que. Pour les calculs de
probabilité, si on doit recouvrir à une table. On peut remplacer la loi B(n, p) par la loi.
4.4.2.6. Utiliser une loi normale pour approcher une loi de Poisson
C’est-à-dire que, pour les calculs de probabilité, si on doit recouvrir à une able,
Remarque. En fait, la loi normale étant continue, tandis que les lois binomiale et de Poisson
sont discrètes, le calcul d’une probabilité du type ) est entaché d’une erreur (puisque
vii
4.4.3. Techniques
La fonction de répartition de la loi normale centrée réduite est tabulée page 222. Il s’agit
i. déterminer directement, à 10-4 près, les probabilités P(U ≤ u) = P(U < u) = ∏(u) pour u
décimal entre 0,00 et 2,99 par pas de 0,01,
ii. déterminer directement, à 10-2 près, le réel tel que ∏(u) est égale, à 10-4 près, à un
Soit t réel positif inférieur à 3. Pour déterminer P(U ≤ 1) = P(U < t),
(1) Arrondir t à l0-2 près, . Le nombre s’écrit donc sous la forme décimale e,dc où e,
vii
(2) Sur la même ligne que , dans la première colonne, lire le nombre (écriture
décimale).
(3) Sur la même colonne que , dans la première ligne, lire le nombre (écriture
décimale).
Avec une calculatrice (si elle est autorisée à l’examen ou au concours). On peut programmer
la formule :
vii
stats[statevalf,cdf,normald{12,cr]] (x);
• Avec une table de la fonction de répartition de la loi normale centrée réduite, il faut se
ramener systématiquement à la loi normale centrée réduite par le changement de variable U
En posant
Les calculs sont ensuite effectués avec la table qui fournit les valeurs. pour de P(
vii
4.5.1 Introduction
Dans cette section, on s’intéresse à quelques éléments de l’étude des couples de variables
aléatoires: indépendance, covariance et combinaisons linéaires (notamment somme et
différence).
X et Y sont discrètes
vii
La loi de probabilité (dite loi conjointe) du couple (X,Y) est définie par:
Soit :
X et Y sont continues
numérique h ; la densité de probabilité du couple (X, Y) est alors une fonction de ℝ² dans
ℝ.
ℝ ℝ
Définition
2. si X et Y sont indépendantes:
vii
alors
X + Y suit
X - Y suit
4.5.3. Techniques
Soient deux variables aléatoires X et Y définies sur le même espace probabilisé (𝛀x).
(1) Si les lois de probabilités de X et Y sont connues, déterminer la loi (ou la densité) de
probabilité du couple (X,Y).
Si la loi de probabilité du couple (X,Y) est connue, déterminer les lois (ou densités) de
probabilité de X et Y.
vii
vii
5.1.1. Introduction
Définitions
vii
aléatoire réelle, continue, qui prend pour valeur l’instant t (supérieur à t0, origine des temps
inconnue a priori mais souvent prise égale à 0) où apparaît la première défaillance.
Fonction de fiabilité
La fonction de fiabilité (reliability, en anglais) d’un dispositif est la fonction, notée R, qui, à
tout instant t (t ≥ t0 ), associe la probabilité de bon fonctionnement du dispositif à cet instant
t, c’est-à-dire la probabilité que la première défaillance apparaisse après l’instant t
R :
Fonction de défaillance
La fonction de défaillance (failure, en anglais) d’un dispositif est la fonction, notée , qui, à
tout instant t (t t0), associe la probabilité que le dispositif soit en panne à cet instant t,
F :
est la fonction de répartition (voir chapitre 3) de la variable aléatoire Tet on a, pour tout t a t o :
vii
t0 par :
caractéristique dite courbe en baignoire, correspondant aux trois périodes souvent observées
dans la vie d’un dispositif:
• période des défaillances aléatoires on vie utile du dispositif pendant laquelle λ est
sensiblement constante;
On considère à l’instant t0 la mise en service dans les mêmes conditions de N0 dispositifs Is.
En supposant qu’un dispositif ayant eu une défaillance n’est ni réparé, ni remplacé, on peut
où Δt est un laps de temps suffisamment petit pour que l’estimation soit jugée
convenable.
Le taux d’avaries est estimé par (t), la fréquence de défaillances par unité de temps
pour chacun d’eux, on relève l’instant t de la première défaillance. On classe ces temps de
bon fonctionnement en ordre croissant et, après d’éventuels regroupements en classe lorsque
vii
MTBF
Si l’on considère les défaillances comme irréparables, E(T) correspond aussi à la durée de
rie moyenne du dispositif ou moyenne des temps de bon fonctionnement avant la première
défaillance (MTTFF Mean Time To First Failure).
Théorème 5.1. Si la fonction de fiabilité R est négligeable, au voisinage de +ce, devant la fonction
inverse, c’est-à-dire si x = 0, alors
Démonstration. Il suffit de procéder à une intégration par parties en remarquant que
puis =1
Un système S est un dispositif constitué de n éléments S 1, ……., Si, ……., Sn., On notera R5,
R5 les fonctions de fiabilité du système e des composants Si, et F5. F5 leurs fonctions de
défaillance.
fonctionne.
composants, alors :
Si on peut supposer que les états (fonctionnement ou panne) de chacun des composants sont
des événements indépendants, alors on a :
vii
5.1.3. Techniques
fiabilité connue.
Calcul série-parallèle
On suppose que le système peut être décomposé en sous-systèmes groupés selon le modèle
série ou parallèle.
vii
Cette loi correspond à la période de défaillances aléatoires d’un dispositif avec un taux
d’avaries constant et égal à λ.
5.2.2.1. Définition
pour tout réel t positif et nulle pour tout réel strictement négatif. C’est notamment le cas des
systèmes électroniques ou de tout dispositif dans sa période dite de vie utile.
vii
5.2.2.2. Espérance
. Or
5.2.3. Techniques
On suppose qu’une observation statistique fournit n couples de valeurs (ri; F (r)) On procède
à une régression affine après transformation des données (voir chapitre 2).
celle des .
vii
exponentielle.
Si 0,75, on peut admettre que l’ajustement affine est justifié et que le phénomène étudié
droite passant par ces points s’ils sont alignés avec A (0; 1) ou par la droite de régression
correspondante.
Par exemple, sur les graphiques ci-après, si l’unité de temps est l’année, on lit MTBF = 5
ans, d’où σ(T) = 5 ans et λ = 1/5 = 0,2.
vii
Une étude statistique a permis d’obtenir les valeurs suivantes de la fonction de fiabilité
Une étude statistique a permis d’obtenir les valeurs suivantes de la fonction de fiabilité
100 jours seront représentés par 1 centimètre et, en ordonnée, 1 unité sera représentée par 5
centimètres.
Commenter le résultat.
5. Donner une valeur approchée à 106 près du taux d’avaries du système, puis la MTBF au
jour près.
6. Calculer, à 10-2 près, la probabilité de voir le système tomber en panne pendant l’année de
garantie, c’est-à-dire avant 365 jours.
5.3.1. Introduction
La loi de Weibullt généralise la loi exponentielle et, grâce à ses paramètres, s’adapte à toute
les périodes de défaillance d’un dispositif. Elle est très utilisée en fiabilité.
5.3.2.1. Définition
vii
est un paramètre d’origine qui indique l’instant à partir duquel la première défaillance suit
• si O < < 1, le taux d’avaries λ est décroissant et la loi correspond à la période des défauts
de jeunesse;
vii
vieillissement du dispositif.
E(T) =7+ nA( ) et a(T) = nB( ) pour 0,2 ≤ <7, à moins que l’on dispose d’un logiciel de
calcul formel qui fournit directement la moyenne et l’écart-type pour tous / . Ainsi les
donnent : A(1 .8) = .8892867325 et B(l .8) .5112267876 (la table fournit A 1.8) 0,8893 et
B(1.8) = 0,511). Puis
MTBF= E(T)=+F(l+)
5.3.3. Techniques
Une observation statistique ayant fournit n couples de valeurs (t i ; F ; (ti) en %), procéder à
une régression affine après transformation des données.
vii
Si 𝜌² < 0,75, l’ajustement affine est contestable ; il vaut mieux utiliser un logiciel spécialisé.
Si 𝜌² 7 0,75, on peut admettre que l’ajustement affine est justifié et que le phénomène étudié
millimétré et supposer que R est représentée par la droite passant par ces points s’ils sont
alignés ou par la droite de régression de Y en X.
Si les points sont bien alignes ou suffisamment proches de la droite de régression, alors
• on peut supposer 7 = 0,
Mais ces informations ne sont pas forcément facile à lire sur le graphique et en général on
connaît une équation de la droite de régression dont on tire les coefficients et p comme
que les points de coordonnées soient alignés si suit une loi de Weihull de
paramètre = 0.
L’axe des temps t, en bordure inférieure, est gradué en échelle logarithmique X =In t ;
L’axe logarithmique des temps est reproduit à l’ordonnée F(t) 63,2%, qui correspond à Y=
Évaluation de
vii
Sinon on translate les points horizontalement (on ajoute le même réel - aux abscisses
Évaluation de n
Évaluation de β
β est donné par l’intersection de la droite A, parallèle à D passant par le point 13 abscisse 1
de l’axe des p, avec l’axe des /3.
vii
6.1.1. Introduction
Soit X une variable aléatoire définie sur un univers (une population) de grande taille N et
dont la loi dépend d’un paramètre inconnu Ө.
Ces estimations sont les valeurs prises, sur l’échantillon donné, par des variables aléatoires
fonctions des valeurs observées.
vii
6.1.2.1. Définitions
Échantillonnage
Un échantillonnage est non-exhaustif ou avec remise lorsque chaque individu prélevé est
remis dans la population-mère avant le tirage de l’individu suivant.
vii
= X(
Estimation
vii
).
,…, )
Les variables aléatoires , définies sur l’ensemble des échantillons de taille n, sont
Toute valeur prise par sur un échantillon de taille n quelconque est une estimation du
paramètre Ө.
On considère une population d’effectif , sur laquelle est définie un caractère quantitatif,
représenté par une variable aléatoire X, suivant une loi quelconque de moyenne
vii
On pose et
est une statistique qui, à tout échantillon, associe la moyenne de X sur cet échantillon :
est une variable aléatoire qui, à tout échantillon , associe la variance de X sur cet
échantillon:
Théorème 6.1. On suppose que sur tout échantillon les variables aléatoires sont
ii) si X suit alors, quel que soit n, suit donc suit suit
iii) si X suit une loi quelconque et que n est suffisamment grand (n ≤ 30), alors suit
approximativement .
vii
Soit une population d’effectif dont une proportion d’individus présente une certaine
d’individus présentant .
ii)
vii
Il s’agit ici de donner à partir des valeurs prises par X sur un échantillon de taille n une
retenant en général des variables aléatoires, définies sur l’échantillon, ayant pour espérance
le paramètre que l’on cherche à estimer.
Moyenne
Variance
Proportion
6.1.3. Techniques
échantillon de taille .
(1) Calculer et la moyenne et l’écart type des valeurs prises par sur l’échantillon .
vii
Ces deux valeurs sont peu différentes dès que n est grand, mais seule la seconde est une
estimation non biaisée de l’écart type.
Une usine fabrique de grandes quantités d’un certain type de pièces mécaniques.
On mesure la longueur de chacune des 50 pièces d’un échantillon choisi au hasard et avec
remise dans une grosse commande.
On constate que les valeurs approchées arrondies à 10-3 près de la moyenne et de l’écart
À partir des informations portant sur cet échantillon, donner une estimation ponctuelle de la
Exercice 6.2.
connaître, entre autres, la proportion d’étudiants ayant suivi des études secondaires
scientifiques.
vii
6.2.1. Introduction
Il paraît donc plus raisonnable de compléter l’estimation ponctuelle par une «fourchette »,
c’est-à-dire la donnée d’un intervalle réel dont la probabilité de contenir la vraie valeur du
paramètre estimé est fixée à l’avance et suffisamment grande.
Soit X une variable aléatoire dont la loi dépend d’un paramètre inconnu . Les intervalles de
confiance pour le paramètre , au risque α (0 < α < 1), issus des différents n -échantillons
vii
d’une façon telle qu’a priori une proportion 1- α de ces intervalles contiennent .
1- α est appelé niveau (ou coefficient) de confiance de l’intervalle issu du tirage aléatoire de
n valeurs de X.
On a alors: P(c ≤ d) = l -
( ,…, );
( ,…, );
Si l’échantillonnage est avec remise (ou peut être considéré comme tel) et si X suit vii
vii
x et x
On a donc : 𝑃 = 1- α
au risque α :
vii
224).
Des calculs semblables aux précédents, dans lesquels les quantiles de la loi normale sont
remplacés par ceux de la loi de Student n - 1 degrés de liberté, conduisent à un intervalle de
Dans le cas où n est suffisamment grand (n ≥30), la loi de Student est peu différente de la loi
normale centrée réduite et l’intervalle de confiance peut s’écrire :
Remarque :
1. Un intervalle de confiance pour une moyenne est toujours centré sur une estimation de
cette moyenne issue d’un échantillonnage aléatoire.
2. Dans les programmes de BTS, on suppose toujours que suit une loi normale ou que n
On sait (théorème 6.2 p. 166) que , la variable aléatoire qui compte le nombre d’individus
l’approximation de la loi binomiale par une loi normale est justifiée, on sait alors que =
par la quantité
On en déduit, par des calculs semblables aux précédents, les intervalles de confiance pour 𝜌,
au risque α,
6.2.3. Techniques
Cas où X suit une loi normale ou que n est suffisamment grand et l’écart type u est connu vii
(2) Fixer un risque α (en général 5 % ou I %) et déterminer, grâce à une table ou une
Cas où X suit une loi normale ou que n est suffisamment grand et l’écart type σ est inconnu
écart type .
de la loi
vii
= si n
variable aléatoire suit la loi normale de moyenne inconnue et d’écart type connu
-r ≤ = 1-
sachant que suit cette condition conduit, par des calculs déjà vus, à: r =
vii
7.1.1. Introduction
Dans cette section on s’intéresse au problème suivant étant donnée une variable aléatoire X,
définie sur une certaine population, dont la loi dépend d’un paramètre inconnu, peut-on
raisonnablement supposer que est égal à une certaine valeur donnée a priori?
vii
fabrication de façon à produire des pièces cylindriques de diamètre fixé. Mais, malgré les
réglages, les diamètres des pièces ne sont pas toujours égaux à et se distribuent
aléatoirement. Comment savoir si la moyenne des diamètres des pièces produites est bien
égale à ?
Le contrôle de toutes les valeurs de X sur la population étant en général impossible (ou trop
long, trop coûteux, etc.), on extrait un échantillon aléatoire de la population sur lequel on
observe les valeurs de X. La question devient : au vu des résultats obtenus sur l’échantillon
réponse à la question est donnée par le mise en place d’un test de conformité.
On définit d’abord des notions générales de la théorie des tests qui restent utiles pour les
sections suivantes, puis on indique comment procéder dans le cas où le paramètre est une
moyenne ou une proportion.
7.1.2.1. Définitions
Un test statistique est une procédure permettant de calculer la valeur d’une certaine fonction
des observations d’un ou de plusieurs échantillons, qui conduit à rejeter ou non, avec un
certain risque d’erreur, une hypothèse généralement appelée hypothèse nulle et notée .
Celle-ci porte sur la (ou les) population(s) d’où est (sont) issu(s) l’(ou les) échantillon(s).
On appelle erreur de première espèce l’erreur commise lorsqu’on rejette l’hypothèse nulle
alors que celle-ci est vraie. La probabilité d’une telle erreur s’appelle risque de première
espèce et se note c.
vii
Le critère du test est une variable aléatoire dont la valeur calculée à partir de(s)
l’échantillon(s) permet de rejeter ou non l’hypothèse nulle selon qu’elle appartient ou non à
la zone de rejet.
si on ne rejette pas .
Remarque:
1. Le choix de l’hypothèse nulle est fait de façon à pouvoir déterminer la loi du critère .
ii. Ne pas rejeter l’hypothèse nulle ne signifie pas qu’on doit automatiquement l’accepter et
la considérer comme vraie! Cela signifie simplement qu’au vu des informations disponibles,
on n’a pas de raison de la considérer comme fausse, ce qui autorise à s’en contenter...
- soit vraie mais que l’échantillon corresponde à l’un des cas rares observables sous
cette hypothèse,
Si on s’est prémuni contre cette dernière cause, l’habitude est de retenir la première
éventualité, considérant en quelque sorte que les événements à faible probabilité ne se
produisent pas. Le principe est donc de considérer les valeurs de qui appartiennent à
comme suffisamment « rares » (α petit) pour remettre en cause l’hypothèse nulle, tandis que
celles qui appartiennent à A sont considérées comme «normales ».
: = contre :
Test unilatéral
( : = contre : ) ou ( : = contre : )
vii
: = contre :
Test unilatéral
: = contre : ) ou ( : = contre : )
7.1.3. Techniques
Au risque α, la zone de rejet R de est définie par les valeurs critiques , telles que
On en déduit les règles de décision équivalentes suivantes, selon le critère dc test retenu : on
x x
Compte tenu de la symétrie de la loi de par rapport à p, elle peut être obtenue
vii
est inconnu
et = où
si n
On en déduit les règles de décision équivalentes suivantes, selon le critère dc test retenu : on
vii
centrée réduite.)
et .
Il s’agit ici de tester l’hypothèse nulle : «ces deux paramètres sont égaux » contre l’hypothèse
alternative: «ces deux paramètres sont différents » (test bilatéral) ou «le premier est supérieur
(inférieur) au second » (test unilatéral).
définis sur ces échantillons et on définit un critère de test fonction de ces estimateurs.
vii
(éventuellement confondues).
On suppose que suit une loi normale de paramètres et ., et que suit une loi
normale de paramètres et .
test bilatéral :
: contre :
test unilatéral :
: contre : ( ou )
vii
test bilatéral :
: contre :
test unilatéral :
: contre : ( ou )
7.2.3. Techniques
vii
suit
On détermine les deux réels c1 et c2 tels que: P(Z < c 1) P (Z > c2) α/2.
1- de la loi normale
On en déduit les règles de décision équivalentes suivantes, selon le critère de test retenu.
Compte tenu de la symétrie de la loi de Z par rapport à 0, elle peut être obtenue directement
en recherchant un réel positif r tel que
7.3.1. Introduction
Soit X une variable aléatoire définie sur la population mère, de fonction de réparation
On veut tester ici l’hypothèse nulle: «F est égale à la fonction de répartition F) donnée »
: = contre : au risque.
On groupe les données observées ( ,..., ) dans r classes du type [ [ pour allant
de 1 à r.
regroupées.
On note: ⟦1, n⟧ = P ( ) = F( ) - F( ).
vii
On construit le test du «khi-deux» à partir des différences entre ces effectifs théoriques et les
effectifs observés n grâce au résultat suivant:
valeurs observées dans la classe numéro j, suit approximativement une loi du khi-deux à
Pour un risque de première espèce a fixé, on détermine le réel, noté tel que P(K
(v)) = 1-α ou P(K > (v)) = 1-α .ci. Considérant que dépasser cette valeur est
rare sous l’hypothèse nulle, on rejettera celle-ci si la valeur prise par K sur l’échantillon est
supérieure à
7.3.3. Techniques
Soit une loi de probabilité théorique caractérisée par sa fonction de répartition F0. Pour
tester
: = contre : au risque α.
classe.
degrés de liberté.
7.4.1. Introduction
indépendants
7.4.2.1. Définition
vii
) )) = ) ))
où est la i-ème classe (ou modalité) du premier caractère et la j-ème classe (ou
modalité) du second.
7.4.2.2. Propriété
) )) = )= ))
vii
indépendants », au risque de 1ère espèce et, à l’aide d’un échantillon de taille n issu de cette
population
et pour tout j de 1 à s :
(3) calculer
degrés de liberté.
vii