Vous êtes sur la page 1sur 19

Chapitre 2 : Outils statistiques de base de la MSP

Pour la plupart des auteurs américains ou japonais dans le domaine de la qualité, l'outil
statistique est un outil essentiel. Ils considèrent en général que l'approche statistique des
problèmes doit être enseignée à tous même si chacun dans une société ne doit pas devenir un
spécialiste dans le domaine. En effet, il n'est pas indispensable de comprendre toute la théorie
sous-jacente aux méthodes statistiques pour pouvoir les utiliser. Cependant un certain nombre
d’outils statistiques est indispensable pour contrôler et maîtriser la qualité.

I. Tableaux, caractéristiques de position/dispersion et graphiques

1. Tableaux

L’emploi de la MSP nécessite que l’on collecte, à intervalle de temps régulier, des
échantillons composés de n individus sur lesquels on effectue une (ou éventuellement
plusieurs) mesure. La valeur , fixée d’avance, est ce que l’on appelle la taille de
l’échantillon. Si le nombre d’échantillons collecté est , alors l’ensemble des mesures
obtenues peut se représenter sous la forme d’un tableau formé de lignes et colonnes dans
lequel est l’observation correspondant au -ième individu du -ième échantillon.

Remarque : L’hypothèse que les observations Xj,k suivent une loi normale est fondamentale
de la MSP.

Echantillons Mesures

Tableau 1 – Tableau MSP de mesures .

Si n = 1, alors on parle de mesures ou valeurs individuelles.

2. Caractéristiques de position/dispersion

Soit un échantillon de taille . On note la -ième plus petite valeur de


l’échaftillon . Avec cette définition, est donc la plus petite des valeurs de
l’échantillon et (qui est la -ième plus petite valeur) est donc la plus grande
des valeurs de l’échantillon.
L’échantillon s’appelle échantillon ordonné. Il faut remarquer que si les
variables aléatoires sont indépendantes, il en est de même pour les variables
aléatoires ordonnées .

2.1 Caractéristiques de position


Caractéristique Formule
Moyenne

Médiane

2.2 Caractéristiques de dispersion

Caractéristique Formule
Ecart-type

Etendue

2.3 Dispersion machine/procédé

On remarque généralement deux phénomènes distincts concernant la dispersion des mesures :

– une dispersion instantanée des mesures correspondant à la capacité de la machine qui usine.
Cette dispersion reste quasiment constante pendant la période d’observation. Elle porte le nom
de dispersion instantanée ou dispersion machine on la note M.

– une dispersion globale des mesures peuvent correspondant à l’usinage des pièces sur une
journée. Cette dispersion prend en compte la dispersion instantanné de la machine à laquelle
s’ajoute la dispersion provoquée par les 4M restant. Elle porte le nom de dispersion globale
ou dispersion procédé et est notée P.
Puisque la dispersion procédé inclut la dispersion machine, on aura toujours la relation

P  M

Si l’on considère le tableau 1 ci-dessus et soient , , Sj et Rj la moyenne, la médiane


empirique, l’écart-type empirique et l’étendue du j-ième échantillon. Les caractéristiques de
position/dispersion concernant machine et procédé se calculent usuellement de la manière
suivante :

– La moyenne procédé

– La médiane empirique procédé


– L’écart-type empirique machine SM

– L’étendue machine RM

En pratique, on ne calculera jamais toutes ces caractéristiques, mais uniquement un sous-


ensemble. Les combinaisons classiques sont la moyenne et l’écart-type ou la moyenne et
l’étendue, ou la médiane et l’étendue. On peut aussi calculer :

– L’écart-type empirique procédé SP

– L’étendue procédé RP

RP = max(Xj,k) - min(Xj,k).

3. graphiques

3.1 Histogrammes et diagrammes en points


L'histogramme est une représentation graphique d'un série de données quantitatives suivant
leurs fréquences ou fréquences relatives d'apparition dans une série d'intervalles (ou classes)
prédéfinis. Il représente globalement un échantillon de données et met en évidence la valeur
centrale, la variabilité et la forme de la distribution des données. Il permet aussi de vérifier
quelle proportion du produit est dans les spécifications et de détecter des phénomènes non
attendus (asymétrie de la distribution, distribution bimodale due éventuellement à un mélange
de deux produits, distribution coupée par élimination de produit non conforme ...).

Histogram

18

15
frequency

12

0
13,1 13,3 13,5 13,7 13,9

Fig. 2.1

Notons que l'histogramme donne une image globale des données et néglige l'ordre éventuel
suivant lequel les données ont été collectées. De plus le choix du nombre de classes et des
limites des classes d'un histogramme a une influence non négligeable sur le graphe résultant et
donc sur l'interprétation qu'on en fera.
Le tracé de l’histogramme n’est significatif que si . On conseille de choisir un nombre
de classes entre 4 et 20, par exemple et la largeur pour chaque classe.
Les limites des classes seront choisies de manière à éviter que les données tombent sur ces
limites.

Le diagramme en points (dot diagram) est un histogramme simplifié où chaque classe ne


compte qu'une valeur possible et les données sont représentées par des points.

Dot Diagram

3
Frequency

0
13,1 13,2 13,3 13,4 13,5 13,6 13,7 13,8
Fig. 2.2

3.2 Boîte aux moustaches (Box and Whisker)


Le Box and Whisker Plot ou diagramme en boîte et moustaches (voir Figure 2.3) consiste à
représenter sur un graphique le minimum, maximum et les 3 quartiles de la distribution d'un
échantillon de donnée. Les 1er, 2ème et 3ème quartiles, sont respectivement les données qui,
dans l'échantillon mis en ordre croissant, ont 25 %, 50 % et 75 % des données qui leur sont
plus petites ou égales.
Le 2ème quartile est également appelé médiane. C'est une mesure de la valeur centrale d'un
échantillon plus intéressante que la moyenne arithmétique quand l'échantillon n'a pas une
distribution symétrique.
Le Box Plot est un autre moyen que l'histogramme de visualiser la position, la dispersion et la
forme d'une distribution et de dire si la distribution est symétrique, et s’il existe des valeurs
aberrantes. Il est souvent utilisé pour comparer plusieurs échantillons de données et convient
quand le nombre de données disponibles est faible.

Box-and-Whisker Plot

13,1 13,2 13,3 13,4 13,5 13,6 13,7 13,8

Fig. 2.3

3.3 Run charts


La représentation de données sous la forme d'un histogramme ou d'un Box et Whisker plot
supprime toute notion d'ordre dans lequel ces données ont été observées. Des histogrammes
identiques peuvent émaner de données dont l'historique est totalement différente. Pour cette
raison il est clair que l'histogramme sera souvent combiné à une représentation des données en
fonction du temps appelée run chart ou diagramme temporel. Un run chart permet, par
exemple, de mettre en évidence un comportement cyclique ou une dérive d'une caractéristique
d'un produit. La construction d'un run chart constitue une première étape avant l'utilisation de
cartes de contrôle.

Fig. 2.4

3.4 Carte de contrôle


La carte de contrôle est un graphique, de type run chart, représentant une série de données
émanant d'un procédé en fonction du temps ainsi qu'une ou deux limites de contrôle (LCL-
Lower Control Limit ou LCS-Limite de Contrôle Supérieure, et UCL-Upper Control Limit ou
LCI-Limite de contrôle Inférieure) destinées à indiquer dans quel intervalle la variable étudiée
est supposée varier. L'implantation de cartes de contrôle dans une fabrication a pour but de
vérifier si le procédé est sous-contrôle statistique.
Les points représentés sur une carte de contrôle pourront être des valeurs individuelles,
moyennes, étendues, écarts-types, proportion de défectueux ou d'autres statistiques. Le calcul
des limites de contrôle est basée sur les hypothèses statistiques faites sur la variable
représentée. La figure suivante présente une carte des moyennes et étendues.

Carte X-barre

13,8
LCS = 13,73
CTR = 13,38
13,6 LCI = 13,03
Données

13,4

13,2

13
0 10 20 30 40
temps ou période (n°)

Fig. 2.5
Carte MR(2)

0,5
LCS = 0,43
0,4 CTR = 0,13
Données LCI = 0,00
0,3

0,2

0,1

0
0 10 20 30 40
Temps ou période (n°)

Fig. 2.6

3.5 La fiche de vérification


Une check sheet ou fiche de vérification est un tableau qui sert à mesurer à quelle fréquence
certains événements se produisent. Elle permet de traduire des « opinions » sur la
performance d'un procédé, service ou produit en « faits » chiffrés. Une fiche de vérification
est en général utilisée par plusieurs personnes et est construite « en ligne » au fur et à mesure
que les événements apparaissent. Son élaboration nécessite la définition de la liste des
événements possibles et da période durant laquelle les données seront prélevées.

Erreur Février Total


1 2 3
Pannes de carburant
Changement d’équipe

Total
Tableau 2 : Fiche de vérification

3.6 Le diagramme de Pareto


Le diagramme de Pareto est une représentation des données d'une check sheet sous forme d'un
diagramme en barres. Les problèmes sont représentés en abscisse et leur fréquence
d'apparition ou leur coût en ordonnée. Les problèmes sont en général classés dans l'ordre
décroissant de leur fréquence d'apparition.
Tracer un diagramme de Pareto aide à diriger l'effort vers les problèmes les plus importants,
fréquents ou coûteux (en fonction du choix qui est fait pour l'axe des Y). Il permet en général
d'illustrer le principe de Pareto selon lequel :
« 80 % des problèmes proviennent de 20 % des causes ».
Il suffit donc de s'attaquer à 20 % des causes pour résoudre 80 % des problèmes.
Ce diagramme constitue la première étape dans un effort d'amélioration de la qualité. Il
permet également de mesurer les progrès faits après la période de changements.

Pareto Chart
100,00
30 93,33
83,33
25
frequency

66,67
20
15 40,00
10
5
0
carburant niveau autres absence retard
Fig. 2.7

3.7 Flow charts et organigramme


Un flow chart ou diagramme de flux est une représentation graphique de toutes les phases
d'un procédé sous forme de rectangles et de flèches. C'est une représentation chronologique
des étapes à suivre pour exécuter une tâche ou des opération effectuées par un procédé. Il
constitue un excellent outil pour visualiser les procédés complexes et examiner la relation
entre les différentes étapes d'un procédé. On l'utilise pour détecter des redondances ou
inefficacités du système, identifier les endroits où des données doivent être collectées...
Une version plus sophistiquée du diagramme de flux est l'organigramme qui comprend
également des étapes de décision.

Fig. 2.8

3.8 Diagramme de cause à effet - Fishbone chart


Le diagramme de cause à effet sert à représenter la relation qui existe entre un « effet » et
toutes les « causes » influentes possibles. L'effet ou le problème est énoncé du côté droit du
diagramme et les principales influences du côté gauche classées par catégories.
Ce diagramme prend en général la forme d'une arête de poisson d'où son nom Fishbone chart.
Quand un problème survient, cette énumération des causes possibles permet d'isoler les
causes les plus probables et de les analyser. Construire un diagramme en arête de poisson ne
résout pas le problème mais aide à ordonner les idées et assure que l'on n'oublie pas certaines
causes possibles dans la résolution d'un problème rencontré dans le procédé.
Ce diagramme n'est pas à proprement parler un outil statistique mais pourra comme ceux-ci
aider à la résolution des problèmes.

Fig. 2.9
Le diagramme de cause à effet complète le Flow chart car il donne une représentation des
composants d'un procédé quand ce dernier en donne une représentation temporelle. Ces deux
diagramme peuvent parfois être combinés.
Le diagramme de cause à effet complète aussi le diagramme de Pareto : ce dernier sert à
identifier les problèmes importants, le diagramme de cause à effet énumère les causes
possibles pour un problème donné. Parmi ces causes, il faudra ensuite identifier celle(s) qui
est (sont) responsable(s) du problème.

3.9 Graphes X -Y ou scatter diagram


Le graphe X – Y est un outil pour identifier les relations potentielles entre deux variables. Des
couples de données correspondant à deux caractéristiques (l'une supposée la cause et
l'autre l'effet) sont collectées et les sont représentés graphiquement par rapport aux . La
forme du diagramme indique le type de relation qui peut exister entre X et Y. En général, un
graphe X - Y ne donne qu'une indication sur une relation potentielle, une étude plus
approfondie du contexte sera en général nécessaire pour vérifier précisément si X « cause »
réellement Y et comment.

Plot of Fitted Model


4,9
4,5
4,1
3,7
Y

3,3
2,9
2,5
0 20 40 60 80
X
Fig. 2.10

II- Lois et estimation de certaines caractéristiques

1. Lois

1.1 Distributions binomiales


Une expérience binomiale est expérience possédant les propriétés suivantes :
1. L’expérience consiste en n répétitions d’une même épreuve de Bernoulli,
2. Chaque épreuve résulte en un résultat qui peut être classé soit comme un succès, soit
comme un échec,
3. La probabilité d’un succès reste constante d’une épreuve à une autre,
4. Les épreuves répétées sont indépendantes.

Soit X la variable aléatoire égale au nombre succès enregistrés au cours d’une expérience
binomiale consistant en n répétitions d’une épreuve de Bernoulli dans laquelle la probabilité
de succès est égale à p. Alors la distribution de probabilité de X est donnée par :
La moyenne et la variance d’une variable binomiale de paramètre n et p sont données par
et .

1.2 Distribution ou loi de Poisson


Une expérience de Poisson est une expérience ayant les propriétés suivantes :
1. Le nombre de succès apparaissant dans un intervalle ou dans une région est
indépendant du nombre de succès enregistrés dans tout autre intervalle de temps ou
région de l’espace.
2. La probabilité qu’un seul succès apparaisse au cours d’un intervalle de temps très
court ou dans une petite région est proportionnelle à la longueur de l’intervalle de
temps ou de la taille de la région et ne dépend pas du nombre de succès enregistrés en
dehors de cet intervalle de temps ou de cette région.
3. La probabilité pour que plus d’un succès apparaissent dans un tel petit intervalle ou
tombe dans une telle petite région est négligeable.

Le variable aléatoire X égale au nombre de succès enregistrés au cours d’une expérience de


Poisson est appelé une variable de Poisson.
La distribution de probabilité de la variable de Poisson X est appelée la distribution de
Poisson. Elle dépend uniquement du nombre moyen  de succès enregistrés dans l’intervalle
de temps ou dans la région considéré.

Une variable aléatoire X suit une distribution de Poisson de paramètre  si sa distribution de


probabilité est donnée par :

La moyenne et la variance de la distribution de Poisson sont toutes les deux égales à  i.e.

E(X) = V(X) = 

1.3 Loi normale


On dit que X est une variable aléatoire normale de paramètres si sa distribution de
probabilité est définie pour et est égale à

Fig.2.11 : Courbe de la loi normale

La distribution normale pour laquelle et est appelée la distribution normale


centre réduite ou distribution normale standard.

La moyenne et la variance d’une variable normale de paramètres  et sont respectivement


égales à  et à .
La table de la distribution normale centrée réduite donne la valeur de la surface au-dessous de
la courbe normale centrée réduite correspondant à la probabilité

pour les valeurs de Z comprises entre –3,4 et 3,4.

Elle peut alors être utilisée pour calculer les probabilités

Si X est une variable normale de moyenne  et de variance , alors

1.4 Loi Gamma


La fonction gamma est définie par
pour .
La variable aléatoire continue X a une distribution gamma de paramètres  et  , si sa fonction
densité est donnée par :

où et .

1.5 Loi t de Student


La variable aléatoire continue T a une distribution t avec  degrés de liberté si sa fonction de
densité est donnée par :

La table des distributions t donne pour différentes valeurs du paramètre  et de la probabilité


, les valeurs telles que .

1.6 Loi khi-deux


La variable aléatoire continue ² a une distribution en chi-deux avec  degrés de liberté si sa
fonction de densité est donnée par :
La table des distributions en donne pour différentes valeurs du paramètre  et de la
probabilité , les valeurs telles que .

1.7 Loi de Fischer


Une variable aléatoire F a une distribution Fisher avec et degrés de liberté, si sa densité
de probabilité est donnée par

La table des distributions F donne pour différentes valeurs du couple ( , ) et pour  = 0,05
ou  = 0,01, la valeur de la variable aléatoire F au-dessus de laquelle on trouve une surface
égale à .
On peut pour trouver la valeur de pour  = 0,95 ou  = 0,99 en utilisant la formule :

III- Estimation de certaines caractéristiques

Caractéristique Estimation Intervalle de confiance


ponctuelle
Moyenne

Médiane

Remarque : est la valeur de la fonction de distribution de la loi normale centrée réduite


(de paramètres ) telle que . Si est inconnu, il peut être remplacé
par son estimateur lorsque . Lorsque , est remplacé par , où
est la fonction de répartition de Student de paramètre i.e. à degré de liberté.
Caractéristi Estimation ponctuelle Intervalle de confiance
que
Ecart-type

Remarque : est la valeur de fonction de répartition de la loi du chi-deux de paramètre


telle que à degré de liberté.

Pour estimer l’écart-type machine M, on utilisera au choix :

M = SM/KS(n) ou M = RM/KR(n), où KS(n! et KR(n) sont des valeurs tabulaires.

Finalement, pour utiliser l’écart-type procédé P, on utilisera :

P = SP

IV- Tests Statistiques

1. Notions de tests d’hypothèses


Une hypothèse statistique est une assertion ou une conjecture portant sur une ou plusieurs
populations et pouvant être acceptée ou rejetée. La conjecture peut concernée une ou des
statistiques de cette ou ces populations.

Les hypothèses que l'on formule dans le but d'être rejetées forment l'hypothèse nulle, notée
. Le rejet de conduit à l’acceptation d’une hypothèse alternative désignée par .

Dans une procédure de test d'hypothèse l'ensemble des valeurs observées qui conduisent à
l'acceptation de forment la région d'acceptation alors que celles qui conduisent à son
rejet forment la région de rejet ou région critique. Les valeurs limites de la région critique
sont appelées valeurs critiques.

On distingue différents types de tests correspondant à la nature des hypothèses auxquelles on


a affaire.

 Les tests de conformité permettent de déterminer si un échantillon observé peut être


considéré comme issu d'une population de paramètres donnés. On peut par exemple
vouloir déterminer si un échantillon observé est issu d'une population de moyenne
donnée.

 Les tests d'égalité ou d'homogénéité permettent de comparer les paramètres de deux


ou plusieurs populations indépendantes. On peut par exemple comparer les moyennes
ou les variances de deux populations indépendantes.

 Les tests d'ajustement permettent de déterminer si un échantillon observé peut être


considéré comme issu d'une population de distribution donnée. Tel serait le cas si on
veut déterminer si un échantillon observé est issu d'une population uniforme ou
normale.
 Les tests d'indépendance ont pour but de tester l'indépendance entre deux ou
plusieurs critères de classification, généralement qualitatifs. Tel serait le cas si on veut
déterminer si le type de sang et la couleur des yeux d'un individu sont des caractères
indépendants.

Les tests de conformité peuvent être unilatéraux ou bilatéraux selon que la région de rejet est
unilatérale ou bilatérale.

En général, les étapes d’un test sont :

Étape 1. Formuler le test à effectuer

, , ou

Étape 2. Choisir la statistique test et construire la région critique en fonction


du seuil de signification

Étape 3. Trouver la valeur calculée de la statistique test correspondant à


l'échantillon observé.

Étape 4. Décision : Rejeter si la valeur calculée de la statistique se trouve


dans la région critique; sinon accepter .

2. Tests de conformité

Tests des conformité concernant les moyennes


Statistique test Région critique
connue ou n grand

et
inconnue et n petit
, = n – 1
et

Tests de conformité concernant les variances


Statistique test Région critique

et

Tests de conformité concernant les proportions


Statistique test Région critique

et
Tests d’égalité concernant les moyennes
Région critique
Statistique test

et connues ou et grands

et

et petits ; inconnues

et

et petits ; inconnues

et

n = n - 1,

pour des observations couplées


et

Tests d’égalité de deux variances


Statistique test Région critique

et
et

Tests d’égalité entre deux proportions


Statistique test Région critique

et
, ,
Critère de décision d'un test d'ajustement

Les données de base d’un tel test d’ajustement se présentent habituellement sous la forme :

Observation
… …
f-observée … ….

où est une observation (distribution discontinue) ou une classe (distribution continue) et


.est la fréquence observée de l’observation ou de la classe .

Pour tester l’hypothèse nulle que ces données proviennent d’une population de distribution
f(x), on calcule dans un premier calculer la fréquence théorique de chaque observation .
On obtient alors une distribution de la forme :

Observation
… …
f-observée … …
f-théorique … …

Le critère de décision utilisée est alors le suivant :

Étape 1. Calculer l'indicateur d'écart

Étape 2. Décision : On rejette au seuil de signification , si ( étant à déterminer),


sinon on accepte .

Critère de décision du test d'indépendance

Les données relatives à un test d'indépendance sont en général présentées dans un tableau de
contingence de r lignes et c colonnes de la forme suivante :

… …
Total
n
Total

Les totaux horizontaux représentent les fréquences marginales des observations

, alors que les totaux verticaux représentent les fréquences marginales des

observations . n est la taille (effectif total) de l'échantillon observé.

Pour tester l’indépendance entre les deux variables, on calcule dans un premier calculer la
fréquence théorique de chacune des cellules en utilisant la relation

Les fréquences théoriques ainsi calculées sont reportées dans le tableau de contingence (entre
parenthèses à côté de la fréquence théorique correspondante).

Étape 1. Calculer l'indicateur

Étape 2. Décision : On accepte l’hypothèse d’indépendance au seuil de signification a, si


avec  = (r-1)(c-1) degrés de liberté; sinon on la rejette.

3. Test d’adéquation

un échantillon de variables aléatoires indépendantes dont la fonction de


répartition est inconnue. Soit une fonction de répartition que l’on pense être
celle des variables aléatoires . Un test d’adéquation permet de décider, à partir
d’une réalisation de l’échantillon, si oui on non la fonction de répartition est
bien celle des variables aléatoires . Un test d’adéquation peut donc se mettre sous la
forme :

Il existe plusieurs méthodes pour tester l’adéquation.

3.1 Méthodes graphiques


3.1.1 Q-Plot
La méthode Q-Plot (Quantile Plot) est une méthode graphique (et donc qualitative) permettant
de tester l’adéquation d’un échantillon avec les lois de probabilité normale,
exponentielle, lognormale et Weibull.
Pour appliquer la méthode Q-Plot, il faut :
1. Ordonner l’échantillon .
2. Tracer les points de coordonnées

– pour la loi normale

– pour la loi exponentielle

– pour la loi lognormale

– pour la loi de Weibull

3. Vérifier que les points tracés sont “approximativement” alignés.

3.1.2 QQ-Plot
La méthode graphique QQ-Plot permet de tester “visuellement” si deux ensembles
d’observations et , dont la taille n’est pas nécessairement identique,
ont des fonctions de répartition. (inconnues) et identiques ou différentes. Pour
appliquer cette, il faut :

1. Calculer avec et

2. Tracer les points de coordonnés . est une valeur estimée de .


3. Vérifier que les points tracés sont “approximativement” alignés sur la droite d’équation
.

3.2 Méthodes quantitatives

3.2.1 Test de Kolmogorov-Smirnov


Le test de Kolmogorov-Smirnov permet de tester l’adéquation avec n’importe quel type de loi
de probabilité. C’est un test qui a l’avantage d’être très général, mais qui a le défaut d’être peu
puissant et donc peu discriminant. Les étapes permettant de le réaliser sont :
1. Ordonner l’échantillon
2. Calculer pour chaque observation de l’échantillon ordonné.
3. Calculer la valeur de la fonction de répartition supposée pour chaque observation
de l’échantillon ordonné.
4. Calculer la différence maximale en valeur absolue entre l’estimation de la fonction de
répartition et la fonction de répartition supposée i.e.

5. Si alors l’adéquation sera rejetée. Les valeurs de sont


tabulaires.

3.2.2 Test d’Anderson-Darling


Le test d’Anderson-Darling est un test d’adéquation spécifiquement dédié au cas de la loi
normale. Les étapes permettant de réaliser ce test sont :
1. Calculer les estimateurs de et de à partir de l’échantillon X1, . . . , Xn.
2. Ordonner l’échantillon.

3. Calculer les probabilités .

4. Calculer les valeurs et

5. Si alors l’hypothèse de normalité sera rejetée. Les valeurs de


sont tabulaires.

3.2.3 Test d’asymétrie et d’aplatissement


Le test d’asymétrie et d’aplatissement est un autre test d’adéquation spécifique à la loi
normale. Ce test est basé sur le fait que si est une variable aléatoire normale de paramètres
alors ses coefficients d’asymétrie et d’aplatissement doivent vérifier . Les
étapes permettant de réaliser ce test sont :
1. Calculer l’estimation de µ.
2. Calculer les estimations des moments

3. Calculer les estimations de et

et

4. Calculer les variables standardisées

et

avec
et

5. L’hypothèse de normalité est rejetée


– si (asymétrie trop négative ou trop positive),
– ou si (aplatissement en excès ou en défaut),
– ou si (test combiné).

3.2.4 Test du chi-deux


Le test du chi-deux est un test qui s’applique avant tout à l’adéquation de loi de probabilité
discrète. Supposons un échantillon correspondant à une variable aléatoire discrète
dont on pense que la distribution de probabilité est . Les étapes permettant de réaliser
ce test sont :
1. Regrouper l’échantillon en classe de valeurs identiques. On doit donc obtenir classes de
valeurs identiques dont l’effectif est on doit avoir .
2. Calculer pour puis

3. L’hypothèse est rejetée si

où est le nombre de paramètres estimés pour le besoin du test.

Remarque : Des procédures sont développées et sont intégrés dans les logiciels d’analyse
statistique (SAS, STATISTICA, MINITAB, STATGRAPHICS, …) ou constituent des
modules indépendants auto-exécutables (CENTURION, SEWSS, …) pour effectuer
toutes les tâches etudiées ci-dessus.

Vous aimerez peut-être aussi