Académique Documents
Professionnel Documents
Culture Documents
1
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
2
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
ρ(X,Y)=cov(X,Y)/σ(X)σ(Y)
Supposons que l’on a relevé des valeurs (xj,yj) de X et Y au cours de n épreuves indépendantes. On
définit, par analogie, un coefficient de corrélation r(X,Y) de l’échantillon par :
r(X,Y)=cov(X,Y)/s(X)s(Y)
où s(X) (resp s(Y)) désigne l’écart-type des valeurs de X (resp Y) pour l’échantillon. On a :
Propriétés :
−1 ≤ ρ ≤ +1
si X et Y sont indépendants alors ρ(X,Y)=0 mais la réciproque est fausse.
Une série statistique à deux variables d’ordre n fournit un nuage de n points. Ajuster linéairement cet
ensemble de points consiste à trouver une droite qui approche "le mieux possible le nuage de points".
Un ajustement linéaire va permettre de faire des prévisions ou d’estimer des valeurs.
Première droite des moindres carrés est définie pour que la somme des carrés des écarts en
ordonnée entre les mesures et les points de cette droite soit minimale.
Soient Aj (0 ≤ j ≤ n−1) les points de coordonnées (xj, yj) formant le nuage de points. Soit D une droite
d’équation y=ax+b et soient Bj pour 0 ≤ j ≤ (n−1) les points de D de coordonnées (xj, axj+b).
On cherche a et b pour que :
S=∑j=0n−1(yj−axj−b)2 soit minimum.
Pour a fixé le minimum de S est atteint lorsque la droite D passe par le point moyen G de
coordonnées (x, ȳ)) donc lorsque b=b0=ȳ−a x.
On trouve ensuite que pour b=b0, S est minimum pour :
a=a0=1/n∑j=0n−1xj yj−xȳ/1/n∑j=0n−1xj2−x2 =cov(X,Y)/σ2(X).
La première droite des moindres carrés est la droite d’équation y=a0x+b0. Elle a donc pour
équation y=ȳ+cov(X,Y)/σ2(X)(x−x).
Deuxième droite des moindres carrés est définie pour que la somme des carrés des écarts en
abscisse entre les mesures et les points de cette droite soit minimale.
On change simplement le rôle de X et de Y. On trouve la droite Δ d’équation :
x=x+cov(X,Y)/σ2(Y)(y−ȳ).
3
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
-Les variables numériques ou mesurables ou encore quantitative : il s’agit des variables qui
peuvent être exprimées numériquement.
4
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
-Les variables nominales ou qualitatives : ce sont les variables non mesurables ; elles peuvent
être codées par des qualitatifs .mais le traitement informatique exige qu’elles soient codées
numériquement.
Les variables booléennes : elle constitue une particularité des variables nominales codées 0 et 1.
1 est le code de la présence de la caractéristique et 0 est le code de l’absence de cette caractéristique.
Exemple une enquête portant sur la question : consommez-vous les produits chinois ? La codification
peut être oui=O et non =N qui sont les lettres alors que la codification numérique est ici : Oui=1 et
non =0
Les variables rationnelles : Leurs échelles de mesure permettent non seulement d’affecter à chaque
individu une valeur mais aussi de comparer ces différentes valeurs .ces variables sont indiquées sur
les études portant sur les attitudes et de préférences.
Caractère
∈R ∈ Z, ∈ N
Ordinales nominales
Classes entiers
5
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
1. Variables nominales: sont des variables de nature qualitative dont les modalités ne sont
pas hiérarchisées.
-elle exprime l’appartenance d’un individu à un ensemble ou une catégorie non hiérarchique
- elles échappent à la mesure: elles peuvent seulement être constatées (par exemple, sexe, nationalité,
profession
- la relation qui définit une variable nominale est une relation d'appartenance à un ensemble.
2. Variables ordinales : sont des variables de nature qualitative dont les modalités sont hiérarchisées.
Pour de telles variables, les modalités peuvent être classées par ordre de grandeur (par
exemple classe sociale, niveau d'études…). On distingue trois types de variables ordinales:
2.1. les variables rangées, qui se composent d'un nombre limité de modalités ordonnées les unes par
rapport aux autres; par exemple, degré de concentration estimé sur une échelle à 4 degrés: 1 = non
concentré; 2 = un peu concentré; 3 = moyennement concentré: 4 = non concentré;
2-2. les rangs, obtenus après un classement des unités d'observation de la première à la dernière, par
exemple, d'après les résultats à un examen ou à une course; s'il n'y a pas d'ex æquo, il y aura autant
de modalité que d'unité d'observation;
2.3. les scores rangés: mesures quantitatives classiques pour lesquelles on ne tient compte que des
propriétés d'équivalence et d'ordre et pour lesquelles on ne prend pas en compte les autres propriétés
arithmétiques du nombre (additivité, zéro vrai, intervalles numériques égaux).
On peut attribuer à chaque élément évalué un nombre qui mesure ses propriétés. Ce nombre doit être
tel que des intervalles numériques égaux représentent des distances égales dans la propriété
mesurée.
Deux situations:
a. le zéro de l'échelle ne correspond pas à l'absence de la propriété chez l'élément caractérisé par la
mesure zéro. Le zéro est arbitraire: on dit alors qu'il s'agit d'une donnée métrique dans une échelle
d'intervalles. Dans ce cas, on peut soustraire des données, mais non les additionner, les multiplier ou
les diviser. Par contre, on peut additionner, multiplier ou diviser des intervalles de données;
6
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Remarque: on peut distinguer des variables métriques discrètes, qui ne peuvent prendre que
des valeurs discrètes, c'est-à-dire séparées les unes des autres et correspondant à des nombres
entiers indivisibles (par exemple, le nombre d'employés dans une société dans une classe), des
variables métriques continues, qui peuvent prendre toutes les valeurs possibles dans un intervalle
(par exemple, la taille).
Nous verrons dans les chapitres suivants. Les méthodes explicatives les plus connues sont : Analyse
discriminante ; Analyse canonique ; la régression linéaire ; la segmentation.
D’après tout ce qui précède, la théorie statistique de la décision nées peut être définit comme
un ensemble des méthodes qui aide à la prise des décisions, soit en mettant en évidence les relations
existant entre les variables qui caractérisent les objets, soit en restructurant les dites variables pour
mieux connaître les objets ou phénomènes étudiés.
Rappelons que le choix de la technique ou méthode particulière à mettre en œuvre est fonction du
problème à résoudre et de la nature des variables étudiées. Cependant le résultat de l’étude n’est
pertinent que lorsqu’elle a été faite sur un échantillon suffisamment représentatif de la population.
7
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
CHAPITRE II : ECHANTILLONNAGE
INTRODUCTION
Les des techniques d’échantillonnage aléatoire,. Ces méthodes reposent sur le hasard. Les unités
statistiques sont désignées par le hasard et ont toute la même chance d’être choisies. Ces techniques ont
aussi l’avantage de permettre de calculer la marge d’erreur d’échantillonnage. Il sera donc possible de généraliser les
résultats à l’ensemble de la population tout en prenant un risque calculé. Avant de commencer à utiliser
des techniques d’échantillonnage aléatoire,
on doit disposer d’une liste complète de toutes les unités
Statistiques de la population, que l’on appelle aussi une base de sondage. Cette liste détermine la population
observée.
Les techniques d’échantillonnage non aléatoire Contrairement aux techniques d’échantillonnage
aléatoire, il est impossible de calculer la marge d’erreur d’échantillonnage. Cependant, ces méthodes sont
beaucoup moins coûteuses, plus rapides et plus simples. Il est par contre, peu recommandé de généraliser les
résultats provenant de ces méthodes à l’ensemble de la population, puisque toutes les unités statistiques
n’ont pas la même chance d’être choisi ce qui influence la représentativité de l’échantillon.
B- Echantillon Systématique
L’échantillonnage a l é a t o i r e s yst ém at ique est une technique où les unités statistiques
sont choisis à intervalle régulier dans la base de sondage.
Procédure :
a) Numéroter les unités statistiques de 1 à N.
b) Calculer l’intervalle de sélection que l’on appelle aussi le pas de sondage. On le calcule en
divisant la taille totale de la population par la taille de l’échantillon recherchée.
c) Tirer au hasard une unité statistique de la population qui fera partie de l’échantillon.
d) Tirer les autres unités en appliquant le pas de sondage qui est l’inverse du taux de sondage. Il est
encore appelé raison de l’échantillon. ces éléments sont sélectionnés à intervalles réguliers
8
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Exemple : si la raison est de 6 il faut d’abord tirer un nombre compris entre 1et 6, soit par exemple 4.
Puis on choisit les unités des rangs suivants : rang individus sélectionnés :
4 10 16 22
+6 +6 +6
C- ECHANTILLON STRATIFIE
L’échantillon par grappes est un cas particulier d’échantillon à deux degré les éléments ne sont pas
sélectionnés un à un mais par sous-groupes appelés grappes,
L’échantillonnage aléatoire par grappes consiste à choisir des groupes plutôt que de choisir
des unités statistiques isolées .Une grappe est un sous-ensemble non homogènes de la population défini
selon la proximité. Il est plus facile de faire une liste des groupes et de choisir au hasard parmi ces
groupes et d’interroger toutes les unités statistiques du groupe. Par exemple, un groupe d’étudiants
faisant partie de la même filière, des habitants du même immeuble, des habitants du même quartier etc.
Cette méthode permet de sauver beaucoup de temps en dé- placement.
Procédure :
a) Diviser la population en grappes.
b) Dresser la liste la plus complète possible (base de sondage) des unités statistiques formant chacune des
grappes.
9
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Echantillon systématique + - + +
Echantillon stratifié ++ - - - -
Echantillon à plusieurs - + + -
degrés
C’est une méthode d’échantillonnage non aléatoire qui permet d’obtenir un échantillon ayant
une certaine représentabilité de la population étudiée. La population est segmentée en fonction de
critère définis a priori. De telle sorte que chaque élément de la population appartienne à un segment
et un seul. A chaque segment de la population correspond un quota, qui indique le nombre de
réponse à obtenir.
chercheur. On demande à ce premier interculoteur d’en designer d’autres qui seront eux aussi
susceptibles de présenter les caractères requises et ainsi de suite.
B- la méthode de l’itinéraire
On impose à l'enquêteur : Un point de départ dans une
commune.
Un itinéraire à suivre avec tirage systématique des logements dans lesquels effectuer les interviews
Objectif : reproduire un certain tirage aléatoire des enquêtés, sans donner explicitement des noms
et adresses à l'enquêteur
C - L’échantillonnage par volontaire : On prélève l'échantillon à partir d'un groupe de volontaires.
D- échantillonnage sur place : L’échantillon étudié est définie par un lieu. Cette méthode est
utilisée dans l'échantillonnage de populations mobiles, rares ou spécifiques.
E-L’échantillonnage accidentel est une technique simple et peu coûteuse. L’unité
statistique se trouve au mauvais endroit au mauvais moment. un étudiant de passage à
l’entrée de l’INSAM trouve un enquêteur qui lui propose de remplir un questionnaire.
Erreur de mesure
Erreur, d’enregistremet
VII-TAILLE DE L’ECHANTILLON. de codage
11
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
2
Z
n S
Exemple supposons que l’on veuille connaitre la durée moyenne de développement d’un
nouveau produit de grande consommation supposons en autre que l’on connaisse une estimation de
l’écart type de la durée de développement (8mois) que l’on souhaiter avoir une précision égale à 2
mois de chaque coté de la moyenne et un seuil signification souhaité de 5%.
12
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
13
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Les tests non paramétriques ne font aucune hypothèse sur la distribution sous-jacente des données.
On les qualifie souvent de tests distribution free. L’étape préalable consistant à estimer les
paramètres des distributions avant de procéder au test d’hypothèse proprement dit n’est plus
nécessaire.
La distinction paramétrique – non paramétrique est essentielle. Elle est systématiquement mise en
avant dans la littérature. Les tests non paramétriques, en ne faisant aucune hypothèse sur les
distributions des données, élargissent le champ d’application des procédures statistiques. En
contrepartie, ils sont moins puissants.
Puissance d'un test:
C'est une évaluation de sa sensibilité, de sa capacité à détecter les effets significatifs dans les données
quand, en fait, ils sont présents ; lors de chaque test, nous acceptons une hypothèse et nous refusons
l'autre
- On commet une erreur de type 1 quant on rejette H0, alors qu'elle est valable
- On commet une erreur de type 2 quand on accepte H0, alors qu'elle n'est pas valable
On dit qu'un test qui conduit à peu d'erreurs de type 2 est un test qui possède une haute puissance ou
très sensible; à l'inverse, on dit qu'un test qui conduit à peu d'erreurs de type 1 et beaucoup d'erreurs
de type 2 à une faible puissance. Il est souhaitable d'utiliser un test de haute puissance chaque fois
que c'est possible ; la puissance d'un test augmente avec la taille de l'échantillon.
Seuil de signification
En statistique, il n'existe pas de règle rigide permettant de tirer une conclusion concernant les
hypothèses; aucun test ne nous fournit une réponse en terme de oui ou non ou de catégorique, mais
indique dans quelle mesure nous pouvons être certain de tirer des conclusions; cette mesure se
nomme niveau ou seuil de signification, ou encore probabilité d'erreur. Au plus le seuil est petit,
au moins il est probable que nous nous trompions quand nous prononçons pour le rejet ou
l'acceptation d'une hypothèse ; généralement, on travaille avec un seuil de 5%.
H0 vraie H0 fausse
α Puissance 1-β
14
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
La question de recherche est : une moyenne calculée sur un échantillon issu d’une population
de variance connue diffère-t-elle significativement d’une moyenne hypothétique ?
>Condition d’application
- La population a une variance connue (cas très rare) et une moyenne inconnue
(posée par hypothèse égale à ).
- L’échantillon est aléatoire et contient n observations indépendantes.
- La taille n de l’échantillon doit être supérieure à 5 sauf si la distribution de la moyenne
dans la population suit une loi normale – auquel cas cette taille peut être
quelconque.
On notera à cet égard que la condition d’une grande taille a pour principal but d’assurer que la
moyenne de l’échantillon suive une distribution normale
Hypothèses
réduite (moyenne = 0 et écart type = i). On l’appelle test z (« test » ou « z statistic »).
Où est le seuil de signification (ou erreur de première espèce) retenu, des valeurs
de la loi normale centrée réduite que l’on peut lire sur des tables appropriées.
Exemple : Comparaison d’une moyenne à une valeur donnée (variance de la population connue)
15
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Z= , soit – 0,70.
Par ailleurs, on peut lire sur la table de la loi normale centrée réduite que = = 1,96
et que =Z 0.05 = 1,64.
Test unilatéral à droite : puisque Z < (-0,70< 1,64), on se situe dans la zone de rejet de et
on rejette l’hypothèse selon laquelle la moyenne de la population est égale à 500 ( = 500).
La question de recherche est : une moyenne m calculée sur un échantillon issu d’une
population de variance inconnue diffère-t-elle significativement d’une moyenne
hypothétique ?.
Condition d’application
- La population a une variance inconnue qui doit être estimée sur l’échantillon et une
moyenne également inconnue (posée par hypothèse égale à
- L’échantillon est aléatoire et contient n observations indépendantes
- La taille n de l’échantillon est supérieure à 30 ou bien la moyenne suit dans la
population une loi normale auquel cas la taille n est quelconque
a- Hypothèses
16
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
La statistique calculée est T = . Sa distribution suit une loi de student avec n – 1 degrés
de liberté. On l’appelle « test » ou « test de student » (t test ou t statistic). Suit
approximativement une loi normale centrée réduite. Autrement dit, T = .=Z= .
On peut donc prendre la décision (i.e rejet ou acceptation de Ho. Rappelons que les règles de
décision de la loi normale centrée réduite sont :
Exemple : comparaison d’une moyenne à une valeur donnée (variance de la population inconnue)
On dispose à présent d’un échantillon beaucoup plus large constitué de 144 observations. La
moyenne trouvée sur cet échantillon est à nouveau m = 493. L’écart type estimé sur l’échantillon
est s = 46,891. Peut-on toujours admettre que la moyenne de la population est = 500, en
adoptant un risque de première espèce de 5% ?
17
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Condition d’application
-les variances 1 et 2 des deux populations sont connues les moyennes 1 et 2 sont
inconnues
-Les deux échantillons sont tous deux aléatoires et contiennent respectivement n1 et n2
observations indépendantes
- la distribution de la moyenne dans chacune des deux populations suit une loi
normale ou bien la taille de chaque échantillon est supérieure à 5,
Hypothèses
sd 1 2
d n1 n 2 2
z suit une loi normale centrée et les règle de décisions sont les suivantes ;
- Dans le cas d’un test bilatéral, on rejette HO si Z< -Zα/2 ou Z> Zα/2
- Dans le cas d’un test unilatéral à gauche, on rejette HO si Z< -Zα
- Dans le cas d’un test unilatéral à droite, on rejette HO si Z >Zα
Conditions d’application
18
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
-Les deux populations ont la même variance inconnue et des moyennes 1 et 2 inconnues
-Les deux échantillons sont tous deux aléatoires et contiennent respectivement n1 et n2 observations
indépendantes
-la distribution de la moyenne dans chacune des deux populations suit une loi
normale ou bien la taille de chaque échantillon est supérieure à 30
Hypothèses
Condition d’application
-Les k échantillons sont aléatoires et contiennent respectivement n1, n2 … nk/
Observations indépendantes
-la distribution des moyennes dans chacune des k populations suit approximativement une loi
normale de même variance inconnue
-le choix de la structure des k groupes ne doit pas déterminer les variables concomitantes.
HYPOTHESES
L’hypothèse alternative est : H1 : les valeurs des I (i=1, 2, …K)ne sont pas toutes identiques, cela
signifie qu’il suffit que la valeur d’un paramètre soit différente pour que l’hypothèse nulle soit rejetée
au profit de l’hypothèse alternative.
19
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
L’hypothèse nulle a éprouver est : : les deux mesure pressentent le même profil .
L’hypothèse alternative est : les deux mesures pressentent les profils différents.
-Condition d’application
- L’échantillon est aléatoire et contient n observations indépendantes
- la distribution de la proportion suit dans la population une loi binomiale
- La taille n de l’échantillon est grand (supérieure ou égale à 30).
- Hypothèse
p o 1
T
Avec p
o
n
o
-Condition d’application
- Les deux échantillons sont aléatoires et contiennent respectivement n1 et n2
observations indépendantes
- la distribution des proportions suit dans chaque population une loi binomiale
- La taille des échantillons est grande (supérieure ou égale à 30).
- Hypothèse
Z
pp
1 2
p 0
1 p n1 n1
0
2 2
21
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Condition d’application
-Les k échantillons sont aléatoires et contiennent respectivement n1, n2 … nk/
Observations indépendantes
-la distribution des proportions dans chacune des k populations suit une loi binomiale
- la taille des échantillons est grande.
- ce test est meilleurs si les tailles des échantillons sont supérieures à 50 chacune et que nkpk≥ 5 pour
chaque échantillon.
HYPOTHESES
L’hypothèse alternative est : H1 : les valeurs des πI (i=1, 2, …K) ne sont pas toutes identiques, cela
signifie qu’il suffit que la valeur d’un paramètre soit différente pour que l’hypothèse nulle soit rejetée
au profit de l’hypothèse alternative.
-Statistique calculée et interprétation du test
x n p
2
k
j j
j 1 n p 1 p
j
K
x j
Avec xj =effectif dans l’échantillon j correspondant à la proportion pj et P i 1
k
n
j 1
k
la distribution de χ suit un khi-deux à k-1 degrés de liberté.la règle de décision est la suivante Ho si χ
≥ χ2α(k-1).
22
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Statistique
La statistique à calculée est
2
xi m
n
2
n 1 s i 1
Où m est la moyenne et s2 la variance de l’échantillon . Cette
2 2
0 0
distribution suit une loi de khi-deux avec n-1 degrés de liberté noté χ2 (n-1)
Les règles de décision sont alors les suivantes :
- Dans le cas alors d’un test bilatéral, on rejette si χ2 χ2α/2 (n-1) ou
<
2 2
χ > χ α/2 (n-1)
-Dans le cas d’un test unilatéral à gauche, on rejette si χ2 χ21-α (n-1)
<
-Dans le cas d’un test unilatéral à droite, on rejette si χ > χ21-α (n-1)
2
23
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Statistique
x x x x
n1 2 n2 2
Condition d’application
-Les k échantillons sont aléatoires et contiennent respectivement n1, n2 … nk/
Observations indépendantes
-la distribution des variances dans chacune des k populations suit une loi normale ;
-Aucune des variances empiriques n’est nulle.
HYPOTHESES
L’hypothèse alternative est : H1 : les valeurs des σ i(i=1, 2, …K)ne sont pas toutes identiques, cela
signifie qu’il suffit que la valeur d’un paramètre soit différente pour que l’hypothèse nulle soit rejetée
au profit de l’hypothèse alternative.
i 1
x x
n 2
ij i k
1 k
s
j 1
; v vis
2 2 2
Avec vi = ni -1. i v isi
: xij est la valeur de l’observation j
v i i 1 v i 1
dans la population i. xi= la moyenne de la variable x dans la population i estimée sur la population
de taille ni .si est la variance la variable x dans la population i estimée sur la population de taille ni
24
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
Cette statistique suit une loi khi-deux à v degré de liberté.la règle de décision est la suivante :
on rejette Ho si χ>χα(k-1)
II.3.4 COMPARAISON DE K VARIANCES (TEST DE COCHRAN)
La question de recherche est : K variances σ1, σ 2 σ 3…. σ k observées sur k échantillons diffèrent-
elles significativement les unes des autres ?
Plus précisément le test de Cochran si la plus grandes des k variances est significativement
différente des k-1 autres variances.
Condition d’application
-Les k échantillons sont aléatoires et contiennent respectivement n1, n2 … nk/
Observations indépendantes
-la distribution des variances dans chacune des k populations suit une loi normale ; ou tout au moins ;
une loi uni modale.
HYPOTHESES
L’hypothèse alternative est : H1 : les valeurs des σ i(i=1, 2, …K)ne sont pas toutes identiques, cela
signifie qu’il suffit que la valeur d’un paramètre soit différente pour que l’hypothèse nulle soit rejetée
au profit de l’hypothèse alternative.
HYPOTHESES
T
i 1 i
Où oi et Ti désignent pour chacune des k classes ; les effectifs observés et les effectifs théoriques
calculer d’après la distribution de référence Dr
la distribution de χ suit une loi de khi-deux à k-1-r degré de liberté ; où r désigne le nombre de
paramètres de la loi de référence qui ont été estimés à l’aide des observations/la règle de décision est
la suivante : on rejette Ho si χ>χα(k-1-r)
III.1-2-COMPARAISON DES DISTRIBUTIONS D’UNE VARIABLE X DANS DEUX
POPULATIONS A ET B (TEST DE KOLMOGOROV-SMIRNOV)
la question de recherche est : une variable X est –elle identiquement distribuée dans deux
population A et B.
Conditions d’application
-les deux échantillons sont aléatoires et contiennent nA et nB observation indépendantes issues
respectivement des populations A et B.
-la variable X étudiée est une variable d’intervalle ou de ratio dont la loi de distribution est
quelconque.
-les limites des classes sont identiques dans les deux échantillons.
Hypothèses
L’hypothèse nulle à éprouver est H0 : la variable X est distribuée à l’identique dans la population A et
B.
L’hypothèse alternative est H1 : la variable X est distribuée différemment dans la population A et B.
Statistique calculée et interprétation du test
La statistique à calculée est : D= Maximum F X F X
A B
OU FA(x) et FB(x) désignent les
fréquences cumulées des classes A et B .on compare aux valeurs critiques do de la table de
Kolmogorov-smirnov. la règle de décision est la suivante :on rejette Ho si d>dO.
26
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
U n An B
U' 2 Suit une loi centrée réduite. On peut donc utiliser U’comparé à la
n An B n A n B 1
12
valeur lue sur la table de la loi normale.
27
2022 GBIO3_IUT_UN_THEORIES DE LA DECISION
second groupe de
variables
représentant un
caractère qualitatif
répartit en g classes
mesurées sur les
mêmes individus
Deux groupes de Analyse des Analyse des Régression Test d’uniformité
variables correspondances correspondances logistique,
qualitatives et un canoniques canoniques régression
groupe de variables
quantitatives
Trois groupes ou ACP ACP Analyse Test d’uniformité
plus de variables canonique
quantitatives généralisée
mesurées sur les
mêmes individus
Deux groupes de Analyse des Analyse des Corrélations poly Test d’uniformité
variables correspondances correspondances chroniques
qualitatives canoniques ACC canoniques ACC
mesurées sur les
mêmes individus
30