Vous êtes sur la page 1sur 19

Départements tertiaires

MATHEMATIQUES

____ Remise à niveau 3 : STATISTIQUES ____

COURS, ACTIVITES
-
ENONCES DES EXERCICES

Documents en ligne : sur http://jff-dut-tc.weebly.com, onglet Remise A Niveau

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 1 sur 19
____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 2 sur 19
1 Statistiques à une variable
1.1 Vocabulaire
Voici les résultats de trois enquêtes concernant un groupe de 30 étudiants d’une section de l’IUT :
1. Leur âge
2. Notes obtenues à une évaluation de mathématiques
3. Mention obtenue au BAC

Indiquer le type de variable pour chaque tableau :


Tableau 1 :
Tableau 2 :
Tableau 3 :

Quelques représentations graphiques utilisées :

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 3 sur 19
1.2 Paramètres de position : mode, médiane et moyenne
1.2.1 Le mode : modalité ayant le plus grand effectif
Si les valeurs sont regroupées dans des classes (intervalles) on parle de classe modale :
* c’est la classe ayant le plus grand effectif lorsque les classes ont même amplitude.
* c'est la classe ayant la plus grande

Indiquer le mode pour les tableaux de l’activité :

exemple de classes d'amplitudes différentes :

1.2.2 La médiane : modalité telle que la moitié des valeurs lui sont inférieures ou égales.
• Si la variable est discrète : on range les valeurs par ordre croissant et on détermine la valeur qui
partage le groupe en deux.
Ex : salaires dans une petite entreprise de 11 personnes :
1250 € ; 3500 € ; 3050 € ; 1860 € ; 1310 € ; 1430 € ; 1525 € ; 2360 € ; 1980 € ; 1250 € ; 1630 €.

Ex : lorsque l’effectif total est pair, avec 10 salariés, on peut déterminer une valeur "centrale" :

Ex : si les valeurs sont regroupées dans un tableau, on utilise les effectifs cumulés croissants :

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 4 sur 19
• Si la variable est continue : on trace le polygone des fréquences cumulées croissantes et on lit
graphiquement la médiane qui correspond à 50 % des valeurs.
Exemple avec le tableau de notes :

1.2.3 La moyenne : somme de toutes les valeurs divisée par l’effectif total

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 5 sur 19
moyenne et fréquences :

comparaison des paramètres de position :

utilisation de la calculatrice :

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 6 sur 19
EXERCICES
* EX 4.1. 24 personnes ont été interrogées sur le nombre de packs de lait achetés ces trente derniers
jours. Les résultats sont les suivants : 0-1-4-2-1-2-1-1
3-0-1-0-3-0-2-2
0-2-1-1-3-1-0-4
1) Organiser ces résultats dans un tableau où chaque modalité sera reprise une fois et associée à
l’effectif correspondant au nombre de réponses.
2) Quelle est la réponse modale ?
3) Quel est le nombre médian de packs achetés, dans cet échantillon interrogé ?
4) Quelle est le nombre moyen de packs par personne ?
* EX 4.2. A l’issue d’un concours de tir à l’arc, Paul et Virginie comparent leurs résultats. La figure ci-
dessous indique les impacts des quinze flèches de chacun.

1) Former un tableau reprenant en six colonnes (une pour chaque score possible) les nombres de tirs
obtenus dans chaque zone (séparer les deux candidats).
2) Si le vainqueur est celui dont le total est le plus fort, qui a gagné ? Est-ce que ça signifie que son
score moyen par flèche est également le plus fort ?
3) Si le vainqueur est celui dont le score modal est le plus fort, qui a gagné ?
* EX 4.3. Lectures graphiques
Lors d’un sondage, on a demandé leur âge aux personnes interrogées (au total : 200 personnes). Le
graphique ci-dessous à droite est le diagramme des fréquences cumulées croissantes de cette série.
1) Quel pourcentage de personnes interrogées ont…
a. moins de 40 ans ? b. Plus de 50 ans ? c. Entre 30 et 50 ans ?
2) Grâce aux données de ce diagramme de FCC, construisez à sa gauche l’histogramme des effectifs
correspondant.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 7 sur 19
* EX 4.4. On donne les nombre d'élèves d'une classe de première, ordonnés selon la valeur de leur
moyenne générale et de leur état civil, selon le tableau ci-dessous :
ELEVES
garçons filles
Notes -17ans +17ans -17ans +17ans
10 2 1 0 2
11 3 4 3 3
12 3 5 4 6
13 2 3 2 3
14 4 2 3 1
1) a. Quelle est la moyenne des garçons ? b. Quelle est la moyenne des filles ?
c. Quelle est la moyenne générale ?
2) a. Parmi les élèves ayant eu moins de 12, quel est le pourcentage de filles ?
b. Parmi les filles, quel est le pourcentage d’élèves qui ont eu moins de 12 ?
* EX 4.5. QCM
1) Dans une classe de 30 élèves, la médiane de la série des notes est 10. Le professeur décide d’ajouter
1 point aux trois notes les plus basses, lesquelles restent les plus basses. La médiane…
a. ne change pas b. augmente de 0,1 point c. augmente de 1 point
c. augmente, mais on ne peut pas savoir de combien
2) Dans une classe de 30 élèves, la moyenne trimestrielle des notes est 9,4. Le professeur décide
d’ajouter 1 point aux trois notes les plus basses. La moyenne…
a. ne change pas b. augmente de 0,1 point c. augmente de 1 point
c. augmente, mais on ne peut pas savoir de combien
3) Un même test a été donné dans deux classes. La première, composée de 20 élèves, a obtenu une
moyenne de 12,30 ; la seconde, composée de 30 élèves, a obtenu une moyenne de 14,80. Quelle
est la moyenne du groupe formé par les 50 élèves de ces deux classes ?
a. 12,55 b. 13,50 c. 13,55 d. 13,8
* EX 4.6. La moyenne d’un groupe de 25 étudiants est 11,48. Celle des garçons est 10,7 et celle des filles
est 12. Combien de garçons et de filles y a-t-il dans ce groupe ?

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 8 sur 19
1.3 Paramètres de dispersion
Ces paramètres montrent si les valeurs sont regroupées autour de la moyenne ou bien dispersées.
Exemple : ces deux séries peuvent avoir la même moyenne mais les valeurs ne sont pas dispersées de la
même manière :

1.3.1 L’étendue
c’est la différence entre la valeur maximale et la valeur minimale de la variable

1.3.2 Les quartiles

• Le premier quartile Q1 est la plus petite valeur telle qu’au moins un quart (25 %) des valeurs lui
sont inférieures ou égales ; on cherche donc la valeur correspondant à
• Le deuxième quartile Q2 est la plus petite valeur telle qu’au moins la moitié (50 %) des valeurs lui
sont inférieures ou égales ; on cherche donc la valeur correspondant à N / 2
Remarque : …………………………………………………………………………………………
• Le troisième quartile Q3 est la plus petite valeur telle qu’au moins trois quarts (75 %) des valeurs lui
sont inférieures ou égales ; on cherche donc la valeur correspondant à

1.3.3 L’écart type σ

utilisation de la calculatrice :

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 9 sur 19
EXERCICES
* EX 4.7. On mesure la taille, en cm, de 18 individus. Les résultats sont les suivants :
156, 160, 160, 164, 166, 167, 169, 170, 172, 172, 175, 176, 176, 178, 180, 180, 184, 190
1) Quelle est l’étendue de la série ?
2) Donner les trois quartiles, rappeler leur signification.
3) A l’aide de la calculatrice, donner la taille moyenne de ce groupe et son écart type. Expliquer la
signification de l’écart type.
4) Si on saisit sur calculatrice uniquement les valeurs en cm au-delà de 100 (la série devient donc 56,
60, 60, 64, …), quel effet cela a-t-il sur la moyenne ? sur l’écart type ? Était-on alors obligé de saisir
ce « 1 » au début de chaque valeur pour obtenir les résultats de la question 3 ?

* EX 4.8.

1) Quelle est l’étendue de la série ?


2) Donner les trois quartiles, rappeler leur signification.
3) A l’aide de la calculatrice, donner le score moyen et son écart type.
* EX 4.9. Les deux tableaux ci-dessous montrent des valeurs en première ligne et des effectifs en
deuxième ligne. Leur diagramme des effectifs sont donc respectivement ceux qui apparaissent au-
dessous.
0 10 20 30 40 0 10 20 30 40
1 2 3 4 5 5 4 3 2 1

Donner la moyenne et l’écart type de chaque série ; commenter la symétrie des résultats.
* EX 4.10. Reprenons l’exemple de l’exercice 4.3.
1) A partir du diagramme des FCC :
a. Donner l’étendue de la série.
b. Donner la médiane (que l’on peut donc
aussi appeler « âge médian »), ainsi que
les deux autres quartiles.
2) A partir des effectifs retrouvés dans chaque
classe d’âge :
a. Saisir les données statistiques sur la
calculatrice.
b. Obtenir alors l’âge moyen des personnes
interrogées et l’écart type des âges.
c. Interpréter concrètement l’écart type.
d. Grâce à une lecture graphique du
diagramme des FCC, dire quel est le
pourcentage des personnes interrogées
dont l’âge se situe à une distance
maximale d’un écart type autour de la
moyenne.
____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 10 sur 19
2 Statistiques à deux variables
2.1 Nuage de points
Le tableau suivant présente l’évolution du budget publicitaire et du chiffre d’affaire d’une société au
cours des 6 dernières années :
Budget publicitaire en
8 10 12 14 16 18
milliers d’euros xi
Chiffre d’affaire en
40 55 55 70 75 95
milliers d’euros yi

100

80

60

40

20

0 2 4 6 8 10 12 14 16 18 20

2) Déterminer les coordonnées du point moyen G du nuage de points.

2.2 Ajustement affine


2.2.1 Méthode de Mayer
On reprend les données du tableau de l’exemple précédent.
1) Soit G1, le point moyen associé aux trois premiers points du nuage et G2 le point moyen associé aux
trois derniers points du nuage.
a) Calculer les coordonnées de G1 et G2.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 11 sur 19
b) On prend (G1G2) comme droite d’ajustement. Tracer cette droite.

2) À l’aide du graphique :
a) Estimer le chiffre d’affaires à prévoir pour un budget publicitaire de 22 000 €.

b) Estimer le budget publicitaire qu’il faudrait prévoir pour obtenir un chiffre d’affaires de 100 000 €.

3) À l’aide de l’équation de la droite (G1G2) :


a) déterminer l’équation de la droite passant par les points G1 et G2

b) Calculer le chiffre d’affaires pour un budget publicitaire de 22 000 €.

c) Calculer le budget publicitaire qu’il faudrait prévoir pour obtenir un chiffre d’affaires de 100 000 €.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 12 sur 19
2.2.2 Droite d’ajustement par la méthode des moindres carrés

Cette méthode porte le nom de « moindre carrés » car elle consiste


à rechercher la position de la droite d’ajustement telle que, la somme
des carrés des longueurs donnant les distances respectives (en vert)
entre la droite et les points, soit minimale.
Pour cela, on utilise la calculatrice qui va donner l’équation
de la droite cherchée.

Exemple :
On considère la série statistique à deux variables donnée dans le
tableau suivant :

100

80

60

40

20

0 5 10 15 20 25 30 35 40

-20
2) a) À l’aide de la calculatrice, déterminer une équation de la droite d’ajustement par la méthode des
moindres carrés.

utilisation de la calculatrice :

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 13 sur 19
EXERCICES
* EX 4.11. On a noté le diamètre (Y, cm) et l’âge (X, années) de divers arbres d’une même essence. Les
résultats numériques sont consignés dans le tableau ci-dessous et le nuage de points correspondant a
été représenté.

X 2 4 5 8 10 11
Y 11 15 22 27 38 37

1) a. Déterminer la droite permettant


l’ajustement linéaire de ces données, par
la méthode de Mayer (coordonnées de
G1 et G2, équation de la droite,
représentation graphique).
b. Estimer graphiquement puis par le calcul
l’âge auquel un arbre de cette essence
atteint un diamètre de 50 cm.
2) a. Saisir les données du tableau sur calculatrice pour obtenir l’équation de la droite de régression
issue de la méthode des moindres carrés.
b. Estimer par le calcul l’âge auquel un arbre de cette essence atteint un diamètre de 50 cm.

* EX 4.12. Un sondage a été réalisé sur le nombre X d’heures par jour passées sur Internet et on a croisé
les réponses avec l’âge Y des répondants. Le tableau ci-dessous affiche les nombres de citations
correspondant à chaque croisement.
X : âge
[10 ; 15[ [15 ; 25[ [25 ; 50[ [50 ; 90[
Y : nombre [0 ; 1[ 8 5 12 23
d’heures [1 ; 3[ 15 28 18 8
quotidien [3 ; 6[ 6 16 2 0

1) Saisir les données (X, Y, effectifs) de cet exercice sur calculatrice (List 1, List 2, List 3).
2) Donner alors :
a. l’âge moyen des répondants
b. le nombre moyen d’heures passées par jour sur Internet, pour l’ensemble des répondants
c. le nombre moyen d’heures passées par jour sur Internet, par tranche d’âges
3) a. Grâce à votre calculatrice, donner l’équation de la droite de régression de Y en fonction de X.
b. Comment interpréter la négativité de son coefficient directeur ?

* EX 4.13. Une étude réalisée sur des magasins de revente d'électroménager a croisé deux variables : le
chiffre d'affaires annuel réalisé et la dépense consacrée à la publicité. Les effectifs (nombre de
magasins) ont été consignés dans le tableau de contingence ci-dessous :
chiffre d'affaires Y (M€)
[1,2 ; 1,6[ [1,6 ; 2,4[ [2,4 ; 2,8[
dépense [30 ; 50[ 28 18 11
publicitaire [50 ; 70[ 19 42 22
X (k€) [70 ; 90[ 8 25 27

1) Après avoir saisi les éléments de ce tableau dans votre calculatrice, donner les moyennes et écart-
types de X et de Y.
2) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés.
b. À combien une entreprise peut-elle estimer son chiffre d'affaires si elle dépense 120 000 € en
publicité ?

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 14 sur 19
2.3 Ajustements non linéaires : changement de variable
Dans de nombreux cas, la corrélation linéaire entre deux variables n'est pas bonne, alors que l'on sait par
ailleurs qu'elles sont corrélées. Une analyse plus poussée conduit à déterminer une relation, une formule
"efficace" entre elles, mais pas de type . La relation pourra être du type d'une fonction du
second degré, ou invoquer un logarithme, exemples pris parmi une multitude de possibilités.

La "meilleure" relation est censée rendre compte de la forme "non droite" d'un nuage de points, ce dernier
étant par ailleurs suffisamment "effilé" pour traduire une corrélation forte entre X et Y.

EXERCICES
* EX 4.14. Dans une enseigne de grande surface, un produit alimentaire A est vendu depuis plusieurs
années. Dans l'année 2008, son prix a fluctué et on a noté dans la même période l'évolution des
quantités vendues de ce produit :
prix de vente, en € X 40 42 45 39 37 40 42 50
quantité vendue (unit.) Y 283 273 267 287 295 290 281 244

Partie 1
1) Donner, à l'aide de la calculatrice, les moyennes et écarts-types des variables X et Y.
2) a. Calculer Cov(X, Y) : la covariance de ces deux variables.
b. Interpréter le signe de cette covariance.
3) a. Calculer leur coefficient de corrélation linéaire.
b. Interpréter sa valeur.
4) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés.
b. Décrire brièvement le principe de cette méthode.
Partie 2
X et Y étant respectivement le prix de vente à l'unité et la quantité vendue, on s'intéressera ici à
l'évolution du chiffre d'affaires réalisé, noté C, avec bien entendu C = X×Y.
prix de vente, en € X 40 42 45 39 37 40 42 50
quantité vendue (unit.) Y 283 273 267 287 295 290 281 244
T
chiffre d'affaires, en € C

1) a. Compléter la ligne de valeurs de C, en utilisant les valeurs de X et Y données.


b. Compléter la ligne de valeurs de T, variable remplaçant provisoirement X, avec T = (53 - X)².
2) a. Etudier la corrélation linéaire entre T et C.
b. Donner l'équation de la droite de régression de C en T, suivant la méthode des moindres carrés.
c. En déduire que l'on peut exprimer C en fonction de X comme suit : C = -3,92X² + 415X + 980.
3) Quelle est alors l'estimation que l'on peut faire du chiffre d'affaires dans les cas où le prix de vente
est fixé à 52 €, 53 €, puis 54 € ?

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 15 sur 19
* EX 4.15. Une société produit et commercialise des écrans TV haut de gamme et veut analyser ses coûts
de production. Le coût global de production a fluctué en fonction de la quantité produite, comme
donné dans le tableau suivant :
quantité produite
(écrans) X 42 45 39 37 40 42 48 45
coût de production (k€) Y 24 25 22 21 23 24 26 25
Les deux parties de cet exercice sont indépendantes et pourront être traitées dans l'ordre de votre choix.

Partie 1
1) Donner, à l'aide de la calculatrice, les moyennes et écarts-types des variables X et Y.
2) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés.
b. Décrire brièvement le principe de cette méthode.

Partie 2
On reprend ici aussi les données de départ de l'exercice (énoncées avant la partie 1). On s'intéressera
ici à l'évolution du coût de revient moyen d'un écran, noté T, avec bien entendu T = Y divisé par X.
coût moyen (k€/écran) T
U
1) a. Compléter la ligne de valeurs de T, en utilisant les valeurs de X et Y données.
b. Compléter la ligne de valeurs de U, variable remplaçant provisoirement T, avec U = 1/T.
2) a. Etudier la corrélation linéaire entre X et U.
b. Donner l'équation de la droite de régression de U en X, suivant la méthode des moindres carrés.
c. En déduire une expression de T en fonction de X.
3) a. Quelle est alors l'estimation que l'on peut faire du coût moyen de production d'un écran lorsque
60 unités seront produites ?
b. Combien d'unités (écrans) doit-on produire pour que ce coût moyen devienne inférieur à 500 € ?

* EX 4.16. Sur les arbres d'un échantillon d'une même essence, en période de croissance (leurs diamètres

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 16 sur 19
2.4 Tableaux de contingence : dépendance de variables croisées
2.4.1 Tableaux de contingence
Deux caractéristiques sont notées, sur 210 individus d'une population : leur catégorie d'emploi et leur
région d'habitation. Les individus sont alors répartis dans le tableau de contingence suivant :

tableau des effectifs observés


Europe
région Paris Province total Ni.
emploi hors France
salarié d'une entreprise 34 10 24 68
recherche d'emploi 38 3 5 46
indépendant 23 31 2 56
dirigeant d'entreprise 9 0 31 40
total N.j 104 44 62 210
46 personnes sont
38 personnes sont en 44 personnes 210 personnes en recherche
recherche d'emploi ET habitent en province ont été d'emploi
habitent à Paris effectif marginal N.2 interrogées effectif marginal N2.
effectif n21 ou obs21 effectif total N

2.4.2 Tableaux des profils lignes ou colonnes


Pour une meilleure lecture de l'importance de chaque effectif comparativement à son effectif marginal
(somme d'une ligne ou d'une colonne), on peut calculer le pourcentage qu'il représente.

tableau des profils lignes


Europe
région Paris Province total Ni.
emploi hors France
salarié d'une entreprise 50 14,7 35,3 100
recherche d'emploi 82,6 6,5 10,9 100
indépendant 41,1 55,3 3,6 100
dirigeant d'entreprise 22,5 0 77,5 100
total N.j 49,5 21 29,5 100

21% des personnes interrogées 77,5% des dirigeants d'entreprise


habitent en province habitent hors de France

tableau des profils colonnes


Europe
région Paris Province total Ni.
emploi hors France
salarié d'une entreprise 32,7 22,7 38,7 32,4
recherche d'emploi 36,5 6,8 8,1 21,9
indépendant 22,1 70,5 3,2 26,7
dirigeant d'entreprise 8,7 0 50 19
total N.j 100 100 100 100

50% des personnes habitant hors 21,9% des personnes interrogées


de France sont des dirigeants sont en recherche d'emploi
d'entreprise

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 17 sur 19
2.4.3 Mesure de l'indépendance
Les deux variables sont indépendantes si le tableau des profils lignes (resp. profils colonnes) montre des
lignes identiques (resp. colonnes identiques). Dans notre exemple, cela signifierait (en profil ligne) que la
répartition des personnes, en pourcentage, selon le lieu d'habitation, serait la même quel que soit l'emploi.

Tableau des effectifs théoriques


Pour mesurer l'indépendance – ou plutôt la dépendance – entre deux variables, il existe des paramètres
calculables basés sur la différence entre le tableau des effectifs observés et un tableau "virtuel" d'effectifs
théoriquement attendus en cas d'indépendance. Ce dernier se doit d'être un tableau de proportion :
pour calculer chaque effectif théorique thij, on peut utiliser un produit en croix :
N i . × N. j
thij =
N

Europe
région Paris Province total Ni.
emploi hors France
salarié d'une entreprise 33,6761905 14,247619 20,0761905 68
recherche d'emploi 22,7809524 9,63809524 13,5809524 46
indépendant 27,7333333 11,7333333 16,5333333 56
dirigeant d'entreprise 19,8095238 8,38095238 11,8095238 40
total N.j 104 44 62 210

Deux variables sont indépendantes lorsque ce tableau est identique au tableau des effectifs observés.
On remarque des divergences fortes dans certaines zones communes aux deux tableaux. En particulier :

calcul du χ² (Khi-deux)

( obs − thij )
2

χ =∑
2 ij

ij thij
deux variables indépendantes correspondent donc à un χ² exactement nul.

Dans notre exemple : χ² = 112,88

Cette valeur est formée par les différences observées entre tableau théorique et tableau d'observations,
mais dépend aussi de la taille des tableaux (nombre de lignes p et nombre de colonnes q) et du nombre
total N d'observations.
Pour pouvoir être interprétée, c’est-à-dire pour avoir du sens dans l'évaluation de la dépendance, elle doit
donc être contextualisée puis comparée à d'autres valeurs de χ² pré calculées et lisibles dans une "table du
χ²", suivant la loi (de probabilité) du χ² à (p-1)×(q-1) "degrés de liberté". Ce point sera traité en TC au
second semestre.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 18 sur 19
Coefficient de Cramer
On peut traduire la valeur calculée du χ² en un coefficient plus facilement lisible : le coefficient de Cramer.
χ2
N × min { p − 1 ; q − 1}

dans notre exemple : 0,5184

Ce dernier a l'avantage de donner un résultat compris dans tous les cas entre 0 et 1,
0 correspondant à l'indépendance parfaite et 1 (ou des valeurs proches de 1) à une très grande disparité
entre les lignes ou les colonnes du tableau d'observation :

EXERCICES

* EX 4.17. On observe dans le tableau ci-contre la fréquentation de deux magasins A et B.


À l'issue d'un sondage, on note le nombre de personnes ayant effectué au
moins un achat, par tranches d'âges (10 à 15 ans, etc.).

1) Établir le tableau d'effectifs théoriquement attendus en cas d'indépendance


âge vs magasin.
2) Calculer le χ² entre ces deux tableaux.
3) Quelle tranche d'âge contribue le plus au résultat précédent ? Interpréter.
4) Calculer le coefficient de Cramer puis donner une conclusion.

* EX 4.18. La position d'une personne vis-à-vis du tabac dépend-elle de son sexe ? Voici les résultats
d'une enquête portant sur 51 hommes et 66 femmes :
S : caractère "sexe" T : caractère "position vis-à-vis du tabac"
Sh : hommes Tj : n'ont jamais fumé
Sf : femmes Tf : sont fumeurs
Ta : ont arrêté

1) Établir le tableau d'effectifs théoriquement attendus en cas d'indépendance


sexe vs usage du tabac.
2) Calculer le χ² entre ces deux tableaux.
3) Calculer le coefficient de Cramer puis donner une conclusion.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin– Mathématiques – RAN 3 Stats – CoursEx – Rev2020 – page 19 sur 19