Vous êtes sur la page 1sur 14

Départements tertiaires

MATHEMATIQUES

____ Remise à niveau 3 : STATISTIQUES ____

CORRIGES DES EXERCICES

Documents en ligne : sur http://jff-dut-tc.weebly.com

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 1 sur 13
1 Statistiques à une variable
1.1 Vocabulaire

1.2 Paramètres de position : mode, médiane et moyenne


* EX 3.1. 24 personnes ont été interrogées sur le nombre de packs de lait achetés ces trente derniers
jours. Les résultats sont les suivants : 0-1-4-2-1-2-1-1
3-0-1-0-3-0-2-2
0-2-1-1-3-1-0-4
1) Organiser ces résultats dans un tableau où chaque modalité sera reprise une fois et associée à
l’effectif correspondant au nombre de réponses.
modalité 0 1 2 3 4
effectif 6 8 5 3 2
2) Quelle est la réponse modale ? 1 (pack)
3) Quel est le nombre médian de packs achetés, dans cet échantillon interrogé ? 1 (pack)
4) Quelle est le nombre moyen de packs par personne ? (8+10+9+8)/24 = 35/24 = 1.458 (pack)
* EX 3.2. À l’issue d’un concours de tir à l’arc, Paul et Virginie comparent leurs résultats. La figure ci-
dessous indique les impacts des quinze flèches de chacun.

1) Former un tableau reprenant en six colonnes (une pour chaque score possible) les nombres de tirs
obtenus dans chaque zone (séparer les deux candidats).
score 0 10 20 30 50 100
effectif Virginie 2 2 4 4 1 2
effectif Paul 1 3 2 6 2 1
2) Si le vainqueur est celui dont le total est le plus fort, qui a gagné ? Est-ce que ça signifie que son
score moyen par flèche est également le plus fort ?
Total Virginie : 470 ; total Paul : 450. Le vainqueur est Virginie.
La moyenne vaut le score total divisé par le nombre de tirs. Comme chacun a effectué 15 tirs, un total
plus important correspond à une moyenne plus importante.
3) Si le vainqueur est celui dont le score modal est le plus fort, qui a gagné ?
Modes Virginie : 20 et 30 ; mode Paul : 30. On pourrait considérer que Paul a gagné.
* EX 3.3. Lectures graphiques
Lors d’un sondage, on a demandé leur âge aux personnes interrogées (au total : 200 personnes). Le
graphique ci-dessous à droite est le diagramme des fréquences cumulées croissantes de cette série.
1) Quel pourcentage de personnes interrogées ont…
a. moins de 40 ans ? b. Plus de 50 ans ? c. Entre 30 et 50 ans ?
Une fréquence cumulée croissante (FCC) est le taux d’individus dont les modalités sont inférieures ou
égales à une valeur donnée. Ici : FCC(x) = p(âge ≤ x), où p est une proportion d’individus.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 2 sur 13
a. p(âge ≤ 40) = FCC(40) = 60% b. p(âge ≥ 50) = 100% - p(âge ≤ 50) = 100%-90% = 10%
c. p(30 ≤ âge ≤ 50) = p(âge ≤ 50) - p(âge ≤ 30) = 90% - 10% = 80%
2) Grâce aux données de ce diagramme de FCC, construisez à sa gauche l’histogramme des effectifs
correspondant. (effectif total : 200 personnes)

60

40

20

* EX 3.4. On donne les nombre d'élèves d'une classe de première, ordonnés selon la valeur de leur
moyenne générale et de leur état civil, selon le tableau ci-dessous :
ELEVES
garçons filles
Notes -17ans +17ans -17ans +17ans
10 2 1 0 2
11 3 4 3 3
12 3 5 4 6
13 2 3 2 3
14 4 2 3 1
1) a. Quelle est la moyenne des garçons ?
(3×10 + 7×11 + 8×12 + 5×13 + 6×14) / 29 = 352 / 29 = 12,14 environ
b. Quelle est la moyenne des filles ?
(2×10 + 6×11 + 10×12 + 5×13 + 4×14) / 29 = 327 / 27 = 12,11 environ
c. Quelle est la moyenne générale ?
(5×10 + 13×11 + 18×12 + 10×13 + 10×14) / 29 = 679 / 56 = 12,125
2) a. Parmi les élèves ayant eu moins de 12, quel est le pourcentage de filles ?
18 élèves ont eu moins de 12, dont 8 filles. 8/18 = 0,4444 environ = 44,44%.
b. Parmi les filles, quel est le pourcentage d’élèves qui ont eu moins de 12 ?
27 élèves sont des filles, parmi lesquelles 8 ont eu moins de 12. 8/27 = 0,2963 environ = 29,63%
* EX 3.5. QCM
1) Dans une classe de 30 élèves, la médiane de la série des notes est 10. Le professeur décide d’ajouter
1 point aux trois notes les plus basses, lesquelles restent les plus basses. La médiane…
a. ne change pas b. augmente de 0,1 point c. augmente de 1 point
d. augmente, mais on ne peut pas savoir de combien
Réponse a. La médiane est la note qui partage le groupe en deux parts égales : la moitié des
élèves a eu moins ou autant que la médiane et l’autre moitié a eu autant ou plus. Si les trois
derniers résultats restent les trois derniers, sur un total de 30 élèves, cette note centrale n’est pas
modifiée.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 3 sur 13
2) Dans une classe de 30 élèves, la moyenne trimestrielle des notes est 9,4. Le professeur décide
d’ajouter 1 point aux trois notes les plus basses. La moyenne…
a. ne change pas b. augmente de 0,1 point c. augmente de 1 point
d. augmente, mais on ne peut pas savoir de combien
Réponse b. La somme de toutes les notes augmente donc de 3 points, et la moyenne, étant la
somme divisée par 30, augmente de 3/30, soit 0,1 point.
3) Un même test a été donné dans deux classes. La première, composée de 20 élèves, a obtenu une
moyenne de 12,30 ; la seconde, composée de 30 élèves, a obtenu une moyenne de 14,80. Quelle
est la moyenne du groupe formé par les 50 élèves de ces deux classes ?
a. 12,55 b. 13,50 c. 13,55 d. 13,8
Réponse d. Dans chaque classe, le produit moyenne effectif donne le total des notes.
Classe 1 : 12,3×20 = 246 points ; classe 2 : 14,8×30 = 444 points.
L’ensemble des 50 élèves a donc obtenu 690 points, soit une moyenne de 690/50 = 13,8.
* EX 3.6. La moyenne d’un groupe de 25 étudiants est 11,48. Celle des garçons est 10,7 et celle des filles
est 12. Combien de garçons et de filles y a-t-il dans ce groupe ?
Notons x le nombre de filles et y celui de garçons. Le nombre total de points obtenu dans ce groupe
est 12x + 10,7y, et il se trouve qu’il vaut aussi 11,48×25 = 287 ; de plus, x + y = 25.
Remplaçons y par 25 – x dans la première information :
12 x + 10, 7 y = 287 ⇔ 12 x + 10, 7 (25 − x ) = 287 ⇔ 12 x + 267, 5 − 10, 7 x = 287 ⇔ 1, 3 x = 19, 5 ⇔ x = 15
Dans cette classe, il y a 15 filles et donc 10 garçons.

1.3 Paramètres de dispersion


* EX 3.7. On mesure la taille, en cm, de 18 individus. Les résultats sont les suivants :
156, 160, 160, 164, 166, 167, 169, 170, 172, 172, 175, 176, 176, 178, 180, 180, 184, 190
1) Quelle est l’étendue de la série ? e = 190 – 156 = 34 cm
2) Donner les trois quartiles, rappeler leur signification.
Q1 = 166, Q2 = M = 172, Q3 = 178
25% de la population ont une modalité inférieure ou égale à Q1, 50% à M et 75% à Q3.
3) A l’aide de la calculatrice, donner la taille moyenne de ce groupe et son écart type. Expliquer la
signification de l’écart type.
moyenne : 171,94 cm ; écart type : 8,676 cm. En moyenne, l’écart entre la taille d’un individu et
171,94 cm vaut 8,676 cm (en plus ou en moins).
4) Si on saisit sur calculatrice uniquement les valeurs en cm au-delà de 100 (la série devient donc 56,
60, 60, 64, …), quel effet cela a-t-il sur la moyenne ? sur l’écart type ? Était-on alors obligé de saisir
ce « 1 » au début de chaque valeur pour obtenir les résultats de la question 3 ?
Toutes les valeurs sont diminuées de 100. Si on les repérait par des points sur un axe, ce groupe de
points se verrait déplacé en bloc de 100 unités vers la gauche. Leur moyenne subit donc la même
transformation. Par contre, les écarts entre les points ne seraient pas modifiés, idem pour leur
écart type. Les résultats obtenus avec cette nouvelle série nous auraient donc facilement permis
d’en déduire ceux de la liste originale : on n’avait pas besoin de saisir ce chiffre des centaines.

* EX 3.8.

1) Quelle est l’étendue de la série ? e = 40 – 20 = 20 points


2) Donner les trois quartiles, rappeler leur signification. Q1 = 30, Q2 = M = 30, Q3 = 35
25% de la population ont une modalité inférieure ou égale à Q1, 50% à M et 75% à Q3.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 4 sur 13
3) A l’aide de la calculatrice, donner le score moyen et son écart type.
moyenne : 30,87 points ; écart type : 4,581 points
* EX 3.9. Les deux tableaux ci-dessous montrent des valeurs en première ligne et des effectifs en
deuxième ligne. Leur diagramme des effectifs sont donc respectivement ceux qui apparaissent au-
dessous.
0 10 20 30 40 0 10 20 30 40
1 2 3 4 5 5 4 3 2 1

Donner la moyenne et l’écart type de chaque série ; commenter la symétrie des résultats.
moyenne : 26,67 ; écart type : 12,47 moyenne : 13,33 ; écart type : 12,47
La liste des valeurs montre une répartition régulière autour de 20, alors que les deux liste d’effectifs
sont symétriques l'une de l'autre autour de la valeur 20. Il n’est pas étonnant de constater deux
moyennes symétriques par rapport à 20.
Si on dressait, pour chaque tableau, une liste des écarts entre les valeurs et leur moyenne, on
trouverait le même liste (toujours par symétrie). Il n’est donc pas étonnant que les deux écart types
soient égaux.
* EX 3.10. Reprenons l’exemple de l’exercice 4.3.
1) A partir du diagramme des FCC :
a. Donner l’étendue de la série. e = 60 – 20 = 40 ans
b. Donner la médiane (« âge médian »), ainsi que les deux autres quartiles.
Q1 = 33 ans, Q2 = M = 38 ans, Q3 = 45 ans (pointillés bleus)
2) A partir des effectifs retrouvés dans chaque classe d’âge :
a. Saisir les données statistiques sur la calculatrice.
b. Obtenir alors l’âge moyen des personnes interrogées et l’écart type des âges.
moyenne : 39 ans ; écart type : 8 ans.
c. Interpréter concrètement l’écart type.
Par rapport à 39 ans, l’âge d’un individu diffère en moyenne de 8 ans
d. Grâce à une lecture graphique du diagramme des FCC, dire quel est le pourcentage des
personnes interrogées dont l’âge se situe à
une distance maximale d’un écart type
autour de la moyenne. (pointillés rouges)
39-8 = 31 ans, 39 + 8 = 47 ans. FCC(31) = 15%
et FCC(47) = 80% ; ainsi, 65% de la
population ont un âge compris entre 31 et
47 ans, soit à un écart type au maximum
autour de l’âge moyen.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 5 sur 13
2 Statistiques à deux variables
2.1 Nuage de points

2.2 Ajustement affine


* EX 3.11. On a noté le diamètre (Y, cm) et l’âge (X, années) de divers arbres d’une même essence. Les
résultats numériques sont consignés dans le tableau ci-dessous et le nuage de points correspondant a
été représenté.

X 2 4 5 8 10 11
Y 11 15 22 27 38 37

1) a. Déterminer la droite permettant


l’ajustement linéaire de ces données,
par la méthode de Mayer (coordonnées
de G1 et G2, équation de la droite,
représentation graphique).

2 + 4 + 5 11 11 + 15 + 22
xG1 = = , yG1 = = 16
3 3 3
La droite de Mayer est la droite (G1G2). Son équation y
8 + 10 + 11 29 27 + 38 + 37
xG2 = = , yG2 = = 34
3 3 3
= ax + b est telle que :
yG − yG1 18 11
a= 2 = =3 et b = yG1 − axG1 = 16 − 3 × = 5 (voir graphique)
xG2 − xG1 6 3
b. Estimer graphiquement puis par le calcul l’âge auquel un arbre de cette essence atteint un
diamètre de 50 cm.
Graphiquement, on lit que pour un âge de 15 ans, on obtient un diamètre de 50 cm.
Par le calcul : y = ax + b donne 50 = 3x + 5, donc 45 = 3x et x = 15.

2) a. Saisir les données du tableau sur calculatrice pour obtenir l’équation de la droite de régression
issue de la méthode des moindres carrés. y = 3,0789x + 4,4737
b. Estimer par le calcul l’âge auquel un arbre de cette essence atteint un diamètre de 50 cm.
Par le calcul : y = ax + b donne 50 = 3,0789x + 4,4737, donc 45,5263 = 3,0789x et x = 14,79.

* EX 3.12. Un sondage a été réalisé sur le nombre X d’heures par jour passées sur Internet et on a croisé
les réponses avec l’âge Y des répondants. Le tableau ci-dessous affiche les nombres de citations
correspondant à chaque croisement.
X : âge
[10 ; 15[ [15 ; 25[ [25 ; 50[ [50 ; 90[
____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 6 sur 13
Y : nombre [0 ; 1[ 8 5 12 23
d’heures [1 ; 3[ 15 28 18 8
quotidien [3 ; 6[ 6 16 2 0

1) Saisir les données (X, Y, effectifs) de cet exercice sur calculatrice (List 1, List 2, List 3).

X Y eff
List 1 List 2 List 3 2) Donner alors :
12,5 0,5 8 a. l’âge moyen des répondants 33,42 ans
12,5 2 15 b. le nombre moyen d’heures par jour sur
12,5 4,5 6 Internet, pour l’ensemble des répondants
20 0,5 5 1,915 h
20 2 28
20 4,5 16
37,5 0,5 12
37,5 2 18
37,5 4,5 2
70 0,5 23
70 2 8
70 4,5 0

relation X,Y : la taille des bulles représente les différents effectifs rattachés aux différents couples (X, Y).

c. le nombre moyen d’heures passées par jour sur Internet, par tranche d’âges
[10 ; 15[ [15 ; 25[ [25 ; 50[ [50 ; 90[
2,103 2,663 1,594 0,887
3) a. Grâce à votre calculatrice, donner l’équation de la droite de régression de Y en fonction de X.
y = -0,02855x + 2,869
b. Comment interpréter la négativité de son coefficient directeur ?
Plus x augmente, plus y a tendance à diminuer ; c’est-à-dire : plus une personne est âgée, moins
elle est supposée passer de temps sur Internet.

* EX 3.13. Une étude réalisée sur des magasins de revente d'électroménager a croisé deux variables : le
chiffre d'affaires annuel réalisé et la dépense consacrée à la publicité. Les effectifs (nombre de
magasins) ont été consignés dans le tableau de contingence ci-dessous :

chiffre d'affaires Y (M€)


[1,2 ; 1,6[ [1,6 ; 2,4[ [2,4 ; 2,8[
dépense [30 ; 50[ 28 18 11
____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 7 sur 13
publicitaire [50 ; 70[ 19 42 22
X (k€) [70 ; 90[ 8 25 27

1) Après avoir saisi les éléments de ce tableau dans votre calculatrice, donner les moyennes et écart-
types de X et de Y.

X Y eff
List 1 List 2 List 3 moyenne de X : 60,3 k€
40 1,4 28 écart type de X : 15,294 k€
40 2 18
40 2,6 11 moyenne de Y : 2,015 M€
60 1,4 19 écart type de Y : 0,4547 M€
60 2 42
60 2,6 22
80 1,4 8
80 2 25
80 2,6 27

relation X,Y : la taille des bulles représente les différents effectifs rattachés aux différents couples (X, Y).

2) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés.


y = 0,009215x + 1,4593
b. À combien une entreprise peut-elle estimer son chiffre d'affaires si elle dépense 120 000 € en
publicité ? si x = 120, y est estimé à 0,009215×120 + 1,4593 = 2,5651 M€

2.3 Ajustements non linéaires : changement de variable


* EX 3.14. Dans une enseigne de grande surface, un produit alimentaire A est vendu depuis plusieurs
années. Dans l'année 2008, son prix a fluctué et on a noté dans la même période l'évolution des
quantités vendues de ce produit :
prix de vente, en € X 40 42 45 39 37 40 42 50
quantité vendue (unit.) Y 283 273 267 287 295 290 281 244
relation X,Y

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 8 sur 13
Partie 1
1) Donner, à l'aide de la calculatrice, les moyennes et écarts-types des variables X et Y.
x = 41, 875 ; σ X ≈ 3, 789 ; y = 277, 5 ; σ Y ≈ 15, 20
2) a. Calculer Cov(X, Y) : la covariance de ces deux variables. Cov(X, Y) = -56,4375
b. Interpréter le signe de cette covariance.
Y a tendance à diminuer lorsque X augmente.
3) a. Calculer leur coefficient de corrélation linéaire. r = -0,9799
b. Interpréter sa valeur. C'est un très bon coefficient : la corrélation linéaire est très forte.
4) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés.
y = -3,9304x + 442,08
b. Décrire brièvement le principe de cette méthode.
La somme des carrés des résidus en Y doit être minimale.
Partie 2
X et Y étant respectivement le prix de vente à l'unité et la quantité vendue, on s'intéressera ici à
l'évolution du chiffre d'affaires réalisé, noté C, avec bien entendu C = X×Y.
prix de vente, en € X 40 42 45 39 37 40 42 50
quantité vendue (unit.) Y 283 273 267 287 295 290 281 244
T 169 121 64 196 256 169 121 9
chiffre d'affaires, en € C 11320 11466 12015 11193 10915 11600 11802 12200
1) a. Compléter la ligne de valeurs de C, en utilisant les valeurs de X et Y données.
b. Compléter la ligne de valeurs de T, variable remplaçant provisoirement X, avec T = (53 - X)².
2) a. Étudier la corrélation linéaire entre T et C.
t = 138, 125 ; σ T ≈ 72, 375 ; c = 11563, 875 ; σ C ≈ 402, 153
Cov(T, C) = -27793,23 ; rTC = -0,9549 (bon coefficient également)
b. Donner l'équation de la droite de régression de C en T, suivant la méthode des moindres carrés.
c = -5,306t + 12296,8

relation T,C

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 9 sur 13
c. En déduire que l'on peut exprimer C en fonction de X comme suit : C = -3,92X² + 415X + 980.
erreur d'énoncé. On se servira de c(t) = -5,306t + 12296,8 et donc c(x) = -5,306(53 - x)²+ 12296,8
3) Quelle est alors l'estimation que l'on peut faire du chiffre d'affaires dans les cas où le prix de vente
est fixé à 52 €, 53 €, puis 54 € ?
c(52) = 12291,46 € ; c(53) = 12296,76 € ; c(54) = 12291,46 €
* EX 3.15. Une société produit et commercialise des écrans TV haut de gamme et veut analyser ses coûts
de production. Le coût global de production a fluctué en fonction de la quantité produite, comme
donné dans le tableau suivant :
quantité produite (écrans) X 42 45 39 37 40 42 48 45
coût de production (k€) Y 24 25 22 21 23 24 26 25
Les deux parties de cet exercice sont indépendantes et pourront être traitées dans l'ordre de votre choix.

Partie 1
1) Donner, à l'aide de la calculatrice, les moyennes et écarts-types des variables X et Y.
x = 42, 25 ; σ X ≈ 3, 382 ; y = 23, 75 ; σ Y ≈ 1, 561
2) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés.
y = 0,45355x + 4,5874
b. Décrire brièvement le principe de cette méthode.
La somme des carrés des résidus en Y doit être minimale.

relation X,Y

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 10 sur 13
Partie 2
On reprend ici aussi les données de départ de l'exercice (énoncées avant la partie 1). On s'intéressera
ici à l'évolution du coût de revient moyen d'un écran, noté T, avec bien entendu T = Y divisé par X.
coût moyen
(k€/écran) T 0,5714 0,5556 0,5641 0,56757 0,575 0,5714 0,5417 0,5556
U 1,75 1,8 1,7727 1,7619 1,739 1,75 1,846 1,8
1) a. Compléter la ligne de valeurs de T, en utilisant les valeurs de X et Y données.
b. Compléter la ligne de valeurs de U, variable remplaçant provisoirement T, avec U = 1/T.
2) a. Étudier la corrélation linéaire entre X et U.
u ≈ 1, 7775 ; σ U ≈ 0, 033497
Cov(X, U) = 0,089497 ; rXU = 0,79 (coefficient pas excellent…)
b. Donner l'équation de la droite de régression de U en X, suivant la méthode des moindres carrés.
u = 0,007825x + 1,447
c. En déduire une expression de T en fonction de X.
t = 1/u = 1 / (0,007825x + 1,447)
3) a. Quelle est alors l'estimation que l'on peut faire du coût moyen de production d'un écran lorsque
60 unités seront produites ?
t = 1 / (0,007825×60 + 1,447) = 0,5218 k€
b. Combien d'unités (écrans) doit-on produire pour que ce coût moyen devienne inférieur à 500 € ?
t = 1 / (0,007825x + 1,447) < 0,5 ⇔ 0,007825x + 1,447 > 2 ⇔ 0,007825x + 0,553 ⇔ x > 70,67
Il faut produire au moins 71 unités.
relation X,U relation X,T

* EX 3.16. Sur les arbres d'un échantillon d'une même essence, en période de croissance (leurs diamètres
x sont compris entre 1 cm et 32 cm), une équipe chargée d'étude a relevé la longueur maximale y de
leurs feuilles (en cm également). Les données relevées sont récapitulées dans le tableau de l'annexe 2.
Notre équipe doit analyser ces résultats pour déterminer la corrélation existant entre les deux séries.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 11 sur 13
1) Corrélation linéaire entre x et y
a. À l'aide de votre calculatrice,
donner le coefficient de corrélation
linéaire entre x et y. r = 0,9687
b. Interpréter le résultat précédent.
très forte corrélation linéaire
c. Donner les coefficients a et b de la
droite de régression de y sur x.
a = 0,5058 et b = 5,795
2) Changement de variable, corrélation
puissance entre x et y
a. Soit les variables p = ln(x) et q = ln(y). Le tableau ci-contre a été complété, vérifier les résultats
sur calculatrice.
b. Que dire du coefficient de corrélation linéaire entre p et q ? r = 0,9978 excellent
c. Donner les coefficients a' et b' de la droite de régression de q sur p. a' = 0,4727 et b' = 1,37324
d. Établir alors la relation existant entre x et y, sous la forme y = k×xn , en donnant aux nombres k
et n une précision de quatre décimales.
q = 0,4727p + 1,37324 ⇔ lny = 0,4727lnx + 1,37324 ⇔ y = exp(0,4727lnx + 1,37324)
⇔ y = exp(ln(x0,4727))×exp(1,37324) ⇔ y = 3,948 × x0,4727
3) Extrapolation des résultats
Utiliser la corrélation trouvée en question 2)d. pour déterminer un arrondi à 0,1 cm près du
diamètre d'un arbre dont les feuilles mesureraient 30 cm au maximum.
y = 30 ⇔ q = ln(30) = 3,4012 ⇔ p = (q – 1,37324) / 0,4727 = 4,2898 ⇔ x = exp(p) = 72,95 cm

relation X,Y relation p,q

2.4 Tableaux de contingence : dépendance de variables croisées


* EX 3.17. On observe dans le tableau ci-contre la fréquentation de deux magasins A et B.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 12 sur 13
À l'issue d'un sondage, on note le nombre de personnes ayant effectué au
moins un achat, par tranches d'âges (10 à 15 ans, etc.).

1) Établir le tableau d'effectifs théoriquement attendus en cas d'indépendance


âge vs magasin.
2) Calculer le χ² entre ces deux tableaux.

3) Quelle tranche d'âge contribue le plus au résultat précédent ? Interpréter.


Il s'agit de la tranche d'âge des 10-15 ans, dont la préférence va au magasin A, contrairement aux autres
tranches d'âge.

4) Calculer le coefficient de Cramer puis donner une conclusion.


χ2 8, 727
= ≈ 0, 2116
N × min { p − 1 ; q − 1} 195 × 1
La dépendance entre âge et magasin est globalement modérée.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 13 sur 13
* EX 3.18. La position d'une personne vis-à-vis du tabac dépend-elle de son sexe ? Voici les résultats
d'une enquête portant sur 51 hommes et 66 femmes :
S : caractère "sexe" T : caractère "position vis-à-vis du tabac"
Sh : hommes Tj : n'ont jamais fumé
Sf : femmes Tf : sont fumeurs
Ta : ont arrêté

1) Établir le tableau d'effectifs théoriquement attendus en cas d'indépendance


sexe vs usage du tabac.
2) Calculer le χ² entre ces deux tableaux.

3) Calculer le coefficient de Cramer puis donner une conclusion.


χ2 5, 3
= ≈ 0, 2128
N × min { p − 1 ; q − 1} 117 × 1
La relation entre sexe et tabagisme est globalement modérée.

____________________________________________________________________________
IUT de Saint-Etienne – Tremplin – Mathématiques – RAN 3 Statistiques - ExCorr – Rev2020 – page 14 sur 13