Vous êtes sur la page 1sur 3

EPAC 2022-2023 Filière : SI 2

Fiche de Td 2 Statistique Descriptive

Exercice 1
À l’issue d’un test de dégustation, on a recueilli 8 notes mesurant l’acidité ressentie pour chacune de 4
bières blanches. Ces notes sont rassemblées dans le tableau suivant :
Bière 1 Bière 2 Bière 3 Bière 4
note 1 5 0 5 0
note 2 5 1 6 0
note 3 5 2 6 1
note 4 6 2 7 1
note 5 7 3 8 2
note 6 7 4 9 3
note 7 8 6 10 4
note 8 10 6 10 4

On pourra remarquer que chaque note est évaluée sur une échelle allant de 0 à 10 . Par exemple, la
première note accordée à la bière 4 (note de 0 ) traduit une absence totale d’acidité pour cette bière La
huitième note de la bière 1 (note de 10) traduit au contraire une acidité extrême. Bien entendu, chaque
bière est évaluée par un jury indépendant des autres jurys.
1. Faites des boîtes à moustaches pour illustrer le lien entre l’acidité et la bière.
2. Quelle méthode semble adaptée pour savoir si les bières diffèrent par leur acidité ?
3. Écrire le modèle correspondant.
4. Dressez le tableau d’analyse de la variance correspondant.
5. Proposez un test pour comparer globalement ces bières (hypothèse nulle, hypothèse alternative,
statistique de test, loi de la statistique sous H0 ). Prenez une décision au seuil de risque α = 1%

Exercice 2
Pour une étude de santé globale, on s’intéresse à la quantité de gras contenu dans des pièces de viandes
de boeuf. Pour cela, on a sélectionné au hasard quatre supermarchés. Dans chacun d’eux, on a choisi
aléatoirement 4 pièces de boeuf, d’un même poids d’un kilogramme, pour mesurer le pourcentage de gras
dans chacune. Les résultats sont les suivants :
Supermarché A Supermarché B Supermarché C Supermarché D
22 25 30 18
20 27 20 20
23 24 23 17
25 24 27 17

1. De quel type d’échantillonnage s’agit-il ?


2. Peut-on constater, au niveau 5% une différence significative de pourcentage moyen de gras entre
au moins deux supermarchés ?

Exercice 3 :

1 EPAC/SI2/2022-2023
On a relevé les salaires dans trois quartiers d’une grande ville. Ces trois quartiers sont en grande partie
occupés par trois communautés A, B et C différentes. Le tableau qui suit résume ces salaires (en milliers
de dollars) :
Communauté A Communauté B Communauté C
43,5 73,5 45,5
49,5 62,0 65.4
38,0 47,5 49.4
66,5 36,5 58.7
57,5 44,5 67.4
32,0 56,0 64.8
67,5 68,0 69.4
71,5 63,5 70.5
1. Y a-t-il une différence significative entre les moyennes des salaires dans les trois communautés ?
2. Donnez un intervalle de confiance à 95% de la différence des moyennes de salaire entre les deux
premières communautés (α = 0, 05).

Exercice 4 :
On considère cinq traitements T1 , · · · , T5 contre les boutons de fièvre, dont un est un placebo (traitement
T1 ). Ces traitements ont été administrés au hasard sur trente patients ( six patients par groupe de
traitement). Le délai, exprimé en jours, entre l’apparition des boutons de fièvre et la cicatrisation
complète a été recueilli chez chacun des trente patients, détaillé ci-dessous :

T1 T2 T3 T4 T5
5 4 6 7 9
8 6 4 4 3
7 6 4 6 5
7 3 5 6 7
10 5 4 3 7
8 6 3 5 6

1. Comparez les moyennes des délais de cicatrisation, délais observés sur cinq échantillons
indépendants (groupes de traitement).
2. Estimez les différents paramètres du modèle.

Exercice 5 :
Exercice 27 - Une usine produit des pièces d’une machine. Pour chaque pièce (individu), on dispose du
coût de sa production (DA) et du temps nécessaire pour sa réalisation (en heures). Le tableau ci-après
(série statistique) donne celte répartition :

Individu 1 2 3 4 5
Temps (X) mesuré en heures 2 3 52 2 4
Coût (Y ) mesuré en Dinars 10 16 23 12 18

1
Pn Cov(X,Y )
On donne − Cov(X, Y ) = N i=1 [(xi − x̄) (yi − ȳ)] . − Cocfficicnt de corrélation = σ(X)σ(Y )
. - Droite de
corrélation linéaire : Y = ȳ − Cov(X,Y
Var(X)
)
x̄ + Cov(X,Y
Var(X)
)
X.
1. Calculer la moyenne de la variable statistique X.
2. Calculer la moyenne de la variable statistique Y .

2 EPAC/SI2/2022-2023
3. Calculer l’écart-type de la variable statistique X.
4. Calculer l’écart-type de la variable statistique Y .
5. Calculer la covariance des variable statistiques X et Y .
6. En supposant qu’il existe une corrélation lináaire entre X et Y , déterminer cette droite de
corrélation.
7. Calculer le coefficient de corrélation. Conclusion ?
8. Une nouvelle pièce est réalisée en 6 heures. Estimer le coût de production de cette pièce cn
utilisant la droite de corrélation établie.

Exercice 6 :
- On fait une étude statistique sur 10 sites de commerce électronique, ayant pour but de sonder sur une
semaine le nombre de visiteurs et le nombre de commandes. On obtient le tableau suivant :

Le numéro du site (i) 1 2 3 4 5 6 7 8 9 10


Le nombre de connections (xi ) 80 100 115 110 70 125 105 90 110 95
Le nombre de commandes (yi ) 32 50 62 56 8 80 62 50 62 38
1. Calculer les moyennes arithmétiques de la variable statistique X et de la variable statistique Y .
2. Calculer les écarts-type de la variable statistique X et de la variable statistique Y .
3. Calculer la covariance entre X et Y .
4. Calculer le coefficient de corrélation linéaire entre X et Y . Commenter.
5. Déterminer la droite de corrélation Y = aX + b.

3 EPAC/SI2/2022-2023

Vous aimerez peut-être aussi