Vous êtes sur la page 1sur 5

TIUF_M1 ANALYSE DE DONNEES

EXERCICES DE REVISION

Exercice 1 : On s’intéresse à la teneur en bicarbonate de sodium d’un comprimé effervescent. Un


échantillon de 160 comprimés est prélevé. Pour chacun d’entre eux, on mesure la quantité de
bicarbonate de sodium. En termes de classes-effectifs, les résultats sont les suivants :

Classes [1610, 1615[ [1615, 1620[ [1620, 1625[ [1625, 1630[ [1630, 1635[

Effectifs 6 9 46 78 21

Soient μ la teneur moyenne inconnue et σ l’écart-type inconnu de la teneur en bicarbonate de


sodium d’un comprimé effervescent.

1. Donner une estimation ponctuelle de μ et une estimation ponctuelle de σ.


2. Donner un intervalle de confiance pour μ au niveau 95%, en justifiant.

Exercice 2 : On s’intéresse à la proportion des individus qui vont au moins une fois au cinéma chaque
mois, notée p. Sur 13 individus choisis au hasard, 8 déclarent aller au cinéma au moins une fois au
cinéma chaque mois.

1. Donner l’intervalle de confiance binomial pour p au niveau 95%.

Exercice 3 : Une entreprise fabrique des transistors utilisés dans des autoradios. Un contrôle régulier
est effectué à l’aide d’un appareil électronique permettant de détecter d’une façon automatique les
transistors défectueux. Le processus de fabrication produit habituellement 2% de transistors
défectueux. Un récent contrôle de 300 transistors donne 11 transistors défectueux.

1. Peut-on conclure, avec moins de 1 chance sur 100 de se tromper, que ce pourcentage est
anormalement élevé ?

Exercice 4 : Dans une entreprise, on demande à 200 salariés choisis au hasard s’ils sont satisfaits ou
non de leur condition de travail. Deux mois après la création d’une salle de pause moderne, on
redemande à ces mêmes 200 salariés s’ils sont satisfaits ou non de leur condition de travail. Les
résultats, en termes d’effectifs, sont les suivants:

1. Peut-on considérer, avec un faible risque de se tromper, que les salariés perçoivent un réel

changement ?
Exercice 5 : Les spécifications d’un certain médicament indiquent que chaque comprimé doit
contenir 2.5 grammes de substance active. Lors d’une étude, 100 comprimés sont choisis au hasard
dans la production, puis analysés. La moyenne des mesures est de 2.65 grammes de substance active
et l’écart-type corrigé des mesures est de 0.35 grammes. Peut-on dire, avec un faible risque de se
tromper, que le médicament ne respecte pas les spécifications ? (On suppose que la substance active
d’un médicament peut être modélisée par une var suivant une loi normale).

Exercice 6 : Souhaitant renouveler son stock, une entreprise commerciale s’intéresse à deux
fabrications différentes d’ampoules électriques, A et B. Sur un échantillon de 105 ampoules de type
A, la moyenne des durées de vie est de 1185 heures et l’écart-type corrigé des durées de vie est de
91 heures. De même, sur un échantillon de 80 ampoules de types B, la moyenne des durées de vie
est de 1235 heures et l’écart-type corrigé des durées de vie est de 115 heures. Y a-t-il une différence
significative des durées de vie moyennes des ampoules selon les types de fabrication ?

Exercice 7 : Lors d’une enquête sur la durée de sommeil des enfants de 2 à 3 ans dans une région, on
a trouvé une moyenne du temps de sommeil par nuit égal à 10.2 heures dans un groupe de 40
enfants. L’écart-type s est de 2.1 heures. La moyenne attendue de sommeil est de11.7 heures chez
les enfants de cet âge.

1. Les enfants examinés dorment-ils autant que ceux de la population ? (𝛼 = 0.05).


2. Les enfants examinés ont-ils une durée de sommeil inférieure à la durée de sommeil des
enfants de la population d’étude ? (𝛼 = 0.05).

Exercice 8 : On teste deux traitements anticancéreux A et B sur deux populations de patients PA et

PB (de même taille nA = nB = 50). L’efficacité d’un traitement est évaluée par l’éventuelle diminution
de la taille de la lésion tumorale, estimée par l’imagerie médicale, après un an de traitement. Pour la
population soumise au traitement A, on observe une diminution de la taille des tumeurs dans 27 cas
sur 50 et pour le traitement B, dans 18 cas.

1. Peut-on conclure à une différence d’effet des deux traitements (au seuil de 5%) ?
2. Peut-on conclure que le traitement A est plus efficace que le traitement B (𝛼 = 0.05) ?

Exercice 9 : Lors d’une expérience pédagogique, on s’intéresse à l’effet comparé de deux pédagogies
des mathématiques chez deux groupes de 10 sujets :

– pédagogie traditionnelle (p1)

– pédagogie moderne (p2)

On note la performance à une épreuve de combinatoire.


1. Vérifier que les paramètres des deux échantillons sont donnés par :

2. Avant d’appliquer un test de comparaison de moyennes, on veut s’assurer que l’on peut
supposer les variances égales dans les populations parentes. Procéder à un test de
comparaison de variances permettant de s’en assurer.

Exercice 9 : Un organisme de certification souhaite établir des coefficients de fidélité pour la quantité
de glucosinolate exprimée en micromoles par gramme contenue dans le Colza. Il fait appel à 5
laboratoires différents : L1, L2, L3, L4 et L5. Les résultats sont :

On suppose que, pour tout i ∈ {1, . . . , 5}, la quantité de glucosinolate en micromoles par gramme
contenue dans le Colza pour le laboratoire Li peut être modélisée par une var Xi suivant la loi
normale N (μi, σ2), avec μi et σ inconnus. Le tableau ANOVA, incomplet, est reproduit ci-dessous :

1. Reproduire et compléter les cases nécessaires de ce tableau.


2. Est-ce que les laboratoires trouvent, en moyenne, des résultats significativement différents ?
3. Peut-on affirmer que, en moyenne, les résultats de L2 et L4 diffèrent significativement ?
Exercice 10 : On souhaite expliquer le temps en minutes (variable Y ) qu’un employé met pour

approvisionner un réseau de distributeurs de boissons à partir du nombre de caisses de

bouteilles à charger (variable X1) et de la distance parcourue en mètres (variable X2). On

adopte le modèle Y = β0 + β1X1 + β2X2 + ε.

1. Décrire brièvement l’enjeu des commandes R suivantes :

w = read.table("https://chesneau.users.lmno.cnrs.fr/boisson.txt", header= T)

attach(w)

pairs(w)

2. Décrire brièvement l’enjeu des commandes R suivantes :

reg = lm(Y ~ X1 + X2)

summary(reg)

Cela renvoie :

Estimate Std. Error t value Pr(>|t|)

(Intercept) 2.3412 1.0967 2.13 0.0442 ∗

X1 1.6159 0.1707 9.46 0.0000 ∗ ∗ ∗

X2 0.0144 0.0036 3.98 0.0006 ∗ ∗ ∗

Residual standard error: 3.259 on 22 degrees of freedom

Multiple R-squared: 0.9596, Adjusted R-squared: 0.9559

F-statistic: 261.2 on 2 and 22 DF, p-value: 4.687e-16

3. Commenter la qualité du modèle.


4. Commenter la commande R suivante :

predict(reg, data.frame(X1 = 5, X2 = 278))

Cela renvoie 14.41975.

5. Commenter la commande R suivante :

confint(reg, level = 0.95)

Cela renvoie :
2.5 % 97.5 %
(Intercept) 0.066751987 4.61571030
X1 1.261824662 1.96998976
X2 0.006891745 0.02187791
6. Commenter la commande R suivante :
predict(reg, data.frame(X1 = 3, X2 = 431), interval = "confidence")
Cela renvoie :
Fit lwr upr
13.38881 10.82736 15.95026
7. Commenter les commandes R suivantes :
e = residuals(reg)
plot(e)

Vous aimerez peut-être aussi