Vous êtes sur la page 1sur 2

REVISION STATISTIQUE –LOGICIEL R-

Créer la fonction g définie par 𝐻(𝑥, 𝑦) = 𝑥 − 2𝑦

a. Créer les vecteurs u=(1,6,0) et v=(0,4,7,-1)

b. Créer le tableau A qui résulte du croisement de u et v par le biais de la fonction H

2 c. Quelle est la différence entre les deux instructions :


3 > rep(c(2,3,6),8) et> rep(c(2,3,6),c(8,8,8))
6 d. Soit l’instruction : >plot(X,Y). Réécrire l’instruction en demandant de marquer les points par
« triangle », et en utilisant la couleur «verte » . On donne
2
3 >
6

2 plot (X,Y,pch=2,col="green")
3
6
e. x=factor(c(.,.,.),levels=1:2,labels=c("M1","M2"))
y=factor(c(.,.,.),levels=1:3,labels=c("P","M","G"))
8fois chisq.test(x,y)
e. Soit X la variable « machine de fabrication » d’une pièce et Y la variable qualitative taille ayant 3
modalités P (pour petit) M (pour moyen ) et G (pour grand). Ecrire les instructions qui permettent de
tester la relation entre X et Y. d’abord vous devez préciser le test et son objectif.
f. Il s’agit du test : Son objectif est : Les instructions :
g. Détecter puis corriger les erreurs dans les instructions qui suivent :
Instruction Erreurs Instruction corrigée
>x=c(1,4,3,15)
>y=c(2,51,623) (x,y)
>data=data.frame(X,y)

On considère la variable taille


observée sur 9 individus et on
obtient le taille=factor(c
vecteur(P,M,G,M,P,G,M,P,G) (1,4,6,4,1,6,4,1,6),levels=c
On code P « 1 »,G « 6 » et (1,4,6),labels=c("p","M","G")
M«4»
>taille=factor(c(1,6,4),levels=1 :6,
labels=c(« P», « M », « G »)
>library(gmodels)
>chisq.test(z,t)

II Nous souhaitons tester l’efficacité d’une formation dans un domaine donné. Pour cela, nous comparons deux
échantillons de personnes du niveau de connaissance requis pour accéder à la formation. Le premier échantillon
(1) est constitué de 220. personnes n’ayant pas subi la formation, le deuxième (2) de 210 personnes venant de
la terminer. Chaque échantillon des populations avec ou sans formation, est soumis au même test. Les notes
moyennes respectives obtenues sont 13,4 et 14,6 estimation de mu 2
Les résultats sont les suivants :
estimation de mu 1
Note 13 14 13.5 15 12.5 16 15
Echantillon1

Nombre d’étudiants
40 20 50 40 60 3 7

1
b..x=rep(c(13,14,13.5,15,12.5,16,15),c(40,20,50,...7)) p-value < 1% au risque 1 % de se tromper on rejette H0 et on accepte
y=rep(c(15,14,..,13),c(50,..,7)) Ha
t.test(X,Y,alternative=c("less"),var.equal=TRUE)
Note 15 14 16 13.5 14.5 15.5 13

Echantillon2
Nombre d’étudiants
50 30 3 20 60 40 7

X=note sans formation


Y=note avec formation
a. Formuler le problème. De quel test s’agit-il ? H0:mu1=mu2
test d homogénéité
Ha:mu1<mu2
b. Rédiger l’instruction qui permet d’effectuer le test. Peut-on confirmer, au risque 1% , que la formation
est efficace, justifier. On donne la p-value < 2.2e-16(VOUS DEVEZ D’ABORD INTRODUIRE LES
p.value < 5% au
risque de se
VARIABLES)
tromperIII,on Dans une population on veut comparer le taux moyen de cholestérol et celui de glycémie. On note X le taux
conserve Ho etdeoncholestérol et Y celui de glycémie. On veut tester si les deux moyennes sont différentes.
rejette Ha c est que
les deux taux sonta. Formuler le problème. De quel test s’agit-il ?
les meme de risque b. Rédiger l’instruction qui permet d’effectuer le test. Peut-on confirmer, au risque 5% , que les 2 taux
5% de se tromper
sont différents, justifier. On donne la p-value = 0.6 t.test(x,y,paired =TRUE)) a.x=taux de chol
IV Compléter les instructions pour obtenir le graphe suivant y=taux de gly
H0=mu1=mu2
Ha=mu1#mu2
il s agit de test
split.screen(c(2,2)) t-apparie
screen(1)
plot(x,z)
screen(2)
split.screen(c(1,2))
screen(3)
barplot(table(y))
screen(4)
hist(x)
screen(5)
hist(z)
screen(6)
boxplot(x)

Instruction :

x=rnorm(100)

z=rnorm(100,2,1)

y=rbinom(100,3,0.4)

V. On considère deux variables X et Y, Le but étant d’étudier la relation entre ces dernières .

X 0.6 2.32 -1.16 3.07 1.77 -2.35 1.82 -3.23 -0.61 0.81
Y 0.02 -6.67 3.58 -6.48 -4.01 4.28 -4.46 6.18 2.31 -0.26

1. De quel test s’agit-il ? Formuler les hypothèses.(préciser le type de la relation qu’on cherche à détecter)

2. Ecrire l’instruction qui permet de réaliser ce test (VOUS DEVEZ D’ABORD SAISIR LES VARIABLES)

3. Commenter la sortie R :
t = -11.87, df = 8, p-value = 2.329e-06 1.testde correlationn
alternative hypothesis: true correlation is not equal to 0 H0:X et Y non correlees
95 percent confidence interval: Ha:XetY correles
-0.9937444 -0.8854716
sample estimates: 2. X= c(0.6,....,0,81)
cor Y=c(0.02,.....,-0,26)
-0.9727654 cor.test(x,y)
estimation de coefficient con -0,97,son intervalle de confience est [-0,99,-0,89]
4. Interpréter la valeur du cor p.valur 2,329*10**6 <5%
on rejette Ho et on accepte Ha au risque de 5% de se tromper
2
97%de variation de y sont controlees par x avec un lien qui est negatif

Vous aimerez peut-être aussi