Vous êtes sur la page 1sur 8

Devoir

d’analyse de
données
Cours dirigé par : M NIAMSI EMALIO Yannick

Rédigée par : TIMAMO Viorika


Shany Marion
ETUDIANTE EN 4EME ANNÉE option ISI (Informatique et
système d’information)
Table des matières
I. Comparaison de deux moyennes .................................................................... 2

a) Analyse de la variable TAS ......................................................................... 2

b) Analyse de sous-groupes ............................................................................. 2

c) Hypothèses ................................................................................................... 3

d) Prédictions.................................................................................................... 3

e) Confrontation : test de Student .................................................................... 3

f) Interprétation ................................................................................................ 3

II. Comparaison de deux pourcentages observés ................................................ 4

a) Hypothèses ................................................................................................... 4

b) Prédictions.................................................................................................... 4

c) Confrontation ............................................................................................... 4

d) Interprétation ................................................................................................ 4

III. Corrélation ................................................................................................... 5

a) Hypothèses ................................................................................................... 5

b) Prédictions.................................................................................................... 5

c) Confrontation ............................................................................................... 5

d) Interprétation ................................................................................................ 5

IV. Comparaison de plusieurs pourcentages observés....................................... 6

a) Hypothèses ................................................................................................... 6

b) Prédictions.................................................................................................... 6

c) Confrontation ............................................................................................... 6

d) Interprétation ................................................................................................ 6

1
I. Comparaison de deux moyennes
a) Analyse de la variable TAS
setwd("C:/Users/timam/Documents/Inge 4/Analyse de données")

tabac = read.csv2("TABAC.csv", header = T)

attach(tabac)

 Moyenne globale de la TAS

mean(TAS)

 Variance globale de la TAS

var(TAS)

 Graphiques

hist(TAS)

boxplot(TAS, horizontal = T)

b) Analyse de sous-groupes
Femme VS Homme

mean(TAS[SEXE == 0])

var(TAS[SEXE == 0])

hist(TAS[SEXE == 0])

boxplot(TAS[SEXE == 0])

mean(TAS[SEXE == 1])

var(TAS[SEXE == 1])

2
hist(TAS[SEXE == 1])

boxplot(TAS[SEXE == 1])

c) Hypothèses
H0 : Il n’y a pas de différence en moyenne.

H1 : Il existe une différence de TAS moyenne entre les hommes et les femmes.

d) Prédictions
o Normalité

qqnorm(TAS[SEXE == 0])

qqnorm(TAS[SEXE == 1])

o Indépendance des individus


o Egalité des variances

var.test(TAS[SEXE == 0], TAS[SEXE == 1])

e) Confrontation : test de Student


t.test(TAS[SEXE == 0], TAS[SEXE == 1],var.equal = TRUE)

f) Interprétation
o P<0.05
o Test significatif
o Non rejette H0
o Il y a une différence entre les deux groupes

3
II. Comparaison de deux pourcentages observés
a) Hypothèses
H0 : Pas de différence entre les hommes et les femmes

H1 : Différence entre le pourcentage de cancer des hommes et des femmes

b) Prédictions
Sous H0 et si les conditions d’applications sont respectées

table(SEXE, K)

NK K Totaux Pourcentages
F 8 8 16 50%
8,5 7,5
H 9 7 16 50%
8,5 7,5
Totaux 17 15 32
Pourcentages 53% 47% 100%

Conditions

o Cij>5
o Indépendance des individus

c) Confrontation
chisq.test(SEXE, K, correct=FALSE)

d) Interprétation
o p>0.05

4
o Test non significatif
o Non rejet de H0
o Pas de mise en évidence de la différence entre les deux pourcentages de
cancer.

III. Corrélation
a) Hypothèses
H0 : ρ=0, pas de lien entre TAS et DOSAGE

H1 : ρ != 0, lien entre TAS et DOSAGE

b) Prédictions
Conditions d’applications

o Relation linéaire entre X et Y


o Loi conditionnelle normale
o Variance conditionnelle constante
o Independence des individus

c) Confrontation
cor.test(TAS, DOSAGE)

d) Interprétation
o p<0.05
o Test significatif
o Rejet de H0
o Lien entre le TAS et le DOSAGE

5
o Lorsque le DOSAGE augmente, le TAS augmente (r=0.83 [0.67 ; 0.91])

IV. Comparaison de plusieurs pourcentages observés


a) Hypothèses
H0 : Il n’y a pas de différence entre les pourcentages.

H1 : Il y a au moins une différence entre les pourcentages.

b) Prédictions
Sous H0 et si les conditions d’application sont respectées

table(SEXE, ATCD)

ATCD 0 ATCD 1 ATCD 2 Totaux


F 6 6 4 16
H 4 4 8 16
Totaux 10 10 12 32
Conditions

o Cij>5
o Indépendance des individus

c) Confrontation
chisq.test(SEXE,ATCD,correct = FALSE)

d) Interprétation
o p>0.05
o Test non significatif
o Non rejet de H0
6
o Pas de différence entre les trois pourcentages

Vous aimerez peut-être aussi