Vous êtes sur la page 1sur 69

Chapitre 2: ANOVA et regression´

Caroline Verhoeven

Table des matieres`

1 Introduction 2 ANOVA ANOVA a` 1 facteur ANOVA a` mesures rep´ et´ ees´ ANOVA
1
Introduction
2
ANOVA
ANOVA a` 1 facteur
ANOVA a` mesures rep´ et´ ees´
ANOVA a` 2 facteurs
3
3

Regression´

Regression´

lineaire´

simple

Regression´

multiple

Regression´

logistique

eamerlogo

1. Introduction

Utilisation de l’ANOVA et de la regression´

Dans les etudes´

on a

de l’ANOVA et de la regression´ Dans les etudes´ on a des donnees´ imposees´ par les

des donnees´

imposees´

par les chercheurs (predicteurs)´

des donnees qui peuvent etreˆ (reponses)´des donnees´ imposees´ par les chercheurs (predicteurs)´ observees´ comme reactions´ Quand utiliser l’ ANOVA et

observees´

comme reactions´

Quand utiliser l’ ANOVA et la regression´

Modele`

Reponse´

Predicteur´

ANOVA a` 1 facteur ANOVA a` 2 facteur Regression´ simple Regresion´ multiple Regression´ logistique

1 quantitative

1 qualitative

1 quantitative

2 qualitative

1 quantitative

1 quantitative

1 quantitative

2 (ou plus) quantitatives

1 qualitative

1 (ou plus) quantitative

eamerlogo

ANOVA a` 1 facteur

2. ANOVA

1. ANOVA a` 1 facteur

On veut comparer la moyenne de plus de 2 groupes Exemple : On veut comparer l’effet d’un traitement 1, un traitement 2 et un placebo

H 0 : µ 1 = µ 2 = · · · = µ k 0 : µ 1 = µ 2 = · · · = µ k

H a : une des moyennes est differente´ a : une des moyennes est differente´

eamerlogo

ANOVA a` 1 facteur

2. ANOVA

1. ANOVA a` 1 facteur

On veut comparer la moyenne de plus de 2 groupes Exemple : On veut comparer l’effet d’un traitement 1, un traitement 2 et un placebo

H 0 : µ 1 = µ 2 = · · · = µ k 0 : µ 1 = µ 2 = · · · = µ k

H a : une des moyennes est differente´ a : une des moyennes est differente´

Principe :

Comparer le variation des moyennes par groupes au variation dans chaque groupe

En SPSS : Analyze Compare Means One-Way ANOVA

eamerlogo

Conditions

2. ANOVA

1. ANOVA a` 1 facteur

Les echantillons´doivent etreˆ aleatoires´ simples

doivent etreˆ

aleatoires´

simples

Les echantillons´doivent etreˆ independants´

doivent etreˆ

independants´

Il faut que σ 1 = σ 2 = · · · = σ k Pour verifier´ Levene σ 1 = σ 2 = · · · = σ k Pour verifier´ Levene

Il faut que la variable soit distribuee´ populations= σ 2 = · · · = σ k Pour verifier´ Levene cela, on a

cela, on a le test de

normalement pour les k

eamerlogo

Test preliminaire´

2. ANOVA

1. ANOVA a` 1 facteur

: le test de Levene

2. ANOVA 1. ANOVA a` 1 facteur : le test de Levene Les variances sont-elles les

Les variances sont-elles les memesˆ

pour tous les groupes?

eamerlogo

Test preliminaire´

2. ANOVA

1. ANOVA a` 1 facteur

: le test de Levene

Les variances sont-elles les memesˆ2. ANOVA 1. ANOVA a` 1 facteur : le test de Levene Pour y repondre´ :

Pour y repondre´: le test de Levene Les variances sont-elles les memesˆ : test de Levene : pour

: test de Levene :

pour tous les groupes?

H 0 : 0 :

H a : Il y a au moins 1 variance qui est differentes´ a : Il y a au moins 1 variance qui est differentes´

σ 1 = σ 2 = · · · = σ k

eamerlogo

Test preliminaire´

2. ANOVA

1. ANOVA a` 1 facteur

: le test de Levene

Les variances sont-elles les memesˆ2. ANOVA 1. ANOVA a` 1 facteur : le test de Levene Pour y repondre´ :

Pour y repondre´: le test de Levene Les variances sont-elles les memesˆ : test de Levene : pour

: test de Levene :

pour tous les groupes?

H 0 : σ 1 = σ 2 = · · · = σ k

H

0

:

σ 1 = σ 2 = · · · = σ k

a : Il y a au moins 1 variance qui est differentes´ H

a : Il y a au moins 1 variance qui est differentes´

H

p > 0 , 05 : NR H 0

p

> 0, 05 : NRH 0

p < 0 , 05 : R H 0

p

< 0, 05 : RH 0

eamerlogo

Test preliminaire´

2. ANOVA

1. ANOVA a` 1 facteur

: le test de Levene

Les variances sont-elles les memesˆ2. ANOVA 1. ANOVA a` 1 facteur : le test de Levene Pour y repondre´ :

Pour y repondre´: le test de Levene Les variances sont-elles les memesˆ : test de Levene : pour

: test de Levene :

pour tous les groupes?

H 0 : σ 1 = σ 2 = · · · = σ k

H

0

:

σ 1 = σ 2 = · · · = σ k

a : Il y a au moins 1 variance qui est differentes´ H

a : Il y a au moins 1 variance qui est differentes´

H

p > 0 , 05 : NR H 0

p

> 0, 05 : NRH 0

p < 0 , 05 : R H 0

p

< 0, 05 : RH 0

En SPSS : Dans le menu ANOVA → Options → Homogeneity of variance test Dans le menu ANOVA Options Homogeneity of variance test

eamerlogo

2. ANOVA

1. ANOVA a` 1 facteur

Si RH 0 pour le test de Levene

1. ANOVA a` 1 facteur Si R H 0 pour le test de Levene eamerlogo Que

eamerlogo

Que faut-il faire si RH 0 pour le test de Levene?

2. ANOVA

1. ANOVA a` 1 facteur

Si RH 0 pour le test de Levene

Que faut-il faire si RH 0 pour le test de Levene? H 0 pour le test de Levene?

Une solution : test de Welchtest de Levene Que faut-il faire si R H 0 pour le test de Levene? eamerlogo

eamerlogo

2. ANOVA

1. ANOVA a` 1 facteur

Si RH 0 pour le test de Levene

Que faut-il faire si RH 0 pour le test de Levene? H 0 pour le test de Levene?

Une solution : test de WelchQue faut-il faire si R H 0 pour le test de Levene? En SPSS : Dans

En SPSS : Dans le menu ANOVA → Options → Welch Dans le menu ANOVA Options Welch

eamerlogo

Apres`

l’ANOVA

2. ANOVA

1. ANOVA a` 1 facteur

L’ANOVA ne permet de detecter´

memesˆ

Comment savoir lesquelles sont differentes?´

que si toutes les moyennes sont les

ou si au moins une est differente.´

eamerlogo

Apres`

l’ANOVA

2. ANOVA

1. ANOVA a` 1 facteur

L’ANOVA ne permet de detecter´

memesˆ

Comment savoir lesquelles sont differentes?´

que si toutes les moyennes sont les

ou si au moins une est differente.´

Si on ne rejette pas H 0 : on peut s’arreterˆ H 0 : on peut s’arreterˆ

Si on rejette H 0 : Il y a differentes´ multiples) : H 0 : Il y a differentes´ multiples) :

possibilites´

(tests de comparaison

eamerlogo

Apres`

l’ANOVA

2. ANOVA

1. ANOVA a` 1 facteur

L’ANOVA ne permet de detecter´

memesˆ

Comment savoir lesquelles sont differentes?´

que si toutes les moyennes sont les

ou si au moins une est differente.´

Si on ne rejette pas H 0 : on peut s’arreterˆ H 0 : on peut s’arreterˆ

Si on rejette H 0 : Il y a differentes´ multiples) : H 0 : Il y a differentes´ multiples) :

possibilites´

Bonferroni

Bonferroni

Tukey

Tukey

Dunnett

Dunnett

Sidak

Sidak

Scheffee

Scheffee

Bonferroni Tukey Dunnett Sidak Scheffee

(tests de comparaison

eamerlogo

Apres`

l’ANOVA

2. ANOVA

1. ANOVA a` 1 facteur

L’ANOVA ne permet de detecter´

memesˆ

Comment savoir lesquelles sont differentes?´

que si toutes les moyennes sont les

ou si au moins une est differente.´

Si on ne rejette pas H 0 : on peut s’arreterˆ H 0 : on peut s’arreterˆ

Si on rejette H 0 : Il y a differentes´ multiples) : H 0 : Il y a differentes´ multiples) :

possibilites´

Bonferroni

Bonferroni

Tukey

Tukey

Dunnett

Dunnett

Sidak

Sidak

Scheffee

Scheffee

Bonferroni Tukey Dunnett Sidak Scheffee

(tests de comparaison

En SPSS : Dans le menu ANOVA → Post Hoc Dans le menu ANOVA Post Hoc

eamerlogo

Principe

2. ANOVA

Principe 2. ANOVA On mesures k fois les memesˆ eamerlogo 2. ANOVA a` mesures rep´ et´

On mesures k fois les memesˆ

eamerlogo

2. ANOVA a` mesures rep´ et´ ees´

sujets sous des conditions differentes´

Principe

2. ANOVA

2. ANOVA a` mesures rep´ et´ ees´

On mesures k fois les memesˆ k fois les memesˆ

Gen´ eralisation´a` mesures rep´ et´ ees´ On mesures k fois les memesˆ sujets sous des conditions differentes´

sujets sous des conditions differentes´

apparies´

du test t pour 2 echantillons´

eamerlogo

Principe

2. ANOVA

2. ANOVA a` mesures rep´ et´ ees´

On mesures k fois les memesˆ sujets sous des conditions differentes´ k fois les memesˆ sujets sous des conditions differentes´

Gen´ eralisation´ du test t pour 2 echantillons´ apparies´ t pour 2 echantillons´ apparies´

En SPSS : Analyze → General Linear Model → Repeated Measures Analyze General Linear Model Repeated Measures

eamerlogo

2. ANOVA

Test preliminaire´

2. ANOVA Test preliminaire´ eamerlogo Les variances des differences´ memes?ˆ 2. ANOVA a` mesures rep´ et´

eamerlogo

Les variances des differences´ memes?ˆ

2. ANOVA a` mesures rep´ et´ ees´

entre 2 groupes sont-elles toutes les

Test preliminaire´

2. ANOVA

2. ANOVA a` mesures rep´ et´ ees´

Les variances des differences´ memes?ˆpreliminaire´ 2. ANOVA 2. ANOVA a` mesures rep´ et´ ees´ Pour y repondre´ entre 2 groupes

Pour y repondre´rep´ et´ ees´ Les variances des differences´ memes?ˆ entre 2 groupes sont-elles toutes les : test

entre 2 groupes sont-elles toutes les

: test de Mauchly

H 0 : les variances des differences´ 0 : les variances des differences´

H a : Il y a au moins 1 variance des differences´ a : Il y a au moins 1 variance des differences´

entre 2 groupes sont les memesˆ

qui est differentes´

eamerlogo

Test preliminaire´

2. ANOVA

2. ANOVA a` mesures rep´ et´ ees´

Les variances des differences´ memes?ˆpreliminaire´ 2. ANOVA 2. ANOVA a` mesures rep´ et´ ees´ Pour y repondre´ entre 2 groupes

Pour y repondre´rep´ et´ ees´ Les variances des differences´ memes?ˆ entre 2 groupes sont-elles toutes les : test

entre 2 groupes sont-elles toutes les

: test de Mauchly

0 : les variances des differences´ H entre 2 groupes sont les memesˆ

0 : les variances des differences´

H

entre 2 groupes sont les memesˆ

a : Il y a au moins 1 variance des differences´ H qui est differentes´

a : Il y a au moins 1 variance des differences´

H

qui est differentes´

p > 0 , 05 : NR H 0

p

> 0, 05 : NRH 0

p < 0 , 05 : R H 0

p

< 0, 05 : RH 0

eamerlogo

Test preliminaire´

2. ANOVA

2. ANOVA a` mesures rep´ et´ ees´

Les variances des differences´preliminaire´ 2. ANOVA 2. ANOVA a` mesures rep´ et´ ees´ memes?ˆ entre 2 groupes sont-elles toutes

memes?ˆ

entre 2 groupes sont-elles toutes les

Pour y repondre´differences´ memes?ˆ entre 2 groupes sont-elles toutes les : test de Mauchly 0 : les variances

: test de Mauchly

0 : les variances des differences´ H entre 2 groupes sont les memesˆ

0 : les variances des differences´

H

entre 2 groupes sont les memesˆ

a : Il y a au moins 1 variance des differences´ H qui est differentes´

a : Il y a au moins 1 variance des differences´

H

qui est differentes´

p > 0 , 05 : NR H 0

p

> 0, 05 : NRH 0

p < 0 , 05 : R H 0

p

< 0, 05 : RH 0

Si RH 0 : H 0 :

correction de Greenhouse-Geisser (plus forte): NR H 0 p < 0 , 05 : R H 0 Si R H

correction Huynh-Feldt: R H 0 Si R H 0 : correction de Greenhouse-Geisser (plus forte) eamerlogo Caroline

eamerlogo

ANOVA a` 2 facteurs

2. ANOVA

3. ANOVA a` 2 facteurs

les effets de 2 facteurs : on compare les moyennes des

populations correspondant a` toutes les combinaisons de tous les niveaux de chacun de ces 2 facteurs. Exemple : Etude de la sensibilite´ aux effets de l’insuline chez des femmes en fonction de leur poids (normal ou surpoids) et selon qu’elles sont en hyperthyro¨ıdie ou non.

On veut evaluer´

eamerlogo

ANOVA a` 2 facteurs

2. ANOVA

3. ANOVA a` 2 facteurs

les effets de 2 facteurs : on compare les moyennes des

populations correspondant a` toutes les combinaisons de tous les niveaux de chacun de ces 2 facteurs. Exemple : Etude de la sensibilite´ aux effets de l’insuline chez des femmes en fonction de leur poids (normal ou surpoids) et selon qu’elles sont en hyperthyro¨ıdie ou non. Plusieurs facteurs possibilite´ d’interaction entre ces facteurs

On veut evaluer´

eamerlogo

ANOVA a` 2 facteurs

2. ANOVA

3. ANOVA a` 2 facteurs

les effets de 2 facteurs : on compare les moyennes des

populations correspondant a` toutes les combinaisons de tous les niveaux de chacun de ces 2 facteurs. Exemple : Etude de la sensibilite´ aux effets de l’insuline chez des femmes en fonction de leur poids (normal ou surpoids) et selon qu’elles sont en hyperthyro¨ıdie ou non. Plusieurs facteurs possibilite´ d’interaction entre ces facteurs

Formulation des hypotheses`

On veut evaluer´

nulles :

H 0 : Le poids n’a pas d’influence sur la sensibilite´ a` l’insuline 0 : Le poids n’a pas d’influence sur la sensibilite´ a` l’insuline

H 0 : La thyro¨ıde n’a pas d’influence sur la sensibilite´ a` l’insuline 0 : La thyro¨ıde n’a pas d’influence sur la sensibilite´ a` l’insuline

H 0 : L’effet du poids sur la sensibilite´ a` l’insuline ne depend´ thyro¨ıde 0 : L’effet du poids sur la sensibilite´ a` l’insuline ne depend´ thyro¨ıde

pas de la

eamerlogo

ANOVA a` 2 facteurs

2. ANOVA

3. ANOVA a` 2 facteurs

les effets de 2 facteurs : on compare les moyennes des

populations correspondant a` toutes les combinaisons de tous les niveaux de chacun de ces 2 facteurs. Exemple : Etude de la sensibilite´ aux effets de l’insuline chez des femmes en fonction de leur poids (normal ou surpoids) et selon qu’elles sont en hyperthyro¨ıdie ou non. Plusieurs facteurs possibilite´ d’interaction entre ces facteurs

Formulation des hypotheses`

On veut evaluer´

nulles :

H 0 : Le poids n’a pas d’influence sur la sensibilite´ a` l’insuline 0 : Le poids n’a pas d’influence sur la sensibilite´ a` l’insuline

H 0 : La thyro¨ıde n’a pas d’influence sur la sensibilite´ a` l’insuline 0 : La thyro¨ıde n’a pas d’influence sur la sensibilite´ a` l’insuline

H 0 : L’effet du poids sur la sensibilite´ a` l’insuline ne depend´ thyro¨ıde 0 : L’effet du poids sur la sensibilite´ a` l’insuline ne depend´ thyro¨ıde

pas de la

En SPSS : Analyze General Linear Model Univariate

eamerlogo

2. ANOVA

3. ANOVA a` 2 facteurs

ANOVA a` 2 facteurs : Principe

ANOVA 3. ANOVA a` 2 facteurs ANOVA a` 2 facteurs : Principe Modele` : REPONSE =

Modele`

:

REPONSE = FACTEUR1 + FACTEUR2 + FACTEUR1 FACTEUR2

eamerlogo

2. ANOVA

3. ANOVA a` 2 facteurs

ANOVA a` 2 facteurs : Principe

ANOVA 3. ANOVA a` 2 facteurs ANOVA a` 2 facteurs : Principe Modele` : REPONSE =

Modele`

:

REPONSE = FACTEUR1 + FACTEUR2 + FACTEUR1 FACTEUR2

Dans l’exemple 4 := FACTEUR1 + FACTEUR2 + FACTEUR1 ∗ FACTEUR2 STRESS = THYRO ¨ IDE + POIDS +

STRESS = THYRO ¨ IDE + POIDS + THYRO ¨ IDE POIDS

eamerlogo

Regression´

lineaire´

3. Regression´

1. Regression´

quantitatives, predicteur´Regression´ lineaire´ 3. Regression´ 1. Regression´ x i : donnees´ quantitatives, reponse´ y i : donnees´

x i : donnees´

quantitatives, reponse´Regression´ quantitatives, predicteur´ x i : donnees´ y i : donnees´ eamerlogo lineaire´ simple Caroline

y i : donnees´

eamerlogo

lineaire´

simple

Regression´

lineaire´

3. Regression´

1. Regression´

quantitatives, predicteur´Regression´ lineaire´ 3. Regression´ 1. Regression´ x i : donnees´ quantitatives, reponse´ y i : donnees´

x i : donnees´

quantitatives, reponse´Regression´ quantitatives, predicteur´ x i : donnees´ y i : donnees´ Lien lineaire´ entre les 2

y i : donnees´

Lien lineaire´

entre les 2quantitatives, reponse´ y i : donnees´ Lien lineaire´ eamerlogo lineaire´ simple Caroline Verhoeven MEMO-I4034

eamerlogo

lineaire´

simple

Regression´

lineaire´

3. Regression´

1. Regression´

lineaire´

quantitatives, predicteur´lineaire´ 3. Regression´ 1. Regression´ lineaire´ x i : donnees´ quantitatives, reponse´ y i :

x i : donnees´

quantitatives, reponse´lineaire´ quantitatives, predicteur´ x i : donnees´ y i : donnees´ Lien lineaire´ entre les 2

y i : donnees´

Lien lineaire´

entre les 2quantitatives, reponse´ y i : donnees´ Lien lineaire´ Question : comment determiner´ la droite y =

Question : comment determiner´

la droite

y

= b 0 + b 1 x ,

b 0 ?b 1 ?

eamerlogo

simple

Regression´

lineaire´

3. Regression´

1. Regression´

lineaire´

quantitatives, predicteur´lineaire´ 3. Regression´ 1. Regression´ lineaire´ x i : donnees´ quantitatives, reponse´ y i :

x i : donnees´

quantitatives, reponse´lineaire´ quantitatives, predicteur´ x i : donnees´ y i : donnees´ Lien lineaire´ entre les 2

y i : donnees´

Lien lineaire´

entre les 2quantitatives, reponse´ y i : donnees´ Lien lineaire´ Question : comment determiner´ la droite y =

Question : comment determiner´

la droite

y

= b 0 + b 1 x ,

b 0 ?b 1 ?

Minimisation au sens des moindres carres´

:

n

i=1

2

i

d

simple

d i : distance entre les mesures et la droite

eamerlogo

Regression´

lineaire´

3. Regression´

1. Regression´

lineaire´

simple

: conditions

Regression´ 1. Regression´ lineaire´ simple : conditions Duˆ a` des erreurs de mesure ou a` des

Duˆ a` des erreurs de mesure ou a` des variabilites´

ε i : residu,´

y i = b 0 + b 1 x i + ε i

condition : ε i ∼ N (0 , σ 2 )

eamerlogo

biologique, on a

Regression´

lineaire´

3. Regression´

1. Regression´

lineaire´

simple

: conditions

Duˆ a` des erreurs de mesure ou a` des variabilites´Regression´ 1. Regression´ lineaire´ simple : conditions y i = b 0 + b 1 x

y i = b 0 + b 1 x i + ε i

ε i : residu,´

condition : ε i ∼ N (0 , σ 2 )

σ : independant´ : independant´

de x

biologique, on a

Homocedasticit´ e´ Het´ erocedasticit´ e´ 25 20 20 15 15 10 10 5 5 0
Homocedasticit´
Het´ erocedasticit´
25
20
20
15
15
10
10
5
5
0
0
0
1
2
3
4
5
0
1
2
3
4
5
Age
Age
FCM
FCM

eamerlogo

Regression´

lineaire´

3. Regression´

1. Regression´

lineaire´

simple

: conditions

Duˆ a` des erreurs de mesure ou a` des variabilites´Regression´ 1. Regression´ lineaire´ simple : conditions y i = b 0 + b 1 x

y i = b 0 + b 1 x i + ε i

ε i : residu,´

condition : ε i ∼ N (0 , σ 2 )

σ : independant´ : independant´

de x

biologique, on a

Homocedasticit´ e´ Het´ erocedasticit´ e´ 25 20 20 15 15 10 10 5 5 0
Homocedasticit´
Het´ erocedasticit´
25
20
20
15
15
10
10
5
5
0
0
0
1
2
3
4
5
0
1
2
3
4
5
Age
Age
FCM
FCM

Les mesures doivent etreˆ0 0 0 1 2 3 4 5 0 1 2 3 4 5 Age Age

eamerlogo

independantes´

3. Regression´

2. Regression´

Utilite´ de la regression´

multiple

multiple

Un variable peut dependre´

de plusieurs facteurs a` la fois.

eamerlogo

3. Regression´

2. Regression´

Utilite´ de la regression´

multiple

multiple

Un variable peut dependre´

Exemple 1

de plusieurs facteurs a` la fois.

Predire´

de son sexe

la taille d’une personne a` partir de la taille du pere,`

eamerlogo

de la mere`

et

3. Regression´

2. Regression´

Utilite´ de la regression´

multiple

multiple

Un variable peut dependre´

Exemple 1

de plusieurs facteurs a` la fois.

Predire´

la taille d’une personne a` partir de la taille du pere,`

de la mere`

et

de son sexe

But : Predire´

les valeur d’Y a` partir de plusieurs variables X 1 , X 2

., X k

eamerlogo

3. Regression´

2. Regression´

Utilite´ de la regression´

multiple

multiple

Un variable peut dependre´

Exemple 1

de plusieurs facteurs a` la fois.

Predire´

la taille d’une personne a` partir de la taille du pere,`

de la mere`

et

de son sexe

But : Predire´

les valeur d’Y a` partir de plusieurs variables X 1 , X 2

., X k

X 1 , X 2 ,

peuvent etreˆ

X k sont en gen´ eral´

nominales

eamerlogo

quantitatives ou ordinales, quelques unes

3. Regression´

2. Regression´

Utilite´ de la regression´

multiple

multiple

Un variable peut dependre´

Exemple 1

de plusieurs facteurs a` la fois.

Predire´

la taille d’une personne a` partir de la taille du pere,`

de la mere`

et

de son sexe

But : Predire´

les valeur d’Y a` partir de plusieurs variables X 1 , X 2

., X k

X 1 , X 2 ,

X k sont en gen´ eral´

peuvent etreˆ

nominales

Exemple 1

quantitatives ou ordinales, quelques unes

Le sexe est une variable nominale :

0=femmeordinales, quelques unes Le sexe est une variable nominale : 1=homme eamerlogo Caroline Verhoeven MEMO-I4034 15

1=hommeordinales, quelques unes Le sexe est une variable nominale : 0=femme eamerlogo Caroline Verhoeven MEMO-I4034 15

eamerlogo

3. Regression´

2. Regression´

Principe de la regression´

multiple

multiple

Etude du lien lineaire´

entre Y et les variables X 1 , X 2

., X k :

y = b 0 + b 1 x 1 + b 2 x 2 + · · · + b k x k .

eamerlogo

3. Regression´

2. Regression´

Principe de la regression´

multiple

multiple

Etude du lien lineaire´

entre Y et les variables X 1 , X 2

., X k :

y = b 0 + b 1 x 1 + b 2 x 2 + · · · + b k x k .

On cherche : b 0 , b 1 , b 2 ,

En SPSS : Analyze Regression Linear

, b k

eamerlogo

Les methodes´

3. Regression´

2. Regression´

pour la regression´

I

multiple

Regression´ 2. Regression´ pour la regression´ I multiple Methode´ independantes´ A utiliser si on veut determiner´

Methode´

independantes´

A utiliser si on veut determiner´

avec toutes les variables independantes´

“Enter” : Methode´

qui introduit toutes les variables

simultanement´

l’equation´

de la droite de regression´

eamerlogo

Les methodes´

3. Regression´

2. Regression´

pour la regression´

I

multiple

Regression´ 2. Regression´ pour la regression´ I multiple Methode´ independantes´ A utiliser si on veut determiner´

Methode´

independantes´

A utiliser si on veut determiner´

avec toutes les variables independantes´

Les autres methodes´

Seulement a` utiliser si on pense qu’une des variable est plus importante que les autres

“Enter” : Methode´

qui introduit toutes les variables

simultanement´

l’equation´

de la droite de regression´

sont des methodes´

hierarchiques.´

eamerlogo

Les methodes´

3. Regression´

2. Regression´

multiple

pour la regression´

II

2. Regression´ multiple pour la regression´ II Methode´ “Forward” : Introduction d’une variable

Methode´

“Forward” :

Introduction d’une variable independante´multiple pour la regression´ II Methode´ “Forward” : L’ordre est determin´ dependante´ a` la fois e´

L’ordre est determin´ dependante´“Forward” : Introduction d’une variable independante´ a` la fois e´ en fonction de la correlation´ avec

a` la fois

e´ en fonction de la correlation´

avec la variable

la fois e´ en fonction de la correlation´ avec la variable S’il n’ameliore´ pas le modele`

S’il n’ameliore´

pas le modele`

significativement, elle est elimin´

ee´

eamerlogo

Les methodes´

3. Regression´

2. Regression´

multiple

pour la regression´

II

2. Regression´ multiple pour la regression´ II Methode´ “Forward” : Introduction d’une variable

2. Regression´ multiple pour la regression´ II Methode´ “Forward” : Introduction d’une variable

Methode´

“Forward” :

Introduction d’une variable independante´multiple pour la regression´ II Methode´ “Forward” : L’ordre est determin´ dependante´ a` la fois e´

L’ordre est determin´ dependante´“Forward” : Introduction d’une variable independante´ a` la fois e´ en fonction de la correlation´ avec

a` la fois

e´ en fonction de la correlation´

avec la variable

la fois e´ en fonction de la correlation´ avec la variable S’il n’ameliore´ pas le modele`

S’il n’ameliore´

pas le modele`

significativement, elle est elimin´

ee´

Methode´

“Backward”

On introduit toutes les variableselle est elimin´ ee´ Methode´ “Backward” On retire la variable independante´ Si cela affaiblit

On retire la variable independante´Methode´ “Backward” On introduit toutes les variables Si cela affaiblit significativement le modele` la plus

Si cela affaiblit significativement le modele`toutes les variables On retire la variable independante´ la plus faible elle est reintroduite´ On rep´

la plus faible

elle est reintroduite´

le modele` la plus faible elle est reintroduite´ On rep´ ete` la procedure´ jusqu’a` ce que

On rep´ ete`

la procedure´

jusqu’a` ce que l’on n’a que les variables utiles

eamerlogo

Les methodes´

3. Regression´

2. Regression´

multiple

pour la regression´

II

2. Regression´ multiple pour la regression´ II eamerlogo Methode´ “Forward” : Introduction d’une

2. Regression´ multiple pour la regression´ II eamerlogo Methode´ “Forward” : Introduction d’une

2. Regression´ multiple pour la regression´ II eamerlogo Methode´ “Forward” : Introduction d’une

eamerlogo

Methode´

“Forward” :

Introduction d’une variable independante´pour la regression´ II eamerlogo Methode´ “Forward” : L’ordre est determin´ dependante´ a` la fois e´

L’ordre est determin´ dependante´“Forward” : Introduction d’une variable independante´ a` la fois e´ en fonction de la correlation´ avec

a` la fois

e´ en fonction de la correlation´

avec la variable

la fois e´ en fonction de la correlation´ avec la variable S’il n’ameliore´ pas le modele`

S’il n’ameliore´

pas le modele`

significativement, elle est elimin´

ee´

Methode´

“Backward”

On introduit toutes les variableselle est elimin´ ee´ Methode´ “Backward” On retire la variable independante´ Si cela affaiblit

On retire la variable independante´Methode´ “Backward” On introduit toutes les variables Si cela affaiblit significativement le modele` la plus

Si cela affaiblit significativement le modele`toutes les variables On retire la variable independante´ la plus faible elle est reintroduite´ On rep´

la plus faible

elle est reintroduite´

le modele` la plus faible elle est reintroduite´ On rep´ ete` la procedure´ jusqu’a` ce que

On rep´ ete`

la procedure´

jusqu’a` ce que l’on n’a que les variables utiles

Methode´

“Stepwize”

Les variables independantes´n’a que les variables utiles Methode´ “Stepwize” On teste si la nouvelle est significative, et on

On teste si la nouvelle est significative, et on refait un test sur lesMethode´ “Stepwize” Les variables independantes´ sont introduites une a` une autres Les variables non

sont introduites une a` une

autres

Les variables non significatives son elimin´et on refait un test sur les sont introduites une a` une autres ees´ Caroline Verhoeven

ees´

3. Regression´

2. Regression´

multiple

Conditions pour la regression´

multiple

1
1

Les memesˆ

que la regression´

simple

2
2

Il existe un lien lineaire´

entre Y et les X i

3
3

Pas de multi-colinearit´

e´ : Il ne peut pas y avoir une grande

correlation´

entre les X i

4
4

Il faut beaucoup de sujets dan l’echantillon.´ Minimum : 5k , k : le nombre de variables predictives´

eamerlogo

Regression´

3. Regression´

logistique

3. Regression´

logistique

x i : donnees´ i : donnees´

quantitatives, predicteur´

logistique x i : donnees´ quantitatives, predicteur´ Reponse´ : donnees´ qualitatives avec 2 valeurs possibles

Reponse´

: donnees´

qualitatives avec 2 valeurs possibles

Pour chaque x i une proportion p i de succes x i une proportion p i de succes

eamerlogo

Regression´

3. Regression´

logistique

3. Regression´

logistique

x i : donnees´ i : donnees´

quantitatives, predicteur´

logistique x i : donnees´ quantitatives, predicteur´ Reponse´ : donnees´ qualitatives avec 2 valeurs possibles

Reponse´

: donnees´

qualitatives avec 2 valeurs possibles

Pour chaque x i une proportion p i de succes x i une proportion p i de succes

Si il y a un lien lineaire´

eamerlogo

logit(p i ) = ln

p

i

p i

1

Regression´

3. Regression´

logistique

3. Regression´

logistique

x i : donnees´ i : donnees´

quantitatives, predicteur´

logistique x i : donnees´ quantitatives, predicteur´ Reponse´ : donnees´ qualitatives avec 2 valeurs possibles

Reponse´

: donnees´

qualitatives avec 2 valeurs possibles

Pour chaque x i une proportion p i de succes x i une proportion p i de succes

logit(p i ) = ln

p

i

p i

1

Si il y a un lien lineaire´ Question : comment determiner´

la droite?

logit(p) = ln

p

p = b 0 + b 1 x

1

eamerlogo

Regression´

3. Regression´

logistique

3. Regression´

logistique

x i : donnees´ i : donnees´

quantitatives, predicteur´

logistique x i : donnees´ quantitatives, predicteur´ Reponse´ : donnees´ qualitatives avec 2 valeurs possibles

Reponse´

: donnees´

qualitatives avec 2 valeurs possibles

Pour chaque x i une proportion p i de succes x i une proportion p i de succes

logit(p i ) = ln

p

i

p i

1

Si il y a un lien lineaire´ Question : comment determiner´

la droite?

logit(p) = ln

p

p = b 0 + b 1 x

1

En SPSS : Analyze Regression Binary Logistic

eamerlogo

Exercice 1

4. Exercices

Ouvrir le fichier film.xls. Determiner´ l’equation´ permettant des recettes d’un film hollywoodien tire´ d’un livre sur base de :

d’un film hollywoodien tire´ d’un livre sur base de : Coutsˆ de production Coutsˆ publicitaires Recettes

Coutsˆ

de production

Coutsˆ publicitairestire´ d’un livre sur base de : Coutsˆ de production Recettes du livres On considere` 10

Recettes du livressur base de : Coutsˆ de production Coutsˆ publicitaires On considere` 10 films. eamerlogo Caroline Verhoeven

On considere` 10 films.

eamerlogo

Coutsˆ publicitaires Recettes du livres On considere` 10 films. eamerlogo Caroline Verhoeven MEMO-I4034 21 / 31

Exercice 2

4. Exercices

Walker et al ont etudi´ e´ le stress chez les manchots de Magellan en 2005. Certains se reproduisent dans une region´ retiree´ avec peu d’activites´ humaine. D’autres se reproduisent dans des regions´ touristiques.

eamerlogo

humaine. D’autres se reproduisent dans des regions´ touristiques. eamerlogo Caroline Verhoeven MEMO-I4034 22 / 31

4. Exercices

Exercice 2

Walker et al ont etudi´ e´ le stress chez les manchots de Magellan en 2005. Certains se reproduisent dans une region´ retiree´ avec peu d’activites´ humaine. D’autres se reproduisent dans des regions´ touristiques.

On veut savoir si les manchots stress plus en grandissant et si le fait de grandir dans une zone touristique ou non influence le stress.

fait de grandir dans une zone touristique ou non influence le stress. eamerlogo Caroline Verhoeven MEMO-I4034

eamerlogo

4. Exercices

Exercice 2

Walker et al ont etudi´ e´ le stress chez les manchots de Magellan en 2005. Certains se reproduisent dans une region´ retiree´ avec peu d’activites´ humaine. D’autres se reproduisent dans des regions´ touristiques.

On veut savoir si les manchots stress plus en grandissant et si le fait de grandir dans une zone touristique ou non influence le stress.

Pour cela, on les capture et on mesure leur concentration de

corticosterone´

manchots : recemment´

concentration de corticosterone´ manchots : recemment´ 30 minutes apres.` eclos,´ On fait cela pour 3 categories´

30 minutes apres.`

eclos,´

On fait cela pour 3 categories´

de

de 40 a` 50 jours et juste adultes.

eamerlogo

4. Exercices

Exercice 2

Walker et al ont etudi´ e´ le stress chez les manchots de Magellan en 2005. Certains se reproduisent dans une region´ retiree´ avec peu d’activites´ humaine. D’autres se reproduisent dans des regions´ touristiques.

On veut savoir si les manchots stress plus en grandissant et si le fait de grandir dans une zone touristique ou non influence le stress.

Pour cela, on les capture et on mesure leur concentration de

corticosterone´

manchots : recemment´

Ouvrir le fichier pinguin.xls. Determiner´

a une influence sur leur niveau de stress, si le fait de grandir dans une

region´

si

ou touristique a une influence sur leur niveau de stress et

ou touristique a une influence sur leur niveau de stress et 30 minutes apres.` eclos,´ On

30 minutes apres.`

eclos,´

On fait cela pour 3 categories´

de

de 40 a` 50 jours et juste adultes.

si l’ageˆ

des jeunes manchots

retiree´

l’effet de l’ageˆ

depend´

de l’environnement.

eamerlogo

Exercice 3

4. Exercices

Ouvrir le fichier melatonine.sav en SPSS. Quand on change de zone horaire, on souffre du decalage´

Ensuite, on s’adapte au cycle lumineux perc¸u par l’oeil et on resynchronise notre rythme circadien. Le changement dans ce rythme se nomme un “shift”.

En 2002, Wright et Czeisler ont re´ etudi´

le cycle de production de melatonine´

soumis a` un des 3 traitement suivants.

Ils ont et´ e´ reveill´

les yeux, a` l’arriere`

de 3 heures. Apres`

horaire.

e´ ce phenom´

ene.`

Ils ont mesure´

chez N = 22 sujets aleatoirement´

e´ durant leur sommeil et soumis a` une forte lumiere`

du genoux ou a` aucune lumiere,`

dans

durant une periode´

2 jours, on a mesure´ leur cycle de melatonine.´

eamerlogo

Exercice 3

4. Exercices

Ouvrir le fichier melatonine.sav en SPSS. Quand on change de zone horaire, on souffre du decalage´

Ensuite, on s’adapte au cycle lumineux perc¸u par l’oeil et on resynchronise notre rythme circadien. Le changement dans ce rythme se nomme un “shift”.

En 2002, Wright et Czeisler ont re´ etudi´

le cycle de production de melatonine´

soumis a` un des 3 traitement suivants.

Ils ont et´ e´ reveill´

les yeux, a` l’arriere`

de 3 heures. Apres`

Le “shift” (en heures) est donne´ pour chaque groupe dans le fichier. Un

shift negatif´

Ils ont mesure´

chez N = 22 sujets aleatoirement´

horaire.

e´ ce phenom´

ene.`

e´ durant leur sommeil et soumis a` une forte lumiere`

du genoux ou a` aucune lumiere,`

dans

durant une periode´

2 jours, on a mesure´ leur cycle de melatonine.´

montre un retard.

1
1

La maniere`

dont on eclaire´

a-t-il un impact sur le cycle circadien?

eamerlogo

Exercice 4

4. Exercices

Ouvrir le fichier intima media.xls en SPSS.

1
1

Regarder si l’ageˆ sport.

a une influence significative sur la pratique du

2
2

Regarder si l’ageˆ

et l’IMC ont une influence significative sur

l’epaisseur´

de l’intima-media.´

 
3
3

Regarder si l’epaisseur´

de l’intima-media´

depend´

de maniere`

significative de la consommation d’alcool et de tabac.

eamerlogo

Exercice 5

4. Exercices

Dans l’emission´

cel´ ebrit´

desagr´

Une de ces epreuves´

8 cel´ ebrit´

leur faut avant d’avoir la nausee´

de realit´

e´ “I’m a celebrity, get me out of here”, des

es´

doivent survivre dans la jungle et doivent subir des epreuves´

et humiliantes

est de manger des choses peu appetissantes.´

eables´

es´

mangent chacune 4 de ces choses. On mesure le temps qui

en secondes.

1
1

Y a-t-il une difference´

de temps entre ces choses?

eamerlogo

Exercice 6

4. Exercices

Les mammiferes`

temperature´

sont exposes´

Fuller et al. se sont demande´ si les autruches savaient faire la memeˆ

chose. Pour cela, ils ont mesure´ la temperature´

de six autruches. Les resultats´ autruche.xls.

Les temperatures´

differentes´

ont des mecanisme´

permettant de reduire´

la

cer´ ebrale´

par rapport a` la temperature´

corporelle quand il

En 2003,

a` des fortes chaleur durant de longues periodes.´

corporelle et cer´ ebrale´

se trouvent dans le fichier

corporelles et cer´ ebrales´

des autruches sont-elles

en moyenne?

eamerlogo

Exercice 7

4. Exercices

Nous testons l’influence de differents´

de laboratoire. Le gain de poids des rats est design´

“Poids” exprimee´

pas suivi un regime´

hypercalorique. La variable Vitamine vaut 1 si les rats n’ont pas rec¸u de

complements´

Les calories et le vitamines influence-t-elles les poids des rats?

Les donnees´

regimes´

alimentaires sur des rats

e´ par la variable

en grammes. La variable Calorie vaut 1 si les rats n’ont

hypercalorique et 2 s’ils ont suivi un tel regime´

vitamines´

et 2 s’ils ont rec¸u de tels complements.´

se trouvent dans le fichier rats.xls.

eamerlogo

Exercice 8

4. Exercices

Les chickadees lancent un cris d’alarme “chick-a-dee-dee-dee” lorsqu’ils

aperc¸oivent un predateur´

2005, Templeton et al. se sont demande´ si le nombre de “dee” etait´

poids des predateurs.´

nourrissant plus frequemment´

predateurs.´

nuees´

chacun des predateur.´

chickadee.xls. Y a-t-il moyen de predire´ du predateur?´

(hiboux, aigle, faucon) qui n’est pas en vol. En

lie´ au

manoeuvrant mieux et se

Les petits predateurs´

de petits oiseaux que les grands

de taille differentes´

Ils ont perche´ 13 predateurs´

devant des

de chickadees et ont mesure´ le nombre moyen de “dee” pour

Les donnees´

se trouvent dans le fichier

le nombre de “dee” moyen sur base du poids

eamerlogo

Exercice 9

4. Exercices

Les trematodes´

poissons “Fundulus parvipinnis”. Ces poissons se font manger pas des

oiseaux tels que les herons.´

oiseaux dans lesquels ils pondent leur oeufs. On a remarque´ que les

poissons infectes´

proies plus faciles. Une etude´

Euhaplorchis californienisis deviennent adultes dans les

Les trematodes´

se retrouvent ainsi dans les

nageaient plus proche de la surface et etaient´

de 1996 a etudi´

donc des

e´ l’impact de l’infection sur

le risque d’etreˆ

mange.´ Ils ont mis des poissons non infectes,´

leg´ erement`

infectes´

et fort infectes´

dans un aquarium ouvert a` l’exterieure´

et ont

compte´ le nombre de poissons manges.´

Voici les resultats´

 

non infecte´

leg´ erement`

infecte´

fort infecte´

Mange´

1

10

37

Non mange´

49

35

9

eamerlogo

4. Exercices

Exercices enseignement enfants trisomiques I

de Graaf et al ont etudi´

l’enseignement (enseignement specialis´

pour des enfants atteints de trisomie. Ils ont pour cela fait remplir un questionnaire a` des parents d’enfants trisomiques suivant les deux types

d’enseignements. Ils ont interroge´ les parents sur les performances des

enfants en lecture, ecriture´

donnees´

e,´ en 2013 l’importance du choix de

e´ ou enseignement traditionnel)

et mathematiques.´

On a egalement´

des

sur l’age,ˆ

le QI des enfants et le niveau d’etude´

des parents.

eamerlogo

4. Exercices

Exercices enseignement enfants trisomiques II

Vous trouverez des donnees´ down.xls

Exercice 10 Y a-t-il une difference´

suivant l’enseignement specialis´

lecture, ecriture´

Exercice 11 Etudier l’effet du type d’enseignement et du niveau

d’etudes´

Exercice 12 Etudier l’effet du QI, de l’ageˆ

mere`

mathematiques.´

Exercice 13 Etudier l’impact du niveau d’etudes´ choix de l’enseignement chez l’enfant.

basees´

sur cette etude´

dans le fichier

entre les performances des enfants

e´ et l’enseignement traditionnel en

et mathematiques.´

des parents sur les performances de l’enfant en lecture.

et du niveau d’etude´

et

de la

sur les performances de l’enfant en lecture, ecriture´

des parents sur le

eamerlogo