Vous êtes sur la page 1sur 94
Introduction à SPSS Technique d’analyse quantitative des données I Professeur: Karim DOUMI Karim DOUMI SPSS

Introduction à SPSS

Technique d’analyse quantitative des

données I

Professeur: Karim DOUMI

Karim DOUMI

SPSS

1

Chapitre 1 : Fonctionnement de SPSS Généralités • SPSS est un outil statistique permettant des…

Chapitre 1 : Fonctionnement de SPSS

Généralités

SPSS est un outil statistique permettant des…

…analyses simples:

Statistiques descriptives,statistiques inférentielle…. tests d’hypothèse…….

…analyses plus sophistiquées:

Analyses multivariées

… des graphiques

Les analyses se font à partir des données

saisies!!!

La qualité des analyses statistiques est fonction de

la qualité des données saisies

Karim DOUMI

SPSS

2

Fonctionnement de SPSS:

Généralités

Quatre types de fichiers utilisés:

Un fichier des données de l’étude

Fichier texte (.txt) ou excel (.xls)

BD (access, Mysql, oracle… )

Un fichier d’édition des données (.sav)

Un fichier de syntaxe (.sps)

Un fichier de résultats (.spo)

Karim DOUMI

SPSS

3

Fonctionnement de SPSS:

Fichier de données

Ce fichier n’appartient pas à SPSS:

Peut prendre diverses formes (Excel, base de données, fichier texte,…).

Avantages du fichier texte:

Utilisation sur PC ou Macintosh.

Peut être lu par n’importe quel programme de traitement de texte.

Résiste au temps et à l’évolution des diverses versions des logiciels.

Création du fichier texte:

Utilisation du bloc-notes ou enregistrement dans WORD ou EXCEL

sous le format texte

Karim DOUMI

SPSS

4

Karim DOUMI SPSS 5

Karim DOUMI

SPSS

5

Description des principales fenêtres :

File : permet la gestion des fichiers (ex. : ouvrir un nouveau fichier, fermer, enregistrer, etc.).

Edit : permet d’effectuer les opérations de traitement de texte (ex. : copier, couper, coller,

etc.).

View : permet de définir les options de l’écran (ex. : barres d’outils).

Data : traite tout ce qui est lié à la gestion de la barre de données (ex. : définir une variable, insérer une variable, etc.).

Transform : permet d’effectuer les différentes opérations de transformation des

variables

(ex. : recodification, catégorisation, création d’indices, etc.).

Analyse : permet toutes les analyses statistiques que SPSS permet d’effectuer (ex. :

analyses descriptives, corrélations, régressions, etc.).

Graphs : présente tous les types de graphiques que SPSS permet de créer (ex. :

histogrammes, etc.).

Utilities : comprend les utilitaires sur le programme (ex. : infos sur les fichiers, infos sur les variables, etc.).

Windows : permet la gestion des fenêtres.

Help : outil d’aide à l’utilisation du logiciel.

Karim DOUMI

SPSS

6

La définition des variables

Name : sert à donner un nom à la variable. Le nom ne doit pas dépasser 8 caractères et il est recommandé de ne pas utiliser de caractères accentués. Il doit bien représenter la variable pour vous permettre de la

reconnaître facilement.

Type : sert à décrire la variable et le format de la colonne. Il est recommandé de laisser l’option «numeric» qui est indiquée par défaut. Pour les décimales «decimal places», vous pouvez les laisser égales à 2 ou les mettre à 0, selon la situation.

Label : permet de donner une identification plus explicite à la variable qui sera affichée dans les différents calculs statistiques.

Values : permet de définir les valeurs que peuvent prendre la variable.

Missing : permet d’indiquer si la variable peut accepter ou non des valeurs manquantes. Remarque : la saisie des données manquantes se fait habituellement en effectuant un simple «retour» (c’est la méthode recommandée). Si vous avez prévu d’utiliser des codes spécifiques (ex. : 9, 99, etc.), il faut les définir dans «missing».

Columns : permet de terminer la largeur de la colonne. Vous pouvez augmenter ou réduire la taille de la colonne.

Align : sert à aligner les données à l’intérieur des cellules.

Scale : permet de définir le type de l’échelle (nominale, ordinale, intervalles et ratio).

Karim DOUMI

SPSS

7

Fonctionnement de SPSS:

Fichier de données

Dans un fichier texte, les données de chaque sujet sont entrées successivement, séparées par un « ; » une « , », une espace ou une tabulation. Il est préférable d’utiliser un « ; » ou une espace

Exemple:

Variables: identification (id), sexe du sujet (sexe, où f=1, h=2) et âge (age) on entrera:

1 1 28 participant 1 est une femme de 28 ans

2 2 33 participant 2 est un homme de 33 ans

3 2 32 participant 3 est un homme de 32 ans etc.

Karim DOUMI

SPSS

8

Fonctionnement de SPSS:

Fichier de données

Le fichier de données inclut les valeurs

numériques associées à vos données

Ex. 7 pour signifier “totalement en accord” ou 1 pour

signifier que le participant est un homme

Principes généraux de saisie:

Chaque ligne = 1 participant

Chaque colonne = 1 variable

Karim DOUMI

SPSS

9

Fonctionnement de SPSS:

Fichier d’édition des données

Pour insérer les données dans ce fichier:

Saisie des données manuellement

Importation du fichier avec la syntaxe:

GET DATA /TYPE = TXT /FILE = 'C:\Ex2.txt'

/DELCASE = LINE

/DELIMITERS = "\t" /ARRANGEMENT = DELIMITED /FIRSTCASE = 2 /IMPORTCASE = FIRST 1000 /VARIABLES = ID F3.2 L100KM F6.2

CHEVAPEU F3.2

POIDS A9

ACCEL F5.2

ORIGIN F3.2

NBCYL F3.2

ANNEE A8

.

CACHE.

EXECUTE.

Karim DOUMI

SPSS

GET DATA /TYPE=XLS

/FILE='C:\Ex2.xls'

/SHEET=name 'Ex2'

/CELLRANGE=full

/READNAMES=on .

10

Fonctionnement de SPSS:

Fichier d’édition des données

Pour insérer les données dans ce fichier:

Avec le menu

Suivre les étapes affichées à l’écran

Karim DOUMI
Karim DOUMI

SPSS

11

Fonctionnement de SPSS:

Fichier d’édition des données

Attribuer un nom/code

à chaque variable

Pour SPSS 12 et moins, max de 8 lettres/chiffres, mais débutant nécessairement par une lettre

Choisir des codes

significatifs

Conserver par écrit les

codes des variables!!!

une lettre – Choisir des codes significatifs – Conserver par écrit les codes des variables!!! Karim

Karim DOUMI

SPSS

12

Code variable Signification ID identification du participant motivation à supprimer ses émotions Karim DOUMI
Code variable
Signification
ID
identification du participant
motivation à supprimer ses émotions
Karim DOUMI

SPSS

13

Fonctionnement de SPSS:

Fichier d’édition des données

Attribuer une étiquette

à chaque variable

Les codes sont limités. On peut dans SPSS attribuer une étiquette (label), laquelle permet de mieux se retrouver

Onglet “variable view”

pour modifier les paramètres des variables

de mieux se retrouver • Onglet “variable view” pour modifier les paramètres des variables Karim DOUMI

Karim DOUMI

SPSS

14

Fonctionnement de SPSS:

Fichier d’édition des données

Les données à saisir

dans SPSS sont numériques:

Chaque modalité de réponse peut se voir attribuer une étiquette (Values)

sont numériques: – Chaque modalité de réponse peut se voir attribuer une étiquette ( Values )

Karim DOUMI

SPSS

15

Fonctionnement de SPSS:

Fichier d’édition des données

Valeurs manquantes:

Il importe d’attribuer un code pour les valeurs manquantes; ceci facilite

la vérification du fichier

de données

On doit spécifier à SPSS un code pour signaler

l’existence d’une valeur

manquante

Ex. -999 pour une échelle allant de 1 à 7.

pour signaler l’existence d’une valeur manquante • Ex. -999 pour une échelle allant de 1 à

Karim DOUMI

SPSS

16

Fonctionnement de SPSS:

Fichier syntaxe

Les analyses avec SPSS se font:

1.Par les menus ou 2.Par les syntaxes

Plus complexe à première vue, elle comporte des

avantages majeurs:

Certains types d’analyses ou de sous-commandes ne sont pas

disponibles via le menu.

En spécifiant tous les paramètres de votre analyse vous êtes plus à même de contrôler les résultats obtenus.

Karim DOUMI

SPSS

17

Fonctionnement de SPSS:

Fichier syntaxe

Le logiciel SPSS reconnaît un ensemble défini de

commandes et de sous-commandes.

Plusieurs d'entre elles seront vues lors des cours

Sinon, guide en .pdf dans le menu d’aide

Le fichier syntaxe est un fichier de commandes

Elles indiquent à SPSS quoi faire avec les données

Les commandes et sous-commandes sont séparées par une barre oblique (/)

Aucun accent ne doit être employé dans les commandes, sous-commandes et noms de variables

Il ne faut pas oublier que les commandes SPSS se terminent toujours par un point.

Karim DOUMI

SPSS

18

Fonctionnement de SPSS:

Fichier syntaxe

Fonctionnement de SPSS: Fichier syntaxe Karim DOUMI SPSS 19

Karim DOUMI

SPSS

19

Fonctionnement de SPSS:

Fichier syntaxe

Fonctionnement de SPSS: Fichier syntaxe Karim DOUMI SPSS 20
Fonctionnement de SPSS: Fichier syntaxe Karim DOUMI SPSS 20

Karim DOUMI

SPSS

20

Fonctionnement de SPSS:

Fichier résultats

Fonctionnement de SPSS: Fichier résultats Karim DOUMI SPSS 21

Karim DOUMI

SPSS

21

Calculer une Variable

Il arrive très souvent que les variables brutes d'une base de

données ne soient pas suffisantes pour effectuer certaines analyses. On peut avoir besoin de créer une ou des nouvelles variables à partir des variables existantes, comme dans les cas

suivants :

Créer une variable qui contient la racine carrée d'une variable existante

Calculer la moyenne ou la somme d'une série de variables

existantes… La commande Compute sert à créer de nouvelles variables sur la base de fonctions arithmétiques, statistiques ou logiques.

Karim DOUMI

SPSS

22

Calculer une Variable

Exemple

Calculer une Variable Exemple Karim DOUMI SPSS 23

Karim DOUMI

SPSS

23

Calculer une Variable

Exemple

Cette nouvelle variable sera la moyenne des réponses données par chaque sujet

aux questions Q01, Q02, Q03,

Allez dans le menu Transformer et choisissez Calculer la variable.

dans le menu Transformer et choisissez Calculer la variable. • Dans la boite de dialogue, écrivez,

Dans la boite de dialogue, écrivez, dans Variable cible (étiquette), MOYSAT (c’est

le nom de la variable).

Ensuite, allez dans la boite Groupe de fonctions et cliquez à deux reprises sur Statistiques (il est dans le bas de la liste, vous devez utiliser l’ascenseur à droite). Vous verrez dans la boite Fonctions et variables spéciales la fonction Mean sur laquelle vous devez aussi cliquer à deux reprises.

Dans la boite du haut, vous verrez apparaître MEAN (?, ?). Vous devez alors insérer les variables Q01, Q02, Q03 dans la parenthèse

Karim DOUMI

SPSS

24

Calculer une Variable

Exemple

Vous pouvez également écrire à la main la commande dans la boite…

une Variable Exemple • Vous pouvez également écrire à la main la commande dans la boite…

Karim DOUMI

SPSS

25

Calculer une Variable

Exemple

Exercice sur la commande CALCULER : par syntaxe

Maintenant, éliminez la variable MOYSAT de la matrice de données (cliquez au haut de la colonne sur le nom de la variable, puis dans le menu Édition, cliquez sur Effacer ou, plus simplement, sur le bouton effacer ou supprimer de votre clavier).

Pour copier la commande à l’intérieur d’un fichier Syntaxe recommencez les

étapes précédentes et remplacez le

recommencez les étapes précédentes et remplacez le par • Le texte copié dans cette fenêtre devrait

par

recommencez les étapes précédentes et remplacez le par • Le texte copié dans cette fenêtre devrait

Le texte copié dans cette fenêtre devrait se lire comme suit :

et remplacez le par • Le texte copié dans cette fenêtre devrait se lire comme suit

Karim DOUMI

SPSS

26

Calculer une Variable

Exemple

faites la même chose en créant la variable « AGEX ».(âge exacte de l’individu)

Voici ce que devrait contenir maintenant votre fichier Syntaxe

AGEX ».(âge exacte de l’individu) Voici ce que devrait contenir maintenant votre fichier Syntaxe Karim DOUMI

Karim DOUMI

SPSS

27

Création d’une variable

La commande recode sert à créer de nouvelles variables (ou à

modifier des variables existantes) sur la base d’un regroupement des valeurs qu'on appelle aussi clé de recodage. Voici quelques situations dans lesquelles vous pouvez utiliser le recodage :

À partir d'une variable contenant la note d'examen sur 20, créer une nouvelle variable qui recode la note en lettre (A+, A-

, A, etc

)

Recoder les valeurs d'items inversés dans une échelle de mesure

Diminuer le nombre de catégories d'une variable catégorielle

en les regroupant différemment

Karim DOUMI

SPSS

28

Création d’une Variable

Exemple

Imaginons que nous voulons réaliser des analyses comparant les gens en formation (STATUT = 1) et les autres (STATUT = 2, 3 ou 4). Pour cela, il nous faut créer une variable qui diminue le nombre de catégories de 4 à 2. :

Allez encore une fois dans le menu Transformer, puis sélectionnez Création de variables

Transformer , puis sélectionnez Création de variables Recodez la variable STATUT de sorte que les sujets

Recodez la variable STATUT de sorte que les sujets qui ont répondu 1 auront la valeur 1 (en formation) alors que ceux qui ont la valeur 2, 3 ou 4 auront maintenant la valeur 2 (autres).

Dans la boite de dialogue principale, inscrivez STATUTX dans la boite Nom de

l’encadré. Inscrivez ensuite Statut recodé dans la boite Étiquette du même encadré. Cliquez sur

ensuite Statut recodé dans la boite Étiquette du même encadré. C l i q u e

Karim DOUMI

SPSS

29

Création d’une Variable

Exemple

Création d’une Variable Exemple Apres il faut Changer les anciennes valeurs par les nouvelles valeurs. Karim

Apres il faut Changer les anciennes valeurs par les nouvelles valeurs.

d’une Variable Exemple Apres il faut Changer les anciennes valeurs par les nouvelles valeurs. Karim DOUMI

Karim DOUMI

SPSS

30

Création d’une Variable

Exemple

Exercice sur la commande Recode : par syntaxe

Exemple Exercice sur la commande Recode : par syntaxe Pour les 3 variables a la fois

Pour les 3 variables a la fois la syntaxe est la suivante:

Karim DOUMI
Karim DOUMI

SPSS

31

Expression conditionnelle (IF)

Les expressions conditionnelles permettent de calculer des variables selon une condition, donc qui s’applique à des sujets ou des observations

(lignes) qui répondent à certains critères que nous allons définir selon nos

besoins avec cette commande. La résultante des expressions conditionnelles peut créer une nouvelle

variable ou bien transformer les valeurs d'une variable existante. Dans le

dernier cas, il faut s'assurer que l'écrasement des valeurs originales ne

porte pas à conséquence

Voici l’apparence Syntaxe la commande de cet exercice.

IF (sexe = 1) satis1=MEAN (q01, q03, q05).

Littéralement, elle signifie que SI la valeur de la variable SEXE est égale à « 1 », la valeur de la variable SATIS1 sera égale à la moyenne des valeurs des variables Q01, Q03 et Q05.

Karim DOUMI

SPSS

32

Expression conditionnelle (IF)

Expression conditionnelle (IF) En utilisant le langage SPS: Karim DOUMI SPSS 33

En utilisant le langage SPS:

Expression conditionnelle (IF) En utilisant le langage SPS: Karim DOUMI SPSS 33

Karim DOUMI

SPSS

33

Sélection de cas:

Pour certaines analyses, il peut être nécessaire de filtrer une partie des observations (cas) pour obtenir des résultats auprès d'un sous-groupe spécifique d'observations.

Il est possible de sélectionner une ou des observations à l’aide de un ou d'une combinaison de critères, soit par la boite de dialogue, soit en utilisant une commande SYNTAXE.

Les conditions de sélection peuvent être uniques ou multiples. Dans le cas d’une seule condition, on inscrit la variable sur laquelle repose la sélection avec la condition formulée grâce aux conditions arithmétiques (<, >, =, <=, >=, <>).

Toutes les conditions multiples (deux variables ou plus) doivent utiliser les

opérateurs logiques (AND et OR) pour séparer les conditions.

Pour faire une sélection de cas de manière interactive, allez dans le

menu Données, puis cliquez sur Sélectionnez des observations.

Karim DOUMI

SPSS

34

Sélection de cas:

Sélection de cas: Karim DOUMI SPSS Pour faire une sélection de cas de manière interactive, allez

Karim DOUMI

SPSS

Pour faire une sélection de cas de manière interactive, allez dans le menu Données, puis cliquez sur Sélectionnez des

observations.

35

Sélection de cas:

Sélection de cas: Karim DOUMI SPSS Dans la première boite de dialogue, vous devez déterminer la

Karim DOUMI

SPSS

Dans la première boite de dialogue, vous devez déterminer la stratégie de

sélection que vous allez utiliser. Vous

avez plusieurs choix, mais le plus populaire est sans contredit Selon une condition logique. Dans ce cas, la

sélection se fait à partir de la

condition que vous énoncez. Nous allons donc voir cette stratégie en premier et préciser les autres par la

suite

36

Sélection de cas

Sélection de cas Karim DOUMI SPSS Exemple : pour choisir les hommes de plus de 30

Karim DOUMI

SPSS

Exemple :

pour choisir

les hommes de plus de

30 ans, on entrerait

dans la boite:

Sexe = 1 AND

age >

30

37

Sélection de cas:

Sélection de cas: Karim DOUMI SPSS Si vous préférez taper la commande manuellement, créer vous la

Karim DOUMI

SPSS

Si vous préférez taper la commande manuellement,

créer

vous la syntaxe suivante:

devriez

38

Sélection de cas:

Sélection de cas: Karim DOUMI SPSS 39

Karim DOUMI

SPSS

39

Les autres stratégies de sélection

Dans la boite de dialogue Sélection de cas, vous avez bien sûr la stratégie Si que nous venons de voir, mais aussi d’autres choix. Voici une brève description pour chacun.

Toutes les observations : vous ne faites pas

de sélection, vous utilisez toutes les observations. Très utile quand vous voulez revenir à la base initiale et annuler une condition préalablement établie.

Par échantillonnage aléatoire : sélection d'observations aléatoire. Vous choisissez à ce moment combien de cas vous voulez dans votre échantillon, soit en pourcentage

(Environ _ % de toutes les observations), soit

en précisant un nombre d'observations parmi les X premiers (Exactement _ observations à partir des premières _ Observations).

Utiliser une variable de filtre : enfin, vous pouvez

faire une sélection en ne conservant que les cas qui

ont des valeurs valides pour une variable filtre. Vous n'avez qu'à transférer la variable filtre dans la boite prévue à cet effet.

Karim DOUMI

SPSS

qu'à transférer la variable filtre dans la boite prévue à cet effet. K a r i
qu'à transférer la variable filtre dans la boite prévue à cet effet. K a r i

40

Corrélation, régression linéaire simple avec SPSS Karim DOUMI SPSS 41

Corrélation, régression linéaire

simple avec SPSS

Karim DOUMI

SPSS

41

Chapitre 2 : Corrélation,

régression et causalité

Introduction : précisions sémantiques

La régression simple indique la nature de la liaison linéaire entre

deux variables (quantitatives). La corrélation indique le degré de

linéarité entre deux variables (quantitatives). Ainsi l’analyse de régression fournit une fonction entière (une droite par exemple)

alors que l’analyse de corrélation fournit un simple nombre un

indice qui renseigne sur l’intensité avec laquelle 2 variables évoluent ensemble. Ces 2 techniques sont donc complémentaires. L’analyse causale enfin va plus loin en précisant le sens de la relation, le

chemin de la cause à l’effet.

Karim DOUMI

SPSS

42

Chapitre 2 : Corrélation,

régression et causalité

Exemple

Si je m’intéresse au lien entre le temps hebdomadaire moyen passé à travailler (X) et la note obtenue au partiel (Y) :

L’analyse de régression permet de déterminer une fonction qui lie les deux variables : ex : « Y =

aX + b »

L’analyse de corrélation renseigne sur l’intensité du lien entre les deux variables : ex : « le lien est fort et très significatif ».

L’analyse causale détermine le sens de la relation : ex « temps de travail note au partiel »

Karim DOUMI

SPSS

43

Chapitre 2 : Corrélation, régression et causalité

5.1. Analyse bivariée

Corrélation entre deux variables quantitatives

Le coefficient de corrélation de Pearson r est une mesure d’association (d’interdépendance) entre deux variables métriques Il mesure l’intensité de la co-variation entre les deux variables :

les deux variables, mesurées sur le même ensemble d’observations, varient-elles de façon analogue (si pour une observation, l’une prend une valeur élevée, l’autre a également une

valeur élevée) ?

Karim DOUMI

SPSS

44

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Calcul du coefficient de corrélation de Pearson :

r

cov(

xy

)

( ).

x

( )

y

r est toujours compris entre 1 et 1 si r est proche de 1 alors le lien est fort et négatif (quand 1 des 2 variables augmente l’autre

diminue), alors que si r est proche de 1 le lien est fort et positif (quand 1 des deux variable augmente,

l’autre augmente aussi) si r est proche de 0 alors il n’y a pas de lien entre x et y

Karim DOUMI

SPSS

45

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

r et r 2 :

Comme r indique le degré de la relation entre la variation d’une variable et celle d’une autre variable, il peut également représenter la décomposition de la variation totale (en étant au carré). On retiendra que r 2 = variation expliquée variation totale r 2 mesure la proportion de la variation d’une variable qui est expliquée par l’autre. r et r 2 sont des mesures symétriques d’association : la corrélation entre X et Y est la même que la corrélation entre Y et X. Il n’est pas important de savoir quelle est la variable indépendante et quelle est la variable dépendante.

Karim DOUMI

SPSS

46

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Interprétation du R 2 :

Variance expliquée : R², coefficient de détermination (proportion de variance totale de Y qui n’est pas due à l’erreur, ou encore proportion de la variance de Y expliquée par la variance de X)

–R² = 0 : la variable indépendante n’explique rien

R² = 1 : la variable explique complètement Y

R² = 0,11 : 11% des variations de Y sont expliquées par le modèle

Karim DOUMI

SPSS

47

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Précisons tout de suite que r indique la force d’une relation linéaire. Si on a r = 0, cela signifie qu’il n’y a pas de relation linéaire entre X et Y, mais cela ne signifie pas que les 2 variables ne sont pas liées !!! Il peut très bien y avoir une relation non linéaire entre elles non

traduite par r. Faites un graph !

Y

entre elles non traduite par r.  Faites un graph ! Y Karim DOUMI SPSS X

Karim DOUMI

SPSS

X

Illustration :

bien une relation entre X et Y, mais non linéaire. Ici r = 0

Il existe

48

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Le coefficient de corrélation linéaire r renseigne sur l’intensité du lien entre 2 variables quantitatives.

Il doit être complété afin de déterminer si l’éventuel lien mis à jour est significatif ou non. On utilise

pour cela un test t :

n  2 t r .  2 1  r
n  2
t r .
2
1 
r

Remarque : sous SPPS, la probabilité critique du test est fournie par la rubrique « sig. (bilatérale) »

Karim DOUMI

SPSS

49

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Exemple SPSS : y a-t-il un lien entre la taille de l’unité sociale de visite (le nombre de personnes qui forment le groupe) et le temps passé dans le musée d’art ? H0 : il n’y a aucun lien entre ces deux variables (r=0) H1 : il existe un lien entre ces deux variables (r0)

Analyse CorrélationBivariée

Résultat : coefficient de corrélation linéaire de Pearson : r (entre -1 et 1)

Karim DOUMI

SPSS

50

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Corrélations

durée estimée de taille de l'unité la v isite sociale durée estimée de la visite
durée
estimée de
taille de l'unité
la v isite
sociale
durée estimée de la visite
Corrélation de Pearson
1
,078
Sig. (bilatérale)
,
,071
N
542
538
taille de l'unité sociale
Corrélation de Pearson
,078
1
Sig. (bilatérale)
,071
,
N
538
613

Le coefficient de Pearson est faible et non significatif. On conclut qu’il n’existe pas de lien entre la durée de la visite et la taille de l’unité sociale de visite

Karim DOUMI

SPSS

51

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Exercice

BDD Employes de SPSS : y’a-t-il une corrélation positive significative entre salaire actuel et salaire à l’embauche ? Entre salaire actuel et nombre de mois d’ancienneté ?

Karim DOUMI

SPSS

52

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Corrélations

Ancienneté Salaire Salaire (nombre de courant d'embauche mois) Salaire courant Corrélation de Pearson 1,000
Ancienneté
Salaire
Salaire
(nombre de
courant
d'embauche
mois)
Salaire courant
Corrélation de Pearson
1,000
,880* *
,084
Sig. (bilatérale)
,
,000
,067
N
474
474
474
Salaire d'embauche
Corrélation de Pearson
,880* *
1,000
-,020
Sig. (bilatérale)
,000
,
,668
N
474
474
474
Ancienneté (nombre
Corrélation de Pearson
,084
-,020
1,000
de mois)
Sig. (bilatérale)
,067
,668
,
N
474
474
474
**.
La corrélation est signif icativ e au niveau 0.01 (bilatéral).

Corrélation positive faible et non significative

Corrélation positive forte et

significative

Karim DOUMI

SPSS

53

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Réponse :

On veut calculer la corrélation entre Y (attitude envers la ville) et X (durée de résidence dans la ville),

après contrôle d’une troisième variable Z (l’importance du climat). On commence par calculer les corrélations simples entre chaque variables :

r YX = 0,9361 r YZ = 0,7334 r XZ = 0,5495

Karim DOUMI

SPSS

54

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Analyse Corrélation Bivariée

Corrélations

ATT_VILL Corrélation de Pearson Sig. (bilatérale) N DURÉE_RÉ Corrélation de Pearson Sig.

ATT_VILL

Corrélation de Pearson

Sig. (bilatérale)

N

DURÉE_RÉ

Corrélation de Pearson

Sig. (bilatérale)

N

ATT_VILL

1,000

,

12

,936* *

,000

12

N ATT_VILL 1,000 , 12 ,936* * ,000 12 IMP_CLIM Corrélation de Pearson Sig. (bilatérale) N

IMP_CLIM

Corrélation de Pearson

Sig. (bilatérale)

N

,733* *

,007

12

de Pearson Sig. (bilatérale) N ,733* * ,007 12 ,550 1,000 ,064 , 12 12 DURÉE_RÉ
,550 1,000 ,064 , 12 12

,550

1,000

,064

,

12

12

DURÉE_RÉ IMP_CLIM ,936* * ,733* * ,000 ,007 12 12 1,000 ,550 , ,064 12

DURÉE_RÉ

IMP_CLIM

,936* *

,733* *

,000

,007

12

12

1,000

,550

,

,064

12

12

**.

La corrélation est signif icativ e au niv eau 0.01 (bilatéral).

Karim DOUMI

SPSS

55

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

La régression simple :

Elle consiste à déterminer une équation qui relie 2 variables quantitatives. Contrairement à la corrélation simple, elle nécessite d’identifier l’une des 2 variables comme étant dépendante (à expliquer) et l’autre comme étant indépendante (explicative). Remarquons tout de même que cette méthode n’implique pas de causalité.

Le modèle type est de la forme :

Y i = β 0 + β 1 X i + e i avec Y = variable dépendante (à expliquer) X = variable indépendante (ou explicative) β 0 = ordonnée à l’origine de la droite β 1 = pente de la droite e i = terme d’erreur associé à la ième observation

Karim DOUMI

SPSS

56

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

La régression simple, vocabulaire :

Coefficient de détermination r 2 : proportion de la variation totale de Y expliquée par la variation de X Valeur estimée (ou prédite) de Y i : Ŷ i = a + bx avec Ŷ i la valeur estimée de Y i et a et b les estimateurs respectifs de β 0 et β 1 . Coefficient de régression : le paramètre b est appelé coefficient de régression non standardisé. L’écart-type résiduel (SEE) : c’est l’écart-type des erreurs (valeurs réelles Y moins valeurs estimées Ŷ). Erreur type (SE b ): estimation de l’écart-type de b

Karim DOUMI

SPSS

57

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

La régression simple, vocabulaire (suite) :

Coefficient de régression standardisé (coefficient bêta) : il correspond à la pente obtenue par la régression de Y sur X lorsque les données sont standardisées. Somme des erreurs au carré : les distances de tous les points à la droite de régression sont élevées au carré et additionnées pour obtenir la somme des erreurs au carré, qui est une mesure de l’erreur totale Statistique t : valeur du t de Student à n-2 degrés de liberté, afin de rejeter ou non H0. Cette statistique est associée à sa probabilité critique (significative lorsqu’elle est < 0,05)

Karim DOUMI

SPSS

58

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Les étapes d’une analyse de régression simple :

1. La première étape consiste à représenter le nuage de points, variable dépendante sur l’axe vertical et variable indépendante sur l’axe horizontal. Cela permet de se faire une idée sur le type de lien (est-ce linéaire ?) et de détecter les éventuelles valeurs extrêmes qui risquent de perturber l’analyse.

Sous SPSS : Graph Diagramme de dispersion Simple

Karim DOUMI

SPSS

59

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

12

10

8

6

4

2

0

0 10 20
0
10
20

DURÉE_RÉ

Karim DOUMI

SPSS

60

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

2. Il s’agit ensuite de trouver les caractéristiques de la droite qui décrit le mieux les données. On

utilise généralement la méthode des moindres carrés. Elle consiste à déterminer la droite de régression qui minimise le carré des distances verticales entre les points et la droite.

Avec une équation du type Y i = β 0 + β 1 X i + e i la distance verticale du point à la droite est représenté par e i.

Les distances de tous les points à la droite élevés au carrés et additionnés forment la somme des carrés des erreurs, ou « erreur totale », notée

e

2

j

Le but est que cette valeur soit minimale (que les distances verticales soient minimisées)

Karim DOUMI

SPSS

61

12

10

8

6

4

2

0

y = β 0 + β 1 x

Y i e i Ŷ i 0 10 20
Y i
e i
Ŷ i
0
10
20

DURÉE_RÉ

Karim DOUMI

SPSS

62

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

3. Estimation des paramètres de la droite :

Dans la plupart des cas, β 0 et β 1 sont inconnues et estimées à partir des observations de l’échantillon en utilisant l’équation : Ŷ i = a + bx i

Ŷ i est la valeur estimée ou prédite de Y i et a et b sont les estimateurs respectifs de β 0 et β 1 . La constante b, qui est la pente de la droite de régression est généralement appelée coefficient de régression non standardisé. C’est la variation attendue de Y quand X varie d’une unité.

b

cov(

XY

)

V X

(

)

aY b X

Karim DOUMI

SPSS

63

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

4. Estimation du coefficient de régression standardisé :

La standardisation est le procédé par lequel les données brutes sont transformées en nouvelles variables, ayant une moyenne de 0 et une variance de 1. L’ordonnée à l’origine prend alors une valeur de 0. La pente obtenue par la régression de Y par rapport à X (B YX ) est alors la même que celle obtenue par la régression de X par rapport à Y (B XY ).

En outre, chacun de ces coefficients de régression standardisés (bêta) est égal au coefficient de régression simple entre X et Y : B YX = B XY = r XY

Il existe une relation simple entre les coefficients de régression standardisés et non standardisés : B YX = b XY (S X /S Y )

Karim DOUMI

SPSS

64

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

5. Test d’hypothèse :

En toute rigueur, la signification statistique de la relation linéaire entre X et Y doit faire l’objet d’un test d’hypothèse. On pose :

H0 : β 1 = 0

H0 implique qu’il n’y a pas de relation linéaire entre X et Y, tandis que l’hypothèse alternative H1 en

suppose une, positive ou négative. On utilise un test bilatéral t à n-2 degrés de liberté associé à une

probabilité critique pour déterminer la significativité de β 1 .

et

H1 :

β 1 0

Avec b coefficient de régression et SE b l’estimation de l’écart-type de b.

Karim DOUMI

SPSS

b

t

SE b

65

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Exercice

En utilisant la BDD SPSS « attitude envers la ville », réalisez une étude de corrélation et de régression

entre la variable dépendante attitude envers la ville et la variable indépendante durée de résidence.

Analyse Régression Linéaire

Karim DOUMI

SPSS

66

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Analyse de corrélation :

Récapitulatif du modèle

Modèle

1

,936 a

R R-deux

,876

Modèle 1 ,936 a R R-deux ,876 R-deux ajusté ,864 Erreur standard de l'estimation 1,2233
Modèle 1 ,936 a R R-deux ,876 R-deux ajusté ,864 Erreur standard de l'estimation 1,2233

R-deux ajusté

,864

Erreur

standard de

l'estimation

1,2233

a. Valeurs prédites : (constantes), DURÉE_RÉ

Karim DOUMI

SPSS

67

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Coefficient de Pearson

Analyse de corrélation :

Récapitulatif du modèle Erreur standard de Modèle R R-deux R-deux ajusté l'estimation 1 ,936 a
Récapitulatif du modèle
Erreur
standard de
Modèle
R
R-deux
R-deux ajusté
l'estimation
1
,936 a
,876
,864
1,2233
a. Valeurs prédites : (constantes), DURÉE_RÉ
SEE
SEE

Le R2 ajustée permet de corriger le R2 en fonction du nombre de variable. Ici, pas d’incidence.

La durée de résidence dans la ville explique à 87,6 % l’attitude

Karim DOUMI

SPSS

68

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Significativité du modèle de corrélation :

ANOVA b

Modèle 1 Résidu Somme des carrés ddl Régression Total 105,952 1 105,952 70,803 14,964 10

Modèle

1

Résidu

Somme

des carrés

ddl

Régression

Total

105,952

1

105,952

70,803

14,964

10

1,496

120,917

11

Carré moy en

,000 a F Signif ication

,000 a

F Signif ication

a. Valeurs prédites : (constantes), DURÉE_RÉ

b. Variable dépendante : ATT_VILL

Karim DOUMI

SPSS

69

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Somme des carrés ddl

Significativité du modèle de corrélation :

ANOVA b Modèle ddl Carré moy en F Signif ication 1 1 105,952 70,803 ,000
ANOVA b
Modèle
ddl
Carré moy en
F Signif ication
1
1
105,952
70,803
,000 a
10
1,496
11
a. Valeurs prédites : (constantes), DURÉE_RÉ
b. Variable dépendante : ATT_VILL
Somme des carrés Régression 105,952 Résidu 14,964 Total 120,917
Somme
des carrés
Régression
105,952
Résidu
14,964
Total
120,917

La statistique F calculée pour 1 et 10 ddl correspond à une proba critique < 0,05. La relation entre X et Y est positive et significative.

Karim DOUMI

SS Y = SS reg + SS res

SPSS

70

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Paramètres du modèle de corrélation :

Coefficients a

Modèle

B

1

Coeff icients non

standardisés

Erreur

standard

1 Coeff icients non standardisés Erreur standard
1 Coeff icients non standardisés Erreur standard

(constante)

DURÉE_RÉ

1,079

,743

1,452

,590

,070

,936

8,414

,177 ,000

,177

,000

Coeff icien

ts

standardi

sés

Bêta

t

Signif ication

a. Variable dépendante : ATT_VILL

Karim DOUMI

SPSS

71

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

B YX = B XY = r XY

Paramètres du modèle de corrélation :

Coefficients a Coeff icien ts Coeff icients non standardi standardisés sés Erreur Modèle B standard
Coefficients a
Coeff icien
ts
Coeff icients non
standardi
standardisés
sés
Erreur
Modèle
B
standard
Bêta
t
Signif ication
1
(constante)
1,079
,743
1,452
,177
DURÉE_RÉ
,590
,070
,936
8,414
,000
a.
Variable dépendante : ATT_VILL
,070 ,936 8,414 ,000 a. Variable dépendante : ATT_VILL T = 0,590  0,070=8,414 avec 12-2

T = 0,5900,070=8,414 avec 12-2 ddl. Proba critique associée < 0,05 ce qui confirme le test F : relation positive significative entre X et Y

Karim DOUMI

72

SPSS

Attitude (Ŷ) = 1,079 + 0,590

(durée de résidence)

Exemple

Karim DOUMI

SPSS

73

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Hypothèses implicites posées lors de l’estimation des paramètres :

H1 : Le terme d’erreur est normalement distribué (pour chaque valeur fixe de X la distribution de Y est normale).

H2 : Les moyennes de toutes ces distributions normales de Y, pour X donné, forment une droite dont la pente est b.

H3 : La moyenne du terme d’erreur est 0.

H4 : La variance du terme d’erreur est constante, et ne dépend pas des valeurs prises par X.

H5 : Les termes d’erreur ne sont pas corrélés (les observations ont été réalisées indépendamment les

unes des autres).

Karim DOUMI

SPSS

74

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Exercice

1) Réalisez une analyse de corrélation et de régression dans BDD « employés » entre salaire et salaire embauche.

2) BDD « enquête du comportement des américains en 1993 » : peut-on expliquer la tendance à être libéral ou conservateur (variable métrique à 7 modalités « affilpol ») en fonction du revenu du répondant ?

3) Reprenez la BDD « enquête du comportement des américains en 1993 » et réalisez une nouvelle analyse de corrélation et de régression susceptibles de présenter un intérêt, entre les variables de

votre choix.

Karim DOUMI

SPSS

75

Chapitre 2: Corrélation, régression et causalité

5.1. Analyse bivariée

Corrélation ou régression simple ?

Les deux méthodes donnent des résultats totalement équivalents, et les conclusions qui peuvent en

être tirées sont identiques (R² est, dans le cas de la régression simple, le carré de r)

On choisira la régression lorsque l’objectif est d’estimer un modèle de prédiction (ex : prédire les ventes par les dépenses publicitaires)

Karim DOUMI

SPSS

76

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Principe : étudier les relations entre n variables prises simultanément (n>2)

Méthodes :

Explicative : régression multiple, analyse discriminante

Descriptive : analyse factorielle des correspondances (AFC), analyse en composantes principales (ACP)

Nature des variables :

Métrique : régression multiple (explicative) et ACP (descriptive)

Nominale : analyse discriminante (explicative), analyse factorielle (descriptive)

Karim DOUMI

SPSS

77

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Pourquoi réaliser des régressions multivariées ?

Limite de la régression simple : un phénomène a rarement une seule cause. Par exemple, qu’est-ce qui explique les ventes d’un produit ?

Le budget pub, le budget force de vente, le prix, le nombre de points de vente, etc.

La régression multiple permet, elle, de confirmer une relation de cause à effet entre variables, c’est-à-

dire expliquer les variations d’une variable par plusieurs autres variables. Si cette relation est confirmée, il faut alors évaluer son intensité.

Karim DOUMI

SPSS

78

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Méthode :

Y est la variable quantitative à expliquer (dépendante), et X1, X2, , Xi, les i variables explicatives (indépendantes) quantitatives (à la rigueur binaires). La forme générale du modèle est :

Y = β 0 + β 1 X 1 + β 2 X 2 + . + β i X i + ε avec ε minimum.

On recherche une fonction f qui lie les valeurs de Y à celle des X et telle que f(Xi) soit le « plus

proche possible » de Y.

Dans la pratique, on calcule l’équation :

Ŷ = b 0 + b 1 X 1 + b 2 X 2 + . + b i X i

Karim DOUMI

SPSS

79

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Présentation des résultats sous SPSS (1/4):

Analyse Régression Linéaire

La significativité globale du modèle est fournie à l’aide d’un test F et une probabilité associée

Le R² ajusté indique le % de variance de Y expliquée par l’équation (ajustée au nombre de variables

indépendantes et à la taille de l’échantillon)

Le coefficient de corrélation multiple R tend vers 1 lorsque la relation est forte, vers 0 lorsqu’elle

est nulle

2

)

k ( 1

R

2

ajusté

2

R

R

n k 1

 

Karim DOUMI

SPSS

80

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Présentation des résultats sous SPSS (2/4) :

Les coefficients β, dits coefficients de régression partiels représentent la variation attendue de Y quand Xi varie d’une unité mais que les autres variables indépendantes sont maintenues constantes. A chacun d’entre eux est associé un tests t pour en estimer la significativité.

Pour comparer la contribution relative des Xi à Y, il suffit de comparer les valeurs absolues des t associés ou de lire les coefficients de régression partiels standardisés Bêta (moyenne=0 et écart- type=1) qui permettent la comparaison entre Xi alors même que celles-ci ont des unités de mesure différentes (exemple, pour estimer les ventes d’un magasin : surface en m², nombre de produits en promo, proximité du centre ville en km etc.)

Karim DOUMI

SPSS

81

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Présentation des résultats sous SPSS (3/4) :

Il est nécessaire de tester la colinéarité, car la multicolinéarité entre variables explicatives biaisent les estimations de R² :

Il faut étudier la tolérance : pourcentage de la variable explicative non expliquée par les autres variables explicatives (elle doit être proche de 1, et en tout cas > 0,3)

Il faut aussi étudier le VIF (variance inflation factor) : degré d’augmentation de l’erreur lié à la multicolinéarité (le VIF doit être inférieur à 4)

Karim DOUMI

SPSS

82

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Présentation des résultats sous SPSS (4/4) :

Enfin, il est nécessaire d’examiner les résidus. Le résidu ei est la différence entre la valeur observée yi et la valeur calculée par le modèle Ŷi. Ces erreurs ei s’expliquent d’une part par l’effet des variables non prises en compte dans le modèle, et d’autre part par des variations aléatoires. Pour que l’interprétation du modèle soit valide, il faut que les résidus se répartissent de manière aléatoire

autour de la valeur calculée. Pour vérifier ce dernier point, il suffit d’examiner le diagramme PP-

Gaussien : il ne doit y avoir aucune forme apparente dans la distribution des résidus

Karim DOUMI

SPSS

83

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Exercice

Peut-on expliquer l’attitude envers la ville en fonction de la durée de résidence et de l’importance accordée au climat ?

Karim DOUMI

SPSS

84

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

Sous SPSS : Analyse Régression Linéaire

Récapitulatif du modèle

Modèle

R

1

,972 a

R-deux

,945

Modèle R 1 ,972 a R-deux ,945 R-deux ajusté ,933 Erreur standard de l'estimation ,8597
Modèle R 1 ,972 a R-deux ,945 R-deux ajusté ,933 Erreur standard de l'estimation ,8597

R-deux ajusté

,933

Erreur

standard de

l'estimation

,8597

a. Valeurs prédites : (constantes), IMP_CLIM, DURÉE_RÉ

Karim DOUMI

SPSS

85

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

La relation est forte Récapitulatif du modèle Erreur standard de Modèle R R-deux R-deux ajusté
La relation est forte
Récapitulatif du modèle
Erreur
standard de
Modèle
R
R-deux
R-deux ajusté
l'estimation
1
,972 a
,945
,933
,8597
a.
Valeurs prédites : (constantes), IMP_CLIM, DURÉE_RÉ
Le modèle « explique » 93,3 % de la variance
de Y
SEE

Karim DOUMI

SPSS

86

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

Sous SPSS : Analyse Régression Linéaire Statistiques : test de colinéarité Diagrammes : diagramme P-P gaussien

ANOVA b

Modèle

1

Résidu

Somme

des carrés

ddl

Régression

Total

114,264

2

57,132

77,294

6,652

9

,739

120,917

11

Carré moy en

,000 a F Signif ication

,000 a

F Signif ication

a. Valeurs prédites : (constantes), IMP_CLIM, DURÉE_RÉ

b. Variable dépendante : ATT_VILL

Karim DOUMI

SPSS

87

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

ANOVA b

Somme Modèle des carrés ddl Carré moy en F Signif ication 1 Régression 114,264 2
Somme
Modèle
des carrés
ddl
Carré moy en
F
Signif ication
1
Régression
114,264
2
57,132
77,294
,000 a
Résidu
6,652
9
,739
Total
120,917
11
a. Valeurs prédites : (constantes), IMP_CLIM, DURÉE_RÉ
b. Variable dépendante : ATT_VILL

Le test F est associé à une probabilité d’erreur < 5 %. Le modèle est donc globalement significatif

Karim DOUMI

SPSS

88

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

Coefficients a

Modèle 1 (constante) DURÉE_RÉ IMP_CLIM Coeff icients non standardisés Erreur B standard

Modèle

1

(constante)

DURÉE_RÉ

IMP_CLIM

Coeff icients non

standardisés

Erreur

B standard

,337

,567

,481

,059

,289

,086

IMP_CLIM Coeff icients non standardisés Erreur B standard ,337 ,567 ,481 ,059 ,289 ,086
IMP_CLIM Coeff icients non standardisés Erreur B standard ,337 ,567 ,481 ,059 ,289 ,086
B standard ,337 ,567 ,481 ,059 ,289 ,086 Coeff icien       ts standardi

Coeff icien

     

ts

standardi

Statistiques de

sés

colinéarité

 

Bêta

t

Signif ication

Tolérance

 

VIF

,595

,567

   

,764

8,160

,000

,698

 

1,433

,314

3,353

,008

,698

1,433

a. Variable dépendante : ATT_VILL

Karim DOUMI

SPSS

89

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

L’équation de la droite de régression est : Ŷ = 0,337 +

0,481X1 + 0,289X2

droite de régression est : Ŷ = 0,337 + 0,481X1 + 0,289X2 Coefficients a Coeff icien

Coefficients a

Coeff icien ts Coeff icients non standardi Statistiques de standardisés sés colinéarité Erreur Modèle B
Coeff icien
ts
Coeff icients non
standardi
Statistiques de
standardisés
sés
colinéarité
Erreur
Modèle
B
standard
Bêta
t
Signif ication
Tolérance
VIF
1 (constante)
,337
,567
,595
,567
DURÉE_RÉ
,481
,059
,764
8,160
,000
,698
1,433
IMP_CLIM
,289
,086
,314
3,353
,008
,698
1,433
a.
Variable dépendante : ATT_VILL

β 1 et β 2 sont significatifs. Ces 2 facteurs sont donc importants pour expliquer Y

Pas de problème de

multicolinéarité

Karim DOUMI

SPSS

90

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Réponse :

on de résidu Diagramme gaussien P-P de régressi Ŷi (Yi calculé) Variable dépendante: ATT_VILL 1,00
on de résidu
Diagramme gaussien P-P de régressi
Ŷi (Yi calculé)
Variable dépendante: ATT_VILL
1,00
Pour l’observation i, on
,75
estime ei par la distance
entre le point et la droite
Y=y
,50
,25
0,00
0,00
,25
,50
,75
1,00
Probabilité cumulée observée
Yi observés
Karim DOUMI
91
SPSS

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

La régression pas à pas :

Le but de la régression pas à pas est de sélectionner, à partir d’un grand nombre de variables explicatives, un petit sous-ensemble de variables qui expliquent la plus grande partie de la variation de la variable dépendante (à expliquer).

Les variables explicatives sont introduites ou retirées une à une de l’équation que l’on cherche à optimiser.

2 méthodes sont possibles :

Karim DOUMI

SPSS

92

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Régression pas à pas ascendante : les variables sont entrées dans le modèle les unes après les autres, en recherchant d’abord la variable Xi la plus explicative, puis celle qui explique le plus la part de variance restant à expliquer etc.

Régression pas à pas descendante : les variables sont éliminées du modèle global les unes après les autres, en éliminant d’abord la variable Xi la moins explicative de Y, puis celle qui explique le moins la variance restant à expliquer etc.

Karim DOUMI

SPSS

93

Chapitre 2: Corrélation, régression et causalité

5.2. Analyse multivariée

Conclusion sur la régression multiple :

Choisir la régression si l’objectif est un modèle de prédiction Bien réfléchir au statut des variables dépendante et indépendantes Disposer de variances suffisantes sur les variables introduites dans le modèle. Ne retenir que les β significatifs. Éviter les données avec des valeurs extrêmes ou aberrantes

Karim DOUMI

SPSS

94