Académique Documents
Professionnel Documents
Culture Documents
Atelier 2 SPSS Biostate 2eme Atelier
Atelier 2 SPSS Biostate 2eme Atelier
Pratique de la statistique
Package
avec le logiciel SPSS
for
Social
Sciences
Initiation à SPSS
4 Analyse de survie
2
Objectifs
▪ Être capable de :
▪ Faire des analyses uni variées, bi variées
et multivariées
▪ Interpréter les résultats de ces analyses
2
Trois types d’analyse
4
Analyse univariée
➢ Calculer la fréquence
➢ Calculer la moyenne, le mode, la variance…
➢ Création des graphiques
5
Outils de l’analyse uni variée
▪ Distribution de fréquences
(ex.: rangement, tableau et graphique)
▪ Mesures de dispersion
(ex.: étendue, variance et écart-type)
7
Analyse uni variée
8
Résultat et interprétation
10
Analyse uni variée
❖ Onglet Analyse
10
Analyse uni variée
❖ Analyser la variable poids(BASE Formation.sav)
11
Résultat et interprétation
11
Représentations graphiques
Boîte à moustaches
les valeurs
aberrantes
Maximum
Q3:75%
Médiane
Q1:25%
Minimum
SPSS: Graphes Générateur de SPSS: Graphes Générateur de
diagrammes Histogramme diagrammes Boîte à moustaches
Variables
quantitatives
continues
13
Analyse bi variée
I. Tableau croisé et test de Khi deux (χ2)
▪ Croisements entre 2 variables catégorielles
Ex. La connaissance de la maladie SIDA selon le
milieu(base femme.xls)
▪ Onglet Analyse
Statistiques descriptives Tableaux croisés
Choisissez les deux variables que vous désirez
croisées (une dans “ligne” et une dans
“colonne”).
▪ Cliquez sur le bouton “cellules” et cochez les
trois choix sous “pourcentages” (ligne,
position, total)
▪ Cliquez statistiques et choisissez Chi-deux.
▪ Cliquez sur “poursuivre” et “ok”. 14
Croisement entre 2 variables
catégorielles
15
Test statistique
➢ Dans la logique d'un test d'hypothèse, il y a toujours
deux hypothèses statistiques:
❖ La première - l'hypothèse nulle ou Ho - est, comme son
nom l'indique, une hypothèse qui postule que la
relation entre X et Y est due au hasard, autrement dit
qu'il n'y a pas de relation entre X et Y (nulle= absence
de relation).
❖ La seconde - l'hypothèse alternative ou H1 - correspond
habituellement à l'hypothèse de votre recherche.
Contrairement à l'hypothèse nulle, cette hypothèse
suggère que la relation entre X et Y ne peut être attribuée
au hasard; il existe donc un lien entre X et Y au sein de la
population.
15
Test statistique
➢ Rappelons qu'en sciences humaines, le risque
maximum d'erreur est de 0.05 (= seuil de signification).
15
Résultat ‘’Outpout’’
16
Analyse bi variée
II. Comparaison de la moyenne et ANOVA
Lorsqu’on confronte une variable quantitative à une
variable qualitative (nominale ou ordinale), on recourt très
généralement à la comparaison de moyennes ou à
l’analyse de variance (ANOVA).
17
Résultat et interprétation
17
Analyse bi variée
2. Analyse de variance (ANOVA)
Cette technique permet de comparer les moyennes de trois
groupes ou plus, créés par une variable catégorielle en
fonction de leur moyenne à une mesure (variable continue)
sous les deux hypothèses suivantes :
17
Analyse de variance (ANOVA)
❖ La question qui nous aidera à illustrer l'analyse de variance
est la suivante : Peut-on croire que l'obésité a une influence
sur l’augmentation du cholestérol ? (Base Formation.xlsx)
17
Résultat et interprétation
la variabilité échantillonnale
de la moyenne
17
Analyse bi variée
1. L’analyse de corrélation
Renseigne sur l’intensité du lien entre les deux variables :
ex : « le lien est fort et très significatif ».
Coefficient de corrélation de Pearson r est une mesure
d’association (d’interdépendance) entre deux variables
quantitative
17
L’analyse de corrélation
17
L’analyse de corrélation
❖ Dans cet exemple, nous avons réalisé une corrélation entre l'espérance
de vie des femmes (LIFEEXPF) et le taux de natalité par 1 000 habitants
(BIRTHRAT). Nous désirions savoir s'il existait une relation linéaire
significative entre ces deux variables.(base naissance.sav)
17
L’analyse de corrélation
17
L’analyse de corrélation
17
Régression simple.
2. Régression simple
Elle consiste à déterminer une équation qui relie 2 variables
quantitatives. Contrairement à la corrélation simple, elle
nécessite d’identifier l’une des 2 variables comme étant
dépendante (à expliquer) et l’autre comme étant indépendante
(explicative).
Le modèle type est de la forme :
Y = β0 + β1X + ε avec
19
Régression simple.
➢ Évaluation de la pertinence du modèle de régression
19
Régression simple.
Valeur absolue
de la corrélation
19
Régression simple.
➢ Les paramètres du modèle
Y = β0 + β1X + ε
Β0= 89.57
β1=-0.744
ε=1.357
Donc:
l'espérance de vie des femmes=89.57-0,744*taux de
natalité+1,357
19
Régression simple.
➢ Courbe d’ajustement
19
Régression simple.
19
Analyse multi variée
22
Analyse multi variée
❑ Le choix des variables indépendantes:
Un bon modèle comprend un nombre optimal de
variables et par la présence d’un lien théorique connu
ou présumé avec la variable dépendante. Il y a des
éléments à considérer lors de cette étape:
22
Analyse multi variée
22
Régression linéaire multiple
❖ Dans notre exemple, nous voulons savoir quelles variables
influencent l’augmentation du cholestérol (BASE FORMATION.sav)
22
Régression linéaire multiple
22
Régression linéaire multiple
❖ Descendante : toutes les variables sont entrées initialement
dans l’équation et sont ensuite éliminées une à une. La
variable ayant la plus petite corrélation avec la variable
dépendante est d’abord étudiée pour l’élimination. Si elle est
éliminée par le modèle, la prochaine variable avec le plus
petit coefficient de corrélation est étudiée, jusqu’à ce
qu’aucune variable ne satisfasse plus au critère d’élimination.
L’augmentation
d’un kilo au niveau
du poids entraine
l’augmentation du
cholestérol de 25%
Taux de chol=8,86+0,016*Poids-0,037*Taille+0,70*Fume+0,19*Triglycerides
22
Régression logistique
➢ Bloc 0 = Modèle n’incluant que la constante(autres coefficients=0)
➢ Bloc 1 = Modèle suivant, incluant un ou plusieurs prédicteurs
β0 = 1,132
22
Régression logistique
Test de Wald: tester H0: βi= 0
contre H1: βi≠0
22
Arbre de décision
Avec SPSS :
Onglet Analyse
▪ Classification Arbre
▪ Choisissez le variable dépendent et les variable
indépendantes
▪ Cliquez sur “ok”.
26
Arbre de décision
❖ Dans le but de déterminer une prédiction de la prévalence
contraceptive en fonction des facteurs socio-économiques un arbre
d’aide à la décision a été tracé(base femme.sav)
26
Arbre de décision
la « racine » de l’arbre
26
Arbre de décision
26
Arbre de décision
Femme A
Femme B
Femme C
26
Arbre de décision
26
L'analyse de survie
26
L'analyse de survie
26
L'analyse de survie
26
L'analyse de survie
26
L'analyse de survie
26
L'analyse de survie
26
L'analyse de survie
26
La meilleure façon d’apprendre à
c’est la pratique
26