Vous êtes sur la page 1sur 21

Analyse bivarié

● Etude de la relation entre deux variables


○ Variables qualitatives:
■ Tables de contingence
■ Test Chi 2
○ Variables quantitatives
■ Diagramme de dispersion
■ Corrélation de Pearson
○ Variables ordinales
■ Corrélation de Spearman
Table de contingence

• Utilisé pour deux variables qualitative.

• table(jeux$variable1,jeux$variable2)
Exercice
• Réalisez les tables de contingence suivantes :
• Le fait de survivre selon genre
• Le fait de survivre selon la classe
• Le fait de survivre selon le port d’embarquement
Tableau de propotions

prop.table(table(jeux$V1,jeux$V2)
Exercice
• Réalisez les tableaux de proportion suivants :
• Le fait de survivre selon genre
• Le fait de survivre selon la classe
• La classe selon le genre
Test Khi deux
d’indépendance
• Le test de khi-deux de
contingence que l’on appelle
aussi le test de khi-deux
d’indépendance.
• Le khi deux, noté aussi χ2, khi
carré ou chi-square en anglais
est une mesure des écarts à
l’indépendance
• Il mesure la distance entre des
effectifs observés et des
effectifs théoriques.
Objectif du test du Khi 2 est :
• Se prononcer sur le lien, la
corrélation, entre deux variables
qualitatives.
Conditions d’application du test

Un test de khi deux s’applique uniquement sur des tableaux croisés :


• ayant au moins 2 lignes et 2 colonnes,
• contenant des valeurs positives entières,
• ayant au moins 60 observations au total,
• ayant aux minimum 5 observations par cases du tableau et/ou dans le
tableau des effectifs théoriques.

Lorsque toutes les cases du tableau n’ont pas plus de 5 observations par
cases, il est conseillé d’effectuer des regroupements de modalités si c’est
possible.
Effectuer un test du Khi deux d’indépendane avec
R
• On utilise la fonction
chisq.test(nom_du tableau_de_contingence)
Comment
analyser un test
Khi2
Interprétation
• Que pouvez vous dire ?
Exercice: y-a-t-il un lien entre la
classe des passagers et leurs
survies?
Correlation avec R

• Une fonction pour trois


corrélations :
• Pearson
• Kendall
• Spearman
coefficient de corrélation linéaire
• Proche de 0 on interprète qu’il
n’y a pas de relation linéaire
entre les deux variables.
• Proche de 1 il existe une
relation croissante.
• Proche de -1 il y a une relation
décroissante.
Regression linéaire simple
• Permet d’obtenir une droite de
régression
• Utilise la fonction
• lm()
Exercice
• Réalisez le script suivant:
• Que pouvez vous dire
• Calculez le coefficient de
Pearson
• Que pouvez vous dire
Exercice

1. Représenter le nuage de points associé à ces observations.


2. Vu le graphique, vous semble-t-il y avoir une relation entre les deux variables ? De quelle nature ?
3. Calculer le coefficient de corrélation
4. Déterminer la droite de régression linéaire. Est-ce que le modèle linéaire vous semble correct ?
Interpréter l’équation de la droite.
5. En 2011, la région prévoit une valeur d’installation de population égale à 4.9. A quelle valeur de
chiffre d’affaire le responsable peut- il s’attendre.
Projet
• Déterminez les liens existants entre les variables du jeu de données
Ronfle

Vous aimerez peut-être aussi