Académique Documents
Professionnel Documents
Culture Documents
(valeurs de la table)
Suggestion de biblio
Est-ce que 20% de différence sont suffisamment élevés pour conclure que la donation est le
mode de financement préféré des français ?
Il faut faire des tests d’hypothèse quand la différence est trop mince
Donation : 12,30€
Taxe : 18,80€
Le consentement à payer sous forme de taxe est supérieur au consentement à payer sous
forme de donation
Comment on fait le test ?
Tests d’hypothèses :
Rejeter ou non l’hypothèse Test de comparaison de
concernant la population proportions
Nord Pas de Calais Test de comparaison de
moyennes
• Les échantillons doivent être représentatifs de la population. On
travaille sur des échantillons pour tirer des conclusions sur l’ensemble
de la population : c’est l’inférence statistique
Etapes pour réaliser un test d’hypothèse
Comparer un pourcentage à une norme test de comparaison d’une proportion à une norme
Exemple :
Touristes Excursionnistes
Visites 12 visites 18 visites
μ = moyenne
Autre exemple :
Norme maximale de taurine dans une boisson : 800mg
H0 : μ = μ0
Test unilatéral à droite
H1 : μ > μ0
Types de test
Test unilatéral à gauche Test bilatéral Test unilatéral à droite
H0 : μ = μ0 H0 : μ = μ0 H0 : μ = μ0
H1 : μ < μ0 H1 : μ ≠ μ0 H1 : μ > μ0
Le test bilatéral est approprié au cas où l’on cherche une différence entre deux
paramètres, ou entre un paramètre et une valeur donnée sans se préoccuper du
signe ou du sens de la différence.
Fixer un risque d’erreur
• Les tests d’hypothèses étant basés sur les informations d’un échantillon, des possibilités d’erreur
existent.
• Possibilité de se tromper, i.e. rejeter une hypothèse alors qu’elle est vraie dans la population
étudiée. On distingue 2 types de risque d’erreur : risque d’erreur de 1ère espèce et risque d’erreur
de 2ème espèce
Décisions
Ne pas rejeter H0 Rejeter H0
Etats de H0
H0 est vraie Bonne décision Mauvaise décision
Erreur de type 1
α = P(de commettre cette erreur)
= risque de première espèce
H0 est fausse Mauvaise décision Bonne décision
Erreur de type 2
β = P(de commettre cette erreur)
= risque de deuxième espèce
On se demande quel risque d’erreur est acceptable
; ]
Seuil de signification.
α=0,01.
NUMERO1
où les sont obtenues en supposant H0 vraie
Somme : X2 = 1,8284
109,22
- de 50 employés 10,48
50 - 99 7,30
> 99
• Pour tester la représentativité, il suffit de comparer la répartition de
l’échantillon à celle que l’on doit s’attendre d’après les données sur la
population.
Chapitre 2. Corrélation et régression linéaire simple
où :
- r varie entre -1 (corrélation négative et parfaite) et +1 (corrélation positive et parfaite), r=0, pas de
corrélation linéaire mais possibilité d’une corrélation non-linéaire.
• Nuages de points
Significativité d’une corrélation linéaire
Hypothèses statistiques Règles de décision
H0 : ρ = 0 Rejeter H0 si r>rc ou si r<-rc
Tester la significativité d’une corrélation
H1 : ρ ≠ 0
linéaire revient à déterminer si la corrélation
observée entre X et Y pour l’échantillon H0 : ρ = 0 Rejeter H0 si r>rc
existe bel et bien au sein de la population H1 : ρ > 0
cible. H0 : ρ = 0 Rejeter H0 si r<-rc
H1 : ρ < 0
Soit une corrélation linéaire de 0.67. Quelle
est la valeur critique de r que l’on doit
dépasser pour conclure à une corrélation
positive significative au seuil de α=0,05
pour un échantillon de 210 individus.
- Valeur critique de
r = 0.115 pour n = 210
Coefficient de Spearman:
Equivalent non-paramétrique du coefficient
de Pearson
Précaution à prendre
• La corrélation n’implique par toujours la causalité
𝒄𝒐𝒗(𝑿 ,𝒀 )
𝒃𝟏 =
𝒗𝒂𝒓(𝑿 )
∑ ( 𝑥 𝑖 − ´𝑥 )( 𝑦𝑖 − ´𝑦 )
𝑏1 =
∑ ( 𝑥𝑖 − ´𝑥 ) 2
2840
¿ =5 = 130 – 5(14)
568 = 60
• L’équation obtenue est un modèle qui donne des informations que les
données seules ne fournissent pas :
• b0 : ordonnée à l’origine (constante de la régression) ; elle représente la valeur
de Y lorsque X est nulle
• b1 : pente de la droite : mesure l’impact de X sur Y.
Si signe positif, l’impact de X sur Y est positif : X=Y
Si signe négatif, l’impact de X sur Y est négatif : X=Y
• Il traduit l’effet de la variation d’une unité de X sur Y. Si X varie de 1 unité,
varie de b1 unité.
• On peut aussi utiliser la droite de régression pour faire des prévisions :
Donc :
Somme des carrés Somme des carrés Somme des carrés des résidus
totale (SCtot) dues à la régression (SCres)
(SCreg)
H0 : β1 ≠ 0 pas significative
qui est distribuée selon la loi de Student avec (n-2) degrés de liberté
et
Approche par l’intervalle de confiance pour β1
•• L’intervalle
de confiance pour β1 est donnée par :
Cet intervalle a 99 chances sur 100 de contenir la vraie valeur du paramètre sur la
population
H0 : β1 = 0
H0 : β1 ≠ 0
Somme des carrés Somme des carrés Somme des carrés des résidus
totale (SCtot) dues à la régression (SCres)
(SCreg)
• Estimation
ponctuelle de la moyenne des ventes trimestrielles pour tous les
restaurants :
2 tests :
• Test F de Fisher pour tester la signification globale de la régression
linéaire multiple, c’est-à-dire voir s’il y a bien une relation significative
entre Y (variable dépendante) et X (l’ensemble des variables
explicatives)
• Test t de Student pour tester la signification individuelle de chaque
variable explicative. Donc test effectué pour chaque variable
indépendante du modèle
Test F de Fisher
H0 : β1 = 0
Ha : β1 ≠ 0
Statistique de test
•
Interprétation des paramètres et estimation :
Les variables weightcost (coûts de transport) et local_tourists sont significatives
Moyenne :
v = 4,7 – 0,012cost + 0,0001income+0,04age + 4,4localtourists
avec 1 si touriste local
et 0 si touriste extérieur