Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Dans le meilleur des cas, SCR = 0, le modèle arrive à prédire exactement toutes
les valeurs de y à partir des valeurs des x j. Dans le pire des cas, SCE = 0, le
meilleur prédicteur de y est sa moyenne y ¯ {\displaystyle {\bar {y}}} .
Un indicateur spécifique permet de traduire la variance expliquée par le modèle,
il s'agit du coefficient de détermination. Sa formule est la suivante :
R 2 = S C E S C T = 1 − S C R S C T {\displaystyle R^{2}={\frac
{SCE}{SCT}}=1-{\frac {SCR}{SCT}}\,}
R = R 2 {\displaystyle R={\sqrt {R^{2}}}\,} est le coefficient de corrélation
multiple.
Dans une régression avec constante, nous avons forcément
0 ≤ R ² ≤ 1.
Enfin, si le R ² est certes un indicateur pertinent, il présente un défaut
parfois ennuyeux, il a tendance à mécaniquement augmenter à mesure que l'on
ajoute des variables dans le modèle. De ce fait, il est inopérant si l'on veut
comparer des modèles comportant un nombre différent de variables. Il est
conseillé dans ce cas d'utiliser le coefficient de détermination ajusté qui est
corrigé des degrés de libertés. Le R² ajusté est toujours inférieur au R².
Significativité globale du modèle[modifier | modifier le code]Le R ² est un
indicateur simple, on comprend aisément que plus il s'approche de la valeur 1,
plus le modèle est intéressant. En revanche, il ne permet pas de savoir si le
modèle est statistiquement pertinent pour expliquer les valeurs de y.
Nous devons nous tourner vers les tests d'hypothèses pour vérifier si la liaison
mise en évidence avec la régression n'est pas un simple artefact.
La formulation du test d'hypothèse qui permet d'évaluer globalement le modèle
est la suivante :
H0 : a1 = a2 = … = ap = 0 ;
H1 : un des coefficients au moins est non nul.
La statistique dédiée à ce test s'appuie (parmi les différentes formulations
possibles) sur le R ², il s'écrit :
F c a l c = R 2 p 1 − R 2 n − p − 1 {\displaystyle F_{calc}={\frac {\frac
{R^{2}}{p}}{\frac {1-R^{2}}{n-p-1}}}} ,
et suit une loi de Fisher à (p, n - p - 1 ) degrés de liberté.
La région critique du test est donc : rejet de H0 si et seulement si Fcalc > F1
- α(p, n - p - 1), où α est le risque de première espèce.
Une autre manière de lire le test est de comparer la p-value (probabilité
critique du test) avec α : si elle est inférieure, l'hypothèse nulle est
rejetée.
Régression de séries temporelles[modifier | modifier le code]La régression de
séries temporelles, c'est-à-dire de variables indexées par le temps, peut poser
des problèmes, en particulier à cause de la présence d'autocorrélation dans les
variables donc aussi dans les résidus. Dans des cas extrêmes (lorsque les
variables ne sont pas stationnaires), on aboutit au cas de régression
fallacieuse : des variables qui n'ont aucune relation entre elles apparaissent
pourtant significativement liées selon les tests classiques.
La régression de séries temporelles demande donc dans certains cas l'application
d'autres modèles de régression, comme les modèles vectoriels autorégressifs
(VAR) ou les modèles à correction d'erreur (VECM).
Voir aussi[modifier | modifier le code]Références[modifier | modifier le
code]Régis Bourbonnais, Économétrie, Dunod, 1998 (ISBN 2100038605)
Yadolah Dodge et Valentin Rousson, Analyse de régression appliquée, Dunod,
2004 (ISBN 2100486594)
R. Giraud, N. Chaix, Économétrie, Puf, 1994
C. Labrousse, Introduction à l'économétrie -- Maîtrise d'économétrie, Dunod,
1983
J. Confais, M. Le Guen, Premiers pas en régression linéaire, La Revue Modulad,
N°35, 2006, pp220–363[1],
Notes et références[modifier | modifier le code]↑ J. Confais, M. Le Guen, «
Premiers pas en Régression Linéaire », La Revue Modulad, no 35, 2006 (lire en
ligne)Articles connexes[modifier | modifier le code]Ajustement de profil
Modèles de régression multiple postulés et non postulés
Régression linéaire
Régression polynomiale
Régression elliptique
Logiciels[modifier | modifier le code]Free Statistics, un portail recensant
plusieurs logiciels de statistique libres et gratuits, plusieurs d'entre eux
traitent de la régression linéaire multiple.
(en) Linear Algebra Mener des régressions sous Matlab avec l'aide de l'algèbre
linéaire.
R, un logiciel de statistique et d'analyse de données complet, sous licence
GNU General Public.
Regress32, un logiciel dédié à la régression linéaire multiple.
RLM, un logiciel gratuit pour effectuer des régressions linéaires multiples.
SIMUL 3.2 logiciel gratuit de modélisation économétrique multi-dimensionnelle
(multi-sectorielle, multirégionale) [1].
Tanagra, un logiciel de statistique et d'analyse de données, comportant un
module de régression.
Portail des probabilités et de la statistique
Ce document provient de «
https://fr.wikipedia.org/w/index.php?
title=Régression_linéaire_multiple&oldid=142891184
».
Catégorie : RégressionCatégories cachées : Page à recycler
(mathématiques)Portail:Probabilités et statistiques/Articles
liésProjet:Mathématiques/Articles
Menu de navigationOutils personnels
Non connecté
DiscussionContributionsCréer un compteSe connecterEspaces de noms
ArticleDiscussionVariantes Affichages
LireModifier
Modifier le codeAfficher l’historiquePlus
Rechercher Navigation
Accueil
Portails thématiques
Article au hasard
Contact
ContribuerDébuter sur Wikipédia
Aide
Communauté
Modifications récentes
Faire un don
OutilsPages liées
Suivi des pages liées
Importer un fichier
Pages spéciales
Lien permanent
Informations sur la page
Élément Wikidata
Citer cette page
Imprimer / exporterCréer un livre
Télécharger comme PDF
Version imprimable
Dans d’autres languesDeutsch
English
日本語
Modifier les liensLa dernière modification de cette page a été faite le 24
novembre 2017 à 14:10.
Droit d'auteur : les textes sont disponibles sous licence Creative Commons
attribution, partage dans les mêmes conditions ; d’autres conditions peuvent
s’appliquer. Voyez les conditions d’utilisation pour plus de détails, ainsi
que les crédits graphiques. En cas de réutilisation des textes de cette page,
voyez comment citer les auteurs et mentionner la licence.
Wikipedia® est une marque déposée de la Wikimedia Foundation, Inc.,
organisation de bienfaisance régie par le paragraphe 501(c)(3) du code fiscal
des États-Unis.