Vous êtes sur la page 1sur 25

Enseignante: A.

GUERRAB

Mise en contexte
En statistiques, plusieurs problmes consistent
dfinir la relation qui existe entre deux variables
statistiques :
Le nombre dannes dexprience et le nombre derreurs

commises ;
Lge du conducteur et le nombre daccidents dauto ;
Le volume des ventes et les dpenses en publicit ;
Le nombre dheures dtudes et les rsultats aux
examens ;

Mise en contexte
Dans ce genre de problmes, les principales questions

auxquelles nous voudrons rpondre sont les suivantes :


Existe-il une relation ou une dpendance entre les variables

statistiques?
Cette relation, si elle existe, est-elle linaire ou non ?
Si une dpendance linaire existe, de quelle faon peut-on la
traduire par une quation mathmatique ?
La relation, si elle existe, est-elle grande ou faible ?
Si lquation mathmatique de la relation entre les variables
existe, comment prvoir les valeurs dune certaine variable
partir de la connaissance de valeurs de lautre variable ou des
autres variables ?

Mise en contexte
Pour rpondre toutes ces questions, nous ferons
appel une thorie statistique que nous appelons :

Lanalyse de la rgression

Principe gnral pour ces deux approches


Rechercher lexistence

dune liaison (relation,


dpendance)

Observation ou exprience
A dfinir

entre deux variables

On dit alors simple

quantitatives

Nature des variables

X et Y

Alatoires(ou non)Rles(idem ou non)

Coefficient de corrlation linaire


X et Y sont alatoires

rX ,Y

COV(X, Y)

VAR(X) VAR(Y)

1 rX ,Y 1

Si r est proche de 0: les deux variables sont indpendantes


X ,Y

Si rX ,Y est proche de - 1: il ya une forte corrlation


linaire entre les deux variables.
Si rX ,Y est proche de + 1: il ya une forte corrlation
linaire entre les deux variables.

Contrle de lhypothse de linarit


Linarit entre X et Y

Visualisation du nuage de points.

*
**
* ***
***
***
Linarit

*
*

***
*

*
* **
***

Pas de linarit

**

Lanalyse de la rgression
Lanalyse de la rgression est une mthode statistique qui

permet dtudier le type de relation pouvant exister entre


une certaine variable (dpendante) dont on veut expliquer
les valeurs et une ou plusieurs autres variables qui servent
cette explication (variables indpendantes)
Rgression linaire simple: une variable indpendante

Rgression linaire multiple: plusieurs variables indpendantes

En dautres termes, lanalyse de la rgression permet

dtudier les variations de la variable dpendante en fonction


des variations connues des variables indpendantes.

Lanalyse de la rgression
Une analyse de rgression est :
dite simple si elle permet de prdire les valeurs dune

variable dite dpendante (explique (Y)) partir des


valeurs prises par une autre variable dite indpendante
(explicative (X)).
dite multiple si elle permet de prdire les valeurs dune

variable dite dpendante (explique (Y)) partir des


valeurs prises par plusieurs autres variables dites
indpendantes (explicatives (Xi)).

Lanalyse de la rgression linaire simple

Dfinition : Nuage de points ou


diagramme de dispersion

Cest la reprsentation graphique dans le plan cartsien de


lensemble des paires de donnes (xi,yi). Ces donnes
proviennent dune srie statistique de deux variables
obtenues partir dune tude mene sur un chantillon ou
sur une population.

Lanalyse de la rgression linaire simple


Exemple : Nuage de points ou diagramme de dispersion
Supposons que le nombre dheures dtudes ncessaires
pour prparer lexamen final en statistiques et le nombre
de bonnes rponses obtenues par chaque tudiant sont
donns dans le tableau suivant :

Tracer le nuage de points ou le diagramme de

dispersion des donnes prsentes ci-dessus.

Lanalyse de la rgression linaire simple


Exemple : Nuage de points ou diagramme de dispersion

Lanalyse de la rgression linaire simple


Objectif dune analyse de rgression simple
Une fois la reprsentation graphique effectue, il est
facile de souponner lexistence dune certaine
relation entre les deux variables (caractres tudis).
Il faut maintenant chercher exprimer cette relation
laide dune quation mathmatique.

Y f (X )
On essaie de trouver la forme mathmatique de la fonction

Lanalyse de la rgression linaire simple


Dfinition : Nous appelons rgression linaire lajustement
dune droite au nuage statistique dune srie de couples
de donnes.
Ainsi, une rgression linaire simple va permettre de
rsumer, dinterprter et de prvoir les variations dun
caractre dit dpendant (Y) en fonction dun autre dit
indpendant (X) et ce en utilisant une droite.

Lanalyse de la rgression linaire simple


y
Variable
expliquer

= 0 + 1x +

Paramtres
du modle

Variable
explicative

Erreur
alatoire

Ecart au
modle

f (X)
Prvision du modle

Y =

Modle de rgression linaire simple

Lanalyse de la rgression linaire simple: sens de 1


Y

**

Relation positive entre X et Y:


Quand X augmente, Y augmente.

**
* **

**
X

Relation ngative entre X et Y:


Quand X augmente, Y diminue.

**
***
* **
X
Y

Pas de relation entre X et Y:


Les variations de Y ne dpendent
pas des variations de X

** * *
* ***
* * ** **
** ** ** * **
** *

Lanalyse de la rgression linaire simple


quation de la rgression linaire simple (comment

l'esprance de y est lie x)


E(y) = 0 + 1x
quation estime de la rgression linaire simple (droite de
la rgression estime, modle empirique)

y b0 b1 x

y = Variable dpendante ou explique


y
= valeur estime de y pour une valeur x
x = Variable indpendante ou explicative
0 et 1 = Coefficients thoriques de rgression ( estimer
laide dun chantillon) par b0 et b1
= Erreur thorique alatoire (dautres facteurs influencent
Y)

Lanalyse de la rgression linaire simple


L'quation estime de la rgression linaire simple (droite de la
rgression estime, modle empirique) peut tre utilise
pour une estimation ponctuelle de la valeur moyenne de y
pour une valeur particulire de x ou pour prvoir la valeur
ponctuelle de y associe une valeur particulire de x

y b0 b1 x
y = Variable dpendante ou explique

y = valeur de prvision de y pour une valeur x, ou moyenne

de y estime pour une valeur de x

x = Variable indpendante ou explicative

Lanalyse de la rgression linaire simple


Les diffrentes tapes dune tude de rgression

Lanalyse de la rgression linaire simple


Il existe plusieurs mthodes permettant destimer le
modle thorique
par le modle
y 0 1 x
empirique

y b0 b1 x

Mthode des moindres carrs

Mthode de la vraisemblance

Lanalyse de la rgression linaire simple


y

Estimation des paramtres


de la droite de rgression
yi
Valeur
observe
pour Xi

yi = a xi + b
valeur prdite par le modle
pour la valeur de xi
xi

Au couple (xi, yi ) observ sajoute yi prdit par le modle

Lanalyse de la rgression linaire simple

Y=Y +
=Y - Y
ei = yi - yi

Estimation des
Lanalyse
deparamtres
la rgression linaire simple

de la droite de rgression

yi
Valeur
observe
pour Xi

yi = a xi + b
valeur prdite par le modle
pour la valeur de xi
xi

Lcart est gal yi - yi soit gal ei

Lanalyse de la rgression linaire simple


On obtient finalement une solution unique pour la
droite de rgression dont le rsultat gnral est:

cov( X , Y )
a
var( X )

b Y aX
Ce rsultat montre bien que X et Y
ne sont pas interchangeables dans la rgression

Lanalyse de la rgression linaire simple

a = 0.640 degrs/mm
b = 3.655 degrs

Equation de la droite: L2(degrs) = 0.640 L1 + 3.655

Vous aimerez peut-être aussi