Vous êtes sur la page 1sur 18

Université de Blida 1

Faculté de technologie
Département sciences de l’eau et de l’environnement

Cours de Master 1

Analyse et modélisation hydrologique

Enseignante : Dr. TAIBI-FEDDAL S.


Chapitre 2:
Liaisons stochastiques
2.1. La corrélation
2.2. La régression
2.1. La corrélation
2.1.1. Définition
La corrélation simple: consiste à chercher une relation entre deux
variables
La corrélation multiple: consiste à chercher une relations entre
plusieurs variables (>2).

Soient X et Y deux variables quantitatives observées.


On souhaite :
1. Déterminer s'il existe une relation entre X et Y .
2. Caractériser la forme de la liaison (la relation) entre X et Y (positive ou
négative, linéaire ou non linéaire, monotone ou non monotone).
3. Tester si la liaison est statistiquement significative.
4. Quantifier l'intensité de la liaison.
5. Valider la liaison identifiée.
2.1. La corrélation
2.1.1. Types de relations entre deux variables
y
Pour savoir s'il existe une relation entre deux
caractères, on établit un diagramme de corrélation.
C-à-d qu’on reporte les couples (xi,yi) sur un plan OXY.
Les n couples (xi, yi) forment un nuage de point.

x
La forme du nuage de point permet de caractériser la
Diagramme de corrélation
relation entre X et Y selon trois critères:
- Forme de la relation
- Sens de la relation
- Intensité de la relation
2.1. La corrélation
2.1.1. Types de relations entre deux variables
2.1.1.1. forme de la relation
a. Une relation est linéaire si le nuage de point peut s'ajuster correctement à
une droite.
b. Une relation est non-linéaire :Le nuage de point présente alors une forme
complexe avec des courbures (parabole, hyperbole, sinusoïde, etc).

Une relation est monotone si elle est strictement croissante ou strictement


décroissante, c'est-à-dire si elle ne comporte pas de minima ou de maxima.
2.1. La corrélation
2.1.1. Types de relations entre deux variables
2.1.1.1. sens de la relation
Une relation monotone (linéaire ou non) est positive si les deux caractères varient dans
le même sens, c'est à dire si l'on observe en général que :

Une relation monotone est négative si les deux caractères varient en sens inverse, c'est à dire
si l'on observe en général que :
2.1. La corrélation
2.1.1. Types de relations entre deux variables
2.1.1.1. Intensité de la relation
Une relation est forte: le nuage de point prend alors la forme d'une ligne
ou d'une courbe dont les points s'écartent peu.
Une relation est faible: le nuage de point n'a pas la forme d'une ligne ou
d'une courbe, ou seulement de façon très grossière.
Une relation est nulle: le nuage de point a le forme d'un carré, d'un cercle,
ou toute autre forme sans véritables lignes directrices.
2.1. La corrélation
2.1.1. coefficient de corrélation
2.1.1.1. définition

Le coefficient de corrélation permet de quantifier la liaison entre deux variables X et


Y , de manière à mettre en évidence le sens de la liaison et son intensité.
Le coefficient de corrélation de Pearson permet d'analyser les relations linéaires
et le coefficient de corrélation de Spearman les relations non-linéaires
monotones.
2.1. La corrélation
2.1.1. coefficient de corrélation
2.1.1.1. Coefficient de corrélation de Pearson (r)

Ce coefficient permet de détecter la présence ou l'absence d'une relation


linéaire entre deux caractères quantitatifs continus. Pour calculer ce
coefficient il faut tout d'abord calculer la covariance.
La covariance est la moyenne du produit des écarts à la moyenne.
2.1. La corrélation
2.1.1. coefficient de corrélation
2.1.1.1. 1.2.1.2. interprétation du r-Pearson

Le r varie entre -1 et +1. Son interprétation est la suivante :


- si r est proche de 0, il n'y a pas de relation linéaire entre X et Y
- si r est proche de -1, il existe une forte relation linéaire négative entre X et Y
- si r est proche de 1, il existe une forte relation linéaire positive entre X et Y
2.1. La corrélation
2.1.1. coefficient de corrélation
2.1.1.1. 1.2.1.2. interprétation du r-Pearson

Le coefficient de détermination r²

Le coefficient de corrélation sert avant tout à caractériser une relation linéaire


positive ou négative par son intensité (relation : forte, faible, absente).
En revanche, son carré « r² » que l'on appelle coefficient de détermination,
s'interprète comme la proportion de variance de Y (ou X) linéairement expliquée
par X (ou Y ).
Exemple: r = 0,9, on voit que la liaison est forte, puisqu'elle se rapproche de 1.
r²= 0,81, on peut dire que 81% de la variance de Y est expliquée par X (et
inversement).
2.1. La corrélation
2.1.1. coefficient de corrélation
2.1.1.1. Coefficient de corrélation de Spearman (𝝆)
Ce coefficient permet de détecter l'existence de relations monotones (croissante ou
décroissante), quelle que soit leur forme précise (linéaire, exponentiel, puissance,
...). Il est surtout utile lorsque l'analyse du nuage de point révèle une forme
curviligne dans une relation qui semble mal s'ajuster à une droite.
Le rho de Spearman est fondé sur l'étude de la différence des rangs entre les
attributs des individus pour les deux caractères X et Y :

𝒊=𝒏 𝟐
𝟔 𝒊=𝟏 𝒓 𝒙 𝒊 − 𝒓 𝒚𝒊
𝝆=
𝒏𝟑 − 𝒏
Avec :
r xi : est le rang de xi dans la distrubution X
r yi : est le rang de yi dans la distrubution Y
n: taille de l′échantillon
Le rho de Spearman varie entre -1 et +1. Son interprétation est la même que
celui de Pearson, mais il permet de mettre en évidence des relations non-
linéaires lorsqu'elles sont positives ou négatives.
2.1. La régression
2.1.1. régression linéaire simple

Dans le cas ou deux variables quantitatives X et Y montrent une forte


relation linéaire. On peut formaliser cette relation par l’expression :
Y= aX+b qui correspond à la droite de régression linéaire simple
où:
y est la variable expliquée et
x et la variable explicative

NB: On parle de régression linéaire multiple lorsqu’on cherche une


relation entre plusieurs variables quantitatives (nb de variables >2)
2.1. La régression
2.1.1. régression linéaire simple
2.1.1.1.détermination des paramètres a et b

 Méthode des moindres carrés

Les paramètres a et b sont estimés par la méthode des moindres carrés et


sont exprimés par les formules suivantes.
2.1. La régression
2.1.1. régression linéaire simple
2.1.1.1.détermination des paramètres a et b

 Méthode graphique

Les paramètres a et b peuvent être estimés graphiquement:


- On reporte d’abord les couples (xi, yi).
- On trace une droite qui passe par le centre du nuage de point.
- Le paramètre a correspond à la pente de la droite : a=∆y/∆x
- Le paramètre b = 𝒚𝒊 lorsque 𝒙𝒊 =0
2.1. La régression
2.1.1. régression linéaire simple
2.1.1.2. applications

Application de la régression linéaire en hydrologie:


extension d’une série de données.

Une des utilisations les plus fréquentes de la régression linéaire est l’extension
de séries de données.
Soit deux variables X et Y : X a été observée n fois et Y k fois.
Soit k le nombre de couple (x,y) dont on dispose; on se propose d’établir, à partir
des ces k couples, la courbe de régression de y en x, puis à partir des valeurs de
x, de reconstituer les (n-k) valeurs de y non observées.
2.1. La régression
2.1.1. régression linéaire simple
2.1.1.2. l’extension de séries de données

Exemple: X les pluies annuelles observées à la station 1 au cours de la


période 1981-2010
Soit: Y les pluies annuelles observées à la station 2 au cours de la
période 1981-2000.

- Reconstituez les pluies observées à la station 2 pour la période 2001-


2010.

Mise en application sur Excel


2.1. La régression
2.1.2. régression non linéaire

Les modèles de régression non linéaire existants :


- Le modèle puissance: 𝑦 = 𝑎𝑥 𝑏
- Le modèle exponentiel: y = 𝑎 𝑒 𝑏𝑥
- Le modèle parabolique (polynomial):𝑦 = 𝑎 + 𝑏𝑥 + 𝑐𝑥 2

Les coefficients a, b et c sont des constantes à déterminer par la


méthode des moindres carrés