Vous êtes sur la page 1sur 25

CHAPITRE II:

LA STATISTIQUE DESCRIPTIVE A
DEUX DIMENSIONS OU BIVARIÉE OU
DEUX VARIABLES
1- Introduction : :

La statistique descriptive à deux


dimensions a essentiellement pour but de
mettre en évidence les relations qui existent
entre les deux séries d’observations
considérées simultanément .
Comme en statistique descriptive a une dimension trois aspects
être envisagés :

1- l’élaboration des tableaux statistiques : permettant de condenser


les données sous la forme de distributions de fréquences à deux
dimensions. Exp : poids des feuilles et poids des racines de 1000
individus de Cichorium intybus en grammes .

feuilles
……….

0- 79 ……….
80-159 ……….
160-239 ……….
. .
. .
. .

q n.1
2- Les présentations graphiques :
2-1- la représentation des séries statistiques
doubles :
Les séries statistiques doubles peuvent être
représentées graphiquement sous la forme de
diagrammes de dispersion ou nuages de points
ceux –ci sont obtenus en représentant chaque
couple d’observation (xi ,yi ) point dans un plan
(x,y).
3- La réduction des données :
Cette réduction concerne deux types de
paramètres:

- Les uns ne concernent qu’une variable à la fois


(paramètre de position et dispersion).

- Les autres servent à décrire les relations existe


entre les deux variables simultanément
(covariance, cov(x,,y) coefficient de corrélation« r »,
coefficient de détermination « r2 », La droite de
régression y = b0 + bs ou y = a + b x , la variance
résiduelle :s2(x,y) l’écart type résiduel :s(x,y)).
3.1. La covariance: cov(x,,y)

La somme des produits des écarts sur n


Le développement de cette formule donne la suivante :
3.2. Le coefficient de corrélation ‘r’ ou r(x,y)
Le coefficient de corrélation mesure la netteté ou
degré ou la liaison qui existe entre les deux séries
d’observations, pour autant que cette liaison s’oint
linéaire ou approximativement linéaire
- le coefficient de corrélation est un coefficient de
corrélation linéaire et sa formule
La suivante :
- le coefficient de corrélation « r » est toujours compris entre -1 et +1
- -1  r  +1
* r=1 il a une parfaite corrélation positive entre 2 variables c.à.d. quand
l’une augmente l’autre augmente également et quand l’une diminue l’autre
diminue également le nuage de points et linéaire positif.

* r ≈ 1 très forte corrélation positive est approximativement linéaire pour


le nuage de points et toujours positif.

* r= -1 il a une parfaite corrélation négative entre 2 variables c.à.d. quand


l’une augmente l’autre diminue et vice-versa le nuage de points et de pente
négatif.

* r ≈-1 très forte corrélation négative est le nuage de points et


approximatifs linéaires de pente négatifs.

* r = 0 pas de corrélation le nuage de points est allongé parallèlement à l’un


des axes de coordonnées ou s’il a une forme arrondie.
3.3.Le coefficient de détermination ‘’ r 2 ‘’ :

• Il correspond par définition ou carré du coefficient de


corrélation,
• Compris entre 0 et 1 : 0  r2  +1,
• Il est toujours exprimé en pourcentage (  ).

Exemple : r2 = 0.38 =38  ils reprisent la part de la variance y est


expliquée où justifie par x

Quand r2 = 100  y est dépendu totalement par x , y =f(x)


Quand r2 = 0  les variables ne dépendent pas les uns par
apport les autres.
y est explique par x
y =f(x) = a + b x
y : variable à expliquer ou variable dépendante.
x: variable explicative ou variable dépendante.
3.4. La droite de régression ou sens des membres carrés

La droite de régression de y en x :
Cette droite a pour but de « résumer » le nuage de
point c.à.d. se représente sur le plan « l’allure »
formé de la distribution à 2 caractères cette droite
donne une idée de la façon doit varier ou
moyenne. La variable y dite dépendante ou
variable a expliqué en fonction de la variable x dite
indépendante ou explicative. Le droit est appelé
également : diagramme de régression.
Lorsque le diagramme de régression et
linéaire ou approximativement linéaire en
peut rechercher l’équation de droite qui
s’ajuste au mieux aux valeurs observées.

Cette droite de régression est généralement


déterminée par la méthode des moindres
carrés c.à.d. de manière à rendre minimum la
somme des carrés des écarts entre les points
observés et les points correspondants de la
droite.
La droite passe automatiquement par la moyenne
Ordonnée à l’ origine b

L’équation est obtenue par la méthode de moindre carré ou sens


des moindres carrés
3.5. La variance résiduelle: s2(x,y)

On appelle résidu d’ y par apport à x les


écarts des résidus peut-être + ou - La variance
résiduelle en symbolise s2(x,y) la dispersion des
points par apport à la droite.
Si l’indice
s2(x,y) =0  tous les points se trouvent sur la
droite donc
r= ±1
Si
r=0  r2=0  s2(x,y) = s2(y)
on peut rien expliquer le nuage de points et
très dispersé
3.6. L’écart-type résiduel

C’est l’erreur d’estimation si en utilise


cette équation:
y= a+bx
pour estimer y en fonction de x