Vous êtes sur la page 1sur 4

LYCLA - COSAPIE X EDEA Année scolaire 2022-2023

Notes de cours de Mathématiques classes : Tle C et Tle D

Module 26 : ORGANISATION ET GESTION DES DONNEES


Chapitre : STATISTIQUES A DEUX VARIABLES
Leçon : TABLEAUX DE CONTINGENCE, TABLEAUX MARGINAUX
NUAGE DE POINTS ET COORDONNEES DU POINT MOYEN
leçons digitalisées en ligne No : 50, 51, 52.

Objectifs :
➢ Regrouper les données d’une série statistique à deux caractères quantitatifs dans un
tableau à double entrée,
➢ Dresser les tableaux marginaux d’une série à deux caractères, calculer les paramètres
marginaux,
➢ Construire dans le plan le nuage de points.
A- Prérequis :
Définis : Caractère ; série statistique.
B- Situation problème :
Voici les informations concernant 10 patients reçus au cours d’une semaine à l’accueil d’un
service de pédiatrie :
Age Taille Durée de la sieste Nombre d’enfants
Enfant
(mois) (cm) (min) dans la famille
Christopher 58 105 30 1
Emile 24 85 120 3
Félix 22 84 105 2
Grace 28 90 100 1
Arianne 55 105 45 5
Léa 44 99 60 2
Nathan 37 94 75 2
Sara 35 91 90 1
Tristan 52 103 45 2
William 25 89 120 3

Mais le pédiatre aimerait faire des interprétations entre l’âge et la taille d’un enfant d’une part, la
durée de la sieste et le nombre d’enfants dans la famille d’autre part.
Comment présenter ces informations de manière à aider le médecin ?
C- Activités :
On désigne par : X le caractère « âge d’un patient » , Y le caractère « taille d’un patient », MX
l’ensemble des modalités du caractère X, MY l’ensemble des modalités du caractère Y.
1. Alors MX ={ } et MY ={ }
2. Dresse un tableau qui donne le produit cartésien MX× MY des ensembles MX et MY .
3. A partir de ce tableau à double entrée reconstituer les séries associées respectivement
aux caractères X et Y.
4. On munit le plan d’un repère orthogonal. Fais une représentation graphique des points Mij
de coordonnées (xi ;yj).
5. Réponds à la question 4 précédente pour les caractères W : « nombre d’enfants dans la
famille » et Z : « durée de la sieste d’un enfant ».

Mathématiques Tle C-D 237COSAPIEX-L.C.E Notes de cours de statistiques EBODEER novembre 2023 Page 1
Résumé
Soit X et Y deux caractères définis sur une population, on désigne par M X l’ensemble des
modalités du caractère X, MY l’ensemble des modalités du caractère Y.
Nuage des points
On munit le plan d’un repère orthogonal.
On appelle nuage de points associé à la série statistique double de caractères (X ;Y) la
représentation graphique de MX× MY dans le plan dont tous les points ont un couple de
coordonnées (xi ;yj) d’effectif nij non nul.
Représentation par des points pondérés : on indique à coté de chaque point Mij de coordonnées
(xi ;yj) l’effectif nij .
Représentation par tache : chaque point Mij (xi ;yj) est représenté par un disque dont l’aire est
proportionnelle à l’effectif.
Point moyen du nuage
On appelle point moyen d’un nuage de points Mij de coordonnées (xi ;yj) le point G de
coordonnées (xG ;yG) où xG est la moyenne de la série marginale associée au caractère X et yG
est la moyenne de la série marginale associée au caractère Y.
Exemple : On a relevé la masse (en kg) et la taille (en cm) des patients à l’accueil d’un hopital ;
on a obtenu les résultats suivants.
Masse
62 62 68 68 59 71 68 68 74 71 62 68 71 74 71 77 62 77 68 71
(x)
Taille
174 168 165 171 165 174 171 165 174 174 174 171 171 168 174 180 168 180 171 174
(y)
1. Dresse le tableau à double entrée de la série double.
2. Représente le nuage de points pondérés associé à la série double (x ;y).
3. Calcule les coordonnées du point moyen G du nuage.

Leçon : AJUSTEMENT LINEAIRE


Leçons digitalisées en ligne No 53, 54, 55, 56.

Objectifs : Apprécier la corrélation entre deux variables statistiques ; Ajuster un nuage de points
par une droite par la méthode de MAYER ou la méthode des moindres carrés.
A- Prérequis : Ecrire l’équation d’une droite passant par deux points donnés.
B- Situation problème :
Le tableau suivant donne la tension artérielle moyenne y en fonction de l’âge x d’une population.
Age (xi) 36 42 48 54 60 66
Tension (yi) 11,3 14 12,6 15 15,5 15,1
TOM en weekend au village est resté seul avec sa grand-mère de 70 ans. Au moment de l’aider
à prendre ses remèdes, Il constate que la tension artérielle de la grand-mère est de 16,2.
Cela parait-il normal ?
C- Activité :
On considère la série double de la situation d’entrée ci-dessus.
1. Représente le nuage de points de coordonnées (xi ;yi) associé à cette série double.
2. Le nuage de points a une forme qui se rapproche d’une droite ( D ) . On aimerait trouver la
droite la plus proche possible de ce nuage.
a) Ordonne les données en ordre croissant selon la 1ère variable.

Mathématiques Tle C-D 237COSAPIEX-L.C.E Notes de cours de statistiques EBODEER novembre 2023 Page 2
b) Partage la distribution en deux groupes équipotents (contenant le même nombre de
données)
c) Détermine les coordonnées des points moyens G1 et G2 de chacun des deux sous-
groupes.
d) Vérifie que la droite (G2G2) passe « aussi près » des points du nuage.
n

 ( x − x )( y − y )
i i
3. Posons ( D ): y = ax + b avec a = i=1
n
et b = y − ax .
( x −x )
2
i
i=1

Vérifie que la droite ( D ) passe « plus près (que la droite (G2G2))» des points du nuage.
4. Utilise l’équation de la droite ( D ) pour déterminer y pour x = 70 .
Réponds alors à la question de la situation problème.
D- Résumé
Soit X et Y deux caractères quantitatifs étudiés sur une population, MX ={x1 ; x2 . . . xn} ,
MY ={y1 ; y2 . . . yn}.
Covariance d’une série double
On appelle covariance d’une série statistique double de caractères (X ;Y) le nombre réel noté
n
cov ( X ; Y ) ou  XY et défini par cov ( X ; Y ) = 1  ( xi − x )( yi − y ) .
n i=1
n n
On montre que :  ( xi − x )( yi − y ) =  xi yi −x . y .
1 1
n i=1 n i=1
Droite des moindres carrés :
Le plan est muni d’un repère orthogonal.
SI X et Y sont en corrélation linéaire alors il existe une droite d’ajustement du nuage et une seule
qui constitue le meilleur ajustement du nuage. Elle a pour équation y = ax + b avec
cov ( X ; Y )
a= et b = y − ax . Cette droite est appelée droite de régression de Y en X.
( X )
2

cov ( X ; Y )
- Droite de régression de X en Y : ( D '): x = a ' y + b ' avec a ' = et b '= x −a ' y .
( Y )
2

Corrélation linéaire :
Définition : deux variables statistiques X et Y sont dites en corrélation linéaire lorsque la courbe
de régression de Y en X et la courbe de régression de X en Y sont des droites.
On appelle coefficient de corrélation linéaire d’une série statistique double de caractères (X ;Y) le
cov ( X ; Y )
nombre noté r définie par : r= .
 XY
Propriétés :
i. aa ' = r 2 ; r = aa ' . Si a  0 et a '  0 alors r = aa ' . Si a 0 et a '  0 alors r = − aa '
ii. Si r 2 =1 alors a = 1 , les droites ( D ): y = ax + b et ( D '): x = a ' y + b ' sont confondues.
a'
On dit que l’ajustement linéaire est parfait.
Mathématiques Tle C-D 237COSAPIEX-L.C.E Notes de cours de statistiques EBODEER novembre 2023 Page 3
iii. Si r est proche de 1, on dit qu’il y a une bonne corrélation ou encore une forte corrélation
entre les deux variables.
iv. La corrélation linéaire entre les deux variables est forte lorsque 0,87  r 1 .
Exemple :
Associe chacun des
nuages de points ci-
dessous au coefficient de
corrélation linéaire qui lui
correspond.

Ajustement linéaire par la méthode de MAYER


Etapes :
a) Ordonner les données en ordre croissant selon Exemple :
la première variable. Remarque : pour deux
valeurs égales de X, ordonner les valeurs de Y
correspondantes en ordre croissant.
b) Partager la distribution en deux groupes
équipotents (contenant le même nombre de
données). Remarque : si le nombre de
données est impair, la donnée du centre est
placée dans chacun des deux groupes.
c) Déterminer la moyenne des abscisses et la
moyenne des ordonnées des points de chacun
des groupes ; définir deux points G1 et G2 dont
les coordonnées sont des moyennes trouvées.
d) Tracer la droite de MAYER qui passe par les
points G1 et G2 et trouver son équation.

Mathématiques Tle C-D 237COSAPIEX-L.C.E Notes de cours de statistiques EBODEER novembre 2023 Page 4

Vous aimerez peut-être aussi