Académique Documents
Professionnel Documents
Culture Documents
M1 ASD
2023/2024
Description unidimensionnelle de
données numériques
• La plupart du temps les données se présentent sous la forme suivante: on
a relevé sur n unités appelées «individus» et p variables numériques.
Lorsque n et p sont grands on cherche à synthétiser cette masse
d’information sous une forme exploitable et compréhensible.
La La
Tableau de contingence (ou Tableaux croises) :
Statistique marginale :
Exemple :
On a relevé les notes en statistique et en physique obtenues par 100 étudiants
d’une section A /M1 . On a obtenu le tableau suivant :
1) Préciser le type du tableau de données. Calculer n23
et donner sa signification.
2) Déterminer les deux distributions marginales.
3) Calculer sa moyenne et sa variance.
4) Les variables X et Y sont-elles indépendantes ?
Justifier.
5) Donner le centre de gravité du nuage de points.
• Indépendance entre 2 caractères
Deux caractères X et Y sont indépendants si les variations de l’un des caractères n’entrainent pas de
variations pour l’autre caractère.
Définition : les séries statistiques (xi, ni.) i=1,…,p et (yj, n.j) j=1,…,k sont dites indépendantes si on a :
Représentation graphique : nuage de points
Covariance entre deux caractères :
Coefficient de corrélation linéaire
- La corrélation est une mesure qui décrit la force et la direction
d'une relation entre deux variables. Il est couramment utilisé
dans les statistiques, l'économie et les sciences sociales pour
les budgets, les plans d'entreprise, etc.
�
𝑿𝑿𝑿 = 𝑿𝑿 − 𝑿𝑿 et �
𝐘𝐘𝐘 = 𝒀𝒀 − 𝒀𝒀
Exemple 1 : Soit le tableau des données correspondant à deux variables statistiques 𝑿𝑿 et Y
1 étape:: Calculer la moyenne
X Y
𝒆𝒆𝟏𝟏 1 6
𝒆𝒆𝟐𝟐 3 2
𝟏𝟏+𝟑𝟑 𝟔𝟔+𝟐𝟐
On a : �
𝑿𝑿 = 𝟐𝟐 = 2 et �
𝒀𝒀 = 𝟐𝟐 = 4
�≠ 0
𝑿𝑿 et �𝒀𝒀 ≠ 0 Le tableau n’est pas centré
𝒀𝒀𝟏𝟏 = 𝑿𝑿𝟏𝟏 − �
𝑿𝑿𝟏𝟏 𝒀𝒀𝟐𝟐 = 𝑿𝑿𝟐𝟐 − �
𝑿𝑿𝟐𝟐
𝐞𝐞𝟏𝟏 -1 2
𝐞𝐞𝟐𝟐 1 -2
Les vecteurs X(-1,1) et Y(2,-2) de 𝑹𝑹𝟐𝟐 ; le plan 𝑹𝑹𝟐𝟐 est aespace des individus, car
chaque axe du repère orthonormé est associé à un individu
• Dans l’exemple 1, on peut voir clairement que les vecteurs Y et X sont
colinéaires et de sens contraire, l’angle de Y1 et Y2 est donc égal à , or le
résultat que l’on retrouve en utilisant la formule (1),
Lorsque les vecteurs sont linéairement dépendants (liés), il existe tel que : Y = aY1 +b,
2
4+6+8
�
Les moyennes : 𝑋𝑋1 = =6 et �𝑋𝑋2 = 5+7+0 = 4
3 3
R est une matrice symétrique, ayant des «1» sur la diagonale (les
variances des variables) et tous ses éléments sont inférieurs ou égales
à 1 en valeur absolue.
• Calcul du produit matriciel ZZ' :
Cette matrice V n’est pas une matrice de corrélation, mais elle porte le nom de matrice
d’information des individus. Elle est symétrique aussi.
• Matrice de Variance- covariance : Matrice de corrélation
On appelle matrice de corrélation la matrice
Lorsque l’on observe les valeurs regroupant tous les coefficients de corrélation
numériques de variables sur linéaire entre les p variables prises deux à deux
qu’on la note R
individus on se trouve en présence
d’un tableau à lignes et colonnes.