Académique Documents
Professionnel Documents
Culture Documents
1 Généralités
Les statistiques sont des ensembles des données d’observation : recensement (ce sont des
chiffres). Les probabilités forment une branche de mathématique et sont donc rigoureuses et
exactes. Pour cela, elles travaillent des objets mathématiques parfaitement définis et abstraits.
Le mot statistique a été introduit par l’italien GHISLINI en 1589 et désignait la science des-
criptive des états. Aujourd’hui, ce mot désigne la méthode scientifique dont le but est l’étude
des propriétés numériques des ensembles.
Elle comprend trois phases :
- L’élaboration des données statistiques systématiques sur un sujet quelconque. Cette phase
surtout descriptive compose la collecte de données ainsi obtenues sous forme de tableaux sta-
tistiques et graphiques.
- L’interprétation des résultats de l’analyse qui permet de vérifier les hypothèses et de pré-
visions. C’est la phase décisive de l’étude statistique.
Lors qu’on observe et étudie un seul trais de caractère sur une population, on parle de sta-
tistique descriptive uni-variée ou de distribution statistique à une seule variable.
a) Caractère qualitatif : Un caractère est qualitatif s’il est lié à une observation ne fai-
sant pas l’objet d’une mesure. Ex : la population tchadienne peut être caractérisée par le sexe
(masculin ou féminin), l’état matrimonial(célibataire, mariée, veuve, divorcée,...)
Définition 4 : Les modalités sont des différentes rubriques associées à un caractère quali-
tatif. Ainsi le caractère "sexe" comporte deux modalités qui sont masculin et féminin.
1
1.3 Présentation en tableau 1 GÉNÉRALITÉS
Propriétés 1 : Les modalités d’un caractère doivent former une partition, c’est-à-dire être
exhaustives et disjointes. A chaque individu, on doit pouvoir associer une modalité et une seule.
2
1.5 Représentation graphique
2 ÉLÉMENTS CARACTÉRISTIQUES DES SÉRIES STATISTIQUES
1) Par convention, une classe est un intervalle fermé à gauche et ouvert à droite du type
[xp − xi=p+1 [. Elle est dite bornée si xi 6= −∞ et xi+1 6= +∞.
2) l’effectif ni de la classe [xi − xi+1 [ est le nombre d’individus dont le caractère prend une
valeur ≥ à xi et strictement inférieur à xi+1 (xi < xi+1 ).
yi = xi+1 − xi
-Diagramme en bandes
Le caractère étant qualitatif, on place sur une droite horizontale, les modalités du caractère.
On porte sur un axe vertical les effectifs ou les fréquences et on trace une bande verticale
proportionnelle à l’effectif associé à cette modalité.
3
2.2 caractéristique de
2 tendance
ÉLÉMENTScentrale
CARACTÉRISTIQUES DES SÉRIES STATISTIQUES
C : célibataire,
M : marié(e)
V : veuf(ve)
D : divorcé(e)
Le domaine de la variable X est {C, M, V, D}. Considérons la série statistique suivante :
MMDCCMCCCM
CMVMVDCCCM
Ici, n = 20, alors x1 = M, x2 = M, x3 = D, x4 = C, x5 = C, ...., x2 0 = M.
2.2.2 La médiane
C’est la valeur qui sépare une série d’observations ordonnées en ordre croissant ou décrois-
sant, en deux parties comportant le même nombre d’observations. On la désigne par la notation
Me.
Méthode de calcul
- Présenter les données sous forme de série. Lorsque les données sont présentées sous forme
de tableau de distribution, les convertir en série.
- Ordonner la série par ordre croissant ou décroissant.
- Déterminer si la série comprend un nombre pair ou impair d’unités statistiques.
Soit N le nombre d’observations :
Cas où N est impair : Dans ce cas la médiane est la valeur qui occupe le rang N2+1 dans la
série ordonnée.
Exemple : Série S = 2 ; 4 ; 4 ; 6 ; 7 ; 8 ; 10 ; 10 ; 12. Ici, la médiane est égale à 7.
N
Cas où N est pair : Dans ce cas la médiane est la moyenne des valeurs de rangs 2
et
N
2
+ 1.
4
2.3 caractéristique de dispersion 3 AJUSTEMENT LINÉAIRE
2.3.3 La variance
La variance est la somme des carrés des écarts à la moyenne divisée par le nombre d’obser-
vations : n
2 1X
sx = (xi − m)2 .
n i=1
La variance peut aussi s’écrire :
n
1X 2
s2x = x − m2 .
n i=1 i
2.3.4 L’écart-type
p
L’écart-type est la racine carrée de la variance : δx = s2x .
3 Ajustement linéaire
Dans le cas où on peut mettre en évidence l’existence d’une relation linéaire significative
entre deux caractères quantitatifs continus X et Y (la silhouette du nuage de points est étirée
dans une direction), on peut chercher à formaliser la relation moyenne qui unit ces deux variables
à l’aide d’une équation de droite qui résume cette relation. Nous appelons cette démarche
l’ajustement linéaire.
5
3.2 Droite de régression 3 AJUSTEMENT LINÉAIRE
Cov(X, Y )
σX Y =
δX δY
Proposition 3 : Le coefficient est compris entre [−1, 1], ou encore |σX Y | ≤ 1
Le coefficient mesure le degré de liaison linéaire entre X et Y.
- Plus le module de σX Y est proche de 1 plus X et Y sont liées linéairement.
- Plus le module de σX Y est proche de 0 plus il y a l’absence de liaison linéaire entre X et Y .
Y = aX + b,
telle que la distance entre le nuage de points et droite soit minimale. Cette distance matérialise
l’erreur, c’est à dire la différence entre le point réellement observé et le point prédit par la droite.
Si la droite passe au milieu des points, cette erreur sera alternativement positive et négative,
la somme des erreurs étant par définition nulle. Ainsi, la méthode des moindres carrés consiste
à chercher la valeur des paramètres a et b qui minimise la somme des erreurs élevées au carré.
On pose
Xn
e2i = U (a, b),
i=1
La méthode des moindres carrées consiste donc à minimiser la fonction U (la somme des erreurs
commises). Nous avons la condition de minimisation suivante,
∂U ∂U
= =0
∂a ∂b
avec n
X
U (a, b) = (yi − axi − b)2 .
i=1
L’équation
∂U
=0
∂b
donne n
X
−2(yi − axi − b)
i=1
6
3.2 Droite de régression 3 AJUSTEMENT LINÉAIRE
b = y − − ax− .