Vous êtes sur la page 1sur 3

Prof : Boufares Amor

Cours de statistiques

4me anne secondaire

I) Vocabulaire statistiques :
Population : cest un ensemble dobjets mathmatiques comme ensemble des animaux, ensemble des vgtaux, ensemble des personnes etc. Individu : cest un lment de la population. Echantillon cest une partie dune population. Taille de la population : cest le cardinal de la population. Caractre : cest une proprit X tudie sur une population. Modalit : c'est une valeur numrique ou non prise par le caractre X. Il y a trois types de caractres : Caractre qualitatif : cest un caractre non mesurable comme la situation familiale dune personne, la couleur des cheveux dune personne etc. Caractre quantitatif discret : cest un caractre mesurable qui prend des valeurs isols x 1 , x 2 ,..., x n comme le poids, la taille etc. Caractre quantitatif continu : cest un caractre qui prend les valeurs des intervalles de la forme [a, b [ appels les classes comme le prix dun article, le salaire mensuel etc. Effectif dune modalit x i : cest le nombre n i dindividus ayant cette modalit. n Frquence dune modalit x i : cest le rel f i i o n est la taille de la population. n Srie statistique simple : cest lensemble des couples ( x i , n i ) o 1 i p. ou encore lensemble des couples ([ a i - 1 , a i [, n i ) o 1 i p.On dit aussi que X est une srie statistique simple sur une population de taille
p

n = ni .
i 1

Tableau statistique :

Modalits x i Effectifs n i

x1 n1

xp

n2

1 p Moyenne du caractre X : cest le rel X n i x i . n i 1 1 p Variance dun caractre X : cest le rel V(X) = n i ( x i ) 2 - (X) 2 n i 1
Ecart-type dun caractre X : cest le rel (X) V(X) .

II) Statistiques doubles :


Dfinition : soit X et Y deux variables tudies simultanment sur une population de taille n.Lensemble des couples ( x i , y i ) o 1 i n, x i sont les valeurs prises par X et y i sont les valeurs prises par Y est appel srie statistique double.On dit aussi que (X, Y) est une srie statistique double sur une population de taille n.On prsente cette srie double comme suit : En donnes individuelles : x i x 2 .. x n y1 y 2 .. y n En donnes groupes : (Tableau double entre)
p q ij

X Y

x1 y1
yj yq

xi n i1
n ij n iq

xp n p1 n pj n pq

n
i 1 j 1

=n

n 11
n 1j n 1q

n ij est leffectif du couple

( xi , y j )

Page 1 sur 3

Distributions marginales : Soit (X, Y) une srie statistique double. Lensemble des valeurs prises par X est appel distribution marginale de X. Lensemble des valeurs prises par Y est appel distribution marginale de Y. Covariance : Soit (X, Y) une srie statistique double sur une population de taille n. On appelle covariance du couple (X, Y) le rel not cov(X, Y) et est dfini par : En donnes individuelles 1 n cov(X, Y) x i y i - X Y n i 1 En donnes groupes 1 p q cov(X, Y) n ij x i y j - X Y n i 1 j 1

Coefficient de corrlation linaire : On appelle cfficient de corrlation linaire du couple (X, Y) le rel not r(X, Y) et est dfini par cov(X, Y) r(X, Y) .On a toujours -1 r(X, Y) 1. (X) (Y) Nuage de points : Soit (X, Y) une srie statistique double sur un chantillon de taille n, x i les valeurs prises par X et y i les valeurs prises par Y,lensemble des points M i ( x i , y i ) o 1 i n dans un repre orthogonal est appel nuage de points associ la srie double (X,Y). Le point G ( X, Y ) est le point moyen du nuage. Ajustement dune srie statistique double : Ajuster une srie statistique double veut dire trouver la courbe la plus proche de son nuage cest dire la courbe sur la quelle se trouvent les points du nuage donc trouver une relation entre X et Y de type X = f(Y) ou Y = f(X) Lorsque Y = f(X) on dit que la variable X est explicative et que Y est la variable explique comme par exemple :

f est une fonction trinme

f est une fonction logarithme

f est une fonction affine Lajustement affine consiste trouver une relation entre X et Y de type X = aY + b ou Y = aX + b.il y a deux types dajustement affine : Page 2 sur 3

Mthode de Mayer : Cette mthode consiste : * scinder le nuage N en deux sous nuages N 1 et N 2 de prfrence de mme effectif. * Dterminer les coordonnes des points moyens respectifs G 1 et G 2 des nuages N 1 et N 2 . * Dterminer lquation cartsienne de la droite de Mayer ( G 1G 2 ) qui doit passer par le point moyen G du nuage.

*Cette mthode est significative lorsque les sous nuages N

et N 2 sont relativement loigns lun de lautre :

Droites des moindres carrs : Il y a deux droites des moindres carrs : cov(X, Y) D1 : y ( x - X) Y est appele droite de rgression de Y en X. V(X) cov(X, Y) D2 : x ( y - Y ) X est appele droite de rgression de X en Y. V(Y) Ces deux droites passent par le point moyen G du nuage.

* Cette mthode est significative lorsque le nuage est allong c'est--dire lorsque
contente aussi de la condition 0,75 r(X, Y) 1 . Dans ce cas les prdictions faites au moyen de cet ajustement sont raisonnables :

3 < r(X, Y) 1 et on se 2

III) Point final:


Lorsque les variables X et Y sont continues alors les x i et les y j dans toutes les formules prcdentes sont les centres des classes.

Page 3 sur 3