Vous êtes sur la page 1sur 6

La mdiane partage l'histogramme des frquences en 2 parties d'aires gales.

II. 2. 1. 3. La moyenne
La moyenne ne se dfinit que pour une variable statistique quantitative. Pour une variable statistique discrte {(xi, ni)}1 i p valeurs dans , la moyenne est la moyenne arithmtique des modalits pondres par les effectifs : = ni xi = X (), avec N = ni. Pour une variable statistique discrte {((xij)1 j q, ni)}1 i p valeurs dans q, la moyenne est encore la moyenne arithmtique des modalits dans q, pondres par les effectifs : = ni = = . est le "point moyen" qui rsume le nuage de points de q. Il caractrise un individu moyen reprsentatif du nuage de donnes.

Exemple.
L'tude de 21 familles a conduit la distribution suivante suivante le nombre d'enfants dans la famille : Le nombre moyen d'enfants par famille est = ni xi = (0 5 + 1 3 + 2 6 + 3 1 + 4 Nombre d'enfants xi 0 1 2 3 4 5 Nombre de familles ni 5 3 6 1 3 3 Cours de Statistique - Chapitre 2 - Paramtres caractristiques Page 14 3 + 5 3) = = . Naturellement, cette moyenne ne reprsente pas une "famille moyenne" mais donne une estimation du nombre d'enfants dans une famille dont est extrait l'chantillon : nous pourrons dire que, dans cette population, il faudra, en moyenne, 7 familles pour avoir 15 enfants, ou que 100 familles auront, en moyenne, 214 enfants.

a) Proprits de la moyenne.
Somme. La somme X + Y de deux variables statistiques X et Y est dfinie par : (X + Y) () = X () + Y (), pour tout . Nous avons alors crire : = (X + Y) () = (X () + Y ()) = X () + Y () = + Produit par un scalaire Le produit X d'une variable statistique X par un nombre rel est dfini par : (X) () = X (), pour tout . Nous pouvons alors crire : = (X) () = X () = . Ecart moyen la moyenne. = (X ) () = (X () ) = X () = 0 Soit une population de commerants, partitionne en trois catgories disjointes : A : les supermarchs, B : les moyennes surfaces, C : les petits dtaillants. Soit X le prix du litre d'huile. Soit le prix moyen du litre d'huile dans les supermarchs : c'est le quotient entre le prix de vente total de l'huile dans les supermarchs, et le nombre total de litres vendus dans les supermarchs.

De mme, soit , le prix moyen du litre d'huile dans les moyennes surfaces. De mme, soit , le prix moyen du litre d'huile chez les petits dtaillants. La relation prcdente (thorme de la moyenne conditionne) permet de calculer le prix moyen du = fi = fi xi Deuxime hypothse. Dans chaque classe, la rpartition des observations est uniforme. Alors, par raison de symtrie, la moyenne d'une classe est la valeur centrale xi = (ei + ei + 1) de la classe. On a encore : = fi = fi xi Conclusion : dans le cas d'une variable statistique continue, pour effectuer le calcul du point moyen, l'hypothse de rpartition uniforme dans chaque classe est quivalente l'hypothse d'une concentration de toutes les modalits d'une classe au centre de la classe.

d) Gnralisation de la notion de moyenne. Soit X = {(xi, ni)}, i [ 1, p ], une variable statistique quantitative discrte valeurs dans R+
*,

N= ni. Soit : R+ * R une application monotone (injection croissante ou dcroissante) continue. Alors (X) = {((xi), ni)}, i [ 1, p ], est une variable statistique quantitative discrte valeurs dans R. On peut calculer sa moyenne = ni (xi). est un nombre rel, compris entre la valeur minimum et la valeur maximum de (xi), i [ 1, p ]. Comme est une injection continue, il existe un unique R+ * tel que ( ) = Cours de Statistique - Chapitre 2 - Paramtres caractristiques Page 17 est appel la -moyenne de X.

Exemples de -moyennes.

1. Si est l'application identique dfinie par (x) = x, la -moyenne de X est la moyenne arithmtique de X, c'est la moyenne au sens ordinaire. 2. Si est dfinie par (x) = x 2, nous obtenons la moyenne quadratique q de X, dfinie par
q 2=

ni xi 2. 3. Si est dfinie par (x) = , nous obtenons la moyenne harmonique h de X, dfinie par = ni . 4. Si est dfinie par (x) = ln (x), nous obtenons la moyenne gomtrique g de X, dfinie par ln ( g) = ni ln (xi), soit g = xi

Proprits des -moyennes.


Pour une variable statistique X, les diffrentes moyennes, harmonique, gomtrique, arithmtique, quadratique, sont lies par la relation :

Il y a galit si, et seulement si, toutes les valeurs de X sont gales. La moyenne gomtrique est bien adapte l'tude des phnomnes de croissance. La moyenne harmonique est utilise pour les calculs d'indices conomiques. h g q. Cours de Statistique - Chapitre 2 - Paramtres caractristiques Page 18

II. 2. 2. Paramtres de dispersion


Les paramtres de dispersion (tendue, intervalle interquartile,) sont calculs pour les variables statistiques quantitatives. Ils ne donnent pas une information complte sur une variable statistique X : en effet, deux variables qui ont la mme moyenne peuvent se prsenter avec des dispersions trs diffrentes. L'histogramme, ou le diagramme, des frquences donnent dj une ide qualitative de la dispersion.

II. 2. 2. 1. Etendue
Soit X une variable statistique relle discrte. L'tendue de X est la diffrence entre la plus grande valeur de X et la plus petite valeur de X. Ce paramtre est souvent utilis dans les contrles de fabrication, pour lesquels on donne, a priori, des marges de construction. Son intrt est limit par le fait qu'il dpend uniquement des valeurs extrmes, qui peuvent tre des valeurs aberrantes.

II.2.2.2. Quartiles et dciles.


a) Variable statistique continue. Pour une variable statistique quantitative relle continue X, on appelle quartiles les nombres rels Q1, Q2, Q3, pour lesquels les frquences cumules de X sont respectivement 0,25, 0,50, 0,75. Ce sont les valeurs pour lesquelles l'ordonne de la courbe cumulative des frquences est respectivement gale 0,25, 0,50, 0,75. Les quartiles partagent l'tendue en quatre intervalles qui ont le mme effectif. Le deuxime quartile, Q2, est gal la mdiane. L'intervalle interquartile est la diffrence entre les valeurs du troisime et du premier quartiles : Q3 Q1. L'intervalle [Q1, Q3] contient 50 % des valeurs de X. b) Variable statistique discrte. Pour une variable statistique relle discrte X, la courbe des frquences cumules est une courbe en escalier. S'il existe une valeur de x pour laquelle la frquence cumule est 0,25 (resp. 0,50, 0,75), le quartile correspondant est cette valeur de X. Sinon, les quartiles seront dtermins par interpolation linaire entre deux valeurs. = xmax xmin

Cours de Statistique - Chapitre 2 - Paramtres caractristiques Page 19 c) Dciles et percentiles. Les 9 dciles sont les nombres rels qui partagent l'tendue en dix intervalles de mme effectif. Utilisation : en matire de salaires, le rapport est un paramtre de dispersion frquemment utilis. Les 99 percentiles sont les nombres rels qui partagent l'tendue en cent intervalles de mme effectif.

II.2.2.3. Ecart absolu moyen.


a) Dfinition. Soit X = {(xi, ni)}1 i p une variable statistique relle. On appelle cart absolu moyen de X la moyenne arithmtique des valeurs absolues des carts de X sa moyenne : e = ni | xi | On pourrait aussi dfinir l'cart absolu moyen de X par rapport sa mdiane, ou par rapport un nombre rel a quelconque. e = ni | xi a | On peut dmontrer que l'cart absolu moyen par rapport un nombre rel a est minimum lorsque a est gal la moyenne de X. b) Calcul pratique. Lorsque les observations sont groupes par classe, on adopte gnralement pour valeur de variable statistique le centre de chaque classe. L'cart absolu moyen prsente un inconvnient majeur : il ne se prte pas facilement aux calculs algbriques, cause de la valeur absolue.

II.2.2.4. Variance et cart-type.


a) Dfinition. Soit X = {(xi, ni)}1 i p une variable statistique relle. On appelle variance de X, la moyenne arithmtique des carrs des carts de X sa moyenne : s 2 (X) = (X () ) 2 = ni ( xi ) 2 On appelle cart-type de X la racine carre s (X) de la variance de X. S = N s 2 (X) est la somme des carrs des carts : S = ni ( xi ) 2 b) Formulere quantitatif. La variable statistique est la mesure du caractre. Celle-ci peut tre discrte ou continue. Il existe deux types de reprsentation graphique d'une distribution statistique caractre quantitatif : Le diagramme diffrentiel correspond une reprsentation des effectifs ou des frquences. Le diagramme intgral correspond une reprsentation des effectifs cumuls, ou des frquences cumules.

a) Variable statistique discrte.


Diagramme diffrentiel : diagramme en btons, des effectifs ou des frquences. La diffrence avec le cas qualitatif consiste en ce que les abscisses ici sont les valeurs de la variable

statistique. Diagramme intgral : courbe en escaliers des effectifs cumuls ou des frquences cumules. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 7

Exemple.
En vue d'tablir rationnellement le nombre de postes de travail ncessaires pour assurer sa clientle un service satisfaisant, une agence de voyage a fait relever, minute par minute, le nombre d'appels tlphoniques reus au cours d'une priode de 30 jours. Cette opration a fourni, pour la tranche horaire de pointe qui se situe entre onze heures et midi, les rsultats suivants : La population tudie est celle des 1 800 minutes composant la dure totale des appels dans la tranche horaire de onze heures midi pendant 30 jours. Le caractre observ est le nombre d'appels tlphoniques : c'est un caractre quantitatif et la variable statistique correspondante, qui ne peut prendre que des valeurs entires, est discrte. La reprsentation des effectifs est identique celle des frquences : seule change l'chelle verticale. La reprsentation graphique diffrentielle correcte est le diagramme en btons. A chaque valeur xi de la variable, porte en abscisse, on fait correspondre un segment vertical de longueur proportionnelle la frquence fi de cette valeur. Le regroupement des valeurs extrmes de la variable en une seule classe (nombre d'appels suprieur ou gal 8) interdit normalement la reprsentation graphique de ce dernier segment. Mais, tant donne la frquence quasi ngligeable de cette classe, l'inconvnient n'est pas bien grand et l'on pourra reprsenter par un segment l'abscisse 8, la frquence des appels de dure 8 ou plus. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 8 La reprsentation graphique intgrale correcte est la courbe en escalier : les frquences des diverses valeurs de la variable statistique correspondent aux hauteurs des marches de la courbe en escalier.

b) Variable statistique continue.


Les observations sont regroupes en classes. Chaque classe possde une certaine amplitude, qui est la longueur de l'intervalle dfinissant la classe. Le rapport entre l'effectif d'une classe et son amplitude s'appelle la densit d'effectif. Le rapport entre la frquence d'une classe et son amplitude s'appelle la densit de frquence. Diagramme diffrentiel : histogramme des densits. Nous portons en abscisse les classes reprsentant les modalits et en ordonnes des rectangles dont la longueur est proportionnelle la densit d'effectif ou la densit de frquence. L'aire d'un rectangle de cet histogramme est alors proportionnelle l'effectif ou la frquence de la classe. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 9 Diagramme intgral : courbe cumulative des effectifs ou des frquences. La courbe cumulative des frquences doit reprsenter la fonction de rpartition de la variable

statistique.

Exemple.
La Fdration nationale de la rparation et du commerce de l'automobile a effectu une enqute auprs de ses adhrents visant mieux connatre la structure de ce secteur. Cette opration a fourni la rpartition suivante des entreprises de la rparation de du commerce de l'automobile selon leur chiffre d'affaires annuel. La masse de chiffres d'affaires correspondant aux entreprises de la premire et de la dernire classes s'lve respectivement 1 714 et 110 145 millions de francs. La population tudie est celle des entreprises de la rparation et du commerce de l'automobile. Le caractre observ est le chiffre d'affaires. C'est un caractre quantitatif et la variable statistique correspondante est continue. La reprsentation graphique diffrentielle correcte est l'histogramme des densits de frquences. Pour la premire et la dernire classes, l'amplitude de la classe n'est pas connue. On dtermine alors la moyenne de la classe, qu'on considre comme la valeur centrale de la classe (quand on construit un histogramme, on fait l'hypothse implicite que les effectifs sont rpartis uniformment l'intrieur de la classe, la moyenne de la classe est alors le centre de la classe). Pour la premire classe, la moyenne du chiffre d'affaires est = 0,125, de sorte que la premire classe est la classe [ 0,00 , 0,25 [. Pour la dernire classe, la moyenne du chiffre d'affaires est = 35, de sorte que la dernire classe est la classe [ 10,00 , 60,00 [. La reprsentation graphique intgrale correcte est la courbe cumulative des frquences. Pour que chaque point exprimental reprsente la fonction de rpartition, il faut prendre pour abscisses les limites suprieures des classes et, pour ordonnes, les frquences cumules correspondantes. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 10 Comme la variable statistique est continue, on tracera une courbe cumulative continue, et non une courbe en escalier, de faon qu' une valeur de frquence cumule corresponde une et une seule valeur de variable. Entre deux points exprimentaux, on trace un segment de droite reprsentant l'interpolation linaire, ou bien une courbe lisse, asymptotiquement tangente l'horizontale d'ordonne 100. Cours de Statistique - Chapitre 2 - Reprsentation graphique Page 11