Vous êtes sur la page 1sur 14

Lyce Stendhal

STATISTIQUES DESCRIPTIVES

Premire S M Obaton

Lquipe des professeurs de mathmatiques Lyce Stendhal

J'aimais et j'aime encore les mathmatiques pour elles-mmes comme n'admettant pas l'hypocrisie et le vague, mes deux btes d'aversion. Stendhal

Anne 2011-2012

Liste des savoirs et savoir-faire du chapitre :


CODE S0101 S0102 S0103 S0104 S0105 INTITULE A Dterminer moyenne, mdiane et quartiles dune srie statistique Dterminer variance et cart-type dune srie statistique Dresser le diagramme en bote dune srie statistique Dcrire le diagramme en bote dune srie statistique Comparer deux sries statistiques avec les outils appropris Bilan EA NA

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Statistiques Descriptives ( En premi`re S ) e


Derni`re mise ` jour : Dimanche 31 Dcembre 2011 e a e

Vincent OBATON, Enseignant au lyce Stendhal de Grenoble (Anne 2011-2012) e e

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-2-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Jaimais et jaime encore les mathmae tiques pour elles-mmes e comme nadmettant pas lhypocrisie et le vague, mes deux btes e daversion. Stendhal

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-3-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Table des mati`res e


1 Notation 2 Quelques gnralits et rappels e e e 2.1 Tri ` plat . . . . . . . . . . . . . . . a 2.2 Eectif total dune srie . . . . . . . e 2.3 Frquence dapparition dune valeur e 2.4 Tableau Standard statistique . . . . 3 Crit`re de position e 3.1 Mdiane . . . . . e 3.2 Quartiles . . . . 3.3 Dciles . . . . . . e 3.4 Moyenne . . . . . 3.5 Modes . . . . . . 5 5 5 5 6 6 6 6 7 7 8 9 9 9 9 9 10 11

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

4 Crit`re de dispersion e 4.1 Etendue . . . . . . . 4.2 Ecart Inter-Quartiles 4.3 Ecart Inter-Dciles . e 4.4 Variance . . . . . . . 4.5 Ecart-Type . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

5 Reprsentation statistiques e 11 5.1 Diagramme en bo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 te 5.2 Autres diagrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.3 Polygne des frquences cumules . . . . . . . . . . . . . . . . . . . . . . . 13 o e e 6 Plages de normalit des distributions normales Gaussiennes e 13

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-4-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Notation

La somme de n nombres numrots de 1 ` n peut scrire : e e a e x1 + x2 + x3 + x4 + + xn1 + xn mais cette criture est longue et les pointills ne sont pas satisfaisants. e e On crira, pour faire moins long et viter les pointills, cette somme ` laide du e e e a symbole Sigma :

X
n i=1

xi

Exemples :
n

1. 2. 3.

X X X
i=1 n i=0

xi = x0 + x1 + x2 + + xn1 + xn i = 1 + 2 + 3 + 4 + + (n 2) + (n 1) i2 = 02 + 12 + 22 + 32 + + (n 1)2 + n2

i=0 n1

2
2.1

Quelques gnralits et rappels e e e


Tri ` plat a

On note (xi ; ni )iN la srie statistique ci-dessous : e Rappels : Leectif ni est le nombre de fois o` appara la valeur xi dans la srie. u t e valeurs xi Eectifs ni x1 n1 x2 n2 x3 n3 x4 n4 ... ... ... ... ... ... xk2 nk2 xk1 nk1 xk nk

2.2

Eectif total dune srie e

Dnition : e Leectif total N de la srie statistique est la somme de tous les eectifs ou le nombre e de valeurs total dans cette srie : e N=

X
k i=1

ni = n1 + n2 + n3 + . . . + nk1 + nk

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-5-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

2.3

Frquence dapparition dune valeur e

Dnition : e La frquence dapparition dune valeur xi est la proportion de cette valeur par rapport e a ` leectif total. Eectif de la valeur ni Frquence par rapport ` 1 : fi = e a = Eectif total N 100ni Frquence par rapport ` 100 : Fi = e a N Proprits : e e

Sf = SF =

X X
k i=1 k i=1

fi = f1 + f2 + f3 + . . . + fk1 + fk = 1

Fi = F1 + F2 + F3 + . . . + Fk1 + Fk = 100

2.4

Tableau Standard statistique

Le tri ` plat dune srie statistique est un tableau contenant les valeurs de la srie, les a e e eectifs, les eectifs cumuls croissants, les frquences, les frquences cumules e e e e croissantes, les pourcentages et les pourcentages cumuls croissants. e valeurs xi Eectifs ni Eectifs Cum Croi Ni Frquences fi e Frquences Cum Croi Fi e Pourcentages pi Pourcentages Cum Croi Pi x1 n1 n1 f1 f1 p1 p1 x2 n2 N1 + n2 f2 F1 + f2 p2 P1 + p2 x3 n3 N2 + n3 f3 F2 + f3 p3 P2 + p3 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... xk1 nk1 Nk2 + nk1 fk1 Fk2 + fk1 pk1 Pk2 + pk1 xk nk N fk 1 pk 100

3
3.1

Crit`re de position e
Mdiane e

Dnition : e La mdiane dune srie statistique est la valeur qui partage cette srie en deux sries de e e e e mme eectif. e

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-6-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Si Me est la mdiane de la srie statistique, alors : e e 50 % des valeurs de la srie sont infrieures ou gales ` Me e e e a 50 % des valeurs de la srie sont suprieures ou gales ` Me e e e a Mthode pour trouver la mdiane : e e Il faut commencer par classer la srie dans lorde croissant. e N Si + 0, 5 = d est entier alors la mdiane est la d i`me valeur de la srie. e e e 2 N Si + 0, 5 = d, 5 est dcimale alors la mdiane est entre la d i`me et la d + 1 i`me e e e e 2 valeur de la srie. e

3.2

Quartiles

Dnition : e Les quartiles dune srie statistique sont les valeurs qui partagent cette srie en quatre e e sries de mme eectif. e e

Si Q1 est le premier quartile et Q3 le troisi`me de la srie statistique, alors : e e 25 % des valeurs de la srie sont dans [M in, Q1 ] e 50 % des valeurs de la srie sont dans [Q1 , Q3 ] e 25 % des valeurs de la srie sont dans [Q3 , M ax] e Mthode pour trouver les quartiles : e Il faut commencer par classer la srie dans lorde croissant. e On utilisera une mthode approximative mais qui donnera des rsultats signicatifs e e pour des sries ` grands eectifs. (Autement il sut de couper en deux les deux sries e a e [M in, Me ] et [Me , M ax]) N N Calculer et on note a lentier suprieur ` . e a 4 4 3N 3N et on note b lentier suprieur ` e a . Calculer 4 4 Q1 est la a i`me valeur de la srie statistique. e e Q3 est la b i`me valeur de la srie statistique. e e

3.3

Dciles e

Dnition : e Les dciles dune srie statistique sont les valeurs qui partagent cette srie en dix sries e e e e de mme eectif. e
Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e -7-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Si D1 est le premier dcile et D9 le neuvi`me de la srie statistique, alors : e e e 10 % des valeurs de la srie sont dans [M in, D1 ] e 80 % des valeurs de la srie sont dans [D1 , D9 ] e 10 % des valeurs de la srie sont dans [D9 , M ax] e Mthode pour trouver les dciles : e e Il faut commencer par classer la srie dans lorde croissant. e On utilisera une mthode approximative mais qui donnera des rsultats signicatifs e e pour des sries ` grands eectifs. e a N N Calculer et on note a lentier suprieur ` e a . 10 10 9N 9N et on note b lentier suprieur ` e a . Calculer 10 10 D1 est la a i`me valeur de la srie statistique. e e D9 est la b i`me valeur de la srie statistique. e e

3.4

Moyenne

Dnition : e La moyenne arithmtique de la srie statistique est le nombre : e e x= 1 N


k

X
i=1

xi ni =

x=

X
k i=1

x1 n1 + x2 n2 + x3 n3 + . . . + xk1 nk1 + xk nk N ou

xi fi = x1 f1 + x2 f2 + x3 f3 + . . . + xk fk

Proprits de la moyenne : ee 1. Si x est la moyenne dun groupe deectif N1 et y la moyenne dun groupe deectif N2 alors la moyenne z de la srie constitue de lensemble des deux e e groupes est : z= N1 x + N2 y N1 + N2

e e 2. Si x est la moyenne dune srie (xi , ni ) alors la moyenne de la srie (axi + b, ni ) est : y = ax + b
Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e -8-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

3. Moyenne lague : e e Quand une valeur aberrante, correspondant ` une erreur de mesure ou ` une a a situation exceptionnelle, est prsente dans une srie, elle inuence e e considrablement la valeur moyenne. Une moyenne calcule apr`s avoir enlev e e e e certaines valeurs est appele Moyenne elague. e e

3.5

Modes

Dnition : e Les modes dune srie sont les valeurs ayant le plus grand eectif. e

4
4.1

Crit`re de dispersion e
Etendue

Dnition : e Ltendue dune srie statistique est la dirence entre la plus grande valeur et la plus e e e petite, de la srie. e Et = M ax M in

4.2

Ecart Inter-Quartiles

Dnition : e Lcart inter-quartiles est la dirence entre Q3 et Q1 e e EQ = Q3 Q1 Lintervalle inter-quartiles est lintervalle entre Q1 et Q3 IQ = [Q1 , Q3 ]

4.3

Ecart Inter-Dciles e

Dnition : e Lcart inter-dciles est la dirence entre D9 et D1 e e e ED = D9 D1 Lintervalle inter-dciles est lintervalle entre D1 et D9 e ID = [D1 , D9 ]

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-9-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

4.4

Variance

Certaines sries statistiques peuvent avoir les mmes crit`res de position comme la e e e mdiane et la moyenne. e Pour les direncier on va utiliser un nouvel outil qui va mesurer la dispersion de la e srie autour de la moyenne. On souhaite trouver une mesure de lcart entre les valeurs e e de la srie et sa moyenne. Si cet cart est grand alors la srie est tr`s htrog`ne et les e e e e ee e valeurs sont loignes de la moyenne sinon si cet cart est petit la srie est homog`ne et e e e e e les valeurs rapproches autour de la moyenne. e On pourrait calculer la moyenne des carts ` la moyenne mais celle-ci donne toujours 0 e a a ` cause des carts qui sont opposs. e e Dmonstration : e 1 k 1 k 1 k 1 k (x xi )ni = (xni xi ni ) = xi ni (x x) = xni N i=1 N i=1 N i=1 N i=1 1 k N ni x = x x=xx=0 N i=1 N Pour viter ce probl`me, on va faire la moyenne des carres des carts ` la moyenne. e e e e a On note ce rsultat, la variance de la srie. e e Dnition : e =x La variance dune srie statistique est la moyenne des carres des carts ` e e e a la moyenne de chacune des valeurs. valeurs xi x1 x2 x3 ... xk1 xk Eectifs ni n1 n2 n3 ... nk1 nk (x xi )2 (x x1 )2 (x x2 )2 (x x3 )2 . . . (x xk1 )2 (x xk )2 La variance de la srie est donc la moyenne de la derni`re ligne du tableau ci-dessus : e e 1 N

V (x) =

X
k i=1

(x xi )2 ni

V (x) = Proprit : e e

X
k i=1

ou (x xi )2 fi

V (ax) = a2 V (x) V (x + b) = V (x) donc V (ax + b) = a2 V (x)


Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e -10-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

4.5

Ecart-Type

Dnition : e Lcart-type est la racine carre de la variance pour revenir aux mme units que les e e e e valeurs de la srie statistique. e =

V (x)

Proprit : e e Si on a deux sries S1 et S2 dcart-type respectifs 1 et 2 e e Si 1 < 2 alors la srie S1 est plus homg`ne que la srie S2 ou la srie S2 est plus e e e e htrog`ne que la srie S1 . ee e e Proprit : e e (ax) = |a|(x) (x + b) = (x) donc (ax + b) = |a|(x)

5
5.1

Reprsentation statistiques e
Diagramme en bo te

Les diagrammes en bo ou bo ` moustaches, sont des diagrammes permettant de te, tes a comparer rapidement des sries statistiques. e

5.2

Autres diagrammes

Diagramme en barres (Histogrammes) :

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-11-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Diagramme en btons : a

Diagramme en camembert :

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-12-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

5.3

Polygne des frquences cumules o e e

Le polygne des frquences cumules (en pourcentages) permet de lire rapidement la o e e mdiane et les quartiles dune sries statistique : e e

Plages de normalit des distributions normales e Gaussiennes

Lorsque lon fait des statistiques sur une grande quantiti de valeurs, il arrivent e souvent que lon obtienne des diagramme ayant sensiblement la mme forme dite EN e CLOCHE ou COURBE DE GAUSS, comme ci-dessous :

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-13-

2011 2012

Les statistiques descriptives

Classe de Premi`re S e

Lorsque la srie statistique donne une reprsentation graphique de la forme dune e e courbe de Gauss, les donnes sont qualies de donnes Gaussiennes. e e e Prorits (Plages de normalit) : e e e On note x la moyenne de la srie et lcart-type de la srie. e e e 1. Environ 68 % des donnes se trouvent dans lintervalle [x , x + ] e On nomme cet intervalle la plage de normalit pour le niveau de conance 0.68 e 2. Environ 95 % des donnes se trouvent dans lintervalle [x 2, x + 2] e On nomme cet intervalle la plage de normalit pour le niveau de conance 0.95 e 3. Environ 99 % des donnes se trouvent dans lintervalle [x 3, x + 3] e On nomme cet intervalle la plage de normalit pour le niveau de conance 0.99 e

Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e

-14-

Vous aimerez peut-être aussi