Académique Documents
Professionnel Documents
Culture Documents
STATISTIQUES DESCRIPTIVES
Premire S M Obaton
J'aimais et j'aime encore les mathmatiques pour elles-mmes comme n'admettant pas l'hypocrisie et le vague, mes deux btes d'aversion. Stendhal
Anne 2011-2012
2011 2012
Classe de Premi`re S e
-2-
2011 2012
Classe de Premi`re S e
Jaimais et jaime encore les mathmae tiques pour elles-mmes e comme nadmettant pas lhypocrisie et le vague, mes deux btes e daversion. Stendhal
-3-
2011 2012
Classe de Premi`re S e
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
4 Crit`re de dispersion e 4.1 Etendue . . . . . . . 4.2 Ecart Inter-Quartiles 4.3 Ecart Inter-Dciles . e 4.4 Variance . . . . . . . 4.5 Ecart-Type . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
5 Reprsentation statistiques e 11 5.1 Diagramme en bo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 te 5.2 Autres diagrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 5.3 Polygne des frquences cumules . . . . . . . . . . . . . . . . . . . . . . . 13 o e e 6 Plages de normalit des distributions normales Gaussiennes e 13
-4-
2011 2012
Classe de Premi`re S e
Notation
La somme de n nombres numrots de 1 ` n peut scrire : e e a e x1 + x2 + x3 + x4 + + xn1 + xn mais cette criture est longue et les pointills ne sont pas satisfaisants. e e On crira, pour faire moins long et viter les pointills, cette somme ` laide du e e e a symbole Sigma :
X
n i=1
xi
Exemples :
n
1. 2. 3.
X X X
i=1 n i=0
xi = x0 + x1 + x2 + + xn1 + xn i = 1 + 2 + 3 + 4 + + (n 2) + (n 1) i2 = 02 + 12 + 22 + 32 + + (n 1)2 + n2
i=0 n1
2
2.1
On note (xi ; ni )iN la srie statistique ci-dessous : e Rappels : Leectif ni est le nombre de fois o` appara la valeur xi dans la srie. u t e valeurs xi Eectifs ni x1 n1 x2 n2 x3 n3 x4 n4 ... ... ... ... ... ... xk2 nk2 xk1 nk1 xk nk
2.2
Dnition : e Leectif total N de la srie statistique est la somme de tous les eectifs ou le nombre e de valeurs total dans cette srie : e N=
X
k i=1
ni = n1 + n2 + n3 + . . . + nk1 + nk
-5-
2011 2012
Classe de Premi`re S e
2.3
Dnition : e La frquence dapparition dune valeur xi est la proportion de cette valeur par rapport e a ` leectif total. Eectif de la valeur ni Frquence par rapport ` 1 : fi = e a = Eectif total N 100ni Frquence par rapport ` 100 : Fi = e a N Proprits : e e
Sf = SF =
X X
k i=1 k i=1
fi = f1 + f2 + f3 + . . . + fk1 + fk = 1
Fi = F1 + F2 + F3 + . . . + Fk1 + Fk = 100
2.4
Le tri ` plat dune srie statistique est un tableau contenant les valeurs de la srie, les a e e eectifs, les eectifs cumuls croissants, les frquences, les frquences cumules e e e e croissantes, les pourcentages et les pourcentages cumuls croissants. e valeurs xi Eectifs ni Eectifs Cum Croi Ni Frquences fi e Frquences Cum Croi Fi e Pourcentages pi Pourcentages Cum Croi Pi x1 n1 n1 f1 f1 p1 p1 x2 n2 N1 + n2 f2 F1 + f2 p2 P1 + p2 x3 n3 N2 + n3 f3 F2 + f3 p3 P2 + p3 ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... xk1 nk1 Nk2 + nk1 fk1 Fk2 + fk1 pk1 Pk2 + pk1 xk nk N fk 1 pk 100
3
3.1
Crit`re de position e
Mdiane e
Dnition : e La mdiane dune srie statistique est la valeur qui partage cette srie en deux sries de e e e e mme eectif. e
-6-
2011 2012
Classe de Premi`re S e
Si Me est la mdiane de la srie statistique, alors : e e 50 % des valeurs de la srie sont infrieures ou gales ` Me e e e a 50 % des valeurs de la srie sont suprieures ou gales ` Me e e e a Mthode pour trouver la mdiane : e e Il faut commencer par classer la srie dans lorde croissant. e N Si + 0, 5 = d est entier alors la mdiane est la d i`me valeur de la srie. e e e 2 N Si + 0, 5 = d, 5 est dcimale alors la mdiane est entre la d i`me et la d + 1 i`me e e e e 2 valeur de la srie. e
3.2
Quartiles
Dnition : e Les quartiles dune srie statistique sont les valeurs qui partagent cette srie en quatre e e sries de mme eectif. e e
Si Q1 est le premier quartile et Q3 le troisi`me de la srie statistique, alors : e e 25 % des valeurs de la srie sont dans [M in, Q1 ] e 50 % des valeurs de la srie sont dans [Q1 , Q3 ] e 25 % des valeurs de la srie sont dans [Q3 , M ax] e Mthode pour trouver les quartiles : e Il faut commencer par classer la srie dans lorde croissant. e On utilisera une mthode approximative mais qui donnera des rsultats signicatifs e e pour des sries ` grands eectifs. (Autement il sut de couper en deux les deux sries e a e [M in, Me ] et [Me , M ax]) N N Calculer et on note a lentier suprieur ` . e a 4 4 3N 3N et on note b lentier suprieur ` e a . Calculer 4 4 Q1 est la a i`me valeur de la srie statistique. e e Q3 est la b i`me valeur de la srie statistique. e e
3.3
Dciles e
Dnition : e Les dciles dune srie statistique sont les valeurs qui partagent cette srie en dix sries e e e e de mme eectif. e
Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e -7-
2011 2012
Classe de Premi`re S e
Si D1 est le premier dcile et D9 le neuvi`me de la srie statistique, alors : e e e 10 % des valeurs de la srie sont dans [M in, D1 ] e 80 % des valeurs de la srie sont dans [D1 , D9 ] e 10 % des valeurs de la srie sont dans [D9 , M ax] e Mthode pour trouver les dciles : e e Il faut commencer par classer la srie dans lorde croissant. e On utilisera une mthode approximative mais qui donnera des rsultats signicatifs e e pour des sries ` grands eectifs. e a N N Calculer et on note a lentier suprieur ` e a . 10 10 9N 9N et on note b lentier suprieur ` e a . Calculer 10 10 D1 est la a i`me valeur de la srie statistique. e e D9 est la b i`me valeur de la srie statistique. e e
3.4
Moyenne
X
i=1
xi ni =
x=
X
k i=1
x1 n1 + x2 n2 + x3 n3 + . . . + xk1 nk1 + xk nk N ou
xi fi = x1 f1 + x2 f2 + x3 f3 + . . . + xk fk
Proprits de la moyenne : ee 1. Si x est la moyenne dun groupe deectif N1 et y la moyenne dun groupe deectif N2 alors la moyenne z de la srie constitue de lensemble des deux e e groupes est : z= N1 x + N2 y N1 + N2
e e 2. Si x est la moyenne dune srie (xi , ni ) alors la moyenne de la srie (axi + b, ni ) est : y = ax + b
Lyce Stendhal, Grenoble ( Document de : Vincent Obaton ) e -8-
2011 2012
Classe de Premi`re S e
3. Moyenne lague : e e Quand une valeur aberrante, correspondant ` une erreur de mesure ou ` une a a situation exceptionnelle, est prsente dans une srie, elle inuence e e considrablement la valeur moyenne. Une moyenne calcule apr`s avoir enlev e e e e certaines valeurs est appele Moyenne elague. e e
3.5
Modes
Dnition : e Les modes dune srie sont les valeurs ayant le plus grand eectif. e
4
4.1
Crit`re de dispersion e
Etendue
Dnition : e Ltendue dune srie statistique est la dirence entre la plus grande valeur et la plus e e e petite, de la srie. e Et = M ax M in
4.2
Ecart Inter-Quartiles
Dnition : e Lcart inter-quartiles est la dirence entre Q3 et Q1 e e EQ = Q3 Q1 Lintervalle inter-quartiles est lintervalle entre Q1 et Q3 IQ = [Q1 , Q3 ]
4.3
Ecart Inter-Dciles e
Dnition : e Lcart inter-dciles est la dirence entre D9 et D1 e e e ED = D9 D1 Lintervalle inter-dciles est lintervalle entre D1 et D9 e ID = [D1 , D9 ]
-9-
2011 2012
Classe de Premi`re S e
4.4
Variance
Certaines sries statistiques peuvent avoir les mmes crit`res de position comme la e e e mdiane et la moyenne. e Pour les direncier on va utiliser un nouvel outil qui va mesurer la dispersion de la e srie autour de la moyenne. On souhaite trouver une mesure de lcart entre les valeurs e e de la srie et sa moyenne. Si cet cart est grand alors la srie est tr`s htrog`ne et les e e e e ee e valeurs sont loignes de la moyenne sinon si cet cart est petit la srie est homog`ne et e e e e e les valeurs rapproches autour de la moyenne. e On pourrait calculer la moyenne des carts ` la moyenne mais celle-ci donne toujours 0 e a a ` cause des carts qui sont opposs. e e Dmonstration : e 1 k 1 k 1 k 1 k (x xi )ni = (xni xi ni ) = xi ni (x x) = xni N i=1 N i=1 N i=1 N i=1 1 k N ni x = x x=xx=0 N i=1 N Pour viter ce probl`me, on va faire la moyenne des carres des carts ` la moyenne. e e e e a On note ce rsultat, la variance de la srie. e e Dnition : e =x La variance dune srie statistique est la moyenne des carres des carts ` e e e a la moyenne de chacune des valeurs. valeurs xi x1 x2 x3 ... xk1 xk Eectifs ni n1 n2 n3 ... nk1 nk (x xi )2 (x x1 )2 (x x2 )2 (x x3 )2 . . . (x xk1 )2 (x xk )2 La variance de la srie est donc la moyenne de la derni`re ligne du tableau ci-dessus : e e 1 N
V (x) =
X
k i=1
(x xi )2 ni
V (x) = Proprit : e e
X
k i=1
ou (x xi )2 fi
2011 2012
Classe de Premi`re S e
4.5
Ecart-Type
Dnition : e Lcart-type est la racine carre de la variance pour revenir aux mme units que les e e e e valeurs de la srie statistique. e =
V (x)
Proprit : e e Si on a deux sries S1 et S2 dcart-type respectifs 1 et 2 e e Si 1 < 2 alors la srie S1 est plus homg`ne que la srie S2 ou la srie S2 est plus e e e e htrog`ne que la srie S1 . ee e e Proprit : e e (ax) = |a|(x) (x + b) = (x) donc (ax + b) = |a|(x)
5
5.1
Reprsentation statistiques e
Diagramme en bo te
Les diagrammes en bo ou bo ` moustaches, sont des diagrammes permettant de te, tes a comparer rapidement des sries statistiques. e
5.2
Autres diagrammes
-11-
2011 2012
Classe de Premi`re S e
Diagramme en btons : a
Diagramme en camembert :
-12-
2011 2012
Classe de Premi`re S e
5.3
Le polygne des frquences cumules (en pourcentages) permet de lire rapidement la o e e mdiane et les quartiles dune sries statistique : e e
Lorsque lon fait des statistiques sur une grande quantiti de valeurs, il arrivent e souvent que lon obtienne des diagramme ayant sensiblement la mme forme dite EN e CLOCHE ou COURBE DE GAUSS, comme ci-dessous :
-13-
2011 2012
Classe de Premi`re S e
Lorsque la srie statistique donne une reprsentation graphique de la forme dune e e courbe de Gauss, les donnes sont qualies de donnes Gaussiennes. e e e Prorits (Plages de normalit) : e e e On note x la moyenne de la srie et lcart-type de la srie. e e e 1. Environ 68 % des donnes se trouvent dans lintervalle [x , x + ] e On nomme cet intervalle la plage de normalit pour le niveau de conance 0.68 e 2. Environ 95 % des donnes se trouvent dans lintervalle [x 2, x + 2] e On nomme cet intervalle la plage de normalit pour le niveau de conance 0.95 e 3. Environ 99 % des donnes se trouvent dans lintervalle [x 3, x + 3] e On nomme cet intervalle la plage de normalit pour le niveau de conance 0.99 e
-14-