Vous êtes sur la page 1sur 6

L-P- ARIANA A-Oukhai MATHEMATIQUE S Statistiques

2emeSc 8/5/ 2012

I- Le vocabulaire
L'ensemble sur lequel on travaille en statistique est appel population. Si cet ensemble est trop vaste, on en restreint l'tude une partie appele chantillon. Un lment de cet ensemble est appel individu. La particularit commune que l'on tudie est appele caractre. (1) Si celle-ci s'exprime par un nombre, il s'a it d!un caractre quantitatif.(dans ce cas, le nombre se note en nral xi) Si les valeurs du nombre exprim en (1) sont isoles, il s'a it d!un caractre di cret. "ar contre, si ces valeurs sont prises dans tout un intervalle de r , il s'a it d!un caractre continu. (#) Si la particularit tudie ne s'exprime pas par un nombre, il s'a it d!un caractre qualitatif. les valeurs prises par le caract$re sont aussi appeles les !odalit . Le nombre d'individus (ni) d'une modalit est appel effectif. Le nombre total d'individus (N) de la population est appel effectif total. Le rapport est appel frquence. (fi est un nombre tou%ours compris entre & et 1). Souvent, les nombres fi s'expriment par un pourcenta e. La somme des nombres fi est tou%ours ale 1. La di''rence des valeurs extr(mes du caract$re s!appelle l!tendue. La donne des valeurs du caract$re et des 'rquences associes s!appelle la di tribution. )ans le cas d'un caract$re continu, ou quand le caract$re discret prend trop de valeurs, on re roupe en nral les individus dans des intervalles de t*pe +a , b+ appels cla e .
)ans la suite, on consid$re des sries caract$res quantitati's discr$tes ou continues. "otation # x1 , x# , - , xp sont les valeurs ou les centres des classes si ces valeurs sont re roupes en classe. n1 , n# , - , np sont les e''ecti's respecti's des valeurs x1 , x# , - , xp '1 , '# , - , 'p sont les 'rquences respectives des valeurs x1 , x# , - , xp . est l!e''ecti' total / . 0 n1 1 n# 1 - 1 np

II- Exemples
Suite un contrle de mathmatiques, dans une classe de 28 lves, le professeur s'est amus classer certains rsultats dans deux tableaux : 234L53U 1 notes nb d'l$ves (e''ecti's) e''ecti's cumuls croissants e''ecti's cumuls dcroissants 'rquences 'rquences cumules croissantes 'rquences cumules dcroissantes 6 # 7 & 8 # 9 1 : # ; 6 1& < 11 # 1# 6 1< < 16 # 17 & 18 # 19 1

Lorsque les rsultats de l'enqu(te statistique sont trop nombreux pour que la liste trie des valeurs soit lisible, on pr'$re perdre de l'in'ormation et ran er les donnes par intervalles appels classes. =l 'aut alors que, dans c>aque classe, la rpartition des valeurs soit r uli$re. Sinon, il 'aut a''iner et prendre des classes plus petites. =l n'est pas indispensable que les classes soient de m(me amplitude, mais il est pr'rable de ne pas d'inir de classes de la 'orme ? plus de ... @ qui emp(c>erait alors tout traitement 1

L-P- ARIANA A-Oukhai MATHEMATIQUE S Statistiques

2emeSc 8/5/ 2012

ultrieur (>isto ramme, mo*enne...). An compte alors le nombre de 'ois oB la valeur du caract$re tombe dans l'intervalle +xi,xi 1 1+, ce nombre est appel effectif de la classe +xi,xi 1 1+.
234L53U # temps de rvision en > Centres des classes e''ecti's e''ecti's cumuls croissants 'rquences en D 'rquences cumules croissantes en D 9 7 7 8 7 +&,1+ +1,#+ +#,<+ +<,6+ +6,7+

Complter les tableau 1 et # . Histogramme

"our reprsenter rap>iquement une srie statistique continue il 'aut reprsenter l'e''ecti' de c>aque classe par un rectan le dont la base est l'amplitude de la classe et dont l'aire est proportionnelle l'e''ecti' ou la 'rquence. Ce dia ramme s'appelle un >isto ramme. 5xemple complter le tableau statistique suivant et tracer l!>isto ramme Salaires Erquences en D 3mplitudes ai ai 0 xi11 - xi Fauteur >i >i 0 L!>isto ramme de la srie est ci-contre/ Gemarque/ si les amplitudes des classes sont identiques, les >auteurs des rectan les sont proportionnelles aux e''ecti's ou aux 'rquences +&, :+ 9 +:, 1#+ 7,< +1#, 18+ :,: +18,#& + #9,& +#&, <& + <<,8 +<&, 6&+ 1<,& +6&, 8&+ 7,<

$ol%&one de frquence cu!ule "uisque la rpartition dans c>aque classe est suppose r uli$re, on peut admettre que l'accroissement de la 'rquence est une 'onction linaire. An trace alors le pol* one des 'rquences cumules croissantes qui permet de lire la 'rquence de la classe +x1,xH pour tout x 3u pralable, il 'aut remplir le tableau des 'rquences cumules xi 'rquences cumules croissantes & & : 9 1# 1#,< 18 #1,1 #& 6:,1 <& :1,9 6& ;6,9 8& 1&&

=l ne reste plus qu' tracer le pol* one


On peut construire de mme le polygone des frquences cumules dcroissantes III -Caractristiques de positio
#

L-P- ARIANA A-Oukhai MATHEMATIQUE S Statistiques

2emeSc 8/5/ 2012

'( )aractri tique de po ition * tendance centrale


Mode + ou cla e !odale ( / notation Io Le mode, pour un caract$re discret, est la valeur du caract$re qui correspond au plus rand e''ecti'. "our un caract$re continu, on parle de classe modale . =l peut * avoir plusieurs modes ( ou plusieurs classes modales ) Mdiane / notation Ie( pour une srie ordonne par ordre croissant ) La mdiane est une valeur Ie du caract$re qui parta e la population en deux sous-ensembles de m(me e''ecti' . Les lments du premier sous-ensemble correspondent des valeurs du caract$re in'rieures ou ales Ie, ceux du second correspondent des valeurs du caract$re suprieures ou ales Ie .

Exemples
Si la srie comporte un nombre impair de termes la mdiane correspond une aleur de la srie! 110 " 110 " 11# " 11# " 11# " 115 " !!" " 11$ " 11% " 120 " 120 " 121 " 121! &ette srie a pour mdiane 115 Si la srie comporte un nombre pair de termes on prend comme mdiane la demie'somme de deu( aleurs! 20 " 20 " 21 " 21 " 2# " 2# $ 2% " 2) " 25 " 2$ " 2$ " #0! &ette srie a pour mdiane 2#*5
0 0 n ix i ou Mo%enne / notation 0 '1 x1 1 '# x# 1 - 1 'p xp
0

'i x i

Remarque +orsque les aleurs du caract,re sont rparties en classes -inter alles.* on calculera la moyenne en utilisant
le centre de c/aque classe! +orsque les aleurs du caract,re sont rparties en classes -inter alles.* on calculera la moyenne en utilisant le centre de c/aque classe! +a moyenne est sensible au( aleurs e(trmes* alors que la mdiane l0est asse1 peu! Si les donnes statistiques font appara2tre une ou plusieurs aleurs aberrantes* on peut calculer la moyenne lague* c0est''dire la moyenne de la srie dans laquelle on a supprim la ou les aleurs aberrantes!
( tab1 ) / Iodes / ,( Ie 0 0 ( tab# ) / Classe modale / Ie 0 0

)aractri tique de po ition non centrale # le quartile

An consid$re une srie ordonne par ordre croissant. Le pre!ier Quartile Q' est la plus petite valeur de la srie telle qu!au moins #7D des valeurs de celle-ci lui sont in'rieures ou ales. Le troi i!e Quartile Q- est la plus petite valeur de la srie telle qu!au moins 97D des valeurs de celle-ci lui sont in'rieures ou ales.

Gemarque / Une srie admet trois quartiles , le deuxi$me, dont on a 'ait usa e en premi$re, est associ la valeur 7&D . )e nombreuses calculatrices consid$rent les quartiles comme les mdianes des deux sries obtenues apr$s avoir parta la srie initiale par sa mdiane, ce qui explique les di''rences constates. )ans la pratique, ces di''rences ont peu d!importance vu la taille des sries. )e la m(me 'aJon, on peut d'inir les dciles d!une srie statistique. Les diffrentes situations sont regroupes dans le tableau ci-dessous : Srie discr$te / Si est un entier, le premier quartile K1 est la valeur qui dans cette liste occupe le ran et le troisi$me quartile K < est la valeur qui dans cette liste occupe le ran . Si n!est pas un entier, le premier quartile K1 est la valeur qui dans cette liste occupe le ran immdiatement suprieur et le troisi$me quartile K< est le valeur qui dans cette liste occupe le ran immdiatement suprieur .

<

L-P- ARIANA A-Oukhai MATHEMATIQUE S Statistiques

2emeSc 8/5/ 2012

Srie continue / ( les valeurs sont re roupes par classe ) K1 est la valeur correspondant la 'rquence cumule croissante ale &,#7 . K< est la valeur correspondant la 'rquence cumule croissante ale &,97 .

3(emple

+a srie 11 * 12 * 12 * !# * 15 * 1$ * 1$ * 1% * 1% * 18 * !& * 20 * 22 * 2# a 1) termes! 4n quart -255. des donnes correspond 6 1) ( 0*25 #*5! +e premier quartile est alors* par dfinition* la plus petite aleur q pour laquelle ) termes de la srie ont une aleur infrieure ou gale q! +e premier quartile est donc la aleur du ),me terme de la srie c0est''dire !#! 7rois quarts -%55. des donnes correspondent 6 1) ( 0*%5 10*5! +e troisi,me quartile est alors* par dfinition* la plus petite aleur q' pour laquelle 11 termes de la srie ont une aleur infrieure ou gale q'! +e troisi,me quartile est donc la aleur du 11,me terme de la srie c0est''dire !&! +0inter alle interquartile est l0inter alle !1# " 18"! +0cart interquartile est 18 # 1# $!

Remarque
+a mdiane d0une srie est une mesure de tendance centrale! -3lle indique un centre* comme la moyenne. +0cart interquartile est une mesure de dispersion! -9l mesure l0cartement des aleurs autour de la mdiane.
3pplication / "our le tableau 1, on a / q1 0 "our le tableau #, on a / q1 0 q# 0 q# 0

I'-Caractristiques de dispersio
-( Ecart interquartile
L.intervalle interquartile d!une srie statistique est l!intervalle + K1 , K<H L.cart interquartile d!une srie statistique est le nombre K< L K1 5xemple / )ans le tableau 1 / K< L K1 0 )ans le tableau # / K< L K1 0 Gemarque / L!cart interquartile mesure la dispersion des valeurs autour de la mdiane , plus l!cart est petit, plus les valeurs de la srie appartenant l!intervalle interquartile sont concentres autour de la mdiane. Contrairement l.tendue ( note e ) qui mesure l!cart entre la plus rande et la plus petite valeur, l!cart interquartile limine les valeurs extr(mes qui peuvent (tre douteuses, cependant il ne tient compte que de 7&D de l!e''ecti' e0 e0

/( 0ia&ra!!e en bo1te + bo1te * !ou tache ou * patte (


Un dia&ra!!e en boite est un rectan le dlimit par le premier quartile et le troisi$me quartile . "our l!obtenir, on trace un axe >oriMontal ( ou vertical ) sur lequel on place les valeurs de K 1 , K< et Ie . L!un des cNts du rectan le a pour lon ueur l!cart interquartile, l!autre est quelconque. An compl$te ce dia ramme en traJant deux traits >oriMontaux / l!un %oi nant K1 au minimun de la srie et l!autre %oi ant K< au maximun de la srie.

"atte
Iin K1

"atte 6 Ie
K< Iax

L-P- ARIANA A-Oukhai MATHEMATIQUE S Statistiques

2emeSc 8/5/ 2012

5xemple / Construire le dia ramme en boite des tableaux 1 et #


:emarques

4ne bo2te a ec des ;pattes; courtes indique que la srie est asse1 concentre autour de sa mdiane! <u contraire* des ;pattes; longues indiquent que la srie est asse1 disperse! 4n des a antages de cette reprsentation* est qu0elle ncessite tr,s peu de calculs! +a reprsentation peut aussi se faire erticalement +a graduation se trou e alors sur l0a(e ertical*
E2ercice

On donne sur le dessin ci'contre les diagrammes en bo2te de deu( sries! &es sries sont les sries des notes de mat/matiques de deu( classes de =remi,re S notes < et >! +es ;pattes; correspondent au( aleurs e(trmes! &omparer ces deu( sries! ?ue peut'on en conclure @ 3( 4ariance et cart-t%pe

La variance O est la mo*enne des carres des carts la mo*enne, c'est dire / n i(x i L ) P

O 0 ( n1 ( x1 L ) P 1 n# ( x# L ) P 1 - 1 np ( xp L ) P ) 0

L.cart t%pe est la racine carre de la variance / 0

5xemple / )ans le tableau 1, O 0 0 )ans le tableau #, O 0 0 Gemarques / L!cart t*pe est un param$tre plus 'in que l!tendue, car il tient compte de la rpartition des valeurs. L!cart t*pe la m(me unit que les valeurs de la srie tudie. L!cart t*pe mesure la dispersion des valeurs de la srie autour de la mo*enne . "lus l!cart t*pe est petit, plus les valeurs de la srie sont concentres autour de la mo*enne. Autre expression de la variance : ( bien plus pratique ) O 0 n ix L P

Remarques

+0cart'type permet d0a oir une ide de la faAon dont les aleurs de la srie s0cartent par rapport la moyenne! &0est une mesure de dispersion -comme l0cart interquartile.! 7

L-P- ARIANA A-Oukhai MATHEMATIQUE S Statistiques

2emeSc 8/5/ 2012

4n cart'type faible correspond une srie concentre autour de sa moyenne! +es calculs de moyenne* de ariance et d0cart'type sont* pour des sries prenant un grand nombre de aleurs* des calculs compliqus! Bais ils sont facilement raliss par les calculatrices utilises en mode statistique et les ordinateurs!
'-I (lue ce d)u e tra s(ormatio a((i e An appelle ima e d!une srie statistique S de valeurs (x1 , x# , - , xp ) a*ant pour e''ecti's respecti's ( n1 , n# , - , np ) par une 'onction ', la srie statistique S! de valeurs (' ( x1 ) , ' ( x# ) , - , ' ( xp ) ) a*ant pour e''ecti's respecti's ( n1 , n# , - , np )

Soit S une srie statistique, ' / x a x 1 b ( avec a & ) une application a''ine et S! l!ima e de S par ' . !0 a 1b Si a Q & , K!< L K!1 0 a ( K< L K1) O! 0 a P O ! 0 R a R