Vous êtes sur la page 1sur 14

Séries statistiques à une variable

Activité d'approche
La statistique étudie certaines caractéristiques : caractères ou variables d'un ensemble fini:
population. Les éléments de cette population étudiée sont appelés alors individus.
Une variable peut être :

 Quantitative : numérique et fait l'objet de calcul ( age, taille, poids, notes, nombres
d'heures etc ...)
 Qualitative : c'est le contraire de quantitative, mais la variable peut très bien être
numérique.
 Discrète : si la variable ne prends qu'un nombre fini de valeurs (ces valeurs sont
appelées modalités et notées xi ) .
 Continue : si la variable prends ses valeurs dans un intervalle ( classe )

Exemple : supposons que l'on veut faire une étude statistique sur les 50 notes attribuées par
un jury à un examen.
On dispose pour cette étude de la liste des notes obtenues :

On peut regrouper ces notes par ordre croissant :


0,1,1,2,2,3,3,3 ....., et construire le tableau suivant :
( dans ce cas la distribution est discrète )

Ou bien regrouper ces notes par


intervalle ( classe ) :
( dans ce cas la distribution est continue )
Exemple de regroupement par classe :

Quelques définitions
L'effectif d'une classe ou d'une modalité est alors le nombre d'individu de cette classe ou de
cette modalité. Généralement on note ni est l'effectif de la classe n° i ( ou de la modalité xi ).
Exemple : ici l'effectif de première classe est 10

L'effectif total est la somme des effectifs de toutes les classes noté souvent N;
on a N = n1 + n2 + n3 + n4 + n5 = 10 + 8 + 12 + 11 + 9 = 50 .
En utilisant la notation sigma :
La fréquence fi de la classes i ou de la modalité xi est le rapport fi/N , la fréquence d'une classe
est un nombre de l'intervalle [0 ;1]
Exemple : ici la fréquence de la première classe est 10/50 soit 0,5

L'effectif cumulé d'une modalité est la somme des effectifs des modalités qui lui sont
inférieures ou égales

La fréquence cumulé d'une modalité est la somme des fréquences des modalités qui lui sont
inférieures ou égales

Dans le cas "variable discrète" on obtient :

 3 personnes ont une note inférieure ou égale à 1


 15 personnes ont une note inférieure ou égale à 6
 47 personnes ont une note inférieure ou égale à 18
 etc...

Dans le cas "variable continue" on obtient :

Paramètres statistiques d'une série statistique simple :


 l'étendue
 le mode
 la moyenne
 la variance et l'écart type
 le coefficient de dispersion est le rapport écart-type moyenne : /x
 la médiane, le premier quartile et le troisième quartile
 Interpolation linéaire
 Exercice interactif : calcul des paramètres d'une série statistique continue

étendue d'une série statistique


L'étendue d'une série statistique est la différence entre la plus grande
modalité du caractère et la plus petite modalité.
C'est un caractère de dispersion de la série.

Exemples :

20 - 0 = 20,
20 est l'étendue de ces deux séries ( continue et discrète )

Mode d'une série statistique


Dans le cas d'une série statistique continue, la classe modale est la classe la plus dense c'est à dire la
classe qui contient le plus d'effectifs par amplitude.
La densité d'effectif de la classe se calcule en divisant chaque effectif par l'amplitude correspondante
de la classe, exemple pour la première classe l'amplitude est de 5 - 0 = 5 , l'effectif de 10 donc la
densité sera de 10/5 soit 2.

Sur cette exemple, la classe modale est donc

Dans le cas d'une série statistique discrète, le mode est la valeur de plus grand effectif :

Moyenne statistique
n1, n2, n3, .........,nNsont les effectifs correspondants aux modalités (centres de chaque classe si
la série est continue ) x1, x2, x3........,xN.

Série discrète.

Série continue

Propriétés de la moyenne :

 Considérons une série statistique S de modalités x1, x2, x3, .........,xN affectées des
effectifs n1, n2, n3, .........,nN de moyenne , et la série statistique S' de modalités
y1, y2, y3, .........,yN affectées des même effectifs n1, ........,nN telle que pour tout i
appartenant à {1 ; 2 ; ....; N }, yi = axi + b alors la moyenne de la série statistique S' est
telle que : = a + b.
( voir exemples )
 Soient S1 et S2 deux séries statistiques d'effectifs totaux respectifs N1 et N2 et de
moyennes respectives et , alors la de la série S regroupant les deux séries S1 et S2
est :
= [N1 + N2 ]/(N1 + N2)
(cette propriété se généralise :voir exemples )

Variance et écart-type
Pour calculer la variance d'une série statistique, on utilise la formule :
Pour calculer la variance , il faut calculer d'abord la moyenne , la variance peut être calculer
aussi en utilisant la formule :

Démonstration :

L'écart-type est le nombre noté


σ tel que .

Médiane d'une série statistique


La médiane d'une série statistique rangée dans l'ordre croissant
(x1 , x2 , x3 , x4 , ....., xn) est le nombre M = Q2 ( parce qu'on l'appelle aussi deuxième quartile )
défini de la façon suivante :
Si n = 2p est pair , M est le centre de l'intervalle [xp ; xp+1]
Si n est impair, M est le nombre xp où p = (n + 1)/2 .

La médiane est un paramètre d'une série statistique simple, et plus exactement un paramètre
de position, c'est le nombre qui permet de couper la population étudiée en deux groupes
contenant le même nombre d'individus. Ce paramètre est utile pour donner la répartition du
caractère étudié, car 50 % environ de la population étudiée a une modalité inférieure à la
médiane et 50 % une modalité supérieure à la médiane. Voyons comment la déterminer sur
les deux exemples ci-dessous :
Exemple : on fait une étude statistique sur les 50 notes attribuées par un jury à un examen,
voici les résultats obtenus en classant ces notes par ordre croissant (variable discrète ).

n = 50 est pair , il faut donc prendre le centre de [9 ; 10]

Utilisons la colonne des effectifs cumulés pour déterminer la médiane : il y a 50 notes, la 25 ème
note est 9 et la 26ème : 10.

Voila la répartition des notes pour comprendre :

Dans le tableau il n'y a pas de valeur partageant la série statistique en deux groupe de même
effectif , ( l'effectif total est pair ) dans ce cas l'intervalle médian est [9;10] et on prendre pour
médiane le centre de cet intervalle : 9,5
Médiane d'une série continue
Si la variable est continue ( regroupement par intervalle des résultats ) le calcul de la médiane
se fait autrement :
Utilisons la colonne des effectifs cumulés pour déterminer la médiane : il y a 50 notes, 50 %
de l'effectif total c'est 25, la médiane est ici la note correspondant à l'effectif cumulé 25.

D'après la colonne "effectif cumulé" :

 18 personnes ont moins de 8


 30 personnes ont moins de 12

La médiane se trouve donc dans l'intervalle [8;12[ ( appelée classe médiane ) on va la


déterminer par interpolation linéaire.

Les points A, M, B sont alignés ce qui se traduit par les droites (AM) et (AB) ont même
coefficient directeur (ou on utilise le théorème de Thalès dans le triangle bleu ) :

La médiane est environ 10,33

50 % environ des personnes ont eu moins de 10,33 et 50 % plus de 10,33 .


Exercice interactif

Quartiles d'une série statistique


Variable discréte :
Définition par la médiane.
Le premier quartile et le troisième quartile d'une série statistique rangée dans l'ordre croissant (x1 , x2
, x3 , x4 , ....., xn) sont les nombres Q1 et Q3 définis de la façon suivante :
Si M = Q2 est la médiane de cette série, M partage la série la série
(x1 , x2 , x3 , x4 , ....., xn) en deux séries de même effectif :
(x1 , x2 , x3 , x4 , ....., xp) et (xp+1 , xp+2 , xp+3 , xp+4 , ....., xn)
la première série contient les modalités inférieur ou égales à Q2
la seconde série contient les modalités supérieur ou égales à Q2
Les nombres Q1 et Q3 sont donc alors les médianes respectives de ces deux séries.
Définition directe.
Le premier quartile et le troisième quartile d'une série statistique rangée dans l'ordre croissant (x1 , x2
, x3 , x4 , ....., xn) sont les nombres Q1 et Q3 définis de la façon suivante :
- si n/4 est un entier , le premier quartile Q1 est le terme de rang n/4 et le troisième quartile Q3 est le
terme de rang 3n/4.
- si n/4 n'est pas un entier, Q1 et Q3 sont respectivement les termes de rang immédiatement
supérieur à n/4 et 3n/4.
Remarque :
Le paramètre Q1 permet de dire que 25 % environ de la population étudiée a une modalité inférieure
à la Q1 et 75 % une modalité supérieure à la Q1.
Le paramètre Q3 permet de dire que 75 % environ de la population étudiée a une modalité inférieure
à la Q3 et 25 % une modalité supérieure à la Q3.
On peut définir aussi les quartiles Q1, Q2, Q3 comme des valeurs permettant de couper une
population ordonnée en quatre groupe contenant chacun le même nombre d'élément.
Exemple : on fait une étude statistique sur les 50 notes attribuées par un jury à un examen, voici les
résultats obtenus en classant ces notes par ordre croissant (variable discrète ).
n/4 = 12,5 ce n'est pas un entier donc le premier quartile est le terme de rang 13 soit Q 1 = 5
3n/4 = 37,5 ce n'est pas un entier donc le troisième quartile est le terme de rang 38 soit Q 3 = 13

Construction du diagramme en boite , pour le construire il faut :


La valeur minimale de la série : 0
Le premier quartile Q1 = 5
Le second quartile ou la médiane Q2 = 9,5
Le troisième quartile Q3 = 13
La valeur maximale de la série : 20
Variable continue
Si la variable est continue ( regroupement par intervalle des résultats ) le calcul de la quartiles
se fait autrement :

Les quartiles se calculent alors par interpolation linéaire.


Construisons le polygone des effectifs cumulés croissants :

Les nombre Q1 , Q2 , Q3 correspondent aux effectifs cumulés n/4 , n/2 et 3n/4 ( soit 12,5 ; 25
et 37,5 )
Par interpolation linéaire on :
Construction du diagramme en boite , pour le construire il faut :
La valeur minimale de la série : 0
Le premier quartile Q1 = 5,94
Le second quartile ou la médiane Q2 = 10,33
Le troisième quartile Q3 = 14,05
La valeur maximale de la série : 20
Interpolation linéaire
Soit f une fonction définie sur , [a; b] un intervalle de et c un nombre réel . Quand il n'est
pas possible de calculer l'image de c par f , on utilise une interpolation linéaire, cela consiste à
remplacer f(c) par g(c) ou g est la fonction affine telle que g(a) = f(a) et g(b) = f(b).

Cela consiste à remplacer la courbe représentative de f sur [a; b] par la droite (AB) ( On dit
que l'on a déterminer f(c) par interpolation linéaire.

Utilisez quelques exemples paramétrables


L'interpolation linéaire est utilisée surtout en statistique

Le mieux est de comprendre sur un exemple :

.
Supposons que l'on étudie la répartition des ages dans une association par exemple d'après le
tableau ci-dessus on a par exemple :

 14 personnes qui ont un age compris entre 0 et 10 ans


 32 personnes qui ont un age compris entre 10 et 20 ans
 etc...

La colonne des effectifs cumulé croissant nous permet de savoir que :

 14 personnes ont un age inférieur à 10 ans


 46 personnes ont un age inférieur à 20 ans
 etc...

Supposons maintenant que l'on a ordonné ces personnes par ordre croissant de leur age ( du
plus jeunes au plus vieux : il faut qu'ils soient d'accord ) et que l'on veuille trouver par
interpolation l'age de la 72 ème personne ( pourquoi pas ???)
On repère à l'aide de la colonne des effectifs cumulés croissants dans quelles tranches d'âge ce
trouve cette personne ( c'est vraiment très indiscret de vouloir connaître son age mais bon ...)

La 72 ème personne a entre 20 et 30 ans c'est sûr , mais cela ne suffit pas ...
On considérant que les 55 personnes de la tranche [20;30[ sont réparti de manière
proportionnelle :

 la 46ème personne a moins de 20 ans, faisons comme si elle en avait 20


 la 101 ème personne a moins de 30 ans faisons comme si elle en avait 30

ces deux schémas ci-dessous devraient vous aider à comprendre :

utilisons Le théorème de Thalès dans le triangle bleu ( désolé ça sert encore )


Eh oui la 72 ème personne a presque 25 ans, mais allez vérifier quand même...

Vous aimerez peut-être aussi