Vous êtes sur la page 1sur 8

Fiche-2: Représentation tabulaire

Rachid Naciri
January 31, 2021

Voila que la phase de la collecte des données est globale des éléments qui constituent la distribution
achevée, une deuxième étape intuitive consiste à statistique.
présenter ces données dans un support de tel sorte Un tableau statistique est constitué d’une liste de
qu’ils soient transmises de façon claire et organisées nombres ou d’états qui correspondent aux critères
facilitant ainsi l’exploitation et l’interprétation des de la population considérée. En statistique, la di-
statistiques. Une telle performance est accomplie mension d’un tableau est donnée par le nombre de
via deux types de supports, les tableaux statistiques critères se rapportant aux individus d’une même
et les graphes (Fiche 2) ou diagrammes statistiques. population présentés dans se dernier. Dans cette
Les tableaux constituent un outil très efficace section on propose d’étudier les modes de représen-
pour une meilleure exploitation des données, dans tation tabulaires les plus utilisées dans le contexte
la mesure où ils transmettent l’information d’une des statistiques descriptives . L’analyse des tableaux
manière rigoureuse. L’objective principale d’une à deux ou plusieurs critères fera l’objet d’une autre
représentation tabulaire et de donner une vision fiche.

1 Tableau à une dimension

Dans tout ce qui suit la notation P = { p1 , · · · , p N } désigne une pop- L’effectif total d’une population corre-
spond au nombre total d’individus sur
ulation constituée de N individus tel que chaque pi représente le
lesquels porte l’observation.
i-ème individu. Le nombre N est dite effectif total de la population.
Si la population P est observée selon un critère X, alors on note
par X = { x1 , · · · , x N } l’ensemble de tout les observations, chaque
l’observation xi correspond à l’individu pi . L’ensemble {( pi , xi ), i =
1, 2, · · · , N } est appelé distribution statistique du critère X. Individus de P Variable X
p1 x1
Définition 1.1 (Tableau statistique de 1ère forme). p2 x2
Pour la variable ( le caractères) X, On appelle tableau statistique p3 x3
.. ..
de premier forme le tableau à deux colonne qui associe à chaque . .
individu sa valeur (catégorie) , ce tableau est dite aussi tableau de pN xN
données individualisées. Table 1: Tableau statis-
tique de 1ère forme

1.1 Effectif relatif

On rappelle que les modalités d’une variable (caractère) sont ces


valeurs (catégories) possibles.
Considérant la variable X observée sur neuf individus telle que
X = {1, 1, 3, 2, 4, 5, 5, 4, 4}, alors les modalité de X est la liste non Noter que le nombre des modalités est
toujours inférieur ou égale au nombre
ordonnée {4, 1, 5, 3, 2} (c’est l’ensemble des valeurs de X prises sans d’observations, puisque il sont toutes
répétition). prises sans répétitions.
Dans tout ce qui suit pour chaque variable X = { x1 , . . . , x N }, on
note par M (X) = {m1 , . . . , mr } l’ensemble de ses modalités (r ≤ n).
2 rachid naciri

Définition 1.2 (Effectif relatif).


On appelle effectif relatif d’une modalité mi le nombre d’individus
présentant cette modalité qu’on note ni .

Exemple: La lettre grec Σ est utilisée pour ré-


sumer l’écriture d’une somme, par ex-
En considérant la variable statistique X = {4, 1, 1, 3, 2, 4, 5, 5, 4}, alors emple l’expression;
M (X) = {m1 = 4, m2 = 1, m3 = 5, m4 = 3, m5 = 2} et on a :
machin1 + machin2 + · · · + machin10

n1 = 3 , n2 = 2 , n3 = 2 , n4 = 1 , n5 = 1 peut être écrit comme :


valeur finale valeur finale
z }| { z }| {
Remarquer que la somme des effectifs relatifs est égale au nombre k = 10 z = 10
d’observations, donc à l’effectif total d’individus. ∑ machink ou ∑ machinz
k=1 z=1
| {z } | {z }
valeur initiale valeur initiale

On peut écrire alors: Les indices (conteurs) k ou z sont dites


variables muettes on peut les changer
k =r à notre guise (Compter de 1 à 10 avec
N = n1 + n2 + n3 + · · · + nr = ∑ nk ces doit est la même chose qu’avec
k =1 10 baguettes), c’est le cas par exem-
ple dans le calcule de l’intégrale d’une
Rb Rb
fonction ; a x2 dx = a t2 dt = · · ·

Définition 1.3 (Tableau statistique de 2ème forme).


On appelle tableau statistique de deuxième forme le tableau à
deux colonnes qui associe à chaque modalité son effectif relatif,
Modalité mi effectifs relatifs ni
ce tableau est dit aussi tableau des effectifs relatifs (absolute Fre-
m1 n1
quency table)
m2 n2
m3 n3
Une autre colonne peut être ajouter au tableau 2, contenant ce .. ..
. .
qu’on appelle effectif cumulé d’une modalité.
mr nr
k =r
Définition 1.4 (Effectif cumulé). effectif total N= ∑ ni
k =1
Pour une modalité mi , l’effectif cumulé représente le nombre
Table 2: Tableau des effectifs relatifs
d’individus présentant une modalité d’indice inférieur ou égal à i,
on le note par nci soit :

k =i
n ci = n1 + n2 + · · · + n i = ∑ nk
k =1

Modalité mi Effectifs relatifs ni Effectifs cumulés nci


m1 n1 n1
m2 n2 n1 + n2 Table 3: Tableau des effectifs
relatifs et effectifs cumulés
m3 n3 n1 + n2 + n3
.. .. ..
. . .
mr nr n1 + n2 + . . . + nr = N

1.2 Fréquence relatif


Le tableau statistique 2, peut être représenter aussi en termes de ce
qu’on appelle fréquence relative.
fiche-2: représentation tabulaire 3

Définition 1.5 (Fréquence relative).


Pour une modalité mi , on appelle fréquence de la modalité
(ou fréquence relative à mi ) qu’on note par f i , la proportion
d’individus de la population présentant cette modalité. Modalité mi Fréquences relatives f i

La fréquence d’une modalité est obtenue en divisant l’effectif re- n1


m1 f1 =
N
latif à cette modalité par l’effectif total, soit :
n2
m2 f2 =
n N
fi = i n3
N m3 f3 =
N
Le tableau des fréquences relatives est dite aussi table des probabil- .. ..
. .
ités du critère étudié. nr
mr fr =
L’ensemble de tout les fréquences relatives d’une distribution statis- N
tique constitue une loi de probabilité1 (voir section 1.3 ), donc leur k =r
∑ fi = 1
sommes vaut 1. En effet; pour un critère de r modalités et d’effectif k =1

total N on a : Table 4: Tableau des


fréquences relatives
r
r ∑ nk
n1 nr N
∑ fk =
k =1
+...+ = = =1
k =1
N N N N
1
On considérant l’expérience aléatoire
D’une manière similaire on peut définir la notion de fréquence cu- "choisir une observation au hasard",
mulé. Pour une fréquence f i , la fréquence cumulé f ci est la somme alors la fréquence d’une modalité peut
être définit comme étant la probabilité
des fréquences présentant un indice inférieur ou égal à i, soit : (uniforme) qu’une observation prend la
valeur de cette modalité.
k =i
f ci = f 1 + f 2 + · · · + f i = ∑ fk
k =1

Modalité mi fréquences relatifs ni fréquences cumulés nci


n1
m1 n1
N
n2 n1 n
m2 + 2 Table 5: Tableau des fréquences
N N N
relatifs et fréquences cumulés
n3 n1 n2 n
m3 + + 3
N N N N
.. .. ..
. . .
nr n1 n2 nr
mr + +...+ =1
N N N N

Exemple d’application:

Considérant les données hypothétiques de la variable X qui représente


le poids (exprimée en kg) observé sur une population P = { p1 , p2 , . . . , p12 }
constituée de 12 personnes, telle que

X = {80, 66, 85, 70, 69, 70, 70, 71, 70, 69, 71, 70}

Donc l’ensemble des modalités de X est la liste non ordonnée des


valeurs prises par X soit,

M(X) = {80, 66, 85, 70, 69, 71}


4 rachid naciri

Les tableaux statistique qui découlent de cette distribution statistique


sont :

Individus Variable Poids (kg)


p1 80
p2 66
p3 85
p4 70
p5 69 Table 6: Exemple: Tableau des données
p6 70 individualisées de la variable poids

p7 70
p8 71
p9 70
p10 69
p11 71
p12 70

Modalités (mi ) Effectifs (ni ) Effectifs cumulés nci


80 1 1
66 1 2 Table 7: Tableau des effectifs
85 1 3 relatifs de la variable poids

70 5 8
69 2 10
71 2 12

Modalités (mi ( x )) Fréquences ( f i ) Fréquences cumulées ( f ci )


80 kg 1/12 1/12

66 Kg 1/12 2/12 Table 8: Tableau de fréquence


85 kg 1/12 3/12 de la variable poids

70 kg 4/12 7/12

69 kg 2/12 9/12

71 kg 3/12 1

1.3 Interprétation d’une fréquence


Considérant la distribution des notes d’un groupe de 18 étudiants Notes ni fi f ci
présentée dans le tableau statistique 9 9 3 3/18 3/18
Si on considère l’expérience aléatoire "Choisir un étudiant au hasard 10 2 2/18 5/18
12 4 4/18 9/18
parmi les 18 étudiants et vérifier sa note" tel que tout les étudi- 5/18 14/18
1 5
ants ont la même chance d’être choisie (probabilité uniforme). Donc 14 2 2/18 16/18

l’ensemble (univers) des possibilité notée Ω est : 16 2 2/18 18/18 =1


Table 9: Répartition des notes
Ω = {9, 10, 12, 13, 14, 16}

Si maintenant on considérant l’événement: A12 ="choisir un étudi-


ants ayant 12 comme note ".
fiche-2: représentation tabulaire 5

Quelle est alors la probabilité de l’événement A12 noté P(A12 ) ?.


Puisque on est dans le cas d’une probabilité uniforme 2 alors 2
En probabilité uniforme, la probabilité
P(A12 ) est le nombre total d’étudiants qui ont 12 comme note sur d’un événement de cardinal p dans un
p
univers de cardinale n est , cela vient
le nombre total d’étudiants, c’est en effet la fréquence relative de la n
du fait que chaque événement peut être
note (modalité ) 12, soit : exprimer comme réunion d’événements
élémentaires (incompatibles).
4
P( A) = = f3
18
Si maintenant on s’intéresse à la probabilité de l’événement:
A≤12 ="choisir un étudiants ayant une note inférieure au égale à 12
".
En effet, pour que l’événement A≤12 soit réalisé il faut choisir un
étudiant qui a comme note 12, 10 ou 9, et puisque c’est événements
sont deux à deux incompatibles 3 on a : 3
C’est à dire qu’un étudiant ne peut
pas avoir deux note différente simul-
3 2 4 9 tanément, on exprime ça comme suit:
P(A≤12 ) = P(A9 ) + P(A10 ) + P(A12 ) = + + = = 0.5 = f c3
18 18 18 18 Ai ∩ A j = ∅ i,j ∈ {9, 10, 12} 0
aveci 6= j
Donc on peut interpréter la fréquence cumuler f c3 de la note 12
comme étant la probabilité (proportion) d"étudiants qui ont une note
inférieure au égale à 12. Dans notre cas, f c3 = 0.5, on peut affirmer
que 50% d’étudiant on une note inférieures à 12 ou que la note 12
et le 50ème centile ou plus précisément la médiane (Voir fiche 3) de
cette distribution de notes.

2 Regroupement des données

Il existe des situations4 où le nombre importants des observation 4


c’est le cas par exemple d’une variable
nous amène à les traiter par groupe et non d’une façon individual- continue où une mesure peut prendre
une infinité de valeurs tel que le temps
isée. Un tel regroupement peut être réaliser par le biais de plusieurs d’exécution d’une tâche.
méthode dans cette section on présente l’une d’elle.
L’objective de regroupement est de répartir l’ensemble des obser-
vations sur une collection d’intervalles dites classes de la forme
] ai , ai+1 ], la valeur ai+1 − ai est ce qu’on appelle amplitudes d’une
classe.
Les étapes de construction d’une distribution type classe sont en
générale:
Ê Déterminer les classes où les données seront regroupées en:
o Déterminant le nombre de classes a formées.
o Déterminant la plage de valeurs qu’aurais chaque classe
Ë Affecter chaque observation dans la classe approprié.
Ì Calculer l’effectif relatif de chaque classe.
En fait, il n’existe pas de règles empiriques strictes pour effectuer
la première étape. généralement le nombre de classe crôit avec le
nombre d’observation.Soient X une variable statistique,
• N le nombre total d’observation,
5
L’étendu d’une variable statistique est
la différence entre la modalité maxi-
• p le nombre de classe, male et la modalité minimale.
• a l’amplitude d’une classe.
En supposant que les amplitudes des classes sont deux á deux égaux,
on peut déterminer l’amplitude d’une classe en utilisant la formule
approximative faisant intervenir l’étendu5 de X:
6 rachid naciri

6
La règle de Struge suppose que la
e = xmax − xmin ≈ p × a distribution suit ce qu’on appelle une
distribution normale, la démonstration
tel que xmax ,xmin représente respectivement la valeur maximale et de cette règle sort du cadre de ce cour,
pour plus de détails voir:
minimale de la variable X.
https://sci-hub.se/https://doi.
Le nombre de classes peut être déterminer en utilisant la règles de org/10.1080/01621459.1926.10502161
Sturge6 : ou
https://robjhyndman.com/papers/
P = 1 + 3.3 × log10 ( N ) sturges.pdf

Le nombre de classes p correspond a la partie entière7 de P. 7


Si par exemple ;
Une fois les valeurs de p et a sont déterminées, on procède à la
P = 8.3 = 6 + 0.3
construction de chaque classe comme suit: |{z} |{z}
partie entière partie fractionnelle

[ xmin , xmin + a], ] xmin + a, xmin + 2a], · · · , ] xmin + ( p − 1) a, xmin + pa] alors p = 8

Exemple d’application:

Considérons une distribution de 50 observation d’une variable


15 58 35 49 9
statistique X qu’on souhaite regrouper dans des classes de même 24 12 25 35 16
amplitude, en utilisant la règle de Struge: 52 19 17 89 24
37 34 30 31 46
L’étendu de la distribution est :
78 31 45 13 33
41 63 27 76 31
e = xmax − xmin = 89 − 1 = 88 24 21 1 16 27
48 33 35 43 28
La distribution est constituée de 50 observations, donc par applica- 58 72 28 42 60
44 36 52 18 49
tion de la règle de Sturge on a :
Table 10: Observations de X
ln(50)
P = 1 + 3.3 log10 (50) = 1 + 3.3 = 6.6 = 6 + 0.6
ln(10) |{z}
nombre de classes

Donc la règle de Struge suggère un regroupement en 6 classes (p=6).


Donc l’amplitude de chaque classe est:

e 88
a≈ = = 14.7
p 6 8
Classes :

[1, 1 + 1 × 14.7]
Ainsi les classes8 construites sont : ]1 + 1 × 14.7, 1 + 2 × 14.7]
]1 + 2 × 14.7, 1 + 3 × 14.7]
[1, 15.7]; ]15.7, 30.4]; ]30.4, 45.1]; ]45.1, 59.8]; ]59.8, 74.5]; ]74.5, 89.2] ]1 + 3 × 14.7, 1 + 4 × 14.7]
]1 + 4 × 14.7, 1 + 5 × 14.7]
A ce stade on peut construire le tableau des effectifs et fréquences ]1 + 5 × 14.7, 1 + 6 × 14.7]

relatifs comme suit:

Classes Effectifs relatifs Fréquences ( f i )

[1, 15.7] 5 5/50

[15.7, 30.4] 15 15/50


Table 11: Regroupement
]30.4, 45.1] 1/12 3/12 en classe de la variable X

]45.1, 59.8] 4/12 7/12

]59.8, 74.5] 2/12 9/12

]74.5, 89.2] 3/12 1


fiche-2: représentation tabulaire 7

3 Tableau à deux dimensions

Soit x et y deux critères statistiques prenant respectivement les modal-


ités (m1 ( x ), . . . , mr ( x )),(m1 (y), . . . , ms (y)). Le tableau de contingence
se présente suit :

M(X)
m1 ( y ) m2 ( y ) ... m j (y) ... ms (y) Total ni•
M(X)
m1 ( x ) n11 n12 ... n1j ... n1s n 1•
m2 ( x ) n21 n22 ... n2j ... n2s n 2•
.. .. .. .. .. .. .. ..
. . . . . . . . Table 12: Tableau de contingence
mi ( x ) ni1 ni2 ... nij ... nis ni •
.. .. .. .. .. .. .. ..
. . . . . . . .
mr ( x ) nr1 nr2 ... nrj ... nrs nr •
Total n• j n •1 n •2 ... n• j ... n•s n••

3.1 Propriétés d’un tableau de contingence

Les données d’un tableau de contingence se lises comme suit:

Définition 3.1 (Types effectifs).


Ê Les effectifs partiels: Ce sont les effectifs lus à l’intérieur du
tableau de contingence (repérés par les coordonnées thé-
matiques nij ). Ils correspondent au nombre d’individus
présentant à la fois la modalité mi ( x ) et la modalité m j (y)
Ë L’ effectif marginal de x: Pour la modalité mi ( x ), cet effectif
est noté ni• , il représente le nombre d’individus ayant cette
modalité.
s
ni • = ∑ nij
j =1

Ceci est valable pour la variable y.


Ì L’ effectif total n•• : On obtient cet effectif en sommant tout
les effectifs partiels ou les effectifs marginaux de l’une des
deux variables.
r s r s

De la même manière on peut définir la notion des fréquences par- n•• = ∑ ∑ nij = ∑ ni• = ∑ n• j
i =1 j =1 i =1 j =1
tielles, et des fréquences marginales:

Définition 3.2 (Types effectifs).


Ê Les fréquences partielles: Ce sont les fréquences rela-
tives aux effectifs partiels . Ils correspondent au portion
d’individus présentant à la fois la modalité mi ( x ) et la
nij
modalité m j (y), soit : f ij = n•• .
Ë Fréquence marginal de x: Pour la modalité mi ( x ), cette
fréquence est noté f i• , il représente la portion d’individus
8 rachid naciri

ayant cette modalité.


s s nij ni •
f i• = ∑ fij = ∑ n•• =
n••
j =1 j =1

Il est évident que :


r s r s
∑ ∑ fij = ∑ fi• = ∑ f • j = 1
i =1 j =1 i =1 j =1

Définition 3.3 (Fréquences conditionnelles).


La fréquence conditionnelle notée f i/j est lue comme la portion
des individus ayant la modalité mi ( x ) parmi les individus présen-
tant la modalité m j (y) ( ou f de i si j). Elle corresponde au rapport
de l’effectif partiel sur l’effectif marginal, soit :
nij
f i/j = .
n• j
nij n•• f ij
f i/j = × =
n•• n• j f•j

Vous aimerez peut-être aussi