Vous êtes sur la page 1sur 23

École Supérieure de Management, Année universitaire : 2022-2023

d’Informatique et de télécommunications
SUP MTI

TD N° 01
Exercice 1 :

Le tableau ci-dessous donne la répartition de la population active occupée (ayant effectivement un emploi) selon
la catégorie socioprofessionnelle (CSP), en France.

Effectifs (en Effectifs Fréquences


CPSP Fréquences (en %)
milliers) cumulés cumulées
Agriculteurs
1312
exploitants
Artisans,
commerçants, chefs 1739
d’entreprises
Cadres, professions
intellectuelles 2267
supérieures
Professions
4327
intermédiaires
Employés 5815
Ouvriers 6049

1. Déterminer la population statistique, l’individu, le caractère et l’effectif total. Quel est le type de la série
statistique ? quelle est la modalité la plus fréquente ?
2. Compléter le tableau ci-dessus.
3. Représenter graphiquement ces données.

Corrigé :

1. Population : Population active occupée (ayant effectivement un emploi)

Individu : un employé

Caractère : catégorie socioprofessionnelle (CSP)

Effectif total : N= 1312 + 1739 + 2267 + 4327 + 5815 + 6049 =21509

Type de la série : Qualitative nominale

Modalité la plus fréquente ou le mode : « Ouvriers »


2.

Effectifs Fréquences (en Fréquences


CPSP Effectifs (en milliers)
cumulés %) cumulées (en %)
Agriculteurs exploitants 1312 1312 6,10 6,10
Artisans, commerçants,
1739 3051 8,08 14,18
chefs d’entreprises
Cadres, professions
2267 5318 10,54 24,72
intellectuelles supérieures
Professions intermédiaires 4327 9645 20,12 44,84
Employés 5815 15460 27,04 71,88
Ouvriers 6049 21509 28,12 100
Total 21509 100

3. Représentation graphique de la série

Effectifs (en milliers)


7000
6000
5000
4000
3000
2000
1000
0

Ou
Effectifs (en milliers)

6%
8%
28%
11%

20%
27%

Agriculteurs exploitants Artisans, commerçants, chefs d’entreprises


Cadres, professions intellectuelles supérieures Professions intermédiaires
Employés Ouvriers

Exercice 2 :

Un relevé des durées des communications téléphoniques effectuées dans un central téléphonique a fourni les
informations consignées dans le tableau suivant (l'unité de durée est la minute).

Intervalle de [0 ; 2[ [2 ; 4[ [4 ; 6[ [6 ; 8[ [8 ; 10[ [10 ; 12[


durée
Effectif 14 16 25 15 17 13

1. Calculer la durée moyenne d'un appel


2. On regroupe les classes par deux, ce qui revient à considérer les classes [0;4[, [4 ; 8[et[8;12[.Calculer la
durée moyenne d'un appel pour cette nouvelle série.
3. Quelle conclusion pouvez-vous formuler ?
4. Déterminer la médiane, premier quartile et troisième quartile de la première série.
5. Dessiner la boite à moustaches.

Corrigé :

1. La moyenne :
Intervalle de [0 ; 2[ [2 ; 4[ [4 ; 6[ [6 ; 8[ [8 ; 10[ [10 ; 12[
durée
Effectif 14 16 25 15 17 13
Centre 1 3 5 7 9 11
14 ∗ 1 + 16 ∗ 3 + 25 ∗ 5 + 15 ∗ 7 + 17 ∗ 9 + 13 ∗ 11
𝑋̅ = = 5.88
100

2.

Intervalle de [0 ; 4[ [4 ; 8[ [8 ; 12[
durée
Effectif 30 40 30
Centre 2 6 10

30 ∗ 2 + 40 ∗ 6 + 30 ∗ 10
𝑋̅ = =6
100
3.

4.

Intervalle
[0 ; 2[ [2 ; 4[ [4 ; 6[ [6 ; 8[ [8 ; 10[ [10 ; 12[
de durée
Effectif 14 16 25 15 17 13
Centre 1 3 5 7 9 11
Effectif
cumulé 14 30 55 70 87 100

La médiane :

On a : α * N = 0.5 *100 = 50

Le premier effectif cumulé qui dépasse 50 est N3=55, la classe qui contient la médiane est c3=[4, 6[

Donc la médiane est :

50 − 30
Me = 4 + (6 − 4) = 5.6
55 − 30

La premier Quartile Q1 :

On a : α * N = 0.25 *100 = 25

Le premier effectif cumulé qui dépasse 25 est N2=30, la classe qui contient Q1 est c2=[2, 4[

Donc Q1 est donné par :

25 − 14
Q1 = 2 + (4 − 2) = 3.375
30 − 14
La troisième Quartile Q3 :

On a : α * N = 0.75 *100 = 75

Le premier effectif cumulé qui dépasse 75 est N5=87, la classe qui contient Q3 est c2=[8, 10[

Donc Q3 est donné par :

75 − 70
Q3 = 8 + (10 − 8) = 8.588
87 − 70

5. Boite à moustaches

Exercice 3 :

On considère les deux séries statistiques définies par les tableaux S1et S2 ci-dessous :

Tableau S1 Tableau S2

Valeurs -80 -40 0 40 80 Valeurs 20 60 100 140 180


Effectifs 15 27 10 23 25 Effectifs 15 27 10 23 25

1. a) Calculer la moyenne de la série statistique correspondant à S1.


b) Déduire de ce résultat la moyenne de la série correspondant à S2.

2. Lors de l'étude sur la résistance d'un type de fil, on a réalisé cent expériences de rupture et on a
noté à chaque fois la charge limite provoquant la rupture. Les résultats sont consignés dans le
tableau suivant :

Charges(en g) [700;740[ [740;780[ [780;820[ [820;860[ [860;900[


Effectifs 15 27 10 23 25

Utiliser un des deux résultats précédents pour obtenir rapidement la moyenne de la charge de
rupture.
Corrigé :

1. On note les valeurs de la série S1 par xi et les valeurs de la série S2 par yi

a) La moyenne de la série S1 :

On a N=15+27+10+23+25=100, donc

(−80) ∗ 15 + (−40) ∗ 27 + 0 ∗ 10 + 40 ∗ 23 + 80 ∗ 25
𝑋̅ = = 6.4
100

b) La moyenne de la série S2 :

On remarque que les valeurs de la deuxième S2 sont données par :

yi=xi+100

donc 𝑌̅ = 𝑋̅ + 100

c-à-d 𝑌̅ = 6.4 + 100 = 106.4

2) Pour calculer la moyenne de la charge de rupture, on calcul d’abord les centres


des classes comme suit :

Charges(en [700;740[ [740;780[ [780;820[ [820;860[ [860;900[


g)
Effectifs 15 27 10 23 25
Centre ci 720 760 800 840 880

On remarque que les centres ci sont donnés par :


ci = yi + 700

donc la moyenne de la charge de rupture est :

𝑍̅ = 𝑌̅ + 700 = 106.4 + 700 = 806.4


Exercice 4 :

La température est relevée chaque heure pendant 4 jours dans une forêt. Les 97 résultats obtenus ont
été triés et sont rassemblés dans le tableau suivant :

Température 14.5 15 15.5 16 16.5 17 17.5 18 18.5 19 19.5


Nombre de
fois où cette
5 7 10 12 15 10 11 9 7 7 4
température a
été relevée

1. Déterminer la médiane Me, les quartiles Q1 et Q3 de cette série statistique.


2. Dessiner la boite à moustaches.
3. Déterminer les déciles D1 et D9.

Corrigé :

1. La médiane Me :

Pour calculer la médiane, on calcul d’abord les effectifs cumulés comme suit :

Température 14.5 15 15.5 16 16.5 17 17.5 18 18.5 19 19.5


Nombre de
fois où cette
5 7 10 12 15 10 11 9 7 7 4
température a
été relevée
Effectif
5 12 22 34 49 59 70 79 86 93 97
cumulé

On N=97 est un nombre impair, N=97=2*48+1

Alors la médiane est la valeur de rang 49 c-à-d la 49ème valeur de la série ordonnée

D’où la médiane est Me=16.5

Premier quartile Q1 :

Q1=x0.25 (α=0.25)

On a 0.25*N=0.25*97=24.25 n’est pas un entier, alors le rang de premier quartile Q1


est le premier entier naturel supérieur à 24.25 (c-à-d 25)

Donc Q1 correspond à la 25ème valeur de la série ordonnée

D’où Q1=16
Troisième quartile Q3 :

On a 0.75*N=0.25*97=72.75 n’est pas un entier, alors le rang de troisième quartile Q3


est le premier entier naturel supérieur à 72.75 (c-à-d 73)

Donc Q3 correspond à la 73ème valeur de la série ordonnée

D’où Q3=18

2. Boite à moustaches

3.

Premier Décile D1

D1=x0.1 (α=0.1)

On a α*N = 0.1*97=9.7 n’est pas un entier, alors le rang du premier décile D1 est le
premier entier naturel supérieur à 9.7 (c-à-d 10)

Donc D1 correspond à la 10ème valeur de la série ordonnée

D’où D1=15

Neuvième Décile D9

D9=x0.9 (α=0.9)

On a α*N = 0.9*97=87.3 n’est pas un entier, alors le rang du neuvième décile D9 est le
premier entier naturel supérieur à 87.3 (c-à-d 88)

Donc D9 correspond à la 88ème valeur de la série ordonnée

D’où D9=19
Exercice 5 :
Au poste de péage, on compte le nombre de voitures se présentant sur une période de 5mn. Sur 100
observations de 5mn, on obtient les résultats suivants :

Nombre de
1 2 3 4 5 6 7 8 9 10 11 12
voitures

Nombre
2 8 14 20 . 15 9 6 2 3 1 1
d’observations

1. Déterminer la valeur manquante dans le tableau.


2. Construire la table des fréquences et le diagramme en bâtons en fréquences de la série du
nombre de voitures.
3. Calculer la moyenne et l’écart-type de cette série.
4. Déterminer la médiane, les quartiles et tracer la boite à moustaches.
5. Déterminer l’étendue et les écarts inter-déciles pour α=0.1 et α=0.2

Corrigé :

1. La valeur manquante dans ce tableau représente l’effectif n5 de la valeur x5=5,

On a l’effectif total de la série est N=100

Donc n5 = N-(2+8+14+20+15+9+6+2+3+1+1)=19

2. Tableau des fréquences :


Nombre de
1 2 3 4 5 6 7 8 9 10 11 12
voitures xi

Nombre
d’observations 2 8 14 20 19 15 9 6 2 3 1 1
ni

Fréquences fi 0.02 0.08 0.14 0.2 0.19 0.15 0.09 0.06 0.02 0.03 0.01 0.01
Diagramme en bâtons

Fréquence
0,25

0,2

0,15

0,1

0,05

0
1 2 3 4 5 6 7 8 9 10 11 12

3. La moyenne 𝑋̅ de série :
1 ∗ 2 + 2 ∗ 8 + 3 ∗ 14 + ⋯ + 12 ∗ 1
𝑋̅ =
100
= 1 ∗ 0.2 + 2 ∗ 0.08 + 3 ∗ 0.14 + ⋯ + 12 ∗ 0.01

= 𝟓. 𝟎𝟕

La moyenne σx de série

On calcule d’abord la variance de la série V(X) :

1
𝑉(𝑋) = [ ∗ (2 ∗ 12 + 8 ∗ 22 + 14 ∗ 32 + ⋯ + 1 ∗ 122 )] − 5.072 = 4.765
100
Donc l’écart-type est

𝜎𝑥 = √𝑉(𝑋) = √4.765 = 2.18

4.

La médiane Me :
Nombre de
1 2 3 4 5 6 7 8 9 10 11 12
voitures xi

Nombre
d’observations 2 8 14 20 19 15 9 6 2 3 1 1
ni

Fréquences fi 0.02 0.08 0.14 0.2 0.19 0.15 0.09 0.06 0.02 0.03 0.01 0.01

Effectif
2 10 24 44 63 78 87 93 95 98 99 100
Cumulé

On N=100 est un nombre pair, N=100=2*k=2*50 (k=50)

Alors la médiane est donnée par :

c-à-d

(50eme valeur + 51eme valeur) 5+5


𝑀𝑒 = = =5
2 2

Premier quartile Q1 :

Q1=x0.25 (α=0.25)

On a 0.25*N=0.25*100=25 est un entier, alors le rang de premier quartile Q1 est 25

Donc Q1 correspond à la 25ème valeur de la série ordonnée

D’où Q1=4

Troisième quartile Q3 :

On a 0.75*N=0.25*100=75 est un nombre entier, alors le rang de troisième quartile Q3


est 75.

Donc Q3 correspond à la 75ème valeur de la série ordonnée


D’où Q3=6

Boite à moustaches (Voir SPSS)

5. Etendue

L’étendue est l’écart entre la valeur maximale et la valeur minimale de la série, c-à-d

Etendue=12-1=11

Intervalle Interquartile :

I=Q3-Q1=6-4=2

Intervalle inter-décile :

Il existe quatre l’écart inter-déciles qui sont :

D9 - D1 ; D8 - D2 ; D7 - D3 ; D6 - D4

Dans cet exercice on a deux cas :

Cas où α=0.1 :

On doit calculer D1 et D9 avec

D1=x0.1 (α=0.1)

et D9=x0.9 (α=0.9)

Pour D1 :

On a α*N=0.1*100=10 est un nombre entier, donc D1 correspond à la 10ème valeur de la


série ordonnée,

C-à-d D1=2

Pour D9 :

On a α*N=0.9*100=90 est un nombre entier, donc D9 correspond à la 90ème valeur de la


série ordonnée,

C-à-d D9=8

D’où l’intervalle inter-décile pour α=0.1 est

I=D9-D1=8-2=6
Cas où α=0.2 : On doit calculer D2 et D8

Pour D2 :

On a α*N=0.2*100=20 est un nombre entier, donc D2 correspond à la 20ème valeur de la


série ordonnée,

C-à-d D2=3

Pour D8 :

On a α*N=0.8*100=80 est un nombre entier, donc D8 correspond à la 80ème valeur de la


série ordonnée,

C-à-d D8=7

D’où l’intervalle inter-décile pour α=0.2 est

I=D8 - D2=7-3=4

Exercice 6 :
1. On se basant sur l’histogramme ci-dessous, construire un tableau contient les colonnes
suivantes : classes Ii , effectifs ni , effectifs cumulés Ni , amplitudes ai , effectifs corrigés ni*,
centres xi .
2. Déterminer la moyenne arithmétique, la classe modale, la médiane, le premier quartile, le
troisième quartile et écart inter-décile pour α=0.2
3. Dessiner la boite à moustaches.
Corrigé

1.

Classes Ii Effectifs Effectifs Amplitudes Effectifs Centres


ni cumulés Ni ai corrigés ni* ci
3+5
[3, 5[ 2*11=22 22 5-3=2 11 =4
2
5+7
[5, 7[ 2*17=34 56 7-5=2 17 =6
2
7 + 12
[7, 12[ 5*26=130 186 12-7=5 26 = 9.5
2
12 + 16
[12, 16[ 4*31=124 310 16-12=4 31 = 14
2
16 + 20
[16, 20[ 4*13=52 362 20-16=4 13 = 18
2

2. La moyenne arithmétique
22 ∗ 4 + 34 ∗ 6 + 130 ∗ 9.5 + 124 ∗ 14 + 52 ∗ 18
𝑋̅ = = 𝟏𝟏. 𝟔𝟎
362

La classe modale : est la classe ayant l’effectif corrigé le plus élevé c-à-d la classe
I4=[12, 16[

La médiane :

On a : α * N = 0.5 *362 = 181


Le premier effectif cumulé qui dépasse 181 est N3=186, la classe qui contient la
médiane est I3=[7, 12[

Donc la médiane est :

α ∗ N − 𝑁2
Me = 7 + (12 − 7)
𝑁3 − 𝑁2
Donc
181 − 56
Me = 7 + 5 ∗ = 11.8
186 − 56

La premier Quartile Q1 :

On a : α * N = 0.25 *362 = 90.5

Le premier effectif cumulé qui dépasse 90.5 est N3=186, la classe qui contient Q1 est
I3=[7, 12[

Donc Q1 est donné par :

90.5 − 56
Q1 = 7 + 5 ∗ = 8.32
186 − 56

La troisième Quartile Q3 :

On a : α * N = 0.75 *362 = 271.5

Le premier effectif cumulé qui dépasse 271.5 est N4=310, la classe qui contient Q3 est
I4=[12, 16[

Donc Q3 est donné par :

271.5 − 186
Q3 = 12 + (16 − 12) = 14,75
310 − 186

Ecart inter-décile pour α=0.2 :

On doit calculer D8 et D2
Pour D2 :
On a : α * N = 0.2 *362 = 72.4

Le premier effectif cumulé qui dépasse 72.4 est N3=186, la classe qui contient D2 est
I3=[7, 12[

Donc D2 est donné par :

72.4 − 56
D2 = 7 + (12 − 7) ∗ = 7.63
186 − 56

Pour D8 :
On a : α * N = 0.8 *362 = 289.6

Le premier effectif cumulé qui dépasse 289.6est N4=310, la classe qui contient D8 est
I4=[12, 16[

Donc D8 est donné par :

289.6 − 186
D8 = 12 + (16 − 12) = 15.34
310 − 186

D’où l’écart inter-décile pour α=0.2 est D8 - D2=15.34-7.63=7.71

3. Boite à moustaches

Exercice 7 :
Une usine produit des pièces d’une machine. Pour chaque pièce (individu), on dispose du coût
de sa production et du temps nécessaire pour sa réalisation (en heures). Le tableau ci-après
donne cette répartition :

Individu 1 2 3 4 5 6
Temps (X) 2 3 6 7 10 11
mesuré en
heures
Coût (Y) 10 18 20 35 38 46

1. Calculer la moyenne de la variable statistique X.


2. Calculer la moyenne de la variable statistique Y.
3. Calculer l’écart-type de la variable statistique X.
4. Calculer l’écart-type de la variable statistique Y.
5. Tracer le nuage de points.
6. Déduire la nature de la relation existant entre X et Y.
7. Calculer le coefficient de corrélation entre X et Y et interpréter le résultat.
8. Déterminer la droite de régression. Tracer cette droite sur le nuage de points précédent.
9. Calculer le coefficient de détermination R2 et interpréter le résultat.

Corrigé :

1. La moyenne de X :

2 + 3 + 6 + 7 + 10 + 11
𝑋̅ = = 6.5
6

2. La moyenne de Y :

10 + 18 + 20 + 35 + 38 + 46
𝑌̅ = = 27.83
6
3. L’écart-type de X :

On calcul d’abord la variance de X,


On a
22 + 32 + 62 + 72 + 102 + 112
𝑉(𝑋) = − 𝑋̅ 2 = 10.92
6
Donc l’écart-type de X est,
𝜎𝑥 = √𝑉(𝑋) = √10.92 = 3.3

4. L’écart-type de Y :
La variance de Y est,
On a
102 + 182 + 202 + 352 + 382 + 462 2
𝑌(𝑋) = 𝑌̅ = 160.32
6
Donc l’écart-type de Y est,
𝜎𝑦 = √𝑉(𝑌) = √160.32 = 12.66

5. Nuage de points
6. On peut déduire qu’il existe une relation linéaire positive entre le temps X et le coût
Y.

7. Corrélation entre X et Y :
On sait que

𝑐𝑜𝑣(𝑋, 𝑌)
𝑟 = 𝑐𝑜𝑟(𝑋, 𝑌) =
𝜎𝑥 ∗ 𝜎𝑦

Avec
1
𝑐𝑜𝑣(𝑋, 𝑌) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑋̅ ̅𝑌
𝑛
1
= (2 ∗ 10 + 3 ∗ 18 + 6 ∗ 20 + 7 ∗ 35 + 10 ∗ 38 + 11 ∗ 46) − 6.5 ∗ 27.83
6
= 𝟑𝟗. 𝟗𝟒

Donc

𝑐𝑜𝑣(𝑋, 𝑌) 39.94
𝑟 = 𝑐𝑜𝑟(𝑋, 𝑌) = = = 𝟎. 𝟗𝟓
𝜎𝑥 ∗ 𝜎𝑦 3.3 ∗ 12.66

Interprétation :
8. Droite de régression :
Dans cet exercice, la variable à expliquer est Y=coût
Et la variable explicative est X=temps
Donc la droite de régression est donnée par :

Y=a*X +b

𝑐𝑜𝑣(𝑋,𝑌)
Avec 𝑎 = et 𝑏 = ̅𝑌 − 𝑎 ∗ 𝑋̅
𝑉(𝑋)

39.94
Donc 𝑎= = 3.66 et 𝑏 = 27.83 − 3.66 ∗ 6.5 = 4.04
10.92

D’où la droite de régression est :

Y=3.66*X +4.04

9. Coefficient de détermination

𝑅2 = 𝑟 2 = (0.95)2 = 0.902

Interprétation :
Exercice 8 :

Le tableau de contingence suivant est entre le salaire mensuel X et l’ancienneté Y des ouvriers
d’une entreprise.

X\Y [0, 8[ [8, 16[ [16, 24[ [24, 32[ ni. fi.

[20, 30[ 5 6 1 0
[30, 40[ 2 4 3 3
[40, 50[ 0 2 4 10
n.j
f.j

1. Compléter le tableau ci-dessus.


2. Calculer les moyennes marginales de X et Y.
3. Calculer les variances marginales de X et Y. Déduire les écarts-type marginaux.
4. Calculer la covariance entre X et Y. Interpréter le résultat.
5. Etudier les séries conditionnelles X/y3 et Y /x2 et présenter les résultats pour chaque groupe
de séries conditionnelles.

Corrigé

1.

X\Y [0, 8[ [8, 16[ [16, 24[ [24, 32[ ni. fi.
𝟏𝟐
[20, 30[ 5 6 1 0 12 = 𝟎. 𝟑
𝟒𝟎
𝟏𝟐
[30, 40[ 2 4 3 3 12 = 𝟎. 𝟑
𝟒𝟎
𝟏𝟔
[40, 50[ 0 2 4 10 16 = 𝟎. 𝟒
𝟒𝟎
n.j 7 12 8 13 40
𝟕 𝟏𝟐 𝟖 𝟏𝟑
f.j = 𝟎. 𝟏𝟕𝟓 = 𝟎. 𝟑 = 𝟎. 𝟐 = 𝟎. 𝟑𝟐𝟓 1
𝟒𝟎 𝟒𝟎 𝟒𝟎 𝟒𝟎
2. Moyenne marginale de X :

Puisque la variable X est continue, on remplace xi par le centre ci

12 ∗ 25 + 12 ∗ 35 + 16 ∗ 45
𝑥̅ = = 36
40
Moyenne marginale de Y :

Puisque la variable Y est continue, on remplace yj par le centre cj

4 ∗ 7 + 12 ∗ 12 + 20 ∗ 8 + 28 ∗ 13
𝑦̅ = = 17.4
40
3. Variances marginale de X

On remplace les valeurs xi par les centres ci , donc

12 ∗ 252 + 12 ∗ 352 + 16 ∗ 452


𝑉(𝑥) = − 362 = 69
40
Ecart-type marginal de X :

𝜎𝑥 = √𝑉(𝑥) = √69 = 8.3

Variance marginale de Y
On remplace les valeurs yj par les centres cj , donc la variance est :

42 ∗ 7 + 122 ∗ 12 + 202 ∗ 8 + 282 ∗ 13


𝑉(𝑥) = − 17.42 = 78.04
40
Ecart-type marginal de Y :

𝜎𝑦 = √𝑉(𝑦) = √78.04 = 8.83

4. Covariance entre X et Y :

1
𝐶𝑜𝑣(𝑥, 𝑦) = (𝑛 𝑥 𝑦 + 𝑛12 𝑥1 𝑦2 + ⋯ + 𝑛34 𝑥3 𝑦4 ) − 36 ∗ 17.4
40 11 1 1

Et on remplace les valeurs par les centres, on obtient :

𝐶𝑜𝑣(𝑥, 𝑦) = 50.6

Interprétation

5. Séries conditionnelle X/y3

X\Y [16, 24[


[20, 30[ 1
[30, 40[ 3
[40, 50[ 4
Total 8
Série conditionnelle Y /x2

X\Y [0, 8[ [8, 16[ [16, 24[ [24, 32[ Total


[30, 40[ 2 4 3 3 12

Vous aimerez peut-être aussi