Académique Documents
Professionnel Documents
Culture Documents
Email : tchandesso@gmail.com
1
TABLE DES MATIÈRES Tchandao Mangamana E.
4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Dénition 1.1.2 Deux ensembles nis E et F sont dits équipotents s'il existe une
bijection de l'un dans l'autre. Donc, deux ensembles sont équipotents s'ils ont le
même cardinal.
1
CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.
Exemple 1.1 Combien de nombres de 3 chires peuvent être formés à l'aide des
chires 1, 2, 3, · · · , 9 ?
Exemple 1.2 Vous achetez une carte téléphonique dont le code secret est choisi par
les chires 0 à 9. Vous eacez par inadvertance 2 chires en grattant. Vous décidez
de tester l'ensemble des cas possibles pour retrouver le bon numéro. Combien de
possibilités avez-vous de choisir les 2 chires manquants ? S'il vous faut en moyenne
1 min 30 sec pour tester un code, combien de temps faudra-til en moyenne pour
tester l'ensemble de code possible ?
Exemple 1.3 Combien de nombres de 3 chires diérents peuvent être formés avec
les 9 chires de F = {1, 2, · · · , 9} ?
Combien de nombres de 3 chires peuvent être formés avec les chires de F et ayant
au moins 2 chires identiques ?
Exemple 1.4 Une compétition réunit 16 équipes. Un podium est un triplet (x1 , x2 , x3 )
avec x1 , x2 et x3 désignant respectivement le vainqueur, le naliste malheureux et
l'équipe classé 3è. Combien y a-t-il de podium possible ?
Exemple 1.7 Dans une classe de terminale, cinq élèves n'ont pas encore été évalués
à l'oral. Dans combien d'ordres diérents le professeur peut-il les interroger, chaque
élève n'étant interrogé qu'une et une seule fois ?
Exemple 1.8 Soit A une partie propre de E . {A, Ā} forme une partition de E .
En eet, A et Ā sont non vides car A est une partie propre de E , A ∩ Ā = ∅ et
A ∪ Ā = E .
a) Algèbre d'évènements
Une famille A , non vide, d'évènements de Ω est une algèbre d'évènements si :
i) ∀A ∈ A , Ā ∈ A ;
ii) ∀A ∈ A , ∀B ∈ A , A ∪ B ∈ A .
b) Tribu
Soit A une algèbre d'évènements de Ω (l'ensemble fondamental est inni). A est
une tribu si pour toute suite innie dénombrable A1 , A2 , · · · , Ai , · · · d'éléments
∞
de A on a Ai ∈ A .
[
i=1
∞
Conséquence : Ai ∈ A .
\
i=1
b) Evènements incompatibles
Soient (Ω, A ) un espace probabilisable et A et B deux évènements de A . On dit
que A et B sont incompatibles si A et B ne peuvent se réaliser en même temps.
d) Espace probabilisé
Soit (Ω, A ) un espace probabilisable. Une probabilité est une application p de A
dans R+ telle que :
i) p(Ω) = 1
ii) ∀A ∈ A , ∀B ∈ A tels que A ∩ B = ∅, p(A ∪ B) = p(A) + p(B) et
si A1 , A2 , · · · , Ai , · · · est une suite dénombrable d'évènements deux à
deux incompatibles, alors :
∞
! ∞
[ X
p Ai = p(Ai ).
i=1 i=1
i=1
1.3.2 Equiprobabilité
Soit Ω = {a1 , a2 , · · · , an } tel que card(Ω) = n ∈ N∗ . L'application
p : P(Ω) → [0, 1]
1
{ai } 7→
n
est une probabilité sur (Ω, P(Ω)). Etant donné que pour tout i = 1, 2, . . . , n,
P ({ai }) = n1 , on parle déquiprobabilité sur Ω.
card(A)
De façon générale on a : ∀A ∈ P(Ω), p(A) = .
card(Ω)
1.3.3 Propriétés
i) ∀A ∈ A , p Ā = 1 − p(A).
ii) p(∅) = 0.
iii) ∀A ∈ A , 0 ≤ p(A) ≤ 1.
iv) ∀A ∈ A , ∀B ∈ A , p(A ∪ B) = p(A) + p(B) − p(A ∩ B).
p(A ∩ B)
∀B ∈ A , pA (B) =
p(A)
Exemple 1.11 Une urne contient deux boules blanches et 3 boules rouges indiscer-
nables au touché. On tire successivement deux boules avec remise. Soient les événe-
ments :
R1 : "Obtenir une boule rouge au premier tirage".
R2 : "Obtenir une boule rouge au second tirage".
1. Calculer P(R1 ), P(R2 ), P(R1 ∩ R2 ), P(R2 /R1 ) et P(R1 /R2 ).
2. Reprendre les mêmes questions si le tirage est sans remise.
n=0
Exemple 1.14 1/4 d'une population a été vacciné contre une certaine maladie.
Parmi les vaccinés, on compte 1/12 de malades. Parmi les malades il y a 4 non
vaccinés pour 1 vacciné. Quelle est la probabilité pour un non vacciné d'être malade ?
Si l'ensemble X(Ω) des valeurs possibles prises par la variable aléatoire X est au
plus dénombrable, alors on dit que X est une variable aléatoire discrète. Sinon, on
parle d'une variable aléatoire continue.
Exemple 1.15
On lance trois fois une pièce de monnaie (qui prend deux valeurs possibles Pile
ou Face ). L'univers est Ω = {P, F }.
Notons X le nombre de fois que Face apparaît au bout des trois lancers. Les
valeurs possibles de X sont dans l'ensemble X(Ω) = {0, 1, 2, 3}. X est une
application de Ω dans X(Ω).
Si X(Ω) = {xi / i ∈ I}, avec I un ensemble ni ou dénombrable, alors pX est en-
tièrement déterminée par la donnée des nombres pi dénis par : pi = pX ({xi }) =
p(X = xi ), ∀i ∈ I .
La loi de probabilité de X est bien dénie si, et seulement si :
n
∀i ∈ {1, · · · , n}, pi ≥ 0 et pi = 1 lorsque X(Ω) est ni.
P
i=1
∞
∀i ∈ N∗ , pi ≥ 0 et pi = 1 lorsque X(Ω) est dénombrable.
P
i=1
F : R → [0, 1]
x 7→ F (x) = p(X ≤ x) où (X ≤ x) = {ω ∈ Ω / X(ω) ≤ x}.
Dans le cas d'une variable aléatoire discrète nie telle que card(X(Ω)) = n, la
fonction de répartition se dénit de la façon suivante :
si
0 x < x1
si
x1 ≤ x < x2
p1
.. .. ..
. . .
F (x) = j
pi si xj ≤ x < xj+1
P
i=1
.. .. ..
. . .
si
1 x ≥ xn
a) Propriétés
i) ∀x, y ∈ R / x ≤ y, F (x) ≤ F (y).
ii) lim F (x) = 1.
x→+∞
1.5.3 Moments
a) Moments d'ordre k
On appelle moment d'ordre k d'une variable aléatoire X , le réel mk (X) déni par :
n
pi xki si X(Ω) est ni
P
i=1
mk (X) = ∞
pi xki si X(Ω) est dénombrable et la série converge absolument.
P
i=1
b) Espérance mathématique
L'espérance mathématique d'une variable aléatoire X est égale au moment d'ordre
1 de X , s'il existe. Elle se note E(X).
X
E(X) = m1 (X) = pi x i .
i
d) Variance et écart-type
La variance Var(X) d'une variable aléatoire X est son moment centré d'ordre 2 :
Var(X) = µ2 (X).
Propriété
Var(X) = m2 (X) − (m1 (X))2 .
F : R → [0, 1]
x 7→ F (x) = p(X ≤ x).
On dit que X est une variable aléatoire continue s'il existe une fonction numérique
f dénie sur R telle que :
i) ∀x ∈ R, f (x) ≥ 0.
ii) f est continue sur R sauf peut-être aux points pour lesquels elle admet une
limite nie à gauche et à droite.
iii) ∀x ∈ R, F (x) = −∞ f (t)dt et lim F (x) = lim −∞ f (t)dt =
Rx Rx
x→+∞ x→+∞
f (t)dt est bien dénie et est égale à 1.
R +∞
−∞
Dans ces conditions, f est alors une densité de probabilité de la variable aléatoire X .
1.6.1 Moments
Soit X une variable aléatoire continue de densité f . On dénit, en supposant la
convergence des intégrales, les notions suivantes :
b) L'espérance mathématique
Z +∞
E(X) = m1 (X) = xf (x)dx.
−∞
Remarque :
1. Une variable aléatoire continue peut ne pas avoir d'espérance mathématique
(l'intégrale n'est pas convergente !)
2. Si f est paire (c'est-à-dire : ∀x ∈ R, f (x) = f (−x)) et si E(X) existe,
alors E(X) = 0.
d) La variance
Z +∞
Var(X) = µ2 (X) = (x − E(X))2 f (x)dx.
−∞
c) Loi de Bernoulli
Loi de probabilité : P (X = 1) = p = 1 − P (X = 0).
Espérance et variance : E(X) = p, Var(X) = p(1 − p).
d) Loi binomiale
Loi de probabilité : ∀k ∈ {0, 1, . . . , n}, P (X = k) = Cnk pk (1−p)n−k .
Espérance et variance : E(X) = np, Var(X) = np(1 − p).
f) Loi de Poisson
Loi de probabilité : ∀k ∈ N, P (X = k) = λk! e−λ .
k
On a en intégrant E(X) = p
λ
and Var(X) = p
λ2
.
Remarque 1.2
L
Noter que pour p = 1 on a la loi exponentielle de paramètre λ, i.e. γ(1, λ) =
E (λ).
Si X1 , X2 , . . . , Xn sont des variables aléatoires réelles indépendantes de
même loi E (λ), alors X1 + X2 + . . . + Xn ; γ(n, λ).
L
On remarque que χ2n = Γ n2 , 2 , si bien que E(X) = n et Var(X) = 2n. De
1
Cette loi a une expérance innie, i.e. E(X) = +∞. On prend souvent θ = 0 et
donc
1
fX (x) = .
π (1 + x2 )
Tn a pour densité
− n+1
x2
1 2
fX (x) = √ 1 + , x ∈ R,
nβ 21 , n2
n
avec
1
Γ(p)Γ(q)
Z
β(p, q) = x p−1
(1 − x) q−1
dx = pour p, q ∈ N .
?
0 Γ(p + q)
On prouve que la loi de Student est centrée comme la loi normale. On a E(Tn ) = 0
et Var(Tn ) = n−2
n
pour n > 2.
1.8 Exercices
Exercice 1.1 On dispose de 4 boules de couleurs diérentes notée R, B, J, V.
On a la possibilité soit de ne choisir de boules, soit d'en choisir une, deux, trois ou
quatre. Combien peut-on eectuer de choix possibles ?
Exercice 1.3 On veut fabriquer des mots de trois lettres (ayant ou non un sens)
avec les lettres de l'alphabet. Déterminer les nombres :
1. N1 de mots diérents que l'on peut fabriquer.
2. N2 de mots contenant trois lettres distinctes.
3. N3 de mots commençant et nissant par une consonne.
4. N4 de mots contenant au moins une voyelle.
5. N5 de mots contenant exactement deux consonnes et une voyelle.
Exercice 1.4
Exercice 1.5 On rappelle que dans un jeu de cartes, chacune des cartes peut-
être considérée comme un élément du produit E × F où E est l'ensemble des 4
couleurs : c÷ur, carreau, trèe, pique et F est l'ensemble des valeurs 2, 3, · · · , 10,
Valet, Dame, Roi et As.
Exercice 1.9 On dispose de 10 livres (deux livres de chimie, trois livres de phy-
sique et cinq livres de mathématiques) qu'on range au hasard sur un étagère. Quelle
est la probabilité
1. p1 pour que 3 livres donnés soient rangés côte à côte ?
2. p2 que les livres soient bien rangés (les livres sont rangés par discipline) ?
pour que :
1. l'étudiant choisisse l'itinéraire D ?
2. l'étudiant arrive en retard ?
3. l'étudiant ait emprunté l'itinéraire C sachant qu'il est arrivé en retard ?
Exercice 1.12 La proportion des pièces défectueuses dans un lot est de 0.05. Le
contrôle de fabrication des pièces est tel que :
Si la pièce est bonne, elle est acceptée avec une probabilité de 0.96.
Si la pièce est mauvaise, elle est refusée avec probabilité 0.98.
On choisit une pièce au hasard et la contrôle. Probabilité pour :
1. qu'il y ait une erreur de contrôle ?
2. qu'une pièce acceptée soit mauvaise ?
Exemple 2.1 Les étudiants de l'université de Kara, les salariés d'une entreprise,
la production d'automobiles d'une année, le stock des machines à une date donnée.
Exemple 2.2 Si la population étudiée est constituée des étudiants de la faculté des
sciences, les caractères étudiés peuvent être : le parcours, la spécialité, l'âge, le sexe,
le nombre de crédits capitalisés, etc.
17
CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.
Exemple 2.3 Les deux modalités du caractère sexe sont : masculin et féminin.
a) Caractères qualitatifs
Les caractères qualitatifs ou variables catégorielles sont des caractères dont les dif-
férentes modalités ne sont pas mesurables. Elles sont non numériques dans le sens
où les opérations de base n'ont pas de sens.
On distingue deux types de caractères qualitatifs : les caractères qualitatifs nomi-
naux et les caractères qualitatifs ordinaux (ou ordonnés).
Caractères qualitatifs nominaux : les diérentes modalités ne sont que des noms
ou des catégories qui ne suivent pas un ordre naturel. C'est le cas par exemple de la
race, la couleur des yeux, la marque de voiture, le sexe, etc.
Caractères qualitatifs ordonnés : les modalités suivent un ordre naturel ou
peuvent être classées dans un ordre spécique. C'est le cas par exemple du niveau
d'éducation, du degré de satisfaction, etc. Ces variables sont repérables selon un
type d'échelle plus ou moins légitime. Les catégories pourront alors donner lieu à un
codage par les rangs qui ouvrira une autre gamme de traitements possibles proches
de ceux des variables quantitatives.
si x < x1
0
F (x) = Fi si xi ≤ x < xi+1
si x ≥ xm
1
b) Percentile
Le p-ième percentile est la valeur telle qu'au moins p pour cent des observations ont
une valeur inférieure ou égale à cette valeur, et (100 − p) pour cent des observations
ont une valeur supérieure ou égale à cette valeur.
Calcul du p-ième percentile
Étape 1 : classer les données dans l'ordre croissant.
p
Étape 2 : calculer l'index i = × n où n le nombre d'observations.
100
Étape 3 (décision) : si i n'est pas un nombre entier naturel, la position du p-ième
percentile correspond à l'entier E(i) + 1, où E(i) désigne la partie entière de i ; si
i est un nombre entier, le p-ième percentile correspond à la moyenne des valeurs des
observations i et i + 1.
c) Quartile
Les quartiles sont des percentiles particuliers. Les étapes de calcul des percentiles
peuvent être directement appliquées au calcul des quartiles. Il y a trois quartiles :
Q1 = Premier quartile soit 25e percentile,
Q2 = Deuxième quartile soit 50e percentile,
Q3 = Troisième quartile soit 75e percentile.
d) Médiane
La médiane (M e) d'une distribution est la valeur de la variable statistique qui
partage en deux eectifs égaux les individus de la population rangés selon la valeur
croissante du caractère. C'est le cas où p = 50.
Si F est la fonction de répartition représentée par les fréquences cumulées, la médiane
est la valeur statistique telle que F (M e) = 0, 5.
Exemple 2.7 Les données sur les salaires mensuels initiaux (en euros) des em-
ployés d'une agence de voyage sont : 2850 2950 3050 2880 2755 2710 2890 3130
2940 3325 2920 2880. Déterminer le 10e percentile ainsi que les quartiles Q1 , Q2 et
Q3 .
e) Moyenne arithmétique
La moyenne arithmétique d'une variable statistique est la somme, pondérée par les
fréquences, des valeurs.
m m
X 1X
x̄ = fi xi = ni xi .
i=1
n i=1
f) Moyenne de sous-populations
La moyenne x̄ d'une population P composée de p sous-populations Pj peut être
exprimée en fonction des moyennes x̄j des sous-populations :
p nj
fj x̄j , où
X X
x̄ = x̄j = fij xij .
j=1 i=1
g) Moyenne harmonique
La moyenne harmonique (H ) est utilisée pour estimer la moyenne des inverses quand
la grandeur a une dimension de vitesse. Elle est dénie par :
1 1
H = = .
1 m
P ni m f
P i
n i=1 xi i=1 xi
h) Moyenne géométrique
La moyenne géométrique (G) est utilisée quand on étudie les variations relatives, en
particulier les accroissements. Elle est dénie par :
v
um
uY n
n
G= t xi i .
i=1
i) Moyenne quadratique
La moyenne quadratique (Q2 ) est utilisée pour calculer la moyenne des carrés des
observations. m X
Q2 = fi x2i .
i=1
b) Variance et écart-type
La variance V (X) se calcule par la formule
m m m
1X 2
X
2
X
V (X) = ni (xi − x̄) = fi (xi − x̄) = fi x2i − x̄2 .
n i=1 i=1 i=1
c) Coecient de variation
C'est le rapport de la moyenne arithmétique à l'écart type, déni par :
σX
CV (X) = .
x̄
Le CV permet d'apprécier la représentativité de la moyenne par rapport à l'ensemble
des observations. Il donne une bonne idée du degré d'homogénéité d'une série. Il faut
qu'il soit le plus faible possible (< 0.15 en pratique).
d) Moment d'ordre k
m
1X
mk = ni xki .
n i=1
m
1X
µk = ni (xi − x̄)k .
n i=1
Exemple 2.8 Lors d'une journée, on a relevé les âges de 20 personnes venant se
présenter à l'examen théorique du permis de conduire : 19, 20, 20, 24, 37, 22, 58,
24, 23, 20, 19, 19, 21, 22, 20, 27, 33, 20, 22, 21.
(a) Déterminer la moyenne arithmétique, géométrique, harmonique et quadratique
de cette série.
(b) Déterminer la médiane, le mode, la variance, l'écart-type, le coecient de varia-
tion et l'écart inter-quartile de cette distribution d'âges.
(c) La distribution est-elle homogène ? Justier.
b) Amplitude de classe
La valeur de l'amplitude d'une classe est calculée par la diérence entre la valeur de
la borne supérieure et celle de la borne inférieure. Il arrive que la borne inférieure de
la première classe et la borne supérieure de la dernière classe ne soient pas données.
Pour estimer les bornes absentes, nous disposons des possibilités suivantes :
Rééchir à ce que pourrait être la valeur de cette borne.
Donner à la première classe l'amplitude de la deuxième classe et à la dernière
l'amplitude de l'avant dernière.
Les classes peuvent avoir une amplitude variable ou constante. Par exemple, la va-
riable âge est souvent subdivisée en classes d'amplitude de 5 ans, 0 à moins de
5 ans, 5 ans à moins de 10 ans, etc. 0, 5, 10, etc. sont les extrémités des classes.
c) Centre de classe
Pour mener des calculs statistiques sur des séries classées, les classes sont réduites à
une seule donnée, à savoir, le centre de classe. Cela revient à considérer que tous les
individus peuvent être décrits par ce centre de classe. Par dénition, le centre ci de
xi + xi+1
la classe [xi ; xi+1 [ est donné par ci = .
2
b) Percentile
Pour déterminer le p-ième percentile P e dans le cas d'une variable continue, on
détermine d'abord l'intervalle auquel appartient ledit percentile : P e ∈ [xi ; xi+1 [
et F (P e) = p/100 = p̃ avec Fi−1 < p̃ ≤ Fi . Par la formule de l'interpolation
linéaire, on obtient alors :
p̃ − Fi−1 p̃ − Fi−1
P e = xi + ai × = xi + ai × .
Fi − Fi−1 fi
b) Ecart inter-quartile
L'écart inter-quartile se dénit par : IQ = Q3 − Q1 . L'intervalle inter-quartile,
[Q1 ; Q3 ], contient 50% des observations.
c) Rapport inter-quartile
Q3
Le rapport inter-quartile est le rapport . C'est un nombre sans dimension qui
Q1
donne une mesure relative des écarts entre les 25% des valeurs les plus basses et les
25% des valeurs les plus élevées.
d) Ecart inter-décile
L'écart inter-décile se dénit par : ID = D9 − D1 . L'intervalle inter-décile,
[D1 ; D9 ], contient 80% de l'eectif de la population, il élimine les 10% des valeurs
les plus élevées et les 10% des valeurs les plus basses.
e) Rapport inter-décile
D9
Le rapport inter-décile vaut . C'est un nombre sans dimension qui compare les
D1
valeurs extrêmes de la distribution en excluant les 10% des valeurs les plus basses
et les 10% des valeurs les plus élevées.
f) Coecient de dispersion
Le coecient de dispersion Cdis est déni par le rapport de l'écart inter-quartile à
la médiane ou encore le rapport de l'écart inter-décile à la médiane, i.e.
Q3 − Q1 D9 − D1
Cdis = ou Cdis = .
Me Me
h) Variance et écart-type
m m m
1X 2
X
2
X
V (X) = ni (ci − x̄) = fi (ci − x̄) = fi c2i − x̄2
n i=1 i=1 i=1
et p
σX = V (X).
i) Coecient de variation
σX
CV (X) = .
x̄
j) Moment d'ordre k
m
1X
mk = ni cki .
n i=1
m
1X
µk = ni (ci − x̄)k .
n i=1
2.5 Exercices
Exercice 2.13 On considère le brin d'ADN suivant : GGGAGTGTBTATTAABTB
BGAABTBBBAGBGBTAGBTBGBGBGGAGTGABBGAGBBTABATGAGGGTA
BTGTBAATAABGBATGTTABBAGAAGGA.
En considérant comme modalités les lettres A, B, G et T, faire le dépouillement,
donner le tableau statistique et faire les représentations graphiques adéquates.
Exercice 2.14 Le tableau suivant donne le nombre d'enfants par famille sur un
échantillon de 1000 familles.
xi 0 1 2 3 4 5 6 7 8
ni 162 240 297 208 62 16 8 5 2
1. Faire le tableau statistique correspondant.
2. Combien de familles ont au moins 3 enfants ?
3. Combien de familles ont au plus 3 enfants ?
Exercice 2.15 Les 33 élèves d'une classe ont obtenu les notes suivantes lors d'un
devoir
Note 2 4 5 8 10 11 12 14 15 18 20
Eectif 1 2 1 4 2 7 6 3 4 2 1
1. Déterminer l'étendue et le mode de cette série.
2. Calculer la moyenne de cette série.
3. Construire un tableau donnant les eectifs cumulés, les fréquences et les fréquences
cumulées.
4. Déterminer la médiane de cette série.
5. Quel est le nombre d'élèves ayant une notre strictement inférieure à 8 ?
6. Quel est le pourcentage d'élèves ayant une note supérieure ou égale à 10 ?
a. 2 frères au moins ?
b. Moins de 2 frères ?
4. Représenter graphiquement les fréquences cumulées de cette distribution.
5. Déterminer la moyenne, la médiane, le mode, l'écart-type et le coecient de
variation de cette distribution. La distribution est-elle homogène ? Justier.
Exercice 2.17 La série suivante est constituée des observations d'une variable
discrète :
8 ; 5 ; 10 ; 1 ; 2 ; 7 ; 2 ; 2 ; 11 ; 1 ; 3 ; 7 ; 3 ; 3 ; 7 ; 2 ; 2 ; 8 ; 8 ; 5.
Calculer le 33è percentile (P33 ), le 9è décile (D9 ) ainsi que la moyenne arithmétique
(x̄) des valeurs de la série strictement comprises entre eux.
Exercice 2.18 Lors d'un examen de Statistique, 30 étudiants ont obtenu les notes
suivantes : 2 ; 3 ; 3 ; 4 ; 5 ; 6 ; 6 ; 7 ; 7 ; 7 ; 8 ; 8 ; 8 ; 8 ; 8 ; 9 ; 9 ; 9 ; 9 ; 9 ; 9 ; 10 ; 10 ; 11 ;
11 ; 11 ; 13 ; 13 ; 15 ; 16. Déterminer le 10e percentile ainsi que les quartiles Q1 , Q2
et Q3 .
Exercice 2.19 Les étudiants de la FaST ont pesé leurs sacs. Le sac le moins lourd
a une masse de 0, 9 kg , le plus lourd 7, 8 kg . La médiane est de 6 kg , le premier
quartile 2, 5 kg et le troisième quartile 7 kg . En moyenne, les sacs de cette faculté
pèsent 4, 2 kg . Compléter :
a) Au moins 25% des sacs de la classe pèsent entre ........ kg et ........ kg .
b) Au moins 50% des sacs pèsent ........ kg ou moins et au moins 50% des sacs
pèsent ........ kg ou plus.
c) Au moins 75% des sacs ont une masse comprise entre ...... kg et ...... kg .
d) Toutes les masses relevées sont entre ........ kg et ........ kg .
e) Si tous les sacs de la classe avaient la même masse, elle serait de ....... kg .
Exercice 2.20 Soit la distribution de 100 entreprises selon le nombre de tra-
vailleurs. On donne : X̄ = 46.9 et M e = 50.
Nombre de travailleurs (Xi ) 0-10 10-20 20-X1 X1 -X2 X2 -110 110-130
Nombre d'entreprises (ni ) 10 18 22 32 16 2
Déterminer la valeur de X1 , X2 et σX .
Exercice 2.21 La prise de taille d'un certain nombre d'étudiants de la FaST a
donné les résultats suivants (en centimètres) : 165, 158, 172, 171, 149, 153, 157, 160,
155, 162, 164, 158, 166, 170, 150, 165, 174, 175, 180, 164, 181, 171, 157, 167. On
regroupe ces mesures par classes d'amplitude 5 cm, la première étant [145 ;150[ et
la dernière [180 ;185[.
1. Dresser le tableau statistique en y incluant toutes les informations concernant les
classes (eectifs, centres, amplitudes, etc.)
2. Représenter graphiquement :
a. les fréquences ainsi que le polygone des fréquences ;
b. les fréquences cumulées croissantes et les fréquences cumulées décroissantes.
3. Calculer de deux manières diérentes la moyenne arithmétique et la variance de
cette série. Que constatez-vous ?
Exercice 2.22 Une organisation non gouvernementale cherche à appuyer les grou-
pements agricoles opérant dans la culture du café. Elle mène une enquête dans ce
sens et relève les quantités (en tonnes) de café produites en fonction des nance-
ments (en millions de francs CFA). Les résultats sont les suivants : 159, 178, 181,
158, 170, 169, 158, 190, 154, 181, 164, 150, 154, 157, 172, 163, 169, 178, 182, 187,
164, 165, 161, 167, 172, 152, 160, 166, 169, 180, 189, 173, 170, 150, 158, 164, 151,
165, 177, 159, 157, 172, 176, 179, 185, 168, 167, 157, 173, 157, 184, 179, 153, 160,
162, 158, 182, 180, 150, 171.
1. En considérant les classes suivantes, présenter le tableau de dépouillement :
[150 ;155[ , [155 ;165[ , [165 ;175[ , [175 ;180[ , [180 ;185[ , [185 ;195[.
2. Déterminer :
a. la quantité moyenne de café produite ;
b. la quantité de café fréquemment produite ;
c. la quantité de café médiane produite ;
d. la quantité de café telle que les 15 plus gros producteurs aient une production qui
lui est supérieure.
3. Déterminer la variation moyenne de production de café d'un groupement à un
autre.
L'eectif nij de la classe (i, j) est le nombre d'individus de la population qui pré-
sentent simultanément la modalité xi de la variable X et la modalité yj de la
variable Y . La distribution s'écrit (xi , yj , nij ). Tous les individus présentant ces
deux modalités sont comme équivalents. Le total des lignes et le total des colonnes
dénissent les distributions marginales. Une ligne ou une colonne constitue une dis-
tribution conditionnelle.
32
CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.
De même, la série (yj , n·j ) constitue le prole colonne. La fréquence marginale des
individus présentant la modalité yj est
m
X n·j
f·j = fij = .
i=1
n
p
m X m p
On a la relation suivante : f·j = 1.
X X X
fij = fi· =
i=1 j=1 i=1 j=1
b) Pour la variable Y
p p
1X
Moyenne marginale : ȳ = f·j yj .
X
n·j yj =
n j=1 j=1
p p
1X
Variance marginale : V (Y ) = f·j (yj − ȳ)2 .
2
X
σY2 = n·j (yj − ȳ) =
n j=1 j=1
b) Pour la variable Y
p p
1 X
Moyenne conditionnelle : ȳi = f (yj | xi )yj .
X
nij yj =
ni· j=1 j=1
p p
1 X
Variance conditionnelle : Vi (Y ) = f (yj | xi ) (yj − ȳi )2 .
2
X
nij (yj − ȳi ) =
ni· j=1 j=1
m
P1 m
P2
avec n1 = ni , n2 = ni et n = n1 + n2 .
i=1 i=1
3.4 Exercices
Exercice 3.24 On étudie un échantillon de taille n = 100 sur Plequel ont été
mesurés deux caractères X et Y , on a observé les résultats suivants : i=1 xi = 800,
100
Exercice 3.25 Le PDG d'une entreprise fait analyser la production d'un produit
sur 10 ans. Nous avons le tableau suivant :
Années (X ) 1 2 3 4 5 6 7 8 9 10
Production (Y ) 49 48 50 50 56 57 62 65 65 68
Représenter graphiquement ces données puis déterminer la droite de régression de
Y sur X à partir de la méthode de Mayer et des MCO.
Année 1 2 3 4 5 6 7
Indice 165 176 193 202 222 245 253
Exercice 3.28 Le tableau suivant indique, pour un pays ctif et pour chaque
année donnée, le nombre de milliers de demandes d'emploi non satisfaites.
Le nombre de milliers de chômeurs constatés en 1990 et en 1996 ont été égarés. Ces
valeurs avaient permis, par la méthode des moindres carrés ordinaires, d'obtenir :
y = −22x + 397 comme équation de la droite d'ajustement de y en x.
1.a. A combien peut-on estimer le nombre de chômeurs en 1995 ?
b. A partir de quelle année, si l'évolution observée reste semblable au cours des
années à venir, y aura-t-il deux fois moins de chômeurs qu'en 1986 ?
2.a. Calculer la moyenne x de x et la variance σx2 de x.
b. Exprimer en fonction de p et q , la moyenne y de y et la covariance σxy de x et
y.
c. Retrouver alors les valeurs de p et q .
Exercice 3.29 Lors d'une étude sur la dynamique des populations de la tenthrède
du pin (Diprion fruterarum), la capacité de reproduction (nombre Y d'ovocytes par
cocon) des individus de cet insecte a été étudiée en fonction de la longueur du cocon
(X en mm). On obtient le tableau ci-dessous.
HH
Y
H [20 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 100[
X H
HH
[7 ; 7,5[ 8 2 0 0
[7,5 ; 8[ 11 15 1 1
[8 ; 8,5[ 0 22 8 0
[8,5 ; 9[ 1 9 10 0
[9 ; 9,5[ 0 12 19 11
[9,5 ; 10[ 0 0 10 20
Dans ce chapitre nous donnons des notions de base sur l'échantillonnage, l'estimation
et les tests d'hypothèses.
4.1 Echantillonnage
L'échantillonnage est l'étude des liaisons existant entre une population et les échan-
tillons de cette population, prélevés par sondage. Les méthodes permettant de réa-
liser un échantillon de bonne qualité (qui ressemble à la population dont il est issu)
sont étudiées en théorie de l'échantillonnage.
39
CHAPITRE 4. NOTIONS DE BASE SUR LA STATISTIQUE INFÉRENTIELLE Tchandao Mangamana E.
S = f (X1 , X2 , . . . , Xn ).
Moyenne empirique
Pour l'échantillon aléatoire X1 , X2 , . . . , Xn , i.i.d de X , la moyenne empirique est
dénie par
n
1X
Xn = Xi .
n i=1
Pourcentage
Considérons une population dont un pourcentage p d'éléments possèdent une cer-
taine propriété. Soit F la v.a qui, à tout échantillon aléatoire prélevé d'eectif n xé,
associe le pourcentage des éléments de cet échantillon possédant cette propriété. Pour
n susamment grand, F suit approximativement la loi normale N p, n p(1−p)
.
4.2 Estimation
Nous allons ici donner de petites notions sur l'estimation ponctuelle et l'estimation
par intervalle de conance.
Moyenne
D'une manière générale, on choisit la moyenne arithmétique x d'un échantillon pré-
levé au hasard dans une population, comme estimation ponctuelle de la moyenne
inconnue m de cette population.
Pourcentage
D'une manière générale, on choisit le pourcentage f des éléments possédant une
certaine propriété dans un échantillon prélevé au hasard dans une population, comme
estimation ponctuelle du pourcentage inconnu p des éléments de cette population
ayant cette même propriété.
Autres exemples
D'autres exemples d'estimation ponctuelle sont donnés dans les chapitres précédents.
C'est le cas de la variance, l'écart-type, les moments, etc.
Moyenne
On rappelle que d'après le TCL, X n suit la loi N m, . Ceci étant, l'intervalle
σ2
n
de conance de niveau 95% de la moyenne m, pour σ connue, est
2
1, 96σ 1.96σ
IC0,95 (m) = X n − √ ; X n + √ .
n n
Pourcentage
L'intervalle de conance de niveau 95% d'un pourcentage p de la population ayant
une certaine propriété est
" p p #
1, 96 F (1 − F ) 1, 96 F (1 − F )
IC0,95 (p) = F − √ ;F + √ ,
n n
Puissance d'un test : C'est la probabilité de rejeter H0 alors qu'elle est fausse.
Sa valeur est 1 − β .
4.4 Exercices
Exercice 4.30 Une entreprise utilise des camions pour transporter sa production.
Elle dispose de 100 camions. Elle repère sur un échantillon de 30 jours choisis au
hasard le nombre de camions en panne. Voici les résultats : 5, 5, 6, 4, 6, 6, 8, 3, 5,
5, 5, 4, 3, 6, 5, 6, 4, 7, 6, 6, 5, 4, 3, 6, 5, 4, 5, 4, 5, 5.
1. Déterminer une estimation ponctuelle de la moyenne m et de la variance σ 2 du
nombre de camions en panne chaque jour pour la population correspondant aux
jours ouvrables de l'année.
2. En prenant l'estimation ponctuelle de la variance pour σ 2 , déterminer un intervalle
de conance de la moyenne m de la population avec le coecient de conance 95%.
3. Au garage où sont stationnés les camions, le responsable arme qu'il y a en
moyenne 6 camions en panne par jour. Un des chaueurs prétend que c'est plutôt 5.
Se basant sur l'échantillon donné plus haut, construire un test permettant de rejeter
ou non, au seuil de signication de 5% et au vu des résultats sur 30 jours, le point
de vue du responsable. Le point de vue du chaueur est-il rejeté au même seuil de
signication ?