Vous êtes sur la page 1sur 10

Chapitre I

STATISTIQUE DESCRIPTIVE A UNE VARIABLE ET A DEUX VARIABLES

I. Type de variables statistiques

Variable qualitative : ses Variable qualitative nominale :


valeurs, ou modalités, s'expriment dont les modalités ne sont pas
de façon littérale ou par un codage ordonnées. Exemple :  Marque de
sur lequel les opérations voiture ; Sexe : homme, femme
arithmétiques telles que moyenne, Variable qualitative ordinale :
somme,..., n'ont pas de sens. dont les modalités sont
naturellement ordonnées. Exemple
: Niveau de satisfaction : bon,
moyen… Utilisation d’un outil :
rare, souvent … Niveau de
résistance d’un matériau : très
résistant, assez résistant, peu
résistant.
Variable quantitative : Une Variable quantitative discrète :
variable statistique est si elle ne peut prendre que des
quantitative si ses valeurs sont des valeurs discrètes, représentées
nombres exprimant une quantité, généralement entières. Exemples :
sur lesquels les opérations • Nombre d’années de
arithmétiques (somme, etc...) ont redoublement dans la scolarité des
un sens. étudiants.
• Nombre d’enfant par famille dans
un échantillon de 20 familles.
Variable quantitative
continue : si ses valeurs peuvent
être n'importe lesquelles d'un
intervalle réel. Exemples :
• Tailles des étudiants d’une
section MIP;
• Revenus mensuels des chefs de
ménage dans un village de 30
familles.

II. Analyse statistique à une variable


1. Les tableaux statistiques
ni
La fréquence : f i= o ù n=∑ ni qui représente La proportion de la
n i
population prenant la valeur x i

L’effectif cumulé croissant : N i= ∑ n j qui représente le nombre


x j <x i
d’individus de la population prenant au plus la valeur xi
La fréquence cumulée croissante : F i= ∑ f j qui représente La proportion
x j < xi
de la population prenant au plus la valeur x i

2. Les représentations graphiques


Variable qualitative Diagramme en « bâtons » : c’est un
graphique où à chaque modalité xi on associe
un « bâton » de longueur proportionnelle à ¿
(ou à fi)
Diagrammes circulaires (camembert ou
secteurs) : C’est une représentation où à
chaque modalité correspond un secteur de
disque dont l'aire (ou l'angle au centre) est
proportionnelle à la fréquence de cette
modalité.
Variable Variable quantitative discrète : Les
quantitative diagrammes précédents peuvent être utilisés
pour représenter une telle variable en plus de
la courbe cumulative qui représente les
fréquences cumulées.
La représentation des fréquences cumulées
est complétée en une fonction en escalier :
F ( x )= ∑ f i
x j <x
Variable quantitative continue : Dans ce
cas on partitionne l’ensemble de ses valeurs
en intervalles de la forme[c i , c i+1 ]. La classe
[c i , c i+1 ] regroupe les individus pour lesquels
la variable prend sa valeur dans l’intervalle
[c i , c i+1 ]. On note à nouveau ¿ son effectif.
Les notions d’effectifs cumulés, fréquences et
fréquences cumulées sont identiques.
L'histogramme est la figure constituée des
rectangles dont les bases sont les classes et
dont les aires sont proportionnelles aux
fréquences (ou aux effectifs) de ces classes.
 Dans le cas où les classes ont la même
amplitude, la hauteur des rectangles est
proportionnelle aux fréquences.
 Dans le cas où les classes n’ont pas la
même amplitude, la hauteur des rectangles
est proportionnelle aux densités d’effectifs
ni
données par la formule : d i=
c i+1 −c i

3.
Les paramètres numériques d’une variable statistique
quantitative
a. Les paramètres de position
Moyenne : La moyenne d’une distribution statistique ¿ est la valeur :

1
x́= ∑ n x =∑ f x
n i i i i i i
Si le caractère est continu, xi désigne le milieu de la classe [c i , c i+1 ] :
c i+ c i+1
x i=
2
Remarque : la moyenne est très sensible aux valeurs exceptionnelles

Mode : Le (ou les) modes (ou classes modales) la modalité de la série (ou
la classe de la série) d’effectif maximal. Il peut y en avoir plusieurs modes
(on parle alors de distribution bimodale ou plurimodale).

Médiane : La médiane noté x 1/ 2 est le réel qui partage la population en


n
deux parties de même effectif .
2
CALCUL DE X1/2 :
Cas discret :
Si on considère les données sous leur forme brute, la médiane correspond à
la valeur :
x 1/ 2=x(n+1 )/ 2 : Si n est impair
xn +xn
+1
x 1/ 2= 2 2  : Si n est pair
2
Cas continu :
0.5−F (c i)
x 1 =c i +( ci +1−c i)
2
fi
Autres paramètres de position :
On définit de même que la médiane les quartiles x 1 /4 et x 3 /4 comme
étant les valeurs pour lesquelles F vaut 1/4 ou 3/ 4. Ils se calculent de la
même manière que la médiane : même formule en remplaçant 1/2 par 1/4
(ou 3/4) et en choisissant l’intervalle [c i , c i+1 ] de sorte que les ordonnées
par F encadrent 1/4 (ou 3/4).
On définirait de même les déciles, centiles... (On parle en générale des
fractiles).

b. Les paramètres de dispersion :


Pour exprimer les caractéristiques d'un échantillon, il est nécessaire de
compléter les paramètres de position par des paramètres de dispersion, qui
mesureront la variabilité des données.
L'étendue ou intervalle de variation
L'étendue « e » est calculé en fonction des valeurs extrêmes : e  x max 
x min , un grand défaut de ce paramètre est qu’il est très sensible aux
valeurs aberrantes.
La variance et l’écart type :
Ce sont les deux mesures les plus utilisées.
1
La variance est : S2 ( X )= ∑ n .(x −x́)² il mesure l'écart quadratique
n i i i
moyen de l'échantillon à sa moyenne.
L’écart type est la racine carrée de la variance :  (X)  √ S ²( X ). Il
s'exprime dans la même unité que les données, ce qui rend son
interprétation plus facile que celle de la variance.
Propriétés
1
 S2 ( X )= ∑ ni x 2i −( x́)²
n i
2
 S ( λ+ X )=S ²(X )
 S2 ( λX )=λ ² S ² (X )
Le coefficient de variation :
Cv est un paramètre de dispersion sans unité. Une pratique empirique
courante est d’utiliser ce paramètre pour comparer la dispersion de deux
variables statistiques qui n’ont pas la même unité.
σ (X )
cv ( X ) =

III. Analyse statistique à deux variables :


a. Représentation des données
Les modalités conjointes de X et Y avec l’effectif de chaque couple
( xi , yj)(i=1 , … , k et j=1 ,. , l) , sont structurés dans un tableau dit
tableau de contingence en effectif. La valeur nij dans la cellule intersection
de la ligne i et de la colonne j représente le nombre d’individus ayant en
même temps la modalité xi pour la variable X et la modalité yj pour la
variable Y .
n ij
La fréquence du couple ( xi , yj) est : f =
ij
n
b. Etude marginale
La distribution à une dimension de chacun des caractères X et Y peut être
obtenue en sommant les effectifs sur l’un des indices i ou j.
ni . =∑ n ij : représente l’effectif des individus ayant la modalité x
i
j
(indépendamment de la variable Y)
n. j=∑ nij : représente l’effectif des individus ayant la modalité y
j
i
(indépendamment de la variable X)
c. Paramètres d’une distribution à deux dimensions (cas de
variables quantitatives) :
Pour quantifier la relation entre les deux variables on utilise des paramètres
statistiques dont :
∑ nij ( xi −x́ ) .( y ¿¿ i− ý)
La covariance : i, j
cov ( X , Y )= ¿
n
cov ( X , Y )
Le coefficient de corrélation linéaire : r ( X , Y )=
σ ( X ) . σ (Y )
Remarque : le coefficient r mesure les liaisons linéaires (le long d’une
droite) entre les variables X et Y , et cette dépendance linéaire est
d’autant plus forte que ¿ r∨¿ est proche de 1.
d. Ajustement linéaire d’une distribution à deux dimensions.
Le problème est de choisir la droite la plus proche de ces points et pouvant
décrire cette relation linéaire, ce qui revient à trouver la droite qui passe «
au mieux » à l’intérieur de ce nuage de points.
La droite ainsi déterminée est dite droite de régression ou d’ajustement
linéaire, ou encore droite des moindres carrés de Y par rapport à X.
Soit : y=ax+ b
cov (X , Y )
Un tel calcul analytique permet d’avoir : a= et b= ý−a x́
S ² (X )
Chapitre II
PROBABILITE ET DENOMBREMENT

I. Introduction, vocabulaire et propriétés


a. Définition
Le théorème des probabilités s’intéresse aux situations « aléatoire » où
l’ensemble des réalisations possibles est connu à l’avance, mais on ne peut
prévoir le résultat de l’expérience avant sa réalisation.

b. Vocabulaire
Evénement : un événement lié à une expérience aléatoire est un sous-
ensemble des résultats possibles pour cette expérience (c'est-à-dire un
certain sous-ensemble de l'univers lié à l'expérience).
Les événements incompatibles : Les événements qui ne peuvent pas se
réaliser en même temps.

c. Propriétés
 p ( ∅ )=0
 p ( Á )=1− p ( A )
 p ( Ω )=1
pi≥ 0

{ n

∑ p i=1
i=1

p ( B)≤ p ( A )
 Si B⊂ A :
{(
p B )=p ( A )− p( A−B)
 ∀ A et B : p ( A ∪ B )= p ( A ) + p ( B )− p( A ∩ B)
 p ( Á ∩B )= p ( B )− p ( A ∩ B )
 p ( Á ∩ B́ )=1− p( A ∪ B)

II. Cas fini équiprobable


Le calcul des probabilités dans le cas fini uniforme nécessite le calcul de
cardinal, c-à-d, le dénombrement des éléments des événements
card ( A )
p ( A )=
card (Ω)
Rappel de dénombrement :
n!
Tirage simultané : C kn=
k ! ( n−k ) !
n!
Tirage successif sans remise : Akn =
( n−k ) !
Tirage successif avec remise : nk
Propriétés :
C 0n=1 C 1n=n
C nn=1
C n−k k
n =C n
C kn=C k−1 k
n−1+C n−1
n
(a+ b)n=∑ C kn ak bn−k
k=1

III. Probabilité conditionnelle et indépendance


Probabilité conditionnelle de A sachant B :

p ( BA )=p ( A )= p (pA( ∩B
B
B)
)

n
Formule de probabilité totale : p ( A )= ∑ p
i=1
( BA ) . p ( B )
i
i

p ( AB ). p(B)
( BA )=
Formule de Bayes :
p
p( A)
Indépendance : Lorsque B réalisé n’apporte aucune formation sur A et
on p ( BA )=p ( A) c-à-d p ( A ∩ B )= p ( A ) . p( B)

Chapitre III
VARIABLES ALEATOIRES DISCRETES

I. Fonction de répartition et ses propriétés


a. Définition
Soit X une variable aléatoire réelle, la fonction de répartition de X est la
fonction :
F X =R ↦ [ 0,1 ] X ↦ F X ( X ) =P ( X ∈ ] −∞ ; x ¿ ¿¿ P(X ≤ x)
F X est une fonction en escalier croissante continue à droite
b. Propriétés

 lim F X ( x )=1
x→+∞

 lim F X ( x )=0
x→−∞
 Cas discret :
X ( Ω ) ={x 1 , x 2 , .. , x n } avec x 1 ≤ x 2 ≤ x3
∀ x ∈ R ; F X ( x )=P ( X ≤ x ] = ∑ p( X ≤ x)
X≤ x

 Espérance : EX= ∑ x i . p( X=x i )


xi
 Variance :
Var ( X )=∑ (x ¿¿ i−EX) ². p( X=x i )=∑ x i ² p( X=x i )−( EX )² ¿

II. Variables aléatoires discrètes usuelles


a. Loi uniforme
Choisir un nombre de l’ensemble {1,..,n} X la v.a qui représente le nombre
de tiers. On dit que X suit une loi uniforme X U ( { 1 ,.. , n } )
1
p ( X=k )=
n
n+1
EX=
2
n 2−1
VarX =
12
Fonction de répartition :

0 si x<1

{
1
1 ≤ x< 2
n
F ( X )= 2
2 ≤ x<3
n
k
k ≤ n<k +1
n
1 x≥n

b. Loi de Bernoulli
Une expérience aléatoire qui a 2 issues qu’on appelle : « succès » et

« échec », on définit la v.a par :


{10 succé
échec
, l’expérience est dite de Bernoulli

si p ( avoir succès )= p
p ( X=1 ) =p p ( X=0 )=1− p=q
On dit que X suit une loi de Bernoulli X Ber (p)

EX= p VarX =pq


Fonction de répartition :
0 si x <0
{
F ( X )= 1− p si 0 ≤ x <1
1 x>1
c. Loi Binomiale
On répète une épreuve de Bernoulli n fois de manière indépendante. Soit X
la v.a qui compte le nombre de succès dans les n répétitions.
On dit que X suit une loi binomiale de paramètre (n , p) : X B(n , p)
p ( X=k )=C kn p k (1− p)n−k
EX=n . p
VarX =np(1−p)

d. Loi géométrique
On répète une épreuve de Bernoulli de manière indépendants jusqu’à
obtenir le premier succès, soit X la v.a qui représente le nombre de
répétition où on a obtenu le 1er succès
On dit que X suit une loi géométrique X geo( p)
k−1
p ( X=k )=(1− p) p
1 q
EX= VarX = 2
p p
e. Loi de poisson
La v.a représente le nombre d’incidents (arrivée de clients, nbre de voiture
dans un péage …) dans une durée donnée
λn −λ
P ( X=n )= e
n!
EX=VarX =λ
Chapitre IV
VARIABLES ALEATOIRES CONTINUS

I. Définition et loi d’une v.a continue


Soit X v.a pouvant prendre des valeurs dans un intervalle de R ; la fonction
de répartition de X est :
F X =R ↦ [ 0,1 ]
X ↦ F X ( X ) =P (X ≤ x )
P ( X ∈ ] a , b ¿ ¿=F X ( b )−F X ( a )
Définition
Une v.a X est dite continue s’il existe une fonction réelle f telle que

f ( x )≥ 0 ; ∀ x ∈ R

{ +∞

∫ f ( x ) dx=1
−∞

la loi de
qui vérifie : P ( X

X , f x définit la loi de X .
x
≤ x )= ∫ f ( t ) dt ; f est dite densité de
−∞

Propriétés
b
 P ( X ∈ ] a , b ¿ ¿=∫ f ( t ) dt
a
+∞
 Espérance : EX= ∫ xf ( x ) dx
−∞
+∞ +∞
2
 Variance : VarX= ∫ ( x−EX ) f ( x ) dx =∫ x 2 f ( x ) dx−( EX) ²
−∞ −∞
 E ( aX +b )=aEX +b
 Var ( aX +b )=a ² VarX
II. Lois continues usuelles
a. Loi uniforme
On note X U ([a , b])
1
{
f ( x )= b−a
si x ∈[a ,b ]
0 ailleurs
b+ a (a−b) ²
EX= VarX =
2 12
Fonction de répartition :

0 si x ≤ a

{
F X ( X )= x−a si a< x ≤ b
b−a
1 si x >b
b. Loi exponentielle
On note X exp( λ)
− λx
f ( x )= λ e si x ≥ 0 Où λ est une constante réelle positive
{
0 ailleurs

1 1
EX= VarX =
λ λ2
Fonction de répartition

F X ( X )=
{1−e0 si xsi≤0x> 0
−λx

La loi exponentielle représente la durée de vie d’un composant 

c. Loi normale
Z suit une loi normale centrée et réduite ,on note Z N (0,1)
2
−x
1 2
f B ( x )= e
√2 π
EZ=0 Var ( Z )=1

Transformation d’une loi N ( 0,1 )


On considère la v.a : X =σZ + μ
La fonction de répartition :
x −μ
F X ( x ) =P ( X ≤ x )=P ( σZ+ μ ≤ x )=P( Z ≤ )
σ
−1 x− μ
1 2
(
σ

f X ( x )= e
√2 π
EX=μ Translation de la courbe
VarX =σ ² Dispersion de la courbe
x −μ
Si X N ( μ , σ ) et Z= N (0,1) , on dit que X a été centré et
σ
réduit.

Chapitre V
COUPLE DE V.A DISCRETES

I. Définition et loi conjointe


On dit que ( X , Y ) est un couple de v.a discrète, la loi conjointe du couple
( X , Y ) est déterminée par la donnée de nombre ;
Pij =P ( X =xi et Y = y i ) ∀ x i ∈ X ( Ω ) , ∀ y j ∈ Y ( Ω )
Avec

0 ≤ P ij ≤1 et ∑ ∑ P ij=1
xi ∈ X ( Ω) y j ∈Y ( Ω )
La loi conjointe peut-être représentée par un tableau

II. Loi marginale


P ( X =xi ) = ∑ Pij P ( Y = y j )= ∑ P ij =1
y j ∈Y ( Ω ) x j ∈ X (Ω )
Les lois marginales sont insuffisantes pour avoir la loi conjointe.

III. Indépendance de v.a


Soit (X ,Y ) un couple de v.a discrète, XetY sont dites indépendantes si
et seulement si :
p ( ( X =x i ) ∩ ( Y = y j ) )= p ( X=x i ) . p(Y = y j )
Propriétés :
 E ( X . Y )=E ( X ) . E(Y )
 X P ( λ1 ) et Y P(λ 2)
X + y P(λ 1+ λ2)

IV. Covariance
Soit( X , Y ) un couple de v.a, alors on définit
cov ( X , Y )=E( ( X−EX ) ( Y −EY ) )
Propriétés
 cov ( X , X )=Var ( X )
 cov ( X , Y )=E ( XY ) −EXEY ( Koneigs )
 Si X et Y sont indépendantes alors : cov ( X , Y ) =0

Var ( X +Y )=VarX + VarY


 Var ( X +Y )=VarX + VarY +2 cov ( X , Y )

Vous aimerez peut-être aussi