Vous êtes sur la page 1sur 8

Chap 1.

Chapitre 1 – Variables observées et


•  Variables observées
•  Distributions observées distributions expérimentales
•  Caractérisations - Statistique descriptive -

1.  Notion de variable observée

Types de variables Exemples


Qualitatives
Individus ou unités statistiques: Absence/présence
objet concernés par la question Binaires (2 descriptions) d’une espèce
que l’on se pose.
≠ phénotypes
Variables: caractéristiques des Multiples (Plusieurs descriptions) possibles
individus étudiés. e.g. sexe, couleur les
Non ordonnées (échelle nominale)
Forte variabilité yeux, etc.
=> variable aléatoire e.g. rare, présent,
Ordonnées (échelle ordinale) abondant…

Critères de choix des variables:


Semi-quantitatives Etat d’un malade
•  complétude des variables, (en danger, sérieux,
(intervalles variables entre classes)
•  pertinence, sans danger, etc.)
•  indépendance.
Quantitatives
(intervalles de classe connu)
Nb d’œufs par nid
Discontinues

Continues Taille

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
Chap 1.
•  Variables observées 2.  Distributions observées
•  Distributions observées
•  Caractérisations

Echantillon représentatif = n unités statistiques è forment une distribution


Afin de caractériser les échantillons, la 1ere étape est de résumer les informations
collectées et les caractériser.

Représentation graphique
Indice ATMO
Diagramme en bâtons: www.airparif.fr
Variables qualitatives et quantitatives discrètes
Représente :
•  le nombre d’occurrences ni pour chaque modalité
•  ou la fréquence fi= ni/n

Histogramme:
Variables quantitatives continues

Les valeurs observées sont discrétisées.


On trace le nombre de valeurs observées ni pour chaque classe i
ou la fréquence fi= ni/n en fonction du centre de la classe.
Nombre de classes: choisi pour une représentation claire
Règle de Sturge k=1+3.3 ln(n); ou règle de Yule: k=2.5 n1/4

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
Chap 1.
•  Variables observées
•  Distributions observées 3.  Caractérisation des distributions observées
•  Caractérisations

3.1 – Indicateurs de la localisation des valeurs


•  valeurs maximale et minimale ;
•  le mode : valeur qui revient le plus souvent ;

•  la médiane : paramètre de tendance centrale qui sert à résumer une série de


valeurs d’une variable quantitative.
= valeur pour laquelle il y a 50% de chances d’être plus grand ;
•  les quantiles ou percentiles :
Pour toute série numérique de données dans un intervalle I, on définit le quantile par :
en,u=inf{x t.q. F(x) >= u},
où F(x) = la fréquence des éléments de la série inférieurs ou égaux à x.

P-Quantile: Fraction de données se situant sous une valeur limite p.


On rencontre aussi le terme quartile, Q25 est le premier quartile (25% des données sont
inférieures à Q25), Q50 le 2ème quartile et Q75 le 3ème quartile ;

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
•  la moyenne : paramètre de tendance centrale qui sert à résumer une série de
données d’une variable quantitative.
n
1
µ = ∑ xi
n i=1
Ou lorsque les valeurs sont réparties en k classes (histogr.)
1 k k
µ = ∑ n j e j avec k = ∑ n j
n j=1 j=1

Exemple de distribution et
paramètres de position
correspondants:

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
Exemple de distributions ayant la même moyenne:

è La moyenne ne permet pas la


description complète de la
distribution

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
3.2 – Indicateurs de la dispersion des valeurs

Variance:
# # n & &
2

N
% % ∑ xi ( (
1 2 1% n
$ ' ( 1 # n &
σ 2 = ∑ xi − x
n i=1
( ) = % ∑ xi −
n % i=1
2 i=1
( = % ∑ xi − nµ (
n ( n $ i=1
2 2

'
% (
$ '

Ou, pour des variables réparties en k classes:

# # k & &
2

% %∑ n j e j ( (
1 k
2 1 % k
$ i=1 ' ( 1 # k &
σ = ∑(n j e j − µ ) = %∑ n j e j −
2 2
( = %% ∑ n j e j − nµ ((
2 2

n j=1 n % j=1 n ( n $ j=1 '


% (
$ '
Ecart type: σ = σ2
σ
Coefficient de variation: CV = 100
µ
Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
3.3 – Les boîtes à moustache

Résumé graphique des paramètres de la distribution observée

Paramètres résumés dans


la boîte à moustaches

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC
3.4 – Distributions observées et Loi de Probabilité

Si l’échantillon est représentatif et composé de variables aléatoires,


la distribution pourra être résumée par un seul objet mathématique
== loi de probabilité.

Statistiques pour les Sciences de la Vie et de l’Environnement (Chap. 1) Solène Turquety, LMD/IPSL, UPMC

Vous aimerez peut-être aussi