Vous êtes sur la page 1sur 13

STATISTIQUES DESCRIPTIVES ET LOIS 1 UE24

I. Définitions

Statistiques : Ensemble des méthodes permettant d’obtenir, de décrire et d’analyser des


observations (ou données). Ces observations consistent généralement en la mesure d’une ou
plusieurs caractéristiques sur un ensemble d’individus (unités statistiques)

Individu statistique : Unité de base sur laquelle la mesure est réalisée

Population : Ensemble des individus sur lesquels on souhaite dégager des informations

Echantillon : Sous ensemble d’individus d’une population

Echantillon représentatif : Tiré au hasard dans la population

II. Variables aléatoires et outils permettant de décrire les mesures

Variable aléatoire : Toute variable dont la valeur dépend du résultat d’une expérience
probabiliste

On notera X la variable aléatoire, et x une réalisation de cette variable aléatoire

La variable aléatoire est caractérisée par :

- Les valeurs qu’elle peut prendre, que l’on appelle le support de la variable aléatoire
- La probabilité d’observer chaque valeur dans la population, c’est sa loi de probabilité

Variable qualitative : Les caractéristiques sont non numériques (couleur, sexe), ce sont des
niveaux (=modalités) et les opérations n’ont pas de sens :

- Nominales (sexe, malade ou non, couleur des yeux, groupe sanguin…)


- Ordinales (peu confortable, assez confortable, très confortable)

Variable quantitative : Les caractéristiques sont numériques, ce sont des nombres réels et les
opérations (moyennes, variances) ont un sens :

- Discrètes (nb de descendants …). Pas de décimal


- Continues (poids, taille, quantités…)
STATISTIQUES DESCRIPTIVES ET LOIS 2 UE24

Exemple :

- Qualitative nominale : Pas une mesure mais une observation (port de lunettes : oui ou
non)
- Lancer de dés ; Nombre de graines = Quantitative discrète
- Distance de Harmon = Quantitative continue

III. La loi de probabilité de X

Loi de probabilité d’une variable qualitative : Il est possible d’énumérer toutes les valeurs
possible (modalités a1) de la variable aléatoire
X Probabilité

a1 P(X = a1)

a2 P(X = a2)
∑𝑛𝑖=1 𝑃(𝑋 = 𝑎𝑖) = 1 P(X = a1) + P(X=a2) + P(X=a3) + P(X=an) = 1
a3 P(X = a3)

a4 P(X = a4)

a5 P(X = a5)

Loi de probabilité d’une variable quantitative discrète : il est possible d’énumérer toutes les
valeurs possibles (dénombrements ai) de la variable aléatoires

∑𝑛𝑖=1 𝑃(𝑋 = 𝑎𝑖) = 1


STATISTIQUES DESCRIPTIVES ET LOIS 3 UE24

Loi de probabilité d’une variable quantitatif continue X

Il n’est pas possible d’énumérer toutes les valeurs possibles x1 de la variable aléatoire

La loi de probabilité d’une variable continue X est sa fonction de densité f(x) (correspond à une
surface)

L’aire sous la courbe blanche représente 1 (totalité de toutes les valeurs)

L’aire en gris représente P (X < 0.50)

Correspond à un point

IV. Statistiques descriptives : Décrire un échantillon à l’aide de données


chiffrées et de graphiques

La moyenne d’un échantillon est X, mais c’est une estimation seulement donc pas la moyenne
réelle de la population

n-échantillon : Sous-ensemble de n individus tirés au hasard dans la population de référence

Xi : Variable aléatoire associé au tirage de l’individu i (i = 1 … n)

xi : Valeur observée chez l’individu i

Les Xi sont indépendants et de même loi


STATISTIQUES DESCRIPTIVES ET LOIS 4 UE24

Soient les réalisations (x1, x2 … xi …, xn) de la variable aléatoire X dans un n-échantillon de la


population de référence.

Variable quantitative discrète

Représentation par diagramme (bâton)

ex : X = nb d’enfants par femme

Nb d’enfants 0 1 2 3 4+

% femmes 13.5 18.2 38.9 20.2 9.2

Variable quantitative continue

Représentation par histogramme ou distribution empirique

Si X est une variable quantitative continue, les xi sont tous différents.

Ex : L’age des actifs

Mode d’une distribution : Valeur ou classe la plus représentée dans l’échantillon (ici 40-45)

Valeur quantitative Moyenne et Variance d’un n-échantillon

La moyenne est un indicateur de position

La variance donne une indication sur l’ampleur des variations autour de la moyenne
STATISTIQUES DESCRIPTIVES ET LOIS 5 UE24

Variable quantitative : Quantiles

Si l’on classe les xi par ordre croissant, on peut facilement calculer la proportion des
observations inférieures à une certaine valeur a1 Fx(a)

La médiane est la valeur a telle que Fx (a) = 0.50

La médiane est la valeur pour laquelle on trouve de part et d’autres la moitié des données.

50% des valeurs au-dessus et 50% des valeurs au-dessous.

Cela permet d’éviter de fausser la moyenne si une valeur (ou plusieurs) est sensiblement
différente des autres.

Pour une nombre impair de valeur on prendra la « centrale » ex : 21 → La médiane est 11

Pour un nombre pair on fera la moyenne des deux à côtés ex : 20 → Moyenne de 10 et 11

La médiane est moins sensible aux valeurs extrêmes que la moyenne

La quantile α% est la valeur a telle que Fx(a) = α

V. Statistiques inférentielles

Objectif : Inférer les propriétés d’une population d’un n-échantillon

Inférer les paramètres d’une population d’un n-échantillon (la moyenne de la taille des
individus de la population) à partir des données sur un échantillon, ou alors tester des
hypothèses (par ex : en moyenne les femmes sont-elles plus petites que les hommes)
STATISTIQUES DESCRIPTIVES ET LOIS 6 UE24

• Chaque xi est une réalisation de la variable aléatoire Xi


• Les Xi sont indépendants, de même loi et caractérisés par :
o Leur espérance E(Xi) =
o Leur variance V(Xi) =

𝑋̅ = Moyenne S²x = Variance Sx = Ecart type

Les Xi sont utilisés pour proposer une estimation pour :

Ecart type = √𝑉(𝑥)

Estimation des paramètres de population

Fluctuations d’échantillonnage
STATISTIQUES DESCRIPTIVES ET LOIS 7 UE24

Population et Estimation

TD Exemple

A partir du fichier bébé.xls : Poids et taille d’un échantillon de 274 bébés

Excel

Estimer la moyenne, la variance et l’écart-type de chacune des variables dans le population

Vérifier les calculs avec les valeurs d’excel

Traiter la question précédente avec Rcmdr R / Rcmdr

Faire des graphes descriptifs : Histogrammes, boxplots et nuages de points

Pour calculer une moyenne :

= moyenne(C2 ; C27)

Pour calculer une variance :

= var(C2 : C27)

Sur R cran : Taper : Library RCmdr

→ Données →Importer des données → Fichier Ecxel

Dataset → Visualiser
STATISTIQUES DESCRIPTIVES ET LOIS 8 UE24

VI. Lois

A. Binomiale

Loi de Bernoulli

X : Variable aléatoire discrète à 2 modalités : Oui / non ; Malade / sain ; 1/0

Loi binomiale

Pour tracer le graphique : Distribution → Distribution binomiale → Graphique


STATISTIQUES DESCRIPTIVES ET LOIS 9 UE24

TD exemple : Loi binomiale

Soit une population dans laquelle 45% des personnes portent des lunettes

Y = Nombre de porteurs de lunettes parmi 10 personnes prises au hasard dans cette population

1/ Tracer la distribution de la loi B (n=10 ; ∏=0.45) sous Rcmdr

2/ Donner la moyenne et la variance de cette loi

3/ Donner la probabilité d’obtenir :

• Une valeur égale à la moyenne


• Une valeur de 4 ou 5
• Une valeur ≤ 3

4/ Donner la loi de probabilité associée à la variable « proportion de porteurs de correction


visuelle parmi 10 personnes

Distribution Binomiale N = 10 ∏ = 0.45

P (y = k) = 𝑐𝑛𝑘 × 𝜋 𝑘 (1 – n)
STATISTIQUES DESCRIPTIVES ET LOIS 10 UE24

On prend 50 personnes dyslexiques

On note 1 quand c’est un homme, 0 quand c’est une femme.

X = Le sexe du ième dyslexique de l’échantillon

Y = Loi Binomiale : Le nombre de femme parmi les 50 de l’échantillon

Moyenne = ∏ x Taille de l’échantillon avec ∏ = probabilité

0.45 x 10 = 4.50 = µx

P (X = 4.50) = 0

P (X = 4) U P (X = 5) = P (X=4) + P (X = 5) = 47%

P (X < 3) = P (X = 1) + P (X = 2) + P (X = 3) + P (X = 0) = 26.6%

Pour tracer le graphique : Distribution → Distribution binomiale → Proba Bino cumulé

B. Loi Normale

Loi Normale (ou Gaussienne)

Une variable aléatoire suit une loi normale si sa densité de probabilité est symétrique par
rapport à µx et continue sur

Loi normale toujours en forme de cloche


STATISTIQUES DESCRIPTIVES ET LOIS 11 UE24

Loi Normale centrée réduite N (0 ;1)

Si une courbe n’est pas (0 ;1), on la transpose pour l’axer sur (0 ;1)

Variables biologiques et loi normale

De nombreuses variables biologiques complexes (déterminées par de nombreux facteurs


indépendants) ont une distribution normale

Quelques exemples :

o Taille des hommes adultes


o Note à l’épreuve EPS des candidats au bac général
o Age du premier mot
o Poids des bébés à la naissance
o Teneur en sucre dans le sang
STATISTIQUES DESCRIPTIVES ET LOIS 12 UE24

TD exemple : Loi normale

Sur un graphique de la distribution normale :

C’est l’aire sous la courbe qui nous donne la probabilité d’avoir un enfant de moins de 2kg
(exemple)

Tracer la distribution de la loi Normale permettant de modéliser la distribution du poids des


bébés à la naissance

Donner la probabilité (pnorm) qu’un bébé pèse à la naissance :

• + de 4kg
• - de 2.5kg

Donner la médiane, le 1er et le 3ème quantiles des poids des bébés à la naissance à partir de la
loi Normale (qnorm)
STATISTIQUES DESCRIPTIVES ET LOIS 13 UE24

Approximation d’une Binomiale par une loi Normale

Vous aimerez peut-être aussi