Vous êtes sur la page 1sur 25

OBJET DE LA STATISTIQUE

RECUEILLIR, TRAITER, INTERPRETER


un ensemble de données d'informations

Le traitement des données consiste à produire DES STATISTIQUES

TROIS ETAPES PRINCIPALES

La collecte des données

Le traitement des données collectées (statistique descriptive)

L'interprétation des données


(inférence statistique : sondages, statistique mathématique)

la statistique mathématique précise règles et méthodes sur la collecte des données


pour que celles-ci puissent être correctement interprétées.
L’APPREHENSION STATISTIQUE

population statistique
ensemble ou groupe d’éléments sur lesquels porte l’analyse statistique
le groupe dans son ensemble est parfois aussi appelé univers
Une population peut être finie ou infinie
Il faut bien connaître les frontières de la population

éléments de la population
habitants, étudiants, notes, électeurs, objets, événements,….

unités statistiques ou individus

Échantillon
ensemble limité de la population
Il sera toujours nécessaire de définir un échantillon représentatif de la population
lorsque celle – ci est très grande

!! dans un échantillon représentatif


chaque individu doit avoir la même probabilité d’être retenu
statistique descriptive
domaine de la statistique qui ne retient que la description et l’analyse
d’un échantillon donné sans produire de conclusions ou inférences
sur un échantillon plus large

échantillon représentatif utilisé


projections sur la population en respectant des conditions de validité

statistique dynamique
statistique inférentielle ou inférence statistique
DESCRIPTION D’UNE POPULATION

on affecte à chaque individu un ou des caractères

les caractères peuvent être qualitatifs ou quantitatifs

Les caractères servent à repérer et à classer les individus d’un échantillon


a chaque caractère on associe des états ou situations différentes
appelées modalités

conditions sur les modalités

les différentes modalités d’un caractère doivent être

incompatibles
un individu de l’échantillon ne doit pas être associé à plus d’une modalité

exhaustives
Il faut prévoir toutes les états, sans exception

définies sans ambiguïté


afin d’éviter les erreurs de classement

hiérarchisées
par exemple, définir des classes d’âge
CARACTERES QUALITATIFS

l’observation n’est pas mesurable


ce type de caractère sert plutôt à réaliser des classements
on est souvent amené les quantifier

à chaque caractère on associe des états ou situations différentes


appelées modalités

caractère : sexe modalités :féminin


masculin

caractère : état matrimonial modalités : marié


célibataire
veuf
divorcé
CARACTERES QUANTITATIFS

l’observation est mesurable, donc traduite par un nombre

le caractère quantitatif est alors appelé variable statistique,


les modalités sont les valeurs possibles que prennent la variable

Il existe deux types de variables statistiques

- les variables discrètes

- les variables continues


variables discrètes

une variable discrète est mesurée par des valeurs isolées prises dans
un intervalle de variation

Il s’agit souvent de nombres entiers

les modalités sont donc des valeurs exactes ou des regroupements


de valeurs en classes de valeurs

exemples :

- nombre d’enfants d’une famille : 0,1,2,3,4,5,6, et plus

- département de naissance
variables continues

variables qui peuvent prendre toutes les valeurs possibles sur le domaine
de variation

les valeurs sont en nombre infini

avant classement, il est nécessaire de procéder à des regroupements


en classes

exemples :

- surface des pièces d’un logement

- âge

- taille

- salaire, chiffres d’affaire

- temps
CARACTERE NATURE
état matrimonial qualitatif
sexe qualitatif
taille quantitatif
Surface d’un quantitatif
logement
âge quantitatif
Département de quantitatif
naissance
CARACTERE NATURE
QUANTITATIF
nombre d’enfants discret
chiffre d’affaires continu
salaire continu
nombre de pièces d’un discret
logement
âge continu
taille continu
nombre de salariés discret
EFFECTIFS

nombre d’individus
d’une modalité
d’une classe
d’un échantillon
d’une population

notations

N ni
effectif total effectif associé effectif
(de l’échantillon) à un caractère d’une classe
(de la population)

nombre total d’individus


dont on a relevé le caractère
xi
CLASSES

le regroupement en classes permet de diminuer le nombre d’opérations


sur un ensemble théoriquement infini

les classes constituent les modalités du caractère

l’amplitude des classes est constante ou variable

le choix du nombre et de l’amplitude des classes se fait en fonction de l’effectif


de la population

les amplitudes des classes sont choisies de manière à assurer un effectif


semblable dans chaque classe

le choix des classes doit être réalisé de sorte que ce choix ne masque pas
certaines particularités
CLASSES

écriture d’une classe [ xi − α i , xi + α i [

2α i étendue de la classe

centre de la classe

les extrémités de la classe peuvent poser problème si on ne les définit


pas correctement
DONNEES

48 72 54 80 58 70 69 58 57 60 Objectifs :
85 94 78 81 64 49 54 57 57 62 ranger les valeurs en classes d’amplitude 5
63 69 72 71 82 87 64 65 73 58 calculer les effectifs de chaque classe
61 67 49 52 60 66 69 89 84 82
73 70 72 58 64 51 65 77 79 80
59 57 81 78 76 79 68 67 53 59 [45;50[ 47.5 3
[50;55[ 52.5 5
[55;60[ 57.5 10
[60;65[ 62.5 8
[65;70[ 67.5 9
[70;75[ 72.5 8
[75;80[ 77.5 6
[80;85[ 82.5 7
classes [85;90[ 87.5 3
[90;95[ 92.5 1

centre des classes effectifs


QUELQUES RAPPELS MATHEMATIQUES

POURCENTAGES
symbole : %

proportion d’un échantillon qui possède un caractère particulier

sur un échantillon de 1000 valeurs, 200 individus sont rouges

proportion des individus rouges

nombre ⋅ d ' individus ⋅ rouges


nombre ⋅ d ' individus ⋅ de ⋅ l ' échantillon
200
= 0,2 = 20%
1000
QUELQUES RAPPELS MATHEMATIQUES

description d’une évolution dans le temps

une population de souris


passe de 1000 à 1200 individus

variation absolue taux de croissance

valeurfinale − valeurinitiale valeurfinale


valeurfinale − valeurinitiale = −1
valeurinitiale valeurinitiale

200 1200
1200 − 1000 = 200 = 0,2 = −1
1000 1000
l’opérateur SOMME

Σ i
xi
1
x1
2
x
6 valeur 5 1
Σ xi = x1 + x2 + x3 + x4 + x5 + x6
i =1

6
Σ xi = 5 + 1 + 9 + 2 + 6 + 0 = 23
i =1
Quelques propriétés de l’opérateur SOMME a : constante

n n n
Σ axi = a Σ xi Σ a = a + a + a + ......... + a = n.a
i =1 i =1
i =1

n n fois
n
Σ (a + xi ) = Σ xi + n.a
i =1
i =1

n n n n n

Σ x = Σ(t
i =1
i
i =1
i + yi + z i ) = Σ t i + Σ yi + Σ z i
i =1 i =1 i =1

n n n n n n
Σ (a + xi ) 2 = Σ a 2 + 2 Σ a.xi + Σ xi2 = n.a 2 + 2a Σ xi + Σ xi2
i =1
i =1 i =1 i =1 i =1 i =1
ni xi yi ni xi ni yi xi2 yi2 xi y i

Σ ni = 10
1
Σ xi = − 7 Σ yi = 5
2
Σ ni xi = − 28 Σ ni yi = 35 Σ x = 109 Σ y = 209 Σ xi yi = 26
i
2 2
i
-3
2 -5 -8
3
effectif total de l’échantillon 4 ATTENTION
10
Σn
4

i =1
i
4
= 10 = N Σ-8
n
xy i i
n
= 26 ≠ Σ xi Σ yi = −35
n
6
i =1 i =1 i =1
l’opérateur PRODUIT

Π i 1
6
x i x1
Π xiv=axle
1 x2u
x3rx4 x5 x6 5
i =1

6
Π xi = 5 *1* 9 * 2 * 6 * 0 = 0
i =1
Quelques propriétés de l’opérateur PRODUIT a : constante

n
Πa = a n
i =1

n n
Π axi = a Πx
n
i
i =1
i =1

n n n
Π xi yi = Π xi × Π yi
i =1
i =1 i =1
NOTION DE FREQUENCE

ni effectif ou fréquence absolue


nombre d’individus associé à une modalité

n
N = Σ ni effectif total de la population ou de l’échantillon
i =1

ni
fi = fréquence relative
proportion d’individus associés à une modalité dans l’échantillon total
N
n
n = nombre de modalités
on utilisera souvent k
k et n sont des indices muets Σf
i =1
i =1
fréquence
modalité effectif relative
xi ni fi
0 2 0,20 ni
1 5 0,50
fi =
2 1 0,10
N
3 0 0,00
4 2 0,20
10 1,00

Σf
n
N = Σ ni i =1
i =1
i =1
effectifs effectifs fréquences fréquences
cumulés cumulés fréquences relatives relatives
modalité effectifs croissants décroissants relatives croissantes décroissantes
xi ni 0 10 fi 0,00 1,00
0 2 2 8 0,20 0,20 0,80
1 5 7 3 0,50 0,70 0,30
2 1 8 2 0,10 0,80 0,20
3 0 8 2 0,00 0,80 0,20
4 2 10 0 0,20 1,00 0,00
10 1,00

k k
nk (croissant ) = Σ ni f k (croissant ) = Σ f i
i =1 i =1

N k
nk (décroissant ) = N − Σ ni f k (décroissant ) = 1 − Σ f i
i =k i =1