Vous êtes sur la page 1sur 66

Statistiques appliques la

recherche

Animateur: ADIL
SOUFI

objectif

Statistique descriptive et infrentielle


la

statistique descriptive, dont le but est la


description d un ensemble de donnes.
la statistique infrentielle, dont le but est
d'effectuer des estimations et des prvisions
partir d'un sous-ensemble de donnes

Les diffrents parties du cours

Objectif de chaque parties de cette


formation
Organiser, prsenter et dcrire des
donnes.
Gnraliser une population, des
caractristiques observes sur des
chantillons.
Faire de bonnes prvisions.

Plan (1er PARTIE)


A.

Partie I statistique descriptive

4 sances
1.
2.
3.
4.

Introduction et analyse descriptive des donnes


Carcteristiques de tendance centrale , de
dispresion et de forme
TD
TP (Satistique DESCRIPTIVE sur Excel) +
evaluation

Introduction et analyse
descriptive des donnes
1.
2.
3.

Dfinitions des principaux termes


Distributions et tableaux statistiques
Reprsentations graphiques

Dfinitions
La statistique : est ensemble des
mthodes scientifiques partir
desquelles sont collecter, prsentes ,
rsumes et analyses des donnes.
Les statistiques : est dsigner des
informations ou des rsultats obtenus
partir d un ensemble des donnes.

Exemple : statistiques sur le chmage


statistiques dmographiques

Dfinitions des principaux


termes

Population
Est lensemble de rfrence sur lequel porte les
observations.
Exemple :
Ensemble des personnes qui ont russi le
baccalaurat lan pass
Ensemble des automobiles en tat de circuler au
1er janvier de cette anne

Individu
Est un lment de la population.

On peut dire que la population ensemble


des individus
L ge des employs d'une entreprise

Caractre ou variable
statistique
Est une information dont on (observe ou
mesure) sur
chaque individu.
Exemple :
Un individu qui a russi le baccalaurat
peut tre
dcrit selon la note de mathmatiques
quil a obtenue
ou bien selon la mention quil a obtenue

Modalits dun caractre ou


dune variable statistique
On dsigne aussi par modalits les
diffrentes
valeurs prsentes par les individus, d'une
population
relativement une variable statistique

Caractre quantitatif discret


Un caractre ou variable X est
quantitatif si ses
diverses modalits son mesurables, c est
dire
chaque modalit j est associ un nombre
xj .
Exemple : le nombre denfants par
famille . La valeur de la variable (ou
caractre) pour une famille sera ici un

Caractre quantitatif continu


Le caractre peut prendre nimporte
quelle valeur dans
un intervalle .
Exemple : la temprature releve
Tanger, 8heurs, le 1er juin sera un
lment de lintervalle [5,35] en degrs
Celsius.

Caractre qualitatif
Un caractre est qualitatif si chaque
modalit ne peut pas tre mesure par
un nombre .
Exemple : tat familial dun individu :
clibataire , marie , divorc.

Exercice
Une tude est ralise sur la pointure
des chaussures
des jeunes Marocains de 16 35 Ans
1. Quelle est la population tudie ?
2. Quel est le caractre tudi ?
3. Ce caractre est ?

Exercice
Montrer

sur un exemple que lon peut


transformer un caractre quantitatif en
caractre qualitatif.

Effectifs et frquences
n (frquence absolue) dune
population est le nombre dindividus
qui composent cette population.
Effectif ni relatif la modalit i du
caractre X est le nombre dindividus
de la population qui prsentent la
modalit i.
Effectif

Effectifs et frquences
Si le caractre prsente p modalits,
alors :
p
n = n1+n2+n3++ni+ n..+np = ni
p

nn
i

i 1

i 1

La frquence relative fi dune modalit i


du caractre
X est la proportion dindividus de la
population qui
ni
prsentent
la modalit i, ainsi:
n

Effectifs et frquences
La somme des frquences relatives est
gale 1 ou
100%.

effectifs et frquences
cumuls
On utilise la frquence cumule pour
dterminer le
nombre d'observations qui se situent audessus (ou
au-dessous) d'une valeur particulire
dans un
ensemble de donnes
Effectifs cumuls
croissants(ascendants): leffectif
cumul croissant jusqu une valeur X
est le nombre dobservations

Distributions et tableaux statistiques

Tableaux statistiques
Si on dcrit les individus selon un seul
caractre, les
tableau statistiques sont une
dimension.

Caractre qualitatif
Modalits du
caractre

effectifs

C1

n1

C2

n2

C3

n3

C4

n4

C5

n5

C6

n6

total

n
n : le nombre total dobservation

Caractre quantitatif discret


En

remplaant Ci par xi , on dsigne souvent


par distribution ou srie statique lensemble
des couples (xi,ni) .

Caractre quantitatif continu


On remplace Ci par l intervalle [ei1,ei[( la classe)
ei-ei-1 est lamplitude de la classe

Reprsentations graphiques

DIAGRAMME CIRCULAIRE
Est

un moyen de reprsenter une srie


statistique dont le caractre est
qualitatif. Il est obtenu en dcoupant
un disque en secteurs dont les mesures
d'angle sont proportionnelles
l'effectif.

Exemple: Dans une entreprise, on a


demand aux employs leur moyen de
transport pour venir au travail. Les
rsultats sont les suivants :

Le diagramme circulaire correspondant est


donc :

Diagramme btons
Est un moyen de reprsenter une srie
statistique dont
le caractre est quantitatif discret.
Si x1,...,xp sont les valeurs possibles
prises par le
caractre et si les effectifs
correspondants sont
n1,...,np, il est constitu par les segments
qui relient le

Ex : Dans une classe, les notes


obtenues un devoir sont :

Le diagramme btons
correspondant est :

On remplace parfois l'effectif par la


frquence, ce qui donne bien sr le mme
aspect au diagramme.

Polygone des frquences


Le polygone des effectifs (ou des
frquences) est
obtenu en reliant les extrmits des
btons du
diagramme prcdent. On obtient ainsi
pour l'exemple
prcdent :

Courbe des frquences cumules


On note gk la frquence cumule du
caractre xk,
c'est--dire gk=f1+...+fk ou fi=ni/N est la
frquence
du caractre xi. La courbe des
frquences cumules est
celle obtenue en joignant les points
(xi,gi). Pour
l'exemple prcdent, on a le tableau :

Courbe des frquences cumules


On obtient donc le graphique suivant

HISTOGRAMME
Est un moyen de reprsenter une srie
statistique dont le caractre est
quantitatif
Continu.
Si la srie statistique est donne par les
classes
([ai,ai+1[), il est constitu par des
rectangles dont la
base est le segment [ai,ai+1[ (sur l'axe des

Ex : On a demand la taille des lves


dans une classe de 33 lves. On
obtient les rsultats suivants

L'histogramme correspondant est donc :

Activits

Activit 1 DISTANCES

CARACTRISTIQUES DE
TENDANCE CENTRALE ET DE
DISPERSION

LES TYPES DE
CARACTRISTIQUES
De

tendance centrale
Une ide sur la position de la valeur
centrale
De dispersion
Une ide sur ltalement de la srie
De forme
Une ide sur la symtrie dune
distribution

Mesure de tendance centrale


La

moyenne arithmtique
Mdiane
mode

la Moyenne arithmtique
Permet

didentifier la quantit autour


de laquelles les valeurs sont rpaties
Cest la caractristique qui reprsente
le mieux le centre de la distribution
de la srie statistique

La moyenne arithmtique simple


La moyenne arithmtique simple d une
suite de
nombres x1, x2, .., Xi,.,Xn
Elle est dfinie par:

x x ...... xi ....xn
x 1 2

x
i 1

Qui se lit x barre est la moyenne


arithmtique simple

La moyenne arithmtique
pondre(la moyenne de grandeur)
On supposons que la valeur de :
X1 soit observe n1 fois
X2 soit observe n2 fois
.
.
Xi soit observe ni fois
p

n x
i

i 1

Formulation de la moyenne avec


frquences relatives
ni
fi
n

est la frquence relative de la modalit i alors


la moyenne est :

n x
i

ni
xi f i xi
n

fi
Si la frquence sont donns en pourcentage :

ni
100%
n
f i xi
100

La cas des Variables continues


Xi est le centre de la classe i
Xi=(ei+ei+1)/2
.

La mdiane(la moyenne de
position)

Note Me est la valeur de la variable


statistique. Dans la srie de donnes
ordonne en ordre croissant ou dcroissant ,
qui partage cette srie en deux parties
chacun comprenant de le mme nombre de
donnes de part et dautre de Me

Le mode(moyenne de frquence)
Cest la valeur qui a t observe le plus
grand
nombre de fois

Mesure de dispersion
une indication de la variation
des donnes. Elles rsument comment
les modalits sont homognes ou
htrognes
Dcrire la dispersion consiste mesurer la
divergence des modalit par rapport la
moyenne
donnent

Mesure de dispersion
Ex. Notes obtenues un examen pour 2
groupes
Groupe A : 9, 10, 11, 11, 12, 13, 13, 14,
15
Groupe B : 4, 5, 7, 8, 12, 16, 17, 19, 20
Ici, la moyenne des notes est de 12
dans les 2 groupe. Les distributions

La variance
La variance mesure la divergence des
donnes par rapport la moyenne. De
faons techniques, cest la moyenne
des carts au carr des modalits par
rapport la moyenne.
Si les modalits sont disperss autour
de la moyenne, les carts seront
grands et la variance leve. Si les
modalits sont concentrs autour de la
moyenne, les carts seront petits et la

La variance
La variance dune population est donne par:

( x x)

La variance
Ex. Variance des notes un examen (groupe A)
xi

xi x

9-12 = -3

10

10-12 = -2

11

11-12 = -1

11

11-12 = -1

12

12-12 = 0

13

13-12 = 1

13

13-12 = 1

14

14-12 = 2

15

15-12 = 3

( xi x ) 2

s
2

2
(
x

x
)
i

N 1

30

3.75
9 1

Lcart-type
Lcart-type est la racine carre de la variance
Pour une population, on a :

2
(
x

)
i

Lcart-type
Lcart-type est plus souvent utilis que la
variance dans linterprtation des rsultats
puisquil est ramen la mme chelle que
les donnes originales
Ex. Notes obtenues un examen
Groupe A : s2 = 3.75 s = 1.936
Groupe B : s2 = 38.5 s = 6.205

Coefficent de variation
Le coefficent de variation permet dvaluer
limportance relative de la dispersion dune
distribution. Il permet ainsi de comparer la
dispersion de 2 distributions qui nont pas la
mme unit de mesure. Il est donn par :

sx
CV ( x) *100
x

Indique le degr dhomognit dune


distribution.

Coefficent de variation
Ex. Comparaison de 2 distributions
variable X : x = 15 et sx = 3 CV(x) = 20%
variable Y : y = 75 et sy = 7.5 CV(y) = 10%
Les donnes de la variable Y scartent
relativement moins de leur centre que celles de la
distribution X. Elles sont donc moins disperses,
plus homognes

Coefficent de variation
Un coefficient de variation inferieur a 15% ,
dans bien de cas , une indication dune bonne
homognit de la distribution des donnes.

tendue
tendue = diffrence entre les
valeurs
observes les plus leves et les plus
faibles
L'inconvnient d'utiliser l'tendue, c'est
qu'elle
ne mesure pas la dispersion de la
majorit des
valeurs d'un ensemble de donnes; elle

Quartiles
Le

quartile infrieur est la valeur du


milieu du premier ensemble, dans
lequel 25% des valeurs sont
infrieures Q1 et 75% lui sont
suprieures. le premier quartile prend
la notation Q1.

Le

quartile suprieur est la valeur du


milieu du deuxime ensemble, dans
lequel 75% des valeurs sont
infrieures Q et 25% lui sont

Exemple Quartiles
suprieur et infrieur
Donnes:

6, 47, 49, 15, 43, 41, 7, 39,

43, 41, 36
Donnes ordonnes: 6, 7, 15, 36, 39,
41, 41, 43, 43, 47, 49
Mdiane: 41
Quartile suprieur: 43
Quartile infrieur: 15

Mesures de forme: coefficients de


dissymtrie

Mesures de forme

le coefficient de dissymtrie de
Pearson

Atelier

Vous aimerez peut-être aussi