Vous êtes sur la page 1sur 3

NOTIONS STATISTIQUES

Statistique : ensemble de donnes chiffres sur un ensemble nombreux

Individu : lment dune population

Population : ensemble sur lequel portent les statistiques (humains, automobiles, objets).
Variable qualitative : La variable est dite qualitative quand les modalits sont des
catgories.
Variable qualitative nominale : La variable est dite qualitative nominale quand les
modalits ne peuvent pas tre ordonnes.
Variable qualitative ordinale : La variable est dite qualitative ordinale quand les
modalits peuvent tre ordonnes.
Variable quantitative : Une variable est dite quantitative si toutes ses valeurs
possibles sont numriques.
Variable quantitative discrte : Une variable est dite discrte, si lensemble des
valeurs possibles est dnombrable.
Variable quantitative continue : Une variable est dite continue, si lensemble des
valeurs possibles est continu.

Caractre statistique (ou variables statistiques) : C'est ce qui est observ ou mesur sur les
individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative.

Amplitude d'une classe (ou d'un intervalle) : C'est la longueur de l'intervalle. L'amplitude de
la classe [ei ; ei+1 [ est ei+1 - ei

Quartiles : Les quartiles Q1 , Q2 , Q3 divisent une srie statistique en 4 parties d'effectifs gaux :
25 % des valeurs sont Q1 , 25 % comprises entre Q1 et Q2 ; 25 % entre Q2 et Q3 , et 25 %
suprieures Q3. Afficher les quartiles : quartile(vect)

Ecart interquartile : C'est la diffrence entre le 3me et le 1er quartile, amplitude de l'intervalle
interquartile : Q3 - Q1.

*Avantage : On est sr que 50% de linformation appartient cet intervalle.


*Inconvnient : On ne dispose que de 50% de la population

Centiles : Les centiles C1, C2 , ... , C99 divisent une srie statistique en 100 parties d'effectifs
gaux. Afficher les dciles : quartile(vect,props=seq(0,1,0.01))

Dciles : Les dciles D1 , D2 , ... , D9 divisent une srie statistique en 10 parties d'effectifs
gaux. Afficher les dciles : quartile(vect,props=seq(0,1,0.1))

Distribution : Ensemble des valeurs, modalits ou classes d'une variable statistique, et des
effectifs ou frquences associes

Donnes statistiques : Sries de mesures, d'observations, d'une ou plusieurs variables


statistiques sur un ensemble d'individus
Effectif : Nombre d'individus pour lesquels une variable statistique a pris une valeur donne.

Effectifs cumuls : Rsultat de l'addition, de proche en proche, des effectifs d'une distribution
observe,

Etendue : Diffrence entre la plus grande et la plus petite des observations d'une srie
statistique. C'est un paramtre de dispersion.
L'inconvnient de l'tendue est qu'elle dpend uniquement des deux valeurs les plus extrmes
de la distribution. Elle indique donc la diffrence maximum entre deux valeurs mais pas la
diffrence typique.

Afficher les valeurs extrmes : range(vect) Etendue


Mdiane Me : La valeur qui spare les individus en deux groupes de mme effectif de sorte que
la moiti des individus prennent des modalits infrieures Me et lautre moiti des modalits
suprieures
* Si le caractre est quantitatif discret et quil y a un nombre impair dindividus, on choisit la
modalit de lindividu qui partage leffectif en deux.
* Si le caractre est quantitatif discret et quil y a un nombre pair dindividus, on utilise la
moyenne des modalits des individus qui partagent leffectif en deux .
Afficher la mdiane : median(vect)

Mode : Le mode est la classe (ou la modalit) dont leffectif est le plus lev.

Ecart absolu moyen : la moyenne de la valeur absolue des carts la moyenne. Autrement
dit, c'est la distance moyenne la moyenne.
Avantage : Cest un indicateur qui touche les observations.
Inconvnient :La valeur absolue ne peut utilise algbriquement ou mathmatiquement, elle
nest pas exploitable algbriquement.
( |x i X |)
Afficher : eam<-mean(abs(vect-mean(vect)) EAM=
N
Variance :.
Avantage : Elle mesure la dispersion des valeurs autour de la valeur moyenne
Inconvnient :elle na pas la mme unit dobservation.

V ( x)=
( x i X )2
Calcul de la variance : Var(vect) N

Ecart-type : L'cart type sert mesurer la dispersion d'un ensemble de donnes. Plus il est
faible, plus la population est homogne.
Avantages : Il mesure la dispersion des valeurs autour de la valeur moyenne. Ils ont la mme
unit dobservation.
Inconvnients : On ne peut pas comparer deux choses diffrentes.
Calcul de lcart-type : Sqrt(var(vect)) ou Sd(vect) . = V ( x )

Coefficient de variation : Cest le rapport de cart type la moyenne. Plus il est faible, plus
lestimation est prcise.
Avantage ; Cest un nombre est sans unit, c'est une des raisons pour lesquelles il est parfois
prfr l'cart-type.
Inconvnient : Le C.V est trs sensible la valeur de la moyenne.

Afficher le C.V : Sd(vect)/mean(vect)
C.V=
X