Vous êtes sur la page 1sur 74

La Statistique Descriptive

Professeur Franois KOHLER


kohler@medecine.uhp-nancy.fr
Buts
Ensembles de mthodes dont le but est de
prsenter les donnes pour que l'on puisse en
prendre connaissance facilement.
Cela peut concerner :
une variable la fois : statistique une dimension,
deux variables la fois : statistique deux dimensions,
plus de deux variables la fois : statistique
multidimensionnelle.
Statistique descriptive
Ces mthodes comportent :
Les tableaux : distributions de frquences.
Les diagrammes : graphiques.
Les paramtres statistiques :
Rduction des donnes quelques valeurs
numriques caractristiques.
Rappel
3 Types de donnes :
Qualitatives (prsence ou absence dune
caractristique)
Binaires,
Nominales.
Quantitatives (compte ou mesure)
Discontinues,
Continues.
Ordinales (rang)
Distributions de frquences
Concernent les 3 types de donnes avec des points
communs et des points spcifiques chacun des types.
Sries statistiques (tout type de donnes) :
Enumration des rsultats :
Exemples :
Couleurs des cheveux : blond, brun, blond, noir.
Nombre denfants dans les familles : 1, 2, 1, 4, 0 .
Sries statistiques ordonnes :
Ne concernent que les donnes quantitatives
et ordinales
Enumration du plus petit au plus grand
Exemple : Nombre denfants : 0, 1, 1, 2, 4 .
Le nombre total dobservations est leffectif. Il est not n
(certain le note N).
Distributions non groupes
Donnes xi ni fi
qualitatives,
ordinales,
x1 n1 f1
quantitatives x2 n2 f2
discontinues
Formellement, ces
tableaux ne concernent
pas les donnes xp np fp
quantitatives continues.
S1p n 1
Distributions non groupes
xi ni fi fi
ni
n
Chaque ligne correspond
une valeur observe
diffrente. Il y a p valeurs
x1 n1 f1 diffrentes observes.

ni correspond au nombre
dobservations (effectif) ayant
x2 n2 f2 comme valeur xi

fi correspond la frquence
(pourcentage) dobservations
ayant comme valeur xi : f n
i
ni

xp np fp
S1 p n 1
Distributions non groupes
Donnes ordinales et xi ni fi Ni Fi
quantitatives
discontinues. x1 n 1 f 1 N1 F 1
x1 est la plus petite
valeur, xp la plus grande x2 n 2 f 2 N2 F 2
des valeurs observes.
Effectifs cumuls. .
N2 = n2+n1
Frquences cumules. xp n p f p Np F p
F2 = f2+f1
S1p n 1
Distributions non groupes
Ni est leffectif cumul cest dire le
xi ni fi Ni Fi nombre dobservations ayant des
valeurs infrieures ou gales xi :
i

x1 n 1 f 1 N1 F 1 Ni n j
j1

x2 n 2 f 2 N2 F 2 Fi est la frquence cumule cest


dire la frquence des
observations ayant des valeurs
. infrieures ou gales xi :
i
Fi f j
xp n p f p Np F p j1

S1p n 1
Distributions groupes
Les valeurs sont mises en classes.
Toutes les distributions relatives des
variables continues doivent tre considres
comme des distributions groupes, puisque
l'infinit de valeurs admissibles est
condense en un nombre fini de mesures en
fonction de la prcision de la mthode de
mesure utilise.
A propos des classes
Leurs valeurs extrmes sont appeles bornes des
classes.
Les classes sont mutuellement exclusives.
L'amplitude de la classe ou intervalle ou module de
classe :
D= borne suprieure - la borne infrieure.
Le point central ou encore point mdian est situ mi
chemin entre les bornes.
Ci = Binfi +Di/2
Dans certains cas la limite infrieure de la premire
classe ou suprieure de la dernire classe n'est pas
prcise. On parle de classes ouvertes. A viter !...
A propos des classes
L'intervalle de classe est gnralement
constant, toutefois, on utilise parfois une
amplitude variable notamment pour les
classes des valeurs extrmes.
En cas de classes d'amplitudes diffrentes, la
densit de frquence ni/ Di permet de
comparer les effectifs ou les frquences d'une
classe l'autre.
la densit de frquence est utilise pour
tracer lhistogramme.
Donnes quantitatives
continues
Remarques :
Si lon mesure le poids dun nouveau n avec une
prcision de 1g, lenfant qui pse 3500g a en fait
un poids compris entre [3499,5g et 3500,5g[.
3500g reprsente le centre de la classe.
Si lon mesure lge en annes pleines des
individus, une personne de 20 ans a un ge
compris entre [20 ans (inclus) et 21 ans[ (exclu).
20 ans reprsente la borne infrieure de la classe.
Distribution groupe
On remplace la colonne xi par une colonne qui
comprend soit les bornes de classes, soit le
centre de classe ou la borne infrieure de la
classe (donnes temporelles comme lge en
annes pleines).
Exemple
Classe Ci ni fi Ni Fi
[140-160[ 150,0 10 0,05 10 0,05
[160-165[ 162,5 20 0,10 30 0,15 Pour les calculs, le
[165-170[ 167,5 30 0,15 60 0,30 centre de classe Ci est
utilis en remplacement
[170-175[ 172,5 45 0,23 105 0,53 de xi sauf de faon
usuelle pour lge
[175-180[ 177,5 40 0,20 145 0,73 (donnes temporelles).
[180-185[ 182,5 35 0,18 180 0,90
[185-190[ 187,5 15 0,08 195 0,98
[190-200[ 195,0 5 0,03 200 1,00
Formules
ni
fi
n
n i 1 n i
p
p = nombre de valeurs diffrentes observes

p
f 1
i 1 i

Total des valeurs i 1 x i i 1 n i x i


n p

Total des carrs des valeurs i 1 x i 1 n i x i2


n 2 p
i
En pratique
Pour les calculs des paramtres statistiques
usuels des donnes quantitatives et
uniquement de ce type de donnes.
On complte la distribution par :
Une colonne ni * xi pour calculer le total,
Une colonne ni * xi2 pour calculer le total des carrs.
Les graphiques reprsentent
les distributions
Distributions non cumules
Distributions non groupes
Donnes qualitatives :
Diagramme sectoriel
Angle au centre proportionnel ni (ou fi).
Donnes quantitatives discrtes
Diagramme en btons
On trace paralllement l'axe des ordonnes, en regard des xi
qui sont ports en abscisse, un segment de longueur
proportionnel ni
Polygone des frquences
Ligne brise joignant les btons.
Frquences absolues / frquences relatives.
Exemple : Donnes qualitatives
Diagramme sectoriel
Rpartition des groupes sanguins
Groupes
sanguins ni fi
A 35 35%
B 9 9%
16 A
35 B
O 40 40%
O
AB 16 16%
40 9 AB
100 100%
Exemple : Donne quantitative
discontinue
25
nombre nombre de
d'enfants familles (ni) 20

(xi)
0 10 15

1 20
2 15 10

3 5
4 3 5

>4 0
0
0 1 2 3 4 >4

Polygone des frquences


Les graphiques reprsentent
les distributions
Distributions non cumules
Distributions groupes
Donnes quantitatives
Histogramme :
Compos de rectangles ayant comme base
l'intervalle de classe et comme hauteur la
densit de frquence (ni/Di).
La surface est proportionnelle ni.
Les graphiques reprsentent
les distributions
Distributions cumules
Uniquement pour des donnes
quantitatives
Polygone des frquences :
Distributions non groupes = escalier.
Distributions groupes = ligne brise.
Histogrammes.
Exemple : Histogramme
90
Densit 80
Classe ni (*10) 70
[140-160[ 10 5 60
[160-165[ 20 40 50
40
[165-170[ 30 60 30
[170-175[ 45 90 20
[175-180[ 40 80 10
[180-185[ 35 70 0
140 160 170 180 190 200
[185-190[ 15 30
[190-200[ 5 5
Aspects de la distribution
Distribution non cumule :
60
en forme de : Cloche, J, U ; 50

une seule bosse, plusieurs bosses ; 40

.
30

20

Symtrie Aplatissement. 10

0
1 2 3 4 5 6 7 8 9 10
Remarques
Autres reprsentations :
Diagramme de Pareto et courbe ABC ;
Boite moustache (Box-plot).
Attention :
Les tableurs comme Excel ou Calc ne permettent
pas facilement de faire des histogrammes.
Diagramme de Pareto
Dans le domaine de la qualit, on tudie les
causes de dysfonctionnement d'un systme.
Quand il s'agit de variables qualitatives
binaires, on prsente les rsultats sous forme
de diagramme de Pareto et de courbe ABC.
Objectif : Visualiser les causes les plus
frquentes de dfaut de qualit.
Exemple
La tenue des dossiers mdicaux fait l'objet de
textes rglementaires contraignants.
l'valuation de la qualit des dossiers fait
partie du processus de certification.
Un dossiers peut avoir plusieurs anomalies.
On a tudi les anomalies rencontres sur 200
dossiers.
Rsultats
Etude de la qualit du dossier du patient : anomalies Effectif % d'anomalies
rencontres Dossier comportant des pices
Nombre de dossiers analyss 200 non "signes" 180 39,74%
Effectif des Pourcentage Dlai de la lettre de sortie non
anomalies de dossiers
respect 150 33,11%
Dossiers non retrouvs 3 1,50%
Absence d'une pice rglementaire 80 40,00%
Absence d'une pice
Dlai de la lettre de sortie non rglementaire 80 17,66%
respect 150 75,00% Doosier ne permettant pas de
Dossier comportant des pices non retrouver la dmarche clinique 30 6,62%
"signes" 180 90,00% Dossier comportant des pices
Dossier comportant des pices sans
sans identification du patient 10 2,21%
identification du patient 10 5,00%
Dossiers non retrouvs 3 0,66%
Doosier ne permettant pas de
retrouver la dmarche clinique 30 15,00% Total 453 100,00%

On trie le tableau par ordre dcroissant du


nombre d'anomalies et on calcule les
pourcentages par rapport au nombre total
d'anomalies
Digramme de Pareto
et courbe ABC
Effectif % de anomalies % Cumul
Dossier comportant des pices non "signes" 180 39,74% 39,74%
Dlai de la lettre de sortie non respect 150 33,11% 72,85%
Absence d'une pice rglementaire 80 17,66% 90,51%
Doosier ne permettant pas de retrouver la dmarche clinique
30 6,62% 97,13%
Dossier comportant des pices sans identification du patient
10 2,21% 99,34%
Dossiers non retrouvs 3 0,66% 100,00%
Total 453 100,00%

100,00%

90,00%

80,00%

70,00%

60,00%

50,00%

40,00%

30,00%

20,00%

10,00%

0,00%
Dos s ie r D la i d e la le ttre Ab s e n c e d ' u n e Doos ie r n e Dos s ie r Dos s ie rs n on
c om p orta n t d e s d e s ortie n oin p i c e p e rm e tta n t p a s c om p orta n t d e s re trou v s
p i c e s n on re s p e c t r g le m e n ta ire d e re trou ve r la p i c e s s a n s
"s ig n e s " d m a rc h e id e n tific a tion d u
c lin iq u e p a tie n t
Les paramtres statistiques
Paramtres de position Paramtres de lchantillon
Valeurs centrales
Moyenne arithmtique E n
Les autres moyennes s o
gomtrique
harmonique
t i
quadratique i t
Mdiane Le + souvent m a
Mode
Mdiale a m
Les fractiles t i
Quartiles i t
Percentiles
o s
Paramtres de dispersion n E
Amplitude ou tendue
Ecart interquartiles
Variance, Ecart type Paramtres de la population
Coefficient de variation
Paramtre d'aplatissement et de symtrie
Moyenne Arithmtique
Population m (mean) Echantillon x (average)

Appele moyenne note x


Paramtre central qui concerne bien videmment
uniquement des variables quantitatives.
Dans lunit de la variable.
Calculable quelque soit la loi qui rgit la distribution.
Somme des valeurs (T) divise par le nombre de mesures (n).
Suivant la forme de prsentation des observations, diffrentes
formules de calcul peuvent tre employes.
Moyenne arithmtique
On note : p p
ni
n : Nombre total de
mesures.
n ni fi f i 1
p : Nombre de valeurs
i 1 n i 1
diffrentes n p p
observes.
T x i n i x i n fi x i
ni : Nombre
doccurrences de la i 1 i 1 i 1
valeur observe i. p
T
fi : Frquence x fi x i
(pourcentage) de la n
valeur observe i. i 1
Moyenne arithmtique
Proprits :
Centre de gravit de la distribution.
La somme des carts la moyenne est nulle.
Affecte par les changements de variable.
Si y = ax + b; on a : y = ax + b
La moyenne contrairement la mdiane est trs sensible
aux valeurs extrmes.
La moyenne d'un groupe rsultant de la fusion d'autres
groupes n'est gale la moyenne des moyennes que si
tous les groupes ont le mme effectif.
Dans une distribution en cloche, unimodale et symtrique,
moyenne, mode et mdiane sont confondus.
Distribution des moyennes de
plusieurs chantillons
La moyenne de l'chantillon est le meilleur
estimateur de la moyenne de la population.
La distribution des moyennes de petits
chantillons (n<30) indpendants tirs de la
mme population suit une loi normale si la
distribution de la variable est normale.
Au-del de 30, la distribution des moyennes suit
une loi normale sans condition sur la distribution
de la variable.
Exemple
Soit la srie correspondant aux tailles en cm
de 6 tudiants : 160,170,180,180, 190, 200.

n = 6; T = 160+170+180+180+190+200 = 1080

1080
x 180 cm
6
Exemple
Le nombre de familles enqutes
nombre nombre de
est de 53.
d'enfants familles Le nombre total denfants est
(xi) (ni) ni*xi de 77.
0 10 0
La moyenne du nombre denfants
1 20 20 par famille est de 77/53 = 1,45.
2 15 30
3 5 15 Attention aux arrondis ici si on
arrondit une dcimale la
4 3 12 moyenne est de 1,5 enfants par
Total 53 77 famille.
Exemple
Les tudiants de premire anne de L1 sant sont rpartis
dans 3 amphithtres avec les donnes ci-dessous. Quelle est
la moyenne de lge en L1 sant ?

Moyenne Les effectifs tant diffrents dans les 3


de l'ge groupes, la moyenne recherche nest pas la
Effectifs en annes moyenne des moyennes.
Amphi 1 1000 18,1
On calcule le total de lge des 3 groupes
Amphi 2 500 19,5
runis : T = 18,1*1000+ 500*19,5+
Amphi 3 1000 18,3 18,3*1000 =46 150.
Leffectif total est de 2 500.
La moyenne recherche est 46150/2500
=18,5 ans
Les autres moyennes
Moyenne gomtrique d'une srie de valeurs
positives est la racine nime du produit des n
valeurs. Elle est toujours infrieure ou gale la
moyenne arithmtique.
Moyenne harmonique d'une srie de valeurs
positives est gale l'inverse de la moyenne des
inverses.
Moyenne quadratique est la racine carr de la
moyenne arithmtique des carrs.
La mdiane

La mdiane note x (tilde) est telle que la moiti des
observations lui sont infrieure (ou gale) et la
moiti suprieure (ou gale) : xi tel que Fi = 0,5.
Sur les distributions symtriques unimodales en cloche
(normales par exemple) la mdiane est gale la moyenne
et au mode.
Paramtre peu sensible aux valeurs extrmes.
Peut tre utilise pour des donnes ordinales.
La mdiane : calcul
Sur une distribution non groupe :
Si n impair, la mdiane est l'observation de rang (N+1)/2
Si n est pair, tout nombre entre xN/2 et xN/2+1
convient. On prend la moyenne (pondre en cas d'ex-aequo)
entre ces deux valeurs.
Sur une distribution groupe, la classe mdiane
est celle qui contient la mdiane.
Dtermination graphique.
En admettant que les observations soient rparties
uniformment dans cette classe, on ralise une approximation
linaire.
Exemple
Classe ni Ni Fi La classe qui contient la
[140-160[ 10 10 0,05 mdiane est [170-[175.
On pose les 2 quations :
[160-165[ 20 30 0,15
0,53 = a*175 +b
[165-170[ 30 60 0,30 0,30 = a*170+b
[170-175[ 45 105 0,53 =>
[175-180[ 40 145 0,73 0,23 = a*(175-170)
[180-185[ 35 180 0,90 a = 0,046 et b= -7,52
=> y = 0,046x 7,52
[185-190[ 15 195 0,98
[190-200[ 5 200 1,00 Cherchons x tel que y = 0,5
Total 200 Mdiane = 174,35
Mode
Mode encore appel valeur dominante :
Correspond la valeur la plus frquente. xi
correspondant au ni (ou fi)maximum.
Il peut y avoir un ou plusieurs modes.

Rappel :
Dans les distributions en cloche, unimodales
symtriques, mode, mdiane et moyenne sont
confondus.
Fractiles
Quartiles
Q1: xi tel que Fi = 0,25 => 1/4 des valeurs lui sont
infrieures, 3/4 lui sont suprieures.
Q2 = Mdiane.
Q3 : xi tel que Fi = 0,75 => 3/4 des valeurs lui sont
infrieures, 1/4 lui sont suprieures.
Dtermination graphique.
Interpolation linaire (cf mdiane).
Percentiles
10ime percentile : xi tel que Fi = 0,10
Remarques
On a :
50% des individus qui ont des valeurs en dehors de
lintervalle Q1-Q3 et 50% lintrieur.

25% des individus qui ont des valeurs comprises entre


Q1 et mdiane.
25% des individus qui ont des valeurs comprises entre
mdiane et Q3.
25% des individus qui ont des valeurs infrieure Q1
25% des individus qui ont des valeurs suprieures
Q3

Ceci permet rapidement de se rendre compte si la


distribution est symtrique ou non.
Paramtres de dispersion
Amplitude ou tendue.
Ecart interquartiles.
Variance et cart type.
Coefficient de variation.
Amplitude ou tendue
Ecart entre la valeur de l'observation maximale et celle de
l'observation minimale.
Non dfinie pour les distributions groupes (tolrance pour
les variables quantitatives continues de la prcision de la
mesure).
On montre que l'cart type est toujours infrieur ou gal la
moiti de l'amplitude.
Dans les distributions unimodales en cloche l'cart type est
gal :
au tiers de l'amplitude pour n de l'ordre de 10,
au quart de l'amplitude pour n entre 15 et 50,
au cinquime pour des effectifs de 50 200,
au sixime pour des effectifs de 200 1000.
Ecart interquartiles (EIQ)
EIQ = Q3 -Q1.
Englobe 50% des observations.
On utilise parfois l'cart semi-interquartile
(Q3-Q1)/2.
Variance et cart type
La variance (variance) d'une srie ou d'une
distribution de frquences est la moyenne
arithmtique des carrs des carts la moyenne
n

(x i x) 2
S2 i 1
n
C'est par rapport la moyenne que la somme des
carrs des carts est la plus faible.
La variance de l'chantillon est souvent note S2.
Ce n'est pas un bon estimateur de la variance de la
population souvent note s2.
Lestimation de la variance est note s
^ 2.
Variance et cart type
Le numrateur de la variance est appel somme des
carrs des carts et not SCE.
L'cart type est la racine carr de la variance. On
l'appelle galement dviation standard (standard
deviation). Il est dans l'unit de la variable.
Variance et cart type sont indpendants des
translations (changement d origine) mais pas des
multiplications (changement d'unit).
Si y = a * x + b, on a Sy = |a| * Sx
Pour les distributions en cloche, la variance calcule
partir des classes est surestime, certain ralise la
correction de Sheppard.
Formules
p p
n
n ni fi i f i 1
i 1 n i 1
n p p
T x
i 1
i n x
i 1
i i n fi
i 1
n p
U x
i 1
2
i n xi 1
i
2
i

p
T
x
n
f x
i 1
i i

N
T2
SCE (x i x) U 2

i 1 n
SCE
S
n
SCE

n 1
Ecart type de la moyenne
Si lon considre plusieurs chantillons indpendants,
issus dune population, on obtient plusieurs
moyennes.
La distribution des moyennes a un cart type appel
cart type de la moyenne ou erreur standard de la
moyenne (ESM) (standard deviation of the mean
SDM).

ES M
n
Reprsentation en Box Plot
Rsume la distribution en terme de
paramtres de position et de dispersion.
Coefficient de variation
CV est le rapport cart type divis par la
moyenne.
CV est un nombre pur, sans units.
CV est totalement indpendant des units.
Le CV permet de comparer la variabilit de
distributions de variables qui ne sont pas dans
les mmes units.
Moments centrs dordre k.
Symtrie et aplatissement
Moments centrs d'ordre k
moyenne arithmtique des carts la moyenne leve la
puissance k.
si k pair => paramtre de dispersion.
si k impair => paramtre de symtrie.
Coefficient de Pearson et de Fisher
b1 pour caractriser la symtrie de la courbe; b2 pour caractriser
l'aplatissement.
b1 = M32 / M23 : est voisin de 0 si la distribution est symtrique.
b2 = M4 / M22 : est voisin de 3 si la distribution suit une loi normale
(plus aplatie qu'elle si b2 < 3).
cf Loi Normale.
Statistique descriptive
2 dimensions
Objectif : mettre en vidence les relations qui existent
entre deux sries d'observations.
Nature des variables : les deux variables peuvent tre
quantitatives, qualitatives ou l'une quantitative et l'autre
qualitative.
Deux variables mesures chez le mme individu par exemple poids
et taille; poids et couleur des yeux, prsence dun cancer et
thylisme...
Situations :
Sries apparies : mme variable mesure dans deux
circonstances :
Avant - Aprs traitement.
Cas - Tmoins on apparie un tmoin dpourvu de la maladie que l'on veut
tudier sur diffrents points que l'on sait lier au phnomne tudi (par
exemple pour une tude de la mortalit on apparie sur ge, sexe, ...
Sries non apparies :
Mme variable mesure dans des groupes diffrents.
Tableaux 2 dimensions
Srie, distribution de frquences : tables de
contingence.
Sujet Poids Taille Poids
1 70 170 Taille 60 65 68 70 73 75 80 83 90 Tot.
2 80 180 162 1 1
3 65 165 165 1 1 2
4 75 175 170 1 12 13
5 90 182 175 10 10
6 73 170 180 4 15 1 2 22
7 60 162 182 1 1
Tot. 1 1 1 5 12 25 1 1 3 48
8 68 165
9 83 180
.
Table de contingence
Nombre de mesures totale n
Total de chaque ligne = li
Total de chaque colonne = cj
Effectif d'une cas = nij
Frquences relatives: Cheveux
nij / li : % en ligne Yeux Blonds Bruns Autres Tot. (li)
nij / cj % en colonne Clairs 50 20 30 100
nij / n % Foncs 60 80 60 200
li / n
Tot. (cj) 110 100 90 300
cj / n
Attention
Cheveux
Yeux Blonds Bruns Autres Tot. (li)
Clairs 50 20 30 100
Foncs 60 80 60 200
Tot. (cj) 110 100 90 300
300 = Nombre total de mesures.
100 = Nombre d'individus ayant les yeux clairs.
110 = Nombre d'individus ayant les cheveux blonds.
50 / 300 = % d'individus ayant les cheveux blonds et les yeux clairs.
50 / 110 = % d'individus parmi les blonds ayant les yeux clairs.
50 / 100 = % d'individus parmi les yeux clairs ayant les cheveux blonds.
Reprsentation graphique 2
variables quantitatives
Nuage de points

90
85
80
75
70
65
60
55
160 165 170 175 180 185
Covariance
Covariance
Calcul
N Tx * T
S x * y -
i
y

Cov (x,y) =
i=1 i N
N
N

S xi * y
i
= Txy = somme des produits
i=1
Table de contingence de 2
caractres binaires

Trs utilises en sant :


Recherche de facteur de risque : exemple
enqutes exposs/non exposs.
Evaluation dun test diagnostic.
Recherche de facteurs de
risques : paramtres utiliss

Cancer du poumon Cancer + Cancer - Total


et thylisme.
Ethylisme + 73 927 1 000
Frquences relatives :
Risques :
- Cancer chez les Ethylisme - 37 963 1 000
thyliques :
R1 = 73/1000
- Cancer chez les Total 110 1 890 2 000
non thyliques:
R0 = 37/1000
Risque relatif et odds ratio
RR est le rapport du risque chez les exposs (R1) sur
le risque des non exposs (R0).
RR = R1/R0 = 0,073/0,037 =1,97

Cote (Odds) (cf course de chevaux).


Chez les thyliques R1/(1-R1) = 0,79
Chez les non thyliques R0/(1-R0) = 0,038

Odds ratio (OR) ou rapport de cotes.


OR = 0,79/0,038 = 2,05

LOR est souvent utilis en pidmiologie. Si la


frquence de la maladie est faible, les valeurs de OR
et de RR sont trs proches.
Recherche de facteurs
de confusion
On a montr que lon avait 1,97 fois plus de chance
de faire un cancer du poumon si lon boit que si lon
ne boit pas Mais ?
Un facteur de confusion est simultanment facteur
de risque pour la maladie et est une variable
associe l'exposition.
Les facteurs de confusion potentiels sont le tabagisme et
le sexe.
La premire variable considrer est le
tabagisme .
Table de contingence
3 variables
Cancer du Cancer du
poumon + poumon - Total

Ethylisme + 70 630 700


Tabagisme
+
Ethylisme - 30 270 300

Total 100 900 1 000

Ethylisme + 3 297 300


Tabagisme
-
Ethylisme - 7 693 700

Total 10 990 1 000

Total 110 1 890 2 000


Calcul des diffrents risques
Chez les fumeurs, la frquence du cancer est de 100/1000 =
0,1 contre 10/1000 = 0,01; RR = 10
Cancer + Cancer - Total Le tabagisme est un facteur de risque pour le cancer du poumon,
car les fumeurs ont 10 fois plus de risque de dvelopper un
Ethylisme
+ 70 630 700
cancer du poumon que les non-fumeurs.
Tabagisme + Ethylisme
- 30 270 300 Quel est le RR d'tre alcoolique pour les fumeurs par rapport
aux non fumeurs ?
Total 100 900 1 000 RR = 700/1000 / 300/1000 = 2,3
Il existe une association entre le tabagisme et l'thylisme. Les
Ethylisme
+ 3 297 300
fumeurs ont 2,3 fois plus de chance d'tre alcooliques que les
non-fumeurs.
Tabagisme - Ethylisme
- 7 693 700
Le tabagisme est un facteur de confusion dans cette tude,
les donnes doivent tre analyses en tenant compte de cette
Total 10 990 1 000
variable.
Total 110 1 890 2 000 Calculer le RR (thylisme) dans chaque strate
Tabagisme+ RR = 70/700 / 30/300 = 1
Tabagisme - RR = 3/300 / 7/700 = 1
L'association entre thylisme et cancer du poumon dans les
donnes brutes (RR = 1,97) est le produit d'un biais de
confusion. Car l'intrieur des diffrentes strates du
"tabagisme" il n'existe aucune association entre thylisme et
le cancer du poumon : RR = 1.
Quelques indicateurs utiliss
en statistiques hospitalires
Lits.
Entres et Sorties.
Dure moyenne de sjour : DMS.
Coefficient (taux doccupation) des lits, Lits
occups.
Effectifs et quivalents temps pleins.
Lits
Comment compter les lits dans un hpital ?
Lits Installs au 1er janvier.
Lits disponibles pendant un priode :
Comment comptabiliser lindisponibilit ?
Fermeture pour dsinfection,
Fermeture par manque deffectifs soignants,
Fermeture par manque de malades,
..
Entres, sorties,
malades prsents
On parle dentres ou de sorties pendant une
priode donne.
Chaque trait reprsente
Date de dbut Date de fin un malade.
2 4 - 3 entres
10 4 4 - 4 sorties
- 6 prsents
3 1
3 Et pour les journes ?
- 21 j (entrants)
1 30 4 - 23 J (sortants)
- 52 J (prsents)
Dure moyenne de sjours :
Dure de sjour PMSI = DS-DE + 1 si dcs.
DMS :
Journes des entrants
DMS
Entres
Journes des sortants
DSM
Sorties
Journes des prsents
DMS
Prsents
Taux doccupation des lits et
lits occups

Journes ralises
Taux d' occupation
Nombre de lits * dure de la priode
Journes ralises
Lits occups
Dure de la priode
Effectifs,
Equivalents temps plein
Les effectifs correspondent au nombre de
personnes employes par la structure.
Les quivalents temps plein (ETP)
reprsentent la force de travail. Une personne
travaillant temps partiel est comptabilise
en fonction de son temps de travail.
Par exemple un hospitalo-universitaire compte pour 0,5
ETP.

Vous aimerez peut-être aussi