Vous êtes sur la page 1sur 141

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique

Université de Parakou
ENATSE

UE: Informatique et logiciels en santé


ECUE: Initiation à l’utilisation du logiciel EpiInfo

Année académique 2022 - 2023

Dr KOSSI Oyéné, PT, PhD


Université de Parakou – Bénin
OBJECTIFS

GENERALITES

PARTIE 1 : SAISIE DES DONNEES

PARTIE 2 : ANALYSE DES DONNEES

MODULE STATCALC D’EPI INFO


Objectifs du cours
L’objectif de ce module est de vous
familiariser à son utilisation. Ainsi, vous
disposerez d’un outil permettant de mettre en
oeuvre concrètement, sur des jeux de données,
les notions abordées dans les autres modules de
cet enseignement.
Objectifs du cours
De plus, dans ce module, nous nous limitons à
présenter les aspects saisie et analyse des
données et nous n’aborderons pas d’autres
fonctionnalités plus spécifiques (génération de
rapport automatisée, création de cartes,…).
EpiInfo est un logiciel de traitements de données
conçu pour des épidémiologistes. Complet, il permet
de mettre en œuvre tout ce qui concerne la partie
informatisable du traitement des données issues
d’une enquête. Cela comprend notamment : la mise
en forme du formulaire de saisie, la saisie, l’analyse
statistique des données et la génération de rapport.
GENERALITES
PRESENTATION DU LOGICIEL EPI INFO

EpiInfo est un logiciel gratuit, développé par les


CDC (Centers for Disease Control) à Atlanta et
librement diffusé.
INSTALLATION D’EPIINFO

Pour débuter cet enseignement vous devez


disposer du logiciel EpiInfo 7. Si vous ne l’avez
déjà, il faut donc, dès à présent, avoir accès à ce
logiciel. C’est un logiciel gratuit que vous
pouvez acquérir via le site des CDC.
INSTALLATION D’EPIINFO

Pour cela vous pouvez procéder comme suit :


1) Sur la page
http://www.cdc.gov/epiinfo/7/index.htm cliquer
sur le bouton Download ZIP File pour
télécharger le fichier EpiInfo_7.zip.
INSTALLATION D’EPIINFO
2) Décompresser le fichier que vous venez de
télécharger.
3) Le fichier : Launch Epi Info 7.exe : permet de
lancer le logiciel sans avoir à l'installer
préalablement. Et cela depuis n'importe quel
support mémoire, le disque dur de votre
ordinateur ou une clef USB par exemple.
LES MODULES DANS EPIINFO
EpiInfo est constitué de différents modules
indépendants. Chacun prend en charge une
partie des traitements.
LES MODULES DANS EPIINFO
Il y a trois modules de base :
CREATE FORMS : permet de créer un formulaire de
saisie,
ENTER DATA : permet de saisir et de modifier les
données à l’aide d’un formulaire,
ANALYSE DATA avec 2 interfaces :
CLASSIC et VISUAL DASHBOARD : qui
permettent d’analyser les données.
LES MODULES DANS EPIINFO
LA NOTION DE PROJET
Les fichiers EpiInfo sont des fichiers d’extension
.prj. Ils sont appelés : projet. Un projet permet
de gérer différents éléments relatifs à une étude :
des questionnaires de saisie, aux données relevées
et aux programmes permettant de les analyser.
Un projet ne se restreint pas aux tables de
données.
PARTIE 1 : SAISIE DES DONNÉES
Deux modules d’EpiInfo sont dédiés à la saisie
des données :
- CREATE FORMS : permet de créer le
formulaire de saisie
- ENTER DATA : permet d’entrer les données à
partir du formulaire de saisie.
CREATION D’UN FORMULAIRE VIERGE

Créer un nouveau formulaire dans un nouveau


projet, dans le module CREATE FORMS, faire
File/New Project : donner le nom du projet à
créer dans la zone Name 1 en précisant son
emplacement (Location 2), puis nommer le
nouveau formulaire (Form Name 3).
AJOUT DE ZONES DE SAISIE
Pour ajouter une nouvelle zone de saisie il suffit
de faire un clic droit sur le formulaire à l’endroit
où doit figurer cette zone. Un menu apparaît.
Dans ce menu, la liste déroulante New Field
permet de spécifier le type de zone de saisie à
inclure : zone de texte, liste déroulante, case à
cocher, boutons radio, etc.
AJOUT DE ZONES DE SAISIE
AJOUT DE ZONES DE SAISIE
Après sélection d’un type de zone de saisie, une
fenêtre apparait qui permet de donner les
caractéristiques du nouveau champ. Cette
fenêtre est spécifique à chaque type de zone de
saisie mais on y trouve un certain nombre de
propriétés communes à renseigner :
AJOUT DE ZONES DE SAISIE
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
Champs numériques :
NUMBER : c’est l’unique type de zone de saisie
permettant de prendre en compte une variable
quantitative. Il faut préciser le format dans
pattern. Chaque # indique un chiffre et le
symbole « . » est le séparateur entre partie
entière et partie décimale au niveau de ce
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
Champs alphanumériques:
Les champs alphanumériques acceptent
n’importe quelle suite de caractères imprimables
en entrée. Il y a trois types de zone de saisie
possibles :
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
Champs alphanumériques:
TEXT : texte simple limité à 255 caractères
TEXT (UPPERCASE) : homogénéise la casse
des entrées associées à ce champ : elles sont
automatiquement converties en majuscule (par
exemple, dans le cas où soit f soit F est tapé au
clavier, c’est F qui est enregistré).
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
Champs alphanumériques:
MULTILINE : réserve de large zone de saisie
(jusqu’à 2 millions de caractères) pour des
réponses à des questions ouvertes par exemple.

Il faut cependant limiter l’utilisation de ce type de champ


car ils sont difficilement exploitables. En effet il n’y a
aucun contrôle sur les valeurs saisies.
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
Champs alphanumériques:
Lorsque la variable associée à la zone de saisie ne
peut prendre que certaines valeurs prédéfinies, il
faut limiter la saisie à ces modalités. Pour cela, il
y a trois types de zone de saisie possibles :
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE

LEGAL VALUES: définit une liste déroulante


avec les différentes valeurs possibles de la
variable ; seules ces modalités et les données
manquantes seront acceptés dans la zone de
saisie.
Exemple :
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
LEGAL VALUES:
A la création de cette zone de
saisie il faut préciser la liste
des valeurs possibles dans
Data Source 1 par
l’intermédiaire du bouton
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE

LEGAL VALUES:
Pour cela saisir les valeurs possibles, dans
l’exemple H et F 1, avec Create New 2 ou faire
référence à une liste existante 3 (Use Existing) :
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
COMMENT LEGAL:
Définit une liste déroulante avec les différentes
valeurs possibles de la variable. Mais, à la
différence de LEGAL VALUES, dans la liste
déroulante, chaque modalité peut être
agrémentée d’un texte précisant le codage.
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
COMMENT LEGAL:
Pour créer cette liste on sépare
simplement modalité à saisir et
commentaire associé par un trait
d’union ( « - » , hyphen en anglais)
dans Data Source. Il s’agit en
quelque sorte de définir un thésaurus
des valeurs possibles de la variable.
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
OPTION:
Avec ce type de zone de saisie, le choix entre les
différentes modalités se fait en cliquant sur le
bouton radio correspondant.
DIFFERENTS TYPES DE CHAMPS ET
CONTROLES DE SAISIE
OPTION:
A la création de ce type de zone de saisie il faut
préciser : la disposition des boutons radio 1,
l’emplacement du texte 2 (à droite ou à gauche
du bouton radio) et surtout le nombre de bouton
radio à créer 3 et le texte associé à chacun 4.
MISE EN FORME DU QUESTIONNAIRE
Une fois les zones de saisie définies il est
important de s’attacher à la présentation du
questionnaire. L’objectif est de le rendre
fonctionnel et attrayant à remplir.
Remarque : Certaines fonctionnalités de mise en forme nécessitent la
sélection simultanée de plusieurs champs : pour cela on dessine un
cadre autour de ces champs en cliquant en haut à gauche de la zone à
délimiter et en maintenant le clic de la souris enfoncé jusqu’au coin
opposé en bas à droite.
MISE EN FORME DU QUESTIONNAIRE
Il est possible de :
- repositionner les champs manuellement par
cliquer / glisser (on peut régler un paramètre
dans le menu Format/Grid Settings : Snap to
grid pour forcer le positionnement de la zone de
saisie à se caler sur la grille (avec 2 choix
possibles en fonction des éléments à aligner :
MISE EN FORME DU QUESTIONNAIRE
Il est possible de :
soit l’intitulé (Snap prompt to grid) soit la zone
de saisie proprement dite (Snap entry field to
grid)) et inversement, si l’on souhaite que
l’élément se positionne exactement à
l’emplacement du curseur de la souris on décoche
Snap to grid.
MISE EN FORME DU QUESTIONNAIRE
MISE EN FORME DU QUESTIONNAIRE
Il est possible de :
- les aligner de manière automatique : on
sélectionne l’ensemble des champs à aligner (cf.
Remarque) puis après un clic droit sur le
formulaire de saisie on choisit le type
d’alignement souhaité.
MISE EN FORME DU QUESTIONNAIRE
MISE EN FORME DU QUESTIONNAIRE
Modifier une zone de saisie
Pour rappeler la fenêtre de définition d’une zone
de saisie il suffit de faire un clic droit sur le
questionnaire au niveau du libellé de la zone de
saisie à modifier : puis de cliquer sur Properties.
Il est alors possible de choisir d’autres
paramètres.
MISE EN FORME DU QUESTIONNAIRE
Supprimer une zone de saisie
Pour supprimer une zone de saisie, faire un clic
droit à son niveau et choisir Delete. On supprime
alors tout ce qui est relatif à cette variable : la
zone de saisie ainsi que les éventuelles données
qui auraient été saisies.
MISE EN FORME DU QUESTIONNAIRE
Create-Edit Forms / Enter Data
Pendant toute la phase de préparation du
formulaire, il est important de le tester sur des
jeux d’essais. Pour cela on bascule du module Create(Edit)
Forms au module Enter Data par le bouton Enter Data de la
barre d’outils. Inversement, pour apporter les améliorations
nécessaires au masque de saisie on bascule du module Enter Data
au module Edit Form par le bouton Edit Form.
MISE EN FORME DU QUESTIONNAIRE
Create-Edit Forms / Enter Data
SAISIE, MODIFICATION ET RECHERCHE
D’ENREGISTREMENTS

Le module Enter Data permet de créer une table


de données à partir d’un formulaire de saisie.
La saisie des données se fait en tapant au clavier
les valeurs souhaitées dans les zones de l’écran
correspondant.
SAISIE, MODIFICATION ET RECHERCHE
D’ENREGISTREMENTS
Le curseur saute de façon automatique d’un
champ au suivant en respectant l’ordre de
tabulation. A la fin de chaque page les données
sont automatiquement enregistrées et, à la fin
du formulaire, un nouveau questionnaire vierge
apparaît prêt à être complété.
PARTIE 2 : ANALYSE DES DONNÉES
ANALYSE DES DONNEES - CLASSIC
Les modules d’Analyse traitent les données
relevées lors de la saisie. Ils permettent
d’afficher, trier, sélectionner, résumer les données
et obtenir des résultats statistiques. Ils
permettent aussi de créer de nouvelles variables
et de les étudier.
ANALYSE DES DONNEES - CLASSIC

La version 7 d’EpiInfo propose deux interfaces


pour l’analyse de données : Classic et Visual
Dashboard. Dans ce cours nous nous
intéresserons au module Classic.
ANALYSE DES DONNEES - CLASSIC
ANALYSE DES DONNEES - CLASSIC
LES COMMANDES DU MODULE ANALYSE

Pour analyser des données avec EpiInfo la


première chose à faire est de préciser les données
à étudier à l’aide de la commande READ.
Ensuite on peut lancer les différentes
commandes pour :
ANALYSE DES DONNEES - CLASSIC
LES COMMANDES DU MODULE ANALYSE
- s’approprier les données : DISPLAY, LIST, SORT
- résumer les données : FREQUENCIES, MEANS, TABLES,
GRAPH,…
- réduire l’échantillon d’étude : SELECT
- créer de nouvelles variables : DEFINE, ASSIGN, RECODE, IF
- gérer les fichiers résultats : ROUTE OUT
- exporter les données : WRITE
-…
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE READ
Cette commande permet de préciser la source de
données à étudier.
C’est la première commande à lancer dans le
module d’Analyse : les commandes qui suivront,
comme, par exemple, lister l’ensemble des
enregistrements, s’appliqueront sur ces données.
ANALYSE DES DONNEES - CLASSIC
ANALYSE DES DONNEES - CLASSIC
ANALYSE DES DONNEES - CLASSIC
IMPORTATION DE DONNEES
EpiInfo permet d’analyser des fichiers de
différents formats : tels les fichiers Access (.mdb
et .accdb), Excel (.xls et .xlsx), des bases MySQL
ou SQL serveur, et des fichiers textes.
ANALYSE DES DONNEES - CLASSIC
IMPORTATION DE DONNEES
Dans EpiInfo, l’importation des données se fait
par l’intermédiaire de la commande Read
(Import).
- L’élément essentiel à préciser est le format des
données : on le sélectionne dans la liste
déroulante Database Type
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE DISPLAY
Cette commande permet d’avoir un aperçu des
variables du fichier en cours d’étude. Elle affiche
notamment leur nom et leur type : sont-elles
considérées comme des variables numériques,
alphanumériques, dates ?
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE DISPLAY
En fonction du type des variables, certains
traitements vont différer. Ce sont donc de
précieuses informations pour s’approprier le
fichier.
On note que l’affichage est différent selon l’origine
de la source de données : Form ou Table
ANALYSE DES DONNEES - CLASSIC
ANALYSE DES DONNEES - CLASSIC
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE LIST
Cette commande permet de lister les données sous forme de tableau.
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE LIST
Tri : Cliquer sur l’entête d’une colonne pour trier
les enregistrements du tableau :
- un premier clic, ordre croissant ou
alphabétique ;
- un deuxième clic : ordre décroissant ou inverse
alphabétique.
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE LIST
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE SORT
Cette commande permet de spécifier l’ordre dans
lequel les enregistrements sont affichés avec la
commande LIST et cela quel que soit le mode
d’affichage choisi. Elle permet de trier les
enregistrements sur les valeurs d’une ou
plusieurs variables.
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE SORT
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE SORT
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE SORT
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE FREQUENCIES
Cette commande permet de produire des tableaux de fréquences.

Interface graphique :
ANALYSE DES DONNEES - CLASSIC
LA COMMANDE FREQUENCIES
STATISTIQUE DESCRIPTIVE
LA COMMANDE MEANS
Cette commande fournit les principales
caractéristiques descriptives d’une variable
quantitative : moyenne, médiane, mode, écart-
type, variance, quartiles, minimum,
maximum,…ainsi que le tableau des fréquences
des valeurs prises par la variable.
STATISTIQUE DESCRIPTIVE
LA COMMANDE MEANS
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
Cette commande permet de sélectionner les
enregistrements qui répondent à un critère
spécifié. Les analyses suivantes ne portent plus
que sur ces enregistrements.
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
Important :
- Le critère de sélection est une condition à tester pour
chaque enregistrement. Les enregistrements
sélectionnés sont ceux pour lesquels la condition est
vraie. Il est possible d’écrire des conditions plus ou
moins complexes comme nous le verrons dans la
page suivante.
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
Important :
- SELECT avec critère de sélection, s’applique sur la
sélection en cours. Par exemple, après avoir
sélectionné les enregistrements concernant les
femmes de plus de 30 ans, si on lance : SELECT
SITE= "CI" pour sélectionner les femmes suivies en
Côte d’Ivoire : on obtient les femmes de Côte d’Ivoire
ayant plus de 30 ans.
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
Important :
- La commande CANCEL SELECT (ou SELECT sans
critère de sélection), annule tous les SELECT
précédents et permet de revenir à l’ensemble des
enregistrements initiaux.
STATISTIQUE DESCRIPTIVE
LA COMMANDE SELECT
Important :
- Il faut toujours s'assurer que la commande SELECT
a bien fonctionné (en regardant la sélection active et
en contrôlant la sélection par des commandes
FREQUENCIES ou LIST).
LA NOTION DE CONDITION
Une condition est une expression évaluée uniquement à
VRAI ou à FAUX.
Les conditions peuvent être utilisées comme critère de
sélection de la commande SELECT et lors de la
création de nouvelles variables (commande IF). Elles
permettent aussi de réaliser des contrôles de saisie
conditionnels.
LA NOTION DE CONDITION
CONDITION ÉLÉMENTAIRE
Une condition élémentaire compare simplement la
valeur d’une variable à une autre valeur à l’aide des
opérateurs de comparaison : AGEINC > 15 est une
condition élémentaire.
LA NOTION DE CONDITION
Les opérateurs de comparaison sont les suivants :
= : égalité
> : supérieur
< : inférieur
<> : différent
>= : supérieur ou égal
<= : inférieur ou égal
LA NOTION DE CONDITION
Exemples :
- CD4VAL<=600 est vérifiée pour les enregistrements
pour lesquels la variable CD4VAL a une valeur d’au plus
600 copies
- DATNAIS=DATE_LAST_BIO est vérifiée pour les
enfants ayant eu un bilan biologique uniquement le jour
de leur naissance (la date de leur dernier bilan
correspond donc à leur jour de naissance)
LA NOTION DE CONDITION
Exemples :
- SITE= "BF" est vérifiée pour les enregistrements
relevés au Burkina Faso ; il est nécessaire d’encadrer de
guillemets (" ") les valeurs non numériques, comme BF,
pour les distinguer des noms de variable
- CD4VAL<>600 est vérifié pour tous les enregistrements
qui n’ont pas 600 en valeur de CD4VAL ; cela comprend
les enregistrements pour lesquels CD4VAL n’a pas de
valeur (est manquant)
LA NOTION DE CONDITION
COMBINAISON DE CONDITIONS
Pour obtenir des conditions plus complexes on
peut combiner les conditions élémentaires en
utilisant les opérateurs logiques :
AND : et
OR : ou
LA NOTION DE CONDITION
COMBINAISON DE CONDITIONS
Si C1 et C2 sont deux conditions :
(C1) AND (C2) : est vérifiée seulement quand
simultanément C1 est VRAI et C2 est VRAI ;
Exemple : (AGEINC>=15) AND
(AGEINC<=25) est vérifiée pour les personnes
d’âge compris entre 15 et 25 ans
LA NOTION DE CONDITION
COMBINAISON DE CONDITIONS
- (C1) OR (C2) : est vérifiée quand au moins une des deux
conditions est vérifiée;
Exemple :(STATUTVIH=1) OR (STATUTVIH=0) est
vérifiée pour les enregistrements pour lesquels on connaît
le statut VIH de l’enfant : infecté ou pas (on exclut ainsi
les enregistrements pour lesquels il est inconnu (9) ou
manquant (.))
LA NOTION DE CONDITION
COMBINAISON DE CONDITIONS
Il est possible d’imbriquer de la sorte plusieurs niveaux
de conditions (en faisant attention à l’emplacement des
parenthèses).
Exemple : ((CD4VAL<600) OR (STATUTVIH=1)) AND
(SITE="CI") est vérifiée pour les personnes interrogées
en Côte d’Ivoire ayant soit moins de 600 copies de CD4,
soit un enfant atteint de VIH.
LA NOTION DE CONDITION
Interface graphique
Que ce soit au niveau de la commande SELECT ou dans
IF l’interface graphique qui permet de saisir la condition
comprend les éléments suivants :
ANALYSE BIVARIEE
LA COMMANDE TABLES
Cette commande fournit le tableau croisé entre
deux variables qualitatives et teste
l’indépendance des deux variables.
ANALYSE BIVARIEE
LA COMMANDE TABLES
ANALYSE BIVARIEE
ANALYSE BIVARIEE
ANALYSE BIVARIEE

Ces tests ne mettent pas en évidence d’association entre lieu de


suivi des mères et décès des enfants (p>0,05) (se référer au module
statistique correspondant pour de plus amples explications)
ANALYSE BIVARIEE
LA COMMANDE MEANS
Cette commande compare les moyennes d’une
variable quantitative dans différents groupes
définis par les modalités d’une variable
qualitative.
ANALYSE BIVARIEE
LA COMMANDE MEANS
ANALYSE BIVARIEE

BF et CI sont les deux modalités de la variable SITE et définissent donc les deux
groupes de comparaisons. Moyenne, écart-type, quartiles, etc. de AGEINC sont
calculés séparément d’une part pour les enregistrements pour lesquels SITE vaut
BF, d’autre part quand elle vaut CI.
ANALYSE BIVARIEE
GESTION DES RESULTATS D’ANALYSE
A l’écran :
Lors de l’exécution de chaque commande, les
résultats des analyses s’affichent à l’écran dans
la zone prévue à cet effet (en haut à droite 1).
GESTION DES RESULTATS D’ANALYSE
GESTION DES RESULTATS D’ANALYSE
Pour consulter l’ensemble des résultats obtenus
depuis le lancement du module d’Analyse on
peut :
- soit utiliser les ascenseurs 2,
- soit encore, plus simplement, naviguer à l’aide
des boutons au-dessus de l’écran.
GESTION DES RESULTATS D’ANALYSE
Conserver les résultats d’analyse:
Il est essentiel de conserver des traces des
analyses de données afin de rédiger le compte-
rendu qui pourra être archivé ou diffusé soit
sous forme imprimable soit via internet.
GESTION DES RESULTATS D’ANALYSE
Conserver les résultats d’analyse:
Pour cela, ponctuellement, on peut inclure
directement les résultats obtenus dans un
fichier texte : en faisant un copier/coller depuis
la fenêtre Résultat du module d’Analyse vers
un fichier de traitement de texte (Word de la suite
Microsoft Office ou Writer de la suite LibreOffice par exemple).
GESTION DES RESULTATS D’ANALYSE
Fichiers de résultats:
D’autre part, EpiInfo enregistre les résultats
d’analyse dans des fichiers hypertextes. Ils sont
enregistrés par défaut dans le dossier Output
du dossier Epi Info 7.
GESTION DES RESULTATS D’ANALYSE
Fichiers de résultats:
Leur nom commence par OUTPUT suivi d’un
numéro d’ordre (fonction des fichiers déjà créés)
et ils ont l’extension : .HTML.
GESTION DES RESULTATS D’ANALYSE
Fichiers de résultats

EpiInfo crée un nouveau fichier de résultats dès


que l’analyse ne porte plus sur le même fichier
de données et donc à chaque commande
READ. En travaillant dans le module d’analyse
vous en avez créés un certain nombre et vous
pouvez aller consulter ces fichiers.
Module StatCalc d’Epi Info
StatCalc: Calculateurs statistiques
Six types de calculs sont disponibles dans StatCalc

1. Tableaux (2 x 2) – Aussi bien les tableaux


simples que les tableaux stratifiés 2 x 2 peuvent
être analysés pour produire des mesures
d’association (chi2, RC, RR, etc.) avec leurs
intervalles de confiance (si applicable).
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)
Des tableaux uniques de 2 x 2 sont fréquemment
utilisés en épidémiologie pour explorer les
associations entre l’exposition aux facteurs de
risque et la maladie ou d’autres facteurs.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)
Les valeurs dans les cellules doivent être des
chiffres représentant le nombre
d’enregistrements répondant aux spécifications
dans les lignes et colonnes « Exposition et
Résultat ».
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

Une étude cas-témoin est une étude dans laquelle


les malades et les personnes bien portantes sont
sélectionnés et le nombre de personnes exposées et
non exposées est ensuite déterminé.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

Dans une étude de cohorte, les sujets exposés et non


exposés sont sélectionnés et le nombre de malades
dans chaque groupe est déterminé par la suite.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

Une étude transversale commence sans que la


maladie ou l’exposition ne soit déterminée, et
vérifie les deux pendant l’étude.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

Dans les études de cohortes, le RR peut être calculé


à partir des résultats.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

Dans les études cas-témoins, le RC peut être utilisé


comme approximation du RR si la maladie est rare
dans la population générale à partir de laquelle les
cas et les témoins sont sélectionnés.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

En général, une association est suggérée par un


RC ou un RR avec un intervalle de confiance
supérieur ou inférieur à 1.
StatCalc: Calculateurs statistiques
1. Tableaux (2 x 2)

Plus le RC ou le RR est loin de 1, plus


l’association apparente est forte. La
significativité statistique peut être évaluée par
des valeurs p pour le chi carré et les tests exacts
de Fisher qui sont petits, <0.05; ou limites de IC
pour le RC qui n’incluent pas 1.
StatCalc: Calculateurs statistiques
StatCalc: Calculateurs statistiques
StatCalc: Calculateurs statistiques
Il est tout d’abord important de remarquer
que les résultats fournis par Epi-Info font
apparaître deux parties de résultats
✓ la première partie concerne les estimations de mesures
d’association et leur intervalle de confiance,
✓ la seconde partie donne les résultats issus des
différents tests statistiques utilisables.
StatCalc: Calculateurs statistiques
Epi-Info fournit un ensemble de résultats qui
ne doivent pas être tous utilisés.
❖ Par exemple vous devez faire attention et tenir compte
uniquement de la mesure d’association correspondant
au schéma de l’étude analysée;
❖ De même avant d’utiliser les résultats des tests
statistiques vous devez vérifier la validité des
conditions initiales (par exemple les effectifs
théoriques sont-ils tous supérieurs à 5 pour pouvoir
utiliser le test du chi2).
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

La stratification d’un ensemble de données


sépare la population en catégories distinctes
en fonction des niveaux d’un paramètre (âge, sexe,
facteurs environnementaux ou catégorie socio-professionnelle). En cas
de confusion, les associations entre la maladie
et l’exposition peuvent être manquées ou
faussement détectées.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

Un facteur de confusion est celui qui est


associé à la maladie et à l’exposition, mais qui
peut ne pas être observé. L’âge est un facteur
de confusion fréquent, bien que tout autre
facteur que l’exposition principale considérée
puisse être traité comme un facteur de
confusion.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

On dit que le tiers facteur T modifie l’effet de


l’exposition E sur la maladie M (ou est un
facteur modificateur d’effet) si l’effet de E sur
M est différent selon les modalités
(strates) de la variable T.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

Facteur modificateur d’effet


Concrètement, cela signifie que la mesure
d’association (RR ou RC) entre l’exposition E
et la maladie M est différente selon les strates
définies par les modalités de la variable T.
Il est donc important de présenter la mesure et le test
d’association séparément dans chaque strate.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

Le RC pondéré Mantel-Haenszel, le RR, le


chi carré et les calculs de la p-valeur
combinent les résultats de différentes strates
pour éliminer la confusion causée par les
variables utilisées pour la stratification.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

Si des tableaux sont créés pour les hommes et


les femmes, la modification d’effet par le sexe
est supprimée. Le degré de modification d’effet
peut être évalué en comparant les RC bruts et
pondérés. Si les rapports sont identiques, il n’y
a pas de modification d’effet par le sexe.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

Si le RC ou les RR pour les strates dans une série


de tableaux stratifiés pour les tests ne sont pas
semblables, il y a alors interaction entre le
facteur de stratification et le facteur de risque.
StatCalc: Calculateurs statistiques
StatCalc: Calculateurs statistiques
StatCalc: Calculateurs statistiques
StatCalc: Calculateurs statistiques
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2

Le RC pour chaque tableau est de 1,0, et le RC ajusté de


Mantel est de 1,0. Le RC brut et le RC de Mantel-
Haenszel sont très différents (2,26 et 1,0), on conclut que
le tabagisme était un facteur de confusion et qu’il semble y
avoir d’association (RC = 2,26) entre l’alcool et l’IM
dans cet exemple.
StatCalc: Calculateurs statistiques
2. Analyse stratifiée de tableaux 2 x 2
Notez que le RC dans les deux strates est le même (1,0).
Le tabagisme ne modifie donc pas l’effet de l’alcool sur la
survenue de l’infarctus du myocarde dans cet exemple. En
d’autres termes, l’effet de l’alcool sur l’IM est le même pour
les fumeurs et les non-fumeurs. Lorsque l’effet varie dans
les différentes strates (les RC sont différents), l’interaction
ou la modification de l’effet est présente.
Merci

Vous aimerez peut-être aussi