Académique Documents
Professionnel Documents
Culture Documents
savez pas comment analyser vos données de recherche ? Alors j’ai une bonne nouvelle pour
vous : dans ce cours vous apprendrez à analyser vos données de recherche grâce au logiciel
Epi-info.
Epi Info™ est un ensemble logiciel relevant du domaine public, conçu pour la communauté
mondiale des praticiens et des chercheurs du secteur de la santé publique. Il permet d’élaborer
en toute facilité des questionnaires et des bases de données, de saisir et d’analyser des
données et de produire des statistiques épidémiologiques, des graphiques et des cartes.
Epi Info 7 est une série d'outils et d'utilitaires librement distribuables pour Microsoft
Windows destinés aux professionnels de la santé publique pour mener des enquêtes sur les
épidémies, gérer des bases de données pour la surveillance de la santé publique et d'autres
tâches, ainsi que des applications générales de base de données et de statistiques. Il permet
aux médecins, épidémiologistes et autres responsables de la santé publique et médicaux
d'élaborer rapidement un questionnaire ou un formulaire, de personnaliser le processus de
saisie des données et de saisir et analyser les données.
Epi Info 7 est gratuit (disponible que sur le système d’exploitation Windows) et peut être
téléchargé à partir du site Web de la CDC (Centers for Disease Control and Prevention) à l'
adresse (https://www.cdc.gov/epiinfo). Retrouver la procédure de téléchargement et
installation dans la vidéo.
Epi-info comprend 4 grande partie qui permette de collecter, analyser et visualiser les
données :
Create Forms – Create a questionnaire using one or more forms to collect and view data.
Enter Data – Enter data and view existing records.
Analyze Data (Classic and Visual Dashboard) – Manage data, run statistical analyses, and
generate lists, tables, graphs, and charts.
Create Maps – Create maps from map server, KLM files, or shape files.
Available utilities include:
StatCalc – Compute statistics from summary data.
Help – Find online and offline resources: including a “discussion forum” and “help desk”
information.
Options – Configure default settings on the following tabs: general, language, analysis, plug-
ins, and web survey.
StatCalc : calculatrices statistiques
StatCalc est un calculateur statistique qui produit des informations épidémiologiques
récapitulatives. Les données récapitulatives n'ont pas besoin d'être contenues dans un projet
Epi Info™ 7 ou saisies dans un autre outil.
Intro StatCalc
OpenEpi.com – Outil Web open source qui fournit des statistiques épidémiologiques
supplémentaires.
Ouvrir StatCalc
2. Sélectionnez l'un des outils suivants dans la liste déroulante : Taille et puissance de
l'échantillon, Chi carré pour la tendance, Tableaux (2 x 2, 2 xn), Poisson (événement
rare par rapport à la norme), Binomial (proportion par rapport à la norme. ) ou Étude
cas-témoin de paires appariées. Ces outils sont également disponibles en appuyant sur
la touche correspondante du clavier qui correspond à la première lettre de chaque
option. Si vous sélectionnez un outil à l'aide du clavier, l'outil apparaît
immédiatement.
3. Saisissez des données pour chaque type de calcul. Les calculs sont effectués au fur et à
mesure que les données sont entrées dans chaque cellule.
4. Pour modifier les valeurs déjà saisies, utilisez la touche Tab ou cliquez sur la cellule et
saisissez les nouvelles informations.
Imprimer
Tous les résultats produits à partir de StatCalc peuvent être imprimés dans Epi Info™ en
cliquant avec le bouton droit et en sélectionnant Imprimer dans le menu contextuel.
Les valeurs dans les cellules doivent être des nombres représentant le nombre
d'enregistrements répondant aux spécifications des lignes et colonnes Exposition et
Résultat.
Une étude cas-témoins est une étude dans laquelle les individus malades et bien
portants sont sélectionnés et le nombre d'individus exposés et non exposés est ensuite
déterminé. Dans une étude de cohorte, les exposés et les non exposés sont sélectionnés
et le nombre de malades dans chaque groupe est ensuite déterminé. Une étude
transversale commence sans détermination de la maladie ni de l'exposition, et vérifie
les deux au cours de l'étude.
Dans les études de cohorte, le risque relatif peut être calculé à partir des
résultats. Dans les études cas-témoins, le rapport de cotes peut être utilisé comme une
approximation du rapport de risque si la maladie est rare dans la population générale à
partir de laquelle les cas et les témoins sont sélectionnés.
Pour des résultats valides, les résultats de chaque enregistrement doivent être
indépendants de ceux des autres enregistrements. Les valeurs d'un individu ne peuvent
pas être utilisées pour prédire celles d'un autre. La confusion doit être supprimée en
stratifiant les variables de confusion.
Des tableaux uniques 2 x 2 sont fréquemment utilisés en épidémiologie pour explorer les
associations entre les expositions aux facteurs de risque et la maladie ou d'autres résultats.
Étant donné un oui-non ou une autre réponse à deux choix décrivant la maladie et une autre
décrivant l'exposition à un facteur de risque, StatCalc produit plusieurs types de statistiques
qui testent les relations entre l'exposition et la maladie.
Généralement, une association est suggérée par un rapport de cotes ou un rapport de risque
avec un intervalle de confiance supérieur ou inférieur à 1,0.
Remarque : Les intervalles de confiance sont désignés par les colonnes inférieure et
supérieure dans les tableaux statistiques.
Plus le rapport de cotes ou le rapport de risque est éloigné de 1,0, plus l'association apparente
est forte. La signification statistique peut être évaluée par des valeurs de p pour les tests chi
carré et exact de Fisher qui sont petites, <.05 ; ou des limites de confiance pour le rapport de
cotes qui n'incluent pas 1,0.
La valeur attendue d'une cellule est le produit des totaux marginaux de cette cellule divisé par
le total général du tableau. Si une valeur attendue est inférieure à cinq, il est recommandé
d'utiliser les résultats du test exact de Fisher et les limites de confiance exactes. Si les
nombres dans le tableau sont tous grands, les autres tests devraient indiquer à peu près le
même résultat.
Exemple de tableaux
L'exemple suivant examine une étude hypothétique explorant la relation entre l'utilisation
d'édulcorants artificiels et le cancer de la vessie.
Figure 10.4 : Données de table unique 2 x 2
Le rapport de cotes de 1,02 et les limites de confiance qui incluent 1,0 ne fournissent aucune
preuve d'une association entre l'utilisation d'édulcorants et le cancer de la vessie
(Schlesselman JJ. Case-control studies. New York : Oxford University Press, 1982).
Analyse stratifiée de 2 x 2 tables
La stratification d'un ensemble de données sépare la population en catégories distinctes en
fonction des niveaux d'un paramètre (c'est-à-dire le sexe). En cas de confusion, les
associations entre la maladie et l'exposition peuvent être manquées ou faussement
détectées. Un facteur de confusion est celui qui est associé à la maladie et à l'exposition, mais
qui peut ne pas être intéressant ou observé. L'âge est un facteur de confusion fréquent, bien
que tout facteur autre que l'exposition principale considérée puisse être considéré comme un
facteur de confusion.
La stratification consiste à créer un tableau séparé de la maladie par exposition pour chaque
combinaison de facteurs de confusion possible. Dans le cas le plus simple, cela pourrait
signifier des tableaux masculins et féminins séparés si le sexe est le facteur de confusion
potentiel. Si l'âge, le sexe et la ville sont des facteurs de confusion, des tableaux séparés
seront créés pour chaque combinaison possible de groupe d'âge, de sexe et de ville.
Si les rapports de cotes ou les rapports de risque pour les strates dans une série de tableaux
stratifiés pour les tests ne sont pas similaires, alors une interaction entre le facteur de
stratification et le facteur de risque est présente.
Exemple
L'exemple suivant étudie la relation entre l'alcool et l'infarctus du myocarde (Relationship
Between Alcohol Consumption and Myocardial Infarction (MI): Confounding Due to
Smoking Hypothetical Data, Schlesselman JJ. Case-control studies. New York: Oxford
University Press, 1982).
Le rapport de cotes pour chaque table est de 1,0 et le rapport de cotes ajusté du résumé de
Mantel est de 1,0. Le rapport de cotes brut et le rapport de cotes sommaire de Mantel-
Haenszel sont assez différents (2,26 et 1,0), concluant que le tabagisme était un facteur de
confusion et qu'il ne semble pas y avoir d'association (rapport de cotes = 1,0) entre l'alcool et
l'IM dans cet exemple. Notez que le rapport de cotes dans les deux strates est le même (1,0). Il
n'y a pas d'interaction ou de modification d'effet entre le tabagisme et l'alcool. En d'autres
termes, l'effet de l'alcool sur l'IM est le même pour les fumeurs et les non-fumeurs. Lorsque
l'effet varie dans les différentes strates (les rapports de cotes sont différents), une interaction
ou une modification de l'effet est présente.
Remarque : Les résultats récapitulatifs n'apparaissent que dans les ensembles de données
stratifiées (les résultats récapitulatifs montrent des résultats ajustés en fonction des critères
de stratification).
Exemple
L'exemple suivant examine si la prévalence réelle des anticorps anti-VIH dans une population
est de 10 %. Un échantillon aléatoire ou systématique de la population est prévu pour estimer
la prévalence. La taille d'échantillon souhaitée sera en mesure d'identifier la prévalence du
VIH avec une marge d'erreur de +/- 3%. L'application affichera la taille de l'échantillon pour
plusieurs niveaux de confiance différents.
La colonne Échantillon total est le produit de la taille du cluster et des clusters. Chaque ligne
désigne la taille d'un échantillon requis pour atteindre le niveau de confiance nécessaire. La
détermination de la taille de l'échantillon n'est qu'un guide approximatif. De nombreux autres
facteurs (par exemple, le coût, le nombre de sujets disponibles, le taux de non-réponse et
l'exactitude des réponses et de la transcription des données) doivent être pris en compte dans
la conception de l'étude.
Cohorte et transversal
L'étude de cohorte et transversale calcule la taille d'échantillon recommandée pour une étude
en fonction d'un ensemble de paramètres et du niveau de confiance souhaité.
Exemple
L'exemple suivant montre comment calculer une taille d'échantillon pour une étude de cohorte
ou transversale. L'application affichera trois estimations de taille d'échantillon différentes
selon trois calculs statistiques différents.
L'étude cas-témoins non appariés calcule la taille d'échantillon recommandée pour une étude
en fonction d'un ensemble de paramètres et du niveau de confiance souhaité.
Exemple
L'exemple suivant montre comment calculer une taille d'échantillon pour une étude cas-
témoins non apparié. L'application affichera trois estimations de taille d'échantillon
différentes selon trois calculs statistiques différents.
La fonction Chi carré pour la tendance calcule le rapport de cotes, le chi carré pour la
tendance linéaire et les statistiques de valeur p en fonction de la réponse à un score
d'exposition et si le patient est tombé malade. Le score d'exposition est un résultat mesuré à
partir d'une étude qui indique le niveau d'exposition que le patient a reçu. A titre d'exemple, 0
= aucune exposition, 1 = exposition modérée, 2 = exposition significative. Les valeurs saisies
dans la colonne Score d'exposition doivent être numériques. Saisissez le nombre de patients
malades pour chaque score d'exposition dans la colonne Cas. Entrez le nombre de patients qui
ne sont pas malades pour chaque score d'exposition dans la colonne Contrôles. Le rapport de
cotes, le chi carré pour la statistique de tendance linéaire et la valeur p pour le chi carré sont
calculés automatiquement.
Poisson
Pour analyser la distribution de Poisson, entrez le nombre attendu de résultats positifs dans
Nombre attendu d'événements et la valeur des résultats positifs dont vous souhaitez
déterminer la probabilité dans Nombre observé d'événements.
Binôme
La distribution binomiale indique la probabilité qu'un certain nombre de résultats positifs se
produisent étant donné le pourcentage attendu de résultats positifs et le nombre total
d'observations effectuées.
Exemple
Supposons que 23,5 % des individus d'une population de patients donnée soient
séropositifs. Si 16 personnes sont sélectionnées parmi cette population de patients, quelles
sont les chances qu'au moins huit de ces personnes soient séropositives ?
L'étude cas-témoins par paires appariées calcule la relation statistique entre les expositions et
la probabilité de tomber malade dans une population de patients donnée. Cette étude est
utilisée pour rechercher la cause d'une maladie en sélectionnant une personne non malade
comme témoin et en associant le témoin à un cas. Le champ peut être associé à un ou
plusieurs critères.
Les cases multicolores qui apparaissent à droite du tableau après la saisie des données
représentent la proportion de chaque valeur saisie dans la population de l'échantillon. Les
statistiques sous le tableau sont calculées automatiquement et fournissent une base pour
déterminer la relation entre l'élément d'exposition et un patient tombant malade.
Exemple
Les tests McNemar et McNemar corrigé sont des tests du chi carré avec des valeurs p
associées.
Les tests d'association exacts de Fisher sont des valeurs p. Des tests exacts doivent être
utilisés lorsque le nombre de cellules est faible.
Pour ajouter un gadget StatCalc au tableau de bord, cliquez avec le bouton droit sur le canevas
et sélectionnez Ajouter une calculatrice StatCalc .
Tous les autres gadgets StatCalc peuvent être ajoutés au tableau de bord visuel avec des
processus similaires et exécutent les mêmes fonctions dans StatCalc que dans le tableau de
bord visuel.