Académique Documents
Professionnel Documents
Culture Documents
Biostat 1
Biostat 1
Email: yacinoargelino@gmail.com
Qu’est-ce que les statistiques ?
La statistique est l'une des disciplines les plus connues qui se concentre
principalement sur la collecte, l'organisation, l'analyse, l'interprétation et la
visualisation des données. Auparavant, les statistiques étaient pratiquées par les
statisticiens, les économistes et les chefs d'entreprise pour calculer et représenter
les données pertinentes dans leur domaine. Aujourd'hui, les statistiques jouent un
rôle central dans divers domaines tels que la science des données, l'apprentissage
automatique, l'analyse des données, l'analyse de l'intelligence économique,
l'informatique et bien d'autres encore.
• Univarié : Mesure effectuée sur une variable par sujet. Par exemple, nous
pouvons déterminer le type de transmission, automatique (A) ou manuelle
(M), sur chacune des dix automobiles récemment achetées chez un certain
concessionnaire, ce qui donne l’ensemble de données catégorielles M A A A A
MAAMA
• Bivarié : Mesure effectuée sur deux variables par sujet. Par exemple, notre
ensemble de données peut consister en une paire (taille, poids) pour chaque
joueur de basket-ball d’une équipe, la première observation étant (72, 168),
la seconde (75, 212), et ainsi de suite).
(a) Le choix d'un parti politique est mesuré sur une échelle nominale. Les noms des partis
n'ont pas d'ordre naturel.
(b) Typiquement, le niveau d'un jeu informatique est mesuré sur une échelle ordinale : par
exemple, le niveau 10 peut être plus difficile que le niveau 5, mais cela n'implique pas que
le niveau 10 soit deux fois plus difficile que le niveau 5, ou que la différence de difficulté
entre les niveaux 2 et 3 soit la même que la différence entre les niveaux 10 et 11.
(c) Le temps de production d'une voiture est mesuré sur une échelle continue (échelle de
rapport). En pratique, il peut être mesuré en jours à partir du début de la production.
(d) Cette variable est mesurée sur une échelle continue (échelle de rapport). En général,
l'âge est saisi en années à partir du jour de la naissance.
(e) L'année calendaire est une variable continue mesurée sur une échelle d'intervalle. Il
convient de noter que l'année que nous définissons comme "zéro" est arbitraire et qu'elle
varie d'une culture à l'autre. Comme l'année zéro est arbitraire et que nous avons aussi des
dates antérieures à cette année, l'année calendaire est mesurée sur une échelle d'intervalle.
Solution to Exercise 3
(f) L'échelle est continue (échelle de rapport).
(g) L'échelle des numéros d'identification est nominale. Le numéro d'identification peut en
effet être composé de chiffres ; cependant, "112233" ne se réfère pas à quelque chose de
moitié moins/bon que "224466". Le numéro est descriptif.
(h) Le classement final est mesuré sur une échelle ordinale. Les classements peuvent être
clairement ordonnés et les participants peuvent être classés en utilisant leurs résultats
finaux. Cependant, le premier gagnant peut ne pas avoir "le double" de la beauté du
deuxième gagnant, il s'agit simplement d'un classement.
(i) Le quotient intellectuel est une variable sur une échelle continue. Il est construit de
manière à ce que les différences soient interprétables, c'est-à-dire qu'être 10 points au-
dessus ou 10 points au-dessous du score moyen de 100 points signifie le même écart par
rapport à la moyenne. Cependant, les ratios ne peuvent pas être interprétés, c'est pourquoi
le quotient intellectuel est mesuré sur une échelle d'intervalles.
TD Exercise 4
Examinez les questions de recherche qui consistent à décrire les attitudes des
parents à l'égard de la vaccination, la proportion d'entre eux qui souhaitent que
leur dernier enfant soit vacciné contre la varicelle, et si cette proportion diffère
en fonction du sexe et de l'âge.
(b) Comment saisir les attitudes à l'égard de la vaccination en une seule variable ?
(c) Quelles sont les variables nécessaires pour répondre à toutes les questions ci-
dessus ? Décrivez l'échelle de chacune d'entre elles.
(a) Le modèle d'étude approprié est l'enquête. Les informations seraient obtenues
par le biais d'un questionnaire remis à un échantillon de parents. Il ne s'agit pas
d'une expérience contrôlée car nous ne manipulons pas une variable particulière
tout en contrôlant les autres ; nous recueillons plutôt des données sur toutes les
variables d'intérêt.
(b) Il existe différentes options pour connaître l'attitude des parents : bien sûr, on
pourrait simplement demander "que pensez-vous de la vaccination ?"; cependant,
la saisie de longues réponses dans une variable "attitude" peut rendre difficile la
synthèse et la distillation des informations obtenues. Une façon courante de traiter
ces variables est de traduire un concept en un score : par exemple, on peut poser 5
questions de type "oui/non" (au lieu d'une question générale) qui concernent les
attitudes à l'égard de la vaccination, telles que "pensez-vous que la vaccination
peut être nocive pour votre enfant ? ou "êtes-vous d'accord pour dire qu'il est
prioritaire de vacciner les nourrissons au cours de leur première année de vie ?" Le
nombre de réponses montrant une attitude positive à l'égard de la vaccination
peut être résumé. S'il y a 5 questions, il y a jusqu'à 5 points "à gagner". Ainsi,
chaque parent peut se voir poser 5 questions et son attitude peut être résumée sur
une échelle allant de 0 à 5, en fonction des réponses données.
Solution to Exercise 4
• Attitude : il est possible que plusieurs variables soient nécessaires pour saisir les
informations des parents dans un score, voir (b) pour plus de détails. L'échelle est
ordinale car un score plus élevé correspond à une attitude plus positive à l'égard de
la vaccination, mais les différences entre les différents niveaux de score ne peuvent
pas être interprétées de manière significative.
- Vacciné : variable binaire (de type "oui-non") indiquant si le parent accepte ou non
que son plus jeune enfant soit vacciné contre la varicelle. Il s'agit d'une variable
nominale.
- Sexe : pour comparer "vacciné" pour les parents de sexe masculin et féminin. Il
s'agit d'une variable nominale.