Biostatistique 1-Introduction

Université Sultan Moulay Slimane
Faculté des Sciences et Techniques

Béni Mellal
Biostatistique
I. Introduction
Licence Sciences et Techniques:
Protection de l’environnement
Option : Sciences de l’environnement
2020-2021
M. MERZOUKI
m.merzouki@usms.ma
INTRODUCTION
M.MERZOUKI
citations sur la statistique
« Il y a trois sortes de mensonges :

les mensonges, les sacrés mensonges et les
statistiques."
Mark Twain
(1835 - 1910)
M.MERZOUKI 4
"Il est facile de mentir avec les statistiques,
mais il est difficile de dire la vérité sans
elles "
Andrejs Dunkels
(1939 - 1998)
M.MERZOUKI 5
"Appeler un statisticien après que l’expérience
soit terminée c’est comme lui demander de faire
une autopsie; il pourra seulement déterminer la
cause de l’échec de l’expérience."
Sir Ronald Fisher

(1890 -1962)
M.MERZOUKI 6
Tirage de journaux concurrents
Le graphique suivant est paru en 1981 dans le New Yorker Post, sous le titre « Ascension du Post, le
quotidien préféré des New-Yorkais ».
1 900 000 Le but de ce graphique est de convaincre le lecteur que la croissance
1 800 000
du tirage du Post va bientôt l’amener en première position, devant le
NEWS News qui périclite
1 700 000
1 600 000
On remarque deux artifices utilisés pour exagérer la tendance :
1 500 000
800 000
1.L’échelle verticale ne démarre pas en zéro.
700 000
C’est une présentation acceptable, mais qui renforce les variations
600 000 apparentes.
POST
500 000
1977 1978 1979 1980 1981 1982 2.L’échelle verticale est discontinue.
M.MERZOUKI 7
Une telle présentation ne serait admissible que si la discontinuité de l’échelle était clairement indiquée, par
exemple par des pointillés :
La version correcte, plus « honnête », du graphique,

1 900 000 est la suivante :
1 800 000
2 000 000
NEWS
1 700 000
NEWS
Le nombre d’exemplaires
1 600 000 1 500 000
1 500 000
1 000 000
800 000
POST
700 000
500 000
600 000
POST
500 000 0
1977 1978 1979 1980 1981 1982 1977 1978 1979 1980 1981
année
On constate immédiatement qu’il reste au Post bien du chemin à parcourir avant d’accéder à la première
place. M.MERZOUKI 8
Le paradoxe de Simpson
FUMER, C’EST BON POUR LA SANTÉ
Dans une étude sur le tabagisme, 1314

TAUX DE MORTALITÉ
femmes ont été suivies pendant 20 ans, et
31 %
l’objectif était de comparer le taux de
mortalité des fumeuses et des non- 24 %
fumeuses.
Après 20 ans, le taux de mortalité chez les
fumeuses était de 24%, alors que celui
des non-fumeuses était 31%. Alors, est-
ce que non-fumer tue ?

FUMEUSES NON FUMEUSES
M.MERZOUKI 9
Age 18 - 24 25 - 34 35 - 44 45 - 54 55 - 64 64 - 74 75+
Smoker? + - + - + - + - + - + - + -
Dead 2 1 3 5 14 7 27 12 51 40 29 101 13 64
Alive 53 61 121 152 95 114 103 66 64 81 7 28 0 0
total 55 62 124 157 109 121 130 78 115 121 36 129 13 64 1314
death Rate% 4 2 2 3 13 6 21 15 44 33 81 78 100 100
M.MERZOUKI 10
taux de mortalité%
120
100
80
60
40
20
Si on raisonne par classe d’âge, dans chaque tranche la mortalité chez les fumeuses est supérieure à celle
des non-fumeuses.
Mais comment les chiffres peuvent-ils s’inverser quand on groupe tout le monde ?
M.MERZOUKI 11
1° dans la population initiale, il y a beaucoup plus de femmes âgées non-fumeuses que fumeuses.
2° dans chaque tranche d’âge les fumeuses meurent plus .
3° mais les âgées meurent de toutes façons beaucoup plus que le jeunes, qu'elles fument ou
pas .
4° comme il y a beaucoup plus d’âgées que de jeunes dans cette étude; la mortalité sera du peut
être à l'âge et pas au tabac .
M.MERZOUKI 12
Pour que le paradoxe se produise, il faut 2 ingrédients :
❖ Premièrement il faut une variable qui influe sur le résultat final (le « groupe »), et qui n’est pas
forcément explicitée au départ. On appelle cela un facteur de confusion. Il s’agit de l’âge des
personnes lequel évidemment joue sur la mortalité.
❖ Deuxièmement, il faut que l’échantillon qu’on étudie ne soit pas distribué de manière homogène : il y
a plus de vieilles femmes dans l’échantillon des non-fumeuses que chez les fumeuses.
M.MERZOUKI 13
CALCULS RÉNAUX : QUEL TRAITEMENT CHOISIR ?
Selon une étude médicale sur le succès de deux traitements contre les calculs rénaux permet de voir le
paradoxe sous un autre angle.
Cette table montre que B est plus efficace.
Taux de succès (succès/total)
Traitement A Traitement B
78 % (273/350) 83 % (289/350)
M.MERZOUKI 14
Cette table montre le succès des traitements A et B pour soigner petits et gros calculs :
Succès en fonction de la taille des calculs
petits calculs gros calculs

Traitement A Traitement B Traitement A Traitement B
93 % (81/87) 87 % (234/270) 73 % (192/263) 69 % (55/80)
Ce qui crée le paradoxe, et l'impression erronée que B est globalement plus efficace, c'est que le
traitement A a été donné beaucoup plus souvent pour les gros calculs, qui sont plus difficiles à
soigner. Le rebroussement de cette inégalité, qui conduit au paradoxe, se produit à cause de deux
effets concurrents :
M.MERZOUKI 15
1. La variable supplémentaire (ici la taille des calculs) a un impact significatif sur les rapports, elle a une
influence en même temps sur le choix du traitement ( les calculs de taille élevée ont été plus souvent
traités par le traitement A) et sur le résultat du traitement (les calculs de taille élevée sont plus
difficiles à soigner). Cette variable est appelée facteur de confusion.
2. Les tailles des groupes qui sont combinés quand la variable supplémentaire est ignorée sont très
différentes.
M.MERZOUKI 16
TERMINOLOGIE
• Ensemble de données d'observation relatives à un groupe d'individus ou d'unités (souvent

pluriel).
• Ensemble des méthodes qui ont pour objet la collecte, le traitement et l'interprétation de
ces données.
• Ensemble des données numériques concernant un phénomène quelconque et dont on tire
certaines conclusions.
• Variable aléatoire, fonction des observations, construite à partir d'un échantillon. (Ainsi, la
moyenne d'un échantillon est une statistique.)
Dictionnaire La Rousse
M.MERZOUKI
Statistiques & statistique
Les statistiques sont un ensemble de données et de valeurs relatives à un phénomène
déterminé sous forme de tableaux, de listes ou de chiffres permettant de caractériser et
comparer des faits et d'analyser leur évolution.
La statistique (au singulier) est l'ensemble des méthodes servant à mesurer,
organiser, analyser et interpréter les données, les observations, les expériences et les résultats.
M.MERZOUKI
Statistique
Statistique descriptive Statistique inférentielle
Permet de vérifier des

Permet de résumer
hypothèses et de formuler des
l'information contenue dans un
lois générales selon une
ensemble de données et ainsi démarche inférentielle.
faciliter sa transmission.
D'une manière générale et sur le plan méthodologique, la statistique descriptive
précède la statistique inférentielle mais les deux aspects de la statistique sont
complémentaires et chacun répond à des besoins particuliers.
M.MERZOUKI
Inférence
L’inférence est un raisonnement par
induction que l’on fait à partir
d’informations récoltées sur un
échantillon afin de les généraliser à la
population associée à cet échantillon.
M.MERZOUKI
Prix payé aux planteurs
Les conditions d'achat des betteraves par les sucreries sont réglementées par l'État de f
açon détaillée. Selon ces règles, la betterave est achetée sur la base de son poids utile et
de sa teneur en sucre.
Les différentes caractéristiques de l'échantillon permettent de déterminer le poids
utile du silo planteur et sa richesse moyenne en sucre, donc les éléments constitutifs
du prix.
M.MERZOUKI
Inférence
 connue
 connu
Echantillon
x inconnue Quelle que soit la décision, elle

s inconnu découlera d’une inférence. On attribue
Population aux betteraves collectées les
caractéristiques de l’échantillon
analysé.
M.MERZOUKI
L’inférence statistique est nécessaire tout simplement parce que la plupart du temps
nous étudions les population par le biais des échantillons représentatifs avec une
marge d’erreur.
La statistique inférentielle à pour objectif de mesurer le degré d’erreur de l’estimation,
M.MERZOUKI
La statistique descriptive est un ensemble de méthodes permettant de décrire, présenter,
résumer des données souvent très nombreuses. Ces méthodes peuvent être numériques (tris,
élaboration de tableaux, calcul de moyennes…) et/ou mener à des représentations graphiques.
La biostatistique est l'application de la statistique à un large éventail de sujets en biologie.

La biostatistique consiste au développement et l'application d'outils statistiques dans :
• La conception des expériences,
• La collecte et la présentation des données,
• L'analyse et l'interprétation des données recueillies en vue de tirer des conclusions ou
prendre des décisions
M.MERZOUKI
EXEMPLES:
Les effets d’un médicament.
L’effet du niveau du cholestérol sur la pression artérielle.
Le nombre de patients admis durant les fins de semaine aux urgences.
Degré de pollution métallique au niveau des animaux marins.
L’effet de l’augmentation de la température sur le survie d’une espèce
L’étude sur les différentes complications dans le traitement des patients atteints d’un virus
M.MERZOUKI
Avant l'expérience, on rédige un protocole expérimental qui décrit les conditions et le
déroulement d'une expérience ainsi que la méthode choisie pour analyser les résultats attendus
de l'expérience, d'où l'importance du dialogue entre le biologise et le statisticien.
Exemple 1 :
On a dénombré sur 4900 naissances 2500 garçons (51%)
Ce résultat est-il compatible avec l’hypothèse d’équiprobabilité des naissances des garçons et
des filles ?
Exemple 2 :
Les guérisons d’une certaine maladie avec un traitement de référence et un traitement A ont été :
• traitement A : 85 guérisons sur 100 traités (85%)
• référence : 81 guérisons sur 100 traités (81%)
Est-ce que le traitement A est plus efficace que le traitement de référence ?
M.MERZOUKI
Population, individu, échantillon
Une population est l’ensemble des éléments auxquels se rapportent les données
étudiées. En statistique, le terme « population » s’applique à des ensembles de toute nature :
étudiants d’une académie, production d’une usine, poissons d’une rivière, entreprises d’un
secteur donné…
Dans une population donnée, chaque élément est appelé « individu» ou « unité statistique ».
Les unités statistiques sont des personnes, des animaux ou des objets concrets ou
abstraits. Les premières populations ayant fait l'objet d’un recensement ayant été des
populations humaines (d'où le lien étroit entre statistique et démographie) le terme "individu"
est parfois employé comme synonyme du terme "unité statistique".
M.MERZOUKI
Un échantillon est un sous-ensemble d’une population sur lequel on effectue une
étude statistique. Une étude sur un échantillon vise généralement à tirer des
conclusions relatives à la population dont il est issu.
La taille d’une population statistique est la première information statistique que

l'on tire d'une population, c’est le nombre de ses unités, désigné par n dans le cas
d’une partie de la population (échantillon) et par N dans le cas d’une population.
M.MERZOUKI
Exemple 1:
Dans le but étudier les facteurs de risque pour développer un diabète de type 2 dans la
région de Béni Mellal-Khénifra, une équipe de chercheurs a suivi 1200 personnes issues de
de cette région,
région de Béni Mellal-Khénifra
population Echantillon individu
Les habitants de la
région B-K
2 520 776 hab. 1200 personne 1 Habitant/ 1 individu
ou une personne
(2014)
M.MERZOUKI
Exemple 2:
Afin d'étudier les risques de l'accouchement liés à l'âge de la mère dans la province d’Azilal , une
étude est porté sur 300 femmes de plus de quarante ans et 500 âgées entre vingt et trente ans.
Province d’Azilal
population Echantillon individu
800 femmes enceintes 1 femme femmes

Les femmes enceintes enceintes de la Prv
de la Prv d’Azilal
de la Prv d’Azilal d’Azilal
Agée de
Agée de Agée de
20+
20+ 20+
M.MERZOUKI
Exemple 3:
Une organisation de consommateurs désire savoir si le poids réel des pains produits par une
boulangerie, qui produit 2000 pain/jour, est bien conforme au poids annoncé (800 g). Pour cela,
elle a prélevé 100 pains au hasard pendant la duré de fabrication du pain pour une journée.
population échantillon individu
1
N = 2000 pains n = 100 pain
pain
M.MERZOUKI
Répartition des unités statistiques selon différents caractères
On divise les populations en sous-ensembles au moyen de certains critères appelés Variables (ou
dimensions ou caractères ou encore caractéristiques), c’est l’aspect particulier que l’on désire
étudier (objet de l’étude). A chaque unité statistique (ou unité) est associée une modalité de
chaque caractère.
Exemples :
• dans le cas de l’étude des facteurs de risque pour développer un diabète de type 2 on peut
s’intéresser à l’avancement de l’âge, origine ethnique et antécédents familiaux liés au diabète)
• concernant la fabrication du pain, on peut s’intéresser au poids, diamètre, longueur, température
de cuisson, nature de la farine …
M.MERZOUKI
Types de Caractères : qualitatifs et qualitatifs
On distingue deux sortes de caractères (Variables):
❑ variables qualitatives (aussi appelés « variables statistiques »)

❑ variables quantitatives
❑ Une variable est dite quantitative lorsqu’elle est intrinsèquement
numérique. Une variable quantitative peut être une variable statistique
discrète ou continue.
M.MERZOUKI
Les variables statistiques discrètes sont des variables qui ne peuvent prendre que des
valeurs isolées, discrètes. Le nombre d’enfants d’une famille, le nombre de chromosomes,
le nombre de pétales d’une fleur, les rechute d'une maladie, rappel de vaccin (4
injections), dentition (32 dents), sont des variables quantitatives discrètes. Le plus
fréquemment, les valeurs possibles sont des nombres entiers.
❑ Les variables statistiques continues peuvent prendre toutes les valeurs numériques
possibles d’un ensemble inclus dans : La taille, le poids, la pression artérielle, le revenu,
le taux de natalité sont des variables continues.
M.MERZOUKI
Les variables qualitatives sont toutes les variables qui ne sont pas représentés par des
nombres (non mesurable). Les variables qualitatives prennent des modalités. Par
exemple, les deux « modalités » du la variable qualitative « sexe », sont « masculin » et
« féminin ».
Les modalités de certains variables qualitatives peuvent être ordonnées ou hiérarchisées.

On dit alors que la variable est ordinale. C’est le cas par exemple de tous les caractères
qualitatifs dont les modalités sont des opinions.
Lorsque les modalités d’une variable ne peuvent pas être ordonnées, la variable
est dite nominale.
M.MERZOUKI
➢ Les données qualitatives définissent des échelles soit nominales soit ordinales. L'échelle
nominale comporte un certain nombre de catégories, dont la seule propriété est qu'elles
sont toutes différentes les unes des autres (sexe, nationalité, type de diplôme, etc.).
➢ Les variables qualitatives ordinales : sont des variables qui contiennent un ordre. Par
exemple, le degré de satisfaction par rapport à votre fournisseur de connexion internet.
Les différentes modalités seraient : très satisfait, satisfait, insatisfait, très insatisfait. Les
variables qualitatives ordinales ont très souvent des degrés de satisfaction,
d’approbation, etc
M.MERZOUKI
Le schéma ci-après récapitule les quatre types de Variables rencontrés en
statistique descriptive.
Variable qualitative Variable quantitative
Variables nominale Variables ordinale Variables discrète Variables continue
M.MERZOUKI
échelles de mesures
L’étude des variables doit se faire avec des outils de mesure. Il n’est pas
possible de mesurer le degré de satisfaction de la même façon qu’on
peut mesurer la taille d’un individu. Voilà pourquoi, on utilise différentes
échelles de mesures.
Il existe 4 types différents associés à des types de variables différentes.

Le mot clé pour se souvenir des 4 échelles de mesures est le mot NOIR.
Nominale
Ordinale
Intervalles
Rapports
M.MERZOUKI
échelles de mesures
1. L’échelle Nominale permet de mesurer une variable qualitative
nominale.
2. L’échelle Ordinale permet de mesurer une variable qualitative ordinale.
3. L’échelle d’Intervalles permet de mesurer une variable quantitative dont
le zéro est fixé arbitrairement. Un zéro arbitraire est un zéro qui ne
correspond pas à une absence.
4. L'échelle de Rapports permet aussi de mesurer une variable
quantitative mais cette fois-ci dont le zéro correspond à une absence de
la variable.
Les deux premières échelles permettent de mesurer des variables

qualitatives seulement et les deux dernières servent uniquement pour des
variables quantitatives.
M.MERZOUKI
Distributions statistiques: Effectifs, fréquences
Lorsque le recueil des données a été effectué, on dispose, pour chacun des
individus de l’échantillon (ou de la population), de la valeur de la variable étudiée.
Le premier traitement consiste alors à relever cette valeur pour chaque
individu et ensuite à compter le nombre d’individus pour lesquels la variable prend
une valeur donnée. On associe, à chaque valeur prise par la variable statistique
étudiée, son effectif.
Notation : les variables seront notées par des lettres majuscules X, Y, Z… ; on note leurs
modalités (valeurs) par des lettres Minuscules xi, yj, zl et les effectifs associés par ni, nj, nl
Exemple : X = sexe, x1 = féminin, x2 = masculin, n1 = nombre de femmes, n2 = nombre

d’hommes.
M.MERZOUKI
N° Sexe Poids (Kg) Taille (cm) Mention du Bac Ville Age (ans) Nbr DE F&S
1 F 58 163 Bien Béni Mellal 21 3
2 F 47 163 Bien Fkih Ben Salah 22 8
3 F 45 156 A. Bien Khnefra 21 8
4 F 51 163 Bien Azilal 22 7
5 F 68 158 Bien Khnefra 22 2
6 F 67 160 A. Bien Azilal 23 4
7 F 45 163 A. Bien Azilal 22 3
8 G 55 174 Passable Khnefra 25 4
9 G 89 182 A. Bien Béni Mellal 23 3
10 F 52 147 A. Bien Béni Mellal 20 4
11 F 60 166 A. Bien Azilal 22 3
12 F 50 164 A. Bien Béni Mellal 21 4
13 F 66 167 Bien Khnefra 21 4
14 F 56 1,69 Passable Béni Mellal 21 1
15 F 49 159 A. Bien Azilal 21 5
16 F 54 163 Bien Béni Mellal 19 1
17 G 65 169 Passable Azilal 22 3
18 G 66 168 Bien Azilal 21 5
19 G 66 174 Passable Azilal 23 9
M.MERZOUKI
Pour le LST PE 2019-2020, l’effectif total des étudiants, qui on été présents dans la
première séance de Biostatistique, est de 19 étudiants.
Soit la variable « sexe » noté X présenté par deux modalité x1= Filles et x2= Garçons
avec, respectivement, des effectifs n1= 14 et n2=5,
Pour les variables continues, on commence par ranger les observations
en classes, celles-ci étant des intervalles de la forme [ai – 1, ai [. Ensuite,
pour chaque classe, on compte le nombre d’individus dont le caractère
appartient à la classe : ce nombre est l’effectif de la classe. On note k
le nombre de modalités.
Définition : on appellera distribution statistique des effectifs

de la variable X :
• l’ensemble des données (xi, ni), i= 1,………..,k , si X est une variable discrète,
• l’ensemble des données [ai-1, ai[, i= 1,………..,k , si X est une variable continue.
Définition: la fréquence ( ou proportion) associée à la valeur xi de la variable
statistique ou à la classe [ai – 1, ai [. est la valeur fi définie par:
fi=ni/N
La fréquence fi représente donc la part de l’échantillon pour laquelle la valeur

de la variable est Xi (ou appartient à [ai – 1, ai [) . On peut par exemple l’exprimer
sous forme de pourcentages (le pourcentage sera alors 100× fi).
Remarque : cette quantité est indépendante de la taille de l’échantillon, ce qui
permet de comparer les résultats obtenus sur plusieurs échantillons.
Les fréquences vérifient les propriétés suivantes :
0 ≤ fi ≤ 1 i= 1,….., k
f1+ f2+ …..+fk = 1
Pour les variables continues, on commence par ranger les observations
Les résultats sont généralement présentés dans un tableau de ce type.
X est discrète x est continue

Classe Effectifs Fréquence fi Fréquence cumulée Fi Classe Effectifs Fréquence fi Fréquence cumulée Fi
x1 n1 n1/N n1/N [a0, a1[ n1 n1/N n1/N
x2 n2 n2/N n1/N+n2/N [a1, a2[ n2 n2/N n1/N+n2/N
.. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. ..
xk nk nk/N 1 [ak-1, ak[ nk nk/N 1
Total N=n1+n2+…+nk 1 Total N=n1+n2+…+nk 1
Distributions statistiques: Effectifs, fréquences
Exemple :
Dans l’échantillon de 19 étudiants de LST PE 2019-2020, on fait un relevé de la ville
d’origine.
Pour obtenir le tableau de fréquences, on divise, pour chaque modalité i, l’effectif ni par
l’effectif total (19 étudiants).
Modes de regroupement des unités statistiques
M.MERZOUKI
Modes de regroupement des unités statistiques
Série simple
Le tableau précèdent est un tableau dans lequel les données n’ont pas été
regroupées. C’est un tableau de données brutes. Nous pouvons lire pour
chaque ligne les différentes valeurs ou modalités des variables ou des
caractères associés à chacune des 19 unités statistiques de la population.
Chaque colonne correspond à une série simple de valeurs ou de
modalités.
Distribution par valeurs ou par modalités
Pour une variable le regroupement se fait par valeurs ou par modalités. Dans ce
cas, on parle de distribution. En effet, la série initiale des 19 données va être
distribuée sur un nombre généralement inférieur (ou au maximum égal), de
valeurs ou de modalités.
M.MERZOUKI
Distribution par valeurs
Prenons l’exemple de la variable « nombre d’enfants par famille» dans le tableau. Un

regroupement des 7723 unités statistiques pour chacune des valeurs possibles de la variable
donnera alors le tableau suivant :
2012
Classes Effectifs ni
1 enfant 3 480
2 enfants 2 978
3 enfants 987
La somme des effectifs
Distribution 4 enfants ou plus 278
de la distribution est égal
sur 4 valeurs Ensemble 7 723
à 7723, l’échantillon total.
Source: L’Institut national d’études démographiques (Ined)
M.MERZOUKI
Distribution par modalités
Dans le tableau, nous allons choisir N° Ville d'origine Effectifs

la ville d’origine comme variable 1 Béni Mellal 6
qualitative pour effectuer un
2 Fkih Ben Salah 1
regroupement par modalités.
3 Khnefra 4
4 Azilal 8
19
19 unités distribuées sur

4 modalités
M.MERZOUKI
Regroupement par catégories
Lorsqu’il y a beaucoup de valeurs ou de modalités, on peut procéder à un

regroupement par catégories de valeurs ou par catégories de modalités.
Catégories de valeurs
Un regroupement des 19 unités statistiques pour chacune des valeurs

possibles de la variable « taille » donnerait un tableau avec 19 valeurs, ce qui
n’aurait aucun intérêt. En revanche, on peut créer des classes de valeurs
pour les tailles et répartir les 19 individus à l’intérieur de ces classes.
M.MERZOUKI
N° Taille (cm) N° Taille (cm) Transformation de la série simple en distribution
1 163 10 147
2 163 3 156 par classes de valeurs
3 156 5 158 Classes i Effectifs ni
4 163 15 159 [146; 150[ 1
5 158 6 160 [150; 154[ 0
6 160 1 163 [154; 158[ 1
7 163 [158; 162[ 3
2 163
8 174
[162; 166[ 6
4 163
[166; 170[ 5
9 182 7 163 [170; 174[ 0
10 147 16 163 [174; 178[ 2
11 166 12 164 [178; 182[ 0
12 164 11 166 [182; 186[ 1
13 167 13 167 ∑ 19
14 1,69 18 168
15 159 14 169 Les classes sont d’amplitudes égales (4 cm),
16 163 17 169
17 169 L’amplitude d’une classe est égale à la différence
8 174
18 168 19 174 entre la borne supérieure et la borne inférieure.
19 174 9 182
M.MERZOUKI
Catégories de modalités
Prenons l’exemple du caractère « Sexe » dans le même tableau. On peut répartir les 19
étudiants selon le sexe pour obtenir le tableau suivant:
Garçons Filles Total

5 14 19
M.MERZOUKI

Biostatistique 1-Introduction

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Biostatistique 1-Introduction

Transféré par

Droits d'auteur :

Formats disponibles

Université Sultan Moulay Slimane

Faculté des Sciences et Techniques

« Il y a trois sortes de mensonges :

Sir Ronald Fisher

quotidien préféré des New-Yorkais ».

1 900 000 Le but de ce graphique est de convaincre le lecteur que la croissance

La version correcte, plus « honnête », du graphique,

Dans une étude sur le tabagisme, 1314

mortalité des fumeuses et des non- 24 %

ce que non-fumer tue ?

FUMER, C’EST BON POUR LA SANTÉ

Alive 53 61 121 152 95 114 103 66 64 81 7 28 0 0

death Rate% 4 2 2 3 13 6 21 15 44 33 81 78 100 100

FUMER, C’EST BON POUR LA SANTÉ

2° dans chaque tranche d’âge les fumeuses meurent plus .

être à l'âge et pas au tabac .

Pour que le paradoxe se produise, il faut 2 ingrédients :

Taux de succès (succès/total)

Succès en fonction de la taille des calculs

petits calculs gros calculs

• Ensemble de données d'observation relatives à un groupe d'individus ou d'unités (souvent

Les statistiques sont un ensemble de données et de valeurs relatives à un phénomène

déterminé sous forme de tableaux, de listes ou de chiffres permettant de caractériser et

comparer des faits et d'analyser leur évolution.

La statistique (au singulier) est l'ensemble des méthodes servant à mesurer,

Permet de vérifier des

D'une manière générale et sur le plan méthodologique, la statistique descriptive

précède la statistique inférentielle mais les deux aspects de la statistique sont

complémentaires et chacun répond à des besoins particuliers.

induction que l’on fait à partir

d’informations récoltées sur un

échantillon afin de les généraliser à la

population associée à cet échantillon.

Les différentes caractéristiques de l'échantillon permettent de déterminer le poids

x inconnue Quelle que soit la décision, elle

La biostatistique est l'application de la statistique à un large éventail de sujets en biologie.

La taille d’une population statistique est la première information statistique que

d’une partie de la population (échantillon) et par N dans le cas d’une population.

région de Béni Mellal-Khénifra

population Echantillon individu

population Echantillon individu

800 femmes enceintes 1 femme femmes

population échantillon individu

On distingue deux sortes de caractères (Variables):

❑ variables qualitatives (aussi appelés « variables statistiques »)

Les modalités de certains variables qualitatives peuvent être ordonnées ou hiérarchisées.

Variable qualitative Variable quantitative

Variables nominale Variables ordinale Variables discrète Variables continue

Il existe 4 types différents associés à des types de variables différentes.

Les deux premières échelles permettent de mesurer des variables

Exemple : X = sexe, x1 = féminin, x2 = masculin, n1 = nombre de femmes, n2 = nombre

Définition : on appellera distribution statistique des effectifs

La fréquence fi représente donc la part de l’échantillon pour laquelle la valeur

X est discrète x est continue

x2 n2 n2/N n1/N+n2/N [a1, a2[ n2 n2/N n1/N+n2/N

Prenons l’exemple de la variable « nombre d’enfants par famille» dans le tableau. Un

Source: L’Institut national d’études démographiques (Ined)

Dans le tableau, nous allons choisir N° Ville d'origine Effectifs

19 unités distribuées sur

Lorsqu’il y a beaucoup de valeurs ou de modalités, on peut procéder à un

Un regroupement des 19 unités statistiques pour chacune des valeurs

Garçons Filles Total

Vous aimerez peut-être aussi