Vous êtes sur la page 1sur 20

Biostatistique

Unité d’enseignement STA109

Chaire de Statistique Appliquée

David Moreau
Contenu de la formation

• Généralités et premiers rappels


• Caractéristiques des distributions à un caractère
• Caractéristiques des distributions à deux caractères
• Notions de calcul de probabilités
• Lois usuelles de probabilités
• L’Estimation
• La Théorie des Tests
• Analyse de la Variance et Modèle Linéaire Simple

STA109 2
Bibliographie
Auteur Titre
FRONTIER S. et al.

LELLOUCH J.

BOUYER J.
BOUYER J.

SAPORTA G.

VALLERON, A.J.

FALLISSARD B. Comprendre et utiliser les statistiques dans les sciences de la vie (Masson, 2005)

SiteInterNethttp://www.agro-montpellier.fr/cnam-lr/statnet/

Biostatistique (Flammarion, 2007)


Probabilités, Analyse des données et statistique (Technip 2006)

Méthodes statistiques – Exercices corrigés (Estem 2001)

Méthodes statistiques -Médecine - Biologie (Estem 2000)

Méthodes statistiques en expérimentation biologique (Flammarion, 1996)

Statistique pour les sciences de la vie et de l'environnement (Dunod 2001)


STA109 3
Plan du cours

• La statistique
• Définitions de termes statistiques
• Différents types de caractères:
caractère qualitatif
caractère quantitatif
• Statistique unidimensionnelle: distribution à un caractère
Tableaux et représentations de caractères qualitatifs
Tableaux et représentation de caractères quantitatifs

STA109 4
La Statistique

• Définition
Le mot statistique désigne à la fois un ensemble de données d’observation et
l’activité qui consiste dans leur recueil, leur traitement et leur interprétation.
Donc les trois principales branches de l’activité statistique sont:
° la collecte des données;
° le traitement des données, appelé la statistique descriptive;
° l’interprétation des données, appelée l’inférence statistique.
• Domaines d’application
Les méthodes statistiques sont utilisées dans presque tous les secteurs
d’activité humaine et font partie des connaissances de base de l'ingénieur, du
gestionnaire, de l’économiste, de l'informaticien. Parmi les innombrables
applications, citons:
° dans le domaine industriel : la fiabilité des matériels, le contrôle qualité, la
prévision…
° dans le domaine de l’économie et des sciences de l'homme: les modèles
économétriques, les sondages, les enquêtes d'opinion…
° dans le domaine médical : l’épidémiologie, la recherche clinique,...

STA109 5
1. Définitions
• La Population:
 ensemble d’objets ou de personnes étudiées
Concrets: ensemble d’êtres humains, stocks d’objets…
Non Concrets: accidents de la route, intention de vote…

• L’échantillon
 Partie de la population sur laquelle porte l’enquête
Choisie par échantillonnage ou sondage
 population-parent
Echantillonage aléatoire simple donne échantillon représentatif

• L’individu
 Objet, personne ou événement sur lequel porte l’étude
Exemple: personne, plante, accident de la route, famille, forêt,
entreprises..…

STA109 6
1. Définitions

• Le caractère (la variable)


 Ensemble des valeurs observées sur les individus
 Le caractère est de type quantitatif ou qualitatif
Exemple: sexe, âge, couleur des yeux, taux de glucose sanguin, proportion de
travailleurs exposés à un polluant….
Pour un caractère qualitatif on observe des modalités.
Exemple: pour le sexe c’est masculin et féminin.
Les modalités doivent êtres:
° incompatibles,
° exhaustives,
° sans ambiguïté.

STA109 7
1. Définitions

• Protocole d’une expérience


 Description de l’ensemble des matériels et méthodes employés
dans l’expérience
 Permet la reproductibilité de l’expérience
• Effectifs et tableaux
 Effectif d’une modalité: nombre d’individus présentant cette
modalité d’un caractère qualitatif
 Les effectifs des modalités sont synthétisés dans des tableaux
(à une dimension si un caractère étudié, à 2 dimensions si 2 caractères étudiés)

STA109 8
2. Différents types de caractères (variables)

• Caractère qualitatif
 Son observation est non quantifiable -> modalités
Les tableaux sont appelés nomenclatures
Les modalités rubriques
 Deux types d’échelle

échelle nominale échelle ordinale


pas d’ordre naturel les modalités peuvent être classées
exemple: le sexe exemple: l’état de santé

STA109 9
2. Différents types de caractères (variables)

• Caractère quantitatif
 Son observation est mesurable -> valeur numérique
 Variable statistique

 Deux types de variable

variable continue variable discrète


prend un nombre infini de prend un nombre fini de valeurs valeurs
réelles réelles
Exemple: l’âge Exemple: le nombre d’enfants dans une
famille
Valeurs regroupées en classes

STA109 10
3. Statistique Unidimensionnelle

Distribution à un caractère
Tableau représentant des données: Modalités (xi) Effectifs (ni)
x1 n1
x2 n2
… …
xi nI
Définitions:
… …
• Effectif total n = ki=1ni xk nK

• Fréquences relatives fi = ni/n


fi (%) = ni/n X 100

Remarques:
• si caractère quantitatif continu, modalités x i peuvent être des classes
• ki=1fi = 1 ou ki=1fi (%) = 100

STA109 11
3.1 Caractère qualitatif

• Tableau des données


modalités rangées selon logique permettant au mieux de les interpréter

Exemple:

• Représentations graphiques:
1) Diagramme à secteurs angulaires (camembert)
Diagramme représentant les résultats du tableau 7

STA109 12
3.1 Caractère qualitatif

2) Diagramme à tuyaux d’orgue

3) Diagramme en bâtons

STA109 13
3.2 Caractère quantitatif
• Cas discret
A) Tableau de données

B) Fréquences relatives et polygone des fréquences


Polygones de fréquence construits en joignant par une ligne brisée les segments voisins du diagramme en
bâtons

STA109 14
3.2 Caractère quantitatif

• Cas discret (suite)


C) Fréquences cumulées
Les fréquences observées sont additionnées de proche en proche pour établir des distributions de fréquences cumulées et tracer la courbe des fréquences cumulées

Fréquences cumulées ascendantes:

Fréquences cumulées descendantes:

Exemple:

STA109 15
3.2 Caractère quantitatif

• Cas discret (suite)


D) Représentation des fréquences cumulées
A partir du calcul des fréquences cumulées on trace des courbes

STA109 16
3.2 Caractère quantitatif

• Cas continu
A) Tableau des données
Quand une variable présente un grand nombre de valeurs, celles-ci sont regroupées en classes
d’amplitudes égales ou différentes
On note :
la classe: Ci = [bi; bi+1[
l’amplitude: aI = bi+1 - bi
le centre: ci = (bi+1 + bi) / 2

Exemple:

STA109 17
3.2 Caractère quantitatif

• Cas continu (suite)

B) Fréquences relatives, densité de fréquence, histogramme

Fréquence de la classe Ci, ni étant le nombre d’observations de la classe, n le nombre total


d’observations:
fi = ni / n

Densité de fréquence de la classe Ci : hi = fi / ai

Histogramme :

ensemble de rectangles dont les bases sont placées sur l’axe horizontal, centrées sur les valeurs des
classes, de largeur égale à leur amplitude et de hauteur la fréquence de la classe ou la densité si les
amplitudes sont différentes.

Le polygone des fréquences est obtenu en reliant le milieu du haut des rectangles de l’histogramme.

STA109 18
3.2 Caractère quantitatif
• Cas continu (suite)
B) Densité de fréquences et histogramme: exemple

STA109 19
3.2 Caractère quantitatif
• Cas continu (suite)
C) Courbe des fréquences cumulées
Les courbes de fréquences cumulées sont construites en affectant à la borne supérieure de la classe i sa
fréquence cumulée croissante, ou en affectant à la borne inférieure de la classe i sa fréquence cumulée
descendante.

Exemple :

STA109 20

Vous aimerez peut-être aussi