Vous êtes sur la page 1sur 12

Examen de l’UE de biostatistique du 11 avril 2012

Les questions sont indépendantes et peuvent être traitées dans le désordre.

Il s’agit d’une étude effectuée sur 189 femmes ayant accouché d’un enfant vivant et unique
(pas de jumeaux) dans le but d’étudier les liens entre des caractéristiques maternelles et le
poids de naissance. Au cours de la grossesse et au moment de l’accouchement ont été
colligés l’âge de la mère en début de grossesse (en année), le poids de la mère avant la
grossesse (en livres), recueilli au moment des dernières règles, l’origine ethnique
(Caucasienne, Africaine ou autre), la consommation de tabac durant de grossesse, les
antécédents d’hypertension artérielle, la présence d’antécédents d’irritabilité utérine, le
nombre de consultations médicales durant le 1er trimestre de la grossesse et enfin, le poids
de l’enfant (en grammes). Un nouveau-né sera considéré, dans cette étude, de petit poids de
naissance si son poids est inférieur à 2500 g. Certaines variables quantitatives ont été mises
en classes pour les besoins de l’analyse. On considérera que les variables continues ont des
distributions normales.
Une partie des résultats de l'enquête est donnée dans les tableaux en fin d'énoncé. Attention
les effectifs peuvent varier en fonction des valeurs manquantes pour certaines modalités.

1. a. Quel est le pourcentage de nouveau-nés de petit poids de naissance et son intervalle


de confiance ?
b. Quelle est la moyenne de l’âge de la mère en début de grossesse et son intervalle de
confiance ?

2. Les pourcentages de petits poids de naissance diffèrent-ils selon :


a. l’origine ethnique de la mère ?
b. la mère est fumeuse ou pas durant la grossesse ?
c. les antécédents d’hypertension artérielle ?

3. a. Le poids de la mère avant la grossesse diffère-t-il selon que le poids de naissance du


nouveau-né est inférieur ou supérieur à 2500 g ?
b. Peut-on dire que le poids de la mère avant la grossesse est un facteur pronostic du petit
poids de naissance du nouveau-né ?
c. le poids de naissance de l’enfant (sous sa forme continue) diffère-t-il selon la présence
d’antécédents d’irritabilité utérine de la mère ?

4. On s’intéresse dans la suite de l’étude à la relation entre le poids de la mère avant la


grossesse (X) et le poids de naissance du nouveau-né (Y).

Master de Santé Publique - 2011-2012 1


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012
a. Y a-t-il une tendance à l'augmentation du poids de naissance du nouveau-né avec le poids
de la mère avant la grossesse ? On vous donne en plus mX = 129,8; sX = 30,6 ; mY = 2944,3;
sY = 729,0 et Σxy = 73019568.

b. Quelle est la part de variance de Y expliquée par le poids de la mère X ? Est ce que la
part de variance de Y expliquée par le poids de la mère X serait différent si le poids de la
mère au moment des dernières règles était exprimé en kg, sachant que 1kg=2,2 livres ?

c. Pensez-vous qu’il soit envisageable de prédire le petit poids de naissance du nouveau-né


en connaissant le poids de la mère avant la grossesse (on ne vous demande pas de faire les
calculs) ?

d. Le coefficient de corrélation entre le poids de la mère avant la grossesse et le nombre de


consultations médicales durant le 1er trimestre est r = 0,141. Y a-t-il une tendance à
l'augmentation du nombre de consultations avec le poids de la mère avant la grossesse ?

5. Le poids de naissance du nouveau-né varie-t-il selon l’origine ethnique de la femme ?


(précisez les conditions d’application du test)

Master de Santé Publique - 2011-2012 2


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012
Tableau 1 : Principales caractéristiques des femmes en fonction du poids de
naissance des nouveau-nés.

Poids de naissance de l’enfant


Caractéristiques Poids < 2500 g Poids ≥ 2500
N=59 N=130
Age de la mère (ans)
moyenne 22,3 23,7
variance 20,4 30,2

Poids avant la grossesse (livres)


moyenne 122,2 133,3
variance 704,8 1006,4

Origine ethnique (n)


Caucasiennes 23 73
Africaines 11 15
Autres 25 42

Fumeuse pendant la grossesse (%) 50,9% 33,9%

Antécédents d’hypertension (n) 7 5

Nombre de consultations médicales


moyenne 0,69 0.84
variance 1,08 1,14

Master de Santé Publique - 2011-2012 3


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012
Tableau 2 : Donnée complémentaires concernant le poids de naissance (en grammes)
du nouveau-né.

Poids de naissance du nouveau-né en fonction des


antécédents d’irritabilité utérine
Antécédents d’irritabilité utérine (n=28)
moyenne 3030,17
écart-type 693,69

Pas d’antécédents d’irritabilité utérine (n=161)


moyenne 2459,43
écart-type 742,97

Poids de naissance du nouveau-né en fonction de


l’origine ethnique de la femme

Caucasiennes (n=96)
moyenne 3103,01
écart-type 727,9

Africaines (n=26)
moyenne 2719,7
écart-type 638,7

Autres (n=67)
moyenne 2804,0
écart-type 721,3

Master de Santé Publique - 2011-2012 4


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012
Correction de l’UE de biostatistique du 11 avril 2012

1. a. Le pourcentage de nouveau-nés de petit poids de naissance est


.

L'intervalle de confiance est obtenu par la formule ce qui donne :

Les conditions d’application (npi, nps, nqi, nqs ≥ 5) sont satisfaites. En effet, la plus petite de
ces 4 valeurs est .

b. La moyenne de l'âge en début de grossesse de l'ensemble des mères peut être calculée à
partir des moyennes des âges des mères qui ont eu un nouveau-né de petit poids de
naissance et de celles qui n'en ont pas eu, qui figurent dans le tableau 1.
On obtient : avec n1 et m1 l’effectif et la moyenne de l’âge des mères ayant

donné naissance à des nouveau-nés de petits poids de naissance et n2 et m2 l’effectif et la


moyenne de l’âge des autres mères.

On obtient donc ici :

La variance s2 de l'âge des mères en début de grossesse est la variance totale. Ce serait
une erreur d'utiliser la formule de la variance commune dont le résultat ne correspond pas à
la variance de l'ensemble des 189 mères réunies.

On a de façon générale: où est la somme des carrés des 189

mères. Comme les variances dans les deux groupes de poids de naissance sont :

et , on en déduit :

et donc :

Puisque la taille de l'échantillon est supérieure à 30, l'intervalle de confiance de la moyenne


est donnée, sans autre condition d'application, par :

Master de Santé Publique - 2011-2012 5


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
.

2. a. Il s’agit ici d’effectuer 3 tests du χ2.


En ce qui concerne l’origine ethnique de la mère, les hypothèses à tester sont : Ho : P1 = P2 =
P3 et H1 : il y a au moins une différence où P1, P2, P3 sont les pourcentages vrais de petits
poids de naissance dans chacune des 3 origines ethniques de la mère.
Le tableau de χ2 est le suivant :
< 2500g ≥ 2500g
[18-25[ 23 73 96
(30,0) (66,0)
[25-35[ 11 15 26
(8,1) (17,9)
[35-45[ 25 42 67
(20,9) (46,1)
59 130 189

Les conditions d’application du test de χ2 sont satisfaites et on obtient :

La valeur de étant inférieure à la valeur seuil de la loi de χ2 à 2 ddl (5,99), on ne rejette


pas H0. On ne met donc pas en évidence de lien entre l’origine ethnique de la mère et le petit
poids de naissance des nouveau-nés.

b. En ce qui concerne le fait que la mère ait fumé durant la grossesse, les hypothèses
testées sont : Ho : P1 = P2 et H1 : P1 ≠ P2 où P1 et P2 sont les pourcentages vrais de
fumeuses chez les mères ayant donné naissance à des nouveau-nés de petit poids de
naissance et chez les autres mères. Pour réaliser le test de χ2, il faut reconstituer le tableau
des effectifs à partir des pourcentages donnés dans l'énoncé. Comme les effectifs doivent
être des nombres entiers, il faut arrondir : par exemple, le nombre de fumeuses chez les
mères ayant donné naissance à des nouveau-nés de petits poids de naissance
est , ce qui donne 30. Le tableau de χ2 est ainsi le suivant :

Master de Santé Publique - 2011-2012 6


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
< 2500g ≥ 2500g
Non fumeuses 29 86 115
(35,9) (79,1)
Fumeuses 30 44 74
(23,1) (50,9)
59 130 189

Les conditions d’application du test de χ2 sont satisfaites car les effectifs théoriques
(indiqués entre parenthèses) sont tous supérieurs à 5. On obtient :

La valeur de étant supérieure à la valeur seuil de la loi de χ2 à 1 ddl (3,84), on rejette Ho.

Le degré de signification est p < 0,01. On conclut qu'il y a une différence entre les
pourcentages de fumeuses chez les mères ayant donné naissance à des nouveau-nés de
petit poids de naissance et chez les autres. Cette différence est dans le sens d'un
pourcentage plus élevé de fumeuses chez les mères ayant donné naissance à des nouveau-
nés de petit poids de naissance (50,9% vs. 33,9%).

c. En ce qui concerne les antécédents d’hypertension artérielle de la mère, les hypothèses


testées sont : Ho : P1 = P2 et H1 : P1 ≠ P2 où P1 et P2 sont les pourcentages vrais de mères
ayant des antécédents d’hypertension artérielle parmi les mères ayant donné naissance à
des nouveau-nés de petit poids de naissance et chez les autres mères. Le tableau de χ2 est
ainsi le suivant :
< 2500g ≥ 2500g
Pas d’ATCD d’hypertension 52 125 177
(55,3) (121,7)
ATCD d’hypertension 7 5 12
(3,7) (8,3)
59 130 189

Les conditions d’application du test de χ2 ne sont pas satisfaites puisque un des effectifs
théoriques (entre parenthèses) est inférieur à 5. Comme tous les effectifs théoriques sont
supérieurs à 3, on peut et on doit utiliser la correction de Yates. On obtient :

La valeur de étant inférieure à la valeur seuil de la loi de χ2 à 1 ddl (3,84) on ne rejette


pas H0. On ne met donc pas en évidence de lien entre les antécédents d’hypertension

Master de Santé Publique - 2011-2012 7


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
artérielle de la mère et le petit poids de naissance des nouveau-nés.
2
Remarque : on peut noter que le test est proche de la signification statistique (χ = 3,14 correspond à un degré de

signification proche de 8%). Là, plus encore qu'ailleurs, il ne faut pas exprimer la conclusion sous la forme "il n'y a pas

de différences".

3. a. Les hypothèses testées sont : Ho : et H1 : où sont les

moyennes vraies du poids de la mère avant la grossesse selon que le poids de naissance du
nouveau-né est supérieur ou inférieur à 2500g. Les effectifs sont supérieurs à 30 dans
chacun des deux groupes d’analyse, on utilise donc l’approximation par la loi normale qui ne
nécessite aucune condition d’application.

On obtient : zo = .

La valeur de z0 étant supérieure à 1,96, on rejette l’hypothèse Ho. Le degré de signification


est p<0,02. Les moyennes des poids des mères avant la grossesse chez les mères ayant eu
des nouveau-nés de petits poids de naissance et chez les autres sont donc significativement
différentes. On constate que le poids moyen avant la grossesse des mères dont les
nouveau-nés ont des petits poids de naissance est plus bas que le poids moyen chez les
mères dont les nouveau-nés ont des poids de naissance normaux.

b. Un marqueur ou un facteur est dit pronostic s'il est statistiquement lié à un événement que
l’on veut tester, c'est-à-dire ici si les moyennes de poids de la mère diffèrent
significativement selon la catégorie du poids de naissance du nouveau-né (<2500g ou non).
C'est le cas ici comme on l'a vu à la question précédente. Le poids de la mère avant la
grossesse est donc un facteur pronostic de petit poids de naissance. Il faut cependant
souligner que cette notion n'a pas de contenu causal : on est ici en situation d'observation,
rien de permet d'affirmer que l'augmentation de poids de la mère est une cause de petit
poids de naissance.

c. Les hypothèses à tester sont : H0 : µ1 = µ2 et H1 : µ1 ≠ µ2, où µ1 et µ2 sont les moyennes


vraies de poids de naissance des nouveau-nés chez les femmes ayant déclaré des
antécédents d’irritabilité utérine et chez les celles qui n’ont en pas déclaré. Le nombre de
femmes ayant déclaré des antécédents d’irritabilité utérine étant égal à 28, et donc inférieur
à 30, le test Z n’est pas utilisable. Il faut recourir au test de Student qui nécessite que les
distributions du poids de naissance soient normales et de même variance.
Les données de l'énoncé permettent de faire l’hypothèse de la normalité des distributions
des poids et on peut tester ici si les variances sont égales. Le test de comparaison des
variances consiste à calculer le rapport de la plus grande sur la plus petite des variances

Master de Santé Publique - 2011-2012 8


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
estimées : et à comparer cette valeur à la valeur seuil à 2,5% d’une loi

de Fisher . Cette valeur seuil est comprise entre celle de (1,84) et celle de

(2,02). On ne met donc pas en évidence de différence entre les deux variances.
Pour effectuer la comparaison de moyenne du poids de naissance des nouveau-nés, il faut,
au préalable, calculer la variance commune :

d’où avec 187 ddl

Pour conclure, il faut comparer |to| à la valeur seuil pour α = 0,05 de la loi de Student à

187 ddl. Comme t0 dépasse la valeur seuil de la loi de Student à 187 degrés de liberté
(comprise entre 1,984 et 1,960), on rejette H0. La valeur de t0 étant bien supérieure à ces
deux valeurs, on met en évidence de différence entre les moyennes de poids de naissance
des nouveau-nés selon la déclaration d’antécédents d’irritabilité utérine de la mère. Le degré
de signification est p < 0,001.

4. a. Pour tester s’il existe une tendance à une augmentation du poids de naissance (Y) et le
poids de la mère avant la grossesse (X), il faut déterminer, dans un premier temps,
l’équation de la droite de régression entre x et y (qui est utilisable si la relation entre x et y
est effectivement linéaire, ce qu'on ne peut pas vérifier avec les données de l'énoncé). Dans
un second temps il faudra tester si la pente de la droite de régression est différente de zéro,
pour cela il faudra supposer en plus que la distribution de y à x fixé est normale et de
variance constante.

Les coefficients de la droite de régression de Y en fonction de X sont : et

a = m y - b m x.

Les valeurs nécessaires aux calculs pour les 189 valeurs communes, mx, sx, my, sy et ∑xy

sont données dans l’énoncé.

On obtient ainsi : b = = 4,48 ≈ 4,50

et a = 2944,3 – 4,48 × 129,8 = 2362,28.

L’équation de la droite de régression est donc :

Master de Santé Publique - 2011-2012 9


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
Pour tester si la pente de la droite de régression est différente de zéro, il faut tout d’abord
estimer la variance de b.

La variance estimée de b est : . D’où on déduit : s = =

2,926 ≈ 2,93.

Le test de l’hypothèse β = 0 s’écrit : t0 = = 2,628 ≈ 2,63 avec 187 ddl. La valeur du

degré de signification doit être lue dans la table de la loi centrée réduite pour un risque α =
5%. Puisque la valeur dépasse 1,96 alors on conclut que la pente est significativement
différente de 0 ; le degré de signification est p <0.01. Puisque que la pente est différente de
0 et que celle-ci est égale à 4,50 nous pouvons conclure à une augmentation du poids de
naissance des nouveau-nés en fonction du poids de la mère au moment des dernières
règles.

b. La part de variance du poids de naissance des nouveau-nés expliquée par le poids de la


mère avant la grossesse est égale à r2. Pour obtenir r2 nous devons préalablement passer
par la relation qui lie la pente de la droite de régression et le coefficient de corrélation. Nous
avons donc : ≈ 0,19. Le pourcentage de variance expliqué est

donc . C'est-à-dire que 3,6% de la variance du poids de naissance des nouveau-


nés est expliqué par le poids de la mère avant la grossesse. Les conditions d'application
sont les mêmes que pour le test de la pente, mais, pour que l'interprétation de r2 qui vient
d'être donnée soit quantitativement correcte, il est essentiel que la régression entre X et Y
soit effectivement linéaire.
La part de variance de Y expliquée par le poids de la mère X ne serait, bien évidemment,
pas différent si le poids de la mère au moment des dernières règles était exprimé en kg au
lieu d’être exprimés en livres. En effet, la valeur du coefficient de corrélation, son degré de
significativité et la part de variance n’est pas modifié par un changement d’unité d’une ou
même des deux variables du modèle.

c. Il ne semble pas pertinent de prédire le poids de naissance des nouveau-nés avec le


poids de la mère avant la grossesse. En effet, soit la relation n'est pas linéaire et la
prédiction n'est pas légitime, soit la relation est linéaire, comme cela semble être le cas ici, et
la précision serait très mauvaise en raison de la petite valeur de r2.

d. Pour tester l'existence de ce lien, on compare à 0 le coefficient de corrélation entre X (le


poids de la mère avant la grossesse) et Z (le nombre de consultations). Les hypothèses

Master de Santé Publique - 2011-2012 10


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
testées sont donc Ho : ρ = 0 et H1 : ρ ≠ 0 où ρ est le vrai coefficient de corrélation entre x et

z. Le test consiste à calculer ≈ 1,95. Comme t0 ne dépasse

pas la valeur seuil de la loi de Student à 187 degrés de liberté (qui est comprise entre 1,960
et 1,984), on ne rejette pas HO même si ici la valeur du test est proche du seuil attendu. On
ne met donc pas en évidence de lien entre le poids de la mère avant la grossesse et le
nombre de consultations du 1er trimestre de la grossesse. Les conditions d’application de ce
test sont : régression entre X et Z linéaire et distribution de Z à X fixé (ou de X à Z fixé)
normale et de variance constante.

5. Les hypothèses testées sont : H0 : µ1 = µ2 = µ3 et H1: il y a au moins une différence, où les


µi sont les moyennes vraies du poids de naissance des nouveau-nés dans les 3 catégories
d'origine ethnique.
Il faut recourir à l’analyse de la variance dont les conditions d’application sont : distributions
du poids de naissance dans les 3 catégories ethniques normales et de même variance. La
normalité ne peut pas être vérifiée avec les données de l'énoncé, mais on peut constater que
les variances qui figurent dans le tableau 2 sont homogènes (ce qu'un test — non au
programme — confirmerait).

Les éléments de calcul nécessaires pour établir le tableau d’analyse de la variance sont les
suivants :

• ≈ 2944,281

•  

On en déduit le tableau d’analyse de la variance :

Source de
variation Somme des carrés des écarts ddl Variance F

Entre catégorie SCEA = 1643450264,1 -


ethnique 2
189×2944,2812 = 5048839,38

Résiduelle SCER = 186

F0 doit être comparé à la valeur seuil lue pour 5% dans la table . Cette valeur seuil est
comprise entre celles de (3,09) et de (3,04). On rejette donc H0. On met en

Master de Santé Publique - 2011-2012 11


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé
évidence une différence des moyennes du poids des nouveau-nés en fonction des 3 classes
ethnique. Le degré de signification est p < 1‰.

nombre de copies : 50
notes supérieures à 10 : 70 %

Master de Santé Publique - 2011-2012 12


Unité d'Enseignement de biostatistiques - Examen du 11 avril 2012 - Corrigé

Vous aimerez peut-être aussi