Vous êtes sur la page 1sur 12

ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

Relation entre le poids de l’enfant et la race de la mère. (3)

Les enfants nés de femmes de race noire, avaient 384,047g de moins que les enfants nés de femmes de race
blanche. Et la différence est statistiquement significative car P-Value=0,015937 < R2 =0,05.

(5)

1
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

A statut tabagique égal, les enfants des femmes de race noire pèsent 451,153 g de moins que les enfants des
femmes de race blanche ; la différence étant statistiquement significative.

A statut racial égal, les enfants des femmes qui fument pèsent 427,220 g de moins que les enfants des femmes qui
ne fument pas ; la différence étant statistiquement significative.

Interprétation du R2 : 12% de la variabilité du poids de l’enfant est dû à la race de la mère et à son statut tabagique.

Quand le F-statistic est supérieur au F-lu, on rejette l’hypothèse nulle.

(6)

2
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

A statut tabagique égal, lorsque l’âge de la mère augmente d’un an, le poids de l’enfant augmente de 11,233 g.

(7)

On remarque que l’interaction ajoutée est significative (0,024541 < 0,05) donc on ne peut pas l’utiliser dans la même
équation.

Interprétation : la relation qu’il y a entre le poids de l’enfant et l’âge de la mère dépend du statut les deux équations
différentes suivantes (voir cahier).

3
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

Ici pour interpréter on regarde le Odds Ratio (OR). Les mamans qui fumaient avaient 2 fois plus de risques d’avoir
des enfants de faible poids par rapport à celles qui ne fumaient pas. Et cette différence est statistiquement
significative.

En ajoutant l’âge dans la relation, on remarque que le OR = 1,9970 est très proche du précédent = 2,0219. Donc
maintenant, on calcule le pourcentage d’infraction (voir cahier). Comme ce pourcentage est < 20%, on conclut que
L’âge de la mère n’est pas un facteur de confusion dans la relation qu’il y a entre le poids de l’enfant et le statut
tabagique de la mère.

4
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

Cours d’analyse des durées de vie : le 31 mars 2021

A partir du fichier LEUKEM2, on a fait la liste suivante :

Comment lire ce tableau : le premier patient a pris le médicament 6-MP et n’a pas chuté après 6 jours… ainsi de
suite. Le 10e patient a pris le même médicament mais 6 jours après, a chuté.

Estimation de Kaplan-Meier : comment réaliser le tableau ?

5
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

On a permuté la variable non censurée à 0 au lieu de 1, et on a obtenu le résultat suivant :

On interprète en disant que : les patients qui suivent le traitement du 6-MP résistent plus longtemps que ceux qui
suivent le placebo.

NB : le fichier de sortie pour les commandes de ce jour est dans le répertoire des Outputs et se nomme :
analyseDureeVie

A partir du fichier de données Addicts, nous avons fait les analyses suivantes :

Contexte du TP : Pour comprendre ce tableau, on dira que : les gens consomment l’héroïne et les drogues par
exemple, ont du mal à suivre un traitement jusqu’à la fin. On a donc deux cliniques pour soigner les patients. On veut
savoir dans quelle clinique les gens finissent le plus leur traitement.

6
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

La première personne a été soignée à la clinique 1, a suivi son traitement jusqu’à la fin (statut =0) pendant 428 jours,
n’a jamais été en prison et a pris 50g de méthadone. C’est comme ça qu’on lit le tableau (liste) précédent.

Estimation de Kaplan Meier :

Interprétation :

D’après le schéma suivant, on dira que la clinique 2 est meilleure que la clinique 1 car les personnes qui suivent leur
traitement là-bas durent plus longtemps.

Cependant, le directeur de la clinique 1 peut se plaindre et trouver un alibi pour justifier que les attributions dès le
départ n’étaient pas bonnes ; en disant par exemple qu’il a eu le plus de personnes qui ont eu des antécédents
judiciaires. Maintenant, on va faire une analyse en tenant compte de ces antécédents judiciaires. Commençons par
faire une régression de Cox :

7
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

On compare le résultat précédent, avec celui suivant, où on a ajouté la valeur prédictive du casier judiciaire.

On verra que le HR du tableau ci est inférieur au HR précédent, donc le directeur de la clinique 1 n’a pas le droit de
dire que ses résultats ne sont pas bons à cause du casier judiciaire des personnes qu’il a eu à analyser. La clinique 2
continue d’être mieux même s’il faut tenir compte du casier judiciaire des patiens.

On remarque aussi que le HR de Prison_Record = 1.3213 est supérieur à 1, on déduit que ceux qui ont fait la prison
dans l’une comme l’autre clinique, ne finissaient pas en général leurs traitements.

Regréssion de COX avc la méthadone : on estime que le directeur de la clinique 1 peut encore se plaindre que la
dose de méthadone n’était pas la bonne pour ses patients.

8
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

Interprétation : avec l’ajustement, on voit que les grandes doses étaient mieux et l’on avait plus de chance de suivre
le traitement jusqu’au bout car les deux HR sur les résultats sont < 1. Ça prouve une fois de plus que la clinique 2 est
meilleure par rapport à la clinique 1.

Il manque de mettre les deux variables ensemble. Maintenant on aura 3 modèles : celui avec le casier judiciaire, celui
avec la dose de méthadone et celui avec les deux variables. Les antécédents judiciaires tendent à ne plus être
significatifs. Voici le résultat du 3e modèle lorsqu’on joint les deux variables au modèle.

TP du mardi 06 avril 2021


Fichier utilisé : DataHosmerMUD

Logiciel utilisé : SPSS

9
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

Au moins une variable a une différence significative (la valeur P de la race=2 est 0,606), donc on peut dire que la race
a une influence sur le poids du bébé à la naissance.

10
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

TP du 13 avril 2021 :
Fichier de travail : DataHosmerMUD

Outil logiciel : SPSS

Modèle de régression logistique en prenant toutes les variables, et leBWTLOW comme variable dépendante et la
RACE comme variable catégorielle.

Cette partie n’est importante que lorsqu’on veut comparer deux modèles.

Le plus grand Cox&Snell et Nagelkerke R est le meilleur modèle.

Remarque : on a fait des calculs et on peut dire que, l’algorithme a détecté 20.1% d’enfants de faible poids par
rapport à 31.2% d’enfants de faible poids observés. Quand un algorithme fait un tel travail, on mesure maintenant la
sensibilité pour deviner sa capacité à bien prédire les résultats. La sensibilité a donné 40.6% cad rien que 40% des
enfants qui étaient de faible poids ont été prédits être de faible poids.

Par contre, avec la spécificité, on trouve que 89% des enfants qui n’étaient psa de faibles poids ont été prédits ne
pas être de faibles poids. A partir de ces observations, on peut déduire que l’algorithme est plus spécifique que
sensible ; cad il prédit mieux les enfants qui ne sont pas de faible poids. Autrement on dirait que les résultats sont
plus surs quand les enfants ne sont pas de faible poids.

Après une analyse de régression linéaire, quand on fait ce tableau, on se concentre uniquement sur la dernière
colonne pour faire l’interprétation. Quand ça vaut zéro, on dira que

11
ISJ – Master1 – S2 – Statistique multivariée – Pr Nguefack

A partir de ce tableau, on cherche à présenter les valeurs en fonction de leur importance. Et pour savoir la valeur qui
pèse plus, on regarde les valeurs du coefficient beta standardisé en valeur absolue.

La valeur t représente celle du test de student. Et quand on regarde ça, c’est proportionnel à la valeur de béta. Plus
c’est grand, alors le Sig. A droite sera faible.

La dernière partie du tableau qui ressort la tolérance, quand la majorité des valeurs est au dessus de 80%, on dit qu’il
n’y a pas de collinéarité. Cad qu’il y a très peu de valeur redondante.

12

Vous aimerez peut-être aussi