Académique Documents
Professionnel Documents
Culture Documents
2024-04-02
Contents
Première visualisation 3
Recodage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Labelisation des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Statistiques univariée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Statistique bivariée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Distribution de chacune des variables suivant le statut de soins. . . . . . . . . . . . . . . . 9
Visualisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1
Analyse de trajectoire de soins
Dans ce papier nous analysons les types de données que sont les données longitudinales. Particulièrement
nous analysons des trajectoires de soins afin de comprendre les tendances qui se dégagent. Quatres
groupes se dégagent à savoirs les Hors soins, les Inaboutis, les Lents, et les Rapides.
Le jeu de données dont nous disposons est constitué de 49365 lignes dont 49365 observations distinctes
et de 8 variables. Ces variables sont id, month, care_status, sex, age, education, wealth, distance_clinic.
La première variable id est un identifiant des observations, la deuxième variable month renseigne
sur le mois de l’observation, la troisième variable care_status renseigne sur le statut de soins du
patient à chaque mois, la quatrième variable sex renseigne le sexe du patient, la cinquième variable
age contient l’âge du patient, la sixième variable education renseigne sur le niveau d’education de
patient, la septième variables wealth renseigne sur le niveau de richesse du patient et la huitième
distance_clinic renseigne sur la distance à laquelle est située la clinique la plus proche du patient.
Procedons au recodage des variables.
Afin de bien visualiser et analyser les données dont nous disposons nous procédons au recodage des
différentes variables. Les variables que nous recodons sont id en Identifiant du patient, Month en Mois,
care_status en Statut de soins du patient, sex en Sexe du patient, education en Niveau d’éducation,
wealth en Niveau de richesse et distance_clinic en Distance à la clinique la plus proche.
Nous labelisons la variables care_statuts en Diagnostiqué, En soins, Sous traitement, Sous contrôle,
sex en Homme et Femme, Education en trois niveaux que sont: Primaire, Secondaire et Supérieur,
Wealth en Bas, Moyen et Elevé et distance_clinic en Moins de 10Km et Plus de 10Km. Ceci nous
permettra d’évoluer dans la statistique univariée et bivariée.
3
Analyse de trajectoire de soins
Statistiques univariée
Dans la statistique univariée nous calculons pour les variables continues leur moyenne et leur écart-type
et pour les variables qualitatives leur effectif et le pourcentage de chacune de ses modalités. Ainsi
(51%) des patients ont été diagnostiqué, seulement (12%) sont entré en soins, seulement (27%) ont
initié leur traitement afin d’éradiquer la charge virale et seulement (9,3%) ont pui atteint le contrôle
de l’infection. Par ailleurs (64%) des patients sont des femmes contre (36%) pour les hommes. Il serait
interessant de voir l’evolution de cette variables suivant le statut de soins du patient. La plupart de
nos patients ont un âge compris entre 30 et 59 ans et ont un niveau d’éducation élévé c’est-à-dire
supérieur( ont étudié jusqu’à atteindre l’université). Les patients ont un niveau de richesse moyen et
la clinique la plus proche d’eux est à moins de 10km.
Caractéristique N = 49 365
Mois 11 (9)
Statut du soins du patient
Diagnostiqué 25 374 (51%)
En soins 5 886 (12%)
Sous traitement 13 509 (27%)
Sous contrôle 4 596 (9,3%)
Sexe du patient
Homme 17 781 (36%)
Femme 31 584 (64%)
Age du patient
16-29 16 911 (34%)
30-59 29 365 (59%)
60+ 3 089 (6,3%)
Niveau d’éducation
Primaire 10 417 (21%)
Secondaire 19 024 (39%)
Supérieur 19 924 (40%)
Groupe de richesse du patient
Bas 15 432 (31%)
Caractéristique N = 49 365
Afin de mieux comprendre l’évolution des différentes variables suivant le statut de soins du patient
nous abordons la statistique bivariée.
Statistique bivariée
Ainsi la plupart des patients dignostiqué ont entre 30 et 59 ans, sont des femmes, ont étudié jusqu’au
secondaire, ont un niveau de richesse moyen et habitent à moins de dix kilomètre d’une clinique
Sous Sous
Diagnostiqué,En soins, traitement, contrôle, N p- Total, N
Variables N = 25 374 N = 5 886 N = 13 509 = 4 596 valeur = 49 365
Sous Sous
Diagnostiqué,En soins, traitement, contrôle, N p- Total, N
Variables N = 25 374 N = 5 886 N = 13 509 = 4 596 valeur = 49 365
Pour la seule variable quantitative (month) l’analyse de la variance à un facteur est effectué afin de
juger de la différence dans les différents statuts de traitement. A cet effet on observe une différence
significative du mois dans les différents statut de soins du patient. C’est à dire le mois passé dans
les différents statuts de soins des patients n’est pas le même. Le test du hki-deux d’indépendance est
calculé pour juger de la significativité des variables catégorielles dans les différents statut de traitement
des patients. On obtient qu’il y une différence significative entre de ces variables dans les différents
status de soins. Les différentes variables sont donc pertinentes (significatives) dans l’analyse bivariée.
On présente maintenant une analyse multivariée des différentes variables. Le graphique suivant permet
de résumer cette information.
age
30−59 47.8% 11.4% 31.6% 9.2%
sex
Homme 62.1% 9.0%20.0%8.9%
wealth
Moyen 50.1% 11.7% 28.5% 9.7%
A présent présentons la distribution de chacune des variables suivant le statut de soins du patient.
On constate que (40,1%) de patients de 60 ans et plus sont diagnostiqué. Ensuite (14,2%) entrent en
soins et (36,9%) parviennent à entrer en traitement et puis (8,7%) ont atteint l’étape de contrôle de
l’infection.
Statut
age
30−59 47.8% 11.4% 31.6% 9.2%
wealth
Moyen 50.1% 11.7% 28.5% 9.7%
education
Secondaire 54.3% 11.4% 24.6% 9.6%
Visualisation
80%
60%
40%
20%
0%
80%
60%
40%
20%
0%
Dans cette partie nous analysons le temps passé entre deux évènements i.e le temps jusqu’à la survenue
d’un certain evènement. Nous analysons donc le temps entre le diagnostique d’un patient et son entrée
en soins, ou le temps entre son entrée en soins et l’initiation de son traitement, ou encore le temps entre
l’initiation de son traitement et le contrôle de l’infection. Cette analyse nous permettra de comprendre
le temps passé entre les différents états et aussi les facteurs explicatifs de l’entree dans les différents
états.
Survie simple
75%
50%
Entrée en soins du patient
Inititation du traitement du patient
Contrôle de l'infection du patient
25%
0%
0 6 12 18 24 30 36
Mois depuis le diagnostique
D’après ce graphique, l’entrée en soins du patient après son diagnostique s’effectue de manière rapide
contrairement à l’initiation du traitement qui ele s’effectue de manière lente après le diagnostique, et
13
Analyse de trajectoire de soins
aussi par rapport au contrôle de l’infection du patient qui s’effectue de manière encore beaucoup plus
lente après le diagnostique.
Entrée en soins du patient Inititation du traitement du patient Contrôle de l'infection du patient
75%
25%
0%
0 6 12 18 24 30 36 0 6 12 18 24 30 36 0 6 12 18 24 30 36
Mois depuis l'étape précendante
Les résultats montrent que l’entrée en soins des patients se fait de façon lente. Par contre une fois en
soins l’initiation du traitement se fait de manière rapide.Toutefois le contrôle de l’infection n’est pas
effectuée de manière aussi rapide que l’initation de traitement mais est effectuée de manière rapide
plus que l’entrée en soins.
Afin de comprendre mieux d’autres facteurs qui interviennent dans l’entrée en soins des patients, ou
l’initiation de leur traitement, ou le contrôle de l’infection, on realise une analyse de survie par sexe
entre les états sucessifs.
75%
Entrée en soins du patient
Inititation du traitement du patient
Contrôle de l'infection du patient
50%
female
25%
male
0%
0 6 12 18 24 30 36 0 6 12 18 24 30 36 0 6 12 18 24 30 36
Mois depuis le diagnostique
On constate que que l’initiation du traitement ne varie vraiment pas suivant le sexe i.e ce facteur n’est
vraiment pas explicatif de l’initiation du traitement chez les patients. Par contre on constate qu’il
y a une large différence entre l’entrée en soins chez les patients hommes et chez les patients femmes.
C’est-à-dire que les patients femmes ont tendance à vite entrée en soins après leur diagnostique. Ce qui
n’est pas remarqué quant à l’inititition du traitement. La différence observée entre temps au niveau de
l’étape de dignostique et de l’entrée en soins ne s’observe plus entre les deux sexes à cette étape.
0.6
0.4
0.2
0.0
M0 M4 M8 M12 M16 M20 M24 M28 M32 M36 M40 M44 M48
Maintenant nous allons essayer de voir s’il y a des typologies qui émergent. Nous utilisons l’Optimal
Maching. Cet algorithme calcule le coût minimal pour passer d’un état à un autre.
16
M0
M1
M2
Dendrogramme
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
Page 17
Analyse de trajectoire de soins
Analyse de trajectoire de soins
1.0
0.8
Rel. Freq. (n=1317)
0.6
0.4
0.2
0.0
M0
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
M16
M17
M18
Nous allons à présent utiliser certains indicateurs afin de définir le nombre de classes à retenir.
3
2
1
Indicators
HG ( −2.42 / 0.83 )
HGSD ( −2.42 / 0.83 )
ASW ( −0.95 / 3.05 )
−2
HC ( −0.79 / 2.63 )
5 10 15 20
N clusters
6 23 85 410 Total
typo_cah
1 522 4 0 39 565
2 0 3 330 3 336
3 1 203 59 13 276
4 23 0 5 112 140
Total 546 210 394 167 1 317
1 2
3 4
1 43 92 148 211 274
1 22 47 72 97 125
276 seq. (n=276)
M0 M2 M4 M6 M8 M10 M12 M14 M16 M18 M0 M2 M4 M6 M8 M10 M12 M14 M16 M18
1 2
565 seq. (n=565), sorted
M0 M2 M4 M6 M8 M10 M12 M14 M16 M18 M0 M2 M4 M6 M8 M10 M12 M14 M16 M18
3 4
1 43 92 148 211 274
276 seq. (n=276), sorted
1 22 47 72 97 125
M0 M2 M4 M6 M8 M10 M12 M14 M16 M18 M0 M2 M4 M6 M8 M10 M12 M14 M16 M18
23 410
1 33 70 112 160 208
1 27 57 87 121 159
210 seq. (n=210), sorted
6 85
546 seq. (n=546), sorted
M0 M2 M4 M6 M8 M10 M12 M14 M16 M18 M0 M2 M4 M6 M8 M10 M12 M14 M16 M18
PBC 0, 70 0, 71
HG 0, 93 0, 95
HGSD 0, 93 0, 95
ASW 0, 53 0, 57
ASWw 0, 53 0, 57
CH 938, 97 1023, 12
R2 0, 68 0, 70
CHsq 3351, 21 3980, 60
R2sq 0, 88 0, 90
HC 0, 03 0, 02
Rapides
Lents
care_statusF
diagnosed, but not in care
Inaboutis
in care, but not on treatment
on treatment, but infection not suppressed
on treatment and suppressed infection
Hors soins
M0 M6 M12 M18
Dans le chapitre qui vient de terminer nous avons identifier quatre classes que sont les Rapides,
Lents, Hors soins et les Inaboutis. Nous cherchons maintenant à connaîte les différents facteurs
explicatifs de ces différentes classes (groupes) obtenus.
Pour cela nous menons une analyse bivariée de ces différents groupes.
25
Analyse de trajectoire de soins
D’après le tableau ci-haut 24% des Rapides sont des jeunes entre 16-29 ans, 68% ont entre 30-59
ans contre seulement 7,4% pour les personnes agées. Les personnes qui initient vite leur traitement
après leur diagnostique et parviennent à l’achever sont majoritairemeent des adultes de 30-59 ans. Ce
groupe des Rapides est essentiellement constituée des femmes et 56% sont de ces patients à moins de
10km d’une clinique. Les patients qui mettent très peu de temps à achever leur traitement sont des
femmes. Dans ce même groupe, les patients ont un niveau d’éducation supérieur. Donc les patients
femmes agés entre 30 et 59 ans et ayant atteint le supérieur arrivent à initier un traitement et arrivent
à aller jusqu’au bout de ce traitement pour éradiquer commplètement l’infection.
Le deuxième Lents i.e moins rapide que le premier est toujours constitué majoritairement des personnes
de 30 et 59 ans, moins de personnes de 16-29ans (34%) et encore moins de des personnes du troisième
âge 60ans. Dans ce groupe encore les femmes sont majoritaires (71%). Les personnes de ce groupe ont
étudié jusqu’à un niveau secondaire et 61% de ces patients sont à 10km d’une clinque.
Le troisième groupe est toujours constitué des personnes qui ont entre 30-59 ans soit 54%, ensuite
des patients jeunes (37%), et enfin les patients du troisième âge (8,4%). Les femmes sont toujours
dominants dans ce groupe (75%) comme dans les autres ailleurs et le niveau supérieur est le plus
présent (46%), ensuite le secondaire (37%) et enfin le primaire (18%), 61% d’eux habitent au moins à
moins ou à 10km d’une clinique.
Le quatrième et dernier groupe qui sont les Inaboutis est constitué des adultes femmes (55%) qui
ont entrent 30-59ans, et également des patients ayant etudié jusqu’au secondaire comme au supérieur
(39%) et 51% sont au moins à moins ou à 10km d’une clinique.
Le graphique suivant permet de faire une analyse multivariée des différentes classes obtenues.
age
30−59 35.0% 16.6% 11.8% 36.5%
sex
male 23.1% 13.6% 9.3% 54.0%
education
secondary 26.1% 17.2% 12.7% 44.0%
distance
less than 10 km 30.2% 17.6% 14.0% 38.2%
wealth
middle 30.9% 17.9% 11.2% 40.0%
Selon ce graphique les jeunes enfants 16-29 (50.6%) ont tendance à être Hors soins, suivi des 30-59
ans (36,5%) et ensuite les personnes âgées 60 ans et plus (35,7 ). Aussi les hommes (54%) ont
tendance à être Hors soins. Les patients ayant étudié jusqu’au primaire sont tendance à être Hors
soins. La plupart des patients ressortent des soins.
groupe
age
30−59 68.3% 61.0% 54.5% 51.5%
sex
male 26.4% 29.0% 25.1% 44.5%
std.resid
higher 52.0% 38.1% 45.5% 38.6%
3
education
secondary 32.0% 39.5% 36.5% 38.8% 2
−2
primary 16.0% 22.4% 18.0% 22.5% −3
distance
less than 10 km 55.8% 61.0% 61.1% 50.9%
wealth
middle 39.8% 43.3% 34.1% 37.2%
Rapides sex
male — —
female 2,40 1,80 – 3,19 <0,001
age group
16-29 — —
30-59 2,26 1,64 – 3,12 <0,001
primary — —
secondary 1,23 0,75 – 2,02 0,4
higher 1,38 0,82 – 2,34 0,2
distance to nearest clinic
less than 10 km — —
10 km or more 0,66 0,46 – 0,94 0,021
sex
male
female
age group
16−29
30−59
60+
education level
primary
secondary
higher
10 km or more
female
age group
16−29
30−59
60+
education level
primary
secondary
higher
10 km or more
Variable N Estimate p
sex male 450 Reference
female 867 0.87 (0.59, 1.16) <0.001
female 867 0.71 (0.36, 1.06) <0.001
female 867 0.90 (0.51, 1.29) <0.001
age group 16−29 464 Reference
30−59 769 0.82 (0.49, 1.14) <0.001
30−59 769 0.55 (0.18, 0.92) 0.004
30−59 769 0.20 (−0.21, 0.61) 0.347
60+ 84 0.79 (0.16, 1.41) 0.013
60+ 84 0.47 (−0.33, 1.28) 0.251
60+ 84 0.55 (−0.23, 1.33) 0.165
education level primary 263 Reference
secondary 482 0.18 (−0.20, 0.57) 0.350
secondary 482 0.06 (−0.37, 0.48) 0.795
secondary 482 0.21 (−0.29, 0.70) 0.417
higher 572 0.37 (−0.03, 0.76) 0.068
higher 572 −0.17 (−0.63, 0.29) 0.474
higher 572 0.33 (−0.20, 0.85) 0.225
distance to nearest clinicless than 10 km728 Reference
10 km or more 589 −0.21 (−0.48, 0.06) 0.123
10 km or more 589 −0.40 (−0.72, −0.07) 0.018
10 km or more 589 −0.42 (−0.78, −0.06) 0.021
−0.5 0 0.5 1
group
group
male female male female 16−29 30−59 60+16−29 30−59 60+ primary
secondaryhigher
primary
secondary
higher
less than 10 km
10 kmless
or more
than 10 km
10 km or more
Lents Inaboutis
50%
40%
30%
20%
10%
less than 10 km
10 kmless
or more
than 10 km
10 km or more
distance to nearest clinic
34
Analyse de trajectoire de soins
sexFfemale
ageF30−59
ageF60+
educationFsecondary
educationFhigher
monthF2
monthF3
monthF4
monthF5
monthF6
monthF7
monthF8
monthF9
monthF10
monthF11
monthF12
monthF13
monthF14
monthF15
monthF16
monthF17
monthF18
monthF19
monthF20
monthF21
monthF22
monthF23
monthF24
monthF25
monthF26
monthF27
monthF28
monthF29
monthF30
monthF31
monthF32
monthF33
monthF34
monthF35
monthF36
1 3 10
estimate