Académique Documents
Professionnel Documents
Culture Documents
regresin multinivel
VctorAbraira
UnidaddeBioestadsticaClnica
Marzo2014
Objetivos
Conocerlosfundamentosyposibilidadesdeaplicacin
de los modelos de regresin multinivel en estudios de
delosmodelosderegresinmultinivelenestudiosde
epidemiologaclnica
Aprenderaaplicar,conStata13,losmodelosderegresin
multiniveldevariabledependientecontinuaydicotmica
einterpretarlassalidas
Revisaralgunaspublicacionesseleccionadascomo
modelosdepresentacinderesultados
Programa
1sesin
Introduccin.
enquconsistenlosmodelosmultinivel?
i
l
d l
l i i l?
quproblemasresuelven?
Efectosdegrupo.Efectoscomposicionalesycontextuales
Modelobsico(modelovaco)decomponentesdelavarianza
EstimacinconStata.
Modelodedosnivelesconvariabledependientecontinuaypendientescomunesentregrupos
Planteamiento.
Especificacindevariostiposdemodelos
Pull de datos
Pulldedatos
Efectosfijosdegrupo
Efectosaleatorioseneltrminoindependiente
Prediccindelosefectosdelgrupo
EjerciciosconStata
Programa
2sesin
Modelodedosnivelesconvariabledependientecontinuaycoeficientesaleatoriosenlaspendientes
Especificacin e interpretacin
Especificacineinterpretacin
Estrategiadeespecificacindelmodelo
EjerciciosconStata
Discusindecasos(artculospublicados)
3sesin
Modeloderegresinlogsticadedosniveles
ElMedianoddsratio(MOR).EstimacinconStata
Interpretacin.EjemploAUDIPOC
Generalizaciones:
Tres y ms niveles
Tresymsniveles
Clasificacionesmixtas.
SMRconmultinivel
EjerciciosconStata
4Sesin
EjerciciosconStatayDiscusindecasos(artculospublicados)
V. Abraira - Bioestadistica Clnica
Sinnimos
Modeloslinealesjerrquicos
deestructurasdelacovarianza
d
t t
d l
i
mixtos(Stata)
paradatoslongitudinalesodepanel
decomponentesdeerror
de parmetros aleatorios
deparmetrosaleatorios
esuncasoparticulardelosmodeloslineales
generalizados
V. Abraira - Bioestadstica Clnica
Paraqu?
Estructuradedatosjerrquica;muestreo
lti t i
multietpico
Losindividuospertenecenagruposylosdeun
mismogrupocompartencaractersticas
pacientes,mdicos
medidasrepetidasdeunmismopaciente
medidas repetidas de un mismo paciente
Estimarlosefectosdelosdiferentesniveles
Quproblemasresuelven?
Manejanlafaltadeindependencia
EstimacinMCOineficiente
Estimacin MCO ineficiente
Significacionesespurias(ej.10pacientes,acadaunole
medimosmensualmentedurante12meses)
Evitanfalaciasporinterpretarefectosanivelequivocado
Ecolgica(interpretardatosagregadosanivelindividual)
Atomstica(interpretardatosindividualesanivelagregado)
JournalofEpidemiologyandCommunityHealth.2001;55:791798.
Quproblemasresuelven?
Estimanelefectodelasvariablesexplicativas
(efectos
fijos) de ambos niveles incluyendo
(efectosfijos)deambosniveles,incluyendo
interaccionesentreniveles
Estimanqupartedelavariabilidadnoexplicada
(efectosaleatorios)esimputableacadanivel
Manejaneficientementedatosfaltantes,sin
imputacin (diseos longitudinales)
imputacin(diseoslongitudinales)
ChakrabortyH,GuH.AMixedModelApproachforIntenttoTreatAnalysisin
LongitudinalClinicalTrialswithMissingValues.ResearchTrianglePark,NC:RTIPress
publicationNo.MR00090903;2009.
V. Abraira Bioestadstica Clnica
Efectosdelgrupo
Efectoscomposicionales:
Lacomposicindelosgruposnoesaleatoria,est
enpartecondicionadaporfactoresasociadoscon
eloutcome(losgruposnosonintercambiables)
Efectoscontextuales:
Elperteneceraungrupoestablecediferencias
Efectosdegrupo
Informacinoruido?
Aveces,elmuestreomultietpicosehacepor
motivosdecoste,oporfactibilidad
Lacorrelacinentreobservacionesesruidoque
dificultaelanlisis
Otras,sediseaparaestudiarelfenmeno
multinivel
Lacorrelacinesinformacin
10
Modelolineal
Modelomultiniveldeefectosaleatoriosdegrupo
enlaconstante(intercept)
Efectosfijos
m
ij
Yij 0 1 xij 2 z j u0 j ij
efectoaleatoriodelgrupoj
0 02
en la constante N 0,
enlaconstante
2
0
2
0
0 j 0 u0 j
efectoaleatoriodelindividuo
idelgrupoj N 0, 2
11
Modelonulo
Modelomultiniveldeefectosaleatoriosdegrupo
enlaconstante,sinvariablesexplicativas
Yij 0 u0 j ij
Anova de1vaefectos
aleatorios
efectoaleatoriodelgrupoj
N 0,
0 02
efectoaleatoriodelindividuo
idelgrupoj N 0, 2
12
Ejemplo1
Rendimientoenmatemticasdeniosingleses(nivel1),en
distintoscolegios(nivel2)
distintos colegios (nivel 2)
Variable
Obs
Mean
Min
Max
school
student
cons
minority
female
7185
7185
7185
7185
7185
5277.898
24.50814
1
.274739
.5281837
2499.578
15.20242
0
.4464137
.4992398
Std. Dev.
1224
1
1
0
0
9586
67
1
1
1
ses
cses
mathach
size
sector
7185
7185
7185
7185
7185
-9.80e-18
-5.75e-17
12.74785
1056.862
.4931106
4931106
.7793552
.660588
6.878246
604.1725
.4999873
4999873
-3.758143
-3.650741
-2.832
100
0
2.691857
2.856078
24.993
2713
1
pracad
disclim
himinty
alumno
cole
7185
7185
7185
7185
7185
.5344871
-.1318694
.2800278
3593
79.96298
.2511861
.9439882
.4490438
2074.275
45.4351
0
-2.416
0
1
1
1
2.756
1
7185
160
meanses
u0_M1
7185
7185
4.55e-17
.1108788
.4135432
2.71679
-1.194089
-7.40282
.8248391
6.477807
13
Ejemplo1:Hayefectocolegio?
oneway mathach cole, tab
153
154
155
156
157
158
159
160
10.279632
11.178552
11
178552
13.538754
15.270623
10.355468
13.574657
11.089138
14.863695
7.2143938
6 923074
6.923074
5.8539039
7.0669376
6.523218
6.4640023
7.8779978
6.4159995
19
29
57
53
47
35
29
59
Total
12.747853
6.8782457
7185
Source
Between groups
Within groups
Total
Analysis of Variance
SS
df
MS
j
F
64906.9571
274969.977
159
7025
408.219856
39.1416338
339876.934
7184
47.3102637
Prob > F
10.43
0.17360
Asy.
S.E.
0.01849
0.13737
2
0
nj
Componente
p
aadida
2
0
0.0000
0.20983
2.86748
6.256327
0.90412
M SB M SW
nj
14
Modelomultinivel
15
Modelomultinivel
16
Salidademultinivelvacio
mixed mathach || cole:, stddeviations
Mixed
effects ML regression
Mixed-effects
Group variable: cole
Number of obs
Number of groups
Yij 0 u0 j ij
Log likelihood = -23557.905
=
=
7185
160
14
44.9
67
Wald chi2(0)
Prob > chi2
=
=
.
.
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------_cons |
12.63707
.2436178
51.87
0.000
12.15959
13.11455
------------------------------------------------------------------------------
153
154
155
156
157
158
159
160
10.279632
11.178552
13.538754
15.270623
10.355468
13.574657
11.089138
14.863695
7.2143938
6.923074
5.8539039
7.0669376
6.523218
6.4640023
7.8779978
6.4159995
Total
12.747853
6.8782457
Asy.
S.E.
[95% Conf. Interval]
-----------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
0.01849
0.13737
0.20983
-----------------------------+-----------------------------------------------cole: Identity
|
D of cole effect
2.86748
sd(_cons) |
2.92464
.1826963
2.587615
3.305562
D within cole
6.256327
-----------------------------+-----------------------------------------------ility of a cole mean
0.90412
sd(Residual) |
6.256868
.0527937
6.154245
6.361202
ated at n=44.89)
-----------------------------------------------------------------------------LR test vs. linear regression: chibar2(01) =
983.92 Prob >= chibar2 = 0.0000
17
Contrminosfijos
P.e. delnio:sexoyses ydelcolegio:sectorytamao
18
Contrminosfijos
Yij 0 1 xij 2 z j u0 j ij
Mixed-effects ML regression
Group
variable:
cole
G
i bl
l
Log likelihood =
-23275.08
Number of obs
Number
of
N b
f groups
=
=
7185
160
14
44.9
max =
=
=
67
651.61
0.0000
Wald chi2(4)
Prob > chi2
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------female | -1.201091
.1641199
-7.32
0.000
-1.52276
-.8794216
ses |
2.345177
.1050492
22.32
0.000
2.139284
2.55107
size |
.0004972
.0002894
1.72
0.086
-.00007
.0010645
sector
t
|
2.37775
2 37775
.3633391
3633391
6.54
6 54
0.000
0 000
1.665619
1 665619
3.089882
3 089882
_cons |
11.67948
.4543243
25.71
0.000
10.78902
12.56994
----------------------------------------------------------------------------------------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------cole: Identity
|
var(_cons) |
3.270243
.4811775
2.450957
4.363392
-----------------------------+-----------------------------------------------var(Residual) |
36.80649
.6215722
35.60817
38.04513
-----------------------------------------------------------------------------LR test vs. linear regression: chibar2(01) =
292.62 Prob >= chibar2 = 0.0000
3, 2 7
8, 2 %
3, 2 7 3 6 , 8 1
19
ClculodelCCI
20
10
ClculodelCCI
. estat icc
Residual intraclass correlation
-----------------------------------------------------------------------------Level |
ICC
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------cole |
.0815995
.0111515
.0622422
.1062947
------------------------------------------------------------------------------
21
0,347 0,258
0,347
22
11
PrcticaconStata
23
Programa
1sesin
Introduccin.
i
l
d l
l i i l?
enquconsistenlosmodelosmultinivel?
quproblemasresuelven?
Efectosdegrupo.Efectoscomposicionalesycontextuales
Modelobsico(modelovaco)decomponentesdelavarianza
EstimacinconStata.
Modelodedosnivelesconvariabledependientecontinuaypendientescomunesentregrupos
Planteamiento.
Especificacindevariostiposdemodelos
Pull dedatos
de datos
Efectosfijosdegrupo
Efectosaleatorioseneltrminoindependiente
Prediccindelosefectosdelgrupo
EjerciciosconStata.
24
12
Repasemoselmodelo
Modelopulldedatos:
Yij 0 1 xij 2 z j ij
(asumeidnticaestructuraentregrupos)
Modelodeefectosfijosenlaconstante
Yij 0 j 1 xij 2 z j 1d1 ... k 1d k 1 ij
(condummyparalosgrupos)
Modelomultinivel
Modelo multinivel
Yij 0 1 xij 2 z j u0 j ij
(asumegruposextradosalazardeunapoblacindegrupos)
25
Pull,multinivel
Source
SS
df
MS
Model
Residual
54225.5272
285651.407
3
7181
18075.1757
39.7787783
Total
339876.934
7184
47.3102637
mathach
Coef.
female
ses
sector
_cons
-1.403538
2.88413
1.96315
12.52113
Std. Err.
.149424
.0974835
.1516053
.1308468
t
-9.39
29.59
12.95
95.69
Number of obs
F( 3, 7181)
Prob > F
R-squared
Adj R
R-squared
squared
Root MSE
P>|t|
0.000
0.000
0.000
0.000
=
=
=
=
=
=
7185
454.39
0.0000
0.1595
0.1592
6.307
regress
-1.110623
3.075226
2.260341
12.77763
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------female | -1.204518
.1641914
-7.34
0.000
-1.526327
-.8827087
ses |
2.343935
.1050997
22.30
0.000
2.137943
2.549927
sector |
2.09957
.3275687
6.41
0.000
1.457547
2.741593
_cons |
12.34793
.2352288
52.49
0.000
11.88689
12.80897
----------------------------------------------------------------------------------------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------cole: Identity
|
var(_cons) |
3.334901
.4897675
2.500775
4.447249
-----------------------------+-----------------------------------------------var(Residual) |
36.80888
.6216452
35.61042
38.04767
-----------------------------------------------------------------------------LR test vs. linear regression: chibar2(01) =
297.80 Prob >= chibar2 = 0.0000
mixed
26
13
Efectosfijosenlaconstante
. regres mathach female ses sector i.cole
note: 160.cole omitted because of collinearity
Source |
SS
df
MS
-------------+-----------------------------+
Model |
81558.568
161 506.574956
Residual | 258318.366 7023 36.7817694
-------------+-----------------------------Total | 339876.934 7184 47.3102637
Number of obs
F(161, 7023)
F(161
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
7185
13.77
13 77
0.0000
0.2400
0.2225
6.0648
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------female | -1.120932
.1699514
-6.60
0.000
-1.454088
-.7877759
ses |
2.154587
.1084604
19.87
0.000
1.941971
2.367202
sector |
3.327148
1.193584
2.79
0.005
.9873639
5.666932
|
cole |
2 |
2.422861
1.502676
1.61
0.107
-.522838
5.368559
3 | -2.042482
2 042482
1.244569
1 244569
-1.64
1 64
0.101
0 101
-4.482213
4 482213
.3972492
3972492
4 |
.4715783
1.578502
0.30
0.765
-2.622763
3.565919
5 | -1.091731
1.179238
-0.93
0.355
-3.403393
1.219931
156
157
158
159
160
| -.1385636
1.16088
-0.12
0.905
-2.414238
2.137111
| -.6087337
1.252587
-0.49
0.627
-3.064182
1.846715
| -.7743099
1.308213
-0.59
0.554
-3.338803
1.790183
|
.3901225
1.433136
0.27
0.785
-2.419257
3.199502
|
0 (omitted)
|
_cons |
11.31946
.8913894
12.70
0.000
9.572068
13.06685
------------------------------------------------------------------------------
27
Multinivel,GEE
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------female | -1.204518
.1641914
-7.34
0.000
-1.526327
-.8827087
ses |
2.343935
.1050997
22.30
0.000
2.137943
2.549927
sector |
2.09957
.3275687
6.41
0.000
1.457547
2.741593
_cons |
12.34793
.2352288
52.49
0.000
11.88689
12.80897
----------------------------------------------------------------------------------------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------cole: Identity
|
var(_cons) |
3.334901
.4897675
2.500775
4.447249
-----------------------------+-----------------------------------------------var(Residual) |
36.80888
.6216452
35.61042
38.04767
-----------------------------------------------------------------------------LR test vs. linear regression: chibar2(01) =
297.80 Prob >= chibar2 = 0.0000
GEE population-averaged model
Group variable:
cole
Li k
Link:
id tit
identity
Family:
Gaussian
Correlation:
exchangeable
Scale parameter:
Number of obs
Number of groups
Obs per group: min
Ob
i
avg
max
Wald chi2(3)
Prob > chi2
39.92755
mathach
Coef.
female
ses
sector
_cons
-1.214257
2.36694
2.092795
12.35648
Std. Err.
.1640118
.1050337
.3089145
.223881
z
-7.40
22.54
6.77
55.19
P>|z|
0.000
0.000
0.000
0.000
=
=
=
=
=
=
=
7185
160
14
44.9
67
666.92
0.0000
mixed
xtgee
-.8928001
2.572803
2.698256
12.79528
28
14
Multinivel,panel
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------female | -1.204518
.1641914
-7.34
0.000
-1.526327
-.8827087
ses |
2.343935
.1050997
22.30
0.000
2.137943
2.549927
sector |
2.09957
.3275687
6.41
0.000
1.457547
2.741593
_cons |
12.34793
.2352288
52.49
0.000
11.88689
12.80897
----------------------------------------------------------------------------------------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------cole: Identity
|
sd(_cons) |
1.826171
.1340968
1.581384
2.10885
-----------------------------+-----------------------------------------------sd(Residual) |
6.067032
.0512314
5.967447
6.168279
-----------------------------------------------------------------------------LR test vs. linear regression: chibar2(01) =
297.80 Prob >= chibar2 = 0.0000
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------+
female | -1.204518
.164427
-7.33
0.000
-1.526789
-.882247
ses |
2.343935
.1071159
21.88
0.000
2.133992
2.553878
sector |
2.09957
.3276265
6.41
0.000
1.457434
2.741706
_cons |
12.34793
.2353565
52.46
0.000
11.88664
12.80922
-------------+---------------------------------------------------------------/sigma_u |
1.826171
.1340967
1.581384
2.108849
/sigma_e |
6.067032
.0512314
5.967447
6.168279
rho |
.0830739
.0113139
.0630497
.1075412
-----------------------------------------------------------------------------Likelihood-ratio test of sigma_u=0: chibar2(01)= 297.80 Prob>=chibar2 = 0.000
mixed, stddev
xtreg, mle
29
Y
Variablesagregadasdegrupo,p.e.sesmediode
los nios del colegio
losniosdelcolegio
Cuandoenelmodelointroducimosunavariablea
nivelindividualytambinelpromediodelgrupo,
convienecentrarlaindividual,paraqueel
coeficientedelamediadelgruposeaelefectode
la media del grupo sobre el rendimiento medio de
lamediadelgruposobreelrendimientomediode
losindividuos(coeficientederegresinentre
grupos)
V. Abraira - Bioestadistica Clnica
30
15
Tambin
Aveces,eltamaodelgrupoesunavariable
explicativa
li ti
Sihaymissing,el%demissing.Sifuera
significativoindicaraquelosmissingnosonal
azar
31
Ejemplo
Mixed-effects ML regression
Group variable: cole
Number of obs
Number of groups
=
=
7185
160
14
44.9
67
Wald chi2(5)
Prob > chi2
=
=
805.65
0.0000
-----------------------------------------------------------------------------mathach |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cses |
2.152197
.1084602
19.84
0.000
1.939618
2.364775
meanses |
5.19679
.3503994
14.83
0.000
4.510019
5.88356
female | -1.194158
.1617788
-7.38
0.000
-1.511238
-.8770771
size |
.0004089
.0002434
1.68
0.093
-.0000682
.000886
sector |
1.48491
.3216624
4.62
0.000
.8544635
2.115357
_cons |
12.19069
.3884165
31.39
0.000
11.42941
12.95197
----------------------------------------------------------------------------------------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------cole: Identity
|
var(_cons) |
2.049609
.3304243
1.494329
2.811228
-----------------------------+-----------------------------------------------var(Residual) |
36.79069
.6209387
35.59358
38.02806
-----------------------------------------------------------------------------LR test vs. linear regression: chibar2(01) =
181.89 Prob >= chibar2 = 0.0000
32
16
Estimacindeefectosdegrupos
Unavezestimadoelmodelo,sepueden
predecirlosefectosdecadagrupo:u
d i l
f t d
d
0j
ApartirdelestimadorempricodeBayes,ode
shrinkage, paralamediadelgrupoque,enel
modelovacio,eslamediadelasmediasdel
g p y
grupoylatotal,ponderadasporlareliability
,p
p
y
delamediadelgrupo
Yj EB = l jY. j + (1 - l j )Y..
u0 j = Yj EB -Y..
33
34
17
ConStata
-4
twoway(droplineres_baycole)
50
100
150
cole
35
-10
-5
50
100
150
cole
BLUP r.e. for cole: _cons
ls_bay_res/li_bay_res
twoway(scatterres_bascole)(rbarls_res_bayli_res__baycole)
V. Abraira - Bioestadstica Clnica
36
18
PrcticaconStata
37
Programa
2sesin
Modelodedosnivelesconvariabledependientecontinuaycoeficientesaleatoriosenlaspendientes
Especificacin e interpretacin
Especificacineinterpretacin
Estrategiadeespecificacindelmodelo
EjerciciosconStata
Discusindecasos(artculospublicados)
3sesin
Modeloderegresinlogsticadedosniveles
ElMedianoddsratio(MOR).EstimacinconStata
Interpretacin.EjemploAUDIPOC
Generalizaciones:
Tres y ms niveles
Tresymsniveles
Clasificacionesmixtas.
SMRconmultinivel
EjerciciosconStata
4Sesin
EjerciciosconStatayDiscusindecasos(artculospublicados)
V. Abraira - Bioestadistica Clnica
38
19
Efectosaleatoriosenlaspendientes
Yij 0 1 xij 2 z j u0 j u1 j xij ij
02 Var (u0 )
12 Var (u1 )
ed values
Fitte
10
15
1 j 1 u1 j
20
0 j 0 u0 j
01 Cov(u0 , u1 )
2 Var ( ij )
-2
-1
0
1
Estatus socioeconomico del alumno (media cero global)
39
Efectosaleatoriosenlaspendientes
AhoralavarianzadeYcondicionadaax
d
d d
l t t
t
dependedex,
yporlotanto,varaentre
individuos
Portanto,lacorrelacinintragrupodepende
delosvaloresdelasx yesdiferenteentre
individuos
Comoelmodelosuponequelosefectosdel
grupo,(u0j+u1jxj)dependendex,es
convenientecentrar lasX
V. Abraira - Bioestadstica Clnica
40
20
Ejemplo
Elefectodelacondicinsocioeconmicadel
nioinfluyesobreelrendimientoescolar
i i fl
b
l
di i t
l
igual entodosloscolegios?
Incluyamosefectoaleatorioenlapendiente
exc:s 02 = s 12
ide:am bos
mixed mathach cses || cole: cses, covariance(unstructured)
V. Abraira - Bioestadstica Clnica
41
Salida
Obs per group: min =
avg =
max =
Wald chi2(5)
Prob > chi2
Coef.
female
cses
meanses
size
sector
_cons
-1.183367
2.155203
5.094703
.000405
1.649098
12.11705
Std. Err.
.161815
.1269245
.3542385
.000246
.3251591
.392702
Random-effects Parameters
P>|z|
-7.31
16.98
14.38
1.65
5.07
30.86
0.000
0.000
0.000
0.100
0.000
0.000
=
=
14
44.9
67
691.96
0.0000
-.8662157
2.40397
5.788998
.0008871
2.286398
12.88673
Estimate
Std. Err.
var(cses)
var(_cons)
cov(cses,_cons)
.6491731
2.145803
.2612122
.2739385
.3461413
.2524898
.283903
1.564162
-.2336587
1.4844
2.943729
.7560831
var(Residual)
36.50946
.62255
35.30945
37.75026
cole: Unstructured
chi2(3) =
196.62
42
21
Preguntacapciosa
CuleselCCIdelcolegio?
cole: Unstructured
Hayunoparacadavalordelcses
Bien,culeselCCIparacses=2?
var(cses)
var(_cons)
cov(cses,_cons)
.6491731
2.145803
.2612122
.2739385
.3461413
.2524898
.283903
1.564162
-.2336587
1.4844
2.943729
.7560831
var(Residual)
36.50946
.62255
35.30945
37.75026
Eag u0 j x j u1 j
chi2(3) =
196.62
var( Eag ) 02 x 2j 12 2 x j 01
5, 7 9
1 3, 7 %
5, 79 36, 5 1
V. Abraira - Bioestadstica Clnica
43
12
20
140
Visualizacin:Ejemplosimulado
presinarterialydiurtico
Variable
Obs
Mean
pad
259
91.91502
Std. Dev.
15.31825
Min
Max
56.84752
130.3824
80
100
-> diuretico = 0
-> diuretico = 1
Obs
Mean
pad
241
81.36483
Std. Dev.
15.06054
Min
Max
47.97024
118.1932
40
60
Variable
1
diuretico
Source
Yi 0 1 xi i
SS
Model
Residual
13895.2673
114976.123
Total
128871.39
pad
Coef.
diuretico
_cons
-10.55018
91.91502
df
MS
1
498
13895.2673
230.875749
499
258.259299
Std. Err.
1.359928
.9441463
t
-7.76
97.35
Number of obs
F( 1,
498)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.000
0.000
=
=
=
=
=
=
500
60.19
0.0000
0.1078
0.1060
15.195
-7.878282
93.77002
44
22
100
120
140
Haydistintosmdicos
40
60
80
Yij 0 1 xij u0 j ij
0
1
diuretico
pad
Coef
Coef.
diuretico
_cons
-8.590804
90.97059
Std Err.
Std.
Err
.893535
5.810326
Random-effects Parameters
z
-9.61
15.66
P>|z|
[95% Conf.
Conf Interval]
0.000
0.000
-10.3421
79.58256
-6.839508
102.3586
Estimate
Std. Err.
sd(_cons)
12.91875
4.594445
6.434247
25.9384
sd(Residual)
9.888966
.3146099
9.291173
10.52522
medico: Identity
45
100
120
140
Efectoaleatorioenlapendiente
Corr>0
60
80
Corr<0
1
diuretico
Coef.
diuretico
_cons
-11.99255
92.07354
Std. Err.
3.566427
4.835521
Random-effects Parameters
P>|z|
-3.36
19.04
Estimate
0.001
0.000
Std. Err.
-5.002477
101.551
medico: Unstructured
sd(diuret~o)
sd(_cons)
corr(diuret~o,_cons)
7.707722
10.70564
-.9831189
2.916992
3.863978
.0267974
3.671033
5.277027
-.9992617
16.18318
21.71882
-.6719174
sd(Residual)
10.11895
.3232188
9.504872
10.77269
chi2(3) =
163.85
pad
Coef.
diuretico
_cons
-6.330363
91.14343
Std. Err.
1.906372
5.100366
Random-effects Parameters
P>|z|
-3.32
17.87
0.001
0.000
-2.593943
101.14
Estimate
Std. Err.
medico: Unstructured
sd(diuret~o)
sd(_cons)
corr(diuret~o,_cons)
3.732735
11.32102
.9999992
1.673439
4.062396
.0003431
1.55032
5.603293
-1
8.987378
22.87325
1
sd(Residual)
10.13664
.3224896
9.523876
10.78883
chi2(3) =
402.48
46
23
140
Corr>0
40
60
60
80
Corr<0
80
100
100
120
120
140
Efectoaleatorioenlapendiente
diuretico
60
80
100
120
-----------------------------------------------------------------------------pad |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------diuretico | -10.02766
10.02766
2.524844
-3.97
3.97
0.000
-14.97626
14.97626
-5.079059
5.079059
_cons |
88.77174
3.118113
28.47
0.000
82.66035
94.88313
------------------------------------------------------------------------------
40
Corr 0
1
diuretico
No
S
diuretico
-----------------------------------------------------------------------------Random-effects Parameters |
Estimate
Std. Err.
[95% Conf. Interval]
-----------------------------+-----------------------------------------------medico: Unstructured
|
sd(diuret~o) |
5.309061
1.897168
2.63539
10.69524
sd(_cons) |
6.839591
2.253758
3.585463
13.04713
corr(diuret~o,_cons) |
.1714171
.4772095
-.6586935
.8133184
-----------------------------+-----------------------------------------------sd(Residual) |
9.540705
.3047652
8.961691
10.15713
-----------------------------------------------------------------------------LR test vs. linear regression:
chi2(3) =
226.30
Prob > chi2 = 0.0000
47
48
24
Efectosaleatorios
49
Contrastes
Cadacoeficientedelapartefija,conlatcon
l nivnvarniv1.
1
g.l=n
Unsubconjuntootodoelmodelo,contestLR
(enlassalidastenemoslosLRtestparalas
partesfijayaleatoria).
Statapermiteguardarparmetrosdemodelos
Stata permite guardar parmetros de modelos
(estimatesstoreB)paraluegohacereltest
(lrtestAB).
V. Abraira - Bioestadstica Clnica
50
25
Mtodosdeestimacin
Asumiendonormalidaddetodaslasvariablesaleatorias
u0 j , u1 j ,...,ij
Haydosmtodosdeestimacin:mximaverosimilitud(ML)y
mximaverosimilitudrestringida(REML).
MLdaestimadoressesgadosporquenoajustaporlosg.l.
perdidosalestimarloscoeficientesfijos.
REMLdaestimacionesinsesgadasperonopermitecomparar
modeloscondistintaspartesfijascontestbasadosenla
deviance
51
Especificacindelosmodelos
Laespecificaciondelmodeloesmscompleja
l
d l
i i l
queenlosmodelosuninivel
Hayquedecidirlasvariablesfijasysus
interacciones
Quvariablestienenpendientealeatoria
Laestructuradevarcov
La estructura de var cov
Nohayreceta
V. Abraira - Bioestadistica Clnica
52
26
Consejos
Parsimonia
Buscarapoyoenlateora.
Nohacerdemasiadamineradedatos
Pensarenquefectosqueremoscontrastar
(nuestrahiptesis)
53
Lecturas
JAntimicrobChemother2011;66:210215.
quseentiendedelapartadodeanlisis?
Estructuradeldatasetyespecificacindel
modelo
cmoseestimelefecto?
Relacinentrefig2ytabla2
g y
54
27
Lectura
JEpidemiolCommunityHealth2001;55:791
798.
798
quseentiendedelapartadodeanlisis?
cuntosmodelosseestiman?especificacinde
losmodelos
quseestima/compara?
cmo?
55
Programa
2sesin
Modelodedosnivelesconvariabledependientecontinuaycoeficientesaleatoriosenlaspendientes
Especificacin e interpretacin
Especificacineinterpretacin
Estrategiadeespecificacindelmodelo
EjerciciosconStata
Discusindecasos(artculospublicados)
3sesin
Modeloderegresinlogsticadedosniveles
ElMedianodds ratio(MOR).EstimacinconStata
Interpretacin.EjemploAUDIPOC
Generalizaciones:
Tres y ms niveles
Tresymsniveles
Clasificacionesmixtas.
SMRconmultinivel
EjerciciosconStata
4Sesin
EjerciciosconStatayDiscusindecasos(artculospublicados)
V. Abraira - Bioestadistica Clnica
56
28
Modeloderegresinlogstica
Generalizamoselmodelolineal,mediante
lafuncinlogit
l f i l i comolink.
li k
Yij 0 u0 j ij
Enlugarde:
Elmodelovacio: logit Pj 0 u0 j
Ahoranohayvarianzaresidual(ij)porque
l
lavarianzadelabinomiallafijala
i
d l bi
i l l fij l
probabilidad(pq).
57
Ejemplo
PrescripcindeestatinasenSuecia:datos
de32345personasen274centrosdesalud.
Variable|ObsMeanStd.Dev.MinMax
+
estatina|32345.756964.428923301
idpaciente|32345161739337.342132345
idcentrosa~d|32345128.358777.019131274
58
29
Modelonulo
Integration points =
Wald chi2(0)
=
.
Log likelihood = -16931.104
Prob > chi2
=
.
------------------------------------------------------------------------------estatina |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
--------------+---------------------------------------------------------------_cons |
1.110215
.0535458
20.73
0.000
1.005267
1.215162
--------------+---------------------------------------------------------------idcentrosalud |
var(_cons)|
.6485884
.0700788
.5248055
.8015672
------------------------------------------------------------------------------LR test vs. logistic regression: chibar2(01) = 2011.91 Prob>=chibar2 = 0.0000
59
Conmsefectosfijos
Integration points =
Wald chi2(5)
=
55.10
Log likelihood = -16905.755
Prob > chi2
=
0.0000
-------------------------------------------------------------------------------------------------estatina |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
---------------------------------+---------------------------------------------------------------hombre |
.0157781
.0331935
0.48
0.635
-.04928
.0808363
|
pais
i |
Low-income economies |
.0588525
.2153503
0.27
0.785
-.3632263
.4809314
Lower_middle_income_economies |
.0991961
.0689634
1.44
0.150
-.0359696
.2343619
Higher_middle_income_economies | -.2040344
.0747628
-2.73
0.006
-.3505668
-.057502
|
privado | -.6593854
.0989402
-6.66
0.000
-.8533047
-.4654661
_cons |
1.399551
.0687291
20.36
0.000
1.264844
1.534258
---------------------------------+---------------------------------------------------------------idcentrosalud
|
var(_cons)|
.5204259
.058917
.4168647
.6497147
-------------------------------------------------------------------------------------------------LR test vs. logistic regression: chibar2(01) = 1436.49 Prob>=chibar2 = 0.0000
60
30
Mtodosdeestimacin
Laestimacindelosmodeloslinealesgeneralizadosesms
complicadaqueladelosmodeloslinealesjerrquicos.
complicada que la de los modelos lineales jerrquicos.
Tambinsonalgoritmositerativos.Generalmente,sebasanen
desarrollarseriesdeTaylordelafuncinlink.
Existenvarios:mximaverosimilitud(ML),quasiverosimilitud
marginal(MQL), quasiverosimilitudpenalizadaopredictiva
(PQL),MonteCarlo(MCMC),muestrodeGibs,
Losmtodosdifierenenlasestimacionesdelaparte
Los mtodos difieren en las estimaciones de la parte
aleatoria,generalmentelosresultadosparalapartefijason
muysimilares.
61
Mtodosdeestimacin
ElStatausaML,condistintosalgoritmosdecuadratura
adaptativa de GaussHermite
con 7 puntos de cuadratura.
adaptativadeGauss
Hermitecon7puntosdecuadratura.
Soncomputacionalmentemuyintensivosperodan
estimacionesmenossesgadasysepuedenhacercontrastes
derazndeverosimilitud.
Comolaestimacinpuedetardarmucho,sipasara,se
recomiendaempezarcon1punto(aproximacindeLaplace)y
pasar a 7 con el modelo final
pasara7conelmodelofinal.
Elmtododelasversionesanteriores,conmenosproblemas
deconvergencia,siguedisponiblecomo(QR
decomposition)
V. Abraira - Bioestadistica Clnica
62
31
ElCCIenlogstica
Enprincipio,comonohayvarianzaresidual,nohayCCI.
Sinembargo,comolavarianzadeladistribucinlogstica
Sin embargo como la varianza de la distribucin logstica
es2/3,paraunmodelologsticodeefectoaleatorioen
laconstante,avecesseusa
02
2
0 2 3
(se basa en asumir una variable latente que expresa la
(sebasaenasumirunavariablelatentequeexpresala
proclividaddexito,cuyoresiduotieneunadistribucin
logstica)
*
Yij* 0 1 xij u0 j ij
V. Abraira - Bioestadstica Clnica
Yij 1 si Yij 0
Yij 0 si Yij* 0
63
ElMOR
Otraformaalternativademedirelefectodelgrupoeselodds
ratio mediano.
ratiomediano.
Laideaescomparardosindividuosidnticosquepertenecen
adosgruposdistintos.
Enelmodelodeinterceptaleatorio,slovaransusu0j
ElMORsedefinecomolamedianadeladistribucinde
probabilidaddelosu0j,ysecalcula
-1
-1
2 so2 F-1(3 )
F inversa de la normal F (3 ) = 0, 6745
4
4
MOR = e
Sepuedeinterpretarcomoelaumentoderiesgo(en
mediana)queunindividuotendrasiselecambiaradeun
grupoaotroconmayorriesgo
V. Abraira - Bioestadstica Clnica
64
32
Ejemplo
ParaelmodelodelasestatinasenqueVar(cons)=0,520
0, 520
0 ,1 3 6 5
0, 520 2 3
Un14%delavariabilidadenlaprescripcinesdebidaal
Centro
MOR = e
( 4)
2 so2 F-1 3
=e
2 x 0,520 x 0,6745
= 1,989
LamedianadeORentreCentroses1,99
Existeuncomandodeusuarioxtmrho quecalculaambos
(hastalaversin12)
Modificadopormi(xtmrhov13),despusdeopcinQR
V. Abraira - Bioestadistica Clnica
65
Prcticaylectura
datosestatinas
BMCHealthServicesResearch2007,7:68
Preguntas
quseentiendedelapartadodeanlisis?
cuntosmodelosseestiman?especificacindelos
modelos
Interpretarlatabla2
66
33
Problemas
Enelmodelolineal,siemprequeseintroducen
efectosfijos,elefectoaleatoriodelgrupo
efectos fijos el efecto aleatorio del grupo
disminuye.
Enelmodelologsticonosiempre,puede,
incluso,aumentar.
Ocurre,sobretodo,silasvariablesintroducidas
sedistribuyendesigualmenteentrelosgrupos
Ellointroduceciertadificultadenla
interpretacindelCCIyMOR.
V. Abraira - Bioestadistica Clnica
67
EjemploAUDIPOC
2 3
4 5
10
11 12
13
14 15
16 17
Reingreso
.8
4 5
10
11 12
13
14 15
16 17
.2
.4
.6
2 3
.1
.2
.3
.4
Muertehospitalaria
50
100
150
200
5178pacientes,129hospitales
Global:5%
Rangointerhosp.:0%,35%
50
100
150
200
4919pacientes
Global:37%
Rangointerhosp.:0%,62%
68
34
Analizandoconmodelomultinivel
Modelovacio
p
Muertehospitalaria
MOR=1.80
IC95%(1.54a2.23)
ICC=0.104
g
Reingreso
MOR=1.24
IC95%(1.15a1.38)
ICC=0.015
Modeloconfactoresfijos
MOR=1.60
IC95%(1.37a2.02)
MOR=1.24
IC95%(1.15a1.39)
69
Generalizaciones
Msde2niveles(p.e. 3:paciente,mdico,centro)
HayunCCIentremdicosdelmismocentroyotroentre
pacientesdelmismomdico
MOR = e
( 4)
2 s22 F-1 3
MOR = e
( 4)
70
35
Generalizaciones
EnStata,hayqueponerprimeroelnivelde
mayorjerarqua
.melogitlenghthstayage
ib2.padmissionib2.smokstat||
country x12:||HospitalId:
country_x12:||HospitalId:
71
Clasificacionesmixtas
Ocurrencuandolosnivelesnoseanidan.
i t
di
t
di
d
paciente,mdico,centro,perounmdicopuede
trabajarenvarioscentros.
Nio,colegio,barrio,sihaycolegiosconniosde
distintosbarrios
Secrea unnivelconlascombinacionesyse
trabajaconunmodelode2niveles.
72
36
SMRconmultinivel
Paracompararresultadosbinariosdecentros
sesueleusarelSMR:cocienteentreeventos
l
l SMR
i t
t
t
observadosyesperados(generalmente
estimadosporregresinlogsticauninivel)
Crtica:losdatosrealmentetienenestructura
j
jerrquica(multinivel)
q
(
)
73
SMR
Byar (Poisson)
Cdigo
STATA
Altas
OBS
ESP
Ratio
Ratio ICI
Ratio ICS
CEGA
Ratio
[95% Conf.
2803
2808
1.020
841
64
89
69
67
0,93
1,34
0,71
1,07
1,18
1,64
2803
2808
0,93
1,34
0,73
1,10
Interval]
1,12
1,57
2843
2852
882
282
65
22
66
19
0,98
1,16
0,76
0,73
1,25
1,76
2843
2852
0,98
1,16
0,76
0,76
1,20
1,56
2855
2856
252
219
13
22
17
18
0,77
1,24
0,41
0,77
1,31
1,87
2855
2856
0,77
1,24
0,40
0,81
1,13
1,66
2857
2872
341
630
35
43
41
37
0,85
1,15
0,59
0,84
1,18
1,55
2857
2872
0,85
1,15
0,62
0,87
1,08
1,44
2874
2880
1.272
434
99
38
94
53
1,06
0,72
0,86
0,51
1,29
0,99
2874
2880
1,06
0,72
0,89
0,52
1,22
0,92
2881
2882
283
235
16
15
29
19
0,55
0,78
0,31
0,44
0,89
1,29
2881
2882
0,55
0,78
0,32
0,45
0,78
1,11
2883
2884
146
217
14
17
13
18
1,11
0,96
0,61
0,56
1,87
1,54
2883
2884
1,11
0,96
0,54
0,58
1,69
1,35
2885
2886
132
198
5
6
10
15
0,48
0,39
0,15
0,14
1,12
0,86
2885
2886
0,48
0,39
0,12
0,11
0,84
0,68
2887
2888
86
721
7
44
11
45
0,61
0
61
0,97
0,25
0
25
0,71
1,27
1
27
1,31
2887
2888
0,61
0
61
0,97
0,22
0
22
0,75
1 01
1,01
1,20
2889
2890
61
1.039
7
90
6
73
1,22
1,23
0,49
0,99
2,51
1,51
2889
2890
1,22
1,23
0,53
1,01
1,90
1,45
2892
504
42
50
0,83
0,6
1,13
2892
0,83
0,62
1,05
2899
157
18
14
1,26
0,74
1,99
2899
1,26
0,80
1,72
74
37
SMRconmultinivel
Odds ratiodelospacientesde
cadahospitalrespectoalpromedio
Comparaelriesgodecadahospital
respectoalpromedio
75
SMRconmultinivel
SMR3sepuedeninterpretarcomo
i d l i
d
d h it l
l
comparacindelriesgodecadahospitalconel
riesgoglobaldelapoblacin,paraunpaciente
"promedio
1 exp
SMR3
1
1 exp
SMR4
SMR4comparaelriesgodecadahospitalpara
compara el riesgo de cada hospital para
suspacientesconelriesgoparaesospacientes
enunhospital"promedio".
76
38
smrmulti
+-----------------------------------------------------------------+
| Cdigo size
obser
SMR1
SMR2
SMR3
SMR4 |
|-----------------------------------------------------------------|
| 2803
1020
64
1.001377
1.00126
1.001375
1.001005 |
| 2808
841
89
1.55959
1.448681
1.558827
1.362925 |
| 2819
7
3
.9979612
.991001
.9979629
.9989933 |
| 2843
882
65
1.064964
1.060677
1.064904
1.048501 |
| 2852
282
22
1.183504
1.246163
1.183314
1.133031 |
|-----------------------------------------------------------------|
| 2855
252
13
.8907416
.8261847
.8908267
.9133525 |
| 2856
219
22
1.252309
1.321125
1.252033
1.16096 |
| 2857
341
35
.8905944
.8921182
.8906797
.9271285 |
| 2858
2
1
1.032141
1.634037
1.032112
1.021242 |
| 2870
11
1
.9299945
.5076091
.9300514
.9443377 |
|-----------------------------------------------------------------|
| 2872
630
43
1.252946
1.251311
1.252669
1.173521 |
| 2873
9
3
.9910167
.9606879
.9910246
.9949441 |
| 2874
1272
99
1.180753
1.150466
1.180566
1.127577 |
| 2876
14
1
1.045359
2.193948
1.045318
1.040197 |
| 2880
434
38
.7476863
.7581505
.7478514
.8269221 |
|-----------------------------------------------------------------|
|
|
| 2881
283
16
.6676011
.5760031
.6677952
.7484443 |
| 2882
235
15
.8801039
.8279751
.8801963
.9115458 |
| 2883
146
14
1.10887
1.177353
1.108765
1.074329 |
| 2884
217
17
1.011805
1.016626
1.011794
1.008306 |
| 2885
132
5
.7571207
.4965685
.7572815
.8241374 |
|-----------------------------------------------------------------|
| 2886
198
6
.6700002
.418055
.6701936
.7488397 |
| 2887
86
7
.8113273
.6414105
.8114612
.8685244 |
| 2888
721
44
1.049132
1.047903
1.049087
1.034362 |
| 2889
61
7
1.10052
1.262515
1.100423
1.057724 |
| 2890
1039
90
1.395141
1.34257
1.394659
1.283684 |
|-----------------------------------------------------------------|
77
39