Académique Documents
Professionnel Documents
Culture Documents
Modelos multinivel
Francisco De la Cruz1
________________________________________________________________________________________________________________________
______________________________________________________________________________________________________________________________________________________________
1
Estadstico epidemilogo, investigador de la Seccin Epidemiologa del Instituto de Medicina Tropical Daniel A. Carrin,
Universidad Nacional Mayor de San Marcos. Lima Per.
Correspondencia: fcoda_es@yahoo.com.mx
muy cuidadoso en la interpretacin de los resultados, es otra vez estimado por errores estndar que resultan
podemos cometer la falacia del error del nivel, el cual muy pequeos, y los resultados son falsamente
consiste en analizar los datos en un nivel, y extraer significativos. En las encuestas esto se llama efecto del
conclusiones de otro nivel. Probablemente la falacia diseo, y el procedimiento usual es calcular los errores
mejor conocida es la falacia ecolgica, sta pretende estndar por mtodos de anlisis ordinarios, estimar la
deducir relaciones para los individuos o nivel 1, cuando correlacin intraclase entre respuestas dentro de las
los resultados contextuales o nivel 2 no reproducen agrupaciones, y emplear una frmula correcta para los
necesariamente al nivel individual. Existe otro tipo de errores estndares. Algunos de estos procedimientos de
falacia llamada falacia atomista, la cual propone las correccin son poco poderosos. Estas correcciones
mismas asociaciones encontradas a nivel individual o podran tambin ser aplicados en anlisis multinivel. Sin
nivel 1 como relaciones a nivel contextual o nivel 2. embargo, en los problemas multiniveles no solo
tenemos agrupaciones de individuos dentro de grupos,
El desarrollo de tcnicas para especificar y ajustar tambin tenemos variables medidas en todos los niveles
modelos multinivel desde mediados de los aos 80 ha disponibles. Combinando variables de diferentes niveles
producido una clase muy grande de modelos tiles. en un modelo estadstico es un problema diferente que
Estos incluyen modelos con respuestas discretas, estimar y corregir para efectos del diseo. Los modelos
modelos multivariantes, modelos de sobrevivencia, multiniveles son diseados para analizar variables de
modelos de series de tiempo, etc. En las siguientes diferentes niveles simultneamente, usando un modelo
secciones pasaremos a explicar de forma sencilla y con estadstico que incluye las diferentes dependencias.
ejemplos algunos mtodos de mayor uso como, modelos
de regresin multinivel, modelo multivariante
multinivel y datos de medidas repetidas.
EFECTOS: FIJOS O ALEATORIOS
Es claro que decidir si un efecto de una variable ser poblacin de unidades, entonces el efecto de la unidad
considerada fijo o aleatorio depender en gran parte del especfica es una variable aleatoria y (1) se convierte en
contexto o de los objetivos del estudio. En los modelos un ejemplo simple de un modelo de dos niveles. Su
multinivel como unidades (agrupamientos) que definen especificacin completa, asumiendo normalidad, puede
los niveles, son vistos como efectos aleatorios, de esta ser escrita de la siguiente manera:
forma, como muestras aleatorias de una poblacin de
estas unidades (como escuelas, centros de salud,
domicilios, etc). Estos efectos aleatorios se traducen en yij = 0 + 1 xij + u j + eij
un modelo de coeficientes aleatorios que van a tomar en
cuenta la variabilidad entre agrupamientos, desde u j ~ N (0, u2 ) , eij ~ N (0, e2 ) (2)
formas simples, a travs de variabilidad a nivel del
intercepto, o de formas ms complejas, a travs de
variabilidades a niveles de inclinaciones de dos rectas. cov( u j , eij )=0
cov( yi1 j , yi 2 j / xij )= u 0
2
multinivel puede ser usado tambin para estimar la Una parte de la matriz de datos para esta estructura
correlacin intraclase. El modelo usado para este podra ser:
propsito es un modelo que no contiene variables
explicativas, por eso es llamado modelo solo de
intercepto. Este puede ser derivado de la ecuacin (2) Intercepto (z) Gnero (x)
como sigue. Si no hay variables explicativas tanto en el Individuo Respuesta Altura Peso
bajo nivel como en el alto nivel esto se reduce a:
1 (femenino) y11 1 0 1
1 y12 0 1 1
yij = 0 + u j + eij (4) 2 (masculino) y21 1 0 0
2 y22 0 1 0
3 (femenino) y31 1 0 1
El modelo de la ecuacin (4) no explica alguna
varianza, slo descompone la varianza en dos
componentes independientes: e2 , el cual es la varianza
Por eso que en el nivel 2 tenemos las varianzas y
del error del ms bajo nivel eij , y u , la varianza del
2
covarianzas de altura y peso mientras no hay variacin
en el nivel 1 y la parte fija del modelo es definida
error del nivel ms alto u j . Usando este modelo usando las variables dummy asociada con cada
podemos estimar la correlacin intra clase por la respuesta. Vemos que en la matriz de datos, el tercer
ecuacin: individuo no tiene peso medido. Especificando el
modelo multivariante como en (6) podemos
implcitamente ajustar los datos donde algunas
respuestas son vacas, simplemente omitimos la unidad
= u2 /( u2 + e2 ) (5)
del nivel 1 correspondiente a la observacin vaca. Al
igual que a las diferentes tcnicas multivariantes, en el
tipo de modelos multiniveles tambin podemos utilizar,
La correlacin intra clase es un estimador de la si el caso lo requiere, anlisis de componentes
proporcin de varianza explicada en la poblacin. La principales, anlisis discriminante, etc.
ecuacin (5) establece que la correlacin intraclase es
igual a la proporcin estimada de la varianza del nivel
grupo comparada con la varianza total estimada. Modelos para medidas repetidas
Cuando las medidas son repetidas en los mismos
sujetos, una jerarqua de dos niveles es establecida con
Modelo multivariante multinivel repeticiones de medidas u ocasiones como unidades de
Otro caso especial importante son los datos nivel 1 y sujetos como unidades de nivel 2. Tales datos
multivariantes donde la respuesta es un vector. son a menudo referidos como longitudinales. As,
Consideramos primero un modelo lineal multivariante podemos tener medidas repetidas del peso de nios,
de nivel nico, con dos respuestas, altura y peso, puntuaciones de pruebas repetidas en estudiantes o
medidos en una muestra de masculinos y femeninos. entrevistas repetidas en encuestas.
Para la j-sima variable (j=0 para altura, j=1 para peso)
medidos en el i-simo sujeto y tenemos la ecuacin del Es importante para distinguir dos tipos de modelo para
modelo: datos de medidas repetidas. Primero, las medidas son
tratadas como covarianza antes que respuestas y ser
ms a menudo apropiado cuando hay un nmero
yij = 01 z1ij + 02 z 2ij + 11 z1ij x j + 12 z2ij x j + u1 j + u2 j pequeo de ocasiones discretas y donde las diferentes
medidas son usadas en cada una. En el segundo caso, el
cual es usualmente referido como un modelo de
medidas repetidas, todas las medidas son tratadas como
1altura 1 femenino respuestas, por ejemplo la relacin entre una medida tal
z1ij = , z 2 ij = 1 z1ij , xj = como altura o peso que cambia con la edad.
0 peso 0masculino
(6) Si medimos el peso de una muestra de bebs despus de
su nacimiento sucesivas veces entonces la ocasin de
repetir la medicin se convierte en la unidad de ms
var(u1 j ) = u21 , var(u2 j ) = u22 , cov(u1 j u2 j ) = u12 bajo nivel de una jerarqua de nivel 2 donde el beb
individual es la unidad de nivel 2. En este caso el
modelo (3) podra proporcionar una descripcin simple
con x1ij siendo tiempo o edad. En la prctica el
crecimiento lineal ser una descripcin inadecuada y su estatura como adultos y estimados de su edad de
desearamos ajustar al mnimo en una funcin hueso en cada una de las medidas de estatura son
polinomial, o quizs una funcin no lineal donde basadas en la radiografa de la mueca. Primero
algunos coeficientes varan aleatoriamente a travs de escribimos los tres componentes bsicos del modelo,
los bebs individualmente, que es que cada beb tenga empezando con un modelo de medidas repetidas simple
su propio modelo de crecimiento. para estatura usando un polinomial de quinto grado.
5 2 1
yij = ij(1) ( h(1) xijh + uhj(1) xijh + eij(1) ) + ij( 2 ) ( 0( 2 ) + uhj( 2 ) xijh + eij( 2 ) ) + (j 3) ( 0( 3) + u0( 3j) )
h=0 h=0 h=0
En el nivel 1 es el modelo ms simple, donde asumimos, cbicos de la curva de crecimiento polinomial. Vemos
que los residuales para la edad del hueso y estatura son que hay una gran correlacin entre estatura de adulto y
independientes, a pesar que la dependencia pudo ser estatura y correlaciones pequeas entre estatura del
creada, por ejemplo si el modelo fue incorrectamente adulto y la estatura de crecimiento y los coeficientes de
especificado en el nivel 2. As la variacin del nivel 1 es la edad del hueso. Esto implica que las medidas estatura
especificada en trminos de dos trminos de varianza. A y edad del hueso pueden ser usados para hacer
pesar de que el modelo es estrictamente un modelo predicciones de la estatura del adulto. De hecho estos
multivariante, porque en el nivel 1 las variables valores predecidos son simplemente los residuales
aleatorias son independientes es innecesario especificar estimados para la estatura del adulto. Para un nuevo
un nivel 1 dummy con variacin no aleatoria. Sin individuo, con informacin disponible en una o ms
embargo, permitimos que la correlacin entre estatura y edades para estatura o edad del hueso, simplemente
edad del hueso entonces necesitaremos especificar el estimamos los residuales de la estatura de los adultos
modelo sin variacin en el nivel 1, las varianzas y usando los parmetros del modelo. La tabla 2 muestra
covarianzas entre edad del hueso y altura en el nivel 2 y los errores estimados estndar asociados con la
entre la variacin individual en el nivel 3. prediccin hecha sobre la base de variacin de la
cantidad de variacin. Es claro que el principal
La tabla 1 muestra los parmetros aleatorios y fijos para beneficio en eficiencia viene con el uso de la estatura
este modelo, omitiendo los estimados para la variacin con un beneficio ms pequeo del aumento de la edad
entre individuos en los coeficientes cuadrticos y del hueso.
Tabla 1. Estatura para crecimiento de adolescente, edad del hueso y estatura adulta para una muestra de nios. Edad
medida cerca de los 13 aos. La varianza y covarianza del nivel 2 muestran la correlacin en parntesis.
Parmetro
Fijo
Altura Adulto
Intercepto 174.4
Grupo (A-B) 0.25 (0.50)
Altura:
Intercepto 153
Edad 6.91 (0.20)
Edad2 0.43 (0.09)
Edad3 -0.14 (0.03)
Edad4 -0.03 (0.01)
Edad5 0.03 (0.03)
Aleatorio
Nivel 2
Intercepto de Intercepto de
Altura Adulto Altura Edad Edad del Hueso
Altura Adulto 62.5
Intercepto de Altura 49.5 (0.85) 54.5
Edad 1.11 (0.09) 1.14 (0.09) 2.5
Intercepto de Edad del Hueso 0.57 (0.08) 3.00 (0.44) 0.02 (0.01) 0.85
Varianza Nivel 1
Altura 0.89
Edad del Hueso 0.18
Tabla 2. Errores estndar para las predicciones de estatura para combinaciones especficas de medidas de estatura y
edad del hueso.
Altura (Edad)
Ninguno 11.0 11.0
Edad del Hueso 12.0
El mtodo usado puede ser empleado para otras estructura de varianza de los datos en funcin de
medidas, como para ser predecidos o como predictores. variables explicativas que nos permite analizar los datos
En particular, las covarianzas tal como tamao de la en los cuales la varianza no es homognea, adems que
familia o antecedentes sociales pueden ser incluidas explora en gran detalle el comportamiento de la
para mejorar la prediccin. variacin.
Las ventajas de usar modelos multinivel son muchas. Los modelos multinivel son una respuesta a la necesidad
Correctamente utilizados, estos modelos nos permiten de analizar la relacin entre los individuos y el medio en
obtener mejores estimaciones de los coeficientes de donde se desenvuelven; poder separar el papel de cada
regresin y de su variacin que con los modelos uno de los componentes de la compleja estructura
tradicionales. Una gran flexibilidad ofrecida por los implicada puede llevar a un mejor conocimiento de la
modelos multinivel se da en trminos de modelar la realidad para as poder intervenir ms eficientemente.
Como se dijo anteriormente los modelos multinivel 3. Goldstein H, Browne WJ, Rasbash J. Multilevel
ofrecen distintas ventajas respecto a los modelos modelling of medical data. Statistics in Medicine.
tradicionales: dan una versin ms realista ya que 2002;21:3291-3315. Disponible en
modelan cada nivel de jerarqua, no requieren la http://www.cmm.bristol.ac.uk/team/mmmd.pdf
hiptesis de independencia entre las medidas de la 4. Goldstein H, Browne WJ. Multilevel factor analysis
variable resultado y tambin dan estimaciones ms models for continuous and discrete data. En:
precisas. La desventaja es la mayor complejidad tanto Maydeu-Olivares A, McArdle J (ed). Contemporary
del marco terico como del modelo propuesto para Psychometrics. Filadelfia: Lawrence Erlbaum,
analizar los datos, lo que conlleva una mayor dificultad 2005.
en la comunicacin de los resultados. De cualquier 5. Goldstein H. Multilevel statistical models. Londres:
forma, la gran frecuencia con que se encuentran Institute of Education, Multilevel Models Projects,
estructuras jerrquicas en los datos que provienen de los 1999. Disponible en
estudios epidemiolgicos, de la investigacin de http://www.ats.ucla.edu/stat/examples/msm_goldste
servicios de salud, etc., est demandando una mayor in/goldstein.pdf
utilizacin de estos modelos. 6. Hox JJ. Applied multilevel analysis. Amsterdam:
TT-Publikaties, 1995. Disponible en
www.geocities.com/joophox/publist/amaboek.pdf
REFERENCIAS BIBLIOGRFICAS 7. Multilevel Models Project. Disponible en
www.ioe.ac.uk/multinivel
1. Barros A. Modelos multinivel: primeros pasos. 8. Plewis I. Multilevel models. Social Research
2001. Departamento de Medicina Social de la Update. 1998, Issue 23. Disponible en
Facultad de Medicina de la Universidad Federal de http://sru.soc.surrey.ac.uk/SRU23.html
Pelotas. Rio de Janeiro, Brasil. 9. Snchez-Cantalejo E, Ocaa-Riola R. Los modelos
2. Bates D, Pinheiro J. Computational methods for multinivel o la importancia de la jerarqua. Gac
multilevel modelling. Bell Labs Technical Sanit. 1999;13(5):391-8. Disponible en
Memorandum. Disponible en http://stat.bell- http://www.elsevier.es/revistas/ctl_servlet?_f=7064
labs.com/NLME/CompMulti.pdf &articuloid=13008388