Vous êtes sur la page 1sur 11

Anlisis de supervivencia (I)

Introduccin
El anlisis de supervivencia recoge un conjunto de tcnicas estadsticas apropiadas para
todos aquellos estudios de seguimiento en donde el tiempo de respuesta hasta observar
un fenmeno o suceso resulta fundamental. En este caso la variable de inters es el
tiempo hasta la aparicin del fenmeno o suceso de inters, que podr o no aparecer en
el transcurso de nuestro estudio, siendo adems muy posible que perdamos algunos de
los pacientes durante el seguimiento. El periodo de seguimiento de cada paciente puede
ser desigual y en el final del mismo puede que ni siquiera se haya presentado el evento a
estudio.
Se denomina estudio de supervivencia porque en sus primeras aplicaciones, el suceso de
inters era la muerte, aunque su uso puede extenderse al estudio de cualquier otro
suceso no necesariamente negativo e incluso positivo, como podra ser el tiempo
transcurrido desde que una persona es operada hasta que recibe el alta mdica. Existe
mucha bibliografa sobre la metodologa estadstica a usar en los estudios de
supervivencia, siendo algo complicado su entendimiento ya que tanto la nomenclatura
como el vocabulario usado pueden variar de un texto a otro, resultando confuso su
entendimiento. En este y en el siguiente captulo, intentaremos definir y aclarar algunos
de los conceptos utilizados en el anlisis de la supervivencia.
Anlisis de supervivencia
Veamos un ejemplo ficticio para ilustrar un estudio de seguimiento. Supongamos que
aplicamos un programa experimental para dejar de fumar en un grupo de 8 pacientes
fumadores y medimos el tiempo que transcurre hasta que fuman el primer cigarrillo
(suceso o evento de inters). El diseo del estudio y su resultado podemos verlo en la
figura 1.
Figura 1. Estudio de seguimiento en pacientes fumadores.

Por ejemplo, el paciente 1 entra el primer da del estudio y durante 3 semanas no fum.
En la figura las estrellas indican el evento de inters, que en este caso es volver a fumar.
El paciente 3 no volvi a la consulta despus de dos semanas iniciado el estudio, pero al
menos sabemos que durante esas dos semanas no fum. Lo mismo sucedi con el
paciente 6, que despus de 4 semanas de seguimiento rehus participar en el estudio,

pero sabemos que en esas cuatro semanas no fum. Los pacientes 5 y 7 seguan sin
fumar cuando se cerr el estudio a las 10 semanas.
Como podemos observar, no es necesario que todos los pacientes entren el mismo da en
el que se inicia el estudio, pudindose incorporar mientras dure el mismo. El tiempo de
observacin puede terminar por estas razones:
Se produce el evento de inters: muerte, recidiva, curacin, alta mdica, etc. En
nuestro caso sera volver a fumar. Pacientes 1, 2, 4 y 7.
Se termina el estudio de seguimiento y no se observa el evento de inters. Pacientes 5
y 8.
Se pierde el seguimiento, bien porque no vuelven, son retirados, mueren por una causa
distinta de la estudia, etc. Las causas pueden ser mltiples. Pacientes 3 y 6.
Si estamos en los dos ltimo casos, nos referiremos a pacientes con informacin
censurada, o pacientes censurados.
A efectos prcticos de anlisis de datos, podemos colocar los datos tal y como aparecen
en la figura 2.
Figura 2. Ordenacion de datos para un estudio de supervivencia.

Al ordenarlos de esta manera es como si todos nuestros pacientes hubiesen empezado el


estudio en el mismo momento, lo que es equivalente a asumir que los criterios de
inclusin y de exclusin fueron los mismos en todo momento. Esto puede no suceder en
estudios de seguimiento muy largos en los que se incluyen pacientes recogidos a lo
largo de muchos aos, ya que los mtodos diagnsticos e incluso la propia definicin de
la enfermedad, pueden haber cambiado a lo largo del tiempo.
Si hay cambios en el modo de clasificar a los pacientes durante el periodo de estudio,
podra introducirse un sesgo muy importante en la valoracin de la supervivencia.
Imaginemos que al estudiar la supervivencia de forma retrospectiva en un grupo de
pacientes oncolgicos recogemos informacin durante 20 aos. En este periodo de
tiempo es bastante probable que las tcnicas de diagnstico y por tanto de clasificacin
de la gravedad de la enfermedad hayan sufrido cambios, siendo ahora las nuevas
tcnicas mucho ms sensibles. Por tanto, los pacientes incorporados en los ltimos aos
se clasificarn como pacientes en estadios ms avanzados de la enfermedad, al detectar
lesiones que antes hubiesen pasado desapercibidas con las antiguas tcnicas. A este
hecho se le denomina migracin diagnstica. Pacientes que antiguamente hubiesen
sido clasificados en estadios iniciales de la enfermedad, ahora al tener tcnicas ms

sensibles de diagnstico, estn clasificados en estadios ms avanzados. La


supervivencia en los pacientes con estadios ms avanzados ser mayor, ya que hemos
incorporado pacientes que en aos anteriores hubiesen sido considerados menos graves.
Como consecuencia de ello y paradjicamente, la supervivencia aumenta tanto en los
grupos leves como en los graves, fenmeno descrito por Will Rogers. Es como si la
persona ms alta de un grupo de gente baja, pasa a pertenecer a un grupo de personas
todas ellas con mayor altura. El promedio de ambos grupos disminuye (De Irala 2004).
Mtodo Kaplan-Meier (producto-lmite)
Uno de los mtodos usados con ms frecuencia en la literatura mdica para estimar la
supervivencia es el mtodo de Kaplan-Meier. En su clculo, no intervienen ni la media
ni la desviacin tpica, etc. siendo por tanto no paramtrico. Del mismo modo, no hay
ninguna limitacin en cuanto a la forma de la distribucin de los datos.
Lo que s es importante en este mtodo, es asumir que la censura resulte no informativa.
Esto equivale a suponer que los pacientes censurados se comportan de igual forma
que el resto de pacientes seguidos. Si los pacientes censurados o perdidos, tienen unas
caractersticas diferentes al resto de pacientes, incluso asociadas al evento que estamos
midiendo, el estudio podra carecer de validez.
El mtodo Kaplan-Meier calcula la supervivencia como un producto acumulativo de la
supervivencia en cada periodo. Aunque la nomenclatura pueda cambiar de un texto a
otro, se calcula de la siguiente frmula recursiva:

Siendo S(ti) la supervivencia estimada en el momento ti, ni el n de pacientes a riesgo en


el momento i al inicio del periodo, y si los supervivientes al final del periodo i. Por tanto
la supervivencia en un periodo dado, se calcula como la tasa de supervivencia en ese
periodo por la supervivencia en el periodo anterior.
Vemoslo en nuestro ejemplo en el que estudibamos el tiempo transcurrido hasta
volver a fumar en un grupo de pacientes. Para facilitar los clculos de la funcin de
supervivencia, podemos colocar los datos como en la Tabla 1. Sin recurrir a los
programas estadsticos, podemos realizar los clculos de la funcin de supervivencia
con cualquier programa con hojas de clculo.
Tabla 1. Tabla de supervivencia.
Tiempo Pacientes a
Sin recada Supervivencia
Recaen
(ti)
riesgo (ni)
(si)
periodo (si/ni)
0
1
2
3
4
5

8
8
7
5
4
2

0
1
1
1
1
0

8
7
6
4
3
2

8/8
7/8
6/7
4/5
3/4
2/2

Funcin de
supervivencia
acumulada S(ti)
1
1*(7/8) = 0,875
0,875*(6/7) = 0,750
0,750*(4/5) = 0,600
0,600 *(3/4) = 0,450
0,450*(2/2) = 0,450

6
7
8
9

1
1
1
1

0
0
0
0

1
1
1
1

1/1
1/1
1/1
1/1

0,450*1 = 0,450
0,450*1 = 0,450
0,450*1 = 0,450
0,450*1 = 0,450

Se pueden seguir fcilmente los clculos siguiendo el esquema de la figura 2.


En el momento 0, entran 8 pacientes, por tanto comenzamos con el 100% libre de
recada y la supervivencia es 1.
En la semana 1 de seguimiento, tenemos la 1 recada de los 8 que entran (n1), por lo
que nos quedan 7 supervivientes o sin recada. La funcin de supervivencia al ser
acumulativa sera S=S0*S1, es decir S=1*(7/8) = 0,870, o lo que es lo mismo, el 87,5%
de nuestros pacientes no ha recado despus de la primera semana.
En la semana 2, tenemos otra recada y un seguimiento perdido. S=S0*S1*S2,
S=1*(7/8)*(6/7) = 0,750.
En la semana 3, comenzamos con 5 pacientes (n3), ya que hasta ese momento han
recado 2 y a otro le perdimos el seguimiento. En los 5 pacientes seguidos, tenemos 1
recada. S=1*(7/8)*(6/7)*(4/5) = 0,600.
En la semana 4, tenemos la ltima recada. S=1*(7/8)*(6/7)*(4/5)*(3/4) = 0,450.
La semana 5, comenzamos con 2 pacientes, hasta el momento han recado 4 y han
abandonado 2. Durante esa semana tenemos un abandono.
No se observan ms abandonos ni prdidas hasta finalizar el estudio.
Como podemos ver, la funcin de supervivencia solo cambia cuando tenemos eventos,
en nuestro caso recadas, y permanece constante mientras no haya eventos aunque se
produzcan prdidas de seguimiento.
La representacin grfica de la tabla de supervivencia es lo que se denomina curva
Kaplan-Meier, que en este ejemplo podemos verla en la figura 3.
Figura 3. Curva de supervivencia Kaplan-Meier.

El tiempo se sita en el eje X, mientras que la funcin de supervivencia S(ti) en el eje Y.


Los escalones de la grfica se producen slo si observamos eventos (tenemos recadas),

los smbolos + representan pacientes censurados, que no tienen efecto sobre la


funcin de supervivencia. A medida que transcurre el seguimiento, disminuye el n de
pacientes observados, bien sea por los eventos o por los casos censurados, siendo cada
vez ms pronunciados los escalones al final del mismo. Por esta razn, hay que tener
muy en cuenta el n de casos que tenemos en cada momento, sobre todo al final, porque
la funcin de supervivencia sufre grandes cambios. Si el paciente con seguimiento ms
largo tiene un evento, la curva terminar en un escaln, a diferencia de nuestro ejemplo,
donde el paciente con seguimiento ms largo no sufre una recada.
Se pueden expresar los resultados del anlisis de supervivencia de varias formas, siendo
la mediana uno de los ms utilizados. Calcular directamente la media o la mediana a
partir de los datos observados por el tiempo de seguimiento carece de sentido, ya que no
estamos teniendo en cuenta aquellos pacientes con seguimiento truncado o censurado.
La supervivencia mediana, es el tiempo de seguimiento transcurrido hasta observar el
evento en el 50% de pacientes, o lo que es equivalente, un 50% de pacientes est libre
del evento estudiado. En nuestro ejemplo, puede verse la mediada grficamente en la
figura 3. A las 4 semanas de seguimiento quedan 4 pacientes (50%) sin recaer de
los 8 que empezaron. Sin en el estudio se producen en menos del 50% de pacientes
el evento, no podramos calcular la mediana.
Una vez obtenida la funcin de supervivencia, podemos calcular su intervalo de
confianza a partir de su error estndar (EE), resultado ofrecido de forma habitual en los
programas estadsticos.

Sin embargo, a no ser que tengamos muestras de gran tamao, no debemos calcular el
intervalo de confianza al 95% como IC95%= S(ti)1,96*EE porque puede no ser vlida
la aproximacin a una distribucin a la normal. Para ello se utiliza una transformacin
del error estndar:

Con el EE transformado podemos calcular el intervalo de confianza:

Bibliografa recomendada
1 Gmez-Melis, G. (2002). http://www.icf.uab.es/icbdigital/pdf/articulo/articulo5.pdf.
Tcnicas estadsticas en el anlisis de supervivencia. ICB digital N 5.
2 Martnez Gonzlez, M. A., A. Snchez-Villegas y F. J. Fauln Fajardo (2006).
Introduccin al anlisis de supervivencia. Bioestadstica Amigable. 2 Edicin. Ed: Daz
de Santos. 643-683.

3 Feinstein, A. R., D. M. Sosin y C. K. Wells (1985). Will Rogers phenomenon. Stage


migration and new diagnostic techniques as a source of misleading statistics for survival
in cancer. N Engl J Med 312: 1604-8.
4 Molinero, L. M. (2001). http://www.seh-lelha.org/superviv1.htm. Tiempo hasta que
ocurre un suceso. Anlisis de supervivencia. (Alce Ingeniera).
5 Pita Fernndez, S. (1995). http://www.fisterra.com/mbe/investiga/supervivencia/
supervivencia.asp. Anlisis de supervivencia. Cad Aten Primaria 2: 130-135.

Anlisis de supervivencia (II)


Introduccin
El anlisis de supervivencia sigue an en constante desarrollo siendo una de las
herramientas ms importantes en la investigacin clnica. Su uso est muy extendido
gracias a la disponibilidad en los ordenadores de programas y paquetes estadsticos que
incluyen muchas de las tcnicas estadsticas de supervivencia. No obstante, la gran
variedad y las distintas posibilidades de los estudios de supervivencia, (eventos
recurrentes, riesgos competitivos, etc.) hacen que actualmente vayan apareciendo
nuevos mtodos y tcnicas de anlisis de los datos.
Comparacin de curvas de supervivencia
Una de las situaciones que podemos encontrarnos es la de comparar la supervivencia de
dos o ms grupos de individuos y ver si esas diferencias son estadsticamente
significativas. Existen diversas pruebas estadsticas, siendo en todas ellas la hiptesis
nula la que mantiene que las diferencias no son importantes a lo largo del tiempo, y la
alternativa la que dice que al menos uno de los grupos se comporta de forma distinta al
resto. Si las curvas de supervivencia se cruzan durante el seguimiento, es muy poco
probable que podamos encontrar diferencias.
Imaginemos que tenemos un grupo de 30 pacientes con EPOC dados de alta tras un
ingreso originado por su enfermedad, y que deseamos saber si aquellos que tienen
insuficiencia cardiaca (IC), reingresan antes. Como podemos ver en la figura 1 aquellos
pacientes con IC tienen un mayor nmero de recadas a lo largo del periodo de
seguimiento.
Figura 1. Curvas de supervivencia en los pacientes con EPOC con y sin insuficiencia
cardiaca (IC).

Si estudiamos las medianas de tiempo de reingreso en cada grupo, solo podramos


calcular las del grupo con IC, que sera de 7 meses. En el grupo sin IC, al tener menos
del 50% de eventos, no es posible calcular una mediana de tiempo de reingreso.
Recordemos que en los estudios de supervivencia, siempre es ms conveniente dar las
medianas de supervivencia y no las medias, ya que stas ltimas pueden estar
distorsionadas por los pacientes con seguimiento ms largo y por los pacientes

censurados. Si como en el ejemplo no disponemos de mediana de supervivencia,


podemos dar la supervivencia del percentil 25, o bien, dar la supervivencia a intervalos
regulares de tiempo (por ejemplo cada mes, cada 6 meses, cada ao) dividida por
grupos o por el factor de estudio. La funcin de supervivencia puede obtenerse
fcilmente desde cualquier programa estadstico junto con las curvas Kaplan-Meier
como un resultado ms. Como siempre, es conveniente dar los resultados de la
supervivencia acompaados de sus respectivos intervalos de confianza.
Una de las pruebas estadsticas ms utilizadas para la comparacin entre grupos es el
test Log-rank, y al igual que sucede con otras pruebas como el test de Wilcoxon
(Breslow) o Taron-Ware, se basa en comparar las muertes observadas en cada grupo con
las esperadas si la mortalidad fuese la misma en todos los grupos. Por ejemplo, si
comparramos la mortalidad de dos grupos A y B, siendo cada uno del mismo tamao,
es de esperar que en cada momento del seguimiento, el nmero de muertes sea
aproximadamente igual en un grupo que en otro. Si las diferencias son mucho mayores
de lo esperado, entonces rechazaramos la hiptesis nula. El estadstico utilizado se
aproxima a una c2 (chi-cuadrado) con tantos grados de libertad como grupos
comparados menos uno.
Es posible que al final del seguimiento, tengamos el mismo nmero de eventos en el
grupo A que en el B, siendo el comportamiento en cuanto a la supervivencia en cada
grupo totalmente distinto. Imaginemos que en el grupo A, casi todas las muertes se
producen al principio del seguimiento mientras que el grupo B, suceden al final del
mismo. La supervivencia final podra ser la misma aunque la evolucin de los grupos
haya sido totalmente diferente. Por ello conviene siempre estudiar la evolucin de cada
grupo observando las curvas para ver si la aparicin de los eventos es homognea a lo
largo del tiempo, o si por el contrario los eventos aparecen concentrados en un
determinado periodo de tiempo.
Las diferencias entre los distintos test para comparar las curvas de supervivencia, radica
en el peso o importancia que se d al momento en el que se produce el evento a lo largo
del seguimiento. La prueba de Breslow (Wilcoxon) da ms peso a los eventos que se
producen al inicio del seguimiento, donde hay ms sujetos en riesgo. La prueba de
Tarone-Ware, es intermedia al Log-rank, dando ms peso a los eventos que se producen
al principio, aunque no tanto como la de Breslow.
En nuestro ejemplo, la prueba de Log-rank (logaritmo de los rangos o tambin conocida
como prueba de Mantel-Cox y similar a la de Mantel-Haenszel) nos da un valor 4,39
con una p=0,036 lo que indica que la supervivencia, en este caso los tiempos de
reingresos, son mayores en el grupo sin IC. Por tanto podemos concluir que los
pacientes con insuficiencia cardiaca tienen unos tiempos de reingreso menores que
aquellos pacientes sin IC, siendo estas diferencias estadsticamente significativas.
Para realizar los clculos, se han de ordenar cronolgicamente las observaciones de
cada grupo de forma combinada y contabilizar el nmero de sucesos que se producen en
cada momento en el tiempo. De no existir diferencias entre los grupos, lo esperado a
lo largo del tiempo, es que en cada momento tendramos la misma proporcin de
eventos en uno y otro grupo. El estadstico c2 con un grado de libertad permite contrastar
si esto es as:

Esta prueba tambin nos sirve para comparar ms de dos grupos, siendo OA y OB los
sucesos observados en el grupo A y B, y EA y EB los eventos esperados en los grupos A
y B respectivamente.
Regresin de Cox
El modelo de regresin de Cox, tambin conocido como modelo de riesgos
proporcionales, es en el anlisis de la supervivencia el equivalente a la regresin lineal.
La regresin de Cox tambin guarda cierta similitud con la regresin logstica as como
en la interpretacin de sus resultados, sin embargo a diferencia de la regresin logstica,
estima tasas de incidencia, o tasas de riesgo (hazard rate) en lugar de odds ratios. La
regresin de Cox, nos permitir estudiar de forma simultnea la relacin entre un
conjunto de variables predictoras o explicativas y la tasa de incidencia del evento de
inters. Tambin podremos predecir y describir la evolucin de la tasa de riego a lo
largo del tiempo a partir de un conjunto de variables predictoras cuyos valores pueden
cambiar a lo largo del tiempo. Como siempre, el evento de inters no tiene
necesariamente que ser la muerte, pudindose estudiar cualquier otro, sin embargo el
suceso debe ser irreversible y ocurrir una sola vez, siendo necesaria adems la censura
no informativa, al igual que suceda con las curvas Kaplan-Meier.
Muchas veces los eventos pueden ser recurrentes, presentndose ms de una vez en un
mismo sujeto, dando lugar a observaciones no independientes ya que estas ocurrencias
estn correlacionadas entre s. El modelo de regresin de Cox analiza eventos nicos
que se slo se presentan una vez en el tiempo aunque utilizando la estrategia adecuada
es posible obtener estimaciones de las tasas de incidencia para cada ocurrencia.
Para entender mejor el significado e interpretacin de los resultados de la regresin de
Cox, antes se debe comprender el significado de un hazard ratio (tasa instantnea de
riesgo). Aunque bsicamente su interpretacin es similar a la de un riesgo relativo, a
diferencia de ste que se calcula como un cociente de proporciones, el hazard ratio
(HR) es en realidad un cociente de tasas o de densidades de incidencia. Si el evento de
inters que estamos estudiando es supervivencia, un hazard ratio de 2 quiere decir que
aquellos que estn expuestos al factor de riesgo, fallecen 2 veces ms rpido que
aquellos que no estn expuestos al factor, o lo que es lo mismo, la rapidez con la cual
fallecen los pacientes expuestos es el doble que la que tienen aquellos pacientes no
expuestos. Un HR de 0,5 indicara por el contrario una disminucin a la mitad en la
velocidad de ocurrencia de la muerte en los pacientes expuestos. Al igual que el riesgo
relativo o la odds ratio, un HR de 1 indica un efecto nulo y por tanto una velocidad
similar en la aparicin de la muertes en uno y otro grupo. Si nuestra variable o factor de
estudio no fuese una variable categrica y fuese cuantitativa como la edad, el HR se
interpretara como el incremento en la tasa de incidencia por cada unidad en la que
medimos nuestra variable.
Un supuesto bsico que debe cumplir la regresin de Cox para su aplicacin es el
supuesto de proporcionalidad de riesgos. Si estudiamos la mortalidad entre dos grupos
de pacientes, expuestos y no expuestos ha de cumplirse que el cociente de las tasas de
riesgo (HR) entre ambos grupos debe ser constante a lo largo del tiempo de
seguimiento. Esto quiere decir que si tuvisemos un seguimiento entre dos grupos de

pacientes durante 5 aos con un HR en el grupo de expuestos de 2 respecto a los no


expuestos, su HR debe ser aproximadamente igual a lo largo de los 5 aos de
seguimiento. Otro supuesto que ha de comprobarse es que la relacin entre las variables
explicativas o predictoras respecto a la tasa instantnea de riesgo debe ser log-lineal.
Aunque existen mtodos y tcnicas adecuadas para comprobar estos supuestos, su
dificultad excede los objetivos de este texto.
Matemticamente el modelo de Cox est formado por el producto de dos trminos. Sin
entrar en demasiados detalles, diremos que el primer trmino depende slo del tiempo
mientras que el segundo depende de las variables predictoras. Su formulacin es la
siguiente:

: Es el riesgo de observar el evento en el instante t en aquellos pacientes que


tienen un valor determinado en las variables explicativas/predictoras Xi.

: Es la funcin de riesgo de referencia, equivalente a la tasa de riesgo de un


individuo con valor 0 en todas las variables explicativas Xi. Depende exclusivamente
del tiempo y se obtiene a partir de los datos.

: Funcin exponencial de las p variables explicativas.

Con la regresin de Cox podemos analizar de forma conjunta la relacin entre nuestras
variables explicativas y la tasa de incidencia del evento estudiado. Veamos los
resultados de nuestro ejemplo (figura 1) en el caso ms simple que sera con una sola
variable explicativa, para ver si la tasa de reingresos en pacientes con EPOC es diferente
segn tengan o no insuficiencia cardiaca (IC). Dicha tabla corresponde a los resultados
del programa SPSS (Tabla 1).
Tabla 1. Resultados de la regresin de Cox con el programa SPSS.

Grupo

B
ET
Wald gl
1,487 0,791 3,536 1

Sig. Exp(B)
0,060 4,424

Intervalo de
confianza 95,0%
Exp(B)
0,939

20,842

El resultado de la tabla muestra el coeficiente estimado b as como su error estndar. El


valor HR podemos encontrarlo en la columna Exp(B) que es de 4,4 lo que indicara
que aquellos pacientes con IC tienen un riesgo 4,4 veces mayor de reingreso que los
pacientes sin IC, aunque para ser exactos de lo que realmente estamos realmente
hablando, es que la velocidad (tasa de incidencia) de reingresos es de 4,4 veces mayor
en los pacientes con IC. En nuestro ejemplo, el HR resulta no ser significativo
(p=0,060), y por ello el intervalo de confianza incluye el 1.
Bibliografa

1 Martnez Gonzlez, M. A., A. Snchez-Villegas y F. J. Fauln Fajardo (2006).


Introduccin a los modelos de supervivencia. Regresin de Cox. Bioestadstica
Amigable. 2 Edicin. Ed: Daz de Santos. 710-717.
2 Molinero, L. M. (2001). http://www.seh-lelha.org/superviv2.htm. Modelos de
regresin de Cox para el tiempo de supervivencia. (Alce Ingeniera).
3 Domnech Massons, J. M. (2008). Metodologa de investigacin en Ciencias de
Salud. Anlisis de la supervivencia. www.metodo.uab.cat.
4 Walters, S. J. What is a Cox. model? (2001).
http://www.medicine.ox.ac.uk/bandolier/painres/download/whatis/COX_MODEL.pdf

Vous aimerez peut-être aussi