Vous êtes sur la page 1sur 46

Curso de Bioestadstica

Parte 9
Comparacin de dos medias
Dr. en C. Nicols Padilla Raygoza
Departamento de Enfermera y Obstetricia
Divisin Ciencias de la Salud e Ingenieras
Campus Celaya-Salvatierra
Universidad de Guanajuato Mxico

Presentacin
Mdico Cirujano por la Universidad Autnoma de Guadalajara.
Pediatra por el Consejo Mexicano de Certificacin en Pediatra.
Diplomado en Epidemiologa, Escuela de Higiene y Medicina

Tropical de Londres, Universidad de Londres.


Master en Ciencias con enfoque en Epidemiologa, Atlantic
International University.
Doctorado en Ciencias con enfoque en Epidemiologa, Atlantic
International University.
Profesor Titular A, Tiempo Completo, Universidad de
Guanajuato.
Nivel 1 del Sistema Nacional de Investigadores
padillawarm@gmail.com raygosan@ugto.mx

Competencias
Aplicar prueba de Z para obtener inferencias de la

comparacin de dos medias pareadas.


Aplicar prueba de Z para obtener inferencias de dos
medias independientes.
Aplicar prueba de t para dos medias pareadas en
una muestra pequea.
Aplicar prueba de t para dos medias independientes
en una muestra pequea.
Obtendr el intervalo de confianza para dos medias
pareadas e independientes.

Introduccin
Con frecuencia queremos hacer

comparaciones de dos grupos.


Los mtodos estadsticos usados para la
comparacin de dos medias dependen de
cmo las dos medias fueron obtenidas. Los
datos pueden ser obtenidos de muestras
pareadas o no pareadas.

Datos pareados
Cmo obtenemos datos pareados?

Muestras pareadas ocurren cuando las


observaciones individuales en la primera
muestra son pareadas a las observaciones
individuales de la segunda muestra.

Para datos cuantitativos usualmente ocurre

cuando hay mediciones repetidas en la


misma persona.

Ejemplo
En un estudio para determinar si las

mediciones de peso al nacer son adecuadas,


se compar el peso al nacer de recin
nacidos de un hospital en Celaya, Gto.
Las mediciones fueron realizadas por
diferentes personas, para controlar el sesgo
de medicin, estando un observador cegado
a la medicin del otro observador.

Datos no pareados
Cmo obtenemos datos no pareados?

Obtenemos datos no pareados cuando


observaciones individuales en una muestra
son independientes de las observaciones
individuales de la segunda.

Ejemplo
Para estudiar los efectos de un nuevo medicamento

para tratar la carga parasitaria de Ascaris


lumbricoides, los pacientes fueron aleatorizados para
recibir nitazoxanida (grupo A) y albendazol (grupo B).
El efecto del medicamento en cada grupo fue medido
y comparado.
En el anlisis de datos pareados calculamos la
diferencia entre la primera y la segunda medicin.
Esto nos da una muestra de diferencias, para luego
aplicar los mtodos de anlisis para datos
cuantitativos de una muestra.

Anlisis de datos cuantitativos


pareados
Cuando analizamos datos pareados, lo primero es calcular la

diferencia entre las dos observaciones individuales en cada par.


Se midieron los pesos al nacer del recin nacidos en Celaya,
por dos observadores.
Paciente

Observador 1 (g)

Observador 2 (g)

Diferencia
(d)

2970

3010

- 40

3525

3650

-125

3100

3125

- 25

2750

2550

200

4000

4050

- 50

3200

3300

-200

3000

3000

2500

2700

-200

3200

3400

-200

10

3900

3700

200

Anlisis de datos cuantitativos


pareados
Para evaluar la diferencia en mediciones pareadas podemos calcular la

media de las diferencias y su intervalo de confianza; tambin podemos


calcular si la media de las diferencias es significativamente diferente de
0.
La notacin que usamos para indicar la media de las diferencias y
desviacin estndar en la muestra y la poblacin se muestran:

Media de
las
diferencias
Desviacin
estndar

Poblacin

Muestra

_
d

Intervalo de confianza
Si no hay diferencia entre las mediciones

pareadas, la media de las diferencias ser 0.


Para calcular el intervalo de confianza de la
media de las diferencias de la muestra y
probar la hiptesis de que es igual a 0,
necesitamos conocer:

La media de las diferencias


La desviacin estndar de las diferencias
El error estndar de la media de las
diferencias

Intervalo de confianza
Podemos calcular el intervalo de confianza

alrededor de la media de las diferencias de la


muestra en la misma forma que los hicimos
para la media de una muestra.
El intervalo de confianza al 95% nos dice que
tenemos 95% de confianza de que la
verdadera media de la poblacin est entre el
intervalo de confianza al 95% a los lados de
la media de la muestra.

Intervalo de confianza
La frmula general para el intervalo de confianza al

95% es:

Estimacin de la muestra 1.96 x ES de la estimacin


de la muestra

Entonces el intervalo de confianza al 95% para la

media de las diferencias es:

1.96 x (s()/n)
es la media de las diferencias.
1.96 es el multiplicador que usamos al calcular el
intervalo de confianza al 95%.
Si lo calculamos al 90% usamos 1.64 como
multiplicador.

Ejemplo
Intervalo de confianza al 95%

d de pesos al nacer = -34.0


s= 140.94
ES= 140.94/10=44.60
-341.96 (44.60) = -121.42 a 53.42

Ejemplo
Intervalo de confianza al 90%

d de pesos al nacer = -34.0


s= 140.94
ES= 140.94/10=44.60
-341.64 (44.60) = -107.14 a 39.1

Prueba de hiptesis para una media de


diferencias
Un intervalo de confianza al 95% nos da un

rango de valores a los lados de la media de


las diferencias que estamos confiados en un
95% que incluye la media de diferencias en
la poblacin.
Tambin podemos calcular la probabilidad de
que, en promedio, no hay diferencia entre las
observaciones pareadas en la poblacin,
usando una prueba de hiptesis.

Prueba de hiptesis para una media de


diferencias
La hiptesis nula es que la media de las

diferencias en la poblacin es cero:


Ho: = 0

Esto es equivalente a decir que la distribucin


de la media de las diferencias de la muestra
es Normal, con media 0 y un error estndar
que depende de la desviacin estndar de la
diferencia en la poblacin.

La hiptesis alternativa es que la media de la

diferencia en la poblacin no es cero:


HA: 0

Prueba de hiptesis para una media de


diferencias
La prueba de hiptesis:

Para probar la hiptesis nula calculamos la


prueba Z

Media de las diferencias de la muestra


media de las diferencias de la hiptesis
d-0
z = ----------------------------------------------------- = -----------error estndar de la diferencia de
ES(d)
medias de la muestra

Donde la media de las diferencias de la hiptesis es cero.

Prueba de hiptesis para una media de


diferencias
Calcular el valor de z en la prueba de

hiptesis, nos dice a cuantos errores


estndar de la media observada est el
centro de la distribucin, definida por la
hiptesis nula.
-0
Z= ----------------S() /n

Ejemplo
Hemos visto que la media de la diferencia de

peso en 10 recin nacidos fue de -34, con


s=140.9 e intervalos de confianza al 95% de
-121.42 a 53.42 gr.
Queremos encontrar si las mediciones
tomadas por los dos observadores fueron
realmente diferentes.

Ejemplo
Debemos sealar la hiptesis nula:

En promedio, todas las mediciones posibles


tomadas por los dos observadores son
idnticas, o
La media de las diferencias en la poblacin es
cero.
La hiptesis alternativa ser: la media de la
diferencia en la poblacin no es cero.

Ejemplo
-34 0
Para probar la hiptesis calculamos z = ----------- = - 0.76
44.52
Asumiendo que la media de las diferencias est
Normalmente distribuida con media de cero, el resultado de
la prueba dice que la media de las diferencias estimada est
a -0.76 errores estndar del centro de la distribucin.
Refiriendo el valor de z de -0.76 a las tablas de dos colas de
la distribucin Normal estndar el valor de p es 0.44.
La conclusin es que aceptamos la hiptesis nula y decimos la
variacin de muestreo es una probable explicacin para las
diferencias en las medias.

Como obtener el valor de p


En la tabla de la distribucin Normal o Z,

buscamos en la columna Z el valor que


obtuvimos con nuestra prueba y vemos en la
columna p el valor que corresponde.
Esta tabla se puede encontrar en libros de
texto de Bioestadstica.

Muestras pareadas pequeas


Cuando el tamao de muestra es pequeo, la

distribucin de las muestras no es


exactamente Normal, pero sigue la
distribucin t.
Por este motivo, si el tamao de muestra es
pequeos (menos de 50) usamos los valores
de la distribucin t, para el clculo del
intervalo de confianza y prueba de hiptesis.

Intervalo de confianza para muestras


pareadas pequeas
La frmula para el intervalo de confianza al 95% es

estimacin t0.05 (ES)


Donde estimacin es la media de las diferencias
t0.05 es el valor de la distribucin t a 0.05 de p con n-1
grados de libertad.
La primera columna de la distribucin t es grados de
libertad que corresponde a n-1. Vamos a la derecha
hasta donde cruce el valor que corresponda con p
0.05 y ese es el multiplicador que usamos para el
intervalo de confianza.

Prueba de hiptesis para muestras


pareadas pequeas
La frmula para la prueba de hiptesis es:

t = media de diferencias 0 /ES


La frmula es similar que la prueba de Z, slo
que el resultado, para obtener el valor de p,
se busca en la tabla de la distribucin t.
La primer columna es grados de libertad (n-1)
y se busca a la derecha el valor de t que
obtuvimos y en la columna se comprueba el
valor de p.

Anlisis de muestras independientes


Difiere del anlisis de datos pareados, ya que

observamos la diferencia entre dos medias


independientes en lugar de la media de las
diferencias de dos observaciones pareadas.
Ejemplos

Los fumadores tienen diferente presin arterial que


los no fumadores?
En una muestra de fumadores y no fumadores:
La presin arterial sistlica fue en promedio de 148 y
entre no fumadores de 138.
La diferencia en medias es 148-138 =10.

Anlisis de muestras independientes


Notacin:

Ya que estamos observando dos poblaciones


independientes y dos muestras son necesarias,
necesitamos notaciones adicionales. Que se muestran en la
tabla de abajo:
Recuerde que usamos letras griegas para parmetros de la
poblacin y letras latinas para estimaciones de la muestra:
Los nmeros inferiores nos sirven para diferenciar entre la
muestra 1 y la muestra 2, y entre las poblaciones 1 y 2.
Poblacin
Muestra
1
2
1
2
_
_
Media
1
2
X1
X2
Desviacin estndar
1
2
s1
s2

Distribucin de muestreo para dos


muestras independientes
La distribucin de muestreo de la diferencia entre

dos medias independientes es encontrada usando


los mismos procedimientos usados para una sola
muestra.
Tomamos repetidamente muestras aleatorias de
tamao n1 y de tamao n2 de una segunda
poblacin y cada vez calculamos las medias (x1,x2)
y las desviaciones estndar (s1, s2) en ambas
poblaciones y luego medimos la diferencia entre las
medias para cada par de muestras.
El resultado es una distribucin de muestreo de
diferencias entre las dos medias independientes.

Distribucin de muestreo para dos


muestras independientes
Generando esta distribucin podemos ver que:

1.- La media de la distribucin de muestreo es el valor de la


poblacin, que es la diferencia entre las dos medias de la
poblacin.
2.- La desviacin estndar de la distribucin de muestreo depende
de n1 y n2, que son los tamaos de muestra.
3.- La forma de la distribucin se vuelve ms parecida a la Normal
cuando n1 y n2, se incrementan.
Sabemos que la distribucin de muestreo de cualquier
estimacin de la muestra puede ser inferida de los datos
reunidos de slo una muestra.
Los mismos principios aplican en este caso: la distribucin de
muestreo de la diferencia de medias puede ser inferida de slo
un grupo de dos muestras. Para realizar esto, necesitamos:

La diferencia entre las dos medias de las muestras


El error estndar de la diferencia entre las dos medias de las muestras

Error estndar para la distribucin de


la diferencia de medias
El error estndar de la diferencia entre dos medias

independientes es la combinacin de los errores


estndar de las dos distribuciones de muestreo
independiente.
Sabemos que el error estndar de una media de la
muestra es:
s
ES = -------n
Varianza de la media es el cuadrado del error
estndar: Varianza = 2 / n

Error estndar para la distribucin de


la diferencia de medias
Se puede mostrar que la varianza de dos medias independientes es

igual a la suma de las varianzas de las dos medias de las muestras, ya


que:
1
2
ES (X1) = ------ES (X2) = -------n
n
_
_
2 1
22
Varianza (X1 X2) = varianza de X1 + varianza de X2 = --------- + ------n1
n2
Las varianzas son sumadas debido a que cada una de las muestras
contribuye al error de muestreo de la distribucin de las diferencias.
Entonces, el error estndar de la diferencia entre dos muestras
independientes es dado por:
21
ES (X1 X2) = ------n1

22
+ -----n2

Error estndar para la distribucin de


la diferencia de medias
En la mayora de las situaciones no

conocemos las desviaciones estndar de la


poblacin (1 y 2); en la prctica
comnmente, usamos las desviaciones
estndar de la muestra (s1 y s2), por lo que:

ES(X1 X2) =

s21
------n1

s 21
+ --------n2

Intervalo de confianza para la


diferencia de dos medias
Asumiendo que la distribucin de muestreo

de (X1 X2) es Normal, podemos calcular el


intervalo de confianza para la diferencia entre
dos medias usando la frmula general:
Diferencia en medias 1.96 (ES (X1 X2))

Para un intervalo de confianza al 95%,


asumiendo distribucin Normal:

_
_
(X1 X2) 1.96 [(s21 / n1) + (s21 / n2)]

Ejemplo
En un estudio para evaluar la eficacia de la solucin

de rehidratacin oral (SRO) en nios con diarrea


aguda, 40 nios estuvieron en el grupo de
tratamiento y 40 en el grupo control. Se midi la
duracin media en horas de la diarrea y la desviacin
estndar.
Grupo
n Media de duracin de diarrea
s
Tratamiento 40
72
10
Control
40
120
12

Ejemplo
Para calcular el intervalo de confianza al 95% para la

diferencia en medias de muestras independientes,


necesitamos primero calcular la diferencia en medias
y el error estndar:
_
_
X1 X2 = 72 120 = - 48 horas
s21 s22
102 122
ES(X1 X2) = -----+ ----- = ------ + ---- =2.5+3.6 = 2.47
n1 n2
40
40
95% IC = -48 1.96 (2.47)= - 52.8 a 43.16

Ejemplo
La diferencia en medias fue de -48 horas con

un error estndar de 2.47.


Los intervalos de confianza al 95% nos dicen
que tenemos 95% de confianza en que la
diferencia en las medias de la duracin de
diarrea en toda la poblacin est entre 52.8
horas y -43.16 horas.
Como no incluye la unidad, puedo adelantar
que las diferencias en las medias son
estadsticamente significativas.

Prueba de hiptesis para dos medias


independientes
Para calcular la probabilidad (valor de p) de que las dos medias

son iguales, usamos la prueba de hiptesis.


Usamos la prueba de z en la misma forma, que lo hicimos para
la media de diferencias de muestras pareadas:
La hiptesis nula es que las dos medias son iguales: Ho:
1 2 = 0
La hiptesis alternativa es: H1: 1 - 2 0
As, la frmula para la prueba de z es:
_
_
(X1 X2) - 0
z = -----------------ES(X1 X2)
ES (X1 X2) = (s21 /n1) + (s21 /n2)

Ejemplo
Apliquemos la prueba de hiptesis para el estudio de solucin de

rehidratacin oral, de que la duracin de la diarrea es en promedio la


misma para ambos grupos.

La diferencia de medias es 48 horas. El error estndar es 2.47.

- 48 - 0
Z = ----------- = - 19.43
2.47

Esto nos dice que la diferencia observada es -19.43 errores estndar


del centro de la distribucin (0).
El valor de p, para z = - 19.43 es <0.0001
Si no hubiera diferencia en la duracin de la diarrea entre los dos
grupos, debera haber una pequea oportunidad (p<0.0001) de
observar una diferencia tan extrema como la observamos.
Podemos decir que es ms probable que la diferencia entre las dos
medias sea diferentes, o sea, que la diferencia en el promedio del
grupo con SRO con el control, son estadsticamente diferentes.

Muestras pequeas con dos medias


independientes
Cuando comparamos dos muestras independientes

que son pequeas, usamos la distribucin t en lugar


de la distribucin Normal para calcular los intervalos
de confianza y para probar hiptesis.
El procedimiento es similar al que hemos usado para
datos de una muestra, con una excepcin: el clculo
del error estndar.
La varianza comn:
Con muestras pequeas estimamos una varianza
comn usando los datos de dos muestras
independientes. Es el promedio de las dos varianzas:
(n1 1)s21 + (n2 -1)s21
S2 = --------------------------(n1 1) + (n2 -1)

Muestras pequeas con dos medias


independientes
El error estndar de la diferencia entre la

media de la muestra es:


ES(X1-X2) = s x 1/n1 + 1/n2

Ejemplo
En un estudio para el tratamiento de anemia

por deficiencia de hierro, con dos tipos


diferentes de hierro, se aleatorizaron los
escolares de un pueblo, para recibir uno u
otro tratamiento.
Al inicio, los niveles de hemoglobina (HB) en
g/Dl. eran similares en ambos grupos.
Despus de 3 meses de tratamiento se
midieron los niveles de HB.

Ejemplo
Hemoglobina
n Media (g/Dl.) s
Hierro A 15
14.8
0.5
Hierro B 13
12.1
1.1
Intervalo de confianza al 95% = diferencia de
medias multiplicador t0.05 x ES
Multiplicador t0.05 con n-2 grados de libertad =
2.056
S2 = (15-1)0.52 + (13 -1)1.12 /15-1 + 13-1 =3.5
+14.52/26 = 18/26 =0.69

Ejemplo
Hemoglobina
n Media (g/Dl.) s
Hierro A 15
14.8
0.5
Hierro B 13
12.1
1.1
Intervalo de confianza al 95% = 14.8 - 12.1
2.056 x 1.21
ES = s 1/n1 + 1/n2 = 0.69 x1/15 + 1/13=
0.83 x 0.379 = 0.32
IC95% = 2.7 0.66 = 2.04 a 3.36

Ejemplo
Hemoglobina
n Media (g/Dl.) s
Hierro A 15
14.8
0.5
Hierro B 13
12.1
1.1
Ho: 1=2 o 1-2= 0
HA: 12 o 1-2 0
t= (14.8 - 12.1)-0 / 0.32 = 8.44
gl n-2 = 26 p<0.05

Bibliografa
1.- Last JM. A dictionary of epidemiology.

New York, 4 ed. Oxford University Press,


2001:173.
2.- Kirkwood BR. Essentials of medical
ststistics. Oxford, Blackwell Science, 1988: 14.
3.- Altman DG. Practical statistics for medical
research. Boca Ratn, Chapman & Hall/
CRC; 1991: 1-9.

Vous aimerez peut-être aussi