Vous êtes sur la page 1sur 122

UNIVERSIDAD NACIONAL DE INGENIERIA

FACULTAD DE INGENIERIA AMBIENTAL

ESTADSTICA
APLICADA A LA INVESTIGACIN
Y EPIDEMIOLOGIA

MsC. Beatriz Castaeda S.


Enero 2005

INDICE
1. Diseo de Estudio de Investigacin
1.1. Estudios de Observacin
1.2. Estudios Experimentales

Pgina
1
1
2

2. Seleccin de mtodos estadsticos


2.1. Medidas de Resumen
2.2. Principios Bsicos de Pruebas de Hiptesis

3
4
5

3. Pruebas Paramtricas y Pruebas no Paramtricas


3.1. Pruebas de Hiptesis para la media poblacional
3.2. Prueba Ji-Cuadrado para la Varianza 2
3.3. Prueba Z para una Proporcin Poblacional
3.4. Pruebas de Hiptesis para la comparacin de medias poblacionales
3.5. Prueba para la media de la diferencia (datos apareados)
3.6. Prueba de comparacin de varianzas
3.7. Prueba Z para comparacin de proporciones poblacionales
3.8. Anlisis de Varianza Prueba para comparacin de medias de
varios grupos.
3.9. Prueba Ji-Cuadrado para comparacin de proporciones
3.10. Prueba de Independencia Ji-Cuadrado

27
29
36
41
44
53
56
59

4. Medicin Epidemiolgica
4.1. Tasas
4.2. Relacin entre 2 caractersticas nominales
4.3. Evaluacin de Procedimientos de deteccin.

81
81
85
90

5. Tamao de muestra
5.1. Una poblacin
5.2. Dos poblaciones

93
93
97

63
71
76

Bibliografa

100

Apndice A: Esquemas de seleccin de Pruebas Estadsticas


Apndice B: Esquemas para la realizacin de una prueba de Hiptesis
Apndice C: Tablas.

101
105
107

MsC Beatriz Castaeda Saldaa

1. DISEO DE ESTUDIO EN INVESTIGACIN

I.

Estudios de observacin
1.
2.
3.
4.

II.

Descriptivo o series de casos


Estudios de casos control
Estudios transversales
Estudios de cohorte

Estudios experimentales
1. Pruebas clnicas controladas
a) Aleatorias
b) No aleatorias
2. Pruebas clnicas no controladas

1.1. ESTUDIOS DE OBSERVACIN


1. Descriptivo de serie de casos.
Cuando en un informe publicado se describen ciertas caractersticas de un
grupo de pacientes (serie de casos). La observacin de los pacientes es por
un periodo breve. No se incluyen sujetos de control.
No son estudios planeados y no comprenden hiptesis a investigar, son
precursores de otros estudios
Estos estudios conducen a formulacin de hiptesis que son investigadas
en estudios posteriores de casos control, transversal o de cohorte.
2. Estudios de casos control.
Las historias o sucesos previos de casos y controles se analizan en un
intento de identificar una caracterstica o factor de riesgo presente en los
casos pero no en los controles.
Si el investigador sospecha que un desequilibrio en las caractersticas
podran afectar las conclusiones, entonces se deben crear los
igualamientos (observaciones apareadas).
La direccin del estudio es hacia atrs se pregunta qu pas?

MsC Beatriz Castaeda Saldaa


3. Estudios transversales.
Analizan datos obtenidos de un grupo de sujetos en un punto determinado
en lugar de un periodo, se planean para investigar qu esta pasando en
este momento? (estudios de prevalencia)
4. Estudios de cohorte.
Los investigadores seleccionan sujetos al inicio del estudio y los diferencian
segn posean el factor de riesgo o hayan sido expuestos. Luego se los
observa por cierto tiempo para contrastar el efecto. qu pasar?

1.2. ESTUDIOS EXPERIMENTALES (PRUEBAS CLNICAS)


1. Pruebas clnicas controladas
Son estudios donde el frmaco o procedimiento en experimentacin se
compara con otro frmaco o procedimiento, en ocasiones un placebo y a
veces un tratamiento antes aceptado
a) Aleatorias
Los pacientes se distribuyen al azar entre las opciones de
tratamiento. Aseguran de la mejor manera que el resultado se debe
a la intervencin.
b) No aleatorias
Los pacientes no se asignan al azar entre las opciones de
tratamiento. Muchos investigadores creen que los estudios sin
controles aleatorios presentan fuentes de desviacin, por lo cual sus
conclusiones son debatibles.
2. Pruebas clnicas no controladas.
Son estudios en donde se describe la experiencia del investigador con el
frmaco o procedimiento experimental, pero el tratamiento no se compara
con otro, por lo menos de manera formal

MsC Beatriz Castaeda Saldaa

2. SELECCIN DE LOS MTODOS ESTADSTICOS


Antes de seleccionar un mtodo estadstico debemos tomar dos decisiones:
1) Cul es la variable dependiente y cual es la independiente, y
2) Qu tipo de datos constituyen cada una de esas variables.
Clasificacin de las variables en funcin de los objetivos de la investigacin
Variable dependiente: Puede identificarse como la variable de inters principal o el
desenlace principal del estudio. Queremos contrastar hiptesis o hacer
estimaciones, o efectuar ambos procedimientos, acerca de la variable
dependiente.
Variables independientes: Son las que determinan las caractersticas que es
necesario tener en cuenta o las condiciones en que se contrastan las hiptesis o
se realizan las estimaciones.
Tipos de variable y escala de medicin
Adems de caracterizar la funcin de las variables en el anlisis, para seleccionar
la prueba estadstica debemos determinar el tipo de datos que constituyen las
mediciones de cada variable.

Cuadro N 1
Tipo de variable Descripcin
Categrica

Cuantitativa

Escala
Nominal

Ejemplo
-sexo
-estado civil
Clasifica a los elementos (no establece -raza
orden)
en categoras o clases
Ordinal
-Dolor
-Color (intensidad)
(orden en
-Estado de enfermedad
categoras)
-Edad
Cuando asume valores
-talla
cuantitativos.
Numrica
-peso
- Discretos
-nmero de hijos
- Continuos
-tiempo de enfermedad

MsC Beatriz Castaeda Saldaa


2.1.

MEDIDAS DE RESUMEN

Llamadas tambin medidas descriptivas por que tienen por objeto describir la
naturaleza de la caracterstica en estudio.

MEDICIN DE DATOS NUMRICOS


Medidas de Posicin
- Media aritmtica o promedio
- Moda
- Cuantilas: Mediana, cuartiles, deciles, percentiles
Medidas de dispersin
- Amplitud o rango
- Varianza y desviacin estndar
- Coeficiente de Variacin

MEDICIN DE DATOS NOMINALES


- Proporciones
- Porcentajes
- Razones
- Tasas

MsC Beatriz Castaeda Saldaa


2.2. PRUEBAS DE HIPTESIS

Principios bsicos de prueba de hiptesis


2.2.1. Definicin
Una prueba de hiptesis es un procedimiento estadstico con el cual, utilizando la
informacin que proporciona una o ms muestras aleatorias, tomamos la decisin
de rechazar o no rechazar un supuesto (hiptesis) acerca de la poblacin o
poblaciones de donde se ha elegido la muestra, asumiendo un riesgo
(probabilidad de error) de equivocarnos al tomar la decisin.
Para realizar el proceso de prueba de hiptesis es necesario que primero se
considere de manera clara lo que se desea probar y expresarlo de manera escrita,
lo cual luego debe ser indicado en trminos de medidas estadsticas de la variable
o caracterstica de la poblacin bajo estudio.
Ejemplo 2.1
Se ha observado que la ingesta de 500 mg. diarios de vitamina C se asocia a la
reduccin de ms de 50 mg. por 100 ml. del nivel de colesterol srico de personas
con niveles de colesterol elevado, luego se plantea que la vitamina C reduce el
nivel de colesterol srico
Entonces para considerar el anlisis estadstico de esta suposicin, determinamos
que:
Poblacin bajo estudio: Personas con nivel de colesterol elevado
Variable:

nivel de colesterol srico (variable cuantitativa)

Medida estadstica:

Promedio de la reduccin del nivel del colesterol


despus de un tratamiento con vitamina C

Hiptesis estadstica:

La reduccin promedio del nivel de colesterol srico es


mayor que 50 mg por 100 ml

H: > 50 mg por 100 ml


2.2.2. DETERMINACIN DE HIPTESIS ESTADSTICAS SEGN NMERO DE
POBLACIONES Y TIPO DE VARIABLE
Las hiptesis estadsticas a plantear y las pruebas a utilizar dependen del tipo de
variable y del nmero de grupos o poblaciones para las que se establece el
supuesto. As tenemos:

MsC Beatriz Castaeda Saldaa

UN GRUPO O POBLACIN
Si la variable es cuantitativa, los parmetros de inters son la media
poblacional () y la varianza poblacional (2); as las hiptesis a formular sern
referidas a la media y varianza poblacional.
Variable: X (cuantitativa)
Poblacin
: Media
X

Medidas
(parmetros)

2: Varianza

Hiptesis:
H: > 50*
H: 2 < 10*
* valores hipotticos para este ejemplo

Si la variable es categrica, el parmetro de inters es la proporcin


poblacional (P); as las hiptesis a formular sern referidas a la proporcin
poblacional.
Variable: categrica (ejemplo: sexo)

Poblacin
Sexo
H
P

M
1-P

Medida : P (Proporcin poblacional)


(parmetro)
Hiptesis:
H: P = 0.30*
* valor hipottico para el ejemplo

MsC Beatriz Castaeda Saldaa

DOS GRUPOS O POBLACIONES


Si la variable es cuantitativa, los parmetros de inters son la medias
poblacionales (1 , 2 ) y la varianzas poblacionales (21 , 22) ; as las hiptesis
a formular sern referidas a la comparacin de medias poblacionales y/o a la
comparacin de varianzas poblacionales.
Variable: X (cuantitativa, ejemplo: nivel de hemoglobina srico)

Poblacin 1

Poblacin 2

X
1

21

Parmetros : 1

X
2

22

21; 2 ; 22

Hiptesis:
H: 21 < 22

H: 1 < 2

comparacin de
medias

comparacin de
varianzas

Si la variable es categrica, los parmetros de inters son las proporciones


poblacionales (P1, P2 ); as las hiptesis a formular sern referidas a la
comparacin de proporciones poblacionales.
Variable: Categrica (ejemplo: hbito de fumar)
Poblacin 1

Poblacin 2

F no F

F no F

P1 1-P1

P2 1-P2

Parmetros : P1

P2

Hiptesis:
H: P1 = P2
comparacin de proporciones

MsC Beatriz Castaeda Saldaa

TRES O MAS GRUPOS O POBLACIONES


Sean k grupos (k 3) y la variable cuantitativa, entonces, los parmetros de
inters son la medias poblacionales (1 , 2, ..., K ) y la varianzas poblacionales
(21 , 22, ..., 2K ); as las hiptesis a formular sern referidas a la comparacin de
medias poblacionales y/o a la comparacin de varianzas poblacionales.
Variable: X (cuantitativa, ejemplo: peso de recin nacidos)
Poblac. 1

Poblac. 2 ... Poblac K

1 21

2 22

K 2K

Parmetros : 1 ; 21; 2 ; 22
...
K 2K

Hiptesis:
H: 21 = 22 = ... = 2K

H: 1 2 ... K
comparacin de
medias

comparacin de
varianzas

Sean k grupos (k 3) y la variable categrica, entonces los parmetros de


inters son las proporciones poblacionales (P1, P2, PK ); as las hiptesis a
formular sern referidas a la comparacin de proporciones poblacionales.
Variable: Categrica (ejemplo: prevalencia de cncer de cuello uterino)
Poblac. 1

Poblac. 2 ... Poblac K

C noC

C noC

C noC

P1 1-P1

P2 1-P2

PK 1-PK

Hiptesis:

Parmetros : P1

H: P1 P2 ... PK

P2; .... ; PK

comparacin de proporciones

MsC Beatriz Castaeda Saldaa

2.2.3. Elementos de una prueba de hiptesis


1) Hiptesis nula y alterna
Al realizar el proceso de prueba de hiptesis los supuestos deben ser formulados
de una manera adecuada para poder aplicar los procedimientos estadsticos; por
ello se debe plantear dos hiptesis, denominadas hiptesis nula (Ho) e hiptesis
alterna (H1)
Hiptesis nula (Ho)
Es la hiptesis que el procedimiento estadstico somete a prueba, se formula como
un supuesto de no diferencia o igualdad para el valor poblacional, o como un
supuesto de no asociacin entre dos variables
Ejemplo 2.2
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es de 5%

H0: P = 0.05

El nivel promedio de glicemia en pacientes


con diabetes tipo II del distrito de Catacaos
es 210 mg %

H0: = 210 mg%

La prevalencia de parasitosis intestinal en los


nios preescolares del asentamiento humano
la Esperanza es igual a la de los nios preescolares del distrito de San Isidro.

H 0: P 1 = P 2

Hiptesis alterna (H1)


Esta hiptesis sirve para contrastar la hiptesis nula, usualmente, se formula como
un supuesto de diferencia, lo cual incluye un amplio rango de valores, desde una
diferencia pequea hasta una diferencia relativamente grande
Ejemplo 2.3
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es menor
del 5%

H1: P < 0.05

MsC Beatriz Castaeda Saldaa


El nivel promedio de glicemia en pacientes
con diabetes tipo II del distrito de Catacaos
es mayor de 210 mg %
La prevalencia de parasitosis intestinal en los
nios pre-escolares del asentamiento humano
la Esperanza es mayor que la de los nios preescolares del distrito de San Isidro.

H1: > 210 mg %

H1: P1 > P2

Los supuestos planteados en las investigaciones nos llevan a formular


hiptesis de diferencia, y nosotros para el manejo estadstico lo indicaremos
como la hiptesis alterna (H1) y a la complementaria que lleve la igualdad la
indicaremos como hiptesis nula (H0).
Ejemplo 2.4
Se ha desarrollado un nuevo medicamento y deseamos probar que este es ms
eficaz que uno antiguo porque suponemos que el porcentaje de pacientes curados
es significativamente mayor con el medicamento nuevo que con el antiguo.
Entonces:
H 0:

El medicamento nuevo es igual o


menos eficaz que el antiguo

H0: Pnuevo Pantiguo

H 1:

El medicamento nuevo es ms
eficaz que el antiguo

H1: Pnuevo > Pantiguo

Planteamiento de una hiptesis


Para considerar el planteamiento de las hiptesis tomaremos como ejemplo el
planteamiento de hiptesis para la media poblacional.
Sea el valor verdadero de la media de una poblacin o universo y k un valor
especfico; la hiptesis que se va a contrastar tomar una de las 3 formas
siguientes:
1. = k, significa que el valor verdadero de la media poblacional es igual a un
valor especfico k
2. k, significa que el valor verdadero de la media poblacional es mayor o
igual a un valor especfico k

10

MsC Beatriz Castaeda Saldaa


3. k, significa que el valor verdadero de la media poblacional es menor o
igual a un valor especfico k.
En cada una de las proposiciones anteriores, la hiptesis que se habr de
comprobar es la hiptesis nula (H0). Esta hiptesis nula, tambin llamada de
nulidad, afirma que no existe diferencia significativa entre un estado actual general
del universo con uno particular, como se ha establecido en la hiptesis.
Si se rechaza la hiptesis nula (H0), esto implica que se acepta alguna
descripcin alterna del estado del universo. Siempre existir una alternativa,
llamada hiptesis alterna o alternativa (H1), asociada con cualquier hiptesis nula
propuesta.
La aceptacin o rechazo de una hiptesis implica el rechazo o aceptacin
respectiva de la otra alternativa. O sea que estos dos eventos son mutuamente
excluyentes y completamente exhaustivos.
Las formas en las cuales se pueden presentar tanto las hiptesis nulas como las
alternativas son las siguientes:
Hiptesis nula (H0)

Hiptesis alternativa (H1)

1. H0: = k

H 1: k

(alternativa bilateral)

2. H0: k

H 1: < k

(alternativa unilateral)

3. H0: k

H 1: > k

(alternativa unilateral)

2) Decisin
Al realizar el proceso de prueba de hiptesis y utilizar la informacin que
proporciona una muestra, sta nos puede indicar una de dos posibles decisiones:
rechazar o no rechazar la hiptesis nula (H0).
Rechazar H0 a favor de H1. Significa que la diferencia encontrada en la muestra
respecto a lo planteado en H0 es tan grande que ya no es probable que se deba al
azar del muestreo, sino a que en la poblacin existe esta diferencia, es decir se
cumple H1.
No rechazar H0. Significa que la diferencia encontrada en la muestra con respecto
a lo planteado en H0 es pequea y puede deberse al azar del muestreo, por ello se
dice que no hay razones suficientes para rechazar la hiptesis nula.

11

MsC Beatriz Castaeda Saldaa

3) Estadstica de la prueba
Una vez formuladas las hiptesis se debe considerar la utilizacin de la muestra
para la comprobacin de stas, es decir, el uso de una medida de la muestra
cuyos valores esperados se encuentren relacionados con lo expresado en las
hiptesis de manera que nos pueda servir como un indicador de la concordancia
de la muestra con una de las hiptesis planteadas.

Ejemplo 2.5
Se piensa que la vitamina C puede disminuir los niveles del colesterol srico, y
que esta disminucin en promedio es mayor de 50 mg. por 100 ml. Para confirmar
se evala una muestra de 40 personas (con niveles elevados de colesterol) antes
y despus de un tratamiento de un mes bajo un rgimen de 500 mg. diarios de
vitamina C.
Entonces las hiptesis estadsticas son formuladas de la siguiente manera:
H0: 50

H1: > 50

Estas hiptesis son referidas al valor de la disminucin promedio (), por lo que la
medida de la muestra relacionada con estas hiptesis es la media muestral ( x ), ya
que la media muestral se distribuye alrededor de la media poblacional, segn el
modelo normal.

De manera que si la hiptesis nula (H0) fuera cierta, esperaramos que la media de
la muestra, x , tome valor alrededor de 50 o menos; en cambio, si la hiptesis
alterna (H1) fuera la correcta, entonces esperaramos que x tome valor alrededor
de un valor mayor que 50; grficamente tenemos:

12

MsC Beatriz Castaeda Saldaa


H0

50

H1

> 50

As para la toma de decisin se considera una medida de la muestra, que est


muy relacionada con las hiptesis planteadas, pero como los valores a observar
para la muestra estn sujetos al azar del muestreo, entonces las decisiones se
establecen sobre la base del comportamiento probabilstico de la medida
calculada a partir de la muestra, por ello la Estadstica ha construido medidas,
usando los datos de la muestra, para las cuales se pueda utilizar los modelos
tericos de probabilidad con los que se pueda realizar el proceso de comparacin.
Ejemplo 2.6
Siguiendo con el ejemplo anterior, tenemos que:
H0: 50

H1: > 50

La Estadstica propone calcular la medida estandarizada de la media de la


muestra en lugar de usar directamente a la media muestral

Z=

x 0
;
S
n

cuya distribucin es N(0,1) si H0 es cierta

Para nuestro ejemplo, como 0 = 50, al reemplazar en la expresin Z obtenemos:

Z=

x 50
;
S
n

cuya distribuci n es N (0,1) si H 0 es cierta

13

MsC Beatriz Castaeda Saldaa


De manera que si la hiptesis nula (H0) fuera cierta, esperaramos que Z tome un
valor alrededor de 0 menor que 0; en cambio, si la hiptesis alterna (H1) fuera la
correcta, entonces esperaramos que Z tome valor alrededor de un valor mayor
que 0; grficamente tenemos:

Si x 50

Si x > 50

Cmo se aprecia en la expresin Z para la estadstica de la prueba, sta se


ha construido en funcin del valor planteado en H0; por lo que la prueba, como ya
se dijo anteriormente, ha sido diseada para comprobar la hiptesis nula.
Segn las hiptesis formuladas, y teniendo en cuenta los requisitos estadsticos
que se deben cumplir (tamao de muestra, distribucin probabilstica de la
poblacin, relacin de independencia entre los grupos, etc), La Estadstica ha
diseado expresiones diversas cuya distribucin probabilstica se asocia a un
modelo de probabilidad, por lo que a las pruebas se les denomina con el nombre
del modelo que sigue o se aproxima a tener la estadstica de la prueba.

Ejemplo 2.7
1. Prueba Z para la media
H0 : 0
H0 : = 0
Estadstica de la prueba :

Z=

x 0
S
n

Esta prueba es aplicable slo si la muestra es grande (n 30)

14

MsC Beatriz Castaeda Saldaa


2. Prueba T para la media
H0 : = 0

H0 : 0

Estadstica de la prueba :

T =

x 0
S
n

Esta prueba es aplicable para muestras pequeas (n < 30) de poblacin


normal.
3. Prueba Z para la proporcin
H0 : P = P0

H1 : P P 0

Estadstica de la prueba : Z =

p P0
P0 (1 P0 )
n

Esta prueba es aplicable slo si la muestra es grande (n 30)


En la Unidad 3 se desarrollan las pruebas estadsticas diseadas para las
hiptesis formuladas, especificando los requisitos que se deben cumplir
para su correcta aplicacin.

4) Regin crtica y regin de no rechazo


Al elegir muestras aleatorias de tamao n de una poblacin, debido al azar del
muestreo, algunas muestras tendrn medidas que sern concordantes o
favorecern a la hiptesis nula (H0) y otras sern concordantes o favorecern a la
hiptesis alterna (H1). As para la toma de decisin se considera una medida de la
muestra, que est muy relacionada con las hiptesis planteadas, y a su recorrido
esperado se divide en dos regiones excluyentes y complementarias llamadas
Regin crtica o de rechazo y Regin de no rechazo.

15

MsC Beatriz Castaeda Saldaa


Ejemplo 2.8
Para probar las hiptesis
H0: 50

H1: > 50

Si consideramos como estadstica para la prueba a la cantidad Z

Z =

x 50
S
n

y eligiramos a 2 como el punto de divisin de su recorrido esperado tendramos

Si x 50

Si x > 50

Regin de no Rechazo

Regin de Rechazo (RC)

Luego como se aprecia en la figura hemos dividido al recorrido de Z en dos


regiones, de manera que si la media de la muestra x es mayor que 50 y su valor
estandarizado (Z) es mayor que 2, rechazamos H0 a favor de H1, pues el resultado
de la muestra es concordante con H1; en cambio si x es cercano a 50 y su valor
estandarizado (Z) es menor que 2, nosotros no podemos rechazar H0 , pues la
diferencia encontrada es pequea (no significativa) y podra deberse al azar del
muestreo.
Regin de no rechazo: Conjunto de resultados muestrales que son concordantes
o favorecen a la hiptesis nula, indicando que la diferencia encontrada en la
muestra con respecto a lo planteado en H0 es pequea (no significativa) y puede
deberse al azar del muestreo.

16

MsC Beatriz Castaeda Saldaa


Regin crtica o regin de rechazo (R.C.): Conjunto de resultados muestrales
que son concordantes o favorecen a la hiptesis alterna, indicando que la
diferencia encontrada en la muestra con respecto a lo planteado en H0 es grande
(significativa) y ya no es posible que se deba al azar del muestreo sino a que
realmente hay diferencias.

5) Tipos de error
Al tomar una decisin sobre la base de la informacin que proporciona una
muestra, como desconocemos la situacin real de la poblacin, corremos el
riesgo de equivocarnos. As al no rechazar H0 cuando esta es verdadera no
cometemos error, en cambio si rechazamos H0 cuando es verdadera cometemos
un error. De manera similar si H0 es falsa (H1 es verdadera) y la muestra nos
indica no rechazar H0 cometemos un error en cambio si la muestra nos indicara
rechazar no cometemos error.

Poblacin

H0
Verdadera

H0
Falsa

H1
verdadera

La muestra indica
No rechazar H0
(no error)

Rechazar H0
(error tipo I)

No rechazar H0
(error tipo II)

Rechazar H0
(no error)

Luego en el proceso de prueba de hiptesis estamos expuestos a cometer 2


errores posibles
Error Tipo I = Rechazar H0 cuando H0 es verdadera
Error Tipo II = No rechazar H0 cuando H0 es falsa, es decir, H1 es verdadera

17

MsC Beatriz Castaeda Saldaa

6) Nivel de significancia y Potencia de la Prueba


En el proceso de toma de decisin se tiene por objeto que las probabilidades de
cometer error sean pequeas; as se denomina a la probabilidad de cometer
error Tipo I y a la probabilidad de cometer error tipo II, es decir,

= P(error tipo I) = P(Rechazar H0 cuando H0 es verdadera)


a la probabilidad tambin se denomina nivel de significancia de la prueba o
tamao de la regin crtica, y el investigador la debe fijar por adelantado,
segn el riesgo que est dispuesto a correr, de rechazar una situacin que en la
realidad es cierta.

= P(error tipo II) = P(No rechazar H0 cuando H0 es falsa)


A (1 - ) se denomina potencia de la prueba y es la probabilidad de rechazar H0
cuando sta es falsa, es decir, cuando H1 es verdadera, esto es:
1 - =P[Rechazar H0 cuando H0 es falsa (H1 verdadera)] = Potencia de la prueba
La potencia de la prueba mide la probabilidad de detectar las diferencias, es decir,
detectar que H1 es verdadera y es utilizada al considerar la determinacin del
tamao de muestra necesario para probar las hiptesis.
Para calcular las probabilidades y es necesario que las hiptesis sean
formuladas para valores especficos de los parmetros de la poblacin,
Ejemplo 2.9
Continuando con el ejemplo anterior consideremos para la hiptesis alterna un
valor mayor que 50, por ejemplo 60, luego las hiptesis quedan especificadas
como:
H0: = 50

H1: = 60

Entonces la distribucin de la media muestral podra ser alrededor de 50 si H0 es


verdadera o alrededor de 60 si H0 es falsa (H1 es verdadera), grficamente
tenemos:
18

MsC Beatriz Castaeda Saldaa


H0

1-

H1

1-
x

= 50
Regin de no rechazo

= 60
Regin crtica o de rechazo (R.C.)

= P(Rechazar H0 cuando H0 es verdadera)


= P( x se encuentre en la Regin de rechazo, cuando H0 es verdadera)
= P( x > c; cuando = 50)

= P(No rechazar H0 cuando H0 es falsa, es decir, H1 es verdadera)


= P( x se encuentre en la Regin de no rechazo, cuando H1 es verdadera)
= P( x c; cuando = 60)
Observamos que las probabilidades y han quedado determinadas por el
punto de corte (c) y se encuentran relacionadas entre si, de manera que si
cambiamos el punto de corte una disminuye y la otra crece, y viceversa.
El punto de corte c, para x , est ntimamente relacionado con el punto de corte
para la estadstica seleccionada para la prueba de hiptesis. As al considerar la
prueba Z anteriormente elegimos a 2 como punto de corte
H1

H0

Z
0
2
Regin de no rechazo

Regin crtica o de rechazo

Luego, considerando la distribucin de Z (el modelo normal) tenemos:


= P(Rechazar H0 cuando H0 es verdadera) = P(Z > 2) = 0.02275
19

MsC Beatriz Castaeda Saldaa

como

Z =

x 50
S
n

Entonces

Luego

Z > 2

C = 50 + 2

Supongamos que n = 40 , y

x 50
> 2
S
n

x > 50 + 2

S
n

S
n
S = 16

C = 50 + 2

16
= 55
40

Con este valor para C podemos, ahora, calcular la probabilidad de error tipo II ()
para = 60, es decir

= P( x c; cuando = 60) =
x 60
55 60
= P

16 / 40
16 / 40

= P( x 55; cuando = 60)

= P (Z 1.98 ) = 0.02385

Por lo tanto la potencia de la prueba para la alternativa = 60 es:

1 - = 0.976
En el sentido ptimo deseamos contar con una regla de decisin para la cual las
probabilidades de cometer error sean pequeas, por ello el mtodo estadstico que
vamos a utilizar consiste en fijar (nivel de significancia), es decir, fijar el riesgo
que aceptamos correr de rechazar la hiptesis nula (H0) cuando esta es
verdadera.
Reforzando el significado prctico del nivel de significancia, podemos decir
que esta medida indica la probabilidad de que podamos encontrar un valor
muestral relativamente alejado del valor planteado en la hiptesis nula, cuando en
realidad el valor de la poblacin coincide con este supuesto. Por ello el nivel de
significancia se elige como un valor de 5%, 1% o 0,1% (1un milsimo) de manera
20

MsC Beatriz Castaeda Saldaa


que no ms de 5 en 100 veces ( 0.05 5%) tomemos la decisin equivocada
de rechazar la hiptesis nula que si es verdadera.
En el ejemplo considerado anteriormente, 0.02 (2%), esto implicara que, si la
verdadera media de la disminucin del colesterol debido al tratamiento con
vitamina C es de 50 mg por 100 ml, entonces se tiene 2% de probabilidad de que
podamos tener una media muestral mayor que 55 mg por 100 ml.
Luego, si la muestra observada proporcionara, por ejemplo, una media muestral
de 58 mg por 100 ml, podemos considerar que este resultado difiere
significativamente del valor 50 (ya que hay slo 2% de probabilidad de que x > 55
y esto se debera a que la verdadera disminucin promedio del colesterol es
mayor de 50 mg por 100 ml, por lo que rechazaramos la hiptesis nula a favor de
la hiptesis alterna.

2.2.4. Nivel crtico (p) de una prueba estadstica


El nivel crtico (p) es la probabilidad mnima con la que se podra rechazar la
hiptesis nula (H0) sobre la base de los resultados obtenidos en la muestra,
bajo el supuesto de que la hiptesis nula es verdadera (Conover W.J.
Practical Nonparametric Statistics. Pg.80)

p = P(rechazar H0 con los resultados obtenido en la muestra observada,


cuando H0 es verdadera)
Este valor p es la principal estadstica utilizada en la prueba de hiptesis. El
cual indica la probabilidad, asumiendo que la hiptesis nula fuera verdadera,
de que los datos observados se alejen del valor planteado en la hiptesis
nula en la magnitud observada o en una magnitud mayor, slo debido a la
casualidad o el azar. El valor p es calculado partiendo del modelo estadstico
que se considera que describe el patrn de comportamiento de las
observaciones cuando el azar es la nica causa para su variabilidad
(Kenneth J. Rothman: Modern Epidemiology pag 116).

Ejemplo 2.10
Para las hiptesis formuladas anteriormente

H0: 50

H1: > 50

21

MsC Beatriz Castaeda Saldaa


Supongamos que la muestra observada proporcion los resultados siguientes para
la media y desviacin estndar:
n = 40 ;

x = 58 ;

S = 16

Deseamos saber si esta media muestral difiere significativamente con respecto a


la reduccin promedio de 50 mg por 100 ml propuesta en H0, luego calculamos p,
la probabilidad de que la media de la muestra tome un valor tan grande o mayor
que 58, asumiendo que la verdadera media es igual a 50.

p = P( x 58 cuando = 50) o en trminos de la estadstica Z

x 0
58 50
= P(Z 3.16) = 0.00079
P

S
/
n
16
/
40

grficamente tenemos:

p = 0.00079

50
As

58

3.16

p = 0.00079 0.008 < 0.001

Este valor p se interpreta para tomar la decisin, as tenemos que la probabilidad


de obtener una media muestral mayor o igual a 58, cuando la media de la
poblacin es 50, es casi improbable (p < 0.001); por lo que conclumos que la
diferencia es altamente significativa e indicadora de que la disminucin promedio
del nivel de colesterol srico es mayor de 50 mg por 100 ml.
El valor p es una estadstica continua con un rango de 0 a 1. Pequeos
valores de p indican un bajo grado de compatibilidad entre la hiptesis nula
y los datos observados, en virtud de la baja probabilidad de que un resultado
tan extremo o mas extremo que el observado en los datos pueda haber sido
generado si la hiptesis nula fuera verdadera. Un bajo valor de p, por lo
tanto, cambia la credibilidad de la hiptesis nula hacia la hiptesis alterna, la
cual sirve como una explicacin relativamente mejor para los datos (Kenneth
J. Rothman: Modern Epidemiology pag 116).

22

MsC Beatriz Castaeda Saldaa


Aunque el valor de p es una medida continua bastante significativa, a menudo es
interpretado como una medida cualitativa para la decisin sobre el rechazo de la
hiptesis nula. Usualmente el 5% es seleccionado como un criterio por el cual
juzgamos el valor p, y este valor es usado para clasificar las diferencias
observadas ya sea como significativa si p 0.05, en cuyo caso la hiptesis nula
es rechazada, o como no significativa si p > 0.05, en cuyo caso la hiptesis nula
no se rechaza . En el cuadro N2 se presenta un resumen de las interpretaciones
para p

Cuadro N 2

NIVEL CRTICO DE UNA PRUEBA ESTADSTICA:


INTERPRETACIN *
Nivel crtico
p > 0.05

0.01 < p 0.05

0.001 < p 0.01

p 0.001

Interpretacin
Indica que la diferencia encontrada
es no significativa y puede deberse
al azar del muestreo

Conclusin
No rechazar H0
No hay evidencia suficiente para rechazar.

Indica que la diferencia encontrada


Rechazar H0 a favor de
es significativa y que probablemente H1
ya no se deba al azar del muestreo
hay evidencia suficiente
para rechazar
Rechazar H0 a favor de
Indica que la diferencia encontrada
es muy significativa y probable- H1
mente se deba a que hay diferencias
en la poblacin
hay evidencia suficiente
para rechazar
Rechazar H0 a favor de
Indica que la diferencia encontrada
es altamente significativa y proba- H1
blemente se deba a que hay
diferencias en la poblacin
hay evidencia suficiente
para rechazar

Si para la realizacin de la prueba de se ha pre-fijado un nivel de


significancia , entonces para tomar la decisin se compara p con , de
manera que

Si p > , entonces no se puede rechazar la hiptesis al nivel establecido


Si p , entonces se rehaza la hiptesis nula para el establecido.

23

MsC Beatriz Castaeda Saldaa

Resumen
En esta unidad Ud. ha recibido las bases para la realizacin de una prueba de
hiptesis estadstica, la cual ser una herramienta muy til para la comprobacin
de los supuestos planteados en las investigaciones en las que Ud, participe. A
continuacin se presenta un esquema resumido del procedimiento a seguir para la
realizacin de una prueba de hiptesis

PROCEDIMIENTO A SEGUIR PARA LA REALIZACIN DE UNA


PRUEBA DE HIPOTESIS

1. Defina con claridad los supuestos que se plantean en la


investigacin
2. Identifique la o las poblaciones bajo estudio
3. Identifique el tipo de la variable en estudio, relacionada con
las suposiciones.
4. Plantee las hiptesis nula y alternativa.
5. Elija la prueba estadstica apropiada para la prueba de las
hiptesis planteadas.
6. Pre-determine el nivel de significancia para la regin de
rechazo
7. Calcule la estadstica de la prueba con los datos obtenidos
para este fin
8. Obtenga el nivel crtico para el resultado obtenido con la
muestra
9. Tome la decisin comparando el nivel crtico (p) con el nivel
de significancia ()

24

MsC Beatriz Castaeda Saldaa

Ejercicio Aplicativo N 1
RENDIMIENTO ESCOLAR Y DESARROLLO VISOMOTOR EN HIJOS DE
MADRES ADOLESCENTES
Silvestre N, Villena A. Gonzles G, Instituto de Investigaciones de la Altura. Dpto.
de Ciencias Fisiolgicas. Universidad Peruana Cayetano Heredia. (Revista Mdica
Herediana 7. Suplemento 1, 1996. pg 6)
El objetivo del presente estudio fue determinar el desarrollo visomotor y el
rendimiento escolar en hijos de madres adolescentes y compararlos con los
observados en hijos de madres adultas. La muestra estuvo constituida por 59
nios de 7-8 aos de edad, mestizos que residen en la ciudad, hijos de madres
adolescentes, y 73 nios de 7-8 aos de edad, hijos de madres adultas ( > 20
aos). El desarrollo visomotor fue evaluado utilizando la prueba de Bender. El
rendimiento escolar fue analizado en base al porcentaje de nios de cada grupo
que desaprob el ao escolar ( 10).
La prueba de Bender se basa en el nmero de errores que tiene un nio cuando
trata de reproducir nueve figuras que les han sido mostradas.
Los hijos de madres adolescentes tuvieron el mayor nmero de errores(6,34
0,38; media ES) en la prueba de Bender cuando se les compara con los
resultados en hijos de madre adulta (4,75 0,24; p < 0.001)
El 13,8% de hijos de madres adolescentes desaprobaron el ao escolar a
diferencia del 4,3% observado en hijos de madre adulta (p <0.01)
En conclusin, los hijos de madres adolescentes tienen un retardo en el desarrollo
visomotor y un menor rendimiento escolar que los hijos de madres adultas
Para esta investigacin identifique
1) Poblacin o poblaciones bajo estudio

2) Variables de inters y su tipo

25

MsC Beatriz Castaeda Saldaa


3) Hiptesis del estudio

4) Hiptesis estadsticas

5) Interpretacin del nivel crtico

26

MsC Beatriz Castaeda Saldaa

3.

PRUEBAS PARAMETRICAS Y PRUEBAS NO


PARAMETRICAS

Segn los requisitos exigidos para tener en consideracin la distribucin de la


estadstica de la prueba, las pruebas estadsticas se han dividido en dos grandes
grupos denominados Pruebas paramtricas y pruebas no paramtricas

Pruebas paramtricas son aquellas en las que el inters se centra en probar


una hiptesis acerca de uno o ms parmetros de la poblacin, adems lo bsico
de estos procedimientos es que se debe conocer la distribucin de la poblacin
de la cual proviene la muestra (usualmente el modelo normal)
Pruebas no paramtricas son aquellos procedimientos que prueban hiptesis
que no son afirmaciones acerca de parmetros de la poblacin, sino ms bien
plantea determinados comportamientos para la poblacin, o aquellos para los
cuales no se exige que la poblacin tenga una distribucin conocida (Wayne,
Daniel. Bioestadstica)
Cuadro N 3
Nmero de
Grupos

PRUEBAS PARAMTRICAS
Variable
de inters
cuantitativa

Uno
Categrica

Dos

cuantitativa

Categrica

K
(K 3)

cuantitativa

Parmetro
Poblacional
Media :

Prueba Estadstica
Prueba Z
Prueba T

Varianza: 2

Prueba Ji-Cuadrado

Proporcin: P Prueba Z
Medias: 1, 2 Prueba de comparacin
de medias: Prueba Z o T
Media de la
diferencia: d Prueba - datos apareados
Prueba de comparacin
de varianzas
Varianzas:
Prueba F
21, 22
Prueba de comparacin
Proporciones: de proporciones
P1, P2
Prueba Z
Prueba de comparacin
Medias :
de medias
Anlisis
de
Varianza
1, 2, ..., k
(Prueba F)
Prueba de Bartlet para
Varianzas:
21, 22, ..., 2k comparacin de varianzas

27

MsC Beatriz Castaeda Saldaa

Cuadro N 4
Nmero de
Grupos

PRUEBAS NO PARAMTRICAS
Variable
de inters

Hiptesis

Prueba Estadstica
Prueba de bondad de
Distribucin de la ajuste
Cuantitativa, poblacin tiene
Ordinal o
un modelo deter- Prueba Ji-Cuadrado
categrica
minado
Prueba de Kolmogorov
Smirnov

Uno
Ordinal o
cuantitativa
Categrica

Dos

Ordinal o
cuantitativa
Categrica

Ordinal
cuantitativa

K
(K 3)
Categrica

Mdicin de efec- Prueba del signo


to antes-despus
Prueba de Wilcoxon
(observaciones
apareadas)
Prueba de McNemar
Comparacin de
mediciones
(grupos indepen- Prueba de
dientes)
Mann-Whitney
Comparacin de Prueba exacta
proporciones
de Fisher
Comparacin de
mediciones
Prueba de Kruskal-Wallis
(grupos indepeno dientes
Comparacin de
mediciones
(grupos dependientes)
Comparacin de
Proporciones:
P1j, P2j, ..., Pkj

Prueba de Friedman
Prueba de comparacin
de proporciones o de
homogeneidad
Prueba Ji-Cuadrado*

Comparacin de
tratamientos
(Observaciones Prueba de Cochran
relacionadas)
* Slo esta prueba ser desarrollada en este curso

28

MsC Beatriz Castaeda Saldaa

3.1. Pruebas de Hiptesis para la media poblacional ()


Prueba Z para la media ()
Datos:
La muestra consiste de n valores cuantitativos, independientes de una poblacin
Requisitos:
1) La muestra es aleatoria
2) Muestra grande de cualquier poblacin o muestra de cualquier tamao si la
poblacin tiene distribucin normal.
3) Varianza poblacional 2 conocida.
Hiptesis:
a) H0: = 0

H1: 0

b) H0: 0

H1: > 0

c) H0: 0

H1: < 0

Estadstica de la prueba

Z=

x 0
/ n

Z tiene distribucin normal N(0,1) si H0 es verdadera.

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

/2

Z > Z1-/2

/2

Z
-Z1-/2
R.C.

Z1-/2

R.C.

29

MsC Beatriz Castaeda Saldaa


b) Rechazar H0 al nivel , si

Z > Z1-

Z
0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

Nota
Si la varianzas 2, es desconocida, entonces, slo cuando la muestra sea
grande (n 30 ), la estadstica Z se obtendr como

Z =

x 0
S/ n

Ejemplo 1
Se llev a cabo un estudio sobre nutricin en un pas en desarrollo. El objetivo del
estudio fue determinar si los habitantes de una regin rural tenan un consumo
diario mnimo de 2000 caloras, que cubriera sus requerimientos bsicos para la
supervivencia. Una muestra de 500 adultos campesinos report un consumo
medio diario de caloras de 2015 con una desviacin estndar de 210 caloras.
De acuerdo a los objetivos propuestos, planteamos hiptesis para el consumo
promedio diario de caloras en la regin:
H1: > 2000
H0: = 2000
Recordemos que plantear que el consumo medio diario de la poblacin es de 2000
caloras, implica que el 50% de la poblacin consume menos de 2000 caloras y
30

MsC Beatriz Castaeda Saldaa


que el otro 50% consume ms de 2000 caloras, por ello para que la mayora de la
poblacin tenga un consumo diario mnimo de 2000 caloras, el promedio debera
ser mayor de 2000 caloras (ver grfico)

50% 50%

> 2000

= 2000
Como la muestra es grande calculamos

Z=

x 0
S/ n

2015 2000
= 1.598
210 / 500

Para este valor de Z, calculado con la informacin de la muestra, obtenemos


el nivel crtico p para la toma de decisin:

p = 0.0548
Z
1.598

p = P(Z 1.598) = 0.0548 > 0.05


lo que indica que el consumo promedio diario de caloras no difiere
significativamente de 2000 caloras ( p >0.05), por lo que no podemos concluir
que la mayora de la poblacin, de esta regin, tenga consumo diario mnimo
de 2000 caloras.

31

MsC Beatriz Castaeda Saldaa

Prueba T para la media ()


Datos:
La muestra consiste de n valores cuantitativos independientes de una poblacin
normal
Requisitos:
1) La muestra es aleatoria
2) Muestra pequea (n < 30) procedente de una poblacin normal.
3) Varianza poblacional 2 desconocida.
Hiptesis:
a) H0: = 0

H1: 0

b) H0: 0

H1: > 0

c) H0: 0

H1: < 0

Estadstica de la prueba

T =

x 0
S/ n

T tiene distribucin t-Student con n-1 grados de libertad [ t(n-1) ], si H0 es


verdadera.

Regla de decisin
a) Rechazar H0 al nivel , si

T < -t1-/2

/2

T > t1-/2

/2

T
-t1-/2
R.C.

t1-/2
R.C.

32

MsC Beatriz Castaeda Saldaa

b) Rechazar H0 al nivel , si

T > t1-

T
0
c) Rechazar H0 al nivel , si

t1-
R.C.

t < -t1-

T
-t1-
R.C.

Ejemplo 2
Un laboratorio farmacutico conduce una investigacin relativa a la eficacia de una
vacuna contra el sarampin. La variable considerada es el ttulo de anticuerpos en
suero producido por la vacuna.
La vacuna producida por otro laboratorio reporta un ttulo promedio
de
anticuerpos de 1.9.
Para probar si la nueva vacuna es ms eficaz que la vacuna antigua, se aplic la
vacuna a 16 voluntarios y se obtuvo los siguientes resultados:
1.2, 3.0, 2.5, 2.4, 1.9, 1.8, 1.5, 2.6, 2.7, 3.1, 1.7, 2.3, 2.2, 2.4, 2.2, 2.1
Luego aqu planteamos las hiptesis
H 0:

El ttulo promedio del anticuerpo de esta nueva vacuna es igual al de la


vacuna antigua. ( = 1.9)

H1: El ttulo promedio del anticuerpo de esta nueva vacuna es mayor que la de la
vacuna antigua ( > 1.9)

33

MsC Beatriz Castaeda Saldaa


Como la muestra es pequea, con los datos se ha comprobado que la distribucin
de los ttulos del anticuerpo tienen distribucin normal, por lo tanto para probar las
hiptesis utilizaremos la prueba T
Luego calculamos la media, desviacin estndar y la estadstica T para realizar la
prueba de las hiptesis.
x = 2.225

T=

x 0
S/ n

S = 0.518

2.225 1.9
= 2.51
0.518 / 16

Para el valor calculado de T obtenemos el nivel crtico p utilizando la distribucin

t-Student con 15 grados de libertad.

t (15 )

p = 0.012

t (15 )
2.51
ESTE RESULTADO NOS INDICA QUE LOS DATOS SON CONCORDANTES
CON UN VALOR PROMEDIO MAYOR A 1.9, PUES LA DIFERENCIA
ENCONTRADA ES MUY SIGNIFICATIVA (p = 0.012).
LUEGO PODRAMOS CONCLUIR QUE LA NUEVA VACUNA PRODUCE
TTULOS DE ANTICUERPOS SIGNIFICATIVAMENTE MAYORES QUE LOS
PRODUCIDOS POR LA VACUNA ANTIGUA.

34

MsC Beatriz Castaeda Saldaa


Resumimos las pruebas de hiptesis para la media poblacional en el siguiente
cuadro
Cuadro N 5

PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONAL

Prueba

a) H0: = 0

H1: 0

b) H0: 0

H1: > 0

c) H0: 0

H1: < 0

Requisitos

Estadstica
de la prueba

Distribucin de Decisin:
La estadstica Rechazar H0
Si H0 es cierta Al nivel si

Varianza 2 conocida
-Todo n de poblacin
Normal
- n grande de cualquier
poblacin

x 0
Z=
/ n

Normal

Varianza 2 desconocida
- n grande (n > 30)
de cualquier poblacin

x 0
Z =
S/ n

Normal

Varianza 2 desconocida
- n < 30 de poblacin
Normal

x 0
T=
S/ n

t-Student

N(0,1)

N(0,1)

t(n -1)

a) Z < -Z1-/2
Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
a) Z < -Z1-/2
Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
a) T < -t1-/2
T > t1-/2
b) T > t1-
c) T < -t1-

35

MsC Beatriz Castaeda Saldaa

3.2. Prueba Ji-Cuadrado para la varianza 2


Datos:
La muestra consiste de n valores cuantitativos independientes de una poblacin
normal.

Requisitos:
1) La muestra es aleatoria
2) La poblacin es normal.

Hiptesis:
a) H0: 2 = 20

H 1: 2 20

b) H0: 2 20

H 1: 2 > 20

c) H0: 2 20

H 1: 2 < 20

Estadstica de la prueba:

X =
2

(n 1) S 2

02

X2 tiene distribucin Ji-cuadrado

2( n 1)

, si H0 es verdadera.

Regla de decisin:
si X2 < 2 / 2

a) Rechazar H0 al nivel ,

X2 > 12 / 2

/2
/2

X2

2 / 2

R.C.

12 / 2

R.C.
36

MsC Beatriz Castaeda Saldaa

b) Rechazar H0 al nivel ,

si

X2 >

12

X2

12

R.C.
c) Rechazar H0 al nivel ,

si X2 < 2

X2

R.C.
Ejemplo 3
Para que un medicamento sea eficaz contra cierta enfermedad debe tener cierta
concentracin del principio activo definida con exactitud. Por esta razn la
concentracin de dichos medicamentos debe tener un valor medio de acuerdo a
lo especificado en su envase y, adems, la variacin de la concentracin debe ser
pequea. De no ser as las farmacias estaran expendiendo medicamentos que
podran tener concentraciones peligrosamente elevadas o que podran tener una
concentracin tan baja que los hara ineficaces.
Un fabricante de cierto medicamento registra en sus envases que su producto
tiene una concentracin del principio activo de 5 0.1 mg/cc.
Esta afirmacin nos llevara a plantear que la distribucin de la concentracin de
este medicamento sera normal con media = 5 y desviacin estndar
= ( 0.1) /3 = 0.033

37

MsC Beatriz Castaeda Saldaa


grficamente tendramos:

99.7%

X
5
y

4.9
3 = 0.1

5.1
3 = 0.1

Es decir si 3 = 0.1, se garantizara que el 99.7% de los productos tendran una


concentracin en el rango de 4.9 a 5.1 mg/cc.
Para verificar la concentracin del medicamento estaramos interesados en
probar dos hiptesis para la concentracin del medicamento, esto es:

a) La concentracin promedio es 5 mg/cc


H 0: = 5

H 1: 5

b) La variabilidad de la concentracin del medicamento es 0.033 mg /cc


H0: 2 (0.033) 2

H1: 2 > (0.033) 2

se tom una muestra de 8 envases para los cuales se obtuvo las siguientes
concentraciones en mg /cc
4.94, 5.09, 5.03, 4.90, 4.95, 5.04, 5.02, 4.93
Como la eleccin de la prueba para las hiptesis formuladas acerca de la media,
en el caso de muestras pequeas, depende de que se conozca la varianza de la
poblacin; primero probaremos las hiptesis para la varianza
De la muestra observada obtenemos:

n=8;

x = 4.9875;

S2 = 0.00439;

S=0.0663
38

MsC Beatriz Castaeda Saldaa

Luego

(n 1) S 2 7(0.00439 )
X =
=
= 28.21
(0.033 ) 2
20
2

Para el valor calculado de

X2

obtenemos el nivel crtico

distribucin Ji-Cuadrado con 7 grados de libertad.

p utilizando la

2
( 7)

p < 0.001

2( 7)
28.21

como P < 0.001, entonces se rechaza H0 a favor de H1

Luego, este resultado nos indica que la diferencia encontrada es muy grande
y que es casi improbable que se deba a la variabilidad del muestreo por lo
que concluimos: Que el fabricante de este medicamento est elaborando el
producto con una concentracin cuya variabilidad es mucho mayor que la
especificada en sus envases (desviacin estndar = 0.033 mg/cc), pues la
diferencia encontrada es altamente significativa (p < 0.001)
Entonces, como se ha rechazado el valor supuesto para la varianza, la prueba de
las hiptesis para la media la realizaremos utilizando la prueba T para muestras
pequeas con varianza poblacional desconocida.
H 0: = 5

H 1: 5

De los datos de la muestra tenemos:

39

MsC Beatriz Castaeda Saldaa

T=

x 0
S/ n

4.9875 5
= 0.533
0.0663 / 8

Para el valor calculado de T obtenemos el nivel crtico p utilizando la distribucin

t-Student con 7 grados de libertad.

t (7)

p > 0.25
2

t (7)
- 0.533
Por ser una prueba de alternativa bilateral

p > 0.50 > 0.05

Este resultado nos indica que los datos son concordantes con el valor 5 para la
media poblacional, ya que la diferencia encontrada es pequea y es altamente
probable que se deba al azar del muestro
Concluimos que no podemos rechazar lo especificado por el fabricante para la
concentracin media del medicamento (5 mg/cc), pues no hay evidencia suficiente
(p > 0.05)

En resumen concluimos que esta muestra nos indica que el fabricante


debera corregir la variabilidad de la concentracin del medicamento para
que cumpla con la especificaciones.

40

MsC Beatriz Castaeda Saldaa

3.3. PRUEBA Z PARA UNA PROPORCIN POBLACIONAL (P)


Datos:
Muestra que consiste de n resultados de observaciones independientes, cada
resultado puede estar en una de dos categoras pero no en ambas.
Requisitos:
1. Las n observaciones son mutuamente independientes
2. Cada resultado de las n observaciones tiene probabilidad P de pertenecer a
la categora 1
3. La muestra es grande
4. La poblacin es grande o infinita, es decir la muestra(n) es mximo el 10%
de la poblacin(N) (n 0.10 N)

Hiptesis:
a) H0: P = P0

H 1: P P 0

b) H0: P P0

H 1: P > P 0

c) H0: P P0

H 1: P < P 0

Estadstica de la prueba:

Z=

p P0
P0 (1 P0 )
n

Z es N(0,1), si H0 es verdadera

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

/2

Z > Z1-/2

/2

-Z1-/2
R.C.

Z1-/2

R.C.

41

MsC Beatriz Castaeda Saldaa

b) Rechazar H0 al nivel , si

Z > Z1-

0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

Nota
Si la poblacin es finita, es decir, la muestra (n) es mayor al 10% de la
poblacin (N) (n > 0.10 N), entonces la estadstica Z se obtendr como

Z=

p P0
P0 (1 P0 ) N n

n
N 1

Ejemplo 4
Luego de la realizacin de un programa de inmunizacin contra la rubola, se
inform que la inmunizacin haba tenido una cobertura del 50% de los nios de
primaria. Una institucin supervisora sospecha que se ha sobrevalorado la
cobertura del programa, por lo que aplic una encuesta a 500 nios de primaria,
revelando que 150 nios haban sido inmunizados. Al 5% de significancia
podremos decir que estos resultados validan lo afirmado acerca de la cobertura
del programa de inmunizacin?
42

MsC Beatriz Castaeda Saldaa

Luego la proporcin en la muestra es

P = 150 = 0.30
500

Aqu planteamos las hiptesis


H0: P = 0.50

H1: P < 0.50

Calculamos la estadstica Z

Z=

p P0
0.30 0.50
=
= 8.944
P0 (1 P0 )
0.50(0.50)
500
n

Calculamos el nivel crtico

p = P(Z < -8.944) 0


Este resultado nos indica la diferencia es tan grande que es improbable que
pueda deberse al azar del muestreo, por lo que para cualquier nivel de
significancia elegido se estara rechazando la hiptesis nula, es decir, concluimos
que se ha sobrevalorado la cobertura del programa de inmunizacin.

43

MsC Beatriz Castaeda Saldaa

3.4. Pruebas de Hiptesis para la comparacin de


medias poblacionales (1, 2)

Prueba Z para la diferencia de medias (1 - 2)


Datos:
Una muestra de tamao n1 (x1, x2, ....., xn1) de la poblacin 1 y una muestra de
tamao n2 (x1, x2, ....., xn2) de la poblacin 2
Requisitos:
1) Ambas son muestras aleatorias de su poblacin correspondiente.
2) Las poblaciones 1 y 2 son independientes
3) Las muestras son grandes (n1 30; n2 30) de cualquier poblacin o son
de cualquier tamao si la poblaciones son normales.
4) Las varianzas poblacionales 21, 22 son conocidas

Hiptesis:
a) H0: 1 = 2

H1: 1 2

H0: 1 - 2 = 0

H1: 1 - 2 0

b) H0: 1 2

H1: 1 > 2

H0: 1 - 2 0

H1: 1 - 2 > 0

c) H0: 1 2

H1: 1 < 2

H0: 1 - 2 0

H1: 1 - 2 < 0

Estadstica de la prueba

Z =

( x1 x 2 )

12 22
n1

n2

Z tiene distribucin normal N(0,1) si H0 es verdadera.

44

MsC Beatriz Castaeda Saldaa

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

Z > Z1-/2

/2

/2

-Z1-/2
R.C.
b) Rechazar H0 al nivel , si

Z1-/2

R.C.

Z > Z1-

0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

Nota
Si las varianzas 21, 22 son desconocidas, entonces slo cuando las
muestras sean grandes (n1 30 , n2 30), la estadstica Z se obtendr como

Z=

( x1 x 2 )
S 12 S 22
+
n1 n2
45

MsC Beatriz Castaeda Saldaa

Ejemplo 5
Un epidemilogo desea comparar dos vacunas para la rabia. Las personas que
previamente haban recibido dichas vacunas se dividieron en dos grupos. El grupo
1 recibi una dosis de refuerzo de la vacuna del tipo 1 y el grupo 2 recibi una
dosis de refuerzo de la vacuna tipo 2. Las respuestas de los anticuerpos se
registraron dos semanas despus. Las medias, desviaciones estndar y tamaos
de las muestras para los dos grupos fueron los siguientes:
Tamao de Media
Grupo La muestra
x
1
2

30
49

4.5
2.5

Desv. est.
S
2.5
2.0

Nivel de significancia pre-fijado = 0.01


(Enunciado adaptado de Bioestadstica. 3ra edicin de Wayne Daniel, pg. 250)

Para realizar la comparacin planteamos las hiptesis:


H0: No existe diferencia en la efectividad de las dos vacunas utilizadas para dosis
de refuerzo.

1 = 2
H1: Existe diferencia en la efectividad de las dos vacunas utilizadas para dosis de
refuerzo.

1 2

Por ser muestras grandes y no contar con las varianzas poblacionales, calculamos

Z=

( x1 x 2 )
2
1

2
2

S S
+
n1 n 2

4.5 2 .5
2

(2.5 )
( 2.0 )
+
30
49

= 3.71

46

MsC Beatriz Castaeda Saldaa


Para este valor de Z, calculado con la informacin de la muestra, obtenemos el
nivel crtico p para la toma de decisin:

p = 0.0001
2
Z
3.71
p/2 = P (Z 3.71) = 0.0001

p = 0.0002 < 0.001

Comparamos este valor p con el nivel de significancia pre-determinado = 0.01


Luego como p < 0.01
Concluimos que esta muestra es una evidencia de que existe diferencia en la
efectividad de las dos vacunas utilizadas para dosis de refuerzo (p < 0.001)

Prueba T para la diferencia de medias (1 - 2)


Datos:
Una muestra de tamao n1 (x1, x2, ....., xn1) de la poblacin 1 y una muestra de
tamao n2 (x1, x2, ....., xn2) de la poblacin 2. La variable es cuantitativa.

Requisitos:
1)
2)
3)
4)

Ambas son muestras aleatorias de su poblacin correspondiente.


Las poblaciones 1 y 2 son independientes
Muestras pequeas de poblaciones son normales.
Las varianzas poblacionales 21, 22 son desconocidas, pero se suponen
semejantes.

Hiptesis:
a) H0: 1 = 2

H1: 1 2

H0: 1 - 2 = 0

H1: 1 - 2 0

b) H0: 1 2

H1: 1 > 2

H0: 1 - 2 0

H1: 1 - 2 > 0

47

MsC Beatriz Castaeda Saldaa

c) H0: 1 2

H1: 1 < 2

H0: 1 - 2 0

H1: 1 - 2 < 0

Estadstica de la prueba

(n1 1)S12 + (n2 1)S22


con S =
n1 + n2 2

( x1 x2 )
T=
;
1 1
Sp
+
n1 n2

2
p

donde S2p es la estimacin de la varianza comn


T tiene distribucin t-Student con n1+n2 -2 grados de libertad [ t(n1+n2-2)], si H0 es
verdadera.

Regla de decisin
a) Rechazar H0 al nivel , si

T < -t1-/2

T > t1-/2

/2

/2

-t1-/2
R.C.

b) Rechazar H0 al nivel , si

t1-/2
R.C.

T > t1-

t1-
R.C.

48

MsC Beatriz Castaeda Saldaa

c) Rechazar H0 al nivel , si

t < -t1-

-t1-
R.C.

Nota
Si no se cumple el requisito de que las varianzas sean semejantes (es decir
21 22 ), entonces la estadstica T se obtendr como:

T =

( x1 x 2 )
S12 S 22
+
n1 n2

En este caso la estadstica T tiene distribucin aproximadamente t-Student con


grados de libertad modificados, dados por

v=

S 12 S 22

n +n
2
1

( ) +( )
S 12

n1

n1 + 1

S 22

n2

n2 + 1

Ejemplo 6
Con el objeto de determinar si la privacin del sueo tiene algn efecto sobre la
frecuencia de la onda alfa del electroencefalograma de las personas, a veinte
personas voluntarias se dividi al azar en dos grupos. Las personas del grupo A
se sometieron a un perodo de privacin del sueo de 10 das, mientras que las
del grupo B sirvieron de control. Al trmino del perodo experimental, se registr la

49

MsC Beatriz Castaeda Saldaa


frecuencia de la onda alfa componente de los electroencefalogramas de las
personas. Los resultados fueron los siguientes:
Grupo A:

10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4

Grupo B:

11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9

Nivel de significancia pre-fijado = 0.01


(Enunciado adaptado de Bioestadstica. 3ra edicin de Wayne Daniel, pg. 254)
Para determinar la presencia del efecto de la privacin sensorial planteamos las
hiptesis:
H0: No existe diferencia en la frecuencia de la onda alfa para las personas
sometidas a privacin del sueo respecto a las que no fueron sometidas a la
privacin.

A = B
H1: Existe diferencia en la frecuencia de la onda alfa para las personas sometidas
a privacin del sueo respecto a las que no fueron sometidas a la privacin.

A B
Por ser muestras pequeas y no contar con las varianzas poblacionales, antes de
aplicar la prueba T para comparacin de medias, con los datos obtenidos para el
nivel alfa en cada grupo, se debe comprobar si estas muestras validan los
requisitos de poblacin normal y varianzas semejantes, lo cual es aceptado
Como se cumplen los requisitos de poblaciones normales y varianzas semejantes
aplicaremos la prueba T sin correccin de los grados de libertad, luego calculamos
Tamao de Media
Grupo La muestra
x
A
B

10
10

10.28
11.08

Desv. est.
S
0.5978
0.4590

50

MsC Beatriz Castaeda Saldaa

Varianza comn

(n 1 1)S 12 + (n 2 1)S 22
9(0.5978 ) 2. + 9(0.459 ) 2
S =
=
= 0.284
n1 + n2 2
18
2
p

T=

10.28 11.08
( x1 x 2 )
=
= 3.357
1 1
1
1
0.284
Sp
+
+
10 10
n1 n 2

Para el valor calculado de T obtenemos el nivel crtico p utilizando la distribucin

t-Student con 18 grados de libertad.

t (18 )

p < 0.005
2

t (18 )
-3.357
Por ser una prueba de alternativa bilateral

p < 0.01

Luego concluimos que esta muestra es una evidencia de que existe diferencia en
la frecuencia de la onda alfa para las personas sometidas a privacin sensorial
respecto a las que no fueron sometidas a la privacin, es decir, que la privacin
sensorial en las personas tienen efecto sobre la frecuencia de la onda alfa de las
personas (p < 0.01)
Resumimos las pruebas de hiptesis para la comparacin de medias
poblacionales en el cuadro N 6

51

MsC Beatriz Castaeda Saldaa

Cuadro N 6
PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS
a) H0: 1 - 2 = 0
H1: 1 - 2 0
b) H0: 1 - 2 0
H1: 1 - 2 > 0
H1: 1 - 2 < 0
c) H0: 1 - 2 0
Prueba

Requisitos
(Grupos
independientes)
Varianzas 21, 22
conocidas
-Todo n1, n2 de poblaciones normales
- n1 30, n2 30 de
cualquier poblacin
Varianzas 21, 22
desconocidas
- n1 30, n2 30 de
cualquier poblacin

( x1 x 2 )

Normal

Decisin:
Rechazar H0
Al nivel si
a) Z < -Z1-/2
Z > Z1-/2

Z=

12 22
+
n1 n 2

N(0,1)

b) Z > Z1-

( x1 x 2 )

Normal

c) Z < -Z1-
a) Z < -Z1-/2
Z > Z1-/2

Z =

S12 S 22
+
n1 n2

N(0,1)

b) Z > Z1-
c) Z < -Z1-

( x1 x 2 )

Varianzas 21, 22
desconocidas, pero
semejantes

T =

- n1 < 30, n2 < 30 de


poblaciones normales

( n1 1) S + (n 2 1) S
n1 + n 2 2

S p2 =

2
1

t-Student

Varianzas 21, 22
Desconocidas y diferentes
- n1 < 30, n2 < 30 de
poblaciones normales

a) T < -t1-/2
T > t1-/2

1
1
+
n1 n 2

Sp

v=

( x1 x 2 )
2
1

b) T > t1-
c) T < -t1-

S12 S 22

+
n
n
2
1
2

n1

S 22

b) T > t1-

c) T < -t1-

( ) +( )
S12

a) T < -t1-/2
T > t1-/2

2
2

S
S
+
n1 n2

n1 + 1

t-Student

2
2

t(n1 + n2 -2)

T =

Distribucin de
la estadstica
Si H0 es cierta

Estadstica
de la prueba

n2

n2 + 1

t(v)

52

MsC Beatriz Castaeda Saldaa

3.5. Prueba para la media de la diferencia (datos apareados)


Comparacin de mediciones para datos apareados
Un mtodo que suele utilizarse para averiguar la efectividad de un tratamiento o
procedimiento experimental es el que usa observaciones relacionadas que se
obtienen de muestras no independientes. Una prueba de hiptesis basada en este
tipo de datos se conoce como prueba de comparaciones apareadas.

El objetivo en las pruebas de comparaciones apareadas es eliminar un


nmero mximo de fuentes de variacin externa, haciendo a las parejas
semejantes con respecto a las dems variables inherentes a los elementos
de estudio, que podran hacer variar el resultado esperado al margen del
efecto del tratamiento.
Las observaciones relacionadas o apareadas podran obtenerse de varias formas.
Los mismos individuos pueden registrarse antes y despus de recibir algn
tratamiento. Parejas de gemelos o hermanos pueden ser asignados al azar para
que reciban dos tratamientos, de tal manera que los miembros de una sola pareja
reciban tratamientos distintos. Al comparar dos mtodos de anlisis, el material
que va a analizarse se divide en partes iguales, de modo que una de las partes se
analice mediante un mtodo y la otra por otro mtodo. O bien, se forman parejas
combinando individuos respecto a alguna caracterstica, como por ejemplo edad y
sexo.

En lugar de llevar a cabo el anlisis con observaciones individuales, se


utiliza como variable de inters la diferencia entre pares individuales de
observaciones.

Hiptesis
a) H0: d = d0

H1: d d0

b) H0: d d0

H1: d > d0

c) H0: d d0

H1: d < d0

La estadstica de la prueba puede ser la

Z=

d d0
Sd / n

o la

T=

d d0
Sd / n
53

MsC Beatriz Castaeda Saldaa

segn el cumplimiento de los requisitos, antes indicados, para la aplicacin de las


pruebas Z y T para la media.

Ejemplo 7
Doce personas participaron en un experimento para estudiar la efectividad de
cierta dieta, combinada con un programa de ejercicio, en la reduccin de los
niveles de colesterol en suero en al menos 10 unidades. La tabla muestra los
niveles de colesterol en suero para las 12 personas al principio del programa
(Antes) y al final del mismo (Despus).
Diferencia
Colesterol en suero
di
Persona Antes (X1) Despus (X2)
1
201
193
8
2
231
236
-5
3
221
216
5
4
260
233
27
5
228
214
14
6
237
216
21
7
326
296
30
8
235
195
40
9
240
207
33
10
267
247
20
11
284
260
24
12
201
209
-8
La hiptesis del estudio sera:

La dieta combinada con el programa de ejercicios es efectiva para reducir


los niveles de colesterol en suero en al menos 10 unidades
Las hiptesis estadsticas sern formuladas como:
H0: d 10

La dieta combinada con el programa de ejercicios no es


efectiva para reducir los niveles de colesterol en suero en al
menos 10 unidades

H1: d > 10

La dieta combinada con el programa de ejercicios es efectiva


para reducir los niveles de colesterol en suero en al menos 10
unidades

54

MsC Beatriz Castaeda Saldaa

Para las diferencias obtenemos

d = 17.417 ;

S d = 14.98

Como la muestra es pequea y la varianza poblacional desconocida utilizaremos


la prueba T para la media de las diferencias, asumiendo que las diferencias tienen
distribucin normal (este requisito debe ser probado con los datos utilizando la
prueba de bondad de ajuste que se desarrollar ms adelante en la seccin
2.3.1.2.)

T =

d d0
17.417 10
=
= 1.715
S d / n 14.98 / 12

Para el valor calculado de T obtenemos el nivel crtico p utilizando la distribucin

t-Student con 11 grados de libertad.

t (11)

p <0.05

t (11)
1.715
Luego podemos concluir que la muestra es una evidencia significativa (p < 0.05)
de que esta dieta combinada con un programa de ejercicio es efectiva para reducir
los niveles de colesterol en suero en al menos 10 unidades.

55

MsC Beatriz Castaeda Saldaa

3.6. Prueba de comparacin de varianzas


Datos:
Una muestra de tamao n1 de la poblacin 1 y una muestra de tamao n2 de la
poblacin 2
Requisitos:
1) Ambas muestras son aleatorias de sus respectivas poblaciones
2) Las poblaciones 1 y 2 son independientes y cada una tiene distribucin
normal con varianzas 21 y 22 respectivamente.

Hiptesis:
a) H0 : 21 = 22

H 1 : 21 22

b) H0 : 21 22

H1 : 21 > 22

c) H0 : 21 22

H 1 : 21 < 22

Estadstica de la Prueba

S12
F= 2
S2
Si H0 es cierta, F tiene distribucin F(n1-1, n2-1) ; donde n1 -1 y n2 1 son los
grados de libertad del numerador y denominador.

Regla de decisin
a) Rechazar H0 al nivel ,

si F < F2

F > F1 2

/2
/2

F
F2

R.C.

F1 2

R.C.
56

MsC Beatriz Castaeda Saldaa

b) Rechazar H0 al nivel ,

si

F > F1

F
F1

R.C.

c) Rechazar H0 al nivel ,

si F < F

F
F

R.C.
Ejemplo 8

En el ejemplo 6, para poder aplicar la prueba T para comparar las medias de dos
grupos, uno de los requisitos que deben cumplir los datos es que las varianza de
ambos grupos sean semejantes, requisito que probaremos con la prueba F
Hiptesis:

H0 : 2A = 2B

H1 : 2A 2B

Donde:
A es el grupo de personas a las que se someti a un periodo de privacin
sensorial de 10 das
B es el grupo control
Variable : Frecuencia de la onda alfa, componente de los electroencefalogramas
para cada persona
Los resultados obtenidos fueron:

57

MsC Beatriz Castaeda Saldaa

Grupo A:

10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4

Grupo B:

11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9

Tamao de Media
Grupo La muestra
x
A
B

10
10

Desv. est.
S

10.28
11.08

0.5978
0.4590

Luego calculamos la estadstica F para la comparacin de varianzas.


Luego

F = (0.5978)2 = 1.696
(0.4590)2

Si = 0.05, entonces para F(9,9), obtenemos las cuantilas /2

F0.025(9,9) = 0.2448

y 1-/2

F0.975(9,9) = 4.03

Luego no se puede rechazar la hiptesis de igualdad de igualdad de varianzas,


por lo que podemos asumir que se cumple el requisito de varianzas semejantes y
que las diferencias encontradas es probable que se deban al azar del muestreo.

58

MsC Beatriz Castaeda Saldaa

3.7. Prueba Z para comparacin de proporciones poblacionales


Datos:
Dos muestras que consisten de n1 y n2 resultados de observaciones
independientes. Para cada muestra los resultados pueden estar en una de dos
categoras pero no en ambas.

Requisitos:
1. Los n1 resultados de la muestra de la poblacin 1 son mutuamente
independientes y de igual manera los n2 resultados de la muestra de la
poblacin 1 tambin son mutuamente independientes.
2. Cada resultado de las n1 observaciones de la muestra de la poblacin 1
tiene probabilidad P1 de estar en la categora 1 y Cada resultado de las n2
observaciones de la muestra de la poblacin 2 tiene probabilidad P2 de
estar en la categora 1.
3. Las muestras son grandes (n1 30 y n2 30)
4. Las poblaciones son infinitas (n1 0.10 N1 y n2 0.10 N2), es decir las
muestras son a lo ms el 10% de la poblacin correspondiente
Hiptesis:
a) H0: P1 P2 = 0

H 1: P 1 P 2 0

b) H0: P1 P2 0

H 1: P 1 P 2 > 0

c) H0: P1 P2 0

H 1: P 1 P 2 < 0

Estadstica de la prueba

Z=

p1 p 2
Sp1 p 2

Z es N(0,1), si H0 es verdadera
Donde:

S p1 p 2 =

p(1 p ) p(1 p )
+
n1
n2

Si H0 es verdadera, es decir, las proporciones son iguales P1 = P2 = P

59

MsC Beatriz Castaeda Saldaa


y existe una proporcin comn (P). la cual estimamos como:

x1 + x2
n1 + n2

p =

siendo x1 y x2 las observaciones que estn en la categora 1, para cada muestra.

p1 =

x1
n1

p2 =

x2
n2

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

Z > Z1-/2

/2

/2

-Z1-/2
R.C.
b) Rechazar H0 al nivel , si

Z1-/2

R.C.

Z > Z1-

0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

60

MsC Beatriz Castaeda Saldaa

Ejemplo 9
En el Ejercicio aplicativo N 1, los investigadores tenan por objeto comparar el
desarrollo visomotor y el rendimiento escolar de hijos de madres adolescentes
con el de los hijos de madres adultas.
El desarrollo visomotor fue evaluado utilizando la prueba de Bender (Nmero de
errores que tiene el nio cuando trata de reproducir nueve figuras que le han sido
mostradas).
El rendimiento escolar fue analizado sobre la base del porcentaje de nios de
cada grupo que desaprob el ao escolar.
Luego para realizar la comparacin, las hiptesis estadsticas planteadas han sido:
1) Para la comparacin del desarrollo visomotor
H0: 1 = 2
El promedio de errores de la prueba de Bender para hijos de madres adolescentes
es igual al promedio de los hijos de madres adultas.
H1: 1 > 2
El promedio de errores en la prueba de Bender es mayor para hijos de madres
adolescentes que para los hijos de madres adultas ( lo que indica desarrollo
visomotor retardado)
2) Para la comparacin del rendimiento escolar
H 0: P 1 = P 2
El porcentaje de nios que desaprob el ao escolar es igual para los hijos de
madres adolescentes que para los hijos de madres adultas.
H 1: P 1 > P 2
El porcentaje de nios que desaprob el ao escolar es mayor para los hijos de
madres adolescentes que para los hijos de madres adultas. (lo que indica menor
rendimiento escolar)
La tabla siguiente resume los resultados obtenidos
Muestra Media de Desv. est. de la Porcentaje de
n
Errores( x ) Media (SE=S/n) desaprobados
Madres adolescentes
59
6.34
0.38
13.8% (8)*
Madres adultas
73
4.75
0.24
4.3% (3)*
Grupo

61

MsC Beatriz Castaeda Saldaa


* Observamos un error en la informacin presentada pues el 13,8% de 59 es
8,142 nios, luego el nmero de nios desaprobados de hijos de madres
adolescentes fue 8 (13.6%).
De igual manera el 4,3% de 73 es 3.139, luego el nmero de nios
desaprobados para hijos de madres adultas es 3 (4,1%)
Por disponer de muestras grandes, tanto para la comparacin de medias como
para la comparacin de proporciones se utiliz la correspondiente prueba Z
1) Para realizar la prueba de hiptesis para comparar las medias, calculamos
la estadstica Z:

Z=

( x1 x 2 )
2
1

2
2

S
S
+
n1 n 2

6.34 4.75
0.38 + 0.24
2

= 3.53

Luego el nivel crtico p = P(Z 3.53) = 0.00021 < 0.001


Es decir la diferencia encontrada es altamente significativa, por lo que se
puede concluir que los hijos de madres adolescentes tienen un retardo en el
desarrollo visomotor respecto al de los hijos de madres adultas
2) Para realizar la prueba de hiptesis de comparacin de proporciones,
calculamos la estadstica Z:

p =

Sp1 p2 =

x1 + x2
8+3
=
= 0 . 083
59 + 73
n1 + n2

p(1 p) p(1 p)
0.083 (0.917) 0.083 (0.917)
+
=
+
= 0.048
n1
n2
59
73

62

MsC Beatriz Castaeda Saldaa

Z=

p 1 p 2 0.136 0.041
=
= 1.979
S p1 p 2
0.048

Luego el nivel crtico p = P(Z 1.979) = 0.02385 < 0.05


Es decir la diferencia encontrada es significativa, por lo que se puede
concluir que los hijos de madres adolescentes tienen menor rendimiento
escolar que los hijos de madres adultas.

3.8. ANLISIS DE VARIANZA


PRUEBA PARA COMPARACIN DE MEDIAS DE VARIOS
GRUPOS
El anlisis de varianza es un proceso que se utiliza para decidir si las medias de
dos o ms poblaciones son iguales o si existe diferencia significativa entre ellas,
es decir, si las diferencias entre los valores medios de las muestras son indicativas
de una variabilidad del muestreo o si las diferencias entre las medias muestrales
revelan las verdaderas diferencias de las medias poblacionales.
Las diferencias poblacionales pueden ser:
a) Subgrupos de una misma poblacin observados para diferentes niveles de
cierto factor o caracterstica, en este caso el anlisis de varianza es
denominado ANLISIS DE VARIANZA DE UN FACTOR O UN CAMINO
(ANOVA DE UN FACTOR)
b) Cuando en la investigacin observamos la caracterstica para elementos
que son relativamente homogneos, decimos que este conjunto de
elementos constituye un bloque. Si los tratamientos son evaluados para k
bloques, los cuales tienen un nmero de elementos igual al nmero de
tratamientos a comparar, la comparacin de medias se puede hacer por
tratamiento de un factor o por bloque y el anlisis se denomina ANLISIS
DE VARIANZA EN BLOQUE PARA UN FACTOR (ANOVA EN BLOQUES
Y UN FACTOR).
c) Subgrupos de una misma poblacin observados para diferentes niveles de
2 caractersticas o factores, en este caso el anlisis de varianza es
denominado ANLISIS DE VARIANZA DE 2 FACTORES O DOS
CAMINOS (ANOVA DE DOS FACTORES). A los distintos niveles de un
factor tambin se denomina tratamientos.

63

MsC Beatriz Castaeda Saldaa

Anlisis de Varianza de un factor (ANOVA DE UN FACTOR)


Datos:
Subgrupos de una misma poblacin observados para diferentes niveles de cierto
factor o caracterstica

Requisitos:
1) Las muestras son aleatorias e independientes.
2) Las poblaciones son normales
3) Las poblaciones tienen varianzas iguales (es decir, 21 = 22 = ..... = 2k ).

Hiptesis:
H0: 1 = 2 = ..... = k
Todos los grupos tienen la misma media. No hay diferencia entre los
tratamientos.

1
2

k
H1: i j para algn i j
La media de alguno de los grupos difiere de la media de alguno de los otros
grupos. Existe diferencia entre los tratamientos.

.........

64

MsC Beatriz Castaeda Saldaa

Estadstica de la Prueba

F =

SCG / K 1
SCE / N K

Si H0 es cierta, F tiene distribucin F(k-1, N-k), es decir tiene distribucin F de


Snedecor con K - 1 grados de libertad en el numerador y N K grados de libertad
en el denominador .
Para los clculos de las sumas de cuadrados (SCG y SCE) dispongamos los datos
en una tabla como sigue:
Grupo 1 Grupo 2
X21
X11
X12
X22
X13
X23
:
:
:
:
X1n1
X2n2
x1
x2
2
S1
S 22
n1
n2

........... Grupo k
...........
XK1
...........
XK2
...........
XK3
:
:
:
:
........... XKnk
...........
xK
...........
S2K
...........
nK

x
S2
N
K

Donde:

x 1 , x 2 , ...., x K

S21, S22 , ......, S2K

y n1, n2 , ....., nK

Son las medias , varianzas y el nmero de datos de la muestra de cada uno de los
k grupos
k

S2

N = ni
i =1

Son la media, varianza y el nmero de datos del total de las observaciones


reunidas en los k grupos
Entonces:

65

MsC Beatriz Castaeda Saldaa

SCG =

(x i x )2 n i
i =1

SCE =

S 2i (n i 1)
i =1

SCT = SCG + SCE

Regla de decisin:
Rechazar H0 al nivel , si F > F1
Nota:
Al realizar el anlisis de varianza los resultados, usualmente, son presentados en
un cuadro llamado cuadro o tabla de Anlisis de varianza o ANOVA como el
siguiente:

Cuadro N 6.

ANOVA DE UN FACTOR

Fuente de
Suma de Grados de Cuadrado Razn Probabilidad
variacin Cuadrados libertad
Medio
F
p
Tratamientos
o Grupos
SCG
K-1
P*
A = SCG/ K-1 F = A/E

Error

SCE

N-k

Total

SCT

N-1

E = SCE/N-k

Si p > 0.05, la diferencia es no significativa


Si p 0.05, la diferencia es significativa
Si p 0.01, la diferencia es muy significativa
Si p 0.001, la diferencia es altamente significativa

Ejemplo 10
Los siguientes datos son muestras de los pesos de nios al nacer tomados de 4
hospitales, se desea comprobar si existe diferencia entre los pesos medios de los
nios nacidos en estos 4 hospitales
Los datos se listan a continuacin (peso en kg.)

66

MsC Beatriz Castaeda Saldaa


Hospital 1 Hospital 2 Hospital 3
Hospital 4
3.000
3.625
3.800
3.050
3.500
3.430
3.500
2.800
3.400
3.000
3.350
3.500
3.400
3.625
3.250
3.400
3.350
3.625
4.100
3.350
5.050
3.150
3.900
3.200
4.760
3.360
3.900
3.050
3.400
3.230
4.00
3.400
3.650
3.950
3.670
2.900
3.260
3.400
3.600
3.100
x 1 = 3.677 x 2 = 3.440 x 3 = 3.707
x 4 = 3.175
2
2
2
S 1 = 0.451 S 2 = 0.077 S 3 = 0.0795 S24 = 0.0546
n1 = 10
n2 = 10
N3 = 10
N4 = 10

x = 3.500
S2 = 0.200
N = 40

SCG = (3.677 - 3.500)2 x 10 + (3.440 - 3.500)2 x 10 +(3.707 - 3.500)2 x 10 +


(3.175 - 3.500)2 x 10 = 1.835
SCE = 0.451 x 9 + 0.077 x 9 + 0.0795 x 9 + 0.0546 x 9 = 5.959
SCT = 7.793
Presentamos estos resultados en una tabla de anlisis de varianza

ANOVA DE PESO DE RECIEN NACIDOS EN 4 HOSPITALES


Fuente de Suma de Grados de Cuadrado Razn Probabilidad
variacin Cuadrados Libertad
Medio
F
P
Grupos

1.835

0.612

Error

5.959

36

0.166

Total

7.793

39

3.695

0.0204

Como p < 0.05, podemos decir que las muestras son evidencia de que existe
diferencia significativa entre los pesos medios de los recin nacidos en los 4
hospitales.

67

MsC Beatriz Castaeda Saldaa

Comparacin mltiple Prueba de Tukey o Prueba de la


Diferencia significativa Honesta (HSD)
Si el ANOVA result en rechazo, entonces podemos comparar las diferencias de
cada par de grupos o tratamientos con el estadstico de Tukey definido por:

W = q ( ,k ,N k )

CME / n

donde:
q es un valor tabular proporcionado en la tabla C1 para la prueba de Tukey
CME = SCE/N-k
n es el nmero de datos en cada grupo
si la diferencia absoluta entre las medias de dos grupos es mayor que W ,
decimos que estos grupos tiene medias que difieren significativamente. Esto es:

Si

x i x j W

decimos que las medias del grupo i y el grupo j


Difieren significativamente

Comparacin mltiple con muestras de distinto tamao


Si las muestras son de diferente tamao entonces, para realizar la comparacin
mltiple se calcula una modificacin del coeficiente W dada por

W * = q ( , k , N k )

CME / n*j

donde n j es el tamao de muestra mas pequeo entre las dos muestras cuyas
medias se van a comparar

Si

x i x j W*

decimos que las medias del grupo i y el grupo j


Difieren significativamente

68

MsC Beatriz Castaeda Saldaa

En este caso se calcula un W j para cada par de grupos a comparar

Ejemplo 11
Continuando con el ejemplo, tenemos que como las muestras son del mismo
tamao, entonces el coeficiente para la comparacin mltiple es:

W = q0.05( 4 , 36 )

CME / n = 3.79 0.166 / 10 = 0.488

COMPARACIN MLTIPLE DE LOS PESOS MEDIOS


DE LOS RECIN NACIDOS EN 4 HOSPITALES
(W = 0.488)

Hospital
Peso medio
(kg)

3.677

3.440

3.707

3.175

Diferencia x 1 - x 2 = 0.237 x 2 - x 3 = 0.267


absoluta de
los pesos x 1 - x 3 = 0.030 x 2 - x 4 = 0.265
medios
x 1 - x 4 = 0.502* x 3 - x 4 = 0.532*
* Diferencia significativa
Esta comparacin se puede presentar en un grfico ilustrando los intervalos al
95% de confianza para la media de cada grupo como sigue:

69

MsC Beatriz Castaeda Saldaa


COMPARACION DE PESO MEDIO DE
RECIEN NACIDOS EN 4 HOSPITALES
4.4
4.2

95% CI PESO

4.0
3.8
3.6
3.4
3.2
3.0
2.8
N=

10

10

10

10

HOSPITAL

De la comparacin mltiple, podemos concluir que los pesos medios de los nios
nacidos en los 4 hospitales difieren en general debido a que el peso medio de los
nios nacidos en el hospital 4 es significativamente menor que el peso medio de
los nios nacidos en los hospitales 1 y 3.
Estos resultados los podemos agrupar estableciendo grupos homogneos, es
decir grupos en los que la diferencia no es significativa

Subconjuntos homogneos segn Peso (kg.)


f
Hospital
Tukey HSD
4
2
1
3
Sig.

n
10
10
10
10

Subconjuntos para = .05


1
2
3.17500
3.43950
3.43950
3.67700
3.70700
.475
.466

Observamos que los recin nacidos en los hospitales 2 y 4 tienen pesos medios
que no difieren significativamente. Asimismo los recin nacidos en los hospitales
1, 2 y 3 tienen pesos promedio que podemos considerar como comparables, es
decir no difieren significtivamente.

70

MsC Beatriz Castaeda Saldaa

3.9. Prueba Ji-Cuadrado para comparacin de proporciones


(Prueba de Homogeneidad)
Datos:
Hay r grupos o poblaciones en total, y una muestra aleatoria es elegida de cada
poblacin. Sea ni que representa el nmero de observaciones en la i-sima
muestra (proveniente de la poblacin i) para i: 1,2,3, ...., r
Cada observacin en cada una de las muestras puede ser clasificada dentro de
una de las c categoras diferentes de la caracterstica bajo estudio.
Si Oij es el nmero de observaciones provenientes de la i-sima muestra que caen
en la categora j, entonces:
ni = ni1 + ni2 + .... + nic
Los datos son arreglados en la siguiente tabla de contingencia de r x c
Poblacin o
Caracterstica
Grupo
Categora1 Categora 2 .......... Categora c Totales
1
n11
n12
..........
n1c
n1
2
n21
n22
n2c
n2
.........
r
nr1
nr2
nrc
nr
Totales
C1
C2
Cc
n
El total de observaciones de todas las muestras reunidas es denotado por n
n = n1 + n2 + ..... + nr
el nmero total de observaciones en la j-sima categora es denotado por Cj. Esto
es, Cj es el nmero total de observaciones en la categora j provenientes de todas
las muestras reunidas en un solo grupo. Por ejemplo
C2 = n12 + n22 + ...... + nr2

Requisitos:
1) Cada muestra es una muestra aleatoria
2) Los resultados de las muestras son independientes de muestra a muestra
3) Cada observacin puede ser clasificada slo en una de las c categoras de
la caracterstica bajo estudio.

71

MsC Beatriz Castaeda Saldaa

Hiptesis:
H0: La proporcin de elementos en cada categora es la misma para todos los
grupos o poblaciones (Los grupos son homogneos)
P1j = P2j = ...... = Prj

para cada categora j

H1: Para 2 o ms grupos hay diferente proporcin de elementos en una o ms


categoras
Pij Pkj

para alguna categora j


y para algn para de poblaciones i , k

Estadstica de la prueba:

i =1 j =1

(n

ij

E ij

E ij

n ij

E
i =1 j =1

ij

Si H0 es verdadera, la distribucin aproximada de X2 para muestras grandes es la


Ji-Cuadrado con (r-1) x (c-1) grados de libertad.
Donde:
Si H0 es verdadera, entonces P1j = P2j = ...... = Prj = Pj

para cada categora j

Es decir existe una proporcin comn Pj de elementos en la categora j, la cual


puede ser estimada como
Pj = C j
n
As para la muestra del grupo i , esperaramos ni x Pj = ni Cj elementos en la
categora j
n
Luego a

Eij = ni Cj
n

Se denomina frecuencia o nmero esperado de elementos en la categora j para la


muestra del grupo o poblacin i.

72

MsC Beatriz Castaeda Saldaa

Regla de decisin:
Rechazar H0 al nivel ,

si

X2 >

12

X2

12

R.C.

Observaciones:
1) Si alguna de las frecuencias esperadas Eij es pequea, la aproximacin a la
distribucin Ji-Cuadrado, puede ser pobre. Cochran establece que si
cualquiera de las Eij es menor que 1 o si ms del 20% de las Eij es menor
que 5, la prueba no es aplicable.
2) Si r y c no son tan pequeos, y si parece que las Eij pueden ser tan
pequeas como 1, sin perjuicio de comprometer la validez de la prueba,
varias categoras pueden ser combinadas para eliminar las frecuencias
esperadas pequeas. Cuales categoras deberan ser combinadas es
problema de juicio. Generalmente, las categoras son combinadas solo si
ellas son similares en algn aspecto, tal que la hiptesis mantiene su
significado.
3) Para el caso particular en que se comparan dos grupos para una variable
con dos categoras (r = 2 y c =2), los datos quedan resumidos en una tabla
de 2x2
Poblacin
Poblacin 1
Poblacin 2
Total

Variable
Categora 1 Categora 2 Total
a
b
N1
c
d
N2
C1
C2
n

la estadstica de la prueba se reduce a:

73

MsC Beatriz Castaeda Saldaa

n(ad bc ) 2
X =
n 1 n 2 C1 C 2
2

La distribucin aproximada de X2 es la Ji-Cuadrado con 1 grado de libertad

Correccin de Yates. Las frecuencias observadas en una tabla de


contingencia son discretas y, de este modo, dan lugar a una estadstica
discreta, X2, la que ha sido aproximada por la distribucin Ji-Cuadrado que
es continua. Yates propuso una correccin para mejorar la aproximacin, a
esta estadstica se denomina X2 corregida y se obtiene como:

2
corregida

n( ad bc (n / 2)) 2
n 1 n 2 C1 C 2

Si la muestra es pequea n < 20 o si 20 < n < 40 y si cualquier frecuencia


esperada es menor que 5, no debe utilizarse los resultados de la prueba JiCuadrado para llegar a conclusiones acerca de las diferencias entre las
proporciones por lo que se sugiere utilizar la Prueba Exacta de Fisher.
(Wayne Daniel. Bioestadstica, pg 483-484)

Ejemplo 12
Con el objeto de comparar la distribucin por grupo sanguneo de las personas
portadoras crnicas de cierto antgeno con la distribucin de grupos sanguneos
de los no portadores, se tom una muestra de 150 portadores y 200 no portadores
obteniendo los siguientes resultados para el grupo sanguneo:
Grupo sanguneo

Portadores No portadores Total

72

92

164

54

77

131

16

25

41

AB

14

Total

150

200

350

Luego formulamos las hiptesis estadsticas

74

MsC Beatriz Castaeda Saldaa


H0: No hay diferencia, en la distribucin por grupo sanguneo, entre portadores y
no portadores.
H1: Hay diferencias en las distribuciones de grupos sanguneos de los portadores
y no portadores.

Para realizar la prueba obtenemos las frecuencias esperadas y luego calculamos


la estadstica X2

FRECUENCIAS ESPERADAS
Grupo sanguneo Portadores No portadores
O
70
94
A
56
75
B
18
23
AB
6
8
Total
150
200

i =1 j =1

(n

ij

E ij
E ij

n ij

E
i =1 j =1

ij

Total
164
131
41
14
350

72 2
62
n=
+ ... +
350 = 1.6289
70
8

Como r =2 grupos y c = 4 categoras, entonces en la distribucin Ji-cuadrado con


3 grados de libertad obtenemos el valor crtico p
p = P[ (23) 1.6289] = 0.6258

Este resultado nos indica que la diferencia encontrada no alcanza significancia


estadstica y que es muy probable que se deba al azar del muestreo, por lo que
no podemos rechazar la hiptesis de no diferencia en la distribucin de grupos
sanguneos.
Para complementar el anlisis se puede acompaar de un grfico comparativo de
porcentajes por categoras como el siguiente

75

MsC Beatriz Castaeda Saldaa

Grupo sanguineo de Portadores y


No portadores de antigeno
60%
50%
40%
30%
20%
10%
0%
O
Portadores
No portadores

AB

Grupo sanguneo

En conclusin, no se ha encontrado diferencia significativa, en la


distribucin por grupo sanguneo, para portadores y no portadores del
antgeno (p > 0.05)

3.10. Prueba de Independencia Ji-Cuadrado


Datos:
Una muestra aleatoria de tamao n es obtenida de una poblacin. Las
observaciones en la muestra son clasificadas de acuerdo a 2 caractersticas o
variables nominales. Usando la primera caracterstica cada observacin es
clasificada en una de las r categoras de la variable y usando la segunda
caracterstica cada observacin es clasificada en una las c categoras de sta
segunda variable.
Sea Oij el nmero de observaciones en la categora i de la primera variable y en la
categora j de la segunda variable. Las frecuencias Oij son arregladas en una tabla
de contingencia de r x c como sigue:

Caracterstica
Caracterstica y
x
Categora1 Categora 2 .......... Categora c Totales
Categora 1
n11
n12
..........
n1c
R1
Categora 2
n21
n22
..........
n2c
R2
.........
..........
..........
..........
..........
..........
Categora r
nr1
nr2
..........
nrc
Rr
Totales
C1
C2
..........
Cc
n

76

MsC Beatriz Castaeda Saldaa

El nmero total de observaciones en la fila i es designado por Ri y el nmero total


de observaciones en la columna j es designado por Cj (enfatizando que estas
cantidades son aleatorias, no fijadas). La suma de las observaciones en todas las
casillas es n el tamao de muestra.

Requisitos
1) La muestra de n observaciones, es una muestra aleatoria (cada
observacin es independiente de las otras para ser clasificada en las
categoras i,j de las variables consideradas)
2) Cada observacin puede ser clasificada dentro de una de las r categoras
de acuerdo con una de las caractersticas y dentro de una de las c
categoras de acuerdo a la segunda caracterstica.

Hiptesis
H0: Las variables son independientes
(Es decir cada observacin puede ser clasificada en una categora de una
variable independientemente de la categora en que fue clasificada de
acuerdo a la otra variable).
H1: Existe asociacin o dependencia entre las variables
(Es decir una observacin que es clasificada en una categora de una variable
tiende a ser clasificada en determinada categora de acuerdo a la otra
variable).
Prueba Estadstica

Sea

E ij =

Ri Cj
n

El nmero esperado de observaciones en la celda i,j , entonces la estadstica de la


prueba esta dada por:

X2 =

i =1 j =1

(n

ij

E ij
E ij

n ij

E
i =1 j =1

ij

77

MsC Beatriz Castaeda Saldaa

Si H0 es verdadera, la distribucin aproximada de X2 para muestras grandes es la


Ji-Cuadrado con (r-1) x (c-1) grados de libertad.

Regla de decisin:
Rechazar H0 al nivel ,

si

X2 > 12

X2
12

R.C.
Las observaciones indicadas en la seccin 2.3.9 para la prueba Ji-Cuadrado de
comparacin de proporciones tambin se deben tener en cuenta para la aplicacin
de esta prueba.

Ejemplo 13
Con el objeto de verificar la suposicin de que la fabricacin de cierto producto
est asociado con alteraciones respiratorias, a 500 trabajadores de una empresa
que fabrica el producto se evalu respecto a la presencia de sntomas de
alteraciones respiratorias y se los clasific a su vez de acuerdo al nivel de
exposicin al producto. Los resultados se presentan en la tabla siguiente:

Presencia de
sntomas
S
No
Total

Nivel de exposicin
Alto
Medio
Bajo
185
33
17

Total

120
305

265
500

73
106

72
89

235

Las hiptesis estadsticas son formuladas como:

78

MsC Beatriz Castaeda Saldaa

H0: Las alteraciones respiratorias son independientes de la exposicin al


producto.
H1: Las alteraciones respiratorias estn asociadas a la exposicin al
producto
Obtenemos las frecuencias esperadas y calculamos la estadstica X2 de la prueba
FRECUENCIAS ESPERADAS
Presencia de
Nivel de exposicin
sntomas
Alto
Medio
Bajo
S
143.35
49.82
41.83
No
Total

X2 =

161.65
305

56.18
106

Total
235

47.17
89

265
500

185 2
332
172
120 2
732
722
+
+
+
+
+
500 = 61.356
143.35 49.82 41.83 161.65 56.18 47.17

Obtenemos el valor crtico, p, de la prueba en la distribucin

2( 2)

As P[ ( 2) 61.3556] < 0.0005


2

Luego, podemos concluir que estos datos son una evidencia de que la presencia
de alteraciones respiratorias esta asociada a la exposicin al producto.

Ejemplo 14

Un psiclogo clnico toma una muestra de 200 pacientes que sufren ansiedad y las
clasifica de acuerdo a su restablecimiento y al tratamiento por medio de terapia;
obteniendo los siguientes datos:
Tratamiento
Restablecimiento
Con terapia curados No curados Total
Tratados
140
20
160
No tratados
10
30
40
Total
150
50
200

79

MsC Beatriz Castaeda Saldaa

Con esta informacin se desea evaluar si existe relacin entre el tratamiento y la


curacin
de los pacientes. (Elorza, h. Estadstica para ciencias del
comportamiento. Pg 414)
Luego, planteamos las hiptesis:
H0: El restablecimiento de los pacientes es independiente del tratamiento
H1: Existe relacin entre el tratamiento y el restablecimiento de los pacientes.
Con los datos obtenidos calculamos el X2

n(ad bc) 2
200(140x30 20x10) 2
X =
=
= 66.67
n 1 n 2 C1 C 2
150 x50x160x 40
2

corregida

n( ad bc (n / 2))2
n1 n2 C1 C2
200( 140x30 20x10 100)2
150x50x160x40

= 63.375
Obtenemos el valor crtico, p, de la prueba en la distribucin
As tanto para el X2 como para el X2corregido se obtienen

2(1)

p < 0.0005

Luego, podemos concluir que estos datos son una evidencia de que el tratamiento
con terapia est significativamente relacionado con el restablecimiento del
paciente (p < 0.0005)

80

MsC Beatriz Castaeda Saldaa


4. MEDICION EPIDEMIOLOGICA
4.1. TASAS

Una tasa es una comparacin por cociente entre un nmero de eventos ocurridos
en un tiempo y lugar dados y la poblacin que estuvo expuesta al riesgo de que le
ocurrieran dichos eventos en la misma poca y en ese mismo lugar
Tasa =

a x base
a+b

La tasa es la expresin numrica del riesgo al que estuvo sometida la poblacin.


Los datos que integran una tasa ocurrieron en un perodo anterior al actual y en
cierto modo permiten anticipar, con un determinado valor numrico, la probabilidad
de que exista ese riesgo para
la poblacin en perodos inmediatos,
particularmente si las condiciones de dicha poblacin se mantienen estables.
En Epidemiologa, usualmente los eventos estn constituidos por casos de
enfermedad o defunciones por diversas afecciones.
Las tasas estn constituidas por tres elementos:
1) El numerador del cociente, que consiste en el nmero de veces que ocurri el
evento o suceso en estudio.
2) El denominador del cociente que es la poblacin expuesta al riesgo de que le
ocurra el fenmeno.
3) Una constante por la cual se multiplica el resultado del cociente. Debido a que
la divisin resulta en una cifra inferior a la unidad el resultado suele
multiplicarse por 100, 1.000, 10.000, o 100.000 para una mejor comprensin y
fcil lectura.

Tasas de uso frecuente

N de defunciones ocurridas en
Tasa anual bruta de mortalidad =

una regin y ao dado


x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

81

MsC Beatriz Castaeda Saldaa


N de defunciones nios menores de un ao
Tasa de mortalidad inf antil =

ocurridas en una regin y ao dado


x 1000
N total de nacimientos vivos ocurridos en la
poblacinen de la misma regin y ao dado

N de nacimientos vivos ocurridos


Tasa anual bruta de natalidad =

en una regin y ao dado


x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

N de enfermos nuevos de una afeccin


Tasa de incidencia =

aparecidos en una regin y ao dado


x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

N de personas de una regin que tienen


Pr evalencia =

la enfermedad en un tiempo especificado


x 1000
Estimacin de personas en la poblacin
en la misma regin y tiempo especificado

Ejemplo 15

Casos con calcificaciones pulmonares en dos poblaciones


con fabrica de asbestos, segn distancia de los
domicilios a la respectiva fabrica
Distancia
(Km)
0 0,9
1,0 1,9
2,0 2,9
3,0 3,9
4,0 y ms
TOTAL

Poblacin A
Poblacin B
Habitantes
Habitantes
N
%
Casos
N
%
Casos
1 531 13,8 279
5 438
9,1
462
1 904 17,2
69
4 489
7,5
117
2 599 23,5 141 10 351 17,4
802
4 672 42,2
2 36 994 62,0
37
368
3,3 119
2 384
4,0
665
11 074 100,0 610 59 656 100,0 2083
82

MsC Beatriz Castaeda Saldaa

AJUSTE DE TASAS

Cuando dos poblaciones tienen diferente estructura de poblacin no es apropiado


comparar las tasas globales ya que est comparacin podra no ser vlida debido
a stas diferencias.
El mtodo directo de ajuste de tasas plantea
1 Definir cul poblacin ser sometida a las condiciones de la otra (Usualmente a
la poblacin menor se le aplican las tasas especficas de la mayor.
2 Con las tasas especficas de la poblacin mayor se calculan los casos
esperados de la poblacin menor y a partir de ellos se obtiene la nueva tasa global
como sigue:
Casos esperados = Poblacin x tasa
Constante
Ejemplo: Casos esperados = 1531 x 85,0 = 130
1000

Tasas de calcificaciones pulmonares


por distancias en dos poblaciones
Distancia
(Km)
0 0,9
1,0 1,9
2,0 2,9
3,0 3,9
4,0 y ms
TOTAL

Poblacin A
Habitantes
N
Casos Tasa
1 531
279 182,2
1 904
69
36,2
2 599
141
54,3
4 672
2
0,4
368
119 323,4
11 074 610
55,1

Poblacin B
Habitantes
N
Casos Tasa
5 438 462
85,0
4 489 117
26,1
10 351 802
77,5
36 994
37
1,0
2 384 665 278,9
59 656 2083
34,9

83

MsC Beatriz Castaeda Saldaa

Casos esperados en poblacin A,


bajo condiciones de poblacin B
Distancia
(Km)

Estructura de A
Habitantes

0 0,9
1,0 1,9
2,0 2,9
3,0 3,9
4,0 y ms
TOTAL

Tasas de
B

1 531
1 904
2 599
4 672
368
11 074

85,0
26,1
77,5
1,0
278,9

Casos esperados
en A bajo
condiciones de B
130
50
201
5
103
489

Tasa ajustada = Suma de casos esperados x constante


Poblacin
Ejemplo: Tasa ajustada =

489 x 1000 = 44,2


11074

Tasas iniciales
A
B
55,1 34,9

Tasas corregidas
A(ajustada) B
44,2
34,9

La comparacin inicial (55,1/34,9 = 1,6) nos estara indicando que la poblacin A


tiene un riesgo 60% mayor al de la poblacin B para tener calcificaciones
pulmonares.
La comparacin luego del ajuste (44,2/34,9 = 1,3) nos indica que si la poblacin A
estuviera sometida a condiciones de exposicin al asbesto iguales que la que
tiene B el riesgo de tener calcificaciones pulmonares sera de 30% ms que en la
poblacin B.

84

MsC Beatriz Castaeda Saldaa

4.2. Relacin entre dos caractersticas nominales


Hay situaciones en las que el inters se centra en describir la fuerza de la relacin
entre dos medidas nominales, como sucede en estudios que miden el riesgo de un
resultado determinado en cuanto a s est presente un factor predisponente
Dos razones usadas para estimar el riesgo son el riesgo relativo (RR) y el Odds
Ratio (OR)

Riesgo relativo
El riesgo relativo de una enfermedad (RR), es la razn de incidencia en personas
expuestas a un factor con respecto a la incidencia en las personas no expuestas.
El riesgo relativo puede calcularse slo a partir de un estudio de cohorte o prueba
clnica en donde se identifica primero a un grupo de personas expuestas a un
factor y otro no expuesto, y luego se estudian durante un tiempo para determinar
que personas desarrollan la enfermedad
Estudios de cohorte Incidencia acumulativa

Personas
Enfermos
No enfermos
Total

Expuestas No expuestas
A1
A0
N1 A1
N0 - A 0
N1
N0

RR =

Total
A
N-A
N

A1 N1
A0 N0

As para interpretar este coeficiente lo comparamos con la unidad, de manera que

Si RR = 1, nos indica que el factor de exposicin no es un factor de riesgo


para la enfermedad, pues se tiene la misma incidencia de enfermedad para
las personas expuestas que para las no expuestas.

Si RR > 1, nos indica que el factor de exposicin es un factor de riesgo


para la enfermedad, ya que para las personas expuestas se tiene mayor
incidencia de la enfermedad que para las personas no expuestas.

Si RR < 1, nos indica que el factor de exposicin es un factor de proteccin


para la enfermedad, ya que para las personas expuestas se tiene menor
incidencia de la enfermedad que para las no expuestas.
85

MsC Beatriz Castaeda Saldaa

Estimacin intervlica
Para que podamos concluir, con certeza, que el factor considerado es un factor de
riesgo para la enfermedad, es necesario que el valor obtenido para el RR sea
significativamente mayor que 1, por ello para estar seguros de este resultado se
obtiene la estimacin intervlica al 95% de confianza para RR; cuyos lmites se
calculan con la siguiente expresin:

L=e

ln( RR ) 1.96

N1 A 1 N 0 A 0
+
N1A1
N0 A0

donde
L:

es el lmite de la estimacin intervlica

e = 2.7182 :

es el nmero neperiano

ln(RR):

es el logaritmo natural del RR

Si el intervalo obtenido tiene lmite inferior mayor que 1, entonces concluimos que
el factor considerado es un factor de riesgo para la enfermedad.
Si el intervalo obtenido tiene lmite inferior menor que 1, entonces no podemos
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
probabilidad se est estimando que es posible que RR = 1, es decir que haya la
misma incidencia para los expuestos que para los no expuestos.
Ejemplo 16

Asuma que de 100 individuos expuestos 20 desarrollaron la enfermedad. En un


grupo de 200 individuos no expuestos, 25 desarrollaron la enfermedad. As en un
arreglo de 2x2 tenemos:
Individuos
Enfermos
No enfermos
Total

Expuestos No expuestos
20
25
80
175
100
200

Total
45
255
300

86

MsC Beatriz Castaeda Saldaa

RR = (20/100) / (25/200) = 1.60


Este resultado nos indica que para los expuestos se tiene un 60% ms de
incidencia de la enfermedad que para los no expuestos.

Li = e

Ls = e

ln( 1.60 ) 1.96

100 20 200 25
+
100 ( 20 ) 200 ( 25 )

ln( 1.60 ) + 1.96

100 20 200 25
+
100 ( 20 ) 200 ( 25 )

= 0.935

= 2.74

Luego el intervalo de confianza al 95% es:

0.935 2.74

Este resultado nos indica que no podemos concluir que el factor de exposicin sea
un factor de riesgo, pues la diferencia encontrada no es significativa.

Odds Ratio (OR)


En estudios de caso-control, en los cuales los investigadores determinan el
nmero de controles, no pueden estimarse las tasas de incidencia. No obstante
puede realizarse un clculo del riesgo relativo, llamado Odds Ratio (OR)
El Odds Ratio es el cociente entre la razn de expuestos a no expuestos en los
casos, y la razn de expuestos y no expuestos en los controles
Personas
Casos
Controles

Expuestos No expuestos
a
b
c
d

OR

Total
N1
N0

a b
axd
=
c d
b xc

Esta estimacin ser correcta si el grupo de control es seleccionado de manera


que refleja la distribucin de exposicin de la poblacin.
87

MsC Beatriz Castaeda Saldaa


Aqu tambin, para interpretar este coeficiente debemos compararlo con la unidad,
de manera que

Si OR = 1, nos indica que el factor de exposicin no es un factor de riesgo


para la enfermedad, pues la relacin de expuestos a no expuesto es la
misma para casos y controles.

Si OR > 1, nos indica que el factor de exposicin es un factor de riesgo para


la enfermedad, ya que la proporcin de casos que han sido expuestos es
mayor que la proporcin de controles que han sido expuestos.

Si OR < 1, nos indica que el factor de exposicin es un factor de proteccin


para la enfermedad, ya que aqu la porcin de expuestos es mayor en los
controles que en los casos.

Estimacin intervlica
Para que podamos concluir, con certeza, que el factor considerado es un factor de
riesgo para la enfermedad, es necesario que el valor obtenido para el OR sea
significativamente mayor que 1, por ello para estar seguros de este resultado se
obtiene la estimacin intervlica al 95% de confianza para OR

L=e

ln( OR ) 1.96

1 1 1 1
+ + +
a b c d

donde
L:

es el lmite de la estimacin intervlica

e = 2.7182 :

es el nmero neperiano

ln(OR):

es el logaritmo natural del OR

Si el intervalo obtenido tiene lmite inferior mayor que 1, entonces concluimos que
el factor considerado es un factor de riesgo para la enfermedad.
Si el intervalo obtenido tiene lmite inferior menor que 1, entonces no podemos
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
probabilidad se est estimando que es posible que OR = 1, es decir que haya la
misma proporcin de expuestos en los casos y controles.

88

MsC Beatriz Castaeda Saldaa

Ejemplo 17

En un estudio de casos-control de dieta con frituras y cncer pancretico (Norell et


al 1986), los siguientes datos fueron obtenidos:

Individuos
Casos
Controles
Total

Dieta con
frituras
53
53
106

No dieta con
frituras
43
85
128

Total
96
138
234

OR = 53/43 = 1.98
53/85
Este resultado nos indica que hubo 98% ms de exposicin a la dieta con frituras
para los casos que para los controles, lo que probablemente influy en el
desarrollo del cncer.
Estimacin intervlica:

Li = e

ln( 1.98 ) 1.96

1
1
1
1
+
+
+
53
43
53
85

ln( 1.98 ) 1.96

1
1
1
1
+
+
+
53
43
53
85

LS = e

Luego el intervalo de confianza al 95% es:

= 1.167

= 3.359
1.167 3.359

Este resultado nos indica que podemos concluir que la dieta con frituras es un
factor de riesgo para el desarrollo de cncer pancretico, pues la diferencia
encontrada es significativa.

89

MsC Beatriz Castaeda Saldaa

4.3. EVALUACIN DE PROCEDIMIENTOS DE DETECCIN


La bondad de un mtodo de deteccin es estimada sobre la base de una muestra
de individuos los cuales han sido sometidos a evaluacin por un procedimiento
aceptado, diferencindolos como sanos y enfermos. Estos individuos al ser
sometidos a la nueva prueba diagnstica pueden resultar positivos o negativos a
la prueba; resultados que podemos agrupar en una tabla de 2 x 2
Prueba
aceptada
Enfermos
Sanos

Prueba diagnstica
Positivo (+)
Negativo (-)
E + (PV)
E- (NF)
S+ (PF)
S- (NV)

TOTAL
E
S

Sensibilidad = E + x 100
E

Es la capacidad del mtodo para detectar a los enfermos


Mide el porcentaje de enfermos que el mtodo es capaz de identificar
Especificidad = S - x 100
S

Es la capacidad del mtodo para identificar a los que no tienen la enfermedad


Mide el porcentaje de sanos que el mtodo es capaz de identificar, es decir,
sanos que dan negativo a la prueba
Valor predictivo

Sobre la base de las estimaciones de la bondad de la prueba para identificacin


de sanos y enfermos, y teniendo en cuenta la prevalencia de la enfermedad en
determinada poblacin se calcula el valor predictivo

Poblacin
Enfermos
Sanos
TOTAL

Prueba diagnstica
Positivo (+)
Negativo (-)
P(E + )
P(E-)
P(S+)
P(S-)
P(+)
P(-)

TOTAL
P(E)
P(S)

Valor predictivo Positivo (VP+) = P(E+) X 100


P(+)
90

MsC Beatriz Castaeda Saldaa

Mide la probabilidad de que una persona que result positiva a la prueba,


realmente tenga la enfermedad.
Valor predictivo Negativo (VP-) = P(S -) X 100
P(-)

Mide la probabilidad de que una persona que result negativa a la prueba,


realmente est sana.
Ejemplo18

Se estima que el 1% de la gente de cierto vecindario tiene tuberculosis; una


placa de rayos X es usada con la gente para prevenirla de la enfermedad. De
experiencias anteriores se sabe que los rayos X tienen una sensibilidad del
99% y una especificidad del 90%.
a) Si la prueba a una persona resulta positiva, cul es la probabilidad de que
no tenga tuberculosis?
b) Si la prueba resulta negativa, cul es la probabilidad de que est
enferma?

Poblacin
Enfermos
Sanos
TOTAL

Prueba diagnstica
Positivo (+)
Negativo (-)
0.0099
0.0001
0.099
0.891
0.1089
0.8911

TOTAL
0.01
0.99

Luego:
Valor predictivo Positivo (VP+) = P(E+) X 100 = 0.0099 x 100 = 9.09%
P(+)
0.1089
Valor predictivo Negativo (VP-) = P(S-) X 100 = 0.891 x 100 = 99.99%
P(-)
0.8911
Ejercicios
1. Se examina de cncer a los residentes de una comunidad y los
resultados se clasifican de positivos si se sospecha que es maligno, y
como negativos si no hay indicios de que sea maligno. Si la
sensibilidad del mtodo diagnstico es del 98% y la especificidad del
91

MsC Beatriz Castaeda Saldaa


85% y si el 5% de la comunidad tiene cncer, cul es la probabilidad
de que una persona no tenga cncer si su examen resulta positivo?.
2. Se sabe que el anlisis de glucosa en sangre en ayuno tiene una
sensibilidad y especificidad conocidas de 80% y 96%,
respectivamente. Segn los reportes mdicos el 90% de las personas
que dan positivo al anlisis de glucosa en orina tienen diabetes.
A una persona con resultado positivo para glucosa en orina, se le ha
hecho una prueba de glucosa sangunea en ayuno, si el resultado fue
positivo cul es la probabilidad de que tenga diabetes?.

92

MsC Beatriz Castaeda Saldaa


5. TAMAO DE MUESTRA
5.1. Una poblacin
a)

Estimacin de una media

Z 21 / 2 Se 2
n=
E2

donde:
Z1-/2 : Cuantila 1-/2 de la normal estndar para una confianza 1-
Se: Desviacin estndar estimada, la que puede obtenerse de revisin
bibliogrfica, en estudios pilotos.
E: Error absoluto o precisin (mximo error de estimacin)

Si la poblacin es finita con N tamao poblacional

Tamao final

nf =

1+

n
N

Ejemplo 19.

Se desea estimar, con 95% de confianza, el tiempo promedio para efectuar cierta
intervencin quirrgica. En un estudio piloto se encontr que S = 2.2 horas.
El investigador asume una precisin de 0.50 horas
Confianza 1- = 0.95, entonces

Z = 1.96

S = 2.22 horas
E = 0.50 horas
Luego

n = 1.96 x 2.2
0.50

= 74.37 74 o ms

Si se desea mejorar la precisin, asumiendo E = 0.25 horas


Luego

n = 1.96 x 2.2
0.25

= 297.49 298 o ms

93

MsC Beatriz Castaeda Saldaa


b) Prueba de hiptesis para una media

(Z Z )
n =

1
0

Ejemplo 20.

Los investigadores desean conocer si Pimax (presin inspiratoria mxima por la


boca) es igual en pacientes con cifoescoliosis y en individuos normales.
Supngase que los investigadores asumen un nivel de significancia del 5% y
desean tener una probabilidad del 90% de detectar la diferencia verdadera.
Se supone que en sujetos normales la media de Pimax es 110 cm H2O y la
desviacin estndar es 20cm H2O. Supngase tambin que los investigadores
desean tener la capacidad para decir que una media de Pimax de 80 cm H2O o
menor es significativamente diferente del valor normal.
H0: 0 = 110

H1: 1 80

= 20
= 0.05 , entonces
1 - = 0.90, entonces

Z = -1.64
Z = 1.28

( 1 . 64 1 . 28 ) 20
n =

80 110

= 3 . 79 4

94

MsC Beatriz Castaeda Saldaa


c) Estimacin de una proporcin

Z 21 / 2 P(1 P)
n=
E2
donde:
Z1-/2 : Cuantila 1-/2 de la normal estndar para una confianza 1-
P: Proporcin poblacional estimada, la que puede obtenerse de revisin
bibliogrfica, en estudios pilotos.
E: Error absoluto o precisin (mximo error de estimacin)

Si la poblacin es finita con N tamao poblacional


Tamao final

nf =

n
1+

n
N

Ejemplo 21.

Se desea estimar la prevalencia de Retinopata Diabtica de pacientes con


Diabtis Mellitus, con un margen de error del 3% y una confiabilidad del 95%.
Estudio realizado en el ao 98 report 30% de prevalencia
Confianza 1- = 0.95, entonces
P = 0.30
E = 0.03

Z = 1.96

Luego

= 896.37 896 o ms

n = 1.96 x 0.30x0.70
0.03

Ejemplo 22.

Se desea estimar la prevalencia de enteroparsitos en escolares del distrito de


Jan. Se sabe que la poblacin escolar es de 17 695 alumnos, para una
confiabilidad del 95% se desea que la precisin (o margen de error) sea de 5% y
como no se tiene valores referenciales asumimos 50% de prevalencia aproximada.
Confianza 1- = 0.95, entonces
P = 0.50
E = 0.05
N = 17695

Z = 1.96

95

MsC Beatriz Castaeda Saldaa


Luego

= 384.16 384 o ms

n = 1.96 x 0.50x0.50
0.05

Como poblacin es finita, entonces


n=

384
1+384/17695

= 375.84 376 o ms

Si prevalencia aproximada es pequea como 5% o 1%, entonces el error o


precisin se elige mximo como un 20% de estos valores, as tendramos por
ejemplo:
Confianza 1- = 0.95, entonces
P = 0.05
E = 0.01 (20% de 5%)

Z = 1.96

Luego

= 1824.76 1825 o ms

n = 1.96 x 0.05x0.95
0.01

d) Prueba de hiptesis para una proporcin

Z
n=

P0 (1 P0 ) Z
P1 P0

P1 (1 P1 )

Ejemplo 23.

Estudios previos han demostrado que la prevalencia usual de la caries dental en


escolares de una comunidad es alrededor del 25%. Cuntos nios deben ser
incluidos en un nuevo estudio diseado para probar que la prevalencia de caries
dental ha disminuido, si se desea tener una seguridad del 90% de detectar una
proporcin de 20% al 5% de nivel de significancia.
P0 = 0.25
P1 = 0.20
= 0.05,
entonces
1 - = 0.90, entonces

Z = -1.64
Z = 1.28
2

1.64 0.25(1 0.75) 1.28 0.20(1 0.80)


n=
= 597.45 597
0
.
20
0
.
25

96

MsC Beatriz Castaeda Saldaa


5.2. Dos poblaciones
a) Comparacin de medias
H0: 1 - 2 = 0

H1: 1 - 2 = A
H0

H1

1-

1-

x1 x2

x1 x 2

Asumiendo varianzas semejantes 2 para cada poblacin y muestras del mismo


tamaos n1 = n2 = n; tenemos que para un resultado obtenido x 1 x 2 en las
muestras

Z 1 =

( x1 x 2 )

12 22
n1

n2

( x1 x 2 )

Z =

2 2
n

( x 1 x 2 ) (1 2 )
2 2
n

despejando x 1 x 2 e igualando obtenemos

( Z 1 Z )
n =2

1 2

Ejemplo 24. Se desea comparar la concentracin de magnesio en el suero y los


tejidos de pacientes con arritmia ventricular y sin sta. Los investigadores desean
tener una muestra grande para poder detectar una diferencia media de valores de
15 mmol/mg de protena o ms, asumiendo un nivel de significancia de 5% y una
seguridad del 80% de poder detectar una diferencia verdadera. Con base en su
experiencia clnica, calcularon que la desviacin estndar era aproximadamente
de 20.

97

MsC Beatriz Castaeda Saldaa


H0: 1 - 2 = 0
= 20
= 0.05 , entonces Z1- = 1.64
1 - = 0.80, entonces Z = -0.84

H1: 1 - 2 15

( 1 . 64 + 0 . 84 ) 20
n = 2

15

= 21 . 87 22

Por lo tanto se necesitan 22 individuos de cada grupo.


b) Comparacin de proporciones
H 0: P 1 - P 2 = 0

H 1: P 1 - P 2 = A
H0

H1

1-

1-

p1 p2

p1 p 2

Asumiendo muestras del mismo tamaos n1 = n2 = n; y bajo la hiptesis nula


proporcin comn P = P1 = P2, tenemos que para un resultado obtenido
p1 p 2 en las muestras

Z 1 =

( p1 p 2 )
P (1 P ) P (1 P )
+
n1
n2

( p1 p 2 )
2 P (1 P )
n

Donde P puede ser considerada como una de las dos proporciones o como el
promedio de las proporciones de cada poblacin
Bajo la hiptesis alterna

Z =

( p1 p 2 ) ( P1 P2 )
P1 (1 P1 ) P2 (1 P2 )
+
n
n
98

MsC Beatriz Castaeda Saldaa

despejando p 1 p 2 e igualando obtenemos

Z 1
n=

P1 (1 P1 ) + P2 (1 P2 )

P1 P2

2 P (1 P ) Z

Ejemplo 25. Es sabido que la proporcin de pacientes que desarrollan


complicaciones despus de un tipo de tratamiento es aproximadamente 5%,
mientras que la proporcin de pacientes que desarrollan complicaciones despus
de un segundo tipo de tratamiento es 15%. Cun grande debe ser la muestra en
cada grupo, si los investigadores desean detectar la diferencia con seguridad del
90%, asumiendo un nivel de significancia del 5%

P2 = 0.05
P1 = 0.15
= 0.05,
entonces
1 - = 0.90, entonces

Z = 1.64
Z = -1.28

1.64 2(0.05 x 0.95) + 1.28 0.15 x 0.85 + 0.05 x 0.95


n=
= 108.36 109
0.15 0.05

Se requiere una muestra de 109 pacientes en cada grupo.

99

MsC Beatriz Castaeda Saldaa

BIBLIOGRAFA
1. AHLBOM, A. And NORELL, S. Introduction TO MODERN EPIDEMIOLOGY.
Epidemiology Resources inc. USA. 1990
2. CONOVER, W.J. Practical Non Parametric Statistics 2ed. JOHN WILEY &
SONS. New York. 1980
3. DANIEL, W.W. BIOESTADSTICA, Base para el Anlisis de las ciencias
de la Salud. Editorial Limusa S.A. de C.V. Grupo Noriega Editores. 2004
4. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. Editorial
El Manual Moderno, S.A. de C.V. Mxico. 1997
5. ELORZA H. Estadstica para ciencias del comportamiento. Harla S.A.,
Mxico. 1987
6. ROTHMAN, K. MODERN EPIDEMIOLOGY. LITTLE, BROWN AND
COMPANY. Boston/Toronto. 1986
7. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a
la Ingeniera. McGRAW-HILL. Mxico. 1996

100

MsC Beatriz Castaeda Saldaa

APNDICE A:

ESQUEMAS DE SELECCIN DE
PRUEBAS ESTADSTICAS

101

MsC Beatriz Castaeda Saldaa

Esquema de seleccin de pruebas estadsticas cuando


la variable dependiente es continua u ordinal
Si
1 Grupo

Prueba Z para la media


Si

n > = 30

Prueba T para la media

Distribucin
normal

No

Prueba del signo para la mediana

No
Si

Prueba Z para la diferencia de medias


Si Varianzas
iguales

Si n > = 30

Nmero
de
grupos

2 Grupos

No

No

Distribuci
n normal

Independientes

No

Si
Distribucin
normal
No

Si
3 a ms Grupos
Independientes

No

Prueba T con ajuste


de grados de libertad

Prueba Z para la media de la diferencia


en datos apareados

n > = 30

No

Prueba T para
diferencia de medias

Prueba de Mann-Whitney para


comparacin de poblaciones

No
Si

Si

Distribucin
normal c/varianzas semejantes
Distribucin
normal c/varianzas semejantes

Si

No
Si

No

Prueba T para la media de la


diferencia en datos apareados
Prueba del signo o de Wilcoxon
para datos apareados

ANVA - Comparacin de tratamientos


Prueba de Kruskal-Wallis - Comparac. de Trat.
ANVA en Bloque - Comparac. de Tratam.
Prueba de Friedman - Comparac. de Tratam.

102

MsC Beatriz Castaeda Saldaa

Esquema de seleccin de pruebas estadsticas cuando


la variable dependiente es nominal
Si
1 Grupo

Prueba Z para la proporcin poblacional

Muestra grande
nP y n(1-P) >5
Prueba Binomial para la proporcin poblacional

No

Si
Frecuencias
esperadas
pequeas

Si

Nmero
de grupos

2 Grupos

Prueba exacta de Fisher - Comparacin de


proporciones

Independientes

Prueba Z o Prueba Ji-Cuadrado


para comparacin de proporciones

No

Prueba de McNemar- Comparacin de proporciones

No

Si
Si
3 a ms Grupos

Frecuencias
esperadas
pequeas
No

Independientes

Prueba Ji-Cuadrado (reunir categoras)


para comparacin de proporciones

Prueba Ji-Cuadrado
para comparacin de proporciones

Prueba Q de Cochran-Comparacin de tratamientos


No

103

MsC Beatriz Castaeda Saldaa

Esquema de seleccin de pruebas estadsticas para medir


relacin entre variables

Continua

Escala de
medicin
para ambas
variables

Coeficiente de correlacin lineal de Pearson

Ordinal y/o
numrica

Coeficiente de Correlacin por rangos de Spearman

Si

Nominal

Cada variable
tiene dos
categoras
(tablas 2x2)
No

- Prueba Ji-Cuadrado (Coeficiente )


- Riesgo Relativo (Estudios de cohorte)
- Odds Ratio (Estudios de Casos-control)
- Coeficiente de concordancia Kappa
(Comparacin de mtodos)

Prueba Ji-Cuadrado para Independencia


de variables (Coeficiente de
Contingencia)

104

MsC Beatriz Castaeda Saldaa

APNDICE B:

ESQUEMA PARA LA REALIZACIN


DE UNA PRUEBA DE HIPOTESIS

105

MsC Beatriz Castaeda Saldaa

ESQUEMA PARA LA REALIZACION DE UNA


PRUEBA DE HIPOTESIS

Defina las hiptesis de la investigacin

Identifique la poblacin bajo estudio


y el tipo de variable

Plantee las hiptesis estadsticas


(H0 y H1)

Elija laprueba estadstica apropiada y el


nivel de significancia

Con los datos muestrales calcule la


estadstica de la prueba

Calcule el nivel crtico p

p <=

SI

Rechace la hiptesis nula H 0 a favor de la


alternativa H 1 .Las diferencias encontradas
son significativas a un nivel < =

NO

No se puede rechazar H0 al nivel elegido.


Las diferencias encontradas no alcanzan
significancia

106

MsC Beatriz Castaeda Saldaa

APNDICE C:

TABLAS

107

MsC Beatriz Castaeda Saldaa

Tabla C1. Cuantilas q para la Prueba de Tukey (2 a 12 tratamientos =0.05)


g.l.
N-K
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120

Nmero de tratamientos (k)


2
3
4
5
6
7
8
9
17.97 26.98 32.82 37.08 40.41 43.12 45.40 47.36
6.08 8.33 9.80 10.88 11.74 12.44 13.03 13.54
40.50 5.91 6.82 7.50 8.04 8.48 8.85 9.18
3.93 5.04 5.76 6.29 6.71 7.05 7.35 7.60
3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80
3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32
3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00
3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.77
3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59
3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46
3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35
3.08 3.77 4.20 4.51 4.75 4.95 5.12 5.27
3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19
3.03 3.70 4.11 4.41 4.64 4.83 4.99 5.13
3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08
3.00 3.65 4.05 4.33 4.56 4.74 4.90 5.03
2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99
2.97 3.61 4.00 4.28 4.49 4.67 4.82 4.96
2.96 3.59 3.98 4.25 4.47 4.65 4.79 4.92
2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90
2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81
2.89 3.49 3.85 4.10 4.30 4.46 4.60 4.72
2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63
2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55
2.80 3.36 3.68 3.92 4.10 4.24 4.36 4.47
2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39

10
49.07
13.99
9.46
7.83
6.99
6.49
6.16
5.92
5.74
5.60
5.49
5.39
5.32
5.25
5.20
5.15
5.11
5.07
5.04
5.01
4.92
4.82
4.73
4.65
4.56
4.47

11
50.59
14.39
9.72
8.03
7.17
6.65
6.30
6.05
5.87
5.72
5.61
5.51
5.43
5.36
5.31
5.26
5.21
5.17
5.14
5.11
5.01
4.92
4.82
4.73
4.64
4.55

12
51.96
14.75
9.95
8.21
7.32
6.79
6.43
6.18
5.98
5.83
5.71
5.61
5.53
5.46
5.40
5.35
5.31
5.27
5.23
5.20
5.10
5.00
4.90
4.81
4.71
4.62

108

MsC Beatriz Castaeda Saldaa


Tabla A-2 Areas bajo la curva normal estndar1

z
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.50

Area
Area en
Area en una
entre
dos colas
cola
z y +z < -z y > +z < -z o > +z
0.000
1.000
0.500
0.040
0.960
0.480
0.080
0.920
0.460
0.119
0.881
0.440
0.159
0.841
0.421
0.197
0.803
0.401
0.236
0.764
0.382
0.274
0.726
0.363
0.311
0.689
0.345
0.347
0.653
0.326
0.383
0.617
0.309

0.55
0.60
0.65
0.70
0.75
0.80
0.85
0.90
0.95
1.002

0.418
0.451
0.484
0.516
0.547
0.576
0.605
0.632
0.658
0.683

0.582
0.549
0.516
0.484
0.453
0.424
0.395
0.368
0.342
0.317

0.291
0.274
0.258
0.242
0.227
0.212
0.198
0.184
0.171
0.159

1.05
1.10
1.15
1.20
1.25
1.282
1.30
1.35
1.40
1.45
1.50

0.706
0.729
0.750
0.770
0.789
0.800
0.806
0.823
0.838
0.853
0.866

0.294
0.271
0.250
0.230
0.211
0.200
0.194
0.177
0.162
0.147
0.34

0.147
0.136
0.125
0.115
0.106
0.100
0.097
0.089
0.081
0.074
0.067

1
2

z
1.55
1.60
1.6452
1.65
1.70
1.75
1.80
1.85
1.90
1.95
1.962
2.00
2.05
2.10
2.15
2.20
2.25
2.30
2.3262
2.35
2.40
2.45
2.50
2.55
2.5752
2.60
2.65
2.70
2.75
2.80
2.85
2.90
2.95
3.00

Area
entre
z y +z
0.879
0.890
0.900
0.901
0.911
0.920
0.928
0.936
0.943
0.949
0.950
0.954
0.960
0.964
0.968
0.972
0.976
0.979
0.980
0.981
0.984
0.986
0.988
0.989
0.990
0.991
0.992
0.993
0.994
0.995
0.996
0.996
0.997
0.997

Area en dos
colas
< -z y > +z
0.121
0.110
0.100
0.099
0.089
0.080
0.072
0.064
0.057
0.051
0.050
0.046
0.040
0.036
0.032
0.028
0.024
0.021
0.020
0.019
0.016
0.014
0.012
0.011
0.010
0.009
0.008
0.007
0.006
0.005
0.004
0.004
0.003
0.003

Area en una
cola
< -z o > +z
0.061
0.055
0.050
0.049
0.045
0.040
0.036
0.032
0.029
0.026
0.025
0.023
0.020
0.018
0.016
0.014
0.012
0.011
0.010
0.009
0.008
0.007
0.006
0.005
0.005
0.005
0.004
0.003
0.003
0.003
0.002
0.002
0.002
0.001

Biometrica Tables for Statisticians , 3 ed.


Los valores de uso frecuente estn en negritas

109

MsC Beatriz Castaeda Saldaa


Distribucin t . Student Acumulativa
P

1-P

tp
g.l.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
55
60
70
80
90
109
200

0.75

0.80

0.85

0.90

P
0.95

1.0005
0.816
0.765
0.741
0.727
0.718
0.711
0.706
0.703
0.700
0.697
0.695
0.694
0.692
0.6.91
0.690
0.689
0.688
0.688
0.687
0.686
0.686
0.685
0.685
0.684
0.684
0.684
0.683
0.683
0.683
0.682
0.681
0.680
0.680
0.679
0.679
0.678
0.678
0.678
0.677
0.676

1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.866
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.852
0.851
0.850
0.849
0.849
0.848
0.847
0.847
0.846
0.846
0.844

1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1 .071
1.069
1.067
1.066
1.064
1.063
1.961
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.052
1.050
1.048
1.047
1.047
1.046
1.045
1.044
1.043
1.042
1.039

3.078
1.836
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.306
1.303
1.301
1.299
1.297
1.296
1.294
1.293
1.291
1.290
1.286

6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.690
1.684
1.680
1.676
1.673
1.671
1.667
1.665
1 .662
1.661
1 .653

t(v)

0.975

0.990

0.995

0.9995

12.706
4.303
3.182
2.776
2.571
2.447
2.3-65
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.030
2.021
2.014
2.008
2.004
2.000
1 .994
1.990
1 .987
1.984
1.972

31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.584
2.567
2.552
2.540
2.528
2.518
2.508
2.500
2.492
2.485
2.477
2.473
2.467
2.462
2.457
2.438
2.423
2.412
2.403
2.396
2.390
2.381
2.374
2.368
2.364
2.445

63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.724
2.704
2.690
2.678
2.669
2.600
2.648
2.638
2.632
2.626
2..601

636.619
31.598
12.941
8.610
6.859
5.959
5.405
5.041
4.781
4.58Z
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.850
3.819
3.792
3.767
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.591
3.551
3.520
3.496
3.476
3.460
3.435
3.416
3.402
3.390
3.340

110

MsC Beatriz Castaeda Saldaa


Distribucin t . Student Acumulativa
P

1-P

tp
g.l.

300
400
500
1000

0.75
0.676
0.676
0.676
0.675
0.67449

0.80
0.843
0.843
0.843
0.842
0.84162

0.85
1.038
1.038
1.037
1.037
1.03643

0.90
1 .285
1.284
1.284
1.283
1.28155

P
0.95
1.650
1.649
1 .648
1.647
1.64485

0.975
1.968
1.966
1.965
1.962
1.95996

t(v)
0.990
2.437
2.434
2.432
2.427
2.32630

0.995
2.592
2.588
2.586
2.581
2.57582

0.9995
3.323
3.315
3.310
3.301
3.29053

111

MsC Beatriz Castaeda Saldaa


Distribucin Ji- Cuadrada Acumulativa
P

1-P

g.l.

1
2
3
4
S
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

0.0005
0.06393
0.02100
0.0153
0.0639
0.158
0.299
0.485
0,710
0.972
1.26
1.59
1.93
2.31
2.70
3.11
3.54
3.98
4.44
4.91
5.40
5.90
6.40
6.92
7.45
7.99
8.54
9.09
9.66
10.2
10.8
11.4
12.0
12.6
13.2
13.8
14.4
15.0
15.6
16.3
16.9

0.001
0.005
0.05157 0.04393
0.01200 0.0100
0.0243
0.0717
0.0908
0.207
0.210
0.412
0.381
0.598
0.857
1.15
1.48
1.83
2.21
2.62
3.04
3.48
3.94
4.42
4.90
5.41
5.92
6.45
6.98
7.53
8.08
8.65
9.22
9.80
10.4
11.0
11.6
12.2
12.8
13.4
14.1
14.7.
15.3
16.0
16.6
17.3
17.9

0.676
0.989
1.34
1.73
2.16
2.60
3.07
3.57
4.07
4.60
5.14
5.70
6.26
6.84
7.43
8.03
8.64
9.26
9.89
10.5
11.2
11.8
12.5
13.1
13.8
14.5
15.1
15.8
16.5
17.2
17.9
18.6
19.3
20.0
20.7

0.01
0.03157

P
0.025
0.02982

0.05
0.01393

0.0201
0.115
0.297
0.554

0.0506
0.216
0.484
0.831

0.872
1.24
1 .65
2.09
2.56
3.05
3.57
4.11
4.66
5.23
5.81
6.41
7.01
7.63
8.26
8.90
9.54
10.2
10.9
11.5
12.2
12.9
13.6
14.3
15.0
15.7
16.4
17.1
17.8
18.5
19.2
20.0
20.7
21.4
22.2

1.24
1.69
2.18
2.70
3.25
3.82
4.40
5.01
5.63
6.26
6.91
7.56
8.23
8.91
9.50
10.3
11.0
11.7
12.4
13.1
13.8
14.6
15.3
16.0
16.8
17.5
18.3
19.0
19.8
20.6
21.3
22.1
22.9
23.7
24.4

2(v)
p

0. 10

0.20

0.30

0.103
0.352
0.711
1.15

0.0158
0.211
0.584
1.06
1.61

0.0642
0.446
1 .00
1.65
2.34

0.148 0.275
0.71
T.02
1.42
1.87
2.19
2.75
3.00
3.66

1.64
2.17
2.73
3.33
3.94
4.57
5.23
5.89
6.57
7.26
7.96
8.67
9.39
10.1
10.9
11.6
12.3
13.1
13.8
14.6
15.4
16.2
16.9
17.7
18.5
19.3
20.1
20.9
21.7
22.5
23.3
24.1
24.9
25.7
26.5

2.20
2.83
3.49
4.17
4.87
5.58
6.30
7.04
7.79
8.55
9.31
10.1
10.-9
11.7
12.4
13.2
14.0
14.8
15.7
16.5
17.3
18.1
18.0
19.8
20.6
21.4
22.3
23.1
24.0
24.8
'25.6
26.5
27.3
28.2
29.1

3.07
3.82
4.59
5.38
6.18
6.99
7,81
8.63
9.47
10.3
11 .2
12.0
12.9
13.7
14.6
15.4
16.3
17.2
18.1
18.9
19.,8
20.7
21.6
22.5
23.4
24.3
25.1
26.0
26.9
27.8
28.7
29.6
30.5
31.4
32.3

3.83
4.67
5.53
6.39
7.27
8.15
9.03
9.93
10.8
11.7
12.6
13.5
14.4
15.4
16.3
17.2
18.1
19.0
19.9
20.9
21.8
22.7
23.6
24.6
25.5
26.4
27.4
28.3
29.2
30.2
31.1
32.1
33.0
33.0
34.9

0.40

4.57
5.49
6.42
7.36
8.30
9.24
10.2
11 .1
12.1
13.0
14.0
14.9
15.9
16.9
17.8
18.8
19.7
20.7
21.7
22.6
23.6
24.5
25.5
26.5
27.4
28.4
29.4
30.3
31.3
32.3
33.3
34.2
55.2
36.2
37.1

112

MsC Beatriz Castaeda Saldaa


41
42
43
44
45

17.5
18.2
18.8
19.5
20.1

18.6
19.2
19.9
20.6
21.3

21.4
22.1
22.9
23.6
24.3

46
47
48
49
50

20.8
21.5
22.1
22.8
23.5

21.9
22.6
23.3
24.0
24.7

25.0.
25.8
26.5
27.2
28.0

22.9
23.7
24.4
25.1
25.9
26.7
27.4
28.2
28.9
29.7

25.2
26.0
26.8
27.6
28.4
29.2
30.0
30.8
31.6
32.4

27.3
28.1
29.0
29.8
30.6
31.4
32.3
33.1
33.9
34.8

29.9
30.8
31.6
32. 5
33.4
34.2
35.1
35.9
36.8
37.7

33.3
34.2
35.1
36.0
36.9
37.8
38.7
39.6
40.5
41.4

35.8
36.8
37.7
38.6
39.6
40.5
41.5
42.4
43.4
44.3

38.1
39.1
40.0
41.0
42.0
43.0
43.9
44.9
45.9
46.9

113

MsC Beatriz Castaeda Saldaa


Distribucin Ji- Cuadrada Acumulativa
P

1-P

g.l.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

0.50

0.6.0

0.70

0.455
1.39
2.37
3.36
4.36
5.35
6.35
7.34
8.34
9.34
10.3
11.3
12.3
13.3
14.3
15.3
16.3
17.3
18.3
19.3
2.3
21.3
22.3
23.3
24.3
25.3
26.3
27.3
28.3
29.3
30.3
31.3
32.3
33.3
34.3
35.3
36.3
37.3
38.3
39.3

0. 708
1.83
2.95
4.04
5.13
6.21
7.28
8.35
9.41
10.5
1.1.5
T2.6
13.6
14.7
15.7
16.8
17.8
18.9.
19.9
21.0
22.0
23.0
24.1
25.1
26.1
27.2
28.2
29.2
30.3
31.3
32.3
33.4
34.4
35.4
36.5
37.5
38.5
39.6
40.6
41 .6

1 .07
2.41
3.67
4.88
6.06
7.23
8.38
9.52
10.7
11 .8
12.9
14.0
15.1
16.2
17.3
18.4
19.5
20.6
21.7
22.8
23.9
24.9
26.0
27.1
28.2
29.2
30.3
31.4
32.5
33.5
'34.6
35.7
36.7
37.8
38.9
39.9
41 .0
42.0
43.1
44.2

0.80

0.90

1 .6A 2. 71
3.22 4.61
4.64 6.25
5.99 7.78
7.29 9.24
8.56 10.6
9.80 12.0
11.9 13.4
12.2 14.7
13.4 16.'0
14.6 17.3
15.8 18.5
17.0 19.8
18.2 21.1
19.3 22.3
20.5 23.5
21.6 24.8
22.8 26.0
23.9 27.2
25.0 28.4
26.2 29.6
27.3 30.8
28.4 32.0
29.6 33.2
30.7 34.4
31.8 35.6
32.9 36.7
34.0 37.9
35.1 39.1
36.3 40.3
37.4 41.4
38.5 42.6
39.6 43.7
40.7 44.9
41.8 46.1
42.9 47.2
44.0 48.4
45.1 49.5
46.2 50.7
47.3 51.8

P
0.95

0.975

0.99

3.84
5.99
7.81
9.49
11.1
12.6
14. 1
15.5
16.9
18.3
19.7
21.0
22.4
23.7
25.0
26.3
27.6
28.9
30.1
31.4
32.7
33.9
35.2
36.4
37.7
38.9
40.1
41 .3
42.6
43.8
45.0
46.2
47.4
48.6
49.8
51.0
52.2
53.4
54.6
55.8

5.02
7.38
9.35
11.1
12.8
14.4
16.0
17.5
19.0
20.5
21.9
23.3
24.7
26.1
27.5
28.8
30.2
31.5
32.9
34.2
35.5
36.8
38.1
39.4
40.6
41 .9
43.2
44.5
45.7
47.0
48.2
49.5
50.7
52.0
53.2
54.4
55.7
56.9
58.1
59.3

6.63
9.21
11 .3
13.3
15.1
16.8
18.5
20.1
21 .7
23.2
24.7
26.2
27.7
29.1
30.6
32.0
33.4
34.8
36.2
37.2
38.9
40.3
41 .6
43.044.3
45.6
47.0
48.3
49.6
50.9
52.2
53.5
54.8
56.1
57.3
58.6
59.9
61.2
62.4
63.7

2(v)
p

0.995 0.999
7.88
10.6
12.8
14.9
16.7
18.5
20.3
22.0
23.6
25.2
26.8
28.3
29.8
31.3
32.8
34.3
35.7
37.2
38.6
40.0
41.4
42.8
44.2
45.6
46.9
48.3
49.6
51.0
52.3
53.7
55.0
56.3
57.6
59.0
60.3
61.6
62.9
64.2
65.5
66.8

0. 9995

10.8 12.1
13.8 15.2
16.3 17.7
18.5 20.0
20.5 22.1
22.5 24.1
24.3 26.0
26.1 27.9
27.9 29.7
29.6 31 .4
31.3 33.1
32.9 34.8
34.5 36.5
36.1 38.1
37.7 39.7
39.3 41.3
40.8 42.9
42.3 44.4
43.8 46.0
45.3 47.5
46.8 49.0
48.3 50.5
49.7 52.0
51.2 53.5
52.6 54.9
54.1 56.4
55.5 57.9
56.9 59.3
58.3 60.7
59.7 62.2
61.1 63.6
62.5 65.0
63.9 66.4
65.2 67.8
66.6 69.2
68.0 70.6
69.3 72.0
70.7 73.4
72.1 74.7
73.4 76.1

114

MsC Beatriz Castaeda Saldaa


41
42
43
44
45
46
47
48
49
50

40.3
41.3
42.3
43.3
44.3
45.3
46.3
47.3
48.3
49.3

42.7
43.7
44.7
45.7
46.8
47.8
48.8
49.8
50.9
51.9

45.2
46.3
47.3
48.4
49.5
50.5
51.6
52.6
53.7
54.7

48.4
49.5
50.5
51.6
52.7
53.8
54.9
56.0
57.1
58.2

52.9
54.1
55.2
56.4
57.5
58.6
59.8
60.9
62.0
63.2

56.9
58.1
59.3
60.5
61.7
62.8
64.0
65.2
66.3
67.5

60.6
61 .8
63.0
64.2
65.4
66.6
67.8
69.0
70.2
71.4

65.0- 68.1
66.2
69.3
67.5 70.6
68.7 71.9
70.0 73.2
71.2 74.4
72.4 75.7
73.7 77.0
74.9 78.2
76.2 79.5

74.7
76.1
77.4
78.7
80.1
81.4
82.7
84.0
85.4
86.7

77.5
78.8
80.2
81.5
82.9
84.2
85.6
86.9
88.2
80.6

115

MsC Beatriz Castaeda Saldaa

UNI - FACULTAD DE INGENIERIA AMBIENTAL


PRUEBA DE HIPTESIS

HIPOTESIS
H0: = 0
a) H1: 0
b) H1: > 0
c) H1: < 0
2

H 0:
a) H1: 2
b) H1: 2
c) H1: 2

Requisitos

x 0
/ n
x 0
Z =
S/ n
x 0

Varianza 2 conocida
-Todo n de poblacin Normal
- n grande de cualquier poblacin
Varianza 2 desconocida
- n grande (n > 30) de
poblacin

Distribucin de
La estadstica
Si H0 es cierta

Estadstica
de la prueba

Z=

cualquier

Varianza 2 desconocida
- n < 30 de poblacin Normal

T=

Normal
N(0,1)
Normal
N(0,1)
t-Student
t(n -1)

S/ n

= 0
20
> 20
< 20

H0: P = P0
a) H1: P P0
b) H1: P > P0
c) H1: P < P0
H 0: P 1 = P 2
a) H1: P1 P2
b) H1: P1 > P2
c) H1: P1 < P2

La poblacin es normal

Muestra grande

Muestras grandes de poblaciones


independientes

X =
2

Z =

Z =

(2n 1)

(n 1) S 2

02
p P0

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-
a) T < -t1-/2 T > t1-/2
b) T > t1-
c) T < -t1-
a) X2 < 2 / 2 X2 > 12 / 2

12
c) X2 < 2

b) X2 >

Normal

P0 (1 P0 ) N n

n
N 1
p1 p 2
1
1
P (1 p )
+
n2
n1

Decisin:
Rechazar H0
Al nivel si
a) Z < -Z1-/2 Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-

; p=

N(0,1)
x1 + x 2
n1 + n 2

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-
a) Z < -Z1-/2 Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
Z es N(0,1)

116

MsC Beatriz Castaeda Saldaa

de
poblaciones
H0: 12 = 220 Muestras
2
2
independientes,
cada
una con
a) H1: 1 2 0
2
2
b) H1: 1 > 2 0 distribucin normal.
c) H1: 12 < 220
Varianzas 21, 22 conocidas

a)H0: 1- 2 = 0
H1: 1 - 2 0
b)H0: 1 - 2 0
H1: 1- 2 > 0
c)H0: 1 - 2 0
H1: 1 - 2 < 0

-Todo n1, n2 de poblaciones


normales
- n1 30, n2 30 de cualquier
poblacin
Varianzas 21, 22 desconocidas

S12
F= 2
S2
Z=

Z=

- n1 30, n2 30 de cualquier
poblacin

Varianzas 21, 22 desconocidas y


diferentes
- n1 < 30, n2 < 30 de poblaciones
normales

Normal

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-

12 22
+
n1 n 2

N(0,1)

( x1 x 2 )

Normal

S 12 S 22
+
n1 n2
T =

S 2p =

T =

a) F < F2 F > F1 2
b) F > F1
c) F < F

( x1 x 2 )

Varianzas 21, 22 desconocidas,


pero semejantes
- n1 < 30, n2 < 30 de poblaciones
normales

F(n1-1, n2-1)

N(0,1)

( x1 x 2 )
1
1
Sp
+
n1 n2

( n1 1) S + ( n2 1) S
n1 + n2 2

( x1 x 2 )
S12 S 22
+
n1 n2

T es t(v)

es t ( n1+ n 2 2 )

2
1

c) T < -t1-
2

a) T < -t1-/2 T > t1-/2

( ) +( )
n1

n1 + 1

S2

a) T < -t1-/2 T > t1-/2


b) T > t1-

2
2

S12 S 22

+
n1 n2

v= 2 2
2
S1

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-

n2

n2 + 1

b) T > t1-
c) T < -t1-

117

MsC Beatriz Castaeda Saldaa

ANOVA DE UN FACTOR
Fuente de
Suma de Grados de Cuadrado Razn Probabilidad
variacin Cuadrados libertad
Medio
F
p
Tratamientos
P*
o Grupos
SCG
K-1
A = SCG/ K-1 F = A/E

Error

SCE

N-k

Total

SCT

N-1

E = SCE/N-k

SCG =

(x i x )2 n i
i =1

SCE =

S 2i (n i 1)
i =1

Prueba Ji-Cuadrado de Homogeneidad

H0: P1j = P2j = ...... = Prj

X =
2

i =1 j =1

(O

ij

para cada categora j

Eij )

Eij

Oij

E
i =1 j =1

ij

Eij = ni Cj/ n

X es 2(r-1 x s-1) ; Rechazar H0 si

X2 >

12

118

MsC Beatriz Castaeda Saldaa

ESTIMACION POR INTERVALO


Parmetro

Media

Varianza 2 conocida
-Todo n de poblacin Normal
- n grande de cualquier
poblacin
Varianza 2 desconocida
- n grande (n > 30) de
cualquier poblacin
Varianza 2 desconocida
- n < 30 de poblacin
Normal

Varianza

Proporcin

Intervalo de confianza
(1- )

Requisitos

La poblacin es normal

Poblacin grande
Muestra grande

L = x Z 1 / 2
L = x Z 1 / 2

n
S
n

S
n
(n 1) S 2
Ls =
2 / 2

L = x t 1 / 2
Li =

( n 1) S 2

12 / 2

L = p Z1 / 2

P
Poblacin finita
Muestra grande

L = p Z1 / 2

p(1 p)
n

p(1 p) N n

n
N 1

Tamao de muestra
Poblac. grande
Z12 / 2 S 2
n=
E2
Poblac. finita
n0
n=
n
1+ 0
N
2
Z
S2
n0 = 1 / 22
E

Poblac grande.

Z 12 / 2 p(1 p )
n0 =
E2
n=

n0
Poblac finita
n
1+ 0
N

119

MsC Beatriz Castaeda Saldaa

Parmetro

Intervalo de confianza (1- )

Requisitos
2

Diferencia de
medias

1 - 2

Varianzas 1, 2 conocidas
-Todo n1, n2 de poblaciones
normales.
-n1 30, n2 30 en general
Varianzas 21, 22
desconocidas
- n1 30, n2 30

P1 P2

n1

22
n2

s12 s22
+
n1 n2

L = ( x 1 x 2 ) t1 / 2 S x1 x 2

-n1<30, n2< 30 de poblaciones


normales

Muestras grandes
poblacin.

x x =

L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2 S x x =

Varianzas 21, 22
Desconocidas

Diferencia de
Proporciones

L = ( x 1 x 2 ) Z 1 / 2 x1 x 2

12

de

cada

S x1 x 2 =

( n1 1) S12 + ( n2 1) S 22
n1 + n2 2

1
1
+
n1 n2

L = ( p1 p2 ) Z 1 / 2 S p1 p 2
S p 1 p 2 =

p1 (1 p1 ) p2 (1 p2 )
+
n1
n2

120

Vous aimerez peut-être aussi