Vous êtes sur la page 1sur 44

INDICE

CAPITULO I: BIOESTADSTICA Estadstica y Medicina 1. MEDIDAS DE CENTRALIZACIN 1.1 Media aritmtica 1.2 Mediana 1.3 Moda 2. MEDIDAS DE DISPERSIN 2.1 Desviacin media 2.2 Varianza 2.3 Desviacin estndar 2.4 Error estndar de un porcentaje 2.5 Error estndar de un porcentaje 2.6 Coeficiente de variacin 2.7 Clculo del tamao de la muestra 2.8 Ejercicios de aplicacin 3. LEYES TERICAS QUE SE AJUSTAN A DISTRIBUIDORES BIOLGICAS 3.1 Distribucin binomial 3.2 Distribucin de Poisson 3.3 Distribucin normal o de Gauss Caso prctico de la distribucin normal 4. PROBABILIDADES 4.1 Probabilidad condicional 4.2 Acontecimientos complejos 4.3 Regla de la multiplicacin 4.4 Regla de la suma Ejercicios de aplicacin a.

b. c. d. e. f. 5. 6. 7. ESTIMACIN DE PARMETROS ESTIMACIN DE MEDIAS DISTRIBUCIN T DE STUDENT Caractersticas La distribucin T de student se usa Ejemplo Ejemplo 8. ESTIMACIN DE UNA PROPORCIN (PORCENTAJE) Pasos a seguir 1. 2. 3. 4. Ejercicios de aplicacin 9. RELACION ENTRE VARIABLES CUALITATIVAS (Asociacin) Test de Chi Cuadrado Paso 1 Paso 2 Paso 3 Paso 4 Paso 5 Paso 6 a. b. 10. PRUEBA EXACTA DE FISHER 2

CAPTULO I: BIOESTADSTICA
Estadstica y Medicina El mdico al estudiar a sus pacientes para establecer el diagnstico, recolecta una serie de datos, los relaciona segn frecuencias, emplea la tcnica probabilstica y decide el diagnstico con base a ellos. La terapetica es un experimento en el cual el mdico debe saber valorar cuantitativamente los resultados logados e interpretarlos correctamente desde el punto de vista estadstico. El pronstico es tambin un anlisis numrico de lo sucedido con anterioridad en casos semejantes. El mdico en la actualidad ya no pude expresarse en trminos subjetivos. La objetividad es lo usual, y as habla de sus experiencias en tantos enfermos, de sus casusticas en tal nmero de pacientes, de sus xitos y fracasos en el tratamiento con tales o cuales proporciones, de las ventajas de los procedimientos diagnsticos en determinados pacientes; todo ello segn porcientos de acierto o error; es decir, utilizando cifras que requieren ser manejadas estadsticamente en forma adecuada. Cuando el mdico y otros profesionales abordan el problema de la salud a nivel colectivo, sea, de toda una comunidad, la estadstica es su mejor arma para resolverlo, ya que la salud es un fenmeno de conjunto, expresable cuantitativamente, influenciado por mltiples factores esencialmente variables y unidos por complejas relaciones. estadstica es en la epidemiologa. La estadstica descriptiva se encarga de ordenar, presentar, sintetizar y organizar los datos de forma inteligible y cientfica. La estadstica analtica es la que ms interesa en medicina, trabaja con los datos de la descripti8va; permite establecer conclusiones de una poblacin (inalcanzable), a partir de los datos estudiados de una muestra (alcanzable). Otro campo ideal de aplicacin de la

Es un clculo estadstico estn presentes los trminos de poblacin, muestra e individuo. La propiedad o cualidad que presenta los elementos de una poblacin se denominan variables. Las variables cualitativas reflejan una cualidad y no pueden medirse. Las variables cuantitativas pueden medirse y son las que ms nos interesan, ya que para obtenerse los resultados es necesario de clculos matemticos. 1. MEDIDAS DE CENTRALIZACIN Son ndices numricos que orientan sobre que valores se agrupan los datos de la distribucin. 1.1 Media Aritmtica Es aquella medida que tendran los valores si todos fueran iguales. En datos simples es el cociente que resulta de dividir la suma de los valores entre el nmero de ellos.
__

x =

( x)
n
__

Donde: x

= Media aritmtica

= Sumatoria
x n = Valores = Nmero de ellos

En datos distribuidos por frecuencias es el cociente que resulta de dividir la suma de los productos de los valores por su frecuencia entre la suma de las frecuencias Donde:
__

= Media aritmtica

= Sumatoria
Fx = Producto de los valores por sus frecuencias

F = Suma de las frecuencias


x=

Fx F

En datos agrupados por clases y frecuencias es el cociente que resulta de dividir la suma de los puntos medios de cada grupo por su frecuencia respectiva entre la suma de las frecuencias.
x=

( Fx) ( F )
__

Donde:

= Media aritmtica

= Sumatoria
Fx = Producto de los puntos medios de cada grupo de valores por sus frecuencias

F = Suma de las frecuencias


1.2 Mediana Es aquella medida que divide a los valores en dos partes iguales. Es un valor nico. Es el valor central de la serie. En caso de tamao impar, la mediana coincide con un valor existente en la serie de datos, pero en caso de tamao par, no tiene que coincidir con un valor hallado en el experimento.
N +1 2

M =

Donde: N = Nmero de valores Para ser clculo, es necesario ordenar todos los valores de la serie. Ejercicio de Aplicacin Si las edades de un grupo de pacientes son: 20, 20, 21, 27, 30, 31, 36, la mediana ser 27 aos.
M = N +1 7 +1 8 = = = 4 2 2 2

El valor N 4 es 27; entonces M = 27

Si por el contrario las edades son: 20, 20, 21, 27, 30, 31 aos, la mediana se calcula como la media de los dos nmeros centrales, 21 y 27; total, 24 aos.
_

x =

21 + 27 48 = = 24 aos 2 2

Ejercicio de Aplicacin La figura de abajo representa la supervivencia de una cohorte de pacientes con infarto agudo de miocardio media horas despus del inicio de los sntomas. Cul es la mediana de supervivencia?

Respuesta: La mediana de supervivencia es el tiempo en el cual el 50% de la cohorte ha muerto y la curva de la grfica tiene un punto de coordenada de 1.5 horas, que corresponde al punto de coordenada del 50% de supervivencia. La supervivencia promedio puede calcularse hasta que hayan muerto todos los miembros de la cohorte. 1.3 Moda Es el valor que ms se repite de un conjunto de datos. A diferencia de la media y mediana, en una serie pueden existir mas de una moda (bimodales, trimodales, etc). La moda siempre coincide con un valor del experimento.

2.

MEDIDAS DE DISPERSIN 2.1 Desviacin Media Es el cociente que resulta de dividir la suma de las desviaciones de los valores alrededor de la media aritmtica, omitiendo los signos entre el nmero de valores.

( x x DM =
N

__

Donde: DM = Desviacin media

= Sumatoria
( X X ) = Desviacin (cada valor menos la media aritmtica
__

N 2.2 Varianza

= Nmero de valores

Es el cociente que resulta de dividir la suma de las desviaciones de los valores alrededor de la media, elevados al cuadrado, entre el nmero de valores.

( X X ) 2 =
N

Donde: S2 = Varianza

= Sumatoria
F ( X 'X ) 2 = Desviaciones al cuadrado

= Nmero de valores

2.3 Desviacin estndar Es la raz cuadrada de la varianza

( X X ) 2 S =
N

Es la ms usada y, conjuntamente con la media aritmtica, constituye la base de los valores biolgicos. Cuando se calcula a partir de datos distribuidos por frecuencias, la frmula se modifica a:
S =

F [ ( X ' X ) 2 ] F

Donde: S = Desviacin estndar

= Suma
F ( X 'X ) 2 = Producto de las desviaciones al cuadrado por su

Frecuencias respectivas

F = Suma de frecuencias
Cuando se trata de datos agrupados por clases y frecuencia, la frmula es:
S =

F ( X ' X ) 2 F

:_

Donde: S = Desviacin estndar

= Suma
F ( X 'X ) 2 = Producto de las desviaciones al cuadrado por sus

Frecuencias respectivas

F = Suma
Existen, por supuesto, mtodos abreviados para calcular estas medidas. Lo importante es que cuando se presentan suficientes datos de seres humanos se obtiene habitualmente una curva caracterstica llamada curva normal o de Gauss, en forma de campana, dentro de la cual quedan incluidos el 95.45% de los individuos normales, correspondiendo a los bordes los anormales, siendo los lmites correspondientes la media aritmtica 2 desviaciones estndar, hecho comprobado por varios autores. En sntesis puede sealarse que cuando se trabaja con valores

10

cuantitativos en el campo de las ciencias mdicas los lmites de variacin se obtienen utilizando la media aritmtica y dos desviaciones estndar. 2.4 Error estndar de un promedio El error estndar de un promedio es igual a la desviacin estndar dividida entre la raz cuadrada del nmero de individuos.
+

S =

S n

2.5 Error estndar de un porcentaje Es igual a la raz cuadrada del producto del porcentaje que se estudia por el porcentaje contrario 8diferencia para 100) dividido entre el tamao de la muestra.
S = P xQ N

Donde: muestra)

S =

Desviacin estndar n P Q = = = Nmero de individuos (tamao de la

Porcentaje favorable que se estudia Porcentaje desfavorable contrario.

El error estndar depende la variabilidad del fenmeno que se estudia y del tamao de la muestra; evidentemente, entre ms pequea es la muestra, el error es mayor, por esto las muestras reducidas tienen un valor muy limitado. Es necesario en cada caso calcular el tamao de las muestras utilizando las frmulas matemticas correspondientes. Lo importante es comprender que el error estndar, la diferencia encontrada y el grado de confiabilidad de los datos deben analizar5se con pruebas de significancia estadstica, que sirven para aceptar o rechazar la influencia del azar. Las pruebas son mltiples

11

y complejas segn el tipo de problema. La ms sencilla es la prueba de la curva normal, aplicable en un ejemplo como el siguiente: Se tienen dos grupos de pacientes estrictamente comparables uno con un frmaco y otro con un placebo; los resultados fueron:
Pacientes que sobrevivieron 48 40 88 Pacientes que fallecieron 2 10 12 Total de pacientes 50 50 100

Letalidad 4% 20% 12%

Grupo con frmaco Grupo con placebo Total

El problema es saber si fue el frmaco el que tuvo el efecto de reducir la letalidad en comparacin al grupo con placebo o fue la casualidad. La frmula de la prueba es:
Y = P1 P 2 PO QO PO QO + N1 N2

Donde: Y = PO QR P1 P2 N1 N2 Valor de significancia (para un 95% de certeza, en la prctica igual a 2) = = = = = = Porciento de pacientes que sobrevivieron (88%) Porciento de pacientes que fallecieron (12%) Porciento de pacientes que sobrevivieron con el frmaco (96%) Porciento de pacientes que sobrevivieron con el placebo (80%) Tamao de la muestra con frmaco Tamao de la muestra con placebo

Como el valor es superior a 2, se considera que la diferencia es real y que la influencia de la casualidad es rechazable y por tanto que el frmaco es til. 2.6 Coeficiente de variacin Es una medida de dispersin adimensional, que permite comparar, desde un punto de vista descriptivo, la dispersin (en forma de 12

desviacin tpica) de das o m variables entre si o b dispersin de una variable en distintos grupos. Para ello no deben tomarse en valor absoluto, sino que ser preciso tomarlas en relacin a la media de donde proceden. A este valor que indica el porcentaje que las desviacin tpica representa de la media aritmtica, se denomina coeficiente de variacin, y se calcula de la siente forma:

CV =

x 100

Ejercicio de aplicacin Un espectrmetro mide 50 veces la misma muestra de sangre, y da niveles de glucemia con: x = = 85 mg. 8mg.

Un ecgrafo mide 50 veces la misma distancia entre dos objetos, y obtiene: x = = 120 Km. 11 km.

Cul de los dos mtodos da mediciones ms precisas?, o dicho de otra forma, Cul de los dos mtodos tiene menos variacin? Bmg.
CV ( Espectrmetro) = CV ( Ecgrafo) = 8 mg x 100 = 9, 41 85 mg

11 km x 100 = 9,17 120 km

Ambos mtodos son parecidos, pero el ecgrafo tiene menos variacin. 2.7 Clculo del tamao de la muestra Ejercicios de aplicacin 1. Un funcionario de salud desea estimar la concentracin media de hemoglobina en una determinada comunidad. Por los contactos preliminares cree que esa media es de alrededor de 150 mg/L, 13

con una desviacin estndar de 32 mg/L. Cuntos sujetos debern ser incluidos en su estudio? Aqu, S = 32 Aqu, D = 5 Si se supone que la poblacin es muy grande, el tamao mnimo requerido de la muestra sera: N = (1.95)2 x (32)2/(5)2 = 157.4 As, el estudio necesita por lo menos a 158 personas. Si la comunidad es de tamao N = 3000 personas, el tamao mnimo requerido de la muestra sera: N = (1.96)2 (32)2/[ (5)2 + (1.96)2 x (32)2/3000] = 149.5

Por consiguiente, habra que estudiar por lo menos a 150 personas. Para una comunidad mayor, con N 30 000 personas, el tamao de la muestra requerida sera:

N = (1.96)2 (32)2/[(5)2 (1.96)2(32)2/30 000] = 156.5 Habra que estudiar por lo menos a 157 personas. 2. Al hacer el muestreo para un atributo, por ejemplo, para estimar la proporcin de personas con una cierta caracterstica en una poblacin, se necesita indicar: La magnitud aproximada de la proporcin (P). El error de muestreo absoluto que puede tolerarse (D). La probabilidad admisible de una muestra desfavorable (convencionalmente 5%).

14

La muestra mnima requerida para una poblacin muy grande es entonces: N (1.96)2 P (1-P)/D2 Ejemplo: Si P = 0.26 y D = 0.03 entonces para una poblacin muy grande: N = (1 96)2 x 0.26 x 0.74/(0.03)2 = 821.2 As pues, el estudio incluira por lo menos a 822 personas. Si la muestra fuera de una poblacin relativamente pequea, por ejemplo, con N = 3000 personas, la muestra mnima requerida podra obtenerse de la estimacin anterior mediante reajuste, as: 821.2/(1 + 821.2/3000) = 644.7 En consecuencia, el estudio comprendera por lo menos a 645 personas.

Ejercicios de aplicacin Clculo de la media aritmtica, desviacin estndar y de los lmites de normalidad 1. Se hizo un estudio para conocer la media aritmtica de das de estancia en un hospital. Los valores fueron 4, 6, 3, 8, 10, 14, 12, 8, 4, 11. La media aritmtica es igual:
__

X =

( X )
n

15

__

X =

80 = 8 10

2. Se efecto una investigacin con 58 mujeres para saber el nmero de hijos que las mujeres deseaban tener; las cantidades fueron:
X 1 hijo 2 hijos 3 hijos 4 hijos 5 hijos 6 hijos 7 hijos F 4 mujeres 5 mujeres 10 mujeres 20 mujeres 10 mujeres 5 mujeres 4 mujeres XF 4 10 30 80 50 30 28

La media aritmtica es igual a:


__

X =
__

( FX ) F
232 58

X =
__

X = 4

3. Se hizo un anlisis de los valores del pulso en un grupo de personas con los siguientes resultados:

Valores del pulso(X) 60 a 64 65 a 69 70 a 74 75 a 79 80 a 84 85 a 89 90 a 94 95 a 99 100 a 104

Nmero de personas (F) 2 5 10 15 25 15 10 5 2

Punto medio de Cada grupo(X) 62 67 72 77 82 87 92 97 102

4. La media aritmtica es igual a:

16

__

X =
__

( FX ' ) ( F )
7298 89

X =
__

X =82

5. La desviacin estndar es igual a:


S =

F ( X 'X ) 2 F
6600 89

S =

S = 8.5 6. Los lmites de la variacin normal:


__

X + 2s

82 + 17 = 65 a 99 3. LEYES TEORICAS QUE SE AJUSTAN A DISTRIBUCIONES

BIOLOGICAS. Nos proponemos encontrar leyes matemticas que sean seguidas por distribuciones biolgicas de datos, ya que si furamos capaces de encontrarlas, podramos sustituir toda la coleccin de datos de nuestro estudio por una frmula terica que siguiera la misma distribucin que aqullos; es decir, sintetizaremos todos los datos en una frmula. Vamos a describir tres leyes tericas que tienen la particularidad de ser seguidas por la inmensa mayora de los fenmenos biolgicos habituales: Distribucin Binomial. Distribucin de Poisson. Distribucin Normal o de Gauss.

17

3.1 Distribucin binomial B (n, p) Es una ley terica que aplicaremos siempre que conozcamos la probabilidad de aparicin de un fenmeno biolgico. Aplicable a un experimento que conste de n pruebas. El resultado es dicotmico y puede ser evaluado como xito o fracaso, siendo la variable de inters el nmero de xitos alcanzados en n pruebas. Se denomina distribucin binomial porque la distribucin de probabilidades nos recuerda que coincide con el desarrollo del binomio de Newton (b+r)4 Es una distribucin de variables discretas, por ello, la distribucin binomial constituye un diagrama de barras discontinuo. Media aritmtica (x) = n,p , (es el valor esperado). n = nmero de individuos. p = probabilidad de tener una caracterstica dicotmica; siendo la probabilidad de tener esa caracterstica constante para cada uno. Q = 1-p Desviacin Tpica ( ) = Varianza = n.p.q Se dice que una variable aleatoria sigue una distribucin Binomial de media (n.p) y de
n. p.q. n. p.q

Aproximacin de la distribucin binomial a la distribucin normal Cuando el tamao de una serie de datos que siguen una distribucin Binomial va aumentando, la distribucin se va pareciendo cada vez ms a un distribucin Normal. Esa Normal, procedente de una

18

Binomial, tiene de media y de a, la media y la a de la distribucin de la que procede.

Una Distribucin Binomial se aproxima a una Distribucin Normal si: n.p > 5 n.q > 5 p.q > 0,05 Ejemplo. igual a La 0,25. probabilidad Se nos de que, ante 15 una sintomatologa con dicha

determinada, un paciente padezca cncer de pulmn se sabe que es presentan pacientes sintomatologa. Cul es la probabilidad de que padezcan cncer de pulmn 4?
15 4 11 Pr = 0,25 . 0,75 4

Cul es la probabilidad de que lo padezcan 7?


15 7 Pr = . 0,75 7 0, 25
8

Cul es la probabilidad de que lo padezcan al menos 13?


15 Pr = 13 0,2513 0,75
2

15 15 15 + 14 0,2514 0,75 1 + 0,75 15 0, 25

3.2 Distribucin de Poisson Constituye un caso particular de la ley binomial para aquellas situaciones en las que b probabilidad de aparicin de un fenmeno sea muy pequea. Es, por lo tanto, la ley adecuada para sucesos 19

raros. La siguen variables discretas que slo toman valores enteros, no negativos, con probabilidad no nula, pero s pequea. Cuanto menor sea la probabilidad de aparicin de un suceso, y mayor sea el nmero de individuos al que hemos de aplicarla, ms exacta ser la sustitucin de la ley binomial por la de Poisson. La distribucin de Poisson est ligada a un experimento que tiene como finalidad cuantificar el nmero d individuos por unidad de tiempo, volumen, superficie, que presentan un determinado carcter. Son distribuciones de Poisson: De cada 2000 partos, un recin nacido presenta una malformacin cardiaca. Cul es la probabilidad de que en 2000 partos aparezcan 3 malformaciones cardiacas?. El nmero de granulocitos por mm 3 es de 2. Qu probabilidad hay de que aparezcan 4 - granulodtospormm3? El nmero de accidentes nucleares graves en una central nuclear es de 1 cada 30 s. Cul es la probabilidad de que ocurran 3 cada 30 meses?. - Media aritmtica (m) n.p = (Lamda) - Desviacin tpica () = n. p.q = - Varianza = 3.3 Distribucin normal o de Gauss Es la distribucin que siguen la mayora de las variables biolgicas. Cualquier variable cuantitativa puede ser estudiada en principio, de acuerdo con la ley de Gauss. Caractersticas: Tiene forma de campana. Es asinttica respecto al eje de abscisas: va de - a + . Es simtrica respecto a la media aritmtica. Es unimodal. 20

La media coincide con la moda y con la mediana. Es la distribucin de las variables cuantitativas continuas. Se define por la media y por la desviacin tpica. El rea total encerrada por la curva de Gauss es igual a 1 (100%).

Importancia de la distribucin Normal: Cuando una variable se distribuye, normalmente: - El 68% de los valores estn comprendidos entre x - El 95% de los valores estn comprendidos entre x 2 El 99% de los valores estn comprendidos entre x 2,6

Estos valores 95% y 99% que ahora describen la muestra, ms adelante, en la parte analtica, van ser los que nos fijen las seguridades del 95% y del 99%; y por tanto las probabiIidades de error p < 0,05 y p < 0,01. Caso prctico de la distribucin normal Imaginemos que hemos realizado un experimento midiendo las pulsaciones por minuto a 1000 pacientes (m = 80 p/m =10p/m). 1. Entre que valores de pulsaciones se encontrarn el 95% de nuestros pacientes? 21

m +/ - 2 -----> 95% de nuestros pacientes 80 +/ - 2.10 -----> 95%; (60 -100) -----> 950 pacientes Nota: A partir de estos datos podramos exigir el clculo de aquellos pacientes que tuvieran pulsaciones comprendidas entre los valores ms diversos, por ej. entre 68y 107 p/m. Bastara con hallar la integral de la ecuacin y aplicar los lmites 68 y 107 para obtener la probabilidad de encontrar individuos entre estas cifras, probabilidad que multiplicada por n (1000 individuos) nos dara el nmero buscado. Para evitar estos clculos habra que tabular la curva de Gauss (pero esto es algo que no se puede hacer sin ms, porque la curva de Gauss depende de la media y de la desviacin tpica de los datos con los que estemos trabajando, y cada experimento tendr unos valores distintos). Hay una tabla, denominada Distribucin Normal Tipificada, a la que se puede acceder mediante una transformacin de los datos, o lo que es lo mismo, mediante una tipificacin. La tipificacin consiste en:
X = xi x
_

La curva de Gauss tipificada tiene de media 0 y de Desviacin Tpica 1, y tiene todas las propiedades de la curva de Gauss. 2. (Volviendo a nuestro ejemplo) Cuntos individuos presentarn pulsaciones superiores a 110 p/m? Para poder calcular lo que nos piden, hay que tipificar este valor.

22

X =

110 80 =3 10

En la tabla, para x = 3, se obtiene un rea S = 0,4987. Pero es el rea comprendida entre el eje y x =3. Nosotros necesitamos, no esta superficie, sino la cola de la curva. Pacientes con ms de 110 p/m, equivale en la curva falsa a pacientes con ms de 3; es decir, la cola. Como el rea de la mitad de la curva es 0,5, el rea de la cola ser: 0,5 - 0,4987 = 0,0013. Por consiguiente el nmero de pacientes con pulsaciones superiores a 110 ser 1000.0,0013=1.3

3. Cuntos pacientes presentarn pulsaciones comprendidas entre 65 y 96p/m? Tipificamos estos dos valores:
65 80 1,5 10 96 80 1,6 10

23

Se busca en la tabla 1,6 y 1,5 (porque la tabla es simtrica). X =1,5 X=1,6 S = 0,4332 S = 0,4452

Por tanto la probabilidad pedida ser: 0,4332 + 0,4452= 0.8784 y el nmero total de pacientes con pulsaciones comprendidas entre 65 y 110 p/m ser: 1000.0,8784 = 878,4 individuos.

4.

PROBABILIDADES Espacio muestral: Es el conjunto de todos los resultados posibles de un experimento.

= {1}, {2}, {3}, {4}, {5}, {6}


Cada elemento del Espacio Muestral se denomina suceso elemental; y cada suceso formado por ms de un elemento se denomina suceso compuesto. Imaginemos tirar una moneda muchas veces, obtenemos una secuencia aleatoria, que se caracteriza por la falta absoluta de un patrn de prediccin. Al ir aumentando la secuencia, la proporcin de pruebas con un resultado particular va variando cada vez menos y tiende a un valor lmite. Esta proporcin se llama. probabilidad de un suceso en particular. Clsicamente se ha definido la probabilidad como el cociente entre los casas favorables y los casos posibles o totales. Por ello podemos decir que la probabilidad (Pr) de un acontecimiento A es igual;

24

Pr ( A) =

n de veces que ocurre A n total de veces que puede ocurrir A

La probabilidad se puede expresar como fraccin decimal o como porcentaje y siempre que s exprese como fraccin decimal debe estar comprendida dentro del orden de 0 a 1.. De forma que: Pr (no ocurra el acontecimiento A) = 1 - Pr (ocurra el acontecimiento A). Ejemplo: En una epidemia de intoxicacin alimentaria, entre las 158 personas ie asistieron al banquete ocurrieron 99 casos de enfermedad. La probabilidad de que una persona, seleccionada al azar, est enferma es:
99 = 0,63 63% 158

Pr (enfermedad ) 0

4.1 Probabilidad condicional En el ejemplo anterior de intoxicacin alimentaria, la probabilidad de que una persona sana enferme era de 0,63. Sin embargo, la probabilidad de enfermar tendra que modificarse si se conociera qu alimento ingiri la persona. Esto introduce la nocin de probabilidad condicional o, dicho de otro manera, la probabilidad de que ocurra A, dado que ha ocurrido B. La probabilidad condicional para A dado que ha sucedido B se define de esta manera:
n de veces que ocurren simultneamente A y B n de veces que ocurre B

Pr ( A / B ) =

Ejemplo: Suponiendo que el alimento responsable es el pavo, la probabilidad de enfermar para las personas que comieron pavo en el banquete, expresada como probabilidad condicional, es:
n personas que comieron pavo y enfermaron 97 = = 0,73 73% n personas que comieron pavo 133

Pr( En : / pavo) =

25

Si los acontecimientos A y B son independientes, es decir, si la aparicin de uno no influye en la aparicin del otro, entonces: Pr (A/B) = Pr (A) Una aplicacin importante de las probabilidades condicionadas, de inters en la investigacin mdica, en especial en la teora probabilstica del diagnstico, es lo que se conoce con el nombre de TEOREMA DE BAYES.

P ( Ai / B ) =

P ( Ai ) . P ( B / Ai ) P( Ai ). P( B / Ai )

Ejemplo de aplicacin de este teorema: En un servicio clnico de digestivo se sabe que, de cada 1900 pacientes con dolor de estmago: 700 presentan gastritis 200 presentan lcera 100 presentan cncer

En el anlisis de la sintomatologa general gstrica; se ha comprobado que las probabilidades de presentar vmitos son: En la gastritis 0,3 En la lcera 0,6 En el cncer 0,9

Llega un nuevo paciente con dolor de estmago que, adems, presenta vmitos Queremos calcular la probabilidad de que tenga cncer gstrico. Llamamos: A1 al suceso gastritis A2 al suceso lcera A3 al suceso cncer 26

y llamamos B al suceso vmitos


Probabilidad de gastritis P(A1) = 700/1000 = 0,7 Probabilidad de que presentando gastritis, tenga vmitos. P(B/A 1) = 0,3 Probabilidad de lcera P(A2) = 200/1000 = 0,2 Probabilidad de que presentando lcera, tenga vmitos. P(B/A 2) = 0,6 Probabilidad de cncer P(A3) = 100/1000 = 0,1 Probabilidad de que presentando cncer, tenga vmitos. P(B/A 3) = 0,9

Calculemos por medio del Teorema de Bayes, la probabilidad de que, teniendo vmitos, presenta cncer; es decir: P ( A3 ) P ( B / A3 ) P( A1 ) P ( B / A1 ) + P ( A2 ) P ( B / A2 ) + P( A3 ) P ( B / A3 )
0,1 . 0,9 = 0,21 0,7 . 0,3 + 0,2 . 0,7 + 0,1 . 0,9

P ( A3 / B ) =

4.2 Acontecimientos complejos Los acontecimientos expresados como combinaciones especficas, por ejemplo. A y B, y los acontecimientos expresados como alternativas especificadas, de la ndole de A o B, se llaman acontecimientos complejos. Pr(A y B) = Pr(A B) = Probabilidad de que A y B ocurran simultneamente Si A y B no pueden ocurrir simultneamente, se dice que se excluyen mutuamente y Pr(A y B)= 0. Pr (A o B) = Pr (A B) = Prob. de que ocurra A, de que ocurra B, o de que ocurran ambos.

27

Dicho de otra manera, Pr(A o B) expresa la probabilidad de que ocurra por lo menos uno de los sucesos (al menos uno). Hay dos reglas para combinar probabilidades que permiten tratar ms facilidad los acontecimientos complejos. Son las reglas de la multiplicacin y la regla de la suma. 4.3 Regla de la multiplicacin La regla de la multiplicacin dice lo siguiente: Pr (A y B) = Pr (A/B) x Pr(B) De modo que cuando A y B son independientes: Pr (A y B) = Pr (A) x Pr (B) Ejemplo: Se sabe que ocurren efectos secundarios-con un frmaco en l 10% de los pacientes que lo reciben. Un mdico tiene dos enfermos a quienes administra el medicamento. Cul es la probabilidad de que ambos pacientes presenten efectos colaterales? 1 Qu nos piden?: Pr (A y B) o Pr(A o B). 2 Acordarnos de la frmula. 3 Ir sustituyendo en la frmula los datos con los que contemos, e ir solucionando los problemas que nos encontremos. En este caso Pr(AyB) = Pr(A/B) x Pr(B). La Pr(B) la conocemos (0,1), y como nos encontramos Pr(A/B), debemos ver si estos sucesos son independientes o no lo son. Si la aparicin de efectos colaterales en un paciente modifica la probabilidad de que aparezcan efectos colaterales en el otro, los sucesos no sern independientes, por el contrario si la aparicin de efectos colaterales en un paciente es independiente de la aparicin de efectos colaterales en el otro, los sucesos sern independiente.

28

Una vez aclarada esta duda: Pr(ambos presenten efectos secundarios)= 0,1 x 0,1 = 0,01 1% 4.4 Regla de la suma La regla de la suma dice lo siguiente: Pr (A o B) = Pr (A) + Pr (B) Pr (A y B) y cuando A y B se excluyen mutuamente: Pr (A o B) = Pr (A) + Pr (B) Ejemplo: Cul es la probabilidad de que al menos uno de los pacientes anteriores presente efectos colaterales? 1 Qu nos piden?: Pr (A y B) o Pr (A o B). 2 Acordamos de la frmula. 3 Ir sustituyendo en la frmula los datos con los que contemos, e ir solucionando los problemas que nos encontremos. En este caso, la Pr(AoB) = Pr(A) + Pr(B) - Pr(AyB). La Pr(A) y la Pr(B) las conocemos, y como nos encontramos Pr(AyB), lo que nos debemos preguntar en esta ocasin es silos sucesos se excluyen o no mutuamente. Una vez aclarada esta cuestin, la Pr de que al menos uno de los pacientes presente efectos colaterales es igual a 0,1 + 0,1 - 0,01 = 0,19 19% Ejercicios de Aplicacin a) Si 66% de los pacientes sobreviven a su primer infarto de miocardio y 33% de stos an vive diez anos despus, Qu proporcin morir en los diez aos siguientes al primer ataque entre todos los pacientes que tienen un infarto de miocardio?: Respuesta. En este caso debe aplicarse la regla de adicin, para el manejo de probabilidades porque ambos fenmenos son mutuamente 29

excluyentes. Si N es el numero total de pacientes que tienen un infarto de miocardio, la probabilidad de que. la muerte ocurra dentro de los diez aos siguientes al primer infarto de miocardio puede calcularse por la expresin.
( (1 / 3) ( N ) + ( ( 2 / 3) ( 2 / 3) ( N ) = 7/9 N

El primer trmino del numerador es el nmero de defunciones debido a un primer ataque y el segundo trmino es el nmero de defunciones en los dos tercios de los pacientes que sobrevivieron al primer ataque. b. Cules son las probabilidades de que un individuo viva cinco horas si ya ha sobrevivido la primera hora? Respuesta La probabilidad de que un individuo que ha sobrevivido una hora despus del principio de un infarto del miocardio logre sobrevivir hasta el final de la quinta hora es de 0.50 (50%). La probabilidad puede calcularse por medio de la formula:
Porcentaje que sobrevive 5 horas = Porcentaje que sobrevive una hora

Posibilida d de sobrevivir hasta el final de la qu int a hora

30 0 0.50 (50 %) 60

c) Si la probabilidad de nacer con la enfermedad A es 0.10 y con la 8 es 0.50, Cul es la probabilidad de nacer con cualquiera de las dos, pero no con ambas? Respuesta Para dos fenmenos individuales que no son mutuamente excluyentes, la probabilidad de que ocurra uno, pero no ambos

30

simultneamente,

se

calcula

determinando

la

suma

de

las

probabilidades de los dos fenmenos menos el producto de las probabilidades de ambos. La frmula para este tipo de probabilidad puede expresarse as:
PAoB = PA + PB ( PA PB )

donde PAoB es la probabilidad de que ocurra uno de los fenmenos pero no ambos simultneamente. P A es la probabilidad de A, y. P B es la del B. Sustituyendo en la frmula por los datos dados (P A =0.10; PB = 0.50), la expresin final es:
PAoB = 0.10 +0.50 - (0.10) (0.50)

= 0.60 - 0.05 = 0.55 d) Si 40% de los pacientes que tienen alguna enfermedad sobreviven un ao y de los sobrevivientes 30% muere antes de cinco aos, Cul es la probabilidad de que un paciente sobreviva a dicha enfermedad ms de cinco aos (expresada en decimales)?. Respuesta La probabilidad de presentacin de un suceso particular (por ejemplo, supervivencia despus de cinco aos) depende de la probabilidad de la presentacin de otro suceso (por ejemplo de sobrevivir un ao). A tal probabilidad combinada se le llama probabilidad condicional y obedece a la ley de probabilidad multiplicativa la probabilidad de que ocurran dos fenmenos es el producto de las dos probabilidades individuales. La probabilidad de que un paciente sobrevive cinco aos es el producto de la probabilidad de sobrevivir el primer ao (0.40) y la de sobrevivir entre el primero y el quinto (1.00 - 0.30 = 0.70). Por tanto, la probabilidad de sobrevivir cinco aos es 0.40 x 0.70 = 028.

31

e) Cul es la pendiente de la lnea correspondiente a la siguiente ecuacin de regresin lineal?. y = 2.1 + 0.3x Respuesta. La formula para la lnea de regresin lineal que describe la relacin entre la variable independiente x y la dependiente y es y = a + bx, donde a es la ordenada al origen (el punto en que la lnea de regresin cruza el eje y cuando x = 0) y b es la pendiente de la lnea (el promedio cambia en y por unidad de cambio en x). e) La figura de la pgina ** representa la supervivencia de una cohorte de pacientes con infarto agudo de miorcario media horas despus del inicio de los sntomas. Cules son las probabilidades de que un individuo viva cinco horas si ya ha sobrevivido la primera hora? Respuesta Con base en los datos que pueden obtenerse de la grfica, la probabilidad de que un individuo que ha sobrevivido una hora despus del principio de un infarto del miocardio logre sobrevivir hasta el final de l quinta hora es de 0.50 (o 50%). La probabilidad puede calcularse por medio de la frmula:
Porcentaje que sobrevive 5 horas = Porcentaje que sobrevive una hora

Posibilidad de sobrevivir hasta el final de la qu int a hora

30 = 0.,50 (0.50%) 60

Nota: Hasta aqu, corresponde a Estadstica descriptiva A partir de aqu corresponde a Estadstica Analtica o Inferencial la estadstica analtica estudia muestras procedentes de poblaciones inaccesibles para, a partir de su estudio inferir

32

propiedades sobre la poblacin en general. Es fundamental para la medicina. 5. ESTIMACION DE PARMETROS Con la estimacin de parmetros se realizan afirmaciones de una poblacin, a partir de los resultados obtenidos de la muestra. Es decir, estimar significa calcular el valor de un determinado parmetro poblacional (media, varianza,...) a partir de un determinado valor muestral (estadstico muestral), ya que el valor del parmetro poblacional es desconocido. La estimacin puede asumir dos formas: 1. Estimacin puntual. 2. Estimacin por intervalo. La primera comprende el clculo de una sola cifra numrica, esto es, de un nico estadstico para evaluar el parmetro desconocido en la poblacin. El problema de las estimaciones puntuales es que no aportan datos respecto a la precisin de la estimacin. Por ello es ms til la estimacin de un parmetro por intervalos, ya que entonces se indican los lmites de valores dentro de los cuales el parmetro poblacional tiene una probabilidad determinada de estar. Los intervalos de estimacin se denominan intervalos de confianza, y los lmites inferior y superior de dicho intervalo, reciben el nombre de lmites de confianza. En funcin del tipo de variable con el que estemos trabajando, el parmetro estimado y el clculo de intervalo de confianza es diferente: Si trabajamos con variables cuantitativas, estimaremos medias. Si trabajamos con variables cualitativas, estimaremos proporciones. 6. ESTIMACION DE MEDIAS

33

Al estimar una media, pretendamos determinar cul es la media de la poblacin (inaccesible para nosotros), a partir del estudio de una muestra de dicha poblacin (que si es accesible para nosotros); es decir queremos calcular un parmetro poblacional (la media poblacional), a partir de un parmetro muestral (la media muestral). Calcular un intervalo de confianza alrededor de la media de una muestra, establece os do lmites de valores entre los que se encontrar el verdadero parmetro poblacional y tambin la probabilidad de que as sea. Cmo se calcula el intervalo de confianza en una estimacin de medias? Cmo estimamos la Hemoglobina Media de una poblacin?. Es decir, Cul es la Hemoglobina Media de una poblacin? Muestra 1. Muestra 2. Muestra 3. Muestra 4. Muestra 5. 100 pacientes m=12,5 100 pacientes m = 10 100 pacientes m =11 100 pacientes m = 7 100 pacientes m =14

=4 =6 =5 =2 =3

De una poblacin podemos extraer infinitas muestras (cada una tendr su media y su desviacin tpica). Si en la poblacin de origen, la variable que estamos estudiando sigue una distribucin normal, en cada una de las muestras obtenidas, tambin seguir una distribucin normal, y adems el conjunto de todas las medias muestrales obtenidas tambin se distribuirn normalmente. Su media (la media de todas esas medias) es la Media PobIacional, y su desviacin tpica se denomina Error Tpico o Error Estndar de la Media (Sm). El Error Estndar de la Media se calcula a partir de resultados de la muestra.
Sm =

34

= Desviacin tpica de la muestra. = tamao de la muestra

Entre x 2Sm estn comprendidos el 95% de los valores de la poblacin

Entre x 2,6Sm estn comprendidos el 99% de los valores de la poblacin

Ejemplo: Quiero estimar la Hemoglobina Media de una poblacin; para ello obtengo una muestra de 100 individuos. La Hb media de dicha muestra = 11 La

=4
4 = 0,4 100 Inferencia

Sm =

La media poblacional estar comprendida entre 11 0,4, en 68 de cada 100 veces que yo repita el experimento. La media poblacional estar comprendida entre 11 2.0,4: 11 0,8 en 95 de cada 100 veces que yo repita el experimento. La media poblacional estar comprendida entre 11 2,6.0,4: 11 1,04 en 99 de cada 100 veces que yo repita el experimento. Dicho de otro modo: En mi muestra, he obtenido una Hemoglobina media de 11, si repitisemos infinitas veces el experimento, la media poblacional estara comprendida entre 10,2 y 11,8 (11 0,8 = x 2S rn) un 95% de las veces. La media no estara comprendida entre esos valores en un 5% de las veces.

35

Hb media = 11 11 0,8 = x 2Sm . 95% de las veces . 5% . Hb media = 11 . ( x 2Sm) = (10,2 -11,8) . p < 0,05 .

Media muestral obtenida. Intervalo de Confianza Seguridad. Probabilidad d error. Media muestral obtenida. Intervalo de confianza para el 95% Probabilidad de error

ANTE UN VALOR OBTENIDO EN UN EXPERIMENTO UNICO, PUEDO ESTIMAR ESE VALOR Ef. LA POBLCION, CON UNA SEGURIDAD CONOCIDA, Y UNA PROBABILIDAD DE ERROR CONOCIDA. Ejemplo: La frecuencia cardiaca media en fumadores es de 70 4 ppm, p < 0,05 Significa: 1. La frecuencia cardiaca de los fumadores estar comprendida entre 66 y 74 ppm en ms del 95% de los casos. 2. La frecuencia cardiaca media de los fumadores no estar comprendida entre 66 y 74 ppm en menos del 5% de los casos. 3. La probabilidad de que la frecuencia cardiaca media est comprendida entre 66 y 74 ppm es algo mayor deI 95%. 4. La probabilidad de que la frecuencia cardiaca media no est comprendida entre 66 y 74 ppm es menor del 5%. 5. Con una seguridad deI 95% la frecuencia cardiaca media estar comprendida entre 66 y 74 ppm. 6. Con una probabilidad de equivocarme < del 5%, la frecuencia cardiaca media estar comprendida entre 66 y 74 ppm. 7. La frecuencia cardiaca de los fumadores est comprendida entre 66 y 74 ppm; p < 0.05. 7. DISTRIBUCION T DE STUDNT o distribucin t de Student-Fisher. Caractersticas: Es una distribucin de variables continuas.

36

Es parecida a la Normal, solo que ms achatada. Los valores del rea bajo la curva (95%, 99%) hay que calculados. Cuando el tamao de una t de Student va aumentando, la curva se va pareciendo cada vez ms a una Normal. En general, cuando n una t de Student se puede aproximar a una Normal.

30,

La estimacin de una media, cuando se trate de una muestra menor de 30 individuos, tendr en poblacin como margen de tolerancia o intervalo de confianza : x t Sm donde x = valor de la media muestral t = valor de Student obtenido de la tabla para el grado de seguridad deseado. Sm = El error estndar de la media. Nota: al buscar en la tabla el valor t de Student, debe hacerse no con n individuos sino con n-1. Grados de libertad. Este concepto significa nmero de trminos realmente libres y se representa por g.l o por v. En la distribucin de la t de Student trabajaremos con n -1 grados de libertad. La distribucin t de Student se usa:

37

Para estimar medias poblacionales a partir de muestras pequeas (n< 30). Para comparar dos medias a partir de muestras independientes. Para estudiar a relacin entre una variable cuantitativa y otra cualitativa (2 categoras). Para-compara dos medias a partir de muestras apareadas.

EJEMPLO 1. Quiero calcular el colesterol medio de los madrileos. Muestra n =100 Colesterol medio (x) 130 = 4 1. n > 30: sigue una distribucin Normal o de Gauss. 2. x = 130
4 = 0,4 100

3. S m =

4. El colesterol medio en Madrid es 130 Z . S m .


Z : Valores de la normal

130 1,96.0,4 = 130 0,784 130 2,580,4 = 130 1,04 EJEMPLO 2.

p < 0,05 seguridad 95% p < 0,01 seguridad 99%

Quiero calcular el colesterol medio de los madrileos. Muestra n = 20 Colesterol medio (x) = 130 = 4 1. n < 30: sigue una distribucin t de Student. 2. x = 130 3., S m =
4 = 0,92 100

38

4. El colesterol medio en Madrid es 130 t v . S m


tv :

Valores de la t de Student. p < 0,05 segundad 95% p < 0,01 seguridad 99%

130 2,09.0,92 = 130 1,92 130 2,86.0,92 = 130 2,63

Los valores de 2,09 y 2,86 que figuran en las expresiones anteriores, se han obtenido de la tabla de la t de Student para n-1 grados de libertad, es decir para 19 grados de libertad. 8. ESTIMACION DE UNA PROPORCION PORCENTAJE). S
Porcentaje muestral n < 100? No p prximo a 0 a 100? No DISTRIBUCION NORMAL S DISTRIBUCIN BINOMIAL DISTRIBUCIN BINOMIAL (p)

Pasos a seguir en la estimacin de una proporcin: 1. Determinar si vamos a trabajar segn una distribucin Binomial o segn una distribucin Normal. 2. Conocer el parmetro muestral (proporcin muestral: p 0,2, p = 0,4 ..)3. Calcular el error estndar del porcentaje (S P).
p (1 p ) n

Sp =

4. Calcular el porcentaje poblacional con un intervalo de confianza (95%, 99%..) y con una probabilidad conocida de equivocarnos ( p < 0.05, p < 0.01)

39

Ejercicio de aplicacin En mi rea de salud, la proporcin de hipertensos es de 0.2(20%). cul es la proporcin de HTA en Lima? Muestra n = 250 Proporcin (p) = 0.2 1. n > 200. Distribucin normal 2. Proporcin (p) = 0.2 3. Calcular el error estndar del porcentaje
Sp = 0.2 . 0.8 = 0.025 250

4. En Lima la proporcin de hipertensos es de: 0.2 2 .0.025 = 0.2 0.05; con una seguridad del 95% y una p < 0.05 0.2 2 .6.0.025 = 0.2 0.065; una p < 0.05 9. RELACION ENTRE VARIABLES CUALITATIVAS (ASOCIAON) Test de CHI-CUADRADO o de lndependencia/Contingencia Con esta prueba de significacin estadstica se analiza la posible relacin entre variables cualitativas. Por ejemplo: El color del cabello y el color de los ojos, el nivel socioeconmico y el padecimiento de Esquizofrenia, el sexo y aprobar o no un determinado examen. El test estadstico que nos permite estudiar la existencia o no de asociacin entre dos variables cualitativas es el test o la distribucin Chicuadrado. Dicha distribucin nos permite realizar: - Pruebas de Independencia: El sexo y el coeficiente intelectual son independientes?. 40 con una seguridad del 99% y

Pruebas de Homogeneidad: El cncer rectal y el cncer gstrico tienen distinta supervivencia?.

CONCEPTO: Una vez planteada la Hiptesis Nula y la Alternativa, el test de Chicuadrado tratar de rechazar la Hiptesis Nula (Ho), con un nivel de significacin determinado, comparando las diferencias existentes entre las frecuencias observadas y las que se esperaran encontrar, bajo la suposicin de que Ho fuese cierta. Posteriormente, se estudia si esas diferencias podran ser o no explicadas por el azar, para un nivel de significacin determinado. Los resultados obtenidos se recogen en una tabla llamada de contingencia. Ejemplo: Obtenemos estos datos (ficticios): En un examen, aprobaron 40 de 60 chicas (66,6%) y 10 de 30 chicos (33,3%). Queremos saber si en TODA la poblacin de opositores, el sexo influye en el resultado del examen. Existe asociacin entre el sexo y el hecho de aprobar un examen? PASO 1: Plasmamos estos datos en una tabla 2x2; es decir, construimos una tabla que se denomina Tabla de valores experimentales (observados). TABLA DE VALORES EXPERIMENTALES OBSERVADOS Aprobados Si 40 10 50 no 20 20 40

Chicas Chicos

60 30 90

41

PASO 2: Establecemos el contraste de Hiptesis, y fijamos el nivel de significacin con el que vamos a trabajar ( = 0,05 por ejemplo) HO: El sexo rio influye en el resultado (el sexo no est relacionado con aprobar un examen) No hay diferencias significativas en el porcentaje de aprobados en funcin del sexo. H1: El sexo s influye en el resultado (el sexo est relacionado con aprobar un examen) Hay diferencias significativas en el porcentaje de aprobados en funcin del sexo. PASO 3: Calculamos la tabla de valores tericos o esperados; bajo la suposicin de que Ho es cierta. Si no tuviramos en cuenta el sexo de los opositores: Cul seria la .probabilidad de aprobar el examen? 50/90, y de forma anloga, Cul sera la probabilidad de no aprobar el examen? 40/90. Estas probabilidades son las que hemos de aplicar a la totalidad de chicas y chicos que se presentan al examen. TABLA DE VALORES TEORICOS o ESPERADOS Aprobados Chicas Chicos Si (50/90).60=33 (50/90).30=17 50 No (40/90).60=27 40/90).30=13 40 60 30 90

PASO 4: Calculamos el 2 Experimental =


2 Exp. =

( E T ) 2 (O E ) 2 = T E

(Valores Experimentales Valores Teri cos) 2 Valores Teri cos

42

2 Exp. =

(Valores Observados Valores Esperados ) 2 Valores Esperados

El 2

Exp.

tambin se puede calcular por la siguiente frmula, pero slo

cuando estemos en tablas 2x2:


N . ( a.d b.c) 2 ( a + b) . (c + d ) . (b + c) . ( a + c )

2 Exp. =

Utilizando la primera frmula:


2 Exp. =
(40 33) 2 ( 20 27) 2 (10 17) 2 ( 20 13) 2 + + + = 9,95 33 27 17 13

PASO 5: Buscamos en la Tabla de la distribucin 2 de Pearson, el valor 2 Terico. El valor 2 Terico nos dice cul es el valor mximo que el azar puede explicar, es decir, cul es la mxima diferencia explicable por el azar, para el nivel de significacin elegido, y con los grados de libertad de la distribucin. Para acudir a la Tabla de Chi-cuadrado, debemos calcular previamente los grados de libertad de la tabla de contingencia con la que estamos trabajando. Dichos grados de libertad (gl) se calculan multiplicando: (n de filas-1).(n de columnas-1). Tablas 2 x 2 gl = 1 Tablas 3 x 2 gl = 2 Tablas 4 x 6 gl = Tablas 4 x 4 gl = PASO 6: REGLA DE DECISION: Si 2 Experimental Si 2 Experimental

2 Terico: Rechazamos Ho p < 0,0


2 Terico: No podemos rechazar Ho para el

nivel de significacin establecido.

43

En nuestro caso: A) p < 0,05 Si 2 Experimental = 9,95


2 Ter.: = 3,84

Rechazo Ho ----> El sexo influye en el resultado; p < 0,05 B) p < 0,01


2 Exp. = 9,95 2 Teor. =

Se puede rechazar Ho con el nivel de significacin deI 1%? C) p < 0,001


2 Exp. = 9,95 2 Teor. =

Se puede rechazar Ho con el nivel de significacin del 0,1%? 10. PRUEBA EXACTA DE FISHER. En una tabla de 2x2, una casulla terica (o una frecuencia esperada) menor de 5 individuos (25%), hara preciso rechazar la prueba, en tal caso, la solucin de este problema se resuelve por medio de la PRUEBA EXACTA DE FISNER, la cual permite detectar la posible asociacin existente entre dos variables cualitativas en los casos de tablas con escasa muestra.

EJEMPLO DE APLICACION DE LA PRUEBA EXACTA DE FISHER En un estudio realizado en un centro de trabajo, se quiere relacionar la funcin respiratoria (medida a travs de FEV 1) y el hbito de fumar (fuma, no fuma). Se seleccion de forma aleatoria una muestra de 42 empleados y los resultados se muestran en la siguiente tabla:

44

Estn relacionados el hbito de fumar con la funcin respiratoria? FEV1 . Fuma No fuma Anormal 4 1 5 Normal 16 21 37 20 22 42

Las hiptesis a contrastar, serian: Ho: El hbito de fumar no est relacionado con la funcin respiratoria. Es decir, ambas variables son independientes. H1: El hbito de fumar est relacionado con la funcin respiratoria; ambas variables no son independientes. RESPUESTA Para contrastar la Hiptesis de independencia entre ambas variables, 10 calculamos la tabla de valores esperados. FEV1 Fuma No fuma Anormal 2,38 2,62 5 Normal 17,62 19,38 37 20 22 42

Puesto que encontramos en 2 casillas un valor inferior a 5, utilizamos el test o la Prueba exacta de Fisher. a) De la tabla original calculamos:

} = 20! , 22! . 5! . 37! = Pr {1, 4, 16, 21 ) 0,1253 1 ! . 4! . 16! . 21 ! 42!


b) Formamos una tabla ms extrema: FEV1 Fuma No fuma Anormal 5 0 Normal 15 22 20 22 45

5 y calculamos:

37

42

Pr { 0, 5, 15, 22} =

20! , 22! . 5! . 37! = 0,0182 0! . 5! . 15! . 22! 42!

c) Al no existir valores ms extremos, el valor exacto de p ser: p = 0,1253 + 0,01 82 = 0,1435 Al ser p >0,05, no podemos rechazarla hiptesis de independencia.

46

Vous aimerez peut-être aussi