Vous êtes sur la page 1sur 14

BIOESTADSTICA AO DE LA UNIN NACIONAL FRENTE A LA CRISIS EXTERNA

TRABAJO ENCARGADO: INTERVALOS DE CONFIANZA


DOCENTE: SULLON LEON ALFREDO. ALUMNOS:

Cruz Crdova Roosvelt Guerrero Ramrez Jesusov Ronald Lalupu Sosa Karen Quiroga Purizaca Gustavo Quispe Orozco Darko Vizueta Mendoza Ivette
FACULTAD DE MEDICINA HUMANA UNIVERSIDAD NACIONAL DE PIURA

ANLISIS DE LA VARIANZA

1. INTRODUCCIN
En estadstica, el anlisis de varianza (o Anova: Analysis of variance) es una prueba que nos permite medir la variacin de las respuestas numricas como valores de evaluacin de diferentes variables nominales. Es un mtodo para comparar dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos: En primer lugar, y como se realizaran simultnea e independientemente varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada contraste se rechaza la H 0 si la t supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad . Si se realizan m contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn estadstico supere el valor )crtico es (1 - m, por lo tanto, la probabilidad de que alguno lo ) supere es 1 - (1 - m, que para valores m. Una primera solucin, prximos a 0 es aproximadamente igual a de denominada mtodo de Bonferroni, consiste en bajar el valor /m, aunque resulta un mtodo muy conservador., usando en su lugar de Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin embargo, para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas. Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930s y es algunas veces conocido como Anova de Fisher o analisis de varianza de Fisher, debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis. El anlisis de varianza sirve para comparar si los valores de un conjunto de datos numricos son significativamente distintos a los valores de otro o ms conjuntos de datos. El procedimiento para comparar estos valores est basado en la varianza global observada en los grupos de datos numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones.

2. VISIN GENERAL
Existen tres clases conceptuales de estos modelos: 1. El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir unicamente en sus medias. Asume que el experimentador ha considerado para el factor todos los posibles valores que ste puede tomar.

Ejemplo: Si el gnero del individuo es un factor, y el experimentador ha incluido tanto individuos masculinos como femeninos, el gnero es un factor fijo en el experimento. (Modelo 1) 2. El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias son restringidas por la jerarqua. En un factor se ha considerado tan slo una muestra de los posibles valores que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir sobre el nivel de aprendizaje y se ha considerado en el experimento slo tres de muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento. (Modelo 2) 3. El Modelo de efectos mixtos describen situaciones donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3) SUPUESTOS PREVIOS El Anlisis de la varianza parte (ANOVA) de algunos supuestos que han de cumplirse: La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas. La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal) SSTotal = SSError + SSFactores El nmero de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribucin chi-cuadrado describe la suma de cuadrados asociada. glTotal = glError + glFactores MODELO DE EFECTOS FIJOS Se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta slo a la media, permaneciendo la "variable respuesta" con una distribucin normal. MODELO DE EFECTOS ALEATORIOS Se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo ms simple es el de estimar la

media desconocida de una poblacin compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medicin. GRADOS DE LIBERTAD Por grados de libertad entendemos el nmero efectivo de observaciones que contribuyen a la suma de cuadrados en un ANOVA, es decir, el nmero total de observaciones menos el nmero de datos que sean combinacin lineal de otros. PRUEBAS DE SIGNIFICACIN El anlisis de varianza lleva a la realizacin de pruebas de significacin estadstica, usando la denominada distribucin F de Snedecor.

3. BASES DEL ANLISIS DE LA VARIANZA


Supnganse k muestras aleatorias independientes, de tamao n, extradas de una nica poblacin normal. A partir de ellas existen dos maneras independientes de estimar la varianza de la poblacin 2: 1) Una llamada varianza dentro de los grupos (ya que slo contribuye a ella la varianza dentro de las muestras), o varianza de error, o cuadrados medios del error, y habitualmente representada por MSE (Mean Square Error) o MSW (Mean Square Within) que se calcula como la media de las k varianzas muestrales (cada varianza muestral es un estimador centrado de 2 y la media de k estimadores centrados es tambin un estimador centrado y ms eficiente que todos ellos). MSE es un cociente: al numerador se le llama suma de cuadrados del error y se representa por SSE y al denominador grados de libertad por ser los trminos independientes de la suma de cuadrados. 2) Otra llamada varianza entre grupos (slo contribuye a ella la varianza entre las distintas muestras), o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada por MSA o MSB (Mean Square Between). Se calcula a partir de la varianza de las medias muestrales y es tambin un cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le representa por SSA) y al denominador (k-1) grados de libertad. MSA y MSE, estiman la varianza poblacional en la hiptesis de que las k muestras provengan de la misma poblacin. La distribucin muestral del cociente de dos estimaciones independientes de la varianza de una poblacin normal es una F con los grados de libertad correspondientes al numerador y denominador respectivamente, por lo tanto se puede contrastar dicha hiptesis usando esa distribucin. Si en base a este contraste se rechaza la hiptesis de que MSE y MSA estimen la misma varianza, se puede rechazar la hiptesis de que las k medias provengan de una misma poblacin. Aceptando que las muestras provengan de poblaciones con la misma varianza, este rechazo implica que las medias poblacionales son distintas, de modo que

con un nico contraste se contrasta la igualdad de k medias. Existe una tercera manera de estimar la varianza de la poblacin, aunque no es independiente de las anteriores. Si se consideran las kn observaciones como una nica muestra, su varianza muestral tambin es un estimador centrado de 2 s : Se suele representar por MST, se le denomina varianza total o cuadrados medios totales, es tambin un cociente y al numerador se le llama suma de cuadrados total y se representa por SST, y el denominador (kn -1) grados de libertad. Los resultados de un anova se suelen representar en una tabla como la siguiente:
Fuente de variacin Entre grupos Tratamient os Dentro Error Total G.L. SS MS F

k-1

SSA

SSA/(k-1)

MSA/MS E

(n1)k kn-1

SSE

SSE/k(n-1)

SST

Y el cociente F se usa para realizar el contraste de la hiptesis de medias iguales. La regin crtica para dicho contraste es F > F (k-1,(n-1)k) Algunas propiedades Es fcil ver en la tabla anterior que GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GL total No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad, llamada identidad o propiedad aditiva de la suma de cuadrados: SST = SSA + SSE El anlisis de la varianza se puede realizar con tamaos muestrales iguales o distintos, sin embargo es recomendable iguales tamaos por dos motivos: La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el tamao es igual. Igual tamao minimiza la probabilidad de error tipo II. 4. Modelos de anlisis de la varianza El anova permite distinguir dos modelos para la hiptesis alternativa: Modelo I o de efectos fijos en el que la H 1 supone que las k muestras son muestras de k poblaciones distintas y fijas.

Modelo II o de efectos aleatorios en el que se supone que las k muestras, se han seleccionado aleatoriamente de un conjunto de m>k poblaciones. Un ejemplo de modelo I de anova es que se asume que existen cinco poblaciones (sin tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han extrado las muestras. Un ejemplo de modelo II sera: un investigador est interesado en determinar el contenido, y sus variaciones, de grasas en las clulas hepticas de cobayas; toma del animalario 5 cobayas al azar y les realiza, a cada una, 3 biopsias hepticas. La manera ms sencilla de distinguir entre ambos modelos es pensar que, si se repitiera el estudio un tiempo despus, en un modelo I las muestras seran iguales (no los individuos que las forman) es decir corresponderan a la misma situacin, mientras que en un modelo II las muestras seran distintas. Aunque las asunciones iniciales y los propsitos de ambos modelos son diferentes, los clculos y las pruebas de significacin son los mismos y slo difieren en la interpretacin y en algunas pruebas de hiptesis suplementarias. Anlisis de la varianza de dos factores Es un diseo de anova que permite estudiar simultneamente los efectos de dos fuentes de variacin. En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no, diferencia en la evolucin segn el sexo. En un anova de dos vas se clasifica a los individuos de acuerdo a dos factores (o vas) para estudiar simultneamente sus efectos. En este ejemplo se haran cinco grupos de tratamiento para los hombres y otros cinco para las mujeres, en total diez grupos; en general, si el primer factor tiene a niveles y el segundo tiene b, se tendrn ab muestras o unidades experimentales, cada una con n individuos o repeticiones. Una observacin individual se representa como: El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo factor y el tercero la observacin dentro de la muestra. Los factores pueden ser ambos de efectos fijos (se habla entonces de modelo I), de efectos aleatorios (modelo II) o uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El modelo matemtico de este anlisis es:

modelo I modelo II modelo mixto donde m es la media global, a i o Ai el efecto del nivel i del 11 factor, j o Bj el efecto del nivel j del 2 factor y ijk las desviaciones aleatorias alrededor de las medias, que tambin se asume que estn normalmente distribuidas, son 2 independientes y tienen media 0 y varianza s .

A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo aade la de aditividad de los efectos de los factores. A los trminos (a b )ij, (AB)ij, (a B)ij, se les denomina interaccin entre ambos factores y representan el hecho de que el efecto de un determinado nivel de un factor sea diferente para cada nivel del otro factor. Para entender mejor este concepto de interaccin veamos un ejemplo sencillo sobre un anova de dos factores, cada uno con dos niveles: supngase un estudio para analizar el efecto de un somnfero teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos grupos de hombres y otros dos de mujeres. A un grupo de hombres y otro de mujeres se les suministra un placebo y a los otros grupos el somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse desde el suministro de la pldora. Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos niveles (hombre y mujer para el sexo y somnfero y placebo para el frmaco). Los dos tipos de resultados posibles se esquematizan en la figura

En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo tratado como en el grupo placebo (hay un efecto del sexo) y que los tratados con placebo tardan ms en dormirse que los tratados con somnfero en ambos sexos (hay un efecto del tratamiento). Ambos efectos son fcilmente observables. Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es distinto en ambos sexos y, simtricamente, es difcil cuantificar el efecto del sexo pues es distinto en ambos grupos de tratamiento. En este caso, se dice que existe interaccin.

Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los distintos niveles del otro, es decir, que las mujeres se durmieran antes con el somnfero y los hombres antes con el placebo. La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos: cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando estn por separado, por lo que, si en un determinado estudio se encuentra interaccin entre dos factores, no tiene sentido estimar los efectos de los factores por separado. A la interaccin positiva, es decir, cuando el efecto de los factores actuando juntos es mayor que la suma de efectos actuando por separado, en Biologa se le denomina sinergia o potenciacin y a la interaccin negativa inhibicin. En el ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del somnfero, o que el ser hombre lo potencia (segn el sexo que se tome como referencia). 4. Contrates de hiptesis en un anlisis de la varianza de dos factores Del mismo modo que se hizo en el anova de una va, para plantear los contrastes de hiptesis habr que calcular los valores esperados de los distintos cuadrados medios. Los resultados son: Modelo I

MS MSA

Valor esperado

MSB

MSAB MSE

Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como una F con los grados de libertad correspondientes y permiten contrastar, respectivamente, las hiptesis: no existe interaccin (MSAB/MSE)

no existe efecto del primer factor, es decir, diferencias entre niveles del primer factor (MSA/MSE)

no existe efecto del segundo factor (MSB/MSE)

Si se rechaza la primera hiptesis de no interaccin, no tiene sentido contrastar las siguientes. En este caso lo que est indicado es realizar un anlisis de una va entre las ab combinaciones de tratamientos para encontrar la mejor combinacin de los mismos.

5) EJERCICIOS
1.-CONTROL DE PESO CON TRES DIETAS DIFERENTES: Se seleccion aleatoriamente a 15 pacientes y se asign 5 a cada dieta. Despus de tres emanas se registr la prdida de peso, en libras. Al nivel de significancia 0.05. Puede concluirse que hay alguna diferencia entre las tres dietas? Dieta A 5 7 4 5 4 SOLUCIN: 1.-Hiptesis Ho: 1=2=3 H1: Los promedios de peso no son iguales 6 7 7 5 6 Dieta B 7 8 9 8 9 Dieta C

2.-Nivel de significancia: =0.05

3.-Grados de Libertad y Valor Crtico: = =0.05

Localizamos el valor crtico segn los grados de libertad en numerador y denominador: 3.89

4.- Clculos para tabla de ANOVA Comenzamos calculando los totales y los cuadrados de los totales divididos por el nmero de observaciones: Dieta A Suma /n 25 125 Dieta B 31 192.2 Dieta C 41 336.2 Total 97 653.4 627.27

/n

A continuacin calculamos los cuadrados de las observaciones y su total: Dieta A 25 49 16 25 16 131 Dieta B 36 49 49 25 36 195 Dieta C 49 64 81 64 81 339

665

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados: SC (total) = 665 - 627.27 = 37.73 SC (intra) = 665 653.4 = 11.6 SC (entre) = 653.4 627.27 = 26.13 Los cuadrados medios sern:

CM (entre) = 26.13/2 = 13.065 CM (intra) = 11.6/12 = 0.97 Por consiguiente el estadstico de contraste vale: F = 13,065/ 0.97 = 13.47 Interpretacin: 13.47>3.89 El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que si existe diferencia significativa entre las medias de peso para cada dieta

2.-Para el control de la Encefalopata Heptica, en un establecimiento de salud se ha seleccionado 20 pacientes, que padecen este mal, y se les subdividi en cuatro grupos, con la finalidad de disminuir su aspartato aminotransferasa y sospechando las causas u origen de esta enfermedad se aplic a cada grupo un tratamiento diferente para disminuir el indicador antes mencionado. Al final de la primera semana se observaron los siguientes valores. A un nivel de confianza del 95% Puede considerarse que los tres tratamientos producen resultados equivalentes? O por el contrario Hay algn tratamiento ms eficaz que los dems? Tratamiento 1 14 23 26 19 17 Tratamiento 2 19 19 23 20 25 Tratamiento 3 24 24 21 23 13 Tratamiento 4 25 15 21 19 15

SOLUCIN: 1.-Hiptesis Ho: 1=2=3= 4

H1: Los tratamientos no disminuyen la TGO

2.-Nivel de significancia: =0.05

3.-Grados de Libertad y Valor Crtico: (K-1) / (n-K) = (4-1) / (20-4) = 5/ 16 =0.05

Localizamos el valor crtico segn los grados de libertad en numerador y denominador: 3.24

4.- Clculos para tabla de ANOVA Comenzamos calculando los totales y los cuadrados de los totales divididos por el nmero de observaciones:

Tratamiento1 Tratamiento2 Tratamiento3 Tratamiento4 Total Suma 99 /n 1960.2 106 2247.2 105 2205 95 1805 405 8217. 2

/n 8201.25

A continuacin calculamos los cuadrados de las observaciones y su total: Tratamiento 1 196 529 676 361 289 2051 Tratamiento 2 361 361 529 400 625 2276 Tratamiento 3 576 576 441 529 169 2291 Tratamiento 4 625 225 441 361 225 1877

8495

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados: SC (total) = 8495 8201.25= 293.75 SC (intra) = 8495 8217.2= 277.8 SC (entre) = 8217.2 8201.25= 15.95 Los cuadrados medios sern: CM (entre) = 15.95/3 = 5.32 CM (intra) = 277.8/16 = 17.36 Por consiguiente el estadstico de contraste vale: F = 5.32/ 17.36= 0.3 Interpretacin: 0.3<3.24 El valor de la F terica con 3 y 16 grados de libertad, a un nivel de confianza del 95% es 3,24. Por consiguiente se acepta la hiptesis nula y se concluye que no existe diferencia significativa entre los tratamientos, ya que todos disminuyen significativamente la TGO

BIBLIOGRAFIA
Obtenido de "http://es.wikipedia.org/wiki/An%C3%A1lisis_de_la_varianza" V. Abraira, A. Prez Mtodos Multivariantes en Ed. Centro de Estudios Ramn Areces. 1996. de Bioestadstica. Vargas

http://www.monografias.com/trabajos7/anva/anva.shtml

Vous aimerez peut-être aussi