Vous êtes sur la page 1sur 43

Cuando se contrasta la hiptesis

de que dos medias poblacionales


son iguales, utilizamos el rbol
para contrastes, de modo que en
l encontramos las diferentes
alternativas, dependiendo de las
suposiciones
de
normalidad,
homocedasticidad, independencia
etc.

Ho: A=B
NORMALES

Muestras
pequeas

Varianzas
desconocidas

Iguales

Distintas

Test Tc

T de Welch

Muestras grandes

Varianzas
conocidas

Varianzas
conocidas
o desconocidas

Test Z

Test Z

Este test permite contrastes de igualdad


de medias para el caso particular que
dispongamos en el estudio de varios
grupos experimentales (ms de dos).

Ho : 1 2 3 ... i
Ha : no todas iguales

riesgo tipo I

0,05

0,1426

0,2649

10

0,4013

15

0,5367

0,8

Riesgo tipo I

grupos comparaciones

0,6

0,4

21

0,6594

28

0,7622

0,2

36

0,8422

10

45

0,9006

11

55

0,9405

12

66

0,9661

13

78

0,9817

14

91

0,9906

15

105

0,9954

0 5

15 25 35 45

55 65 75 85 95 105 115 125

comparaciones

El anlisis de la varianza (ANOVA) nos permite:

Ho : 1 2 3
Ha : no todas iguales

5%

El anlisis de la varianza de un conjunto de muestras permite


contrastar la hiptesis nula todas las medias poblacionales de
las que provienen las muestras son iguales contra la hiptesis
alternativa no todas las medias son iguales con un nivel de
significacin prefijado.

Conviene sealar que el ANOVA es una prueba a nivel


global. Nos habla de si existen o no diferencias a nivel
global entre las medias pero no nos dice entre cuales se
produce la diferencia.
Slo cuando se obtenga una significacin de la prueba
global se proceder por distintos mtodos a comprobar
que medias son las responsables de la significacin.

Consideraciones generales
El nombre se debe al mtodo empleado y no al objetivo
conseguido.
El mtodo se basa en la pregunta: habr mayor variacin
entre las medias de los distintos grupos que entre los
grupos mismos?.
Una diferencia entre las medias ha de ser grande con
respecto a la variabilidad inherente a los grupos para que
sea significativa.

Como todas las tcnicas estadsticas la actual est basada en


ciertas hiptesis que han de verificarse para que la tcnica sea
vlida.

Ahora las condiciones son que se disponga de r muestras aleatorias


independientes, normales de medias y varianzas desconocidas
pero iguales (homoscedsticas).

Ai N ( i , )

1
X11
X12
X13
.
X1j
X1n1
n1
x1.

2
X21
X22

3
X 31
X 32

i
Xi1
Xi2

r
Xr1
Xr2

X2j
X2n2

X 3j
X3n3

Xij
Xini

Xrj
Xrnr

n2

n3

x2.

x3.

ni

nr

xi.

xr.

i = n de grupos ; j = ndice de observacin en cada grupo


ni = n de observaciones en la muestra i ;
N = Tamao global
= Media global
xi. = media del grupo i
;

Ejemplo base: La tabla siguiente ofrece datos de las


disminuciones de actividad de r = 4 grupos de ratas tras
la aplicacin de 4 sustancias distintas. Las 24 ratas
totales eran homogneas y fueron divididas al azar en 4
grupos de 6 ratas.

64
72
68
77
56
95
x1.= 72

78
91
97
82
85
77
x2.= 85

75
93
78
71
63
76
x3.= 76

55
66
49
64
70
68
x4. =62

La idea base :

La variabilidad total de los datos (Q) es suma de dos


variabilidades: la variabilidad de los datos dentro de
cada muestra (que se debe slo al azar (QD) y la
variabilidad existente entre las muestras (que se debe al
azar y si la hiptesis alternativa es cierta a que las
muestras provienen de poblaciones con
distintas
medias(QE).

ni

Q ( xij x )

i 1 j 1

ni

QD ( x ij xi. )

i 1 j 1

QE ni ( xi. x )
i 1

XB

XA

X
XC

XB

X AX

XC

Datos reales:
A
1,53
1,61
3,75
2,89
3,26

Total
Med ia

13,04
2,61

ESTIMU LAN TE (t rat ami ent o)


B
C
D
3,15
3,89
8,18
3,96
3,68
5,64
3,59
5,7
7,36
1,89
5,62
5,33
1,45
5,79
8,82
1,56
5,33
5,26
7,1
15,60
2,60

30,01
5,00

47,69
6,81

E
5,86
5,46
5,69
6,49
7,81
9,03
7,49
8,98
56,81
7,10

163,15
5,10

Insulina liberada

media global

Qu observamos?
Variabilidad en las observaciones
Por qu?.
Es debida al azar.???
o a que no todos los tratamientos
producen el mismo efecto???
Tratamiento

ni

Q ( xij x )

i 1 j 1

ni

QD ( x ij xi. )

i 1 j 1

QE ni ( xi. x )
i 1

Datos reales: Diagrama de


dispersin
Insulina liberada

media global

yij y
y

Tratamiento

ni

Q ( xij x )

i 1 j 1

ni

QD ( x ij xi. )

i 1 j 1

QE ni ( xi. x )
i 1

Datos reales: Diagrama de


dispersin
Insulina liberada

media global

eij yij yi

yij y
y

Tratamiento

ni

Q ( xij x )

i 1 j 1

ni

QD ( x ij xi. )

i 1 j 1

QE ni ( xi. x )
i 1

Insulina liberada

media global

eij dentro yij yi

yij y
eij entre yi y

Tratamiento

Para obtener variabilidades promedio es


preciso dividir cada suma de cuadrados por sus
grados de libertad, obtenindose as la
varianza dentro y la varianza entre.

2
QD
SD
N r

2 QE
SE
r 1

Estadstico de contraste
Fexp

2
S Entre
2
S Dentro

El cociente entre la variabilidad entre y la variabilidad dentro, una


vez que se han hecho comparables, sigue una distribucin F de
Snedecor con r-1 y N-r grados de libertad.

Regla de decisin
Fexp

2
S Entre
2
S Dentro

Al comparar la variabilidad entre y la variabilidad dentro:


Rechazaremos la hiptesis nula siempre que la variabilidad entre sea
grande, pero utilizando como patrn de comparacin la variabilidad
dentro.
Es decir, aceptaremos un efecto de los tratamientos siempre que estos
produzcan mayores diferencias en las unidades experimentales que las que
habra sin la aplicacin de los mismos.

Regla de decisin
Si el valor experimental Fexp supera el valor crtico de una F de Snedecor con r-1 y N-r
g.l. al nivel de significacin elegido, se rechazar la Ho de igualdad de medias
poblacionales y se aceptar la alternativa de que al menos algn par de medias es
diferente.

Contraste Unilateral
superior

(r 1;

r)

Si Fexp. Rechazo Ho

p valor Rechazo Ho

1 2 i r

H0 :
2
D

2
E

Ha :
2
E

S
S

2
E
2
D

2
D

notodaslas medias soniguales


0.05

F r 1, N r

Como se trata de un contraste unilateral superior:


RC :

RA:

F / F F

( r 1, N r )

F / F F

( r 1, N r )

Por ello la hiptesis

es equivalente a

1 2 ...... r

H0 :
2
E

2
D

y la alternativa Ha: No todas son iguales es equivalente a


2
E

2
D

y as el test de comparacin de medias se convierte en un test unilateral


superior.

Presentacin de resultados
Cuadro del ANOVA

La informacin completa del anlisis se resume en forma de tabla,


denominada tabla del ANOVA y resume toda la informacin necesaria
para realizar el correspondiente contraste
ANOVA

Fuente

Sumas de
Cuadrados
r

Entre

QEntre ni xi x
i 1

ni

Residual

QDentro xij xi
i 1 j 1
ni

QTotal xij x
r

Total

i 1 j 1

g.l.

Estimadores

r-1

2
S Entre
QEntre / r 1

Fexp.

Fexp
2

N-r
N-1

2
S Dentro
QDentro N r

2
SEntre
2
SDentro

Existen frmulas abreviadas equivalentes que


facilitan enormemente los clculos y evitan errores
de redondeo:
Q

QE

x ij2 C

T i .2
C
ni

i
S ie n d o C

x ij

Ejemplo base: La tabla siguiente ofrece datos de las


disminuciones de actividad de r = 4 grupos de ratas tras
la aplicacin de 4 sustancias distintas. Las 24 ratas
totales eran homogneas y fueron divididas al azar en 4
grupos de 6 ratas.

64
72
68
77
56
95
x1.= 72

78
91
97
82
85
77
x2.= 85

75
93
78
71
63
76
x3.= 76

55
66
49
64
70
68
x4. =62

QE

64
72
68
77
56
95
n 1=6
T 1. = 432

78
91
97
82
85
77
n 2=6
T 2. =510

75
93
78
71
63
76
n3 =6
T 3. = 456

55
66
49
64
70
68
n 4 =6
T 4. = 372

x ij2 C

T i .2
C
ni

i
S ie n d o C

x ij

N=24

ij

1770

ij

T1.2
31104
n1

T2.2
43350
n2

T3.2
34656
n3

17702
C
130537,5
24

Ti.2
QE C 1636,5
i ni

T4.2
23064
n4

Ti.2
n 132274
i
i

Q = 642++682 -C= 3654,5


QD =3654,5-1636,5 = 2118

El objetivo es comparar si todos los tratamientos


tienen igual efecto o no:
Ho : 1 2 3 4

Ha : no todas iguales
Q

QD

QE

3654, 5 2018, 0 1636, 5

QD
2018, 0
2

SD

100,9
N r
20
QE 1636,5
2

SE

545,5
r 1
3
SE2
F 2 5, 41
F5%(3,20) 3,10
SD

F1%(3,20) 5,85

Generalmente los resultados se expresan en forma


de tabla de la forma:
Fuente
variaci
n
Entre

Suma de
cuadrados

Grados
libertad

Estimadores

F experim

r-1=3
Ti2.
QE
C 1636,5
i ni

Q
SE2 E 545, 5
r 1

SE2
F 2 5, 41*
S D

Dentro

QD Q QE = 2118

N-r =20

Q
SD2 D 100, 9
Nr

Total

Q 3654,5

N-1= 23

Importante!!
EL ANOVA es una prueba de significacin a nivel global
Nos dice si hay diferencias, pero no donde estn las diferencias
(es decir que par(es) de medias es (son) diferente(s))

Necesitamos realizar contrastes tras el ANOVA para


encontrar dichas diferencias
(es decir, para encontrar las causas de la significacin)

Contrastes tras el ANOVA


Sin control riesgo tipo I:..LSD

Tamaos iguales: TUKEY


Todas las comparaciones
Tamaos distintos: BONFERRONI
Con control riesgo tipo I

Comparar con un control: DUNNET

(test de la diferencia significativa mnima)

a) Hiptesis estadstica:
H 0 :

Ha:

i j

( i , j ; i, j 1, ..., r)

b) Nivel de significacin (usuales) 0,05 y 0,01


c) Estadgrafo de Contraste, :
xi x j
t N r
1 1
2
sD
ni n j

d) Regin crtica =

t / t t ; N r

e) Regin de aceptacin =

t / t ; N r t t ; N r

Si n j n i n i, j; (i, j 1, 2, ...r )
t

Si

exp

xi x j
1 1
sD2
n n

tN r ,

Rechazo H0
Cte=C

X i X j tN r , * C Re chazo H0

Llamando LSD

t , N r * C

Por tanto, la cantidad LSD es la mnima diferencia que tenemos que encontrar
entre las medias muestrales de dos tratamientos (niveles del factor) Para
concluir que las medias son diferentes en sus respectivas poblaciones.

No es ms que una t de

Student (corregida ya que utilizamos un mejor estimador


de la nica varianza poblacional) de modo que al realizar muchas

comparaciones se incrementa el riesgo tipo I.

' K

Se elige k= r (nmero de grupos a comparar), de forma que se


rechaza H0 para cada comparacin si texp Tukey N r , k
El test de Tukey exige que todos los grupos tengan el mismo
tamao muestral. Se consigue un 0.05
H 0 : i j (i , j ; i, j 1, ..., r)
Ha: i j
b) Nivel de significacin (usuales) 0,05 y 0,01
c) Estadgrafo de Contraste:

xi x j
1 1
s
n n
2
D

N r , K

K r

Se elige k= r(r-1)/2 (nmero de todas las comparaciones por


parejas), de forma que se rechaza H0 para cada comparacin si

texp tBonferroni (N r ,k ). Consigue un

0 .0 5

H 0 : i j (i , j ; i, j 1, ..., r)
Ha: i j
b) Nivel de significacin (usuales) 0,05 y 0,01
c) Estadgrafo de Contraste:

xi x j
1 1
2
sD
ni n j

t N r , K

K r r 1
2

Si las unicas comparaciones con sentido son los de los


diferentes tratamientos con el control. Se elige k=(r-1)
(numero de grupos menos uno).
Se rechaza la H0 si texp > tDunnett (N r, k ).
Es conveniente que todos los grupos tengan el mismo
tamao muestra.

Relacin penalizaciones

Vous aimerez peut-être aussi