Vous êtes sur la page 1sur 10

Herramienta para Anlisis de Datos:

ANOVA:Anlisisdevarianzadeunsolofactor

Problema ejemplo:

Suponga que usted sea dueo de un restaurante mexicano y que ofrezca una salsa especial
que acompaa las enchiladas. Usted cuenta con clientes regulares que vienen todos los
das. La mayora de sus clientes son estudiantes, obreros o unos empleados de oficina.
Algunos de ellos casi siempre piden la salsa especial, pero usted tiene la impresin de que
a los estudiantes y a los obreros les gusta ms esta salsa que a los empleados. Basndose
en 10 das representativos para cada grupo, existe en este caso alguna relacin
significativa?

Nmerodevecesquelosclientes
pidenlasalsaespecial
Da Estudiantes Empleados Obreros
1 25 15 25
2 10 18 29
3 14 13 28
4 14 15 27
5 20 14 25
6 27 9 28
7 19 9 29
8 22 10 27
9 19 11 26
10 14 13 28

Observaciones:
LafuncinAnlisisdeVarianzadeunsolofactorrealizaunanlisisdevarianzasencillo,quesometea
pruebalahiptesissegnlacuallasmediasdevariasmuestrassoniguales.Generalmente,elanlisisde
varianza,esunprocedimientoestadsticoqueseutilizaparadeterminarsilasmediasdedosomsmuestras
fueronextradasdelamismapoblacin.LafuncindeANOVAdeunsolofactorlepidequeproveela
siguienteinformacin.

InputRange:Rangodeentrada.Escribalareferenciacorrespondientealrangode
datosdelahojadeclculoquedeseeanalizar.Elrangodeentradadebercontenerdoso
msrangosadyacentesorganizadosencolumnas(comosevearriba)ofilas.Sielrango
deentradacontienettulosdefilaodecolumna,deberseleccionarlacasillade
verificacin.

OutputRange:Rangodesalida.Escribalareferenciacorrespondientealacelda
superiorizquierdadelrangoenelcualdeseaqueaparezcalosresultados.

Parautilizarlasherramientasdeanlisis,seleccioneDataAnalysisdelmendeTools.
Dentro de la
opcin de herramienta de anlisis, escoja "ANOVA: Single Factor". En seguida, registre
el Rango de entrada y el Rango de Salida, refirindose a la direccin de las celdas
requeridas. Cuando utilize una herramienta de anlisis, Excel crea una tabla de
resultados. Si usted incluye ttulos en el rango de entrada, Excel los utiliza para los datos
de la tabla de salida. El resultado de la tabla de los datos del ejemplo, lo puede encontrar
abajo.

Anova:Deunsolofactor
Resumen
Grupos Cuenta Suma Promedio Varianza
Estudiantes 10 184 18.4 29.16
Empleados 10 127 12.7 8.678
Obreros 10 272 27.2 2.178

ANOVA
Origende Sumade Grados Promedio F Prob. Valor
Variaciones Cuadrados Libertad Cuadrados Crtico
Entre 1067.27 2 533.6 40.01 8.42E 3.354
Grupos 09
Dentrode 360.1 27 13.34
losGrupos
Total 1427.37 29

ElresultadodeunaANOVAledaelvalorestadsticodela"F."Enestecasoelvalordela"F"ola
variacinentrelostresgruposes40.01.Parasabersilosresultadosenesteejemplosonsignificativos(o
sea,silaprobabilidad"P"tieneunvalormenora0.05),elvalordela"F"necesitaseralmenos3.354(o
sea,elvalorcrticoparaF).Entonces,comoelvalordenuestra"F"esde40.01yesmuchomayorqueel
valorcrticoparaF(3.354)estamossegurosquelosresultadosdenuestraspruebassonsignificativos.En
otraspalabras,sexisteunarelacinsignificativaentrecuantoquecadagrupopidelasalsaespecial.La
probabilidaddemuestraaqunivellosresultadossonestadsticamentesignificativos.

Problema para el estudiante

Imagine que la compaa Tortillas Familiares, S.A. haya lanzado una nueva marca de
tostaditas que vienen con nuevos colores. Basndose de una encuesta que la compaa
condujo enfocndose a los colores de la tostadita, la textura y los sabores, tenemos unos
datos de las opiniones de diferentes clientes acerca de nuestro producto. Hemos tenido
algunas discusiones que indican que las opiniones de los colores de las tostaditas
dependen de las diferentes edades de los clientes. Los resultados de las encuestas se
dividieron entre diferentes rangos de edades. Los resultados estn tabulados a una escala
de 100 puntos (el punto ms alto, significa que le gustan ms las tostaditas). Basndose
en estos resultados, existe alguna diferencia estadstica entre las opiniones de las
tostaditas y la edad de los clientes?

Tostaditas de nuevos colores


Encuesta: Resultados por Edad
Informante < 20 21-40 > 40
1 89 85 64
2 95 67 66
3 94 90 68
4 81 73 63
5 82 83 59
6 86 73 75
7 87 86 80
8 92 61 60
9 90 89 59
10 93 75 73

Anova:Deunsolofactor
Resumen
Grupos Cuenta Suma Promedio Varianza
<20aos 10 889 88.9 23.6556
2140aos 10 782 78.2 96.8444
>40aos 10 667 66.7 52.4556

ANOVA
Origende Sumade Grados Promedio F Prob. Valor
Variaciones Cuadrados Libertad Cuadrados Crtico
Entre 2465.26 2 1232.63 21.38 2.72E 3.354
Grupos 06
Dentrode 1556.6 27 57.65
losGrupos
Total 4021.86 29

Ntese:Parasersignificativo,elvalordeFtienequesermayorde3.35yelvalordeFobservadoeneste
casollegaaser21.38.Comoresultado,elANOVAindicaquesexisteunadiferenciasignificativaentre
lostresgruposencuantoasuopininsobrelastostaditasdenuevoscolores.
Herramienta para Anlisis de Datos:
ANOVA:Anlisisdevarianzadedosfactoresconunasolamuestraporgrupo

Problema ejemplo:

Suponga que usted haya experimentado con levadura para una receta de panes dulces.
Parece ser que la cantidad de azcar y la temperatura del agua afectan el tamao de los
panes. Basndose en los siguientes datos, usted realiza un anlisis de varianza para
averiguar lo que es significativo de estas recetas.

Levadura:Tamaodelospanes
dulces
Agua Agua Agua
Fra Tibia Caliente
Poco 75 87 60
Azcar
Azcar 74 82 55
Normal
Mucho 70 79 53
Azcar

Observaciones:
Estafuncinpermiterealizarunanlisisdevarianzadedosfactoresconunasolamuestraporgrupo.En
general,elanlisisdevarianzaesunprocedimientoestadsticoqueseutilizaparadeterminarsilasmedias
dedosomsmuestrashansidoextradasdepoblacionesconlamismamedia.LafuncindeANOVA:dos
factoresconunasolamuestraporgrupolepidequeproveelasiguienteinformacin.

InputRange:Rangodeentrada.Escribalareferenciacorrespondientealrangode
datosdelahojadeclculoquedeseeanalizar.Elrangodeentradadebercontenerdoso
msrangosadyacentesorganizadosencolumnas(comosevearriba)ofilas.Sielrango
deentradacontienettulosdefilaodecolumna,deberseleccionarlacasillade
verificacin.

OutputRange:Rangodesalida.Escribalareferenciacorrespondientealacelda
superiorizquierdadelrangoenelcualdeseaqueaparezcanlosresultados.

Parautilizarlasherramientasdeanlisis,seleccioneDataAnalysisdelmendeTools.Dentrodelacajade
herramientadeanlisis,escoja"ANOVA:TwofactorWithoutReplication."Enseguida,registreelRango
deentradayelRangodeSalida,refirindosealadireccindelasceldasrequeridas.Cuandoutilizeuna
herramientadeanlisis,Excelcreaunatabladeresultados.Siustedincluyettulosenelrangodeentrada,
Excellosutilizaparalosdatosdelatabladesalida.Elresultadodelatabladelosdatosdelejemplo,lo
puedeencontrarabajo.

Anova:Dosfactoresconunasolamuestra
Resumen Cuenta Suma Promedio Varianza
Poco 3 222 74 183
Azcar
Azucar 3 211 70.33 192.33
Normal
Mucho 3 202 67.33 174.33
Azcar

Agua 3 219 73 7
Fra
Agua 3 248 82.67 16.33
Tibia
Agua 3 168 56 13
Caliente

ANOVA
Origende Sumade Grados Promedio F Prob. Valor
Variaciones Cuadrados Libertad Cuadrados Crtico
Filas 66.89 2 33.44 23.15 0.0063 6.94
Columnas 1093.56 2 546.78 378.53 2.7E 6.94
05
Error 5.78 4 1.44

Total 1166.22 8

ElresultadodelANOVA(Anlisisdevarianza)indicaelvalorestadsticodela"F."Enestecasoelvalor
dela"F"porlasfilas(cantidaddeazcar)es23.15.Parasabersiestosresultadossonsignificativos(osea,
silaprobabilidad"P"tieneunvalormenora0.05),elvalordela"F"observadonecesitaseralmenos6.94
(osea,elvalorcrticodelaF).Entonces,comoelvalorde"F"observadoesde23.15yesmuchomayor
queelvalorcrticodelaF(6.94),estamossegurosquelosresultadosdenuestraspruebassonsignificativas.
Elvalordela"F"paralascolumnas(temperaturadelagua)esiguala378.53.Estoestambinsignificativo,
porqueelvalorde"F"crticoessolamente6.94.Enotraspalabras,existeunarelacinsignificativaenla
cantidaddeazcar,latemperaturadelaguayeltamaodelospanesdulces.Laprobabilidadmuestraaqu
nivellosresultadossonestadsticamentesignificativos.

Problema para el estudiante:

Imagine que la compaa Tortillas Familiares, S.A. haya analizado el nmero de clientes
que entra a la tienda principal. Cada hora, ellos han contado el nmero promedio de
clientes que entra a la tienda. Estos nmeros estn resumidos por hora y por trimestre.
Existe alguna relacin significativa en el nmero de clientes que entra a la tienda por
medio de las variables que son la hora y el trimestre del ao?
Promedio de clientes en la tienda
Hora Trim 1 Trim 2 Trim 3 Trim 4
8:00AM 7 4 5 9
9:00AM 10 7 8 20
10:00AM 25 15 17 35
11:00AM 50 20 25 67
12:00PM 75 35 40 85
1:00PM 79 40 46 103
2:00PM 74 43 49 96
3:00PM 68 38 38 85
4:00PM 52 34 38 80
5:00PM 54 30 35 86
6:00PM 45 25 30 85
7:00PM 69 27 35 75
8:00PM 50 20 33 70
9:00PM 40 17 29 62

Anova:Dosfactoresconunasolamuestra
Resumen Cuenta Suma Promedio Varianza
8:00AM 4 25 6.25 4.916
9:00AM 4 45 23 35.58
10:00AM 4 92 23 82.67
11:00AM 4 162 40.5 484.33
12:00PM 4 235 58.75 622.92
1:00PM 4 268 67 870
2:00PM 4 262 65.5 593.67
3:00PM 4 229 57.25 542.25
4:00PM 4 204 51 433.33
5:00PM 4 205 51.25 643.58
6:00PM 4 185 46.25 739.58
7:00PM 4 206 51.5 577
8:00PM 4 173 43.25 468.92
9:00PM 4 148 37 366

Trim1 14 698 49.85 534.29
Trim2 14 355 25.35 146.55
Trim3 14 428 30.57 169.49
Trim4 14 958 68.42 792.73

ANOVA
Origende Sumade Grados Promedio F Prob. Valor
Variaciones Cuadrados Libertad Cuadrados Crtico
Filas 18179.58 13 1398.42 17.149 3.19E 1.98
12
Columnas 16214.05 3 5404.68 66.28 2.27E 2.84
15
Error 3180.19 39 81.54

Total 37573.83 8

Ntese:ElvalordeFsignificativoparalasfilas(i.e.,lahoradelda)nosindicaquedeacuerdoconlahora
delda,hayunadiferenciasignificativaenelnmerodeclientesquepasaporlatienda.Elvalor
significativoparalascolumnas(i.e.,trimestre)nosindicaquedeacuerdoconeltrimestredelao,hayuna
diferenciasignificativaenelnmerodeclientesquepasaporlatienda.

Ejemplo 1
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la hipertensin
arterial, comparndola con la de una dieta sin sal. Para ello se seleccionan al azar 25
hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le
suministra ningn tratamiento, al segundo una dieta con un contenido pobre en sal,
al tercero una dieta sin sal, al cuarto el frmaco a una dosis determinada y al quinto
el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25 sujetos al
finalizar los tratamientos son:

Grupo
1 2 3 4 5
180 172 163 158 147
173 158 170 146 152
175 167 158 160 143
182 160 162 171 155
181 175 170 155 160

La tabla de anova es:

Fuente de GL SS MS F
variacin
Tratamiento 4 2010,64 502,66 11,24
Error 20 894,4 44,72
Total 24 2905,04

Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hiptesis nula y concluimos que


los resultados de los tratamientos son diferentes.

Ejemplo
Se quiere probar la eficacia de un somnfero estudiando posibles diferencias de la
misma por el sexo de los sujetos. Se eligen al azar dos grupos de insomnes varones
y otros dos de mujeres y tanto para los hombres como para las mujeres se
suministra a un grupo el somnfero y a otro un placebo y se mide, en minutos, el
tiempo que tardan en dormirse.

Los resultados son:

Placebo Somnfero
30 35
50 32
45 30 Hombre
47 25
38 30
50 42
35 30
46 15 Mujer
25 18
32 23

Se trata de un anova de dos factores fijos. Llamamos primer factor a la droga que
tiene dos niveles: placebo y somnfero. El segundo factor es el sexo tambin con 2
niveles: hombres y mujeres. El tamao de las muestras es n=5.

La tabla de anova es:

Fuente de GL SS MS
variacin
Somnfero 1 696,2 696,2
Sexo 1 105,8 105,8
Interaccin 1 0,2 0,2
Error 16 1197,674,85
Total 19 1999,8

Se empieza contrastando la interaccin: f = 0,2/74,85 = 0,0026 que como es menor


que F0,05(1,16)=4,49 no se rechaza la hiptesis nula de que no existe interaccin.

A continuacin se contrastan los factores: para el somnfero f = 696,2/74,85 = 9,3


que es mayor que 4,49 por lo tanto existe efecto del somnfero y para el sexo f =
105,8/74,85 = 1,41 que como es menor que 4,49 no existe diferencias entre los
sexos.

La estimacin del efecto del somnfero ser la diferencia entre las medias de los que
lo toman y los que tomaron placebo, sin tener en cuenta el sexo, una vez que se ha
visto que no tiene efecto

Ejemplo 3
En el ensayo clnico de los analgsicos descrito anteriormente se encuentran los
siguientes resultados:

Placebo Analgsico <Analgsico


A B
35 20 22
40 35 42
60 50 30
50 40 35
50 30 22

La tabla de anova correspondiente:

Fuente de G.L. SS MS
variacin
Analgsico 2 748,8 374,4
(tratamiento)
Paciente (bloque) 4 767,6 191,9
Error 8 409,2 51,15
Total 14 1925,6

Los contrastes de hiptesis se hacen:

para el analgsico f=374,4/51,15=7,32 que como es mayor que F0,05(2,8)=4,46 existe


un efecto del tratamiento.

para los bloques f=191,9/51,15=3,75 que es menor que F0,05(4,8)=3,84 por tanto no
hay componente aadida por los pacientes.

Vous aimerez peut-être aussi