Vous êtes sur la page 1sur 16

SOCIOESTADSTICA

1. ANOVA de un factor (EJEMPLOS PRCTICOS):


a.- Proporcin explicada de la varianza b.- Anlisis Post-Hoc

Anova de un factor:
a) Proporcin explicada de la varianza (ltimas consideraciones)

Midiendo el efecto del factor: Proporcin explicada de la varianza


Nada ms sealar que eta al cuadrado (2) es una razn entre la suma de cuadrados intergrupo y la suma de cuadrados total.

2 =

Suma de cuadrados inter-grupo Suma de cuadrados total

Por tanto es una medida que nos sirve para determinar si el efecto es grande en trminos de la proporcin de la varianza que explica el factor. En otras palabras, la variacin inter-grupo es la variacin explicada por la manera como se han distribuidos los valores en funcin del factor.
Profesor: Osvaldo Blanco Socilogo

Anova de un factor:
b) Anlisis PostHoc.

Anlisis Post-Hoc de Tukey y Scheff


Vamos a ver 2 casos de anlisis Post-Hoc que pueden surgir:
Cuando se conforman diferentes grupos donde alguna(s) medias no se superponen. Cuando se conforman diferentes grupos donde alguna(s) medias s se superponen.

Es importante tener en cuenta esto porque -como ya veremos- tiene implicancias muy importantes en el anlisis y las conclusiones.
Para ello veamos dos ejemplos donde podamos entender a qu nos referimos con esta idea de superponen.
Profesor: Osvaldo Blanco Socilogo

1 Ejemplo: Medias grupales que NO se traslapan (superponen)

Ejemplo 1
Imaginemos que hemos realizado un estudio acerca de los distintos factores que explican la repitencia en 28 liceos municipales de la regin. A partir de encuestar a distintos actores del sistema educativo (alumnos, profesores, directores y apoderados) se les consulta acerca de cules seran segn su perspectiva- las razones de las repitencias de sus establecimientos. Las razones que explican las repitencias (factor) tienen las siguientes categoras (es decir, los siguientes grupos o niveles del factor):
Factores internos La repitencia se debe al contexto de pobreza de los alumnos. La repitencia se debe a que las familias de los alumnos estn mal constituidas y ello influye en el rendimiento escolar de sus hijos. La repitencia se debe a que los alumnos tienen graves problemas de abuso de drogas y alcohol. La repitencia es culpa de los profesores. La repitencia es culpa del sistema educativa, el cual es claramente excluyente.
Profesor: Osvaldo Blanco Socilogo

Factores externos

1 Ejemplo
Des criptives Promedio de repitentes por c urso 95% Conf idence Interval f or Mean Low er Bound Upper Bound 8.90 11.77 10.53 12.33 6.15 18.85 4.36 9.14 6.78 8.10 8.05 9.90 N pobrez a f amilias mal c ons tituidas droga, alcohol culpa de los prof esores culpa del sis tema educ ativo en su c onjunto Total 3 7 2 4 12 28 Mean 10.33 11.43 12.50 6.75 7.42 9.00 Std. Deviation .58 .98 .71 1.50 1.00 2.33 Std. Error .33 .37 .50 .75 .29 .44 Minimum 10 10 12 5 6 5 Max imum 11 13 13 8 9 13

La tabla de estadsticos descriptivos nos seala claramente que la pobreza, familias mal constituidas y consumo de drogas y alcohol tienen medias ms o menos parecidas entre s y, adems, desviaciones tpicas claramente diferenciadas del grupo conformado por las razones de culpa de los profesores y culpa del sistema educativo en su conjunto. Importante es entender que gracias a las desviaciones tpicas nos podemos hacer una idea respecto de su variabilidad intra-grupo.

Recordemos que las desviaciones tpicas son una medida de la dispersin de los datos respecto de la media. Si bien es cierto que no se pueden comparar entre s en tanto no se cuente con grupos con las mismas medias, tambin es cierto que son un buen indicador de la variacin que cada sujeto tiene respecto de su propio grupo (es decir, es un buen indicador de la variabilidad intra-grupo). Esto es as pese a que, de hecho, la variacin intra-grupo se calcula por medio de una estimacin de la varianza. En definitiva, las desviaciones tpicas son tiles para darnos una primera impresin de lo que podramos llamar como las dispersiones intra-grupo.
Profesor: Osvaldo Blanco Socilogo

1 Ejemplo
Tes t of Homogene ity of Variance s Promedio de repitentes por c urs o Levene Statistic 1.603

df 1 4

df 2 23

Sig. .207

Esta tabla nos permite evaluar si violamos o no el supuesto de la homogeneidad de las varianzas (homocedasticidad). Si la significacin nos dijiera que las varianzas son distintas (es decir, si el valor de Sig. fuese menor que un nivel de 0,05 que es el nivel trabajado por SPSS, pero podemos cambiarlo si queremos) todo el anlisis posterior sera en vano.
Profesor: Osvaldo Blanco Socilogo

1 Ejemplo
ANOV A Promedio de repitentes por c urso Sum of Squares 121.452 24.548 146.000 df 4 23 27 Mean Square 30.363 1.067 F 28.449 Sig. .000

Betw een Groups Within Groups Total

Recuerde que sta es la tabla del contraste de hiptesis de la Anova propiamente tal, por lo que Ud. debe comparar la significacin de la razn F (Sig.) con el nivel de significacin con el que trabaja (0,05; 0,01 o cualquier otro que Ud. decida). Adems, recuerde que la razn F es la divisin entre la suma de cuadrados inter-grupo (Between Groups) y la variacin Total (en este ejemplo: 121,452/146 = 30,363). Por lo tanto, F ser alto cuando ms alta sea la diferencia entre la suma de cuadrados inter-grupo y la suma de cuadrados total.
Profesor: Osvaldo Blanco Socilogo

Multiple Com parisons Dependent Variable: Promedio de repitentes por curs o Tukey HSD

1 Ejemplo
Se observa que las diferencias entre medias intergrupo son significativa cuando los grupos que se comparan son, por un lado, algn factor interno, mientras que por otro, un factor externo.

(I) f ac tores que ex plican la repitencia pobrez a

f amilias mal c ons tituidas

droga, alcohol

culpa de los prof esores

culpa del sis tema educ ativo en su c onjunto

(J) f actores que explican la repitencia f amilias mal c ons tituidas droga, alcohol culpa de los prof esores culpa del sis tema educ ativo en su c onjunto pobrez a droga, alcohol culpa de los prof esores culpa del sis tema educ ativo en su c onjunto pobrez a f amilias mal c ons tituidas culpa de los prof esores culpa del sis tema educ ativo en su c onjunto pobrez a f amilias mal c ons tituidas droga, alcohol culpa del sis tema educ ativo en su c onjunto pobrez a f amilias mal c ons tituidas droga, alcohol culpa de los prof esores

Mean Dif f erence (I-J) Std. Error -1.10 .71 -2.17 .94 3.58* .79 2.92* 1.10 -1.07 4.68* 4.01* 2.17 1.07 5.75* 5.08* -3.58* -4.68* -5.75* -.67 -2.92* -4.01* -5.08* .67 .67 .71 .83 .65 .49 .94 .83 .89 .79 .79 .65 .89 .60 .67 .49 .79 .60

Sig. .551 .182 .001 .002 .551 .698 .000 .000 .182 .698 .000 .000 .001 .000 .000 .796 .002 .000 .000 .796

95% Conf idence Interval Low er Bound Upper Bound -3.20 1.01 -4.95 .62 1.25 5.92 .95 -1.01 -3.52 2.76 2.56 -.62 -1.38 3.11 2.75 -5.92 -6.59 -8.39 -2.43 -4.89 -5.46 -7.42 -1.10 4.89 3.20 1.38 6.59 5.46 4.95 3.52 8.39 7.42 -1.25 -2.76 -3.11 1.10 -.95 -2.56 -2.75 2.43

*. The mean dif f erenc e is s ignif icant at the .05 level.

Esto nos sealara cierta tendencia a diferenciarse aquellas razones de la repitencia ligadas a factores relativos a su entrono sociocultural inmediato (pobreza, familias mal constituidas y problemas de drogas-alcohol) respecto de las razones ligadas a responsabilidad del sistema educativo (profesores y sistema educativo en su conjunto).
Profesor: Osvaldo Blanco Socilogo

1 Ejemplo
Prom ed io d e re piten te s p or cu rs o Tukey HSD
a,b

f ac tores que ex plican la repitencia culpa de los prof esores culpa del sis tema educativo en su c onjunto pobrez a f amilias mal c ons tituidas droga, alcohol Sig.

N 4 12 3 7 2

Subs et f or alpha = .05 1 2 6.75 7.42 10.33 11.43 12.50 .057

Significaciones para cada subconjunto. Simplemente deben entenderse como la significancia de la diferencia entre la media ms grande y la ms pequea en cada grupo. Como los grupos son homogneos las significaciones siempre son mayores que .

.897

Means f or groups in homogeneous s ubs ets are displayed. a. Uses Harmonic Mean Sample Size = 3.818. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Ty pe I error lev els are not guaranteed.

Se forman 2 subconjuntos donde ningn promedio de algn nivel de factor se superponen en ambos subconjuntos.

Es decir, hay diferencias claramente establecidas entre los dos factores internos a las unidades educativas (culpa de los profesores, culpa del sistema educativo en su conjunto) y los tres factores externos (pobreza, familias mal constituidas y consumo abusivo de drogas o alcohol).
Profesor: Osvaldo Blanco Socilogo

2 Ejemplo: Medias grupales que se traslapan (superponen)

Ejemplo 2
En un estudio llevado a cabo por un organismo internacional se procesan datos sobre los porcentajes de mujeres alfabetizadas en cada pas. Se decide por tomar como factor la regin continental, tomando a un conjunto de pases que sean de un mismo continente y confrontando la variable dependiente (porcentaje de mujeres alfabetizadas) segn el factor geogrfico. Para avanzar ms rpido, diremos que el contraste Anova nos result significativo y ahora procedemos a un anlisis nicamente Post-Hoc de Tuckey.
Profesor: Osvaldo Blanco Socilogo

Multiple Com parisons Dependent V ariable: Mujeres alfabetizadas (% ) Tukey HSD Mean Dif f erence (I-J) -6.50 30.63* 60.78* 26.40 12.21 6.50 37.13* 67.28* 32.90* 18.71 -30.63* -37.13* 30.14* -4.24 -18.42 -60.78* -67.28* -30.14* -34.38* -48.56* -26.40 -32.90* 4.24 34.38* -14.18 -12.21 -18.71 18.42 48.56* 14.18

(I) Regin econmic a OCDE

Europa Oriental

A sia / Pacf ic o

f ric a

Oriente Medio

A mric a Latina

(J) Regin ec onmic a Europa Oriental A sia / Pacf ic o f ric a Oriente Medio A mric a Latina OCDE A sia / Pacf ic o f ric a Oriente Medio A mric a Latina OCDE Europa Oriental f ric a Oriente Medio A mric a Latina OCDE Europa Oriental A sia / Pacf ic o Oriente Medio A mric a Latina OCDE Europa Oriental A sia / Pacf ic o f ric a A mric a Latina OCDE Europa Oriental A sia / Pacf ic o f ric a Oriente Medio

Std. Error 10.12 9.27 9.05 9.19 8.89 10.12 8.09 7.84 8.00 7.65 9.27 8.09 6.71 6.90 6.49 9.05 7.84 6.71 6.60 6.17 9.19 8.00 6.90 6.60 6.37 8.89 7.65 6.49 6.17 6.37

Sig. .987 .017 .000 .057 .742 .987 .000 .000 .001 .153 .017 .000 .000 .990 .062 .000 .000 .000 .000 .000 .057 .001 .990 .000 .238 .742 .153 .062 .000 .238

95% Conf idence Interval Low er Bound Upper Bound -36.05 23.05 3.55 57.72 34.35 87.21 -.45 53.24 -13.74 38.17 -23.05 36.05 13.49 60.77 44.39 90.17 9.53 56.26 -3.62 41.05 -57.72 -3.55 -60.77 -13.49 10.54 49.75 -24.39 15.91 -37.37 .54 -87.21 -34.35 -90.17 -44.39 -49.75 -10.54 -53.65 -15.12 -66.57 -30.55 -53.24 .45 -56.26 -9.53 -15.91 24.39 15.12 53.65 -32.79 4.42 -38.17 13.74 -41.05 3.62 -.54 37.37 30.55 66.57 -4.42 32.79

Claramente, el caso ms dramtico es el de frica, quien se diferencia negativamente de las dems regiones (ver signo).

Amrica latina se diferencia significativamente de frica. Ntese que en realidad los grupos siempre se diferenciarn de los dems, pero el punto es determinar si las diferencias entre los promedios grupales (variacin inter-grupo) es estadsticamente significativa.

IMPORTANTE: El asterisco * es el que nos seala si la diferencia es estadsticamente significativa, lo que se comprueba por la significacin (columna Sig.) que en este caso debe ser menor que 0,05 (ver nota debajo de la tabla)

*. The mean dif f erenc e is s ignif icant at the .05 level.

El nivel de significacin se puede cambiar Profesor: Osvaldo Blanco por medio de los controles de SPSS
Socilogo

Mujere s alfabe tizadas (%)

Ejemplo 2

Tukey HSD

a,b

Regin econmica f ric a A sia / Pacf ic o Oriente Medio A mric a Latina OCDE Europa Oriental Sig.

N 18 15 16 21 6 9

Subs et for alpha = .05 1 2 3 32.06 62.20 66.44 80.62 80.62 92.83 99.33 1.000 .196 .182

Means f or groups in homogeneous subsets are display ed. a. Uses Harmonic Mean Sample Siz e = 11.762. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.

El promedio de mujeres alfabetizadas en Amrica Latina se superpone, por una parte, con el subconjunto formado con Asia/Pacfico y Oriente Medio, as como, por otra parte, da forma a un tercer subconjunto con los pases europeos miembros de a OCDE y Europa oriental Esto no hace otra cosa que confirmar el cuadro anterior donde Amrica Latina se diferecia significativamente de frica, mientras que de las dems zonas geogrficas no. De esta forma, frica es la regin de ms bajo promedio de mujeres alfabetizadas en el mundo, muy por debajo de las dems. Importante es tambin detenerse a observar los totales de cada grupo (N). Por ejemplo, Amrica Latina cuenta con 21 pases, por lo que pueden existir valores extremos (bajos y altos) que afecten el valor del promedio. Los pases de la OCDE son slo 6, y esto tambin es importante a la hora de calcularse los promedios.
Profesor: Osvaldo Blanco Socilogo