Académique Documents
Professionnel Documents
Culture Documents
PRUEBAS NO PARAMÉTRICAS
Es posible que el estudiante al incluir datos en su base se haya encontrado con valores
categóricos, tanto ordinales como nominales, y se haya preguntado cómo se puede comparar
este tipo de valores. Pues bien, los datos nominales y ordinales también son susceptibles de
comparación y de búsqueda de relación a través de las denominadas pruebas no paramétricas.
Estas, como veremos más adelante, son un poco más fáciles de calcular manualmente que las
pruebas paramétricas.
Las pruebas no paramétricas se utilizan cuando no se cumple los criterios siempre mencionados
para las pruebas paramétricas: normalidad, homogeneidad y tipo de medida. La primera prueba
no paramétrica a estudiar es la prueba de correlación rho de Spearman. Esta sigue muchos de
los parámetros lógicos de la prueba de correlación de Pearson.
2 [ POLITÉCNICO GRANCOLOMBIANO]
PRUEBAS NO PARAMÉTRICAS DE CORRELACIÓN: RHO DE SPEARMAN
En la semana 5, vimos cómo calcular correlaciones cuando los valores seguían una serie de
condiciones de las pruebas paramétricas. Como se mencionaba anteriormente, es probable que
los datos puedan no resultar válidos para las pruebas escalares. La rho de Spearman es una
medida no paramétrica de correlación que funciona con datos a nivel ordinal. La rho de
Spearman, a diferencia de la prueba de correlación de Pearson, utiliza los rangos de los valores
en cuanto a las dos variables pareadas, más que la puntuación en sí misma. En este sentido, la
rho de Spearman compara la posición de cada persona en cuanto a una variable.
Coolican (2005, p.303) señala que el fundamento del coeficiente de correlación de Spearman es
que las diferencias entre los rangos serán pequeñas cuando exista una elevada correlación
positiva. Esto quiere decir que la diferencia entre el par de rangos de cada persona debería ser
bajo, o incluso de cero, en tanto exista una fuerte correlación.
6 ∑ 𝑑2
𝑟ℎ𝑜 = 1 −
𝑛(𝑛2 − 1)
6 𝑥 46
𝑟ℎ𝑜 = 1 −
7(72 − 1)
276
𝑟ℎ𝑜 = 1 −
336
𝑟ℎ𝑜 = 0,179
Ahora bien, se debe comparar este valor con los valores críticos para la rho de Spearman en la
tabla (anexa a este curso). Recuerde que el valor debe ser igual o mayor que el de la tabla para
que tenga significancia. Entonces para n = 7 datos, con un alfa de 0,05 y una prueba a dos colas,
el valor crítico de la tabla es de 0,786. Este valor está muy por encima del por nosotros
conseguido, por tanto no se puede afirmas la significancia de la prueba de correlación.
Es importante notar que el nivel de medida para este caso debe ser ordinal, que es lo que
caracteriza al análisis con el coeficiente de correlación de Spearman. La base debe quedarnos,
en sus valores, como sigue:
4 [ POLITÉCNICO GRANCOLOMBIANO]
Fuente. Elaboración propia
6 [ POLITÉCNICO GRANCOLOMBIANO]
Note que el cuadro debe decir Correlaciones no paramétrica y, al interior del mismo, Rho de
Spearman. También note que el valor de la correlación es el mismo al hallado de manera
manual.
Para ello hay que atender, de nuevo, a dos cosas. Lo señalado en rojo informa el valor de la
fuerza de la correlación. Recordemos que esta debe aproximarse a uno para decir que hay una
correlación. El mínimo exigido en estos casos es de 0,66. Aquí el valor de la fuerza de la relación
es inferior al valor antes señalado (0,66), por lo tanto sabemos de antemano que no hay
correlación. Lo segundo, señalado en amarillo, informa la significancia. Recordemos que el valor
esperado para decir que una prueba es o no significativa (y por tanto para rechazar la hipótesis
nula) es menor a 0,05 o al 5%. En este caso el valor señalado en amarillo está muy por encima
del 0,05, por lo cual sabemos que esta prueba no es significativa. A partir de lo anterior
podemos ejemplificar el reporte del resultado del cálculo del coeficiente de correlación de
Spearman para la relación de los rangos de dos variables. Recuerde que en este caso no se
encontró correlación y esa no correlación resultó ser no significativa:
Hemos visto hasta el momento comparaciones de variables escalares y ordinales. Sin embargo,
es probable que el estudiante se encuentre con la necesidad de comparar datos nominales. Las
tablas de frecuencias ya fueron presentadas con anterioridad en la unidad correspondiente al
análisis descriptivo. Sin embargo, es posible comparar las frecuencias de las categorías en tablas
que comparan los valores de distintas categorías.
Por ejemplo, se podría postular una asociación entre el tiempo de deserción en una carrera y la
pertenencia a un tipo de universidad, sea esta pública o privada, a través de la comparación del
número de estudiantes que desertan de universidades públicas y privadas en distintos
momentos de la carrera. Podemos ejemplificar esto a través de la siguiente tabla de frecuencia,
que resume los valores de las frecuencias para cada comparación.
Como se observa, este tipo de tablas es muy común en las investigaciones psicológicas. Así, la
chi cuadrada es una herramienta útil para especificar la asociación entre variables que tienen,
ambas, varias categorías, generalmente de orden nominal.
La chi cuadrada es la prueba a utilizar cuando se busca la asociación donde las variables
implicadas son categóricas. El diseño utilizado será entre grupos, de modo que cada persona o
caso contado puede ocurrir sólo en una de las casillas de la tabla de frecuencia. La hipótesis nula
en la chi cuadrada diría que la población siempre se distribuye de forma uniforme entre los
distintos casos.
La frecuencia predicha según la hipótesis nula se conoce como frecuencia esperada. Es lo que
uno esperaría que ocurriera con las frecuencias totales si la H0 fuese cierta. Las frecuencias
obtenidas realmente se conocen como frecuencias observadas. En ese sentido la chi-cuadrada
8 [ POLITÉCNICO GRANCOLOMBIANO]
basa su análisis en la comparación de las frecuencias esperadas contra las frecuencias
observadas. La fórmula para calcularla es la siguiente:
2
(𝑜 − 𝑒)2
𝑋 = ∑
𝑒
Chi cuadrada de 2 x 2
Cuando trabajamos con una tabla de contingencia con dos filas y dos columnas, como en el
primer ejemplo, es relativamente facil descubrir si existe una asociación entre el pertenecer a
una universidad pública y privada y el tiempo de deserción.
Para ello vamos a utilizar el cálculo de la chi cuadrada siguiendo la ecuación de las frecuencias
esperadas:
𝐹𝑥𝐶
𝑒=
𝑇
Para ejemplificar el uso del SPSS para el cálculo de la chi cuadrada continuaremos con el
ejercicio anterior. Pero, a diferencia de las formas hasta ahora utilizadas para la elaboración de
la base y debido a que los datos del ejemplo se encuentras agrupados, vamos a utilizar un atajo
que se conoce como ponderación de casos. Para ello se debe ingresar una nueva variable que
tenga por título [TOTAL]. Además, se deben seguir los pasos para la asignación de valores de
etiqueta vistos anteriormente durante la prueba t para muestras independientes.
10 [ POLITÉCNICO GRANCOLOMBIANO]
Fuente. Elaboración propia
En la vista de datos, los valores se designan por los totales de los casos. Así, aparecen valores
para cada opción en cada una de las combinaciones de la categorías, quedando una base como
la que sigue:
Luego de seleccionar esta opción, SPSS arroja el siguiente cuadro de diálogo. En el cual se
selecciona la alternativa [Ponderar casos mediante] y se designa la variable [Total]. Aceptándose
la ponderación.
12 [ POLITÉCNICO GRANCOLOMBIANO]
Teniendo esta base ya ponderada procedemos con los comandos para la chi cuadrada:
Analizar/Estadísticos descriptivos/Tablas de contingencia…
Se procede a [Continuar] y a [Aceptar]. El resultado del análisis de SPSS debe arrojarnos las
siguientes tablas:
14 [ POLITÉCNICO GRANCOLOMBIANO]
En este caso, el valor de la x2 es muy similar al calculado por nosotros de manera manual.
Este mismo procedimiento permite que el programa nos muestre el gráfico correspondiente al
análisis, sin necesidad de pasos adicionales. Como verá, el gráfico de barras agrupadas es una
forma de estimar visualmente, una posible diferencia entre los grupos seleccionados. En el
ejemplo trabajado no se notan mayores diferencias entre los tipos de universidades y el tiempo
de deserción.
16 [ POLITÉCNICO GRANCOLOMBIANO]