Vous êtes sur la page 1sur 11

DESCUBRIENDO RELACIONES

Glenis Luz Vergara Coavas

Alumna

Roberto Figueroa

Profesor

UNIVERSIDAD DE CÓRDOBA

MAESTRÍA EN EDUCACIÓN - COHORTE X

27 de septiembre de 2017
Índice

1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. Relación entre dos variables nominales, use una tabla de contingencia . . . . 3
2.1. Ejemplo 1 : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2. Ejemplo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3. Ejemplo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3. Grupos desiguales de encuestados, incluya porcentajes en las tablas de contin-
gencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1. Ejemplo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2. Ejemplo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4. Relación entre dos variables de intervalo iguales, calcule un coeficiente de co-
rrelación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4.1. Ejemplo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
4.2. Ejemplo 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
5. Interpretar Pearson usando el coeficiente de determinación . . . . . . . . . . 8
5.1. Ejemplo 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
6. Relación entre una variable nominal y una variable de intervalo igual, use las
diferencias entre promedios . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
6.1. Ejemplo 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
6.2. Comentario Final ................................................................................................... 10
7. Bibliografía ............................................................................................................ 11
Relación entre dos variables.

1. Introducción

En este capítulo, consideraremos los métodos estadísticos básicos para examinar las rela-
ciones entre dos variables. Por ejemplo, si queremos saber si existe una relación entre género
y afiliación política o una relación entre las actitudes hacia la lectura y las actitudes hacia la
escuela.
El análisis estadístico de la asociación (relación, covarianza, correlación) entre variables
representa una parte básica del análisis de datos en cuanto que muchas de las preguntas e
hipótesis que se plantean en los estudios que se llevan a cabo en la práctica implican analizar
la existencia de relación entre variables.

2. Relación entre dos variables nominales, use una tabla de


contingencia

Los datos nominales se describen con palabras y se componen de categorías. Por ejemplo,
si los encuestados nombran su género o nombran el país en el que nacieron, están produ-
ciendo datos nominales. Una tabla de contingencia es una tabla de dos vías que muestra
simultáneamente las dos categorías a las que pertenece cada encuestado. Para ver lo que esto
significa, considere el Ejemplo 1 en el que sólo hay un encuestado, que es indicado por el tré-
bol (♣). La tabla proporciona información simultánea sobre dos variables (características del
encuestado): (1) asistió al programa de dejar de fumar y (2) no está fumando actualmente.

2.1. Ejemplo 1 :

Tabla 1 Tabla de contingencia con un encuestado

Asistieron al programa para dejar de fumar


Si No
Fuma en SI
la actualidad NO ♣

3
Una tabla de contingencia es una tabla de dos vías que muestra simultáneamente las dos
categorías a las que pertenece cada encuestado. Para ver lo que esto significa, considere el
Ejemplo 1 en el que sólo hay un encuestado, que es indicado por un trébol (♣). La tabla
proporciona información simultánea sobre dos variables (características del encuestado): (1)
asistió al programa de dejar de fumar y (2) no está fumando actualmente.

2.2. Ejemplo 2

Tabla 2 Tabla de contingencia con frecuencias para un grupo de encuestados

Asistieron al programa para dejar de fumar


SI NO
Fuma en la SI 0 50
actualidad NO 50 0
Total 50 50

Las frecuencias en la tabla de contingencia en el Ejemplo 2 muestran una relación perfecta:


Si sabemos que una persona asistió al programa de dejar de fumar, podemos predecir con
perfecta exactitud (al menos para los 100 encuestados representados en el tabla) que no
están fumando actualmente. Por supuesto, este ejemplo es para propósitos de instrucción
solamente así que usted puede ver un ejemplo de una relación perfecta, que sirve como punto
de referencia al interpretar otras relaciones. Por desgracia, los verdaderos programas para
detener la molestia están lejos de ser perfectamente efectivos, y es extremadamente raro
encontrar relaciones perfectas al estudiar a la gente.
El ejemplo 3 ilustra un ejemplo más realista, en el que hay una relación menos que
perfecta. Sin embargo, todavía indica que hay una relación: Los que utilizan Internet con
más frecuencia son más opuestos a la censura de material sexual en Internet que los que lo
utilizan con menos frecuencia.

2.3. Ejemplo 3

Tabla 3 Tabla de contingencia con frecuencias para un grupo de encuestados

Frecuente Ocasional Raramente


Favorece la censura Si 30 43 55
de materia sexual en Internet No 60 47 35
Total 90 90 90
3. Grupos desiguales de encuestados, incluya porcentajes en las tablas
de contingencia

A menudo, obtendrá un número desigual de encuestados en los grupos de comparación.


Cuando este es el caso, la comparación de frecuencias en tablas de contingencia puede ser
confusa. Considere el Ejemplo 4, donde hay una muestra de 29 encuestados que habían estado
en el bienestar y 148 que nunca habían estado en el bienestar. Existe una relación entre haber
estado en el bienestar y estar a favor del gobierno financiación del bienestar? La relación es
más fácil de ver si tenemos en cuenta los porcentajes presentado en el ejemplo 5, donde
está claro que la mayoría de los que habían estado en el bienestar lo favorecen mientras que
una mayoría de los que no habían estado en el bienestar se oponen. Por ejemplo, para la
primera celda de datos de la primera columna de la Tabla 4, que tiene una frecuencia de
19, el porcentaje se obtuvo dividiendo 19 por el total de la columna, 29, y multiplicando el
resultado por 100.

3.1. Ejemplo 4

Tabla 4 Tabla de contingencia con frecuencias para un grupo de encuestados

Ha recibido bienestar
SI NO
A favor del SI 19 67
bienestar NO 10 81
Total 29 148

3.2. Ejemplo 5

Tabla 5 Tabla de contingencia con frecuencias y porcentajes para un grupo de encuestados

Ha recibido bienestar
SI NO
A favor del SI 66 %(n = 19) 45 %(n = 67)
bienestar NO 34 %(n = 10) 55 %(n = 81)
Total 100 %(n = 29) 100 %(n = 148)
4. Relación entre dos variables de intervalo iguales, calcule un
coeficiente de correlación

Los datos de intervalos iguales se definieron en el capitulo anterior. Las respuestas a los
ítems de tipo Likert (es decir, los ítems con opciones "Totalmente de acuerdo" a "Totalmente
en desacuerdo") y las puntuaciones totales en escalas de actitud se asumen ampliamente.
Además, algunas variables demográficas se miden en escalas de intervalos iguales. Los años
de educación completados son un ejemplo; es igual intervalo porque la diferencia entre 1 año
y 2 años es igual a la diferencia entre 2 años y 3 años, y así sucesivamente.
La estadística más utilizada para describir la relación entre dos variables de intervalo
iguales es el coeficiente de correlación de Pearson, que a menudo se llama simplemente el
r Pearson. (Nótese que r es el símbolo seleccionado por Karl Pearson, el estadístico que
desarrolló el coeficiente de correlación).
Considere el Ejemplo 6, que muestra las puntuaciones en una actitud hacia la escala de
la tecnología y las puntuaciones en una actitud hacia la escala de Internet. La actitud hacia
la escala de la tecnología tenía muchos más elementos que el de Internet, por lo que las
puntuaciones tienden a ser mucho mayor en el primero. Sin embargo, para nuestro propósito
aquí, no nos interesa este artefacto producido por los diferentes números de artículos. En
cambio, nos interesa la relación entre las dos variables. Podemos determinar si hay una
relación considerando las posiciones de los individuos en las dos variables en relación con otras
en el grupo. Esto es más fácil de lo que parece. Por ejemplo, Joe y Jane tienen puntuaciones
altas en las actitudes hacia la tecnología. (Nótese que sus puntuaciones de 35 y 32 son
más altas que las puntuaciones obtenidas por otros en esta escala.) Igualmente, Joe y Jane
tienen altos puntajes en las actitudes hacia Internet. (Nótese que sus calificaciones de 9 y 10
son más altas que las puntuaciones obtenidas por otros en esta escala). Al mismo tiempo,
aquellos que tienen baja actitud hacia las puntuaciones de tecnología (John y Jake) también
tienen puntuaciones bajas en las actitudes hacia Internet. Esto ilustra lo que entendemos por
una relación directa (también llamada relación positiva). En una relación directa, alta las
puntuaciones están asociadas con altas puntuaciones, y las puntuaciones bajas se asocian con
puntuaciones bajas.

4.1. Ejemplo 6

Tabla 6 Relación directa, r = 0, 89


Actitud hacia Actitud hacia
Demandado la tecnologia el Internet
Joe 35 9
Jane 32 10
Marilyn 29 8
Phyllis 27 8
Homero 25 7
Clyde 22 8
Jennifer 21 6
Jake 18 4
John 15 5

Observe que la relación en el ejemplo 6 no es perfecta. Por ejemplo, aunque Joe tiene una
actitud tecnológica más alta que Jane, Jane tiene una actitud de Internet más alta que Joe.
(En otras palabras, mientras que el orden en las dos variables es similar, no es exactamente
el mismo, por lo tanto, la relación es menos que perfecto.) Si la relación era perfecta, el
valor de Pearson r sería 1,00. Siendo menos que perfecto, su valor real es

0.89. Como se puede ver en la siguiente figura, que muestra los posibles valores del r de
Pearson, 0.89 es una relación directa fuerte.

-1.00 Relación inversa 0.00 Relación directa 1.00


⇑ ⇑ ⇑ ⇑ ⇑
Perfecta Fuerte Moderada Débil Ninguna Débil Moderada Fuerte Perfecta

En una relación inversa (también llamada relación negativa), los que están altos en una
variable son bajos en la otra. Tal relación existe entre los dos factores en el Ejemplo 7. Los
que tienen mucho miedo a los animales (como Robert, Sheldon y Cynthia) tienen poca edad,
mientras que los que tienen bajo miedo a los animales tienen mucha edad. Sin embargo, la
relación no es perfecta. El valor de Pearson r para la relación en el ejemplo es -0.85.

4.2. Ejemplo 7

Tabla 7 Relación inversa, r = −0, 85


Demandado Miedo de animales Edad en años
Roberto 10 9
Sheldon 8 8
Cynthia 9 7
Nancy 7 12
Elaine 7 13
Tornero 6 15
Jackie 4 15
Tom 1 16
Sheila 0 16

Las relaciones en los Ejemplos 6 y 7 son fuertes, pero en cada caso existen excepciones
que hacen que el Pearson sea menor que 1.00 y -1.00. A medida que aumenta el número
y el tamaño de las excepciones, los valores del Pearson r se acercan a 0.00. De hecho, un
valor de $0.00 indica una ausencia completa de una relación. Es decir, cuando r es igual a
0.00, no hay tendencia discemable para las puntuaciones en las dos variables para poner a
los encuestados en el mismo o inverso orden. Para aquellos de ustedes que deseen probar su
mano en el cálculo de un Pearson r usando una calculadora, la fórmula y un ejemplo se dan
en el apéndice A.

5. Interpretar Pearson usando el coeficiente de determinación

Es importante notar que el coeficiente de Pearson r no es una proporción y no puede


multiplicarse por 100 para obtener un porcentaje. Por ejemplo, un r de Pearson de 0,50
no corresponde al 50 % de cualquier cosa. Para pensar en la correlación en términos de
porcentajes, debemos convertir el coeficiente de Pearson r a otra estadística, el coeficiente de
determinación, cuyo símbolo es r2, que se calcula simplemente tomando el cuadrado de r .
Así, para un r de 0,50, produce un r2 igual a 0,25 (0,50 x 0,50 = 0,25). Si multiplicamos 0,25
por 100, obtenemos el 25 %. £Qué significa este resultado? Simplemente esto: un Pearson r
de 0,50 es 25 % mejor que 0,00. El Ejemplo 8 muestra los valores seleccionados de r , r2 , y
los porcentajes que usted debe pensar al interpretar un r.

5.1. Ejemplo 8

Tabla 8 Valores seleccionados de r y r2


r r2 Porcentaje∗
0,9 0,81 81 %
0,5 0,25 25 %
0,25 0,06 6%
-0,25 0,06 6%
-0,5 0,25 25 %
-0,9 0,81 81 %

∗También se denomina porcentaje de varianza explicado o porcentaje de la varianza


explicada.

Tenga en cuenta que es convencional dar los valores de Pearson r en un informe de


investigación. Sin embargo, al discutir los valores, es útil considerar cuánto mejor que 0.00
son. Por ejemplo, un investigador ingenuo podría describir un r de Pearson de 0,25 como
indicando una correlación moderada. A la luz del hecho de que 0,25 es sólo 6 % mayor que
cero, una mejor interpretación sería que indica una relación débil o relativamente débil.

6. Relación entre una variable nominal y una variable de intervalo


igual, use las diferencias entre promedios

En el ejemplo 9, la variable nominal es la afiliación política (demócrata y republicana). La


variable de intervalo igual es la actitud hacia el aborto medida con una escala de actitud que
tiene un rango de puntuación posible de 0 a 100, donde 100 indica la actitud más favorable.
Al comparar los medios para las diferentes categorías en la variable nominal, podemos ver que
hay una relación entre las dos variables, de modo que los demócratas tienen actitudes más
favorables hacia el aborto que los republicanos. En otras palabras, estos resultados indican
que la afiliación política de un encuestado es predictiva de su actitud hacia el aborto.

6.1. Ejemplo 9

Tabla 9 Actitudes hacia el aborto

Media Desv. estándar


Demócrata 55,68 9,86
Republicano 42,71 7,99
Las desviaciones estándar ayudan en la interpretación de la relación en la Tabla 9. Estas
desviaciones estándar indican que hay una variación considerable entre las personas con
ambas afiliaciones políticas. Por ejemplo, suponiendo que la distribución de las puntuaciones
de actitud es normal, la desviación estándar de 9,86 para los demócratas indica que hay que
salir casi 10 puntos en cada lado de su media para reunir el 68 % de los demócratas y el
32 % restante de los demócratas. Los demócratas están incluso más lejos que 10 puntos de
su media. Dicho de otra manera, ni los demócratas ni los republicanos son muy homogéneos
en sus actitudes hacia el aborto. Por lo tanto, la afiliación política de un encuestado es un
predictor lejos de lo perfecto de sus actitudes.

6.2. Comentario Final


Aunque sólo hemos comenzado a rascar la superficie de las diversas técnicas que han
desarrollado los estadísticos para examinar las relaciones, las que se describen en este capítulo
le llevarán un largo camino hacia el inicio de la consideración de las relaciones entre las
variables que usted mide con sus cuestionarios.
Aquellos de ustedes que han estado siguiendo de cerca los capítulos sobre estadísticas
pueden haber notado que la manera de analizar datos ordinales para las relaciones no se
discute en este capítulo. Como resultado, puede sustituir el término ordinal por igual intervalo
a lo largo de este capítulo y seguir la información en las guías para analizar el comportamiento
de datos teniendo en cuenta que la mediana, y no la media, debe utilizarse como un promedio
para los datos ordinales.
7. Bibliografía

Patten Mildred L.(2001) Questionnaire Research . A practical Guide. Second Edition.

Vous aimerez peut-être aussi