Vous êtes sur la page 1sur 17

Anlisis

de datos bivariados
(Regresin y Correlacin)


Introduccin
En la mayora de los estudios estadsticos se involucra ms de una variable. En este
bloque estudiars los mtodos descriptivos para analizar la relacin entre dos
variables medidas a un mismo grupo de individuos o elementos de una muestra o
una poblacin. Las variables estadsticas pueden ser cuantitativas o cualitativas,
por lo que existen tres posibles combinaciones a considerar: cualitativa versus
cualitativa, cuantitativa versus cuantitativa y cualitativa versus cuantitativa.

Una vez que hayas visto los mtodos para el anlisis de relacin entre variables,
estars en condiciones de responder acerca de cmo est relacionada una variable
con otra, qu tan intensa es la relacin, y si se pueden utilizar los datos de una
variable para predecir valores de la otra variable. Para el caso de variables
cuantitativas caso que abordaremos en este bloque-, el anlisis se har mediante
el diagrama de dispersin, el clculo del coeficiente de correlacin y la recta de
regresin.

Conforme vayas avanzando te dars cuenta que muchos conceptos estadsticos
involucrados en el anlisis de una variable que ya estudiaste en el curso anterior,
son necesarios para el anlisis de datos de dos variables. Los principios del anlisis
son los mismos, se sugiere empezar haciendo una tabla o grfica para identificar el
aspecto general y las desviaciones de los datos y despus aadir descripciones
numricas para una mayor precisin en el anlisis. Al contenido de este bloque
tambin se le conoce como anlisis de datos bivariados.


Construccin e interpretacin de diagramas de dispersin

Actividad de aprendizaje 1:
En un estudio con 50 universidades mexicanas en 2014 se recopilaron datos de
diversas variables tales como nmero de profesores, financiamiento pblico,
matrcula de estudiantes entre otras. En el siguiente diagrama de dispersin se
muestra la relacin entre la cantidad de estudiantes y el total de profesores en las
50 universidades mexicanas.






Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares

Figura 1 Relacin entre la cantidad de estudiantes y profesores en las


universidades mexicanas

Cantidad de profesores

30000
25000
20000
15000
10000
5000
0
0

50000 100000 150000 200000 250000


Cantidad de estudiantes


1. Con tus compaeros de equipo analiza cuidosamente la grfica e interpreta la
relacin entre la cantidad de estudiantes y la cantidad de profesores. Redacta
un pequeo resumen con las conclusiones.

2. A continuacin se presentan las conclusiones de cuatro equipos, responde
verdadero si ests de acuerdo y falso si no ests de acuerdo.
A mayor de cantidad de estudiantes en las universidades existe un mayor
nmero de profesores: ___________________________.

Cada punto representa una universidad y para localizarlo en la grfica se
requieren de dos datos: la cantidad de estudiantes y la cantidad de
profesores de una universidad: ________________________.

Se alcanzan a observar tres grupos de universidades: un primer grupo tiene
un mximo de 30,000 estudiantes y un mximo de 5,000 profesores. Un
segundo grupo va de 40,000 a 100,000 estudiantes y de 3,000 a 10,000
profesores, y un tercer grupo est formado por una universidad muy
grande con cerca de 210,000 estudiantes y casi 30,000 profesores, por lo
que se considera un punto extremo: _____________________________.

Parece que a medida que aumenta el nmero de estudiantes tambin
aumenta el nmero de profesores, pero no est muy claro porque algunas
universidades tienen ms estudiantes que otras y si embargo tienen menos
profesores: __________________________.

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


An cuando hay cierta dispersin en los datos se podra considerar que la


forma de la nube de puntos es aproximadamente lineal, de tal manera que si
se pasa una lnea recta por el medio de los puntos en el sentido de la
tendencia, la mayora quedaran sobre ella o cercanos a ella:
________________________________.


Interpretacin de un diagrama de dispersin
Un diagrama de dispersin expresa la relacin entre dos variables cuantitativas
medidas a un mismo grupo de elementos o individuos. Los valores de una variable
aparecen en el eje horizontal y los valores de la otra variable aparecen en el eje
vertical. Cada elemento aparece como un punto en el diagrama, cuyas coordenadas
dependen de los valores de ambas variables para cada elemento o individuo. La
variable explicativa se coloca en el eje horizontal y la variable de respuesta en el
eje vertical. Algunas veces no hay distincin entre una variable explicativa y una
variable de respuesta, entonces se pueden colocar en cualquier eje del diagrama.

Para interpretar un diagrama de dispersin el primer paso consiste en identificar
el aspecto general de los datos. Esto es, identificar la direccin, la forma, la
intensidad, agrupamientos y puntos extremos en la relacin entre las dos variables.


Actividad de aprendizaje 2:
A continuacin se presentan algunas definiciones de las caractersticas que
permiten interpretar un diagrama de dispersin. Coloca el nombre de las
caractersticas en el espacio que consideras corresponde a su definicin:
1. Forma lineal
2. Direccin (asociacin) negativa
3. Agrupamientos
4. Intensidad fuerte
5. Datos extremos o atpicos
6. Intensidad dbil
7. Direccin (asociacin) positiva
8. Forma curvilnea

La direccin de la relacin entre dos variables se refiere a cmo cambian los
valores de una variable en relacin con los cambios en la otra variable. Si los
valores de una variable tienden a aumentar conforme los valores de la otra
variable tambin aumentan, se dice que entre ambas variables hay
_______________________________________________. Por el contrario, si los valores de una
variable tienden a aumentar conforme los valores de la otra variable tienden a
disminuir o viceversa, se dice que entre ambas variables hay
_______________________________________________.
Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares

Cuando la nube de puntos de un diagrama de dispersin tiende a parecerse en


forma global a una lnea recta imaginaria, se dice que la relacin entre las
variables tiene ________________________________. En caso contrario, podra haber
una relacin con ________________________________, o bien, podra no haber una
relacin con forma identificable.

Cuando en un diagrama de dispersin existe poca dispersin en la nube de
puntos respecto a una lnea recta imaginaria que pasa por el medio de la nube,
se dice que hay una _________________________________en la relacin entre las
variables. En caso contrario, se dice que entre las variables existe una
_______________________________________.
Cuando en el diagrama de dispersin se observan uno o ms puntos alejados
del resto de la nube de puntos se dice que existen _________________________________.
Si en vez de pocos datos se observan grupos que se separan entre s en la nube
de puntos, entonces existen ___________________________________ de datos.


Actividad de aprendizaje 3:
Los diagramas de dispersin que se muestran a continuacin fueron construidos
con datos de diferentes variables medidas a las 50 universidades mexicanas en un
estudio de calidad que se realiz en 2014. En cada caso, en conjunto con tus
compaeros de equipo seala si la asociacin es positiva, negativa o no existe
asociacin. Si la forma de la relacin es lineal, curvilnea o no hay una relacin
clara. Si la intensidad de la relacin es fuerte o dbil. Finalmente seala si hay
puntos extremos y agrupamientos en los datos en cada caso.

Figura 2 Relacin entre profesores de tiempo completo y prestigio internacional en las
universidades mexicanas
Profesores de tiempo
completo (%)

120
100
80
60
40
20
0
0

20

40

60

80

100

120

Prestigio internacional (%)



Direccin:
Intensidad:

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Forma:
Puntos extremos:
Agrupamientos:

Figura 3 Relacin entre posgrados e ndice de calidad en las universidades
mexicanas

Indice de calidad
(%)

120
100
80
60
40
20
0
0

20

40

60

80

100

120

Posgrado (%)


Direccin:
Intensidad:
Forma:
Puntos extremos:
Agrupamientos:

Prestigio Internacional (%)

Figura 4 Relacin entre prestigio internacional y empleabilidad en las universidades


mexicanas
120
100
80
60
40
20
0
0

20

40

60

80

100

120

Empleabilidad (%)


Direccin:
Intensidad:
Forma:

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Puntos extremos:
Agrupamientos:

Actividad 4:
En conjunto con tus compaeros de equipo revisa la prensa o un reporte
estadstico oficial y seleccionen un diagrama de dispersin que les parezca
interesante. Identifiquen las variables y de ser el caso, identifiquen a la variable
explicativa y a la variable de respuesta. Interpreten el diagrama de dispersin
teniendo en cuenta todas su caractersticas.

Correlacin lineal
Una vez que se ha construido un diagrama de dispersin se tiene una idea global
de la relacin entre dos variables cuantitativas. El diagrama describe la direccin,
la forma, e intensidad de la relacin, y nos muestra si existen agrupamientos y
datos extremos. Construir un diagrama de dispersin es un buen punto de partida
en el anlisis bivariado de datos.

La siguiente etapa consiste en calcular medidas numricas que describan con
mayor precisin la relacin entre las variables. La medida que describe en forma
precisa la relacin entre dos variables es el coeficiente de correlacin lineal,
tambin llamado coeficiente de correlacin de Pearson, en honor al matemtico
ingls que desarroll su frmula matemtica.

En suma, el coeficiente de correlacin es una medida de la relacin lineal entre dos
variables cuantitativas, por lo que en lo sucesivo ser suficiente con hacer
referencia a coeficiente de correlacin para entender que se trata de una medida
de correlacin lineal.

Significado del coeficiente de correlacin lineal

Actividad de aprendizaje 1:
Los siguientes diagramas de dispersin se construyeron con datos del examen
ENLACE aplicado en Preparatoria en 2014 en todos los estados del pas. Los datos
del primer diagrama representan los porcentajes de estudiantes que obtuvieron
los niveles ms altos (bueno y excelente) en matemticas y comunicacin. Los
datos del segundo diagrama representan la cantidad de exmenes programados
(en miles) y la cantidad de exmenes aplicados (en miles), pues no es posible
aplicar todos los exmenes que se programan por alguna razn.





Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares

Figura 5: Resultados Bueno-Excelente en Matemticas vs.


Bueno-Excelente en Comunicacin

Bueno-Excelenete en
Comunicacin (%)

70
60
50
40
30
20
10
0
0

10

20

30

40

50

60

Bueno-Excelente en Matemticas (%)



Figura 6: Cantidad de exmenes programados vs cantidad de exmenes
aplicados en cada entidad federativa
Examenes aplicados
(en miles)

140
120
100
80
60
40
20
0
0

20

40

60

80

100

120

140

160

Examenes programados
(en miles)



1. En conjunto con tus compaeros de equipo comenta y justifica en cul de los
dos diagramas de dispersin hay mayor correlacin entre las variables.


2. Coloca verdadero si ests de acuerdo y falso si no ests de acuerdo con la
conclusin a la que llegaron dos equipos:
Las variables que se muestran en el primer diagrama de dispersin estn ms
correlacionadas porque si se traza una lnea recta imaginaria por el medio de la
nube de puntos estara ms inclinada que en el caso del segundo diagrama.
___________________________________.

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Las variables que se muestran en el segundo diagrama de dispersin estn ms


correlacionadas porque si se traza una lnea recta imaginaria por el medio de la
nube de puntos la mayora quedara muy cercanos a ella, e incluso algunos
puntos quedaran sobre ella. ____________________________________.


El coeficiente de correlacin: una medida para evaluar la relacin lineal
entre dos variables cuantitativas
El coeficiente de correlacin proporciona dos propiedades relevantes de la
relacin entre dos variables cuantitativas: la direccin y la intensidad o fuerza de la
relacin. El signo del coeficiente hace referencia a la direccin y el valor del
coeficiente expresa la intensidad de la relacin. Usualmente se simboliza con la
letra r.

Una relacin perfecta entre dos variables cuantitativas se observa cuando todos los
puntos en un diagrama de dispersin caen sobre una lnea recta. En este caso la
desviacin de cada punto respecto a la lnea recta es igual a cero. Las siguientes
figuras muestran los dos casos de relacin perfecta que se pueden presentar:

Scatter Plot
Collection 1
Scatter Plot

Collection 1

9
8

1
1

X


Y=x +1
Y=x + 8
r=1 r=-1

En el primer caso el coeficiente de correlacin es igual a 1 y en el segundo
diagrama es igual a -1. En la prctica es difcil encontrar una relacin perfecta dada
la variabilidad que caracteriza a los datos estadsticos, as que lo ms comn es
encontrar coeficientes de correlacin entre -1 y 1 pero no exactamente iguales a 1.

Actividad de aprendizaje 2:
Con base en las lecturas anteriores y con apoyo de Internet, en conjunto con tus
compaeros de equipo identifiquen cuales de los siguientes enunciados son
verdaderos y cules son falsos:
Valores del coeficiente de correlacin cercanos a -1 indican que los puntos de
un diagrama de dispersin se encuentran muy alineados a una recta
descendente de izquierda a derecha_________________________.
X

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


El signo negativo del coeficiente de correlacin indica que los valores de una
variable tienden a aumentar conforme los valores de la otra variable tienden a
disminuir___________________________.

Valores del coeficiente de correlacin cercanos a 1 y -1 indican relacin fuerte
entre las variables___________________________.
Valores cercanos a -1 y -1 indican una relacin fuerte entre las variables y por
lo tanto se puede concluir que una es causa de la otra__________________________.
El signo positivo del coeficiente de correlacin indica que los valores de una
variable tienden a aumentar conforme los valores de la otra variable tambin
tienden a aumentar___________________________.
Valores del coeficiente de correlacin cercanos a 0 indican relacin una dbil
entre las variables en una u otra direccin __________________________.
Valores del coeficiente de correlacin cercanos a 1 indican que los puntos de un
diagrama de dispersin se encuentran muy alineados a una recta ascendente
de izquierda a derecha_________________________.
Valores cercanos a -1 y -1 indican una relacin fuerte entre las variables, pero
no se puede concluir que una es causa de la otra. Para ello se requiere otro tipo
de anlisis_________________________.


Comparen sus respuestas con las de otros equipos y soliciten la ayuda de su
profesores para aclarar las dudas que puedan surgir.

Actividad de aprendizaje 3:
Ingresa a una aplicacin de Internet denominada applet que se muestra en la
direccin http://www.rossmanchance.com/applets/GuessCorrelation.html. Para
una muestra de 25 puntos y observando el diagrama de dispersin que aparece en
la seccin derecha, proporciona una estimacin del coeficiente de correlacin,
despus verifica qu tan cercana al valor real fue tu estimacin. Realiza la
simulacin 10 veces y completa la siguiente tabla. Comenta con tus compaeros los
resultados de ellos.







Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares

Tabla 1 Estimacin y comprobacin del coeficiente de correlacin a partir


de un diagrama de dispersin
Nmero
Estimacin
Valor de r
de
de r
simulacin
1


2


3


4


5


6


7


8


9


10




Actividad de aprendizaje 4:
Analiza los cuatro diagramas de dispersin que se muestran a continuacin y
asigna el coeficiente de correlacin que consideras le corresponde.

r=0.558 r=-0.339 r=0.984 r=-0.872


r=_____________

r=_____________

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares





r=_____________


r=_____________

Expresin matemtica para el clculo del coeficiente de correlacin
El coeficiente de correlacin involucra a su vez a diversos conceptos estadsticos,
por lo que su clculo resulta laborioso, particularmente cuando se tienen muchos
datos. Para fijar ideas y que comprendas el proceso de clculo, en esta seccin
analizaremos la frmula para calcular el coeficiente de correlacin con un pequeo
conjunto de datos, y posteriormente, en la siguiente secuencia didctica dedicada
al uso de tecnologa vers cmo hacer el clculo correspondiente teniendo en
cuenta un conjunto de datos ms grande.

Mencionamos anteriormente que en una correlacin perfecta entre dos variables,
los puntos quedan perfectamente colocados en una lnea recta, lo que implica que
la desviacin o distancia de ellos a la recta es igual a cero. Es decir, entre ms
cercanos estn los puntos a la lnea recta habr mayor correlacin entre las
variables. En este sentido el concepto de desviacin es parte importante en el
clculo del coeficiente de correlacin, y como la desviacin se mide respecto a un
promedio, la media aritmtica tambin es otro concepto importante que forma
parte de la frmula, as como la desviacin estndar que mide la variabilidad, como
se muestra a continuacin:

!
!
=

1

Donde:
: valores de la variable 1
: valores de la variable 2
: media aritmtica de la variable 1
: media aritmtica de la variable 2
! : desviacin estndar de la variable 1
! : desviacin estndar de la variable 2
: tamao de la muestra

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares

Actualmente en cualquier herramienta de software, hoja de clculo o calculadora


se encuentra disponible una funcin que calcula el coeficiente de correlacin. Sin
embargo es importante que conozcas el algoritmo de clculo y lo pongas en
prctica para entender su significado.

Actividad de aprendizaje 5
Durante la primera semana del mes de julio de 2014, en la estacin climatolgica
que se encuentra en Ciudad Universitaria en la ciudad de Culiacn Sinaloa, se midi
la temperatura promedio diaria y la evaporacin. Los datos se muestran en la
Tabla 4.7
Tabla 4.7 Datos de temperatura y evaporacin
Das
Temperatura Evaporacin
(x)
(y)
1
29.5
6.53
2
28.3
3.28
3
29.2
2.12
4
29.4
4.16
5
29.9
4.24
6
30.4
7.16
7
28.0
5.40

Recuerda que la media aritmtica y la desviacin estndar se calculan
respectivamente con las siguientes expresiones que estudiaste en el curso
anterior:

! + ! + + !
=


! =

(! )! + (! )! + + (! )!

1


Entonces el clculos de la media aritmtica y la desviacin estndar de cada una de
las variables (temperatura y evaporacin) arrojan los siguientes valores:

= 29.2 ! = 0.85 = 4.7 ! = 1.78

Para simplificar el clculo del coeficiente de correlacin utilizaremos la siguiente
tabla mostrando en cada columna, cada parte de la frmula. En el ltimo rengln
de la ltima columna se muestra la sumatoria de todos los clculos que se fueron
acumulando y que equivale al numerador de la frmula del coeficiente de
correlacin.
Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Tabla 4.8 Datos y clculos del coeficiente de correlacin

Das

Temperatura
(x)

Evaporacin
(y)

1
2
3
4
5
6
7

29.5
28.3
29.2
29.4
29.9
30.4
28.0

6.53
3.28
2.12
4.16
4.24
7.16
5.40

0.353
-1.059
0.000
0.235
0.823
1.412
-1.412

1.028
-0.798
-1.449
-0.303
-0.258
1.382
0.393

0.363
0.845
0.000
-0.071
-0.212
1.951
-0.555
2.321


Sustituyendo la frmula queda lo siguiente:


!
!
2.321
=
=
= 0.38
1
71

El coeficiente de correlacin obtenido indica que hay una relacin positiva entre la
temperatura y la evaporacin, es decir, al aumentar la temperatura tiende a
aumentar la evaporacin. Sin embargo, la relacin es dbil puesto que el valor del
coeficiente es ms cercano a cero que a 1.

Observaciones importantes:
1. Las dos variables se expresan en diferentes unidades de medida, sin
embargo, al dividir entre la desviacin estndar estas se anulan, por lo que
el coeficiente de correlacin no tiene dimensiones y es independiente de las
escala de medida de las variables.
2. Cuando se trata de una poblacin el denominador de la frmula es en
lugar de 1. Lo mismo pasa con el calculo de las desviaciones estndar
que participan en la frmula del coeficiente de correlacin.
3. Una correlacin alta entre dos variables no significa causalidad, es decir,
que una sea causa de la otra. Se requieren otro tipo de anlisis estadsticos
que estn fuera del alcance de este libro para determinar causalidad.


Leccin 4: Uso de tecnologa en la estadstica
Objetivo
Utilizar recursos tecnolgicos para analizar datos de dos variables a travs de diagramas
de dispersin y el clculo del coeficiente de correlacin.

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Punto de partida
Responde con base en tus conocimientos actuales:
Conoces algunos programas de cmputo (software) tiles para construir diagramas
de dispersin y clculo estadsticos como el coeficiente de correlacin?
En qu aspectos del anlisis de datos bivariados crees que ayude un programa de
cmputo?

Actividad de aprendizaje 1
La hoja de clculo Excel puede ser de gran utilidad en el anlisis de datos bivariados
mediante la construccin de diagramas de dispersin y el clculo del coeficiente de
correlacin. Mostraremos paso a paso el procedimiento de captura y clculo con los
datos de la siguiente situacin:
Los datos que se muestran a continuacin corresponden a los porcentajes de alumnos
que se ubicaron en los niveles superiores del examen ENLACE (Bueno y Excelente) de
matemticas y comunicacin aplicado en el nivel de preparatoria en 2014 en todos los
estados del pas. Se proporcionan adems, datos de la cantidad de exmenes
programados y la cantidad de exmenes aplicados.
Tabla 2: Porcentajes de alumnos que se ubicaron en los niveles Bueno y Excelente en el examen
ENLACE de Preparatoria en 2014 en todos los estados del pas.

Estado

Programadas

Aplicadas Porcentaje

Porcentaje
Bueno-Excelente
Matemticas

Porcentaje
Bueno-Excelente
Comunicacin

Aguascalientes

14008

12758

91.1

42.3

47.9

Baja California

33687

30605

90.9

48.5

58.3

Baja California Sur

7397

6855

92.7

32.5

40.5

Campeche

8153

7591

93.1

39.3

43.5

Coahuila

27915

24936

89.3

38.5

48.5

C olima

6824

6569

96.3

41.1

47.1

Chiapas

58943

54090

91.8

31.6

24.8

Chihuahua

30359

28247

93

43.7

50.7

Distrito Federal

67878

55629

82

38.3

44.9

Durango

17289

16144

93.4

52.9

55.3

Guanajuato

49027

44635

91

42.6

48.2

Guerrero

34427

29856

86.7

27.2

27.5

Hidalgo

29333

27332

93.2

39.1

46.3

Jalisco

76639

68614

89.5

39.8

50.2

Estado de Mxico

134557

122757

91.2

38

46.5

Michoacn

40357

33304

82.5

35.9

35.7

Morelos

19842

15880

80

35.1

38.4

Nayarit

11864

10671

89.9

29.1

37.7

Nuevo Len

47865

41155

86

38.1

46.9

Oaxaca

38233

33913

88.7

38

37

Puebla

67591

64014

94.7

46.7

52.3

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Quertaro

19387

17907

92.4

44.5

52.1

Quintana Roo

14313

13306

93

37.6

42.3

San Luis Potos

31459

29889

95

38.2

45.9

Sinaloa

36117

33582

93

39.7

42.2

Sonora

29839

27299

91.5

48.2

50

Tabasco

27054

24911

92.1

30.9

32.7

Tamaulipas

32614

30925

94.8

39.5

51.5

Tlaxcala

14055

12516

89.1

32

35.3

Veracruz

75695

72416

95.7

40.5

45

Yucatn

18258

17185

94.1

37.2

46.4

Zacatecas

14303

13465

94.1

44.3

43.3

Abre una hoja de clculo y captura los datos de la Tabla 4.9 utilizando como punto
de partida la primera celda de la hoja.
Selecciona con el cursor los datos de las columnas E y F sin incluir los ttulos de las
columnas. El rea selecciona estar comprendida entre la celda E2 y la celda F33.
En el men elige la opcin INSERTAR, luego la opcin GRFICOS y despus la
opcin DISPERSIN. Dentro las diversas opciones de diagramas de dispersin que
aparecen elige la primera opcin. Aparecer un diagrama de dispersin con los datos
seleccionados.
En la parte central del men aparece una nueva opcin que se llama DISEO DE
GRFICO. En ella puedes elegir diversas presentaciones para mostrar tus datos en
el diagrama de dispersin, la ms comn es la primera opcin, seleccinala.
Coloca como ttulo del grfico RESULTADOS BUENO-EXCELENTE EN
MATEMTICAS VS. BUENO EXCELENTE EN COMUNICACIN. Deber
aparecer un diagrama como el que se muestra a continuacin.

Bueno-Excelente en comnicacin

Resultados Bueno-Excelente en Matemticas


Bueno-Excelente en Comunicacin

70
60
50
40
30
20
10
0
0

10

20

30

40

50

60

Bueno-Excelente en Matemticas

Ahora selecciona con el cursor los datos de las columnas B y C sin incluir los ttulos
de las columnas. El rea selecciona estar comprendida entre la celda B2 y la celda
C33.

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Sigue los mismos pasos que en el diagrama anterior y coloca como ttulo
EXAMENES PROGRAMADOS VS EXAMENES APLICADOS. Deber aparecer
un diagrama como el que se muestra a continuacin:

Exmenes aplciados
(miles)

Exmenes Programados vs. Exmenes Aplicados


140
120
100
80
60
40
20
0
0

20

40

60

80

100

120

140

160

Exmenes programados
(miles)

Para calcular el coeficiente de correlacin del primer diagrama de dispersin,


en el men elige la opcin FRMULAS, despus la opcin MS FUNCIONES, y
enseguida FUNCIONES ESTADSTICAS. Dentro de la lista de funciones
estadsticas aparece la funcin COEF. DE CORREL, seleccinala y en el cuadro
de dilogo que aparece, inserta la informacin solicitada. De inmediato
aparecer el valor del coeficiente de correlacin en la parte inferior, presiona
aceptar y aparecer dicho valor en la celda donde est posicionado el cursor.


En conjunto con tus compaeros de equipo interpreta el coeficiente de
correlacin obtenido cuyo valor es 0.846.
o Qu dice este valor sobre la relacin entre los resultados de
matemticas y de comunicacin?
o Podran utilizarse los resultados de matemticas para hacer una
prediccin confiable sobre los resultados de comunicacin o
viceversa?

Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares


Actividad de aprendizaje 2

Utiliza la hoja de clculo Excel y verifica el resultado del coeficiente de correlacin
que obtuviste manualmente con los datos de la tabla 4.7 sobre la relacin entre
temperaturas y evaporacin.
Comenta los resultados con tus compaeros y si hay alguna diferencia
identifica la posible causa.
Interpreta el coeficiente de correlacin

















Apuntes de Diagramas de Dispersin y Correlacin Dr. Santiago Inzunza Cazares

Vous aimerez peut-être aussi