Vous êtes sur la page 1sur 69

ESTADISTICA DESCRIPTIVA

UNIVERSIDAD POLITCNICA ESTATAL DEL CARCHI



ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIN
INTERNACIONAL











Tulcn Ecuador
2012

MCS : JORGE POZO
CORRELACIN Y REGRESIN LINEAL
MARA GORDN

TEMA: Desarrollo de ejercicios de correlacin y regresin lineal

Objetivos
Objetivo general
Desarrollar los ejercicios de correlacin y regresin
Objetivos especficos
Interpretar los datos estadsticos
Realizar las grficas relacionando dos variables
Analizar los resultados obtenidos en los coeficientes

JUSTIFICACIN
El presente trabajo tiene como finalidad la realizacin y el anlisis de
ejercicios relacionados al comercio exterior aplicando los casos de
correlacin y regresin lineal con el fin de que los estudiantes desarrollen las
capacidades de aprendizaje y aplicacin en los problemas del contexto
nacional

MARCO TERICO

CORRELACIN

TCNICAS DE CORRELACIN
En los captulos anteriores, ustedes estudiaron las distribuciones de una sola
variable. A continuacin abordaremos el estudio de dos variables y no
solamente de una. Particularmente estudiaremos qu sentido tiene afirmar
que dos variables estn relacionadas linealmente entre s y cmo podemos
medir esta relacin lineal.

RELACIONES LINEALES ENTRE VARIABLES
Supongamos que disponemos de dos pruebas una de ellas una prueba de
habilidad mental y la otra una prueba de ingreso a la Universidad.
Seleccionemos cinco estudiantes y presentamos en la tabla N4.1.1, los
puntajes obtenidos en estas dos pruebas.
TABLA N4.1.1
ESTUDIANTES
X
PRUEBA
DE
HABILIDAD
MENTAL
Y
EXAMEN DE ADMISIN
Mara 18 82
Olga 15 68
Susana 12 60
Aldo 9 32
Juan 3 18

Observamos las cinco parejas de puntajes de la tabla N4.1.1 podemos
afirmar que la prueba de habilidad mental se puede usar para pronosticar el
puntaje de examen de admisin?. La tabla nos dice que si podemos hacer
tal suposicin ya que los estudiantes con puntajes altos en la prueba de
habilidad mental tienen tambin un puntaje alto en el examen de admisin y
los estudiantes con puntajes bajos en la prueba de habilidad mental, tienen
puntajes bajos en el examen de admisin. En circunstancias como la
presente (cuando los puntajes altos de una variable estn relacionados con
los puntajes altos de la otra variable y los puntajes bajos de una variable
estn relacionados con los puntajes bajos de la otra variable), afirmamos
que hay una relacin lineal positiva entre las dos variables, entonces
podemos definir una relacin lineal positiva entre ese conjunto de pares de
valores X y Y, tal como se muestra en la tabla N4.1.1.

Supongamos que en lugar de los resultados de la tabla N 4.1.1, hubiramos
obtenido los puntajes que se muestran en la tabla N 4.1.2 Podramos
afirmar que en esta situacin los puntajes de la prueba de habilidad mental
pueden usarse para pronosticar los puntajes altos en el test de habilidad
mental aparecen con puntajes bajos en el examen de admisin y los sujetos
con puntajes altos en el examen de admisin, entonces podemos definir una
relacin lineal negativa entre un conjunto de pares de valores X y Y (tal
como en la tabla N4.1.2), es decir, los puntajes altos de X estn apareados
con los puntajes bajos de Y y los puntajes bajos de X estn apareados con
los puntajes altos de Y.

TABLA N4.1.2
X Y
ESTUDIANTES
PRUEBA
DE
HABILIDAD
MENTAL
EXAMEN DE ADMISIN
Mara 18 18
Olga 15 32
Susana 12 60
Aldo 9 68
Juan 3 82




TABLA N4.1.3
X Y
ESTUDIANTES
PRUEBA
DE
HABILIDAD
MENTAL
EXAMEN DE ADMISIN
Mara 18 18
Olga 15 82
Susana 12 68
Aldo 9 60
Juan 3 32

Examinemos ahora la tabla N4.1.3. en este caso ya no podemos afirmar
que los puntajes de la prueba de habilidad mental sirvan para pronosticar los
puntajes del examen de admisin, ya que unos puntajes altos del test de
habilidad mental estn aparejados con otros puntajes bajos del examen de
admisin y algunos puntajes bajos del test de habilidad mental estn
apareados con otros puntajes altos del examen de admisin, entonces, en
este caso, decimos que no existe una relacin lineal entre las variables X y
Y.

DIAGRAMA DE DISPERSIN
En las situaciones que se presentan en la vida real no tenemos solamente
cinco parejas de valores para ambas variables, sino muchsimas parejas.
Otra forma alternativa de ver si existe o no relacin lineal entre dos variables
sera hacer una grfica de los valores X y Y en un sistema de coordenadas
rectangulares, este tipo de grfica es conocido con el nombre de diagrama
de dispersin, grfico de dispersin o nube de puntos. Dibujemos el
diagrama que corresponde a la tabla N4.1.1. lo haremos haciendo
corresponder a cada valor de la variable independiente X, un valor de la
variable dependiente Y, es decir, para la alumna Susana haremos
corresponder su puntaje en la prueba de habilidad mental (12) con su
puntaje de la prueba de admisin (60); al alumno Juan le hacemos
corresponder su puntaje del test de habilidad mental (3) con su puntaje del
examen de admisin (18). Luego ubicaremos los cinco pares de puntajes en
el sistema de ejes rectangulares y obtendremos los grficos N4.1.1 y
N4.1.2.

Observaremos en el grfico N4.1.1, que tabla N4.1.1, es descrita por el
diagrama de dispersin. Vemos en este grfico que los cinco puntos dan la
sensacin de ascender en lnea recta de izquierda a derecha. Esto es
caracterstico en datos en los que existe una relacin lineal positiva. Aunque
estos cinco datos no configuren una lnea recta en forma perfecta, se puede
trazar una lnea recta que describa en estos puntos en forma bastante
aproximada, conforme se ve en el grfico N4.1.2 y por esto decimos que la
relacin es lineal.

Si ocurre que todos los puntos de la grfica de dispersin estn incluidos en
una sola lnea en forma exacta afirmamos que la relacin lineal es perfecta.
El grado en que se separan los puntos de una sola lnea recta nos da el
grado en que la relacin lineal no es perfecta. As cuando menos puntos se
encuentran en una sola lnea decimos que la relacin lineal entre las dos
variables es menos fuerte y cuando ms puntos queden incluidos en una
lnea recta afirmaremos que la relacin lineal es ms fuerte.
GRFICO N4.1.1.


GRFICO N4.1.2

Usando los datos de la tabla N4.1.2 y utilizando la misma forma de razonar
empleada hasta ahora podemos construir el correspondiente grfico de
dispersin, tal como se muestra en el grfico N4.1.3.

Podemos observar en el grfico N4.1.4 que la nube de puntos de la grfica
puede delinearse bien por una lnea recta, lo que nos indica que hay una
relacin lineal entre las dos variables X y Y. vemos tambin que la lnea
desciende de izquierda a derecha (tienen pendiente negativa) por lo que
decimos que la relacin lineal entre las dos variables es negativa.

Si tenemos en cuenta la tabla N4.1.3 podemos obtener una figura como se
muestra en la grfica N4.1.5. Notamos, en esta situacin, que resultar
intil cualquier lnea recta que trate describir adecuadamente este diagrama
de dispersin.




GRFICO N4.1.3


GRFICO N4.1.4




GRFICO N4.1.5


COEFICIENTE DE CORRELACIN RECTILINEA DE PEARSON
Con ayuda de las grficas nos podemos formar una idea si la nube de
puntos, o diagrama de dispersin, representa una relacin lineal y si esta
relacin lineal es positiva o negativa, pero con la sola observacin de la
grfica no podemos cuantificar la fuerza de la relacin, lo que si
conseguiremos haciendo uso del coeficiente r de Pearson.

El coeficiente de correlacin r de Pearson, forma valores comprendidos entre
-1 y +1 pasando por 0. El nmero -1 corresponde a una correlacin negativa
perfecta (los puntos del diagrama de dispersin deben encontrarse formando
perfectamente una lnea recta). El coeficiente de correlacin r=0 se obtiene
cuando no existe ninguna correlacin entre las variables. Los valores
negativos mayores que -1 indican una correlacin negativa y los valores
positivos menores que 1 indican una correlacin positiva. Referente a la
magnitud de r podemos decir que independientemente del signo, cuando el
valor absoluto de r est ms cerca de uno, mayor es la fuerza de la
correlacin, as as que -0.20 y +0.20 son iguales en fuerza (ambos son dos
valores fuertes).

CLCULO DEL COEFICIENTE r DE PEARSON UTILIZANDO UNA
MQUINA CALCULADORA CUANDO LOS DATOS NO SON MUY
NUMEROSOS
Dadas dos variables X y Y con sus respectivos valores. Tabla N4.1.4,
podemos calcular el coeficiente r de Pearson con una mquina calculadora
mediana la siguiente frmula.

( ) ()()
[(

()

)][(

()

)]


TABLA AUXILIAR N4.1.4.
(1)
x
(2)
Y

(3)
x
2
(4)
y
(5)
XY
18
15
12
9
3
x = 57
82
68
60
32
18
y= 260
324
225
144
81
9
x = 783
6724
4624
3600
1024
324
y = 16296
1476
1020
7200
288
54
xy = 3558

Con los datos de la tabla N4.1.1, se ha elaborado la Tabla Auxiliar N4.1.4.

En las columnas (1) y (2) se han escrito los valores de X y Y. en la columna
(3), se han elevado al cuadrado los valores de X. en la columna (4) se han
elevado al cuadrado los valores de Y. en la columna (5) se ha efectuado el
producto de cada pareja de valores X y Y. aplicando los datos en la frmula
4.1.1, se tiene:

() ()()
[(() ()

)][(() ()

)]



( )( )

()()




INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIN
Qu tan elevado es un coeficiente de correlacin dado?. Todo coeficiente
de correlacin que no sea cero indica cierto grado de relacin entre dos
variables. Pero es necesario examinar ms esta materia, porque el grado de
intensidad de relacin se puede considerar desde varios puntos de vista. No
se puede decir que un r de 0.50 indique una relacin dos veces ms fuerte
que la indicada por r de 0.25. ni se puede decir tampoco que un aumento en
la correlacin de r=0.40 a r=0.60 equivalga a un aumento de r=0.70 a r=0.90.
es de observar que una correlacin de -0.60 indica una relacin tan estrecha
como una correlacin de +0.60, la relacin difiere en la direccin.

Siempre que est establecida fuera de toda duda razonable una relacin
entre dos variables, el que el coeficiente de correlacin sea pequeo puede
significar nicamente que la situacin medida est contaminada por algn
factor o factores no controlados. Es fcil concebir una situacin experimental
en la cual, si se han mantenido constantes todos los factores que no sean
pertinentes, el r podra haber sido 1 en lugar de 0.20. por ejemplo:
generalmente la correlacin entre la puntuacin de aptitud y el
aprovechamiento acadmico es 0.50 puesto que ambos se miden en una
poblacin cuyo aprovechamiento acadmico tambin es influenciable por el
esfuerzo, las actitudes, las peculiaridades de calificacin de los profesores,
etc. Si se mantuvieran constantes todos los dems factores determinantes
del aprovechamiento y se midieran exactamente la aptitud y las notas, el r
sera 1 en vez de 0.50.

Una conclusin prctica a la correlacin es que sta es siempre relativa a la
situacin dentro de la cual se obtiene y su magnitud no representa ningn
hecho natural absoluto. El coeficiente de correlacin es siempre algo
puramente relativo a las circunstancias en que se ha obtenido y se ha de
interpretar a la luz de esas circunstancias y slo muy rara vez en algn
sentido absoluto.

Adems podemos agregar que la interpretacin de un coeficiente de
correlacin como medida del grado de relacin lineal entre dos variables, es
una interpretacin como medida del grado de relacin lineal entre dos
variables, es una interpretacin matemtica pura y est completamente
desprovista de implicaciones de causa y efecto. El hecho de que dos
variables tiendan a aumentar o disminuir al mismo tiempo no implica que
obligadamente una tenga algn efecto directo o indirecto sobre la otra.

A continuacin calcularemos con la frmula N4.1.1, antes indicada
coeficiente de Pearson de la relacin presentada en la tabla N4.1.2

CUADRO AUXILIAR 4.1.5
(1)
x
(2)
Y
(3)
x
2

(4)
y
(5)
XY
18 18 324 324 324
15 32 225 1024 480
12 60 144 3600 720
9 68 81 4624 612
3 82 9 6724 246
x = 57 y= 260 x = 783 y = 16296
xy =
2382


() ()()
[(() ()

)][(() ()

)]



( )( )

()()




Vemos que la correlacin es fuerte y negativa.

Ahora calculemos con la misma frmula de Pearson N4.1.1, el Coeficiente
de Correlacin lineal con los datos de la tabla N4.1.3.

CUADRO AUXILIAR 4.1.6
(1)
x
(2)
Y
(3)
x
2

(4)
y
(5)
XY
18 18 324 324 324
15 32 225 6724 1230
12 60 144 4624 816
9 68 81 3600 542
3 82 9 1024 96
x = 57 y= 260 x = 783 y = 16296 xy = 3006


() ()()
[(() ()

)][(() ()

)]



( )( )

()()




La correlacin es muy dbil y positiva.

CORRELACIN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN
CLASES
El presente tema nos conduce a calcular el coeficiente de correlacin r, que
nos proporciona informacin de la fuerza de la relacin que existe entre dos
conjuntos de datos que se encuentran agrupados, cada uno de ellos
formando por separados una distribucin de frecuencias, mejor dicho
teniendo por separado sus intervalos de clase con sus respectivas
frecuencias.
Para realizar una exposicin del tema en forma ms entendible,
presentamos el ejemplo del Cuadro N 4.1.7.
Ejemplo:
Calcular el grado de correlacin entre las puntaciones obtenidas en
inventario de hbitos de estudio y los puntajes obtenidos en un examen de
Matemtica, aplicados a un total de 134 alumnos de un colegio de la
localidad.




CUADRO N 4.1.7
X Hbitos de estudio

Y Matemtica

2030

3040

4050

5060

Total


7080 3 2 2 7
6070 1 0 4 5 10
5060 2 6 16 3 27
4050 4 14 19 10 47
3040 7 15 6 0 28
2030 8 2 0 1 11
1020 1 1 2 4
Total

23 40 48 23 134

Podemos notar que el problema no es tan simple, como el caso anterior,
dado que ahora los datos se han clasificado en una tabla de doble entrada
N 4.1.7. Este cuadro muestra, en la primera columna del lado izquierdo los
intervalos de clase de la variable Y, los que cubren todos los posibles datos
acerca de las puntuaciones alcanzadas por los estudiantes en la prueba de
Matemtica. Ntese que los intervalos crecen de abajo hacia arriba. En la
fila superior se presentan los intervalos de clase todos los 134 posibles datos
acerca de los puntajes obtenidos por los estudiantes en la variable hbitos
de estudios representados por la letra X.
Dentro del Cuadro N 4.1.7 en los casilleros interiores o celdas de la tabla,
se encuentran las frecuencias de celdas

que corresponden a puntajes


que pertenecen tanto a un intervalo de la variable Y como a un intervalo de
la variable X.
En la fila interior del Cuadro se presentan los totales de los puntajes de la
variable X, hbitos de estudio. Esos totales se llaman frecuencias marginales
de la variable X y se representan por

.
En la ltima columna de la derecha se encuentran los totales de los puntajes
de la variable rendimiento en matemtica. Estos totales se denominan
frecuencias marginales de la variable Y.
Cuando los datos se presentan tal como el presente caso, formando tablas
de doble entrada, es conveniente usar el mtodo clave que expondremos a
continuacin porque con este procedimiento se evita manejar grandes
nmeros, como sera el caso si se emplearn las frmulas para trabajar con
la calculadora de bolsillo.
La frmula que utilizaremos es la siguiente:

)(

)
[

] *

+


Para obtener los datos que deben aplicarse en la frmula N 4.1.2., vamos a
construir el cuadro auxiliar N 4.1.8, al mismo tiempo que se explica el
significado de los smbolos de esa frmula.
Lo primero que hacemos es reemplazar los intervalos horizontales y
verticales por sus respectivas marcas de clase; a continuacin
adicionaremos al Cuadro N 4.1.7, cinco columnas por el lado derecho;
cuyos encabezamientos son:

para la primera

para la segunda,


para la tercera,

para la cuarta y

para la quinta columna.


Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran:

para la primera

para la segunda fila que est debajo de la anterior,

para la tercera fila y por ltimo,

para la cuarta fila que est debajo


de todas; de esta manera se va elaborando el Cuadro Auxiliar N 4.1.8.
1) Para determinar las frecuencias marginales que se deben colocar en la
columna

para la primera

para la segunda,

para la tercera,


sumamos las frecuencias de las celdas que estn en la misma fila de la
marca de clase 75, obtenemos: 3+2+2=7, nmero que se escribe en el
primer casillero o celda de la columna

para la primera

para la
segunda,

para la tercera,

En la fila de la marca de clase 65,


sumamos 1+4+5=10, nmero que se escribe debajo del 7.
Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.
Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.
En igual forma: 7+15+6=28.
Lo mismo: 8+2+1=11
Y en la ltima fila: 1+1+2=4
A continuacin sumamos estas frecuencias marginales de la variable Y:
7+10+27+47+28+11+4=134 es el total general.

2) Ahora a determinar las frecuencias marginales de la variable X: En
columna encabezada con la marca de clase 25 sumemos verticalmente
las frecuencias: 1+2+4+7+8+1=23.
En la columna encabezada con 35, tenemos: 3+6+14+15+2=40
En la siguiente: 2+4+16+19+6+1=48
En la ltima: 2+5+3+10+1+2=23

3) Centremos nuestra atencin en la columna encabezada

para la
primera

para la segunda,

para la tercera,

este signo significa


desviacin unitaria, y procedemos en la misma forma que en las Tablas
N 2.1.2 y N 2.1.3 (b). recuerden que las desviaciones unitarias
positivas: +1, +2, y +3 corresponden a los intervalos mayores y por el
contrario las desviaciones unitarias negativas: -1, -2 y -3 corresponden a
los intervalos menores. Como origen de trabajo se tom la marca de
clase 45 y por lo tanto su desviacin unitaria es cero.

4) Luego vamos a determinar las desviaciones unitarias horizontales de la
variable X. el origen de trabajo es la marca de clase 45 que se halla en la
fila superior del cuadro, por esa razn, escribimos cero debajo de la
frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se
escriben a la izquierda cero, porque se corresponden con los intervalos
de clase que tienen menores marcas de clase y que estn a la izquierda
de 45. La desviacin unitaria positiva, se corresponde con el intervalo de
mayor marca de clase, 55 (en parte superior del Cuadro N 4.1.8.)

5) A continuacin vamos a determinar los valores que deben colocarse en la
columna encabezada

; este smbolo indica que se debe multiplicar


cada valor de

por su correspondiente valor de

, as: 7(+3)=21;
10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12.
Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y
(-28)+ (-22)+ (-12)=-62 los negativos.

Por ltimo: 68-62=6 total, que se coloca en la parte inferior de la columna

Para obtener los valores de la cuarta columna encabezada

debemos
tener en cuenta que (

)(

, por lo tanto basta multiplicar cada


valor de la segunda columna por su correspondiente valor de la tercera
columna as se obtiene el respectivo valor de la cuarta columna. En efecto:
(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-
3)(-12)=36
La suma: 63+40+27+28+44+36=238
Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que
(

)(

)=

por consiguiente basta multiplicar verticalmente un valor de la


primera fila por su correspondiente valor de la segunda dila para obtener el
respectivo valor de la tercera fila.
(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23

Sumando horizontalmente:
(-46)+ (-40)+ (23)=-86+23=-63

Vamos por la cuarta fila; vemos que (

)(

. Luego basta
multiplicar cada elemento de la segunda fila por su correspondiente
elemento de la tercera fila para obtener el respectivo elemento de la cuarta
fila as:
(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23

Para obtener los valores de la quinta columna

observamos que
hay tres factores; el 1 es la frecuencia

de la celda o casillero que se est


considerando, el segundo factor es la desviacin unitaria

, el tercer factor
es la desviacin unitaria

. Por tanto el procedimiento ser el siguiente:


Tomemos el nmero 3 que es la frecuencia de la celda determinada por el
cruce de los intervalos que tienen la marcha de clase 75 horizontalmente y
35 verticalmente.

Bajemos la vista del nmero 3 hacia donde se halla el respectivo valor (-1)
de la desviacin unitaria

(ver la lnea punteada).



Para indicar el tercer factor corremos la vista del nmero 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias

y ubicamos el
nmero +3 (ver la lnea punteada) formemos el producto de estos tres
nmeros: (3) (-1) (+3)=-9. Este nmero -9 encerrado en un semicrculo lo
escribimos en la celda elegida.
En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0
Continuando hacia la derecha: (2) (+1) (+3)=6





CUADRO AUXILIAR N 4.1.8












CUADRO CORREGIDO DEL CUADRO AUXILIAR N 4.1.8


La frmula del paso (9) lleva el signo para indicar que se deben sumar
horizontalmente los nmeros que estn encerrados en los semicrculos de
esa primera fila elegida, as: -9+0+6=-3. Este nmero se escribe en la quinta
columna.
Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un
semicrculo.
(0)(-1)(+2)=0
(4)(0)8+2)=0
(5)(+1)(+2)=10
Sumando 0+0+10=10
Ahora con la tercera fila:
(2)(-2)(+1)=-4
(6)(-1)(+1)=-6
(16)(0)(+1)=0
(3)(+1)(+1)=3
Sumando: (-4)+(-6)+0+3=-7
Cuarta fila:
(7)(-2)(-1)=14
(15)(-1)(-1)=15
(6)(0)(-1)=0
(0)(+1)(-1)=0
La suma es: 14+15=29
(8)(-2)(-2)=32
(2)(-1)(-2)=4
(0)(0)(-2)=0
(1)(+1)(-2)=-2
La suma es: 32+4-2=34
Sptima fila:
(1)(-2)(-3)=6
(1)(0)(-3)=-6
(2)(1)(-3)=-6
Sumando: 6+0-6=0
Sumando los valores de la columna quinta.
-3+6-7+0+29+34+0=69-10=59
Reuniendo los resultados anteriores, se tienen los datos para aplicar en
frmula N 4.1.2.
n=134



()()()()
[()()()

][()()()

]



( )( )




EJERCICIO RESUELTO N2 DE CLCULO DEL COEFICIENTE DE
CORRELACIN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS
Calcular el coeficiente de correlacin lineal de las puntuaciones en
matemticas de 100 estudiantes de la Facultad de Ciencias de la
Universidad MN.
CUADRO N4.1.9


CUADRO N4.1.10



En este problema tenemos que calcular el coeficiente de correlacin lineal r
para dos conjuntos de datos, constituidos por los calificativos en una escala
de 0 a 100, en matemticas y en fsica para 100 estudiantes de la Facultad
de Ciencias de cierta Universidad.

Los datos se muestran en el cuadro N4.1.9. Notemos que a lo largo de la
lnea horizontal superior se encuentran los intervalos que contienen los
calificativos de matemticas desde 40 hasta 100.

Igualmente en la primera columna vertical izquierda, se encuentran los
calificativos para fsica de los mismos estudiantes, desde el calificativo 40
hasta 100. Ntese que en la columna de los calificativos de fsica los datos
crecen de abajo hacia arriba y para la fila horizontal superior vemos que los
calificativos en matemticas crecen de izquierda a derecha.
A continuacin procedemos a calcular el coeficiente de correlacin r para
estos datos aplicando el mismo mtodo que utilizamos en el problema
anterior.

1) Traslademos los datos del cuadro N4.1.9 al cuadro N4.1.10.
llamaremos fxy a cualquiera de las frecuencias de los casilleros interiores
del cuadro N4.1.9. en el cuadro N4.1.10 podemos observar que se han
agregado cinco columnas por el lado derecho y cuatro filas por la parte
inferior.

Observaremos en el cuadro N4.1.10 que los intervalos para la puntuacin
en matemticas y para la puntuacin en fsica se han reemplazado por las
marcas de clase correspondientes. As en la fila horizontal superior se ha
reemplazado el primer intervalo 4050 por su marca de clase 45, el
segundo intervalo 5060 por su marca de clase 55 y de esta manera se
han reemplazado los dems intervalos por sus marcas de clases en el
cuadro N4.1.10.

De igual forma para la columna primera de la izquierda vemos que los
intervalos se han reemplazado por sus respectivas marcas de clase as, para
la puntuacin en fsica el primer intervalo superior 90 100 se han
reemplazado por su marca de clase 95, el segundo intervalo superior
8090 se ha reemplazado por su marca de clase 85 y as sucesivamente
hasta llegar el intervalo inferior 4050 que se ha reemplazado por su marca
de clase 45.

Ahora vamos a realizar los pasos siguientes:
1) Para determinar las frecuencias marginales

sumemos todos los


valores

de la primera fila que tiene la marca de clase 95. De esta


forma tenemos: 2+5+5=12. Para la segunda fila que corresponde a la
marca de clase 85, obtenemos: 1+3+6+5=15 que escribimos en el
segundo casillero de

. Continuando con la suma de los nmeros,

de
las filas llenamos la columna

. .
2) Dediquemos nuestra atencin a las frecuencias marginales

. El primer
resultado de

lo obtenemos sumando las frecuencias

para la
columna que tiene la marca de clase 45, de esta forma tenemos:
2+4+4=10 que se escribe en el primer casillero de la fila

. Para el
segundo casillero tenemos el nmero 15 que se obtiene sumando
verticalmente las frecuencias

de la columna que tiene la marca de


clase 55. Continuando con la suma de las

de las dems columnas,


llenamos las frecuencias marginales

.
3) Atendamos ahora la columna

. La columna

tiene en total 6 casilleros


arbitrariamente escogemos uno de estos casilleros como origen de
trabajo le asignamos el nmero. Observemos ahora la primera columna
de la izquierda en donde estn las marcas de clase de los puntajes de
fsica. Aqu observamos que las marcas de clase crecen de abajo hacia
arriba, entonces las desviaciones unitarias en la columna

crecern de
abajo hacia arriba. Entonces del 0 hacia abajo, las desviaciones unitarias
son nmeros negativos que van decreciendo hacia abajo.
Desde el 0 hacia arriba las desviaciones unitarias sern positivas y
crecientes.

De manera que podemos observar que la columna

est conformada
por los siguientes nmeros que crecen del cero hacia arriba: 1,2 y desde
el cero hacia abajo decrecen: -1, -2, -3.

4) Veamos la fila


Notamos que en la fila horizontal superior las marcas de clase crecen de
izquierda a derecha, de igual forma las desviaciones unitarias crecern
de izquierda a derecha. Elegimos como origen de trabajo arbitrariamente
uno de los casilleros de

, el tercero contando de izquierda a derecha, y


vamos asignando nmeros positivos crecientes hacia la derecha del 0,
as tenemos 1, 2 y 3 y hacia la izquierda, a partir del cero, tendremos: -1
y -2.
5) Expliquemos la columna

multipliquemos cada valor de

por su
correspondiente valor de

y se obtiene un valor

. Por ejemplo el
nmero 24 se obtiene multiplicando la frecuencia marginal

por su
correspondiente desviacin unitaria

esto es, 12x2=24. Para el


segundo casillero multiplicamos 15x1=15; para el tercero 25x0=0, as
hasta terminar con 11 x (-3)=-33.
6) Observamos la columna

. La primera celda de esta columna tiene el


nmero 48 que se obtiene multiplicando el valor

de la segunda
columna por su correspondiente valor

=24, de la tercera columna, es


decir, 2 x 24 = 48. Para el segundo casillero de la columna

,
tenemos 15 que es igual a 1 x 15. De esta forma continuamos llenando
los dems valores de la columna

.

7) Veamos ahora la fila

. El nmero -20 del primer casillero de esta fila


se obtiene multiplicando la frecuencia marginal

por su
correspondiente desviacin unitaria

, es decir: 10(-2)=-20.

Para el segundo casillero de

, multiplicamos (-1) x (-15) = 15 y as


sucesivamente hasta 12 x 3 = 36.


8) Veamos la fila

. El primer casillero de esta fila es 40 y es el


resultado de multiplicar -2 del primer casillero de la fila

por -20 de
su correspondiente primer casillero de la fila

esto es. (-2) x (-20) = 40.


Para el segundo casillero de

multiplicamos -1 del segundo casillero

por -15 de su correspondiente segundo casillero de

, luego
obtenemos (-1) x (-15) = 15. As continuamos multiplicando los valores de
los valores de los casilleros de la fila

por sus correspondientes


valores de la fila

hasta llegar a (3) (36) =108.



9) Interesa ahora obtener los nmeros encerrados en semicrculos, por
ejemplo, el nmero 4, que corresponde a la marca de clase 75 para la
puntuacin en matemticas y a la marca de clase 95 de la puntuacin en
fsica.

Para saber cmo se obtiene este nmero 4, corramos nuestra vista hacia la
derecha dirigindose hacia la columna

y obtenemos el nmero 2. Del


nmero 4, encerrado en semicrculo, bajemos la vista con direccin a la fila

y obtenemos 1. La frecuencia del casillero donde est el 4, encerrado en


semicrculo, es

. Multiplicando estos tres factores


tendremos:

()()() .
Podemos enunciar la siguiente regla:

Para obtener los valores encerrados en semicrculos en los casilleros
interiores del cuadro N4.1.10, multiplicamos el valor de la frecuencia

del
casillero para la cual estamos haciendo el clculo, por los valores de las
desviaciones unitarias

, obtenidas corriendo la vista hacia la derecha


hasta columna

y tambin hacia abajo hasta llegar a la fila

.
As por ejemplo, para el casillero que corresponde a las marcas de clase 75
en matemtica y 85 en fsica, tenemos la frecuencia de la celda

, los
otros dos factores son:

=1.
Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicrculo.
Para el casillero correspondiente a la marca de clase 55 en matemticas
marca de clase 45 en fsica, tenemos:

()()() que es el valor encerrado en semicrculo. As


podemos proceder para obtener todos los dems valores encerrados en
semicrculos.

Sumando las frecuencias marginales de la columna

, se tiene

.
Sumando los valores de la tercera columna se obtiene

. La
suma de los valores de la quinta columna:

=150

Para todas las filas, en el ltimo casillero de la derecha se tiene la suma de
los valores de la fila. As por ejemplo,

.
Para la tercera fila:

.
Para la cuarta fila:


Estos totales de filas y columnas reemplazamos en la frmula N4.1.2.

()() ()()
[(() ()

)][(() ()

)]



( )( )

()()




Vemos que el coeficiente de correlacin en este caso es 0,79

EJERCICIO PROPUESTO N1 DEL CLCULO DEL COEFICIENTE DE
CORRELACIN ENTRE DOS CONJUNTOS AGRUPADOS DE DATOS.

Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba
de conocimientos de Psicologa General (variable x) y un test de inteligencia
(variable y). los datos se muestran en el Cuadro N4.1.11.

Aplicando los datos tomados del Cuadro Auxiliar N4.1.12 en la frmula
N4.1.2, tenemos:
Resultado:

() ()()
[(() ()

)][(() ()

)]



( )( )

()()



REGRESIN LINEAL SIMPLE

REGRESIN LINEAL SIMPLE
Al comenzar a estudiar las tcnicas de correlacin afirmamos que
estudiaramos dos variables y no solamente una. Llamamos en esa ocasin
x a una de las variables y a la otra. En el tema que nos ocuparemos ahora,
estudiaremos la forma tabla N4.2.1, similar a lo que utilizamos correlacin,
conocimiento el puntaje en la prueba de habilidad mental (variable x) para un
alumno determinado, podemos anticipar el puntaje del examen de admisin
(variable y) del mismo alumno.
Consideramos la relacin lineal expresada por el cuadro N4.2.1. si
dibujamos esa relacin, obtenemos el grfico N4.2.1. como podemos
observar todos los puntos se alinean exactamente en una sola lnea recta
lo que recibe el nombre de lnea de regresin. Teniendo en cuenta esta
lnea, podemos predecir cualquiera de los valores de y conociendo el valor
de x: Para x = 25, segn la recta, corresponde y = 35, para x =20,
corresponde y=30, etc. En este caso se trata de una correlacin positiva
perfecta cuyo coeficiente de correlacin es +1.
CUADRO N4.2.1

PRUEBA DE
HABILIDAD MENTAL
X
EXAMEN DE
ADMISIN
Y
Susana 5 15
Ivn 10 20
Lourdes 15 25
Aldo 20 30
Juan 25 35
Mara 30 40
Csar 35 45
Olga 40 50


Recordemos el grfico N4.2.1 que dibujamos cuando estudiamos
correlacin, en este grfico observamos el diagrama de dispersin
aproximado por una lnea recta, la recta es mejor ajuste, a los puntos del
diagrama de dispersin, es decir, en la mejor medida procure dejar igual
nmeros de puntos del diagrama de dispersin por encima de ella que igual
nmero de puntos de abajo, se llama lnea de regresin.

ECUACIN DE LA REGRESIN RECTILNEA
La ecuacin que describe la lnea de regresin es.

)X-r(



En donde:
Media de variable y en la muestra

EJEMPLO PROPUESTO N2 DEL CLCULO DEL COEFICIENTE DE
CORRELACIN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS

Supongamos que se tiene 50 vendedores de cierta compaa. Estos
vendedores durante un ao 1985 han realizado ventas tal como lo muestra
el cuadro N4.1.13, el que tambin muestra el nmero de aos de
experiencia que tienen como vendedores.

Para dicho cuadro, se pide calcular el coeficiente de correlacin lineal r.


CUADRO N4.1.13


Tomando los datos obtenidos en el Cuadro Auxiliar N4,1,14 apliquemos en
la frmula N4.1.12, se tiene:

Resultado:

() ()()
[(() ()

)][(() ()

)]



( )( )

()()






CUADRO AUXILIAR N4.1.14


GRFICO N 4.2.1

= media de la variable X en la muestra.


X = un valor de la variable X
r = coeficiente de Pearson, de la correlacin lineal entre las variables X y Y

desviacin estndar de Y en la muestra

desviacin estndar de X en la muestra

valor Y resultante del clculo de la frmula.



Veamos cmo podemos predecir los valores de Y a partir de los valores de
X. Estudiemos el Cuadro N 4.2.1. Cmo el grfico de este cuadro es una
lnea recta ascendente sabemos que su coeficiente de correlacin de
Pearson r=+1. Adems tenemos los siguientes resultados:

=22.5

11.46

11.46

=32.5
Estos resultados se pueden calcular a partir de los datos del cuadro N4.2.1.
Apliquemos estos datos a la frmula N4.2.1, obtenemos la siguiente
expresin:

() (

)X-(1)(

)

Simplificando trminos obtenemos:


Escojamos cualquier valor de X del Cuadro N4.2.1 por ejemplo para Mara
X=30, reemplazando este valor en (b).



Vemos en el Cuadro N4.2.1 el valor que corresponde a Mara efectivamente
es 40. Es decir, podemos usar la ecuacin N4.2.1 para predecir los valores
de Y conociendo los valores de X.

Esta frmula de regresin se puede para dos variables X y Y, entre las
cuales no es obligatorio que exista una correlacin lineal perfecta, es decir,
no es obligatorio que r para la correlacin entre X y Y sea siempre igual a 1.
Este valor de r para otras aplicaciones de la regresin, puede tomar
cualquier valor distinto.

EJERCICIO RESUELTOS DE REGRESIN LINEAL SIMPLE
Al aplicar un test de inteligencia a una muestra representativa constituida por
800 alumnos, se obtuvo la puntuacin media de 30,4 puntos, con la
desviacin estndar de 12.6 puntos.
La edad media de la muestra fue de 14.5 aos, con la desviacin estndar
de 3.2 aos.

El coeficiente de correlacin lineal de Pearson entre la variable Y, edad de
sujetos estudiados y la variables X, rendimiento mental de los mismos
sujetos, fue r=0,89

Con estos datos se pide determinar la ecuacin de regresin rectilnea de
edad en base del puntaje del rendimiento mental.

Qu edad corresponde a los sujetos que alcanzan puntuaciones de:

25 puntos

?
Datos:

= 14.5

3.2

12.6

Aplicando estos datos en la frmula N 4.2.1 se tiene:

)X-0.89(

. Es la ecuacin de regresin buscada


Respuesta de la primera pregunta

()


Segunda pregunta

()


Tercera pregunta

()


Cuarta pregunta

()


Quinta pregunta

()


Sexta pregunta

()


RELACIONES

La correlacin se ocupa de establecer la magnitud y la direccin de las
relaciones. Antes de profundizar en estos aspectos particulares de las
relaciones, analizaremos algunas caractersticas generales de stas, con las
cuales podemos comprender mejor el material especfico acerca de la
correlacin.




RELACIONES LINEALES

Para iniciar nuestro anlisis de las relaciones, veamos una relacin entre dos
variables. La siguiente tabla muestra el salario mensual que percibieron
cinco agentes ventas y el valor en dlares de la mercanca vendida por cada
uno de ellos en ese mes.
AGENTE VARIABLE X MERCANCA
VENDIDA ($)
Y VARIABLE
SALARIO ($)
1
2
3
4
5
0
1000
2000
3000
4000
500
900
1300
1700
2100

Podemos analizar mejor la relacin entre estas variables si trazamos una
grfica utilizando los valores X y Y, para cada agente de ventas, como los
puntos de dicha grfica. l es una grfica de dispersin o dispersigrama.

Una grfica de dispersin o dispersigrama es una grfica de parejas
de valores X y Y.

La grfica de dispersin para los datos de los agentes de ventas aparece
en la figura 6.1. En relacin con esta figura, vemos que todos los puntos
caen sobre una lnea recta. Cuando una lnea recta describe la relacin
entre dos variables, se dice que esta relacin lineal.





Una relacin lineal entre dos variables es aquella que puede
representarse con la mejor exactitud mediante una lnea recta.

Observe que no todas las relaciones son lineales; algunas son
curvilneas. En este caso, al trazar una grfica de dispersin para las
variables X y Y, una lnea curva ajusta mejor a los datos que una lnea
recta.






CLCULO DE LA (r) DE PEARSON

La ecuacin para calcular la r de Pearson mediante datos:



Donde

es la suma de los productos de cada pareja de puntajes z.


Para utilizar esta ecuacin, primero hay que convertir cada dato en bruto en
su valor transformado. Esto puede tardar mucho tiempo y crear errores de
redondeo. Con algn lgebra, esta ecuacin se puede transformar en una
ecuacin de clculo que utilice datos en bruto:

ECUACIN PARA EL CLCULO DE LA (r) DE PEARSON


()()

()

] [

()

]


Dnde: es la suma de los productos de cada pareja X y Y,
tambin se llama la suma de productos cruzados.

La tabla 6.4 contiene algunos de los datos hipotticos reunidos a partir de
cinco sujetos.

Datos hipotticos para el clculo de la r de Pearson


TABLA 6.4
SUBJETIVO X Y

XY
A 1 2 1 4 2
B 3 5 9 25 15
C 4 3 16 9 12
D 6 7 36 49 42
E 7 5 49 25 35
TOTAL 21 22 111 112 106



()()

()

] [

()

]



()

[
()

] [
()




Utilicemos estos datos para calcular la r de Pearson:


()()

()

] [

()

]


es la suma de los productos cruzados; se determina multiplicando los
datos X y Y para cada sujeto y luego sumando los productos resultantes. El
clculo de y de los otros trminos aparece en la tabla 6.4. Al sustituir
estos valores en la ecuacin anterior, obtenemos.



()

[
()

] [
()





PROBLEMA DE PRCTICA 6.1

Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para
su conveniencia, hemos reproducido estos datos en las primeras tres
columnas de la tabla 6.5. En este ejemplo tenemos una relacin lineal
imperfecta y estemos interesados en calcular la magnitud y direccin de la
relacin mediante la r de Pearson. La solucin tambin aparece en la tabla
6.5.

IQ y el promedio de las calificaciones: clculo de la r de Pearson




TABLA 6.5
ESTUDIANTE
NMERO
IQX PROMEDIO
DE
DATOS Y


1
2
3
4
5
6
7
8
9
10
11
12
110
112
118
119
122
125
127
130
132
134
136
138
1.0
1.6
1.2
2.1
2.6
1.8
2.6
2.0
3.2
2.6
3.0
3.6
12,100
12,544
13,924
14,161
14,884
15,625
16,129
16,900
17,424
17,956
18,496
19,044
1.00
2.56
1.44
4.41
6.76
3.24
6.76
4.00
10.24
6.76
9.00
12.96
110.0
179.2
141.6
249.9
317.2
225.0
330.2
260.0
422.4
384.4
408.0
496.8
TOTAL 1503 27.3 189,187 69.13 3488.7



()()

()

] [

()

]



()

[
()

] [
()





PROBLEMA DE PRCTICA 6.2

Tratemos de resolver otro problema. Se ha puesto a reflexionar si es
verdad que los opuestos se atraen? Todos hemos estado ante parejas en las
que sus miembros parecen ser muy diferentes entre s. Pero esto es lo
usual? Qu fomenta la atraccin: las diferencias o las similitudes? Un
psiclogo social abord este problema pidiendo a 15 estudiantes que
respondieran un cuestionario relacionado con un sus actitudes hacia una
amplia gama de temas. Tiempo despus les mostr las actitudes de un
extrao hacia los mismos temas y les pidi que evaluaran su agrado o
inclinacin por el extrao y si, probablemente, disfrutaran el trabajar con l.
En realidad, las actitudes del extrao fueron elaboradas por el
experimentador y variaron de sujeto a sujeto, con respecto a la proporcin
de actitudes similares que hubo entre el extrao y el individuo que particip
en el experimento. De esa manera, se obtuvieron datos, para cada sujeto a
sus actitudes y la atraccin que sinti hacia un extrao, basada en las
actitudes de este ltimo hacia los mismos temas. Si los iguales se atraen,
entonces debera existir una relacin directa entre la atraccin hacia un
extrao y la proporcin de actitudes similares. Los datos se presentan en la
tabla 6.6. Entre mayor sea la atraccin, ms alto ser el puntaje. El puntaje
de atraccin mximo es de 14. Calcule el coeficiente de correlacin r de
Pearson * para determinar si existe una relacin directa entre la similitud de
actitudes y el grado de atraccin.

Datos y solucin del problema de prctica 6.2



TABLA 6.6
ESTUDIANTE
NMERO
PROPORCIN DE
ACTITUDES
SIMILARES X
ATRACCIN
Y


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.30
0.44
0.67
0.00
0.50
0.15
0.58
0.32
0.72
1.00
0.87
0.09
0.82
0.64
0.24
8.9
9.3
9.6
6.2
8.8
8.1
9.5
7.1
11.0
11.7
11.5
7.3
10.0
10.0
7.5
0.090
0.194
0.449
0.000
0.250
0.022
0.336
0.102
0.518
1.000
0.757
0.008
0.672
0.410
0.058
79.21
86.49
92.16
38.44
77.44
65.61
90.25
50.41
121.00
136.89
132.25
53.29
100.00
100.00
56.25
2.670
4.092
6.432
0.000
4.400
1.215
5.510
2.272
7.920
11.700
10.005
0.657
8.200
6.400
1.800
TOTAL 7.34 136.5 4.866 1279.69 73.273



()()

()

] [

()

]



()

[
()

] [
()





Por lo tanto, con base en estos estudiantes, existe una relacin muy fuerte
entre las similitudes y las atracciones.

Una segunda interpretacin de la r de Pearson. La r de Pearson tambin
se puede interpretar en trminos de la variabilidad de Y explicada por medio
de X. este punto de vista produce ms informacin importante acerca de r y
la relacin entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se
muestra una relacin imperfecta entre X y Y. En este ejemplo, la variable X
representa una competencia de ortografa y la variable Y la habilidad en la
escritura de seis estudiantes de tercer grado. Suponga que queremos
predecir la calificacin en la escritura de Mara, la estudiante cuya
calificacin en ortografa es de 88. Si no hubiese una relacin entre la
escritura y la ortografa.
EJERCICIOS DE APLICACIN
1. En un largo curso de introduccin a la sociologa, un profesor hace
dos exmenes. El profesor quiere determinar si las calificaciones de
los estudiantes en el segundo examen correlacionadas con las
calificaciones del primero. Para facilitar la los, se elige una muestra de
ocho estudiar calificaciones aparecen en la siguiente tabla.




a. Construya una grfica de dispersin para datos, utilizando la
calificacin del primer examen como la variable X. Parece
lineal la relacin?


b. Suponga que existe una relacin lineal en calificaciones de los
dos exmenes, calcule la r de Pearson.
c. Qu tan bien explican la relacin, las calificaciones del
segundo examen?





()()

()

] [

()

]

0
20
40
60
80
100
120
0 20 40 60 80 100
Series1


[
()

] [
()

]

0,629531757

Se puede decir que es una relacin Baja y positiva que los dos exmenes
tienen entre si

2. Un investigador realiza un estudio de la relacin entre el consumo de
cigarros y las enfermedades determinan la cantidad de cigarros
fumados diariamente y de das de ausencia en el trabajo dura ltimo
ao debido a una enfermedad para 13 individuos en la compaa
donde trabaja este investigador. Los datos aparecen en la tabla
anexa.

SUJETO CIGARROS
CONSUMIDOS
DAS DE
AUSENCIA
1
2
3
4
5
6
7
8
9
10
11
12
0
0
0
10
13
20
27
35
35
44
53
60
1
3
8
10
4
14
5
6
12
16
10
16

a. Construya una grfica de dispersin para estos datos: Se ve
una relacin lineal?
b. Calcule el valor de la r de Pearson.
c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto
disminuye el rango de ambas variables. Vuelva a calcular r
para los sujetos restantes. Qu afecto tiene la disminucin del
rango sobre r?
d. A utilizar todo el conjunto de datos, qu porcentaje de la
variabilidad en el nmero de das de ausencia es explicado por
la cantidad de cigarros fumados diariamente? De qu sirve
ese valor?



0
2
4
6
8
10
12
14
16
18
0 20 40 60 80
Series1




()()

()

] [

()

[
()

] [
()

]


0,6753


0
2
4
6
8
10
12
14
16
0 10 20 30 40
Series1



()()

()

] [

()

[
()

] [
()

]


0,0318

3. Un educador ha construido un examen para las aptitudes mecnicas y
desea determinar si ste es confiable, mediante dos administraciones
con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
estudiantes reciben dos administraciones del examen, donde la
segunda administracin ocurre un mes despus que la primera. Los
datos aparecen en la tabla.

a. Construya una grfica de dispersin para las parejas de datos.
b. Determine el valor de r.
c. Sera justo decir que ste es un examen confiable? Explique esto al
utilizar

.

SUJETO ADMINISTRACIN 1 ADMINISTRACIN 2
1
2
3
4
5
6
7
8
9
10
10
12
20
25
27
35
43
40
32
47
10
15
17
25
32
37
40
38
30
49



0
10
20
30
40
50
60
0 20 40 60
Series1


()()

()

] [

()

[
()

] [
()

]


0,9881

La investigacin no es confiable por que los datos son tomados en dos
fecha totalmente distintas

4. Un grupo de investigadores ha diseado un cuestionario sobre la
tensin, consistente en 15 sucesos. Ellos estn interesados en
determinar si existe una coincidencia entre dos culturas acerca de la
cantidad relativa de ajustes que acarrea cada suceso. El cuestionario
se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe
utilizar el evento matrimonio como estndar y juzgar los dems
eventos en relacin con el ajuste necesario para el matrimonio. El
matrimonio recibe un valor arbitrario de 50 puntos. Si se considera
que un evento requiere de ms ajustes que el matrimonio, el evento
debe recibir ms de 50 puntos. El nmero de puntos excedentes
depende de la cantidad de ajustes requeridos. Despus de que cada
sujeto de cada cultura ha asignado puntos a todos los eventos, se
promedian los puntos de cada evento. Los resultados aparecen en la
siguiente tabla:



EVENTOS ESTADOUNIDENSES ITALIANOS
Muerte de la esposa
Divorcio
Separacin de la pareja
Temporada en prisin
Lesiones personales
Matrimonio
Despedido del trabajo
Jubilacin
Embarazo
Dificultades sexuales
Reajustes econmicos
Problemas con la familia
poltica
Problemas con el jefe
Vacaciones
Navidad
100
73
65
63
53
50
47
45
40
39
39

29
23
13
12
80
95
85
52
72
50
40
30
28
42
36

41
35
16
10

a. Suponga que los datos tienen al menos una escala de intervalo
y calcule la correlacin entre los datos estadounidenses y la de
los italianos.
b. Suponga que los datos slo tienen una escala ordinal y calcule
la correlacin entre los datos de ambas culturas.

0
20
40
60
80
100
0 50 100 150
Series1




()()

()

] [

()

[
()

] [
()

]



0,8519

La r es alta y positiva es decir que los comportamiento de las dos
nacionalidades son bastante similares




INDIVIDUO EXMEN CON LPIZ
Y PAPEL
SIQUIATRA
A
SIQUIATRA
B
1
2
3
4
5
6
7
8
9
10
11
12
48
37
30
45
31
24
28
18
35
15
42
22
12
11
4
7
10
8
3
1
9
2
6
5
9
12
5
8
11
7
4
1
6
2
10
3


5. Un psiclogo ha construido un examen lpiz - papel, a fin de medir la
depresin. Para comparar los datos del examen con los datos de los
expertos, 12 individuos con perturbaciones emocionales realizan el
examen lpiz papel. Los individuos tambin son calificados de
manera independiente por dos siquiatras, de acuerdo con el grado de
depresin determinado por cada uno como resultado de entrevistas
detalladas. Los datos aparecen a continuacin. Los datos mayores
corresponden a una mayor depresin.


a. Cul es la correlacin entre los datos de los dos siquiatras?
b. Cul es la correlacin entre las calificaciones del examen con
lpiz y papel y los datos de cada siquiatra?






()()

()

] [

()

[
()

] [
()

]



0,8519
La relacin se da con un mismo criterio por los psiquiatras
0
2
4
6
8
10
12
14
0 5 10 15
Series1





()()

()

] [

()

[
()

] [
()

]

0,6973
La relacin entre las dos variables es baja y positiva

0
2
4
6
8
10
12
14
0 20 40 60
Series1




()()

()

] [

()

[
()

] [
()

]

0,697
6. Para este problema, suponga que usted es un psiclogo que labora
en el departamento de recursos humanos de una gran corporacin. El
presidente de la compaa acaba de hablar con usted acerca de la
importancia de contratar personal productivo en la seccin de
0
2
4
6
8
10
12
14
0 20 40 60
Series1
manufactura de la empresa y le ha pedido que ayude a mejorar la
capacidad de la institucin para hacer esto. Existen 300 empleados
en esta seccin y cada obrero fabrica el mismo artculo. Hasta ahora,
la corporacin slo ha recurrido a entrevistas para elegir a estos
empleados. Usted busca bibliografa y descubre dos pruebas de
desempeo, lpiz papel, bien estandarizadas, y piensa que podran
estar relacionados con los requisitos desempeo de esta seccin.
Para determinar si alguna de ellas se puede utilizar como dispositivo
de seleccin, elige 10 empleados representativos de la seccin de
manufactura, garantizando que un amplio rango de desempeo quede
representado en la muestra, y realiza las dos pruebas con cada
empleado. Los datos aparecen en la siguiente tabla.
Mientras mayor sea la calificacin, mejor ser el desempeo. Las
calificaciones de desempeo en el trabajo. Las calificaciones de
desempeo fabricados por cada empleado por semana, promediados
durante los ltimos 6 meses.
a. Construya una grfica de dispersin del desempeo en el
trabajo y la primera prueba, utilizando la prueba 1 como la
variable X. Parece lineal la relacin?
b. Suponga que la relacin anterior es lineal y calcule el valor de
la r de Pearson.
c. Construya una grfica de dispersin del desempeo en el
trabajo y la segunda prueba, utilizando la prueba 2 como la
variable X. Parece lineal la relacin?
d. Suponga que la relacin anterior es lineal, calcule el valor de la
r de Pearson.
e. Si slo pudiera utilizar una de las pruebas para la seleccin de
los empleados, utilizara alguna de ellas? En tal caso, cul
de ellas? Explique.





EMPLEADO
1 2 3 4 5 6 7 8 9 10
Desempeo en el
trabajo
50 74 62 90 98 52 68 80 88 76
Examen 1 10 19 20 20 21 14 10 24 16 14
Examen 2 25 35 40 49 50 29 32 44 46 35






()()

()

] [

()

]


0
20
40
60
80
100
120
0 10 20 30
Series1

[
()

] [
()

]


0,5917





()()

()

] [

()

]


0
20
40
60
80
100
120
0 20 40 60
Series1

[
()

] [
()

]


0,9076

ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIN
INTERNACIONAL
EVALUACIN
SEXTO A NOCHE


CLCULO DEL COEFICIENTE r DE PEARSON Y REALICE LA GRFICA

ESTUDIANTE
NMERO
PROPORCIN DE
ACTITUDES
SIMILARES X
ATRACCIN Y
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.30
0.44
0.67
0.00
0.50
0.15
0.58
0.32
0.72
1.00
0.87
0.09
0.82
0.64
0.24
8.9
9.3
9.6
6.2
8.8
8.1
9.5
7.1
11.0
11.7
11.5
7.3
10.0
10.0
7.5




EJERCICIO RESUELTO N2 DE CLCULO DEL COEFICIENTE DE
CORRELACIN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS
DETERMINANCDO EL CUADRO AUXILIAR Y REALICE LA GRFICA

PRUEBA DE
HABILIDAD MENTAL
X
EXAMEN DE
ADMISIN
Y
Susana 5 15
Ivn 10 20
Lourdes 15 25
Aldo 20 30
Juan 25 35
Mara 30 40
Csar 35 45
Olga 40 50


ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIN
INTERNACIONAL
EVALUACIN
SEXTO A NOCHE

EJERCICIO RESUELTO N2 DE CLCULO DEL COEFICIENTE DE
CORRELACIN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS
DETERMINANDO EL CUADRO AUXILIAR Y REALICE LA GRFICA

ESTADOUNIDENSES ITALIANOS
100
73
65
63
53
50
47
45
40
39
39
29
23
13
12
80
95
85
52
72
50
40
30
28
42
36
41
35
16
10

c. Suponga que los datos tienen al menos una escala de intervalo
y calcule la correlacin entre los datos estadounidenses y la de
los italianos.
d. Suponga que los datos slo tienen una escala ordinal y calcule
la correlacin entre los datos de ambas culturas.
Conclusiones
Desarrollo de ejercicios de correlacin y regresin lineal en donde se
efectu comparaciones de coeficientes y formulas estadsticas de las
variables determinadas.
Aplicacin de grficas para la determinacin de la relacin de las
variables dependientes e independientes.

Recomendaciones
Manejar y aplicar las frmulas matemticas para realizar un anlisis
estadstico de comparacin positivo.
Realizar un procedimiento con medidas especficas para la
elaboracin de las grficas.
Elaborar e interpretar con la mayor relacin posible grficas, datos y
frmulas estadsticas.

BIBLIOGRAFA
Legoas, L. A. (2008). Estadstica Bsica. En L. A. Legoas, Estadstica Bsica (pgs. 177-211).
Lima: San Marcos.
Mendano, J. (2007). Estadstica General. En J. Mendano, Estadstica General. Mxico:
Majangrail.
Zamora, M. C. (2006). Estadstica Inferencial. En M. C. Zamora, Estadstica Inferencial. Lima:
Moshera.

Vous aimerez peut-être aussi