Vous êtes sur la page 1sur 55

UNIVERSIDAD POLITCNICA ESTATAL DEL CARCHI

ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIN COMERCIAL


INTERNACIONAL

TEMA: Aplicacin de Ejercicios de estadstica


Msc. Jorge pozo

Integrante

Ayala Maricela
NIVEL: 6TO A

Periodo 2012
TEMA: Aplicacin de Ejercicios de estadstica

Problema:

La dificultad del estudiante para calcular los Ejercicios de estadstica

Objetivos:

Objetivo General.

Identificar como calcular los Ejercicios de estadstica

Objetivos Especficos.

Recopilar conceptos sobre los Ejercicios de estadstica

Analizar los conceptos sobre los Ejercicios de estadstica

Poner en prctica los conocimientos sobre los Ejercicios de estadstica

Justificacin

Este trabajo se realiza para que el estudiante sea prctico en el clculo de la


correlacin y relacin lineal y domine bien el tema y se involucre en
investigaciones cada vez ms profundas analizando algunas caractersticas
generales como es la de calcular el coeficiente de correlacin r de Pearson de
acuerdo a los datos planteados, al observar los resultados se puede sacar
importantes anlisis con el fin de determinar si es aceptable o no el tipo de
caso aplicado,

Desarrollo

CORRELACIN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN


CLASES

El presente tema nos conduce a calcular el coeficiente de correlacin r, que


nos proporciona informacin de la fuerza de la relacin que existe entre dos
conjuntos de datos que se encuentran agrupados, cada uno de ellos formando
por separados una distribucin de frecuencias, mejor dicho teniendo por
separado sus intervalos de clase con sus respectivas frecuencias.
Para realizar una exposicin del tema en forma ms entendible, presentamos el
ejemplo del Cuadro N 4.1.7.

Ejemplo:

Calcular el grado de correlacin entre las puntaciones obtenidas en inventario


de hbitos de estudio y los puntajes obtenidos en un examen de Matemtica,
aplicados a un total de 134 alumnos de un colegio de la localidad.

CUADRO N 4.1.7

X Hbitos de estudio
2030 3040 4050 5060 Total
Y Matemtica
7080 3 2 2 7
6070 1 0 4 5 10
5060 2 6 16 3 27
4050 4 14 19 10 47
3040 7 15 6 0 28
2030 8 2 0 1 11
1020 1 1 2 4
Total 23 40 48 23 134

Podemos notar que el problema no es tan simple, como el caso anterior, dado
que ahora los datos se han clasificado en una tabla de doble entrada N 4.1.7.
Este cuadro muestra, en la primera columna del lado izquierdo los intervalos de
clase de la variable Y, los que cubren todos los posibles datos acerca de las
puntuaciones alcanzadas por los estudiantes en la prueba de Matemtica.
Ntese que los intervalos crecen de abajo hacia arriba. En la fila superior se
presentan los intervalos de clase todos los 134 posibles datos acerca de los
puntajes obtenidos por los estudiantes en la variable hbitos de estudios
representados por la letra X.
Dentro del Cuadro N 4.1.7 en los casilleros interiores o celdas de la tabla, se
encuentran las frecuencias de celdas que corresponden a puntajes que
pertenecen tanto a un intervalo de la variable Y como a un intervalo de la
variable X.

En la fila interior del Cuadro se presentan los totales de los puntajes de la


variable X, hbitos de estudio. Esos totales se llaman frecuencias marginales
de la variable X y se representan por .

En la ltima columna de la derecha se encuentran los totales de los puntajes de


la variable rendimiento en matemtica. Estos totales se denominan frecuencias
marginales de la variable Y.

Cuando los datos se presentan tal como el presente caso, formando tablas de
doble entrada, es conveniente usar el mtodo clave que expondremos a
continuacin porque con este procedimiento se evita manejar grandes
nmeros, como sera el caso si se emplearn las frmulas para trabajar con la
calculadora de bolsillo.

La frmula que utilizaremos es la siguiente:

( )( )
=
2
[ 2 ( )2 ] [ 2 ( ) ]

Para obtener los datos que deben aplicarse en la frmula N 4.1.2., vamos a
construir el cuadro auxiliar N 4.1.8, al mismo tiempo que se explica el
significado de los smbolos de esa frmula.

Lo primero que hacemos es reemplazar los intervalos horizontales y verticales


por sus respectivas marcas de clase; a continuacin adicionaremos al Cuadro
N 4.1.7, cinco columnas por el lado derecho; cuyos encabezamientos son:
para la primera para la segunda, para la tercera, 2 para la cuarta
y para la quinta columna.
Por la parte inferior del cuadro le adicionamos cuatro filas que se nombran:
para la primera para la segunda fila que est debajo de la anterior,
para la tercera fila y por ltimo, 2 para la cuarta fila que est debajo de
todas; de esta manera se va elaborando el Cuadro Auxiliar N 4.1.8.

1) Para determinar las frecuencias marginales que se deben colocar en la


columna para la primera para la segunda, para la tercera,
sumamos las frecuencias de las celdas que estn en la misma fila de la
marca de clase 75, obtenemos: 3+2+2=7, nmero que se escribe en el
primer casillero o celda de la columna para la primera para la
segunda, para la tercera, . En la fila de la marca de clase 65,
sumamos 1+4+5=10, nmero que se escribe debajo del 7.
Para la fila de la marca de clase 55, tenemos: 2+6+16+3=27.
Para la fila de la marca de clase 45, se tiene: 4+14+19+10=47.
En igual forma: 7+15+6=28.
Lo mismo: 8+2+1=11
Y en la ltima fila: 1+1+2=4
A continuacin sumamos estas frecuencias marginales de la variable Y:
7+10+27+47+28+11+4=134 es el total general.

2) Ahora a determinar las frecuencias marginales de la variable X: En columna


encabezada con la marca de clase 25 sumemos verticalmente las
frecuencias: 1+2+4+7+8+1=23.
En la columna encabezada con 35, tenemos: 3+6+14+15+2=40
En la siguiente: 2+4+16+19+6+1=48
En la ltima: 2+5+3+10+1+2=23

3) Centremos nuestra atencin en la columna encabezada para la primera


para la segunda, para la tercera, este signo significa desviacin
unitaria, y procedemos en la misma forma que en las Tablas N 2.1.2 y N
2.1.3 (b). recuerden que las desviaciones unitarias positivas: +1, +2, y +3
corresponden a los intervalos mayores y por el contrario las desviaciones
unitarias negativas: -1, -2 y -3 corresponden a los intervalos menores. Como
origen de trabajo se tom la marca de clase 45 y por lo tanto su desviacin
unitaria es cero.

4) Luego vamos a determinar las desviaciones unitarias horizontales de la


variable X. el origen de trabajo es la marca de clase 45 que se halla en la
fila superior del cuadro, por esa razn, escribimos cero debajo de la
frecuencia marginal 48. Las desviaciones unitarias negativas: -1 y -2 se
escriben a la izquierda cero, porque se corresponden con los intervalos de
clase que tienen menores marcas de clase y que estn a la izquierda de 45.
La desviacin unitaria positiva, se corresponde con el intervalo de mayor
marca de clase, 55 (en parte superior del Cuadro N 4.1.8.)

5) A continuacin vamos a determinar los valores que deben colocarse en la


columna encabezada ; este smbolo indica que se debe multiplicar
cada valor de por su correspondiente valor de , as: 7(+3)=21;
10(+2)=20; 27(+1)=27; 47(0)=0; 28(-1)=-28; 11(-2)=-22 y 4(-3)=-12.
Sumando algebraicamente, tenemos: 21+20+27=68 los positivos: y (-
28)+ (-22)+ (-12)=-62 los negativos.

Por ltimo: 68-62=6 total, que se coloca en la parte inferior de la columna

Para obtener los valores de la cuarta columna encabezada 2 debemos


tener en cuenta que ( )( ) = 2 , por lo tanto basta multiplicar cada
valor de la segunda columna por su correspondiente valor de la tercera
columna as se obtiene el respectivo valor de la cuarta columna. En efecto:

(+3)(21)=63; (+2)(20)=40; (+1)(27)=27; 0*0=0; (-1)(-28)=28; (-2)(-22)=44 y (-3)(-


12)=36

La suma: 63+40+27+28+44+36=238

Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que


( )( )= por consiguiente basta multiplicar verticalmente un valor de la
primera fila por su correspondiente valor de la segunda dila para obtener el
respectivo valor de la tercera fila.

(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23

Sumando horizontalmente:

(-46)+ (-40)+ (23)=-86+23=-63

Vamos por la cuarta fila; vemos que ( )( ) = 2 . Luego basta multiplicar


cada elemento de la segunda fila por su correspondiente elemento de la tercera
fila para obtener el respectivo elemento de la cuarta fila as:

(-2)(46)=92; (-1) (-40)=40; 0*0=0 y (+1) (23)=23

Para obtener los valores de la quinta columna observamos que hay


tres factores; el 1 es la frecuencia de la celda o casillero que se est
considerando, el segundo factor es la desviacin unitaria , el tercer factor es
la desviacin unitaria . Por tanto el procedimiento ser el siguiente:
Tomemos el nmero 3 que es la frecuencia de la celda determinada por el
cruce de los intervalos que tienen la marcha de clase 75 horizontalmente y 35
verticalmente.

Bajemos la vista del nmero 3 hacia donde se halla el respectivo valor (-1) de
la desviacin unitaria (ver la lnea punteada).

Para indicar el tercer factor corremos la vista del nmero 3 hacia su derecha
hasta llegar a la columna de las desviaciones unitarias y ubicamos el
nmero +3 (ver la lnea punteada) formemos el producto de estos tres
nmeros: (3) (-1) (+3)=-9. Este nmero -9 encerrado en un semicrculo lo
escribimos en la celda elegida.

En la misma fila tomamos la celda siguiente: (2) (0) (+3)=0

Continuando hacia la derecha: (2) (+1) (+3)=6

CUADRO AUXILIAR N 4.1.8

CUADRO CORREGIDO DEL CUADRO AUXILIAR N 4.1.8


La frmula del paso (9) lleva el signo para indicar que se deben sumar
horizontalmente los nmeros que estn encerrados en los semicrculos de esa
primera fila elegida, as: -9+0+6=-3. Este nmero se escribe en la quinta
columna.

Trabajemos con la siguiente fila: (1) (-2) (+2)=-4 se encierra en un semicrculo.

(0)(-1)(+2)=0

(4)(0)8+2)=0

(5)(+1)(+2)=10

Sumando 0+0+10=10

Ahora con la tercera fila:

(2)(-2)(+1)=-4

(6)(-1)(+1)=-6

(16)(0)(+1)=0
(3)(+1)(+1)=3

Sumando: (-4)+(-6)+0+3=-7

Cuarta fila:

(7)(-2)(-1)=14

(15)(-1)(-1)=15

(6)(0)(-1)=0

(0)(+1)(-1)=0

La suma es: 14+15=29

(8)(-2)(-2)=32

(2)(-1)(-2)=4

(0)(0)(-2)=0

(1)(+1)(-2)=-2

La suma es: 32+4-2=34

Sptima fila:

(1)(-2)(-3)=6

(1)(0)(-3)=-6

(2)(1)(-3)=-6

Sumando: 6+0-6=0

Sumando los valores de la columna quinta.

-3+6-7+0+29+34+0=69-10=59

Reuniendo los resultados anteriores, se tienen los datos para aplicar en frmula
N 4.1.2.

n=134
= 59

= 63

= 6

2 = 155

2 = 238

(134)(59)(63)(6)
=
[(134)(155)(63)2 ][(134)(238)(6)2 ]

7906 + 378
=
(20770 3969)(31892 36)

8284
=
535212656

8284
=
23134.66

= 0.358

RELACIONES

La correlacin se ocupa de establecer la magnitud y la direccin de las


relaciones. Antes de profundizar en estos aspectos particulares de las
relaciones, analizaremos algunas caractersticas generales de stas, con las
cuales podemos comprender mejor el material especfico acerca de la
correlacin.
RELACIONES LINEALES

Para iniciar nuestro anlisis de las relaciones, veamos una relacin entre dos
variables. La siguiente tabla muestra el salario mensual que percibieron cinco
agentes ventas y el valor en dlares de la mercanca vendida por cada uno de
ellos en ese mes.

AGENTE VARIABLE X MERCANCA Y VARIABLE


VENDIDA ($) SALARIO ($)
1 0 500
2 1000 900
3 2000 1300
4 3000 1700
5 4000 2100

Podemos analizar mejor la relacin entre estas variables si trazamos una


grfica utilizando los valores X y Y, para cada agente de ventas, como los
puntos de dicha grfica. l es una grfica de dispersin o dispersigrama.

Una grfica de dispersin o dispersigrama es una grfica de parejas de


valores X y Y.

La grfica de dispersin para los datos de los agentes de ventas aparece en


la figura 6.1. En relacin con esta figura, vemos que todos los puntos caen
sobre una lnea recta. Cuando una lnea recta describe la relacin entre dos
variables, se dice que esta relacin lineal.

Una relacin lineal entre dos variables es aquella que puede representarse
con la mejor exactitud mediante una lnea recta.
Observe que no todas las relaciones son lineales; algunas son curvilneas.
En este caso, al trazar una grfica de dispersin para las variables X y Y,
una lnea curva ajusta mejor a los datos que una lnea recta.

CLCULO DE LA (r) DE PEARSON

La ecuacin para calcular la r de


Pearson mediante datos:


=
1

Donde es la suma de los productos de cada pareja de puntajes z.


Para utilizar esta ecuacin, primero hay que convertir cada dato en bruto en su
valor transformado. Esto puede tardar mucho tiempo y crear errores de
redondeo. Con algn lgebra, esta ecuacin se puede transformar en una
ecuacin de clculo que utilice datos en bruto:

ECUACIN PARA EL CLCULO DE LA (r) DE PEARSON

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

Donde: es la suma de los productos de cada pareja X y Y, tambin


se llama la suma de productos cruzados.

La tabla 6.4 contiene algunos de los datos hipotticos reunidos a partir de cinco
sujetos.

Datos hipotticos para el clculo de la r de Pearson

TABLA 6.4

SUBJETIVO X Y XY
A 1 2 1 4 2
B 3 5 9 25 15
C 4 3 16 9 12
D 6 7 36 49 42
E 7 5 49 25 35
TOTAL 21 22 111 112 106

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

21(22)
106
= 5
(21)2 (22)2
[111 ] [112 ]
5 5
13.6
=
18.616

= 0.731

= 0.73

Utilicemos estos datos para calcular la r de Pearson:

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

es la suma de los productos cruzados; se determina multiplicando los


datos X y Y para cada sujeto y luego sumando los productos resultantes. El
clculo de y de los otros trminos aparece en la tabla 6.4. al sustituir
estos valores en la ecuacin anterior, obtenemos.

21(22)
106
= 5
(21)2 (22)2
[111 ] [112 ]
5 5

13.6
=
18.616

= 0.731

= 0.73

PROBLEMA DE PRCTICA 6.1


Resolvamos otro ejercicio. Esta utilizaremos los datos de la tabla 6.1. Para su
conveniencia, hemos reproducido estos datos en las primeras tres columnas de
la tabla 6.5. En este ejemplo tenemos una relacin lineal imperfecta y estemos
interesados en calcular la magnitud y direccin de la relacin mediante la r de
Pearson. La solucin tambin aparece en la tabla 6.5.

IQ y el promedio de las calificaciones: clculo de la r de Pearson

TABLA 6.5

ESTUDIANTE IQX PROMEDIO


NMERO DE DATOS Y
1 110 1.0 12,100 1.00 110.0
2 112 1.6 12,544 2.56 179.2
3 118 1.2 13,924 1.44 141.6
4 119 2.1 14,161 4.41 249.9
5 122 2.6 14,884 6.76 317.2
6 125 1.8 15,625 3.24 225.0
7 127 2.6 16,129 6.76 330.2
8 130 2.0 16,900 4.00 260.0
9 132 3.2 17,424 10.24 422.4
10 134 2.6 17,956 6.76 384.4
11 136 3.0 18,496 9.00 408.0
12 138 3.6 19,044 12.96 496.8
TOTAL 1503 27.3 189,187 69.13 3488.7

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

1503(27.3)
3488.7
= 12
(1503) 2 (27.3)2
[189,187 ] [69.13
12 12 ]
69.375
=
81.088

= 0.856

= 0.86

PROBLEMA DE PRCTICA 6.2

Tratemos de resolver otro problema. Se ha puesto a reflexionar si es verdad


que los opuestos se atraen? Todos hemos estado ante parejas en las que sus
miembros parecen ser muy diferentes entre s. Pero esto es lo usual? Qu
fomenta la atraccin: las diferencias o las similitudes? Un psiclogo social
abord este problema pidiendo a 15 estudiantes que respondieran un
cuestionario relacionado con un sus actitudes hacia una amplia gama de
temas. Tiempo despus les mostr las actitudes de un extrao hacia los
mismos temas y les pidi que evaluaran su agrado o inclinacin por el extrao
y si, probablemente, disfrutaran el trabajar con l. En realidad, las actitudes
del extrao fueron elaboradas por el experimentador y variaron de sujeto a
sujeto, con respecto a la proporcin de actitudes similares que hubo entre el
extrao y el individuo que particip en el experimento. De esa manera, se
obtuvieron datos, para cada sujeto a sus actitudes y la atraccin que sinti
hacia un extrao, basada en las actitudes de este ltimo hacia los mismos
temas. Si los iguales se atraen, entonces debera existir una relacin directa
entre la atraccin hacia un extrao y la proporcin de actitudes similares. Los
datos se presentan en la tabla 6.6. Entre mayor sea la atraccin, ms alto ser
el puntaje. El puntaje de atraccin mximo es de 14. Calcule el coeficiente de
correlacin r de Pearson * para determinar si existe una relacin directa entre la
similitud de actitudes y el grado de atraccin.

Datos y solucin del problema de prctica 6.2


TABLA 6.6

ESTUDIANTE PROPORCIN DE ATRACCIN


NMERO ACTITUDES Y
SIMILARES X
1 0.30 8.9 0.090 79.21 2.670
2 0.44 9.3 0.194 86.49 4.092
3 0.67 9.6 0.449 92.16 6.432
4 0.00 6.2 0.000 38.44 0.000
5 0.50 8.8 0.250 77.44 4.400
6 0.15 8.1 0.022 65.61 1.215
7 0.58 9.5 0.336 90.25 5.510
8 0.32 7.1 0.102 50.41 2.272
9 0.72 11.0 0.518 121.00 7.920
10 1.00 11.7 1.000 136.89 11.700
11 0.87 11.5 0.757 132.25 10.005
12 0.09 7.3 0.008 53.29 0.657
13 0.82 10.0 0.672 100.00 8.200
14 0.64 10.0 0.410 100.00 6.400
15 0.24 7.5 0.058 56.25 1.800
TOTAL 7.34 136.5 4.866 1279.69 73.273

( )( )

=
2 2
( ) 2 ( ) ]
[ 2 ] [

7.34(136.5)
73.273
= 15
(7.34)2 (136.5)2
[4.866 ] [1279.69 ]
15 15
6.479
=
6.916

= 0.937

= 0.94

Por lo tanto, con base en estos estudiantes, existe una relacin muy fuerte
entre las similitudes y las atracciones.

Una segunda interpretacin de la r de Pearson. La r de Pearson tambin se


puede interpretar en trminos de la variabilidad de Y explicada por medio de X.
este punto de vista produce ms informacin importante acerca de r y la
relacin entre X y Y. Considere, por ejemplo, la figura 6.9, en la cual se
muestra una relacin imperfecta entre X y Y. En este ejemplo, la variable X
representa una competencia de ortografa y la variable Y la habilidad en la
escritura de seis estudiantes de tercer grado. Suponga que queremos predecir
la calificacin en la escritura de Mara, la estudiante cuya calificacin en
ortografa es de 88. Si no hubiese una relacin entre la escritura y la ortografa.

EJERCICIOS DE APLICACIN

1. En un largo curso de introduccin a la sociologa, un profesor hace dos


exmenes. El profesor quiere determinar si las calificaciones de los
estudiantes en el segundo examen correlacionadas con las
calificaciones del primero. Para facilitar la los, se elige una muestra de
ocho estudiar calificaciones aparecen en la siguiente tabla.

ESTUDIANTE EXMEN 1 EXMEN 2


1 60 60
2 75 100
3 70 80
4 72 68
5 54 73
6 83 97
7 80 85
8 65 90

a. Construya una grfica de dispersin para datos, utilizando la


calificacin del primer examen como la variable X. Parece lineal
la relacin? 2
b. Suponga que existe una relacin lineal en calificaciones de los
dos exmenes, calcule la r de Pearson.
c. Qu tan bien explican la relacin, las calificaciones del segundo
examen?

120

100

80

60
Series1
40

20

0
0 20 40 60 80 100
( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

365027
46239
= 8
(559)2 (653)2
[39739 ] [54687
8 8 ]

=0,629531757

Se puede decir que es una relacin Baja y positiva que los dos exmenes
tienen entre si

2. Un investigador realiza un estudio de la relacin entre el consumo de


cigarros y las enfermedades determinan la cantidad de cigarros fumados
diariamente y de das de ausencia en el trabajo dura ltimo ao debido a
una enfermedad para 13 individuos en la compaa donde trabaja este
investigador. Los datos aparecen en la tabla anexa.

SUJETO CIGARROS DAS DE


CONSUMIDOS AUSENCIA
1 0 1
2 0 3
3 0 8
4 10 10
5 13 4
6 20 14
7 27 5
8 35 6
9 35 12
10 44 16
11 53 10
12 60 16

a. Construya una grfica de dispersin para estos datos: Se ve una


relacin lineal?
b. Calcule el valor de la r de Pearson.
c. Elimine los datos de los sujetos 1, 2, 3, 10, 11 y 12. Esto
disminuye el rango de ambas variables. Vuelva a calcular r para
los sujetos restantes. Qu afecto tiene la disminucin del rango
sobre r?
d. A utilizar todo el conjunto de datos, qu porcentaje de la
variabilidad en el nmero de das de ausencia es explicado por la
cantidad de cigarros fumados diariamente? De qu sirve ese
valor?
18
16
14
12
10
8 Series1
6
4
2
0
0 20 40 60 80

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

31185
3391
= 12
(297)2 (105)2
[12193 ] [1203
12 12 ]
= 0,6753

16
14
12
10
8
Series1
6
4
2
0
0 10 20 30 40

( )( )

=
2 2
( ) 2 ( ) ]
[ 2 ] [

7140
1197
= 6
(140)2 (51)2
[3842 ] [517
6 6 ]

= 0,0318
3. Un educador ha construido un examen para las aptitudes mecnicas y
desea determinar si ste es confiable, mediante dos administraciones
con un lapso de 1 mes entre ellas. Se realiza un estudio en el cual 10
estudiantes reciben dos administraciones del examen, donde la segunda
administracin ocurre un mes despus que la primera. Los datos
aparecen en la tabla.

a. Construya una grfica de dispersin para las parejas de datos.


b. Determine el valor de r.
c. Sera justo decir que ste es un examen confiable? Explique esto al
utilizar 2 .

SUJETO ADMINISTRACI ADMINISTRACI


N1 N2
1 10 10
2 12 15
3 20 17
4 25 25
5 27 32
6 35 37
7 43 40
8 40 38
9 32 30
10 47 49
60

50

40

30
Series1
20

10

0
0 20 40 60

( )( )

=
2 2
( ) 2 ( ) ]
[ 2 ] [

85263
9907
= 10
(291)2 (293)2
[9905 ] [9977
10 10 ]

= 0,9881
La investigacin no es confiable por que los datos son tomados en dos fecha
totalmente distintas

4. Un grupo de investigadores ha diseado un cuestionario sobre la


tensin, consistente en 15 sucesos. Ellos estn interesados en
determinar si existe una coincidencia entre dos culturas acerca de la
cantidad relativa de ajustes que acarrea cada suceso. El cuestionario se
aplica a 300 estadounidenses y 300 italianos. Cada individuo debe
utilizar el evento matrimonio como estndar y juzgar los dems eventos
en relacin con el ajuste necesario para el matrimonio. El matrimonio
recibe un valor arbitrario de 50 puntos. Si se considera que un evento
requiere de ms ajustes que el matrimonio, el evento debe recibir ms
de 50 puntos. El nmero de puntos excedentes depende de la cantidad
de ajustes requeridos. Despus de que cada sujeto de cada cultura ha
asignado puntos a todos los eventos, se promedian los puntos de cada
evento. Los resultados aparecen en la siguiente tabla:

EVENTOS ESTADOUNIDENSES ITALIANOS


Muerte de la esposa 100 80
Divorcio 73 95
Separacin de la pareja 65 85
Temporada en prisin 63 52
Lesiones personales 53 72
Matrimonio 50 50
Despedido del trabajo 47 40
Jubilacin 45 30
Embarazo 40 28
Dificultades sexuales 39 42
Reajustes econmicos 39 36
Problemas con la familia
poltica 29 41
Problemas con el jefe 23 35
Vacaciones 13 16
Navidad 12 10

a. Suponga que los datos tienen al menos una escala de intervalo y


calcule la correlacin entre los datos estadounidenses y la de los
italianos.
b. Suponga que los datos slo tienen una escala ordinal y calcule la
correlacin entre los datos de ambas culturas.

100

80

60

40 Series1

20

0
0 50 100 150
( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

491992
39766
= 15
(691)2 (712)2
[39391 ] [42644 ]
15 15

= 0,8519

La r es alta y positiva es decir que los comportamiento de las dos


nacionalidades son bastante similares

INDIVIDUO EXMEN CON LPIZ SIQUIATRA SIQUIATRA


Y PAPEL A B
1 48 12 9
2 37 11 12
3 30 4 5
4 45 7 8
5 31 10 11
6 24 8 7
7 28 3 4
8 18 1 1
9 35 9 6
10 15 2 2
11 42 6 10
12 22 5 3

5. Un psiclogo ha construido un examen lpiz - papel, a fin de medir la


depresin. Para comparar los datos del examen con los datos de los
expertos, 12 individuos con perturbaciones emocionales realizan el
examen lpiz papel. Los individuos tambin son calificados de manera
independiente por dos siquiatras, de acuerdo con el grado de depresin
determinado por cada uno como resultado de entrevistas detalladas. Los
datos aparecen a continuacin. Los datos mayores corresponden a una
mayor depresin.

a. Cul es la correlacin entre los datos de los dos siquiatras?


b. Cul es la correlacin entre las calificaciones del examen con
lpiz y papel y los datos de cada siquiatra?
14
12
10
8
6 Series1

4
2
0
0 5 10 15

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

650
628 12
=
(78)2 (78)2
[650 ] [650
12 12 ]

= 0,8519

La relacin se da con un mismo criterio por los psiquiatras


14

12

10

6 Series1

0
0 20 40 60

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

29250
2729
= 12
(375)2 (78)2
[12941 ] [650
12 12 ]

= 0,6973

La relacin entre las dos variables es baja y positiva


14

12

10

8
Series1
6

0
0 20 40 60

( )( )

=
2 2
( ) ( )
[ 2 ] [ 2 ]

29250
2729
= 12
(375)2 (78)2
[12941 ] [650
12 12 ]

= 0,697

6. Para este problema, suponga que usted es un psiclogo que labora en


el departamento de recursos humanos de una gran corporacin. El
presidente de la compaa acaba de hablar con usted acerca de la
importancia de contratar personal productivo en la seccin de
manufactura de la empresa y le ha pedido que ayude a mejorar la
capacidad de la institucin para hacer esto. Existen 300 empleados en
esta seccin y cada obrero fabrica el mismo artculo. Hasta ahora, la
corporacin slo ha recurrido a entrevistas para elegir a estos
empleados. Usted busca bibliografa y descubre dos pruebas de
desempeo, lpiz papel, bien estandarizadas, y piensa que podran
estar relacionados con los requisitos desempeo de esta seccin. Para
determinar si alguna de ellas se puede utilizar como dispositivo de
seleccin, elige 10 empleados representativos de la seccin de
manufactura, garantizando que un amplio rango de desempeo quede
representado en la muestra, y realiza las dos pruebas con cada
empleado. Los datos aparecen en la siguiente tabla.
Mientras mayor sea la calificacin, mejor ser el desempeo. Las
calificaciones de desempeo en el trabajo. Las calificaciones de
desempeo fabricados por cada empleado por semana, promediados
durante los ltimos 6 meses.
a. Construya una grfica de dispersin del desempeo en el trabajo
y la primera prueba, utilizando la prueba 1 como la variable X.
Parece lineal la relacin?
b. Suponga que la relacin anterior es lineal y calcule el valor de la r
de Pearson.
c. Construya una grfica de dispersin del desempeo en el trabajo
y la segunda prueba, utilizando la prueba 2 como la variable X.
Parece lineal la relacin?
d. Suponga que la relacin anterior es lineal, calcule el valor de la r
de Pearson.
e. Si slo pudiera utilizar una de las pruebas para la seleccin de los
empleados, utilizara alguna de ellas? En tal caso, cul de
ellas? Explique.

EMPLEADO
1 2 3 4 5 6 7 8 9 10
Desempeo en
el trabajo 50 74 62 90 98 52 68 80 88 76
Examen 1 10 19 20 20 21 14 10 24 16 14
Examen 2 25 35 40 49 50 29 32 44 46 35

120

100

80

60
Series1
40

20

0
0 10 20 30

( )( )

=
2 2
( ) 2 ( ) ]
[ 2 ] [

123984
12804
= 10
(168)2 (738)2
[3026 ] [56772
10 10 ]
= 0,5917

120

100

80

60
Series1
40

20

0
0 20 40 60

( )( )

=
2 2
( ) ( )
[ 2 2
] [ ]

284130
29542
= 10
(385)2 (738)2
[15493 ] [56772
10 10 ]
= 0,9076

Anlisis

El trabajo realizado acerca de cmo realizar calcular la correlacin y relacin


lineal se analizado que es un mtodo el cual permite comparar e interpretar
resultados a travs de la recoleccin de datos de cualquier institucin con el
objetivo de llegar a establecer deducciones.

Conclusin.

Al realizar el trabajo permite que cada uno de nosotros tenga conocimientos


claros acerca de la correlacin y relacin lineal para poner en prctica en los
problemas que se presentan el mundo en especial de comercio exterior,
ayudan a interpretar datos en forma resumida los datos planteados y a dar
solucin al problema.

Recomendacin
El tema de investigacin es de mucha relevancia porque la correlacin y
relacin lineal nos permiten determinar un promedio de algunos datos
estadsticos, tomando variables correspondientes para la interpretacin de los
datos.

Lincografa.

www.profesorenlinea.cl/.../EstadisticaMediaMedianaModa.htm

Cronograma

Actividades Abril

das 21 22 23 24
Definicin del
x
tema
Problema de
x
investigacin
Objetivos x
Justificacin
de la x
investigacin
Marco
x
Referencial

Aspectos
x x
metodolgicos
Pres. Proy. X

Recursos

PRESUPUESTO
Trabajo
CANTIDAD Valor PRESUPUESTO
unitario
PAPEL 20 0,02 0,40
IMPRESIN 20 0,06 1,20
INTERNET 2 0,5 1,00
TOTAL 2.60
DESARROLLO DE EJERCICIOS HIPOTESIS

1.- El banco de prstamos estudia la relacin entre ingreso (X) y de ahorros (Y)
mensuales de sus clientes.

Meses 1 2 3 4 5 6 7 8 9
Ingresos 350 400 450 500 950 850 700 900 600
Ahorro 100 110 130 160 350 350 250 320 130

a) Determinar la ecuacin lineal de las dos variables.


= +

= 73,89 + 0.45

b) Trace el diagrama de dispersin en el plano cartesiano

400
y = 0.4516x - 74.919
350
R = 0.9262
300
250
Ahorros

200
150
100
50
0
0 200 400 600 800 1000
Ingresos

c) Estime el ingreso que corresponde a un ahorro semanal de 90 dlares.


= 73,89 + 0.45 = 73.89 + 0.45(90) = 33.39
d) Si el ahorro es de 200 dlares que gasto puede realizar el obrero en
dicha semana.
= 73.89 + 0.45 = 73.89 + 0.45(200) = 16.11
e) Si el ingreso es de 350 dlares cual es el salario.

= 73.89 + 0.45

350 = 73.89 + 0.45

350 + 73,89
=
0,45

= 941,97

Desarrollo

Ahorros
Meses Ingresos(X) (Y) 2 2 X*y ( )2 ( )2
1 350 100 122500 10000 35000 80277,78 12345,68
2 400 110 160000 12100 44000 54444,44 10223,46
3 450 130 202500 16900 58500 33611,11 6579,01
4 500 160 250000 25600 80000 17777,78 2612,35
5 950 350 902500 122500 332500 100277,78 19290,12
6 850 350 722500 122500 297500 46944,44 19290,12
7 700 250 490000 62500 175000 4444,44 1512,35
8 900 320 810000 102400 288000 71111,11 11856,79
9 600 130 360000 16900 78000 1111,11 6579,01
5700 1900 4020000 491400 1388500 410000,00 90288,89

2 2 ( )2 ( )2

Primer caso


= + ( ) ( )

1 5700
X= = = 633.33
9

1 1900
Y= = = 211.11
9


=
( 2 ( )2 )[ 2 ( )2 ]

9(1388500) (5700)(1900)
=
(9(4020000) (5700)2 )(9(491400) (1900)2 )

1666500 1666500
= = = 0.96
3690000 812600 1731616

( )2
=

410000
= = 213.44
9

2 = (213,44)2 = 45556,63

( )2
=

90288,89
= = 100,16
9

2 = (100,16)2 = 10032,10


= + ( ) ( )

100,16 100,16
= 211.11 + 0.96 ( ) 0.96 ( ) 633,33
213,44 213,44

= 211,11 + 0,45 285,31

= 74,2 + 0,45

2.- Un comerciante mayorista encargo un estudio para determinar la relacin


entre los gastos de publicidad semanal por radio y las ventas de sus productos.
En el estudio se obtuvieron los siguientes resultados.

Semana 2 3 4 5 6 7 8 9 10 11
Gasto de Publicidad ($) 30 20 40 30 50 70 60 80 70 80
Venta ($) 300 250 400 - 550 750 630 930 700 840

En la quinta semana por diversos motivos no se pudo hacer el estudio

a) Determine la ecuacin de regresin de ventas sobre gastos de


publicidad

Gastos
Ventas
publicidad
(Y)
Meses (X) 2 2 X*y ( )2 ( )2
1 30 300 900 90000 9000 653,09 86697,53
2 20 250 400 62500 5000 1264,20 118641,98
3 40 400 1600 160000 16000 241,98 37808,64
4 50 550 2500 302500 27500 30,86 1975,31
5 70 750 4900 562500 52500 208,64 24197,53
6 60 630 3600 396900 37800 19,75 1264,20
7 80 930 6400 864900 74400 597,53 112597,53
8 70 700 4900 490000 49000 208,64 11141,98
9 80 840 6400 705600 67200 597,53 60297,53
500 5350 31600 3634900 338400 3822,22 454622,22

2 2 ( )2 ( )2

Primer caso

= + ( ) ( )

1 500
X= = = 55,55
9

1 5350
Y= = = 594,44
9


=
( 2 ( )2 )[ 2 ( )2 ]
9(338400 (500)(5350)
=
(9 31600 ( 500)2 )[9 3634900 (5350)]

370600
=
(34400)(4091600)

370600
= = 0.99
375168,02

( )2
=

3822,22
= = 20,61
9

2 = (20,61)2 = 424,77
( )2
=

454622,22
= = 224,75
9

2 = (224,75) = 50512,56

224,75 224,75
= 594,44 + 0.99 ( ) 0.99 ( ) 55,55
20,61 20,61

= 594,44 + 10,79 599,71

= 5,27 + 10,79

=
( 2 ( )2 )[ 2 ( )2 ]

9(338400 (500)(5350)
=
(9 31600 ( 500)2 )[9 3634900 (5350)]

370600
=
(34400)(4091600)

370600
= = 0.99
375168,02

b. Estime la cosecha si se aplica 12 sacos de fertilizantes.

1000
900
800
700
Ventas

600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80 90
Gastos

a) Determina el coeficiente de determinacin. De su comentario sobre este


valores
= 5,27 + 10,79

yr= -5,27 + 10,79(30)

yr= 318,43
3.- Se obtuvieron los siguientes datos para determinar la relacin entre cantidad
de fertilizante y produccin de papa por hectrea.

Sacos de fertilizante por


hectrea 3 4 5 6 7 8 9 10 11 12
Rendimiento en quintales 45 48 52 55 60 65 68 70 74 76

a) Encuentre la ecuacin de regresin de la cosecha sobre el fertilizante,


por el mtodo de mnimos cuadrados.
= +


= 2
2 ( )

Sacos de Rendimiento
fertilizantes en quinta
Periodo X (Y) 2 2 X*y ( )2 ( )2
1 3 45 9 2025 135 20,25 265,69
2 4 48 16 2304 192 12,25 176,89
3 5 52 25 2704 260 6,25 86,49
4 6 55 36 3025 330 2,25 39,69
5 7 60 49 3600 420 0,25 1,69
6 8 65 64 4225 520 0,25 13,69
7 9 68 81 4624 612 2,25 44,89
8 10 70 100 4900 700 6,25 75,69
9 11 74 121 5476 814 12,25 161,29
10 12 76 144 5776 912 20,25 216,09
75 613 645 38659 4895 82,50 1082,10

2 2 ( )2 ( )2


=

75
= = 7,5
10

=

613
= = 61,3
10

10(4895) (75)(613)
=
10(645) (75)2

48950 45957
=
6450 5625

2993
= = 3,63
825

= 61,3 3,63(7,5) = 34,07

= 34,07 + 3,63

b. Estime la cosecha si se aplica 12 sacos de fertilizantes Cunto es el error o


residual?

= 34,07 + 3,63

= 34,07 + 3,63(12) = 77.63-76=1.63 es el error.

b) Determina el coeficiente de determinacin. De su comentario sobre este


valores

N( XY) ( X)( Y)
r=
[N( X2 ) ( X)2 ][N( Y 2 ) ( Y)2 ]

10(4895) (75)(613)
r=
[10(645) (75)2 ][10(38659) (613)2 ]
48950 45975
r=
(6450 5625)(386590 375769)

2975
r=
(825)(10821)

2975
r=
(8927325)

2975
r=
2987,86

r = 0,75

4.- El nmero de horas de estudio invertidas y las calificaciones finales en un


curso de matemticas de una muestra 10 alumnos ha dado los siguientes
resultados:

Alumno 1 2 3 4 5 6 7 8 9 10
Horas de estudio 14 16 22 20 18 16 18 22 10 8
Calificacin 12 13 15 15 17 11 14 16 8 5

a) Determine la recta de regresin de la calificacin sobre el nmero de


horas de estudio invertidos. Interprete la ecuacin de regresin.

Horas
de
estudio Calificacin
Alumno X (Y) 2 2 X*y ( )2 ( )2
1 14 12 196 144 168 5,76 0,36
2 16 13 256 169 208 0,16 0,16
3 22 15 484 225 330 31,36 5,76
4 20 15 400 225 300 12,96 5,76
5 18 17 324 289 306 2,56 19,36
6 16 11 256 121 176 0,16 2,56
7 18 14 324 196 252 2,56 1,96
8 22 16 484 256 352 31,36 11,56
9 10 8 100 64 80 40,96 21,16
10 8 5 64 25 40 70,56 57,76
164 126 2888 1714 2212 198,40 126,40

2 2 ( )2 ( )2

164
=
10

= 16,4

126
=
10

= 12,6

2212
= (16,4)(12,6)
10
= 221,2 206,64

= 14,56

( )2
=

198,40
= }
10

= 4,45

2 = 19,84


=
2

14,56
=
19,84

= 0,734

= 12,6 0,73(16,4)

= 0,565
= +

= 0,565 + 0,734

5.- Una muestra de 60 de las 350 agencias de ventas de automviles de una


importadora registrada en un mes con X (autos vendidos por agencia), Y
(ventas en miles de dlares) ha dado los siguientes resultados:

= 10, = 10, 2 = 7000, 2 = 42000, = 8000

a) Determine la ecuacin de regresin: = +

8000
= 10 20 = 66.67
60

2
2
= ( )2

7000
2 = (10)2 = 16.67
60

66.67
= = = 4
2 16.67

= 20 (4)(10) = 60
Ecuacin

= +

= 60 4

b) Calcule el coeficiente de terminacin Qu porcentaje de la variacin


total es explicada por la regresin?

= 20 60 = 1200

= 10 60 = 600


=
( 2 ( )2 )[ 2 ( )2 ]

60(8000) (600)(1200)
=
[60(7000) (600)2 ][60(42000) (1200)2 ]

240000
= = 0,94
254358.44
6.- Los contadores con frecuencia estiman los gastos generales basados en el
nivel de produccin. En la tabla que sigue se da la informacin recabada sobre
gastos generales y las unidades producidas en 10 plantas y se desea estimar
una ecuacin de regresin para estimar gastos generales futuros.

Gastos generales
($) 300 1000 1100 1200 600 800 900 500 400 200
Unidades
producidas 15 45 55 75 30 40 45 20 18 10

a) Determine la ecuacin de regresin y haga un anlisis del coeficiente de


regresin.

Gasto Unidades
generales producidas
Periodos X (Y) 2 2 X*y ( )2 ( )2
1 300 15 90000 225 4500 160000,00 412,09
2 1000 45 1000000 2025 45000 90000,00 94,09
3 1100 55 1210000 3025 60500 160000,00 388,09
4 1200 75 1440000 5625 90000 250000,00 1576,09
5 600 30 360000 900 18000 10000,00 28,09
6 800 40 640000 1600 32000 10000,00 22,09
7 900 45 810000 2025 40500 40000,00 94,09
8 500 20 250000 400 10000 40000,00 234,09
9 400 18 160000 324 7200 90000,00 299,29
10 200 10 40000 100 2000 250000,00 640,09
7000 353 6000000 16249 309700 1100000,00 3788,10

(
2 2 2
( ) )2

Xi
=
X
N
7 000
=
X
10
X = 700
Yi
=
Y
N
353

Y=
10

Y = 35,3

XY
SXY = Y
X
n

309 700
SXY = (700)(35,3)
10

SXY = 30 970 24 710

SXY = 6 260

(Xi X )2
SX =
N

1 100 000
SX =
10

SX = 331,66

SX2 = 109 998,36

SXY
b=
S X2

6 260
b=
109 998,36
b = 0,06

bX
a= Y

a = 35,3 0,06(700)

a = 6,7

Y = a + bx

Y = 6,7 + 0,06x

Vous aimerez peut-être aussi