Vous êtes sur la page 1sur 13

Laboratorio de estadstica descriptiva

TUTOR

Universidad Nacional Abierta y a Distancia


UNAD

2017
LABORATORIO DE REGRESIN Y CORRELACIN LINEAL

REA: Estadstica Escuela de Ciencias Bsicas Tecnologa e


Ingeniera
CURSO: Estadstica TEMA: REGRESIN Y CORRELACIN LINEALSIMPLE
Descriptiva

CIENCIAS BSICAS

ACTIVIDAD

Ejercicios:

1. Se quiere estudiar la asociacin entre consumo de sal y tensin arterial. A una


serie de voluntarios se les administra distintas dosis de sal en su dieta y se mide su
tensin arterial un tiempo despus.

Valores Iniciales

X (Sal) Y (Tensin)
1.6 98
2.3 102
3.3 109
4.2 113
4.6 115
5 120
A) Realice el diagrama de dispersin y determine el tipo de asociacin entre las
variables.

140
120
113 115
120 109
102
98
100
Y (Tensin)

80

60

40

20

0
0 1 2 3 4 5 6
X (Sal)

B) Encuentre el modelo matemtico que permite predecir el efecto de una variable


sobre la otra. es confiable?

Como sabemos este caso corresponde a una Regresin Lineal.


La regresin lineal es una tcnica que permite cuantificar la relacin que puede ser
observada cuando se grafica un diagrama de puntos dispersos correspondientes a dos
variables, cuya tendencia general es rectilnea (como nuestro diagrama de arriba).

Expresndolo de una forma simple, se dara por la educacin:

Y = a + bX (1) donde:

Y= representa los valores de la coordenada a lo largo del eje vertical en el grfico.


X= representa los valores de la coordenada sobre el eje horizontal.
a = es llamado el intercepto.
b = se denomina la pendiente o coeficiente de regresin.

Podemos obtener los valores de:


Donde n= nmero de variables.

Para ellos necesitamos averiguar las cantidades x, y, y x.y. y sus respectivas


sumatorias.

X (Sal) X2 Y(Tensin) Y2 X.Y


1.6 2,56 98 9604 156,8
2.3 5,29 102 10404 234,6
3.3 10,89 109 11881 359,7
4.2 17,64 113 12769 474,6
4.6 21,16 115 13225 529
5 25 120 14400 600
x = 21 2
x = y = 657 2
y = 72283 x.y = 2354,7
82.54

Remplazando:

21657
2354.7 6
= 212
= 6,106
82.54 6

657(6.106121)
= = 88,128
6

Ahora remplazamos en la Ec (1) los valores de a y b.


Y = a + b X -> Y = 88,128 + 6,106 (X)

Probamos si la ecuacin funciona y cumple:

Damos distintos valores de X segn la tabla, con el fin de confirmar si da la Y


correspondiente y as ver si existe una relacin.

Cuando X= 1,6
Y = 88,128 + 6,106(1,6) = 97,89
Cuando X= 2,3
Y = 88,128 + 6,106(2.3) = 102,171
Cuando X= 3,3
Y = 88,128 + 6,106(3.3) = 108.27
ETC.

Como observamos los valores resultantes estn muy cerca a los valores de Y en la tabla

97,89 > 98
102,171 > 102
108,27 >109

Esto se debe a que algunos puntos se encuentran alrededor de la funcin y no dentro de


ella (como se puede observar en el diagrama dispersin),
Lo que hace la regresin lineal es ajustar una funcin lineal lo ms precisa a los valores
dados.

La ecuacin final para este caso sera: Y = 88,128 + 6,106 (X)


Como conclusin podemos decir, que si es confiable ya que se acerca bastantea los
valores reales y cumple la relacin.

C) Determine el grado de relacin de las dos variables.

Segn la frmula de Correlacin:

Remplazamos y nos da:

21657)2
2354.7( )
2 = 212
6
6572
= 0.9684
84,54 6 (72283 6 )

0.9684x100% = 96.84%

Tiene un 96.84% de exactitud, su coeficiente de correlacin es 0,9684.

D) Si a un paciente se le administra una dosis de sal de 5,6. Cul es la tensin


arterial esperada?
Aplicando la formula encontrada:

Y= a + b X - > Y = 88,128 + 6,106 (5,6)

Y= 122,3216

Donde: X = Cantidad de Sal.


Y = Tensin.

La tensin arterial es de 122,3216

2. En un nuevo proceso artesanal de fabricacin de cierto artculo que est implantado, se


ha considerado que era importante ir anotando peridicamente el tiempo medio (medido
en minutos) que se utiliza para realizar una pieza y el nmero de das desde que empez
dicho proceso de fabricacin. Con ello, se pretende analizar como los operarios van
adaptndose al nuevo proceso mejorando paulatinamente su proceso de produccin.
Los siguientes datos representan dicha situacin:

A) Identifique la variable dependiente (y) y la variable independiente (x) realice el


diagrama de dispersin y determine el tipo de asociacin entre las variables.

Valores Iniciales

X (Das) Y (Tiempo Minut)


12 45
23 30
35 27
42 25
53 23
65 21
70 20

Diagrama
50
45
45

40

35
30
(Y)Tiempo

30 27
25
23
25 21 20
20

15

10

0
0 10 20 30 40 50 60 70 80

(X)Das

B) Encuentre el modelo matemtico que permite predecir el efecto de una


variable sobre la otra. es confiable?

Este caso corresponde a una regresin lineal simple tambin, entonces partimos
nuevamente de la Ecuacin Lineal

Y = a + bX (1)

Obtenemos los valores de:

Donde n= nmero de valores.

Buscamos los valores de x, y, y x.y. y sus respectivas sumatorias.


X (Das) X2 Y(Tiempo Y2 X.Y
Min)
12 144 45 2025 540
23 529 30 900 690
35 1225 27 729 945
42 1764 25 625 1050
53 2809 23 529 1219
65 4225 21 441 1365
70 4900 20 400 1400
x = 300 x2 = 14496 y = 191 y2 = 5649 x.y = 7209

Remplazando:

300191
7209
7
= 3002
= 0,0393
14496 7

170(0.0393235)
= = 22,966
7

Ahora remplazamos en la Ec (1) los valores de a y b.


Y = a + b X -> Y = 22.966 + 0.0393 (X)

Probamos si la ecuacin funciona:

Damos distintos valores de X segn la tabla, con el fin de confirmar si da la Y


correspondiente y as ver si existe una relacin.
Cuando X= 42
Y = 22,966 + 0,0393(42) = 24,616
Cuando X= 65
Y = 22,966 + 0,0393(65) = 25,5205
Cuando X= 70
Y = 22,966 + 0,0393(70) = 25,717
ETC.

Como observamos los valores resultantes estn cerca a los valores de Y en la tabla

24,613 > 25
25,5205 > 21
25,717 > 20

En este caso el %error de la ecuacin es un ms alto al punto anterior, ya que los puntos
estn ms dispersos a la recta lineal.

La ecuacin final para este caso sera: Y = 22,966 + 0,0393 (X)


Como conclusin podemos decir, que si es confiable ya que se acerca a los valores reales
y cumple la relacin.

C) Determine el grado de correlacin de las dos variables.


Segn la frmula de Correlacin:

Remplazamos y nos da:

3001912
7209( )
2 = 3002
7
1912
= 0.812
14496 (5649 )
7 17

0.841x100% = 81.2%

Tiene un 81.2% de exactitud, su coeficiente de correlacin es 0.812.

D) Qu tiempo deber tardarse un empleado cuando lleven 90 das?

Aplicamos la frmula:

Y= a + b X - > Y = 22,966 + 0,0393(90) = 26,503

Donde: X = Das
Y = Tiempo

El empleado deber tardarse 26,503 minutos en la pieza


3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemtico que
permita determinar la relacin entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 nios y realiza las mediciones respectivas.
A continuacin, se presentan los resultados:

Estatura (Cm) Peso (Kg)


120 24
124 23
107 19
118 24
112 21
110 19
115 22
104 16
110 20
116 23

A) Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersin y determine el tipo de asociacin entre las variables.

X= Estatura. Y= Peso.

30

24 24
25 23 23
22
21
20
19 19
20
16
15
(Y)Peso

10

0
100 105 110 115 120 125

(X)Estatura
B) Encuentre el modelo matemtico que permite predecir el efecto de una variable
sobre la otra. es confiable?

Este caso es igual a los dos anteriores, entonces partimos nuevamente de la


Ecuacin Lineal

Y = a + bX (1)

Obtenemos los valores de:

Donde n= nmero de valores.

Buscamos los valores de x, y, y x.y. y sus respectivas sumatorias.

X X2 Y(Peso Y2 X.Y
(Estatura Kg)
Cm)
120 14400 24 576 2880
124 15376 23 529 2852
107 11449 19 361 2033
118 13924 24 576 2832
112 12544 21 441 2352
110 12100 19 361 2090
115 13225 22 484 2530
104 10816 16 256 1664
110 12100 20 400 2200
116 13456 23 529 2668
x = 1136 x2 = y = 211 2
y = 4513 x.y =
129390 24101
Remplazando:

1136211
24101
10
= 11362
= 0,386
129390
10

211(0,3861136)
= = -22,74
10

Ahora remplazamos en la Ec (1) los valores de a y b.


Y = a + b X -> Y = -22,74 + 0,386 (X)

Probamos si la ecuacin funciona:

Damos distintos valores de X segn la tabla, con el fin de confirmar si da la Y


correspondiente y as ver si existe una relacin.
Cuando X= 120
Y = -22,74 + 0,386(120) = 23,58
Cuando X= 124
Y = -22,74 + 0,386(124) = 25,124
Cuando X= 107
Y = -22,74 + 0,386(107) = 18,562
ETC.

Como observamos los valores resultantes estn cerca a los valores de Y en la tabla

23,58 > 24
25,124 > 23
18,562 > 19

El %error de la ecuacin es bajo.

La ecuacin final para este caso sera: Y = -22,74 + 0,386 (X)


Como conclusin podemos decir, que si es confiable ya que se acerca a los valores reales
y cumple la relacin.
C) Determine el grado de correlacin de las dos variables.

Segn la frmula de Correlacin:

Remplazamos y nos da:

1136211)2
24101( )
2 = 1136 2
10
2112
= 0.841
129390 10 (4513 10 )

0.841x100% = 84.1%

Tiene un 84.1% de exactitud, su coeficiente de correlacin es 0.841.

D) Cul es el peso que debera tener un estudiante que mida 128 cm?

Aplicamos la frmula:

Y= a + b X - > Y = -22,74 + 0,386(128) = 26,668

Donde: X = Estatura
Y = Peso

El estudiante pesa 26,668Kg