Vous êtes sur la page 1sur 6

REGRESIN LINEAL SIMPLE

1. INTODUCCION
En muchas aplicaciones estadstica se debe resolver problemas que contiene un conjunto de
variables y que se sabe existe alguna asociacin entre ellas. En este conjunto de variables muy a
menudo se tiene una sola variable dependiente, que depende de una o ms variable
independiente.
La primera forma del estudio de la asociacin entre las variables X e Y es la regresin, que
consiste en determinar una relacin funcional entre ellas, con el fin de que se pueda predecir
el valor de una variable en base a la otra. La variable que se va predecir se denomina
variable dependiente y la variable que es la base de la preedicin se denomina variable
independiente.
La segunda forma del estudio de la asociacin entre las variables X e Y, es denominada
correlacin, que consiste en determinar la variacin conjunta de las dos variables, su grado de
relacin y su sentido. La medida del grado de la relacin se denomina coeficiente de
correlacin. El cuadrado del ndice de correlacin se denomina coeficiente de determinacin.
Se realizara un estudio de la regresin lineal en el sentido que, la ecuacin de regresin que se
calcula ser valida, solo si hay la seguridad de que existe un alto nivel de correlacin entre las
variable medido por el coeficiente de determinacin.
Los mtodos de regresin y de correlacin se clasifican por el numero de variable independiente
en simple o mltiple. El anlisis de asociacin se denomina simple, si hay una sola variable
independiente. Si hay dos o mas variable independiente se denomina anlisis de asociacin
mltiple.
2. DIAGRAMA DE DISPERSIN
Se denomina diagrama de dispersin o nube de puntos, a la grafica de los valores (x,y) de
las variables X e Y en el sistema cartesiano.
Es frecuente visualizar el tipo de relacin existente entre dos variables a partir del diagrama de
dispersin.
3. LA COVARIANZA
La covarianza de los datos observado en una muestra es la estadstica que mide el nivel de la
variabilidad conjunta de los datos de las variables en pareja con respecto a sus medias
respectivas.
____

__ ___

cov( x, y ) xy x y

4. EL COEFICIENTE DE CORRELACION
El coeficiente de correlacin lineal de Pearson de los n pares de valores
bidimensional (x,y) es el numero abstracto o relativo r que se calcula por:

de una variable

cov( x, y )

El coeficiente de correlacin de la muestra es un nmero real comprendido entre -1 y 1


El grado o nivel de ajuste de la ecuacin a los datos se analiza en forma descriptiva aplicando el
coeficiente de determinacin que se define como el cuadrado del coeficiente de correlacin.
5. REGRESIN LINEAL SIMPLE.
Dados n pares de valores de una variable bidimensional, la regresin lineal simple Y con
respecto a X, consiste en determinar la ecuacin de la recta:
Y = a + bx

Mg. JOSE HUAMAN

34

Que mejor se ajusta a los valores de la muestra, con el fin de poder predecir o estimar
partir de X.

Y a

El proceso de predecir o estimar Y a partir de la variables X , es la regresin. Hallar la


funcin lineal, consiste en determinar las constante a y b a partir de los datos de la
muestra.

cov( x, y )
x2
__

__

a y b x

El proceso de predecir o estimar Y a partir de la variables X , es la regresin. Hallar la


funcin lineal, consiste en determinar las constante a y b a partir de los datos de la
muestra.
Ejemplo 1
El gerente de la empresa estudia la relacin que existe entre las variables gastos (y) y salario
(x) de un personal obrero, a la vez trata de encontrar la ecuacin de regresin para hacer
estimaciones.
x
28
25
35
40
45
35
70
80

y
25
20
32
37
40
30
55
60

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

PRACTICA DIRIGIDA
Mg. JOSE HUAMAN

35

1) En un estudio del efecto de un componente de la dieta sobre la composicin de los lpidos


del plasma, se obtuvieron los siguientes datos en una muestra de 8 animales experimentales
X = Medida del componente de la dieta
Y = Medida de la concentracin de lpidos en el plasma
x
18
21
28
35
47
33
40
19

y
38
40
47
54
66
52
59
38

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

2) Los datos siguientes muestran la Densidad ptica de cierta sustancia a diferente Niveles
de concentracin.
X = Nivel de concentracin
Y = Densidad ptica
x
80
120
160
200

y
0,08
0,12
0,18
0,21

x
280
320
360
400

y
0,38
0,41
0,42
0,51

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

3) El administrador de un hospital reuni los siguientes datos sobre el Costo por comida
estndar a diferente Volmenes de preparacin.
36
Mg. JOSE HUAMAN

X = Nmeros de comidas servidas


Y = Costo por comidas
x
30
35
40
45
50

y
1,15
1,11
0,98
1,01
0,97

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

4) Se llevo a cabo un experimento para estudiar la relacin entre una Medicin objetiva de la
ansiedad y la Frecuencia cardiaca en adulto. Se obtuvieron los siguientes resultados en los
10 adultos normales.
X = Frecuencia cardiaca por minutos
Y = Medicin objetiva de la ansiedad
x
50
55
60
65
70

y
48
41
45
41
42

x
75
80
85
90
95

y
36
38
36
30
32

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

5) Se reunieron los siguientes datos en un estudio de la relacin entre la Inteligencia y el Tamao


de la familia.
X = Tamao de la familia
Mg. JOSE HUAMAN

37

Y = Puntuacin de inteligencia
x
1
2
3
4
5

y
105
102
104
100
97

x
6
7
8
9
10

y
101
95
93
97
88

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

6) Un banco estudia la relacin entre las variables, ingreso y ahorros mensuales de sus clientes. Una
muestra aleatoria de sus clientes revelo los siguientes datos en dlares:
X:
Y:

350
100

400
1105

450
130

500
160

950
350

850
350

700
250

900
320

600
130

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

7) El gerente de personal de una empresa quiere estudiar la relacin entre el ausentismo y la edad
de sus trabajadores. Si una muestra aleatoria de 9 trabajadores de registro de la empresa revelo lo
siguientes datos:
Edad:
Ausentismo:

25
18

46
12

58
8

37
15

55
10

32
13

41
7

50
9

23
16

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

8) Un grupo que vende al menudeo, encargo un estudio para determinar la relacin entre los gastos
de publicad semanal por radio y el monto de las ventas de sus productos. En el estudio se
obtuvieron los siguientes resultados:
Mg. JOSE HUAMAN

38

Gastos:
Ventas:

30
300

20
250

40
400

50
380

70
550

60
750

80
630

70
930

80
700

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

9) Una empresa agroindustrial quiere determinar la relacin entre cantidad de fertilizante y


produccin de papa por hectrea que produce. Si la muestra del experimento proporciono los
siguientes datos:
Sacos:
Rendimiento:

3
45

4
48

5
52

6
55

7
60

8
65

9
68

10
70

11
74

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

10) Para estudiar la relacin entre el numero de horas de estudio y las calificaciones finales en una
prueba de conocimientos se recopilaron los siguientes datos de una muestra aleatoria de 8
alumnos.
Horas:
Calificaciones:

14
12

16
13

22
15

20
15

18
17

16
11

18
14

16
16

Hallar la covarianza
Halar la correlacin
Estimar el modelo
Hallar el coeficiente de determinacin
Hallar la varianza de regresin
Realizar la inferencia del modelo
Aplicacin del modelo.

Mg. JOSE HUAMAN

39