Vous êtes sur la page 1sur 7

22/05/2014

1
DIAGRAMA DE DISPERSIN
1
Utilcelo cuando necesite mostrar lo que sucede a una variable cuando
otra cambia, con la finalidad de probar la teora de que las dos
variables se relacionan.
Este tipo de diagramas se usa para probar posibles relaciones entre
causa y efecto; no puede probar que una variable causa la otra, pero
s aclara si existe alguna relacin y la intensidad que pudiera tener la
misma.
La direccin y la unin de la agrupacin le da idea sobre la fuerza de la
relacin entre la variable 1 y la variable 2. Cuanto ms se asemeje a una
lnea recta, ms fuerte ser la relacin entre las variables.
Tipos de Diagramas de Dispersin
3
4
22/05/2014
2
5
Clculo de Covarianza y Coeficiente de Correlacin
6
( )( )
y x
n
y x
S
n
y y x x
S Cov
i i
xy
i i
xy xy
= =

= =

xy
Cov mediante bien o
Covarianza: Es una medida de lo que se dispersan los valores de una muestra bidimensional tanto del
valor medio de la x como del valor medio de la y. Se determina mediante la expresin:
Cuando se trata de una distribucin bidimensional...
La covarianza entre dos variables, S
xy
, nos indica si la posible relacin entre dos variables es directa o
inversa.
Directa: S
xy
>0 Inversa: S
xy
<0 Sin Relacin Lineal : S
xy
=0
El signo de la covarianza nos dice si el aspecto de la nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relacin entre las variables
Relacin
positiva
Relacin
negativa
Ninguna
relacin
Coeficiente de Correlacin de Pearson R
Bondad de los ajustes
El coeficiente de correlacin de Pearson, r, nos permite saber si el
ajuste de la nube de puntos a la recta de regresin obtenida es
satisfactorio.
Se define como el cociente entre la covarianza y el producto de
las desviaciones tpicas (raz cuadrada de las varianzas)
y x
xy
y x
xy
y x
xy
S S
S
S S
S
V V
V
r = = =
2 2
Teniendo en cuenta el valor de la covarianza y las varianzas, se
puede evaluar mediante cualquiera de las dos expresiones siguientes:

=


2
2
2
2

y
n
y
x
n
x
y x
n
y x
r
i i
i i
( ) [ ] ( ) [ ]
2
2
2
2


=
i i i i
i i i i
y y n x x n
y x y x n
r
Grado de Correlacin
El coeficiente de correlacin, r, presenta valores entre 1 y +1.
Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La
nube de puntos est muy dispersa o bien no forma una lnea recta. No se
puede trazar una recta de regresin.
Cuando r es cercano a +1, hay una buena correlacin positiva entre las
variables segn un modelo lineal y la recta de regresin que se determine
tendr pendiente positiva, ser creciente.
Cuando r es cercano a -1, hay una buena correlacin negativa entre las
variables segn un modelo lineal y la recta de regresin que se determine
tendr pendiente negativa: es decreciente.
No hay
correlacin
0 r
Correlacin
lineal positiva
1 + r
Correlacin
lineal negativa
1 r
Hay correlacin
no lineal
0 r
22/05/2014
3
Coeficiente de Determinacin, R
2
Para estimar la bondad de un ajuste frecuentemente se prefiere
utilizar el Coeficiente de Determinacin, R
2
, que es el Coeficiente de
Correlacin elevado al cuadrado.
Se determina mediante cualquiera de las dos expresiones
siguientes:

2
2
2
2
2
2

y
n
y
x
n
x
y x
n
y x
R
i i
i i
( )
( ) [ ] ( ) [ ]
2
2
2
2
2
2


=
i i i i
i i i i
y y n x x n
y x y x n
R
Su valor oscila entre 0 y +1.
Cuando hay una buena correlacin lineal, R
2
es muy cercano a +1.
Normalmente se acepta para valores de R
2
>= 099.
Cuando no hay correlacin o bien sta no es lineal, R
2
es bajo e
incluso cercano a cero
10
Ejemplo 1
Una agencia de coches estudia la
relacin entre el cuenta kilmetros y
el precio de venta de coches
usados.
Se selecciona una muestra y se
registran los datos.
Hallar la lnea de regresin
La Recta de Regresin Lineal
Auto Cuenta Km Precio
1 37388 14636
2 44758 14122
3 45833 14016
4 30862 15590
5 31705 15568
6 34010 14718
Variable Variable
Independiente "x" Dependiente "y"
; 14775
37426
=
=
y
x
Kilmetros Precio USS
Xi Yi Xi*Yi Xi Yi
37388 14636 547210768 1397862544 214212496
44758 14122 632072476 2003278564 199430884
45833 14016 642395328 2100663889 196448256
30862 15590 481138580 952463044 243048100
31705 15568 493583440 1005207025 242362624
34010 14718 500559180 1156680100 216619524
Suma 224556 88650 3296959772 8616155166 1312121884
Promedio 37426,00 14775,00 549493295,33 1436025861,00 218686980,67
67 , 854 . 475 . 3
) )( (
) , cov(
385 . 320 . 35
) (

2
2
=

=
=

n
y y x x
Y X
n
x x
s
i i
i
x
Solucin
Solucin manual: Calcular varios estadsticos
06 , 458 . 18 ) 426 . 37 )( 09840 , 0 ( 775 . 14
09840 , 0
385 . 320 . 35
67 , 854 . 475 . 3

) , cov(
2
= = =
=

= =

x B y A
s
Y X
B
x
x x B A y 09840 , 0 06 , 458 . 18 = + =

La Recta de Regresin Lineal
Modelo Lineal
Parmetros del modelo lineal
Es confiable el modelo ya que R : -0,9409
22/05/2014
4
La Recta de Regresin Lineal
Grafico de Dispersin
Ejercicio: 2
En el ejemplo 2, supongamos que el nmero medio de horas-hombre
depende linealmente del tamao del lote:
De los datos tenemos:

1100
1
=

=
n
i
i
y 500
1
=

=
n
i
i
x 61800
1
=

=
n
i
i i
y x

28400
1
2
=

=
n
i
i
x 134660
1
2
=

=
n
i
i
y 10 = n
La Recta de Regresin Lineal
0 , 2
50 10 28400
50 110 10 61800
2
=


= B
10 50 2 110 = = A
B
i i
x y + = 2 10

La Recta de Regresin Lineal


20 30 40 50 60 70 80
Tamao del Lote
20
70
120
170
H
o
r
a
s

-

H
o
m
b
r
e
Si la cantidad de aditivo 55 = x , estimamos que la distribucin de probabilidades de Y
tiene una media de HH Y 120 55 2 10 = + =
La Recta de Regresin Lineal
22/05/2014
5
En el caso del ejemplo de horas hombre el coeficiente de determinacin es:

9956 0
60
13600
2
, = = R

Esto significa que el 99,56% de la variabilidad en la variable de las horas hombre, es
explicada por el tamao del lote, el modelo lineal parece satisfactorio en este caso.
La Recta de Regresin Lineal
El Coeficiente de Correlacin creado por Karl Pearson alrededor de
1900, describe la fuerza de la relacin entre dos conjuntos de variables en
escala de intervalo o de razn. Se designa con la letra r, y con frecuencia se
le conoce como r de Pearson y coeficiente de correlacin producto-
momento. Puede adoptar cualquier valor de 1.00 a +1.00, inclusive. Un
coeficiente de correlacin de 1.00 o bien de +1.00 indica una correlacin
perfecta.
COEFICIENTE DE CORRELACIN Medida de la fuerza de la relacin
lineal entre dos variables.
CARACTERSTICAS DEL COEFICIENTE DE CORRELACIN
1. El coeficiente de correlacin de la muestra se identifica por la letra
minscula r.
2. Muestra la direccin y fuerza de la relacin lineal (recta) entre dos
variables en escala de intervalo o en escala de razn.
3. Vara de 1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociacin entre las variables.
5. Un valor cercano a 1 indica una asociacin directa o positiva entre las
variables.
6. Un valor cercano a 1 indica una asociacin inversa o negativa entre
las variables.
COEFICIENTE DE DE DETERMINACIN
Una medida cuyo significado se interpreta con ms facilidad es el
Coeficiente de Determinacin. ste se calcula elevando al cuadrado el
coeficiente de correlacin.
COEFICIENTE DE DETERMINACIN Proporcin de la variacin total en la
variable dependiente Y que se explica, o contabiliza, por la variacin en la
variable dependiente X.
22/05/2014
6
PRINCIPIO DE LOS MNIMOS CUADRADOS
Al emplear la recta de regresin con un mtodo matemtico denominado
Principio de los Mnimos Cuadrados este mtodo elimina el juicio subjetivo.
Este mtodo proporciona lo que comnmente se conoce como recta del
mejor ajuste.
Con este mtodo se determina una ecuacin de regresin al minimizar la
suma de los cuadrados de las distancias verticales entre los valores reales
de Y y los valores pronosticados de Y.
Forma general de la ecuacin de regresin lineal Y = A + BX

PRINCIPIO DE LOS MNIMOS CUADRADOS


Como resultado, el procedimiento de los mnimos cuadrados genera una
recta que minimiza la suma de los cuadrados de las desviaciones verticales
entre los puntos y la recta.
PRINCIPIO DE LOS MNIMOS CUADRADOS
Dada la siguiente tabla de datos:
Determine:
Modelo de Regresin Lineal
Coeficiente de Correlacin Lineal
Coeficiente de Determinacin
Si un nio tiene 9 aos Cul seria su peso?
Y 58 42 51 54 40 39 49 56
X 12 8 10 11 7 7 10 14
22/05/2014
7
PRINCIPIO DE LOS MNIMOS CUADRADOS
Y X XY
58 12 696 144 3364
42 8 336 64 1764
51 10 510 100 2601
54 11 594 121 2916
40 7 280 49 1600
39 7 273 49 1521
49 10 490 100 2401
56 14 784 196 3136
Promedios
48,625 9,875 495,375 102,875 2412,875

PRINCIPIO DE LOS MNIMOS CUADRADOS


Diagrama de Dispersin.-

Vous aimerez peut-être aussi