Vous êtes sur la page 1sur 12

SEMANA 06 (12/10/17)

INTRODUCCION
Con frecuencia debemos descubrir y medir ciertos graficos que presentan
configuraciones de ciertas puntos con marcada aproximacion a una recta,
parabola o algo desconocido. Si existe una tendencia o relaciones entre
ellas significara que debera resolverse un problema de ajuste de una
curva.
En estadistica el ajuste de una curva pueden dividirse en 3 partes:
1. Decidir que clase de curva debe ajustarse a los datos.
2. Calcular las constantes involucradas en la ecuacion de la curva
seleccionada que ha de ajustarse a los datos.
forma de la ecuacion: y = f(x)
donde f(x) significa: alguna funcion de x
para una ecuacion de primer grado sera y = a + bx define una linea recta
3. Debera interpretar los resultados mediante explicaciones, estimaciones
y predicciones.
Recordemos cuestiones basicos:

PLANOS COORDENADOS
GRÁFICAS DE DISPERSIÓN
Una gráfica de dispersión puede ser usada para datos en la forma
de parejas ordenadas de números.
El resultado será un montón de puntos "dispersos" alrededor del plano.
Si la tendencia general es que los puntos suban a la derecha de la gráfica,
entonces decimos que hay una correlación positiva entre las dos variables
medidas.
Si los puntos caen a la izquierda de la gráfica, decimos que hay
una correlación negativa .
Si no hay tendencia general, entonces no hay correlación .
Si la tendencia no es muy pronunciada, esto es, los puntos están dispersos
ampliamente – entonces decimos que las variables están débilmente
correlacionadas .
Si la correlación es más pronunciada, decimos que las variables
están fuertemente correlacionadas .

EJEMPLOS

Si Usted grafica la altura de una persona en un eje y su peso en el otro,


probablemente obtendría una correlación positiva fuerte (porque las
personas altas generalmente pesan más).

Correlación positiva débil


Si Usted grafica la edad de un hombre y su memorizacion en su cerebro,
probablemente obtendría una correlación negativa débil (porque algunos
hombres tienen una tendencia a la perdida de memoria cuando
envejecen).

Correlación negativa fuerte

Si Usted grafica el tamaño de zapatos de una mujer y la longitud de su


cabello, probablemente obtendría ninguna correlación. (Estas variables no
están relacionadas.)

No hay correlación
REGRESIÓN LINEAL SIMPLE
Nos centraremos en primer lugar, en el caso de que la función que
relaciona las dos variables X e Y sea la más simple posible, es decir, una
línea recta.
Por ello pasaremos a interpretar los coeficientes que determinan una línea
recta.
Toda función de la forma: Y=a+bX
determina, al representarla en el plano una línea recta,
donde X e Y son variables y
a y b son constantes.
Por ejemplo: Y=3+2X.

SIGNIFICADO DE a y b
a es la ordenada en el origen, es decir, es la altura a la que la recta corta al
eje Y. Se denomina también término independiente.
b, también denominada pendiente es la inclinación de la recta, es decir, es
el incremento que se produce en la variable Y cuando la variable X
aumenta una unidad.
Por ejemplo, en el caso anterior Y=3+2X, por cada unidad que incrementa
la X, la Y presenta un incremento medio de 2 unidades.
En la recta de regresión -como ya veremos- b recibe el nombre
de Coeficiente de regresión.

Si b>0, entonces cuando X aumenta Y también lo hace (relación directa).

Si b<0, entonces, cuando X aumenta Y disminuye (relación inversa).

Ver figura a y b de abajo respectivamente.


La ecuacion de una linea recta es: y= a+bx

FIG.1

RECTA DE REGRESIÓN (O MEJOR AJUSTE)


La recta que se ajusta mejor a los n puntos (x1 y1) (x2 y2) (xn yn) tiene
la forma: y= a+bx
FIG.2

Un metodo bastante usado es el llamado de minimos cuadrados.


LA RECTA DE MINIMOS CUADRADOS

ESTIMACIÓN DE LA RECTA DE REGRESIÓN POR EL MÉTODO DE


LOS MÍNIMOS CUADRADOS
Sean X e Y dos variables aleatorias medidas sobre los mismos individuos, y
sean (xi,yi) los pares de observaciones sobre dichos individuos.
En primer lugar procederemos a representar el diagrama de dispersión, o
nube de puntos. Supongamos que es la obtenida en la figura 3.
Aunque la nube revele una gran dispersión, podemos observar una cierta
tendencia lineal al aumentar X e Y (tendencia que no es del todo exacta;
por ejemplo si suponemos que X es la edad e Y es la talla, obviamente, la
talla no sólo depende de la edad, además también puede haber errores de
medida).
Por esa nube de puntos podemos hacer pasar infinitas rectas.
De todas ellas debemos elegir una ¿cual?...
Obviamente elegiremos la mejor de todas en algún sentido.
La recta de regresión debe tener carácter de línea media, debe ajustarse
bien a la mayoría de los datos, es decir, pasar lo más cerca posible de
todos y cada uno de los puntos.
Llamaremos a la mejor de todas Y*=a+bX (Y* para distinguir los valores de
la tabla de los que se habrían producido con la recta si la relación fuese
funcional).

Figura 3: Nube de puntos y posibles rectas que pueden pasar por ella.

Que pase lo más cerca posible de todos los puntos, es decir que diste poco
de todos y cada uno de ellos significa que hemos de adoptar un criterio
particular que en general se conoce como MÍNIMOS CUADRADOS.
Este criterio significa que la suma de los cuadrados de las distancias
verticales de los puntos a la recta debe ser lo más pequeña posible
(ver figura 4).
(Obviamente, este es uno de los posibles criterios a adoptar, pero es el
más utilizado).

Figura 4: Recta de regresión mostrando los residuos o errores que se


minimizan en el procedimiento de ajuste de los Mínimos cuadrados.

Estas distancias verticales se denominan errores o residuos.

ECUACIONES PARA ENCONTRAR a Y b


Las constantes a y b se determinan mediante el sistema de ecuaciones

Aquí, significa "la suma de." Así,


xiyi= suma del productos =x1y1+x2y2+ +xnyn
xi= suma del valores de x=x1+x2+ +xn
yi= suma del valores de y=y1+y2+ +yn
xi2= suma del valores de x2=x12+x22+ +xn2
PASOS

Una forma más precisa de encontrar la recta que mejor se ajusta es


el método de mínimos cuadrados.
Use los pasos siguientes para encontrar la ecuación de la recta que mejor
se ajusta para un conjunto de parejas ordenadas .

PASO 1: Calcule la media de los valores de x y la media de los valores de y .

PASO 2: Realice la suma de los cuadrados de los valores de x .

PASO 3: Realice la suma de cada valor de x multiplicado por su valor


correspondiente y .

PASO 4: Calcule la pendiente de la recta usando la fórmula:

donde n es el número total de puntos de los datos.

PASO 5: Calcule la intercepción en y de la recta usando la fórmula:

donde son las medias de las coordenadas de x y y de los puntos de


datos respectivamente.

PASO 6: Use la pendiente y la intercepción en y para formar la ecuación de


la recta.
EJEMPLO 1
Use el método de mínimos cuadrados para determinar la ecuación de la
recta que mejor se ajusta para los datos. Luego grafique la recta.

Solución:
Grafique los puntos en un plano coordenado .

Calcule las medias de los valores de x y los valores de y , la suma de los


cuadrados de los valores de x , y la suma de cada valor de xmultiplicado
por su valor correspondiente y .
Calcule la pendiente.

Calcule la intercepción en y .
Primero, calcule la media de los valores de x y la media de los valores
de y .

Use la fórmula para calcular la intercepción en y .

Use la pendiente y la intercepción en y para formar la ecuación de la recta


que mejor se ajusta.
La pendiente de la recta es -1.1 y la intercepción en y es 14.0.
Por lo tanto, la ecuación es y = -1.1 x + 14.0.
Dibuje la recta en la gráfica de dispersión.
EJEMPLO 2
Construir una linea recta que aproxime los datos de la tabla y hallar la
ecuacion de la recta.
x 2 3 5 7 9 10
y 1 3 7 11 15 17

1. Primero hacemos el diagrama de dispersion.

2. Para determinar la ecuacion se eligen solo dos puntos, en este caso


tomamos el (3,3) y el (9,15)

3. Se reemplaza estos valores en la ecuacion de la recta y se obtiene la


ecuacion de la recta de regresion. 𝒚 = 𝒂 + 𝒃𝒙
(3,3) 3 = a + 3b
(9,15) 15 = a + 9b resolviendo obtenemos: a = -3 b = 2
la recta de regresion sera y = 2b - 3

4. Finalmente construimos la recta ajustada


x 0 1 2 3 4 5
y -3 -1 1 3 5 7
Comprobando se puede ver que los puntos se encuentran sobre la recta.

EJEMPLO 3
Hallar la pendiente, la ecuacion y las intersecciones de X e Y de la recta
que pasa por los puntos (1,5) y (4,-1).

PENDIENTE= b = (y1-y0)/(x1-x0) = {5-(-1)}/(1-4) = -2

ECUACION: y = a + bx.... 5 = a + (1)b


-1 = a + (4)b
resolviendo b = -2 ; a = 7; luego la ecuacion sera: y = 7 - 2x

LA INTERSECCION Y (y = 7 - 2x )
y = 0 ; x = 3.5

LA INTERSECCION X (y = 7 - 2x)
x=0;y=7
ANEXOS DE EJERCICIOS SOBRE MINIMOS CUADRADOS
De acuerdo a la información mostrada a continuación, determina
¿cuáles serán los costos en una jornada de trabajo de 40 horas?.
MES COSTO HORAS
(Y) (X)
ENERO 400 10.00
FEBRERO 500 12.50
MARZO 500 17.50
ABRIL 600 20.00
MAYO 1,500 50.00
JUNIO 900 30.00
TOTAL 4,400 140.00

SOLUCIÓN
MES COSTO HORAS (X) (X)(Y) X2
(Y)
ENERO 400 10.00 4000 100
FEBRERO 500 12.50 6250 156
MARZO 500 17.50 8750 306
ABRIL 600 20.00 12000 400
MAYO 1,500 50.00 75000 2,500
JUNIO 900 30.00 27000 900
TOTAL 4,400 140.00 133,000 4,363

Y = a + bx
Y = 87.75 + 27.67(x)
Con esta ecuación de mínimo cuadrado se pueden predecir los costos
totales aproximados de acuerdo a las horas laboradas.
Y = 87.75 + 27.67(40)
Y = 87.75 + 1106.8
Y = $1,194.55

Vous aimerez peut-être aussi