Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCION
Con frecuencia debemos descubrir y medir ciertos graficos que presentan
configuraciones de ciertas puntos con marcada aproximacion a una recta,
parabola o algo desconocido. Si existe una tendencia o relaciones entre
ellas significara que debera resolverse un problema de ajuste de una
curva.
En estadistica el ajuste de una curva pueden dividirse en 3 partes:
1. Decidir que clase de curva debe ajustarse a los datos.
2. Calcular las constantes involucradas en la ecuacion de la curva
seleccionada que ha de ajustarse a los datos.
forma de la ecuacion: y = f(x)
donde f(x) significa: alguna funcion de x
para una ecuacion de primer grado sera y = a + bx define una linea recta
3. Debera interpretar los resultados mediante explicaciones, estimaciones
y predicciones.
Recordemos cuestiones basicos:
PLANOS COORDENADOS
GRÁFICAS DE DISPERSIÓN
Una gráfica de dispersión puede ser usada para datos en la forma
de parejas ordenadas de números.
El resultado será un montón de puntos "dispersos" alrededor del plano.
Si la tendencia general es que los puntos suban a la derecha de la gráfica,
entonces decimos que hay una correlación positiva entre las dos variables
medidas.
Si los puntos caen a la izquierda de la gráfica, decimos que hay
una correlación negativa .
Si no hay tendencia general, entonces no hay correlación .
Si la tendencia no es muy pronunciada, esto es, los puntos están dispersos
ampliamente – entonces decimos que las variables están débilmente
correlacionadas .
Si la correlación es más pronunciada, decimos que las variables
están fuertemente correlacionadas .
EJEMPLOS
No hay correlación
REGRESIÓN LINEAL SIMPLE
Nos centraremos en primer lugar, en el caso de que la función que
relaciona las dos variables X e Y sea la más simple posible, es decir, una
línea recta.
Por ello pasaremos a interpretar los coeficientes que determinan una línea
recta.
Toda función de la forma: Y=a+bX
determina, al representarla en el plano una línea recta,
donde X e Y son variables y
a y b son constantes.
Por ejemplo: Y=3+2X.
SIGNIFICADO DE a y b
a es la ordenada en el origen, es decir, es la altura a la que la recta corta al
eje Y. Se denomina también término independiente.
b, también denominada pendiente es la inclinación de la recta, es decir, es
el incremento que se produce en la variable Y cuando la variable X
aumenta una unidad.
Por ejemplo, en el caso anterior Y=3+2X, por cada unidad que incrementa
la X, la Y presenta un incremento medio de 2 unidades.
En la recta de regresión -como ya veremos- b recibe el nombre
de Coeficiente de regresión.
FIG.1
Figura 3: Nube de puntos y posibles rectas que pueden pasar por ella.
Que pase lo más cerca posible de todos los puntos, es decir que diste poco
de todos y cada uno de ellos significa que hemos de adoptar un criterio
particular que en general se conoce como MÍNIMOS CUADRADOS.
Este criterio significa que la suma de los cuadrados de las distancias
verticales de los puntos a la recta debe ser lo más pequeña posible
(ver figura 4).
(Obviamente, este es uno de los posibles criterios a adoptar, pero es el
más utilizado).
Solución:
Grafique los puntos en un plano coordenado .
Calcule la intercepción en y .
Primero, calcule la media de los valores de x y la media de los valores
de y .
EJEMPLO 3
Hallar la pendiente, la ecuacion y las intersecciones de X e Y de la recta
que pasa por los puntos (1,5) y (4,-1).
LA INTERSECCION Y (y = 7 - 2x )
y = 0 ; x = 3.5
LA INTERSECCION X (y = 7 - 2x)
x=0;y=7
ANEXOS DE EJERCICIOS SOBRE MINIMOS CUADRADOS
De acuerdo a la información mostrada a continuación, determina
¿cuáles serán los costos en una jornada de trabajo de 40 horas?.
MES COSTO HORAS
(Y) (X)
ENERO 400 10.00
FEBRERO 500 12.50
MARZO 500 17.50
ABRIL 600 20.00
MAYO 1,500 50.00
JUNIO 900 30.00
TOTAL 4,400 140.00
SOLUCIÓN
MES COSTO HORAS (X) (X)(Y) X2
(Y)
ENERO 400 10.00 4000 100
FEBRERO 500 12.50 6250 156
MARZO 500 17.50 8750 306
ABRIL 600 20.00 12000 400
MAYO 1,500 50.00 75000 2,500
JUNIO 900 30.00 27000 900
TOTAL 4,400 140.00 133,000 4,363
Y = a + bx
Y = 87.75 + 27.67(x)
Con esta ecuación de mínimo cuadrado se pueden predecir los costos
totales aproximados de acuerdo a las horas laboradas.
Y = 87.75 + 27.67(40)
Y = 87.75 + 1106.8
Y = $1,194.55