Académique Documents
Professionnel Documents
Culture Documents
A través de esta muestra, se desea estudiar la relación existente entre las dos variables X e Y.
Ahora asumiremos que si hay una relación de causalidad de la variable X (causa) hacia la variable
Y (efecto). Además, se sabe que esa relación es de tipo lineal, dentro del rango de los datos.
Estableceremos un modelo para explicar la causa (Y) en términos del efecto (X), del tipo
siguiente:
+ ei
1
de forma que sea una variable que toma valores próximos a cero.
Por tanto:
b>0 b<0
b=0
de forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son
de forma esquemática, las que siguen:
medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias
entre los valores reales y los aproximados al cuadrado (para que sean positivas y no se compensen
los errores):
2
2. Una aproximación de Y, se define a partir de dos cantidades a y b. Vamos a calcular
aquellas que minimizan la función por el Método de Mínimos Cuadrados
3. Posteriormente encontraremos fórmulas para el cálculo directo de a y b que sirvan para cualquier
problema.
1. Regresión de Y sobre X : + ei
Una vez que tenemos definido el error de aproximación mediante la relación , las cantidades que lo
minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los
mínimos cuadrados:
3
Las ecuaciones normales. La primera se escribe como
Lo que nos da las relaciones buscadas, determinándose los parámetros de la ecuación de regresión:
Donde:
Sxy = ΣYi X i - (Σ Y i ) (Σ X i )
n
Sx2 = Sxx = Σ X i ² - (Σ X i )²
n
Supuesto 1: E(e ) = 0
4
Es decir la media de lso errores a lo largo de una serie infinitamente larga de
experimentos es 0 para cada valor de xi
Se = √ CME …(1)
n -2
Si Se = 0; indica que existe una relación lineal perfecta entre las variables.
𝑺𝑪𝑴
̂𝟐 =
𝝈
𝒏−𝟐
6. Error estándar estimado de la pendiente
̂𝟐
𝝈
𝑺𝒆(𝒃) = √
𝑺𝒙𝒙
𝟏 𝒙̅𝟐
̂) =
𝑺𝒆(𝒂 ̂𝟐 [
√𝝈 + ]
𝒏 𝑺𝒙𝒙
Donde:
5
Nos gustaría tener que r=1, pues en ese caso ambas variables tendrían la misma varianza, pero
esto no es cierto en general. Todo lo que se puede afirmar, como sabemos, es que
Por ello:
r ≈1 r ≈ -1 r≈0 r≈0
Ahora si
6
9. Coeficiente de Determinación ( R2 )
7
Ejemplo 1:
2. Se lleva a cabo un estudio acerca de la cantidad de azúcar refinada mediante cierto proceso a varias
mperaturas diferentes como se indica a continuación.
3. Se prepararon 9 muestras de suelo con cantidades variables de fósforo. Las plantas de maíz que se
cultivaron en cada suelo fueron cosechadas al término de 38 días y se analizaron para determinar su
contenido de fósforo.
X: Fósforo orgánico en suelo (ppm) ; Y: Fósforo aprovechable por la planta (ppm)
X: 1 4 5 9 13 11 23 23 28
Y: 64 71 54 81 93 76 77 95 109