Académique Documents
Professionnel Documents
Culture Documents
Yi = β0 + β1Xi + ui (1.1)
Yi = b0 + b1Xi (1.2)
Para obtener el termino de error, b 0 + b1Xi pasa al lado izquierdo de la ecuación (1.2),
generando una diferencia con Yi que es
Yi – b0 – b1Xi (1.3)
Σ (Y – b – b X )
i 0 1 i
2
(1.4)
R2 = SE/ST (1.9)
ESR = SR / (n – 2) (1.10)
Par manejar bien el estimador de MCO, se tienen que tener cuenta tres
supuestos que son fundamentales y así poder ejercer el modelo de MCO minimizando
los errores que pueden perjudicarlo, desplegando así resultados de los coeficientes
totalmente confiables que servirán para estimaciones futuras que en su mayoría son
acertadas. Los tres siguientes supuestos para MCO son:
1. El termino de error ui presenta una media poblacional igual a cero.
2. (Xi, Yi), i = 1,…,n, son obtenidas de manera independientes e idénticamente
distribuidas (iid) de su distribución conjunta
3. Los valores atípicos son improbables.
Para el numero 1 esto quiere decir que la distribución en su estudio de u i dado Xi tiene
como media igual a 0 por lo que E(u i | Xi) = 0, esto se debe a factores como la media
condicional de u en un experimento controlado aleatoriamente, donde el objeto de
estudio son asignados al azar ya sea para el grupo X=1 o X=0, por lo que se distribuye
de manera independiente de las características personales de los objetos de estudio,
entonces, la asignación de manera aleatoria hace que X y u sean independientes,
ocasionando que su media sea 0. Así también se evita un problema de correlación
entre X y u, ya que la correlación es una asociación lineal.
En el supuesto numero 2 se trata directamente de la obtención de información o datos
de la muestra, el supuesto menciona que si las observaciones se recopilan mediante
un muestreo aleatorio simple de una única y gran población, entonces X i y Yi, i = 1,…,n,
son independientes e idénticamente distribuidas, ya que si seleccionan observaciones
o datos al azar se distribuyen de manera totalmente independiente de otras
observaciones también seleccionadas al azar.
El ultimo supuesto, el 3, debe de ser el de mayor relevancia, ya que pueden cometerse
errores u omisiones ya sea en la recolección o análisis de datos, y por consecuencia en
la interpretación de datos que de estas derivan. En MCO, los datos atípicos son
improbables, y si los hay pueden ser engañosos. Esto puede derivarse en la
recolección u obtención de datos, tales como errores tipográficos donde un dato tenga
como valor real “19”, y sea colocado en “91”, generando un serio problema. Una forma
de detectar los datos atípicos es desplegando los datos, ya viendo cual es el dato
atípico se pasa a un análisis para decidir si el dato en cuestión es un error en la
recolección de datos o no, si es un error tipográfico, se procede a corregirlo. Si en
verdad es un dato atípico se puede incluir en la base de datos o removerla de la
misma. Todos estos pasos son para este tercer supuesto son muy importantes ya que
los MCO son sensibles a valores atípicos de gran tamaño, entonces deben examinarse
con cuidado con el fin de cerciorarse de que dichos datos atípicos estén registrados de
manera correcta y pertenezcan a la base de datos.
Capítulo 5:
Se empieza con el contraste de hipótesis del coeficiente β1, este tiene una
distribución normal para grandes muestras y el contraste se hace de la misma manera
que el método para medias poblacionales, por lo tanto, la hipótesis nula (H 0) y la
alternativa (H1) para β1 son las siguientes
H0: β1 = β1,0
H1: β1 = β1,0 (alternativa bilateral) (2.1)
Siguiendo los pasos generales se calcula la desviación estándar del estimador βˆ1,
ES(βˆ1), que este es un estimador de la desviación estándar muestral de βˆ1, σβˆ1,
entonces
Ya obtenidos estos datos se pasa de recoger los datos del estadístico t aplicado para
βˆ1, y β1,0 incluidos en la ecuación
Por ultimo se procede a conseguir el valor – p, que es muy importante para decidir si se
rechaza o no se rechaza la hipótesis nula. Para ilustrarlo se tiene en cuenta un valor –
p que es menor del 5% expone elementos contra la hipótesis nula en la dirección de
que, en su probabilidad de conseguir un valor de βˆ1 lo mas posible lejos del de la
hipótesis nula como el observado puedan ser menores al 5%, que cabe mencionar que
el 5% es la medida de significación más común que usan los estadísticos para el
análisis y decisión de hipótesis, el valor – p se obtiene
Tambien la hipótesis puede ser contrastada con el mismo nivel del 5% haciendo una
comparacion del resultado del estadístico t con un intervalo de +1.96 y -1.96 para ver si
se rechaza la hipótesis nula con significación del 5% si |t act| > 1.96.
H0: β1 = β1,0
H1: β1 < β1,0 (alternativa unilateral) (2.3)
β1,0 es el valor de β1 bajo la nula, mientras que la alternativa β1 es menor que β1,0. Si la
alternativa es que β1 sea mayor, entonces se invierte. La interpretación en el estadístico
t es muy importante ya que la hipótesis nula se puede rechazar y se toma en cuenta la
alternativa para resultados del estadístico t que sean muy altos y negativos, pero no
para resultados muy altos y positivos, por lo tanto para un nivel de significación del 5%
la hipótesis nula se rechaza si tact < -1.645
H0: β0 = β0,0
H1: β0 es diferente a β0,0 (alternativa bilateral) (2.4)
Se procede de la misma manera para el análisis que se hizo para β1, y si es unilateral
se trabajan con los mismos pasos para el contraste unilateral que se hizo con β1.
Yi = β 0 + u i (Di = 0) (2.7)
Como E(ui|Di) = 0, la esperanza condicional de Y i cuando Di = 0 es E(Yi|Di) = β0,
entonces teniendo este resultado se interpreta como β0 el valor de la media
poblaciones, cuando Di = 1
Yi = β0 + β1 + ui (Di = 1) (2.8)
Capítulo 6:
Esto quiere decir que aumenta el tamaño de la muestra, βˆ1 se acerca β1 + ρxu(σu/σx)
haciendo que crezca.
Donde E(Yi|X1i = x1, X2i = x2) es la esperanza condicional de Yi, dado X1i = x1, X2i = x2. La
ecuación (3.2) que es la función de regresión poblacional en el modelo de regresión
múltiple. Como ya se sabe, β0 es el intercepto o termino constante, que se obtiene
su valor cuando X1 y X2 son 0, gráficamente se puede ver donde la recta de
regresión múltiple el punto donde atraviesa en el eje de las Y, β1 es el coeficiente
de X1i, β2 es el coeficiente de X2i, y si se añaden mas variables que son
independientes del modelo de regresión múltiple se les llama variables de
control. Para interpretación de β1 es diferente para el caso de la regresión
múltiple que en la regresión simple, porque ahora es el efecto que ejerce sobre
Y de la variación en una unidad de X1, manteniendo igual o constante X2.
La variable X0i se denomina como regresor constante ya que esta asociado a β0 que
es el termino constante, además de que toma el mismo valor, que es 1 para
todas las observaciones, ambas ecuaciones, (3.3) y (3.4), son equivalentes para
su determinada función, aunque en la practica existe la posibilidad de que haya
múltiples factores omitidos en el modelo de regresión.
ESR = SR / (n – k – 1) (3.10)
R2 = SE / ST (3.11)