Académique Documents
Professionnel Documents
Culture Documents
1
Para decidir qué clase de función podría ajustarse a la curva, de acuerdo con las
posibilidades de la figura 1, debe hacerse una gráfica de dispersión de los datos observados. Si en
dicha gráfica se aprecia que los puntos se distribuyen alrededor de una recta, se procede a realizar
un análisis de regresión lineal.
La gráfica de dispersión nos sugiere que existe una relación lineal entre la variable
independiente porcentaje de pobreza en 2010 y la variable dependiente porcentaje de pobreza en
2011.
El modelo de regresión lineal simple es:
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜖
Los valores de los parámetros 𝛽0 𝑦 𝛽1no se conocen y deben estimarse a partir de los
datos de la muestra . Estos coeficientes que se calculan de la muestra son conocidos como
regresores . La ecuación estimada de regresión es
𝑦̂ = 𝛽0 + 𝛽1 𝑥
Para calcular los regresores se emplea el método de los mínimos cuadrados, este método
emplea los datos de la muestra para determinar las características de la recta que hacen mínima la
suma de los cuadrados de las desviaciones:
∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 ∑ 𝑥𝑖
∑ 𝑦𝑖 𝑥𝑖 = 𝑏0 ∑ 𝑥𝑖 + 𝑏1 ∑ 𝑥𝑖 2
En esta tabla los valores de intercepción y variable X1 hacen referencia a los coeficientes
𝛽0 𝑦 𝛽1 respectivamente. Remplazando estos datos en la ecuación 2, se tiene que la ecuación de
regresión para las variables pobreza en 2010 y pobreza en 2011 es:
𝑦̂ = −1,3148 + 0,94126𝑥
El coeficiente b1 también corresponde a la pendiente de la recta. En general, este
coeficiente expresa la razón de cambio entre la variable dependiente con respecto a un cambio
unitario en la variable independiente x.
En el ejemplo, la pendiente de la recta es positiva, lo que implica que en las ciudades
donde se observó mayor pobreza en 2010, también se observó mayor pobreza en 2011. Pero
como la pendiente es un número entre cero y uno, significa que el incremento en el porcentaje de
pobreza en 2011 entre una ciudad y otra es menor que en el 2010.
3
La tabla 3 muestra el valor de SSE, SSR Y SST en la columna que indica la suma de
cuadrados, de alli se obtiene el coeficiente r2 que aparece (0,969175). Esto revela que la ecuación
de regresión explica en un 96,92% los valores observados de la pobreza en 2011 según los
valores de pobreza en 2010.
(a) Tomando como variable dependiente en este estudio porcentaje de pobreza en 2011 y
la variable independiente porcentaje de pobreza 2010. Se utiliza este método debido a es una
técnica estadística utilizada para estudiar la relación entre variables, resaltando que en la
investigación social, el análisis de regresión se utiliza para predecir un amplio rango de
fenómenos, desde medidas económicas hasta diferentes aspectos del comportamiento humano. En
este caso al realizar el grafico de dispersión nos sugiere que existe una relación lineal entre la
variable independiente porcentaje de pobreza en 2010 y la variable dependiente porcentaje de
pobreza en 2011.
(b) Debido a su simplicidad y gran utilidad, en este estudio fue utilizado el programa
EXCEL, utilizando la herramienta ANALISIS DE DATOS,
2.
4
Supongamos el siguiente ejemplo. La resistencia a la rotura de un componente eléctrico
constituye una característica importante de un cierto proceso. Un fabricante utiliza un material
nuevo de fabricación frente al material clásico. Se recoge una muestra de 10 elementos usando el
primer componente y otra de 10 elementos usando el segundo componente.
Se pueden considerar a los dos procesos como dos tratamientos o dos niveles diferentes de
un factor dado.
Componente Nuevo Componente
antiguo
16.85 17.50
16.40 17.63
13.21 18.25
16.35 18.00
16.52 17.86
17.04 17.75
16.96 18.22
17.15 17.90
16.59 17.96
16.57 18.15
Se tiene que la media muestral del componente nuevo es ȳ1 = 16,76 y la del componente antiguo
es ȳ2 = 17,92.
Se pretende averiguar si existen diferencias significativas entre ambos tratamientos a nivel
de resistencia.
En este caso, se considera que los datos proceden de una m.a.s de una distribución normal,
y que el diseño es completamente aleatorizado.
5
El contraste de hipótesis que se tiene que realizar es bilateral:
H0 ≡ µ1 = µ2
H1 ≡ µ1 ≠ µ2
Fijamos α = P {error tipo I} = P{Rechazar H0|H0 siendo cierta}
Suponiendo normalidad y suponiendo que 𝜎12 = 𝜎22 , se utiliza el estadístico
siguiente:
𝑦1 − ̅̅̅
̅̅̅ 𝑦2
𝑡0 =
1 1
𝑆𝑝 √𝑛 + 𝑛
1 2
donde ȳ1 e ȳ2 son las medias muestrales, n1 y n2 son el tamaño de cada muestra y
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22
𝑆𝑝 2 =
𝑛1 + 𝑛2 − 2
Se compara el valor de este estadístico con el valor de una distribución t de
Student 𝑡𝛼;𝑛1 +𝑛2−2
2
muestra concreta que produzca un valor fuera de este intervalo es rara si H0 fuese cierta,
lo que lleva a rechazar la hipótesis H0.
En el ejemplo:
6
𝑆𝑝 = 0,204
𝐴𝑠í,
𝑦1 − ̅̅̅
̅̅̅ 𝑦2
𝑡0 = = −9,13
1 1
𝑆𝑝 √𝑛 + 𝑛
1 2
Por otro lado, 𝑡𝛼;𝑛1 +𝑛2−2 = t0,025;18 = 2,10, y como |t0| = 9,13 > t0,025;18 =
2
2,10, entonces no se acepta H0, esto es, existen diferencias significativas entre las dos
medias al nivel de confianza del 95 %.
(a) Variable: resistencia a la rotura de un componente eléctrico
Muestras independientes porque los valores de una muestra no revelan
información sobre los valores de la otra muestra.
(b) la distribución t (de Student) es utilizada debido a que las muestras tiene el
tamaño suficientemente pequeño para ser aplicado y son aproximadamente normal. En
este caso estamos estimando la media de una población normalmente distribuida cuando
el tamaño de la muestra es pequeña.
BIBLIOGRAFÍA
Cardona, González, Rivera, Hernán (2013) Aplicación de la regresión lineal en
un problema de pobreza
http://www.unilibre.edu.co/revistainteraccion/volumen12/art4.pdf
Walpole (2007) Probabilidad y estadística para ingenieros, p. 380