Vous êtes sur la page 1sur 9

UNIDAD 7 – ANALISIS DE REGRESION Y CORRELACION

1. Explique el significado de los términos: regresión y correlación.

Regresión:es un método que permite explicar la asociación entre dos o más variables.
Correlación: indicador matemático de relación entre dos variables
En el análisis de regresión, desarrollaremos una ecuación de estimación, esto es, una
fórmula matemática que relaciona las variables conocidas con la variable desconocida.
Después de conocer el patrón de esta relación, podremos aplicar el análisis de
correlación para determinar el grado en el que las variables se relacionan. El análisis
de correlación, entonces, nos indica qué tan bien la ecuación de estimación describe
realmente la relación.

2. Indique cuáles son los fundamentos del método de mínimos cuadrados aplicado en
regresión.

El fundamento del Método de Mínimos Cuadrados es obtener estimadores de los


parámetros B0 y B1 que minimicen la distancia de los errores con respecto a la nube
de puntos. Encontrar los valores de B0 y B1 que más se ajusten a los datos, entre las
infinitas rectas se encuentra una.
Deseamos encontrar una forma de “penalizar” errores absolutos grandes, para poder
evitarlos. Podemos lograr esto si elevamos al cuadrado los errores individuales antes
de sumarlos. Los cuadrados de cada término logran dos objetivos:
1. Magnifica, o penaliza, los errores más grandes.
2. Cancela el efecto de los valores positivos y negativos (un error negativo al
cuadrado sigue siendo positivo).
Como estamos buscando la línea de estimación que minimiza la suma de los
cuadrados de los errores, a esto le llamamos método de mínimos cuadrados.

3. Enuncie los supuestos del modelo de regresión lineal simple.

 E(e)= 0
 Normalidad: La distribución del termino error e es normal (Normalidad del
Error)
 Varianzas homogéneas
 Independencia

4. Indique de qué forma los supuestos del error de regresión se trasladan a la variable
dependiente
5. En un estudio de asociación basado en una muestra de 20 pares de valores x, y, se
obtuvo una ecuación dada por ŷ =1.2 – 0.56 x. Si y es tasa de endeudamiento y x
tasa de interés vigente en el mercado, ¿qué significado tienen los valores 1.2 y 0.56 de
la ecuación?

1,2 = b0  es el valor promedio de la tasa de endeudamiento cuando la tasa de


interés vigente en el mercado es cero.
0,56 = b1  es el cambio estimado en la tasa de endeudamiento a raíz de un cambio
unitario en la tasa de interés del mercado.

6. En el estudio anterior se pretende averiguar en qué medida la estimación se


aproxima a los valores reales de la variable “y”, ¿qué medida permite observar esto?

La medida que permite observar en que mediad la estimación se aproxima a los


valores reales de la variable Y es el ERROR ESTANDAR de la regresión, el cual se
mide en las unidades de la variable de respuesta (Y) y representa la distancia estándar
que separa a los valores de los datos de la línea de regresión ajustada. Se utiliza para
evaluar que tan bien la ecuación de regresión predice la respuesta. Mientras más bajo
sea el valor de e, mayor será la veracidad del modelo propuesto.

7. ¿Qué es el error de regresión?

Ei = Yobs – Y
El error de regresión es la fórmula matemática que relaciona la variable desconocida
con las variables conocidas en el análisis de regresión.

8. ¿Qué significado tiene el error estándar de la regresión?

Medida de la confiabilidad de la ecuación de estimación, que indica la variabilidad de


los puntos observados alrededor de la recta de regresión, esto es, de qué manera los
valores observados difieren de sus valores pronosticados sobre la recta de regresión.

9. ¿Cómo se analiza la suma de cuadrados total en regresión? ¿Qué significa cada


una de sus componentes?

SCR  a la diferencia entre la recta ajustada y la recta Y, la llamamos desvío debido


a la regresión. Si se calcula este desvío para cada punto de las X, se los eleva al
cuadrado y se suman, obtenemos la suma de cuadrados de la regresión.
Es la suma de cuadrados de las variaciones explicadas por la regresión planteada, es
decir las variaciones por causas de las variables independientes Xi seleccionadas.
SCE  a la diferencia entre el valor de la variable y la recta ajustada la llamamos
error o desvío no explicado. Si calculamos el error ara cada punto de las X, lo
elevamos al cuadrado y lo sumamos, obtenemos la suma de cuadrados de los
errores.
Son las variaciones producidas por variables no consideradas en el modelo de
regresión.
SCT  la suma de cuadrados totales representa la variación total que existe entre los
valores reales y los valores de la regresión. Es igual a la suma de ambas sumas de
cuadrados
10. ¿Qué rango tiene el coeficiente de determinación general y que significan sus
rangos extremos?

R2 = coeficiente de determinación general = 1 – (SCE/SCT)


 Mide la proporción de la variación de Y que es explicada por la variable
independiente X, en el modelo de regresión.
 Determina la bondad de ajuste del modelo.
 Proporción que representa la suma de cuadrados explicada (SCR) en relación
a SCT.
 0 <= R2 <= 1 rango
 R2 = 1 ; el ajuste es perfecto (100% de las variaciones fueron explicadas por la
variable)
 R2 = 0 ; el ajuste es malo (0% de las variaciones fueron explicadas por la
variable)

11. El resultado logrado para el R2 en el análisis de regresión entre tiempo de


funcionamiento correcto y costo asignado a mantenimientos de equipos en un centro
de cómputos fue 0.63, conforme a este resultado en el modelo, ¿qué porcentaje se le
atribuye a regresión y cual a error?

El 63% de las variaciones de Y es explicado por X (SCR)


El 37% de las variaciones son atribuidas al error.

12. ¿Puede usted inferir respecto de la pendiente poblacional? ¿Con qué estadísticos
puede trabajar para esto?

Si se puede inferir respecto a la pendiente poblacional. Trabajando con un modelo de


regresión lineal simple inferimos a través de la prueba t o F, ya que la pendiente es
solo una. Los estadísticos son:

13. ¿Qué significa una hipótesis nula, H0 :   0 ?

Significa que no hay dependencia lineal o asociación entre la variable independiente y


la dependiente.

14. ¿Por qué en regresión lineal simple el VP de la prueba F es igual al de la prueba t?

Porque la diferencia entre la prueba t y F es que la prueba F explica todo el modelo, en


cambio la prueba t explica la dependencia para una sola variable. Pero al ser un
modelo de regresión lineal simple, hay una sola variable independiente, por lo que
serán iguales.

15. ¿Qué significa un VP de 0.00 en una prueba F para el modelo de regresión lineal?
¿Cómo plantea las hipótesis si tiene 3 variables independientes? ¿Qué sentido de
lateralidad tiene esta prueba y porque?

Un VP = 0,00 en una prueba F implica rechazar Ho, por lo que existe asociación
entres las variables. Las hipótesis planteadas serian:
Ho : B1=B2=B3= 0
H1 : Existe al menos una Bi distinta de 0.

Esta prueba es lateral derecha porque estamos buscando la existencia de


dependencia lineal por lo que el cociente entre CMR/CME debería ser grande y
situarse a la derecha.

16. ¿Qué significa un VP de 0.35 en una prueba F para el modelo de regresión lineal?

Un VP = 0,35 en una prueba F nos llevaría a aceptar Ho, por lo que podemos afirmar
que no existe asociación o que existe independencia entre las variables.

17. ¿Cómo verifica el cumplimiento de los supuestos del modelo de regresión lineal
simple?

Los supuestos se pueden verificar mediante Q-Qplot y la prueba de KS (Normalidad),


gráficos de residuos vs X o Y, residuos vs Y (múltiple) (Homogeneidad de Varianzas),
cumplimiento de la secuencia de valores o estadístico de Durbin-Watson
(independencia)

18. ¿Hay diferencias entre los supuestos del modelo de regresión simple y múltiple?

Sí, hay diferencias en los supuestos de ambos modelos. En el modelo de regresión


múltiple existe un quinto supuesto el cual indica que existe colinealidad entre las
variables.

19. ¿Qué significa y que mide un Factor de Inflación de la varianza de 8?

Mide la colinealidad entre las variables independientes. Un VIF de 8 es preocupante,


ya que indica bastante colinealidad entre las variables.
Utilícese para describir cuánta multicolinealidad (correlación entre predictores) existe
en un análisis de regresión. La multicolinealidad es problemática debido a que puede
aumentar la varianza de los coeficientes de la regresión, lo que haría que fuesen
inestables y difíciles de interpretar.
Colinealidad exacta: cuando una o más variables, son una combinación lineal de otra,
es decir, existe un coeficiente de determinación entre estas dos variables de 1.

20. En un análisis de regresión entre tres variables independientes y una dependiente,


la prueba t dio un valor p de 0.0003 en la variable x2, ¿Qué significa esto? Si el VIF es
de 6 para x2, ¿Qué implica?
UNIDAD 8 – SERIES DE TIEMPO

1. En análisis de series temporales, cual es el modelo que sustenta el método clásico


de análisis.

Es el modelo Multiplicativo. Yt = Tt x St x Ct x It

2. Defina las cuatro componentes en el análisis de series de tiempo.

 Tendencial: determina el comportamiento general de la serie y muestra como la


variable evoluciona a través del tiempo. Actúa en periodos largos de tiempo,
considerándose en general más de dos años. Con el primer tipo de variación, la
tendencia secular, el valor de la variable tiende a aumentar o disminuir en un periodo
muy largo. El incremento estable en los costos de vida registrados en el Índice de
Precios al Consumidor (IPC) es un ejemplo de tendencia secular. De un año a otro, el
costo de vida varía bastante, pero si examinamos un periodo a largo plazo, nos damos
cuenta que la tendencia tiende a aumentar de manera estable
 Estacional: Aquellas variaciones provocadas por efectos estacionales, es decir,
aquellos que se producen en periodos cortos y en forma recurrente año tras año. Se
denominan de esta forma porque se lo asocia a las estaciones provocadas por
factores climáticos. La variable presenta un comportamiento en el corto plazo que año
tras año se repite en la misma época. (artículos navideños)
 Cíclico: efecto de los factores que generan cambios en periodos largos y suele
asociarse con los ciclos económicos. Estos cambios responden a cuatro etapas:
expansión, prosperidad, recesión y depresión. (ciclos ganaderos).
 Irregular: todos los factores no considerados anteriormente. Actúa en el corto plazo
y puede ser considerado como permanente o excepcional.

3. Un administrativo de compras de una empresa indicó que los cambios estacionales


se deben a efectos de los ciclos económicos por lo que inciden notablemente en
períodos anuales o bianuales. (V-F)

FALSO. Los cambios estacionales están relacionados a factores climáticos.

4. Una serie estable a través del tiempo, sin crecimiento ni decrecimiento se dice
estacional. (V – F)

VERDADERO. Estacionarias: Una serie es estacionaria cuando es estable, es decir,


cuando la media y la variabilidad son constantes a lo largo del tiempo. Esto se refleja
gráficamente en que los valores de la serie tienden a oscilar alrededor de una media
constante y la variabilidad con respecto a esa media también permanece constante en
el tiempo. Es una serie básicamente estable a lo largo del tiempo, sin que se aprecien
aumentos o 5 disminuciones sistemáticos de sus valores.

No Estacionarias: Son series en las cuales la media y/o variabilidad cambian en el


tiempo. Los cambios en la media determinan una tendencia a crecer o decrecer a
largo plazo, por lo que la serie no oscila alrededor de un valor constante.
5. Cuando analizamos la componente de tendencia, se trabaja con análisis de
regresión múltiple (V – F)

FALSO. Se trabaja con un análisis de regresión lineal simple, ya que se están


analizando solo dos variables. (Tiempo y ventas por ejemplo) Yt = B0 + B1 x Tiempo

6. En el estudio de tendencia, por el método de regresión, lo más importante es el


cumplimiento de los supuestos del modelo de regresión y la aplicación de inferencias
sobre la pendiente. (V - F)

7. Ud. ha analizado la serie de ventas bimestrales de los cuatro últimos años,


codificando con numeración correlativa, y empezando desde enero del primer año,
además la ecuación de regresión dio, 28 + 2.5 x, y el índice estacional del segundo y
cuarto bimestre mostraron caída en 0.10 y 0.08 respectivamente, estime las ventas del
bimestre 8 y del bimestre del bimestre 16 de la serie analizada ajustando por efecto
estacional.

BM8 --– ventas estimadas = (28 + (2,5*8))* 0,90 = 48 * 0,90 = 43,2


BM16 – ventas estimadas = (28 + (2,5*16))* 0,92 = 68 * 0,92 = 62,56

8. Desestacionalice un monto de compras analizado por el método clásico, con valor


en miles de pesos de 28 si corresponde al tercer trimestre de una serie de 3 años,
enumerada en forma correlativa desde el primero con índice estacional de 1.17, 0.98,
1.02, y 0.83, respectivamente para cada trimestre.

Compras desestacionalizadas = (28.000/102)*100 = 27.450,98

9. Sintetice en tres pasos como obtiene los índices estacionales por el procedimiento
de razón a promedio móvil dentro del método clásico.

a) Suavizar mediante promedios móviles. Promediar de manera consecutiva una


cantidad L de valores de la serie.
b) Eliminar el efecto de los factores del corto plazo: S, I, quedando solo tendencia
Yt = Tt
c) Determinar el índice estacional por sub periodo y eliminar el efecto irregular. Esto
implica: ordenar por sub periodo y promediar de la mejor forma (media, mediana, tri
media). Ajustar para que la suma sea la cantidad de sub periodos por 100.
UNIDAD 9 – CONTROL DE CALIDAD

1. ¿Cuál es el principal objetivo del control estadístico de calidad?

Sus objetivos fundamentales son: mantener bajo control un proceso y eliminar las
causas que provocan deficiencias en las diferentes fases del Ciclo de Calidad.
El objetivo principal del control estadístico de procesos es determinar si las variaciones
en el producto se deben a causas asignables o a causas comunes

2. Defina brevemente los conceptos de causas asignables y aleatorias.

Causas Aleatorias: son aquellas que están siempre presentes en un proceso; son
muchas en cantidad pero su influencia es pequeña y podemos decir que producen
variaciones que se deben al azar; la distribución de probabilidad de las variaciones
provocadas por este tipo de causas responde a la Normal; como están siempre
presentes en el proceso, este tendrá sus parámetros (Media y Dispersión)
perfectamente definidos con estas causas actuando. Cuando un proceso funciona con
solo caudas aleatorias de variación, decimos que está bajo control.
Causas Asignables: son pocas en cantidad pero provocan gran influencia en los
procesos; no están siempre presentes ni responden a una ley de probabilidad; suelen
ser sencillas de identificar y de eliminar. Cuan estamos ante un proceso que actúa con
causas aleatorias y con causas asignables de variación, decimos que el mismo está
fuera de control.

3. ¿A qué se llama ERROR TIPO I, y ERROR TIPO II en el procedimiento de control


de calidad?

Las hipótesis estadísticas del procedimiento de prueba serán:


H0: El proceso está bajo control
H1: El proceso está fuera de control

Situaciones del proceso de producción

H0 verdadera H0 falsa
Que continúe el
El proceso está bajo El proceso está fuera de
proceso
Decisión control control

Decisión correcta Error tipo II

Ajustar el proceso Error tipo I Decisión correcta

4. ¿Cuáles son los dos procedimientos que se pueden aplicar en control estadístico de
calidad?

Los procedimientos son Cartas o Gráficas de Control y Estudio de Capacidad.


Cartas de control: pueden ser para variables o para atributos. Los primeros se utilizan
para controlar características medibles de los productos; mientras que los segundos se
utilizan cuando un producto se los clasifica en bueno o defectuosos según cumpla o no
las especificaciones. El objetivo de los Gráficos de control es monitorear el proceso a
fin de mantenerlo dentro de su capacidad operativa y actuando solo con causas
naturales de variación, esto es: bajo control.
Estudios de Capacidad: una vez que el proceso está controlado y funcionando solo
con causas comunes de variación, el paso siguiente es determinar si el mismo tiene
capacidad para cumplir con las especificaciones. La capacidad del proceso solo puede
ser evaluada en el caso de que el proceso se encuentre bajo control estadístico, y se
puede definir como aquellos límites dentro de los cuales, la única fuente de variación
son las causas comunes o aleatorias del sistema.

5. ¿Qué gráficos pude realizar en estudios de control para variable cuantitativa?

Los gráficos más utilizados son los gráficos x , R, gráfico de medias muestrales y
gráficos de rangos muestrales. Al analizar ambos Gráficos podemos observar en el
proceso que se pueden presentar cuatro condiciones: tener o no exactitud y tener o no
precisión, por lo que hay que analizar cada uno de manera individual.
Diremos que un proceso está bajo control cuando en ambos gráficos todos los
resultados de las muestras caen dentro de los límites de control. Mientras que diremos
que esta fuera de control cuando uno o más puntos muestrales, en uno o ambos
gráficos, caen fuera de los límites establecidos.

Gráfico de medias muestrales: en el intervalo se encuentra el 99,73% de las medias


muestrales. Gráfica de control para supervisar las medias de los procesos.

R
  3 x 3
d2 n

x  R A2

Gráfico de rangos muestrales: Gráfica de control para supervisar la variabilidad de


los procesos. En el intervalo se encuentra el 99,73% de los rangos muestrales.

d3
R  3R
d2

LSCR  R D4

LICR  R D3
6. ¿Qué indica un gráfico de control que posee cinco puntos consecutivos por encima
o debajo de la línea de control?

Esto se conoce como Racha. Éstas son un conjunto de puntos muestrales


consecutivos, que tienen una baja probabilidad de ocurrir solo por azar.

7. ¿Qué significa si el gráfico de control presenta tendencia decreciente?

Indica que la media del proceso puede estar cambiando, en esta caso disminuyendo.

8. ¿Con que índices estudia la capacidad del proceso productivo?

La evaluación sobre el funcionamiento correcto de un proceso se realiza en base a los


índices de capacidad y estabilidad (aptitud), Cp y Cpk respectivamente.

LST  LIT VT
Cp :  Debe ser mayor a 1,33 para que el proceso sea
R VN Capaz de producir artículos buenos, es decir que
6 satisfacen las especificaciones de tolerancia.
d2
Cpk : (min cpi o cps )
Debe ser mayor a 1,33 para que el proceso esté
x  LST centralizado en torno a la verdadera media y
cps  produzca un porcentaje de defectuosos equivalente
R a (1-0,9997)*100. Apto.
3
d2
LIT  x
cpi 
R
3
d2

9. ¿Qué indica el índice de capacidad si su valor es de 1.8?

Como 1,8 > 1,33 el proceso es capaz de producir artículos buenos, es decir, que
satisfacen las especificaciones de tolerancia.

10. ¿Qué representa un Cpk de 0.89?

Como 0,89 < 1,33, el proceso no es apto, por lo que se debe calcular el porcentaje de
defectuosos, por exceso y/o por defecto, que el mismo produce. El proceso no está
centrado en la media.

11. ¿En qué se basa el estudio de capacidad del proceso, en lo concerniente a la


distribución poblacional de la variable cuantitativa?

La capacidad del proceso solo puede ser evaluada en el caso de que el proceso se
encuentre bajo control estadístico, y se puede definir como aquellos límites dentro de
los cuales, la única fuente de variación son las causas comunes o aleatorias del
sistema. Debe seguir una distribución Normal y casi todas las unidades fabricadas en
condiciones de control (99,7%) se encontraran en un intervalo de amplitud de +-3.

Vous aimerez peut-être aussi