Vous êtes sur la page 1sur 4

1. ¿Qué diferencia hay entre la prueba de White y Breush -Pagan?

Que la prueba de White no se apoya en el supuesto de normalidad


2. ¿En qué consiste la sensibilidad y especificidad en un modelo de regresión
logística?
Sensitividad: probabilidad de acertar en las que si sucede el éxito y el modelo las
clasifica como sí.
Especificidad: probabilidad de acertar en las que no sucede.

3. Si un modelo de regresión lineal se encontró que el coeficiente de


correlación de dos variables independientes es de 0.70, ¿existirá problema
de colinealidad en el modelo estimado, compruébelo?
¿No existirían problemas de colinealidad… xq?
Vif=1/(1-rho(i,j))
Vif=1/(1-0,70)=3,33
Si el vif es cercano al 1 se dice que hay ausencia de colinealidad.

4. ¿Qué diferencia existe entre un modelo lineal de probabilidad y un modelo


logit?
Que el modelo lineal de probabilidad se estima por el método de mínimos cuadrados ordinarios y
el logit se estima por máxima verosimilitud. Además en el MLP la variable dependiente es
dicotómica Y=(0,1) con sus respectivas probabilidades de éxito y fracaso, mientras que en el
logit la variable dependiente es logarítmica.

5. En un estudio realizado para un municipio del departamento se estimó un


modelo de regresión lineal múltiple para explicar el salario de los
funcionarios públicos de la alcaldía, pero se encontró que el 40% de ellos
tenían un ingreso muy elevado y el restante un ingreso muy bajo. ¿Qué
supuesto no se cumpliría bajo estas condiciones y qué consecuencia
provocaría?
En ese estudio se pueden presentar problemas de heterocedasticidad. Dado que habrá datos o
valores atípicos y ocasionará problema en la varianza. (esta no será constante en los residuos).

6. Se quiere estimar la decisión de las personas en ingresar a una carrera


profesional o una técnica, teniendo en cuenta su edad, el puntaje obtenido
en el bachillerato, la ciudad de residencia, años educativo de los padres.
Teniendo en cuenta lo anterior, ¿Cuál sería el método de estimación los
coeficientes del modelo, por qué?
El método de estimación para este modelo es máxima verosimilitud. Pues hay una decisión con
2 opciones de respuesta (1,0) y la mejor forma de tratar las variables dependientes dicotómicas
es con un modelo logit bajo el método de MVM.

7. Uno de los problemas en un modelo de regresión lineal es encontrar errores


estándares muy grande, ¿qué implicaciones tiene esto?
Los errores estándares muy altos llevan a que se incumpla el supuesto de normalidad en los
residuos.
8. ¿Por qué un modelo lineal de probabilidad no es conveniente realizarlo?
No es conveniente realizar un modelo lineal de probabilidad xq se pueden presentar diversos
problemas.
 No hay normalidad en las perturbaciones xq la variable dependiente, al igual que las
perturbaciones siguen la distribución Bernoulli.
 La varianza de las perturbaciones no es homocedástica (no hay varianza constante). Dado que la
distribución de estas no es normal.
 El valor del r cuadrado como medida de bondad del ajuste es cuestionable. este tiene un valor
limitado en los modelos de respuesta dicotómica

9. En un modelo regresión logística ¿qué supuestos hay que tener en cuenta al


momento de realizar la estimación?
la variable dependiente no puede ser lineal. No se cumple el supuesto de normalidad
de los residuos

10. Si se quisiera estimar un modelo que explique la cantidad de automóviles


vendido por cada concesionario de Colombia y para esto se utilizan las
siguientes variables: PIB per cápita de cada ciudad, tasa de interés local,
automóviles vendidos en al año anterior del estudio, fuerza laboral
empleada en la ciudad. ¿existiría algún inconveniente en realizar la
estimación deseada, por qué?
Si existiría un inconveniente, pues al tener en cuenta el número de automóviles vendidos en el
año anterior se pueden presentar problemas de autocorrelación en los residuos. Una de las
razones por las que se presenta la autocorrelación son los modelos autorregresivos; es decir.
que la variable dependiente está también como independiente, pero en un periodo anterior.

11. ¿Qué diferencia existe entre ODDS y razón ODDS?


Los ODDS son la proporción entre las probabilidades de ocurrencia y no ocurrencia del evento.
Y la razón ODDS muestra el cambio proporcional en la variable de respuesta cuando las
independientes se incrementan en una unidad.

12. Teniendo en cuenta el siguiente modelo: 𝑦̂ = 3.813 + 2.9617𝑋1 − 18063𝑋2 +


0.3267𝑋3 con valor t (1.7619) (1.4268) (-2.4126) (0.3425) respectivamente y 𝑅2
= 0.9852. ¿Qué supuesto no se cumple, por qué? Multicolinealidad.

13. Un economista afirma que la covarianza de los residuos es insesgada, por


tal razón los residuos presentan autocorrelación, ¿está de acuerdo con esta
afirmación, por qué?
No se está de acuerdo. El problema de la autocorrelación
14. ¿Qué problema puede ocurrir cuando se incluyen muchas variables
dicotómicas en un modelo de regresión lineal?
Se puede presentar problemas de multicolinealidad si se tienen muchas variables dicotómicas en
un modelo de regresión lineal.

15. En un modelo de regresión estimado mediante MCO se aplicó la prueba de


Durbin-Watson dando como resultado 2,982, ¿Usted qué haría?
Con valor de b-w cercano a 3 es el caso de una zona de indecisión
16. ¿Qué ocurre con un modelo de regresión lineal cuando hay datos atípicos?
17. Cuando hay datos atípicos en un modelo de regresión se pueden presentar problemas de: 1
Heteroscedasticidad y 2 también se puede incurrir en la violación del supuesto de la normalidad
en los residuos.
18. ¿Cuándo hay presencia de heteroscedasticidad que le pasa a los
coeficientes del modelo?
En presencia de heteroscedasticidad los coeficientes del modelo pueden estar sobreestimados
(por encima del valor real) o subestimados (por debajo del valor real).

19. ¿Qué les pasa a los intervalos de confianza de los coeficientes del modelo
de regresión lineal cuando hay presencia de multicolinealidad perfecta?
En presencia de multicolinealidad perfecta, los intervalos de confianza de los coeficientes
tienden a ser muy amplios, aumentando la probabilidad de que no sean significativos.

20. ¿Cómo se soluciona el problema de multicolinealidad?


Para solucionar la multicolinealidad se puedes: No hacer nada, Se puede hacer una eliminación
de la variable que esté correlacionada con otra, se puede aumentar el tamaño de la muestra o
se puede usar información a priori (antes de).
21. ¿Cómo se soluciona el problema de heteroscedasticidad?
Para solucionar la heterocedasticidad se pueden hacer varias cosas.
 Se puede hacer una transformación de variables a logaritmos con el fin de disminuir la
variabilidad de estas.
 Se puede cambiar el método de estimación, pasando de MCO (Mínimos cuadrados ordinarios) a
MCG (Mínimos cuadrados generalizados).

22. ¿Cuáles son las razones por las cuales ocurre la heteroscedasticidad?
La heteroscedasticidad en un modelo se presenta por:
 Presencia de datos atípicos
 Asimetría en la distribución de los datos
 Forma funcional incorrecta del modelo

23. ¿Cuáles son las razones por las cuales ocurre la autocorrelación en los
residuos?
La autocorrelación en los residuos ocurre porque se tiene una variable dependiente y esta misma
está considerada como independiente, pero en un periodo anterior (Autorregresivo—depende de ella
misma en un tiempo anterior). O por un sesgo o error de especificación en el modelo.

24. ¿Cuáles son las consecuencias de la heteroscedasticidad?


Las consecuencias de la heterocedasticidad son:
 Se pueden obtener coeficientes sobreestimados o subestimados (por encima o por debajo de su
valor real) y sus varianzas y cov
 Si la varianza es alta, los intervalos de confianza pueden ser muy amplios, pero si es baja estos
son angostos.
 Se aumenta la probabilidad de cometer un error tipo 1 o un error tipo 2.

25. ¿Qué consecuencia hay si se presenta multicolinealidad?


En presencia de multicolinealidad:
 Los coeficientes pueden ser indeterminados o no estimables y tienen errores estándares infinitos.
 A pesar del teorema de Gauss-Marcokv .. los estimadores presentan varianzas grandes que
hacen que la estimación de los coeficientes sea menos precisa.
 Los intervalos de confianza de los coeficientes pueden ser muy amplios (aumentando la
probabilidad de encontrarse el cero entre dicho intervalo y que la variable independiente no sea
significativa).
 Se puede tener un coeficiente de determinación muy elevado (como falso).
 La razón t de los coeficientes no es significativa.

26. ¿Cuáles son las maneras para saber si un modelo de regresión logístico cuenta con
conformidad en las frecuencias predichas? La manera de saber si un modelo logit cuenta
con conformidad en las frecuencias predichas es por medio de la prueba Pearson.
Esta prueba tiene distribución chi-cuadrado. En la hipótesis nula se dice que existe conformidad con
las frecuencias predichas y en la alterna se dice que no hay tal conformidad. Si pal probabilidad
chi cuadrado es menor que el nivel de significancia se rechaza la hipótesis nula, y si es mayor;
no se rechaza.

27. En un modelo de regresión logística, ¿por qué no se recomienda usar el pseudoR 2?,
¿cuál se debe usar?
No es recomendable usar el pseudo r cuadrado, pues no se trata de una regresión lineal y este
sólo diría la explicación de las independientes a la dependiente. Se debe usar el Rcuenta, este
muestra cuantas clasificaciones son verdaderas y cuantas son falsas o en otras palabras
muestra el número de predicciones correctas.

28. ¿Cuáles son las consecuencias de la autocorrelación en los residuos?


Las consecuencias de la autocorrelación son:
 Si la autocorrelación es + los coeficientes pueden ser sobreestimados y si es negativa, los
coeficientes pueden ser subestimados
 Si la autocorrelación es positiva los intervalos de confianza de los coeficientes son muy amplios y
si es negativa sucede lo contrario.