Vous êtes sur la page 1sur 5

Profesor: Julio Casanova

GUÍA MACHINE LEARNING


INTELIGENCIA DE NEGOCIOS
Jueves 14 de Mayo del 2015

Ejercicios Preprocesamiento, Visualización y Reduccion de Dimensiones

1. Si tenemos una variable de nuestro set de datos en estudio que tiene un 5 % de datos
faltantes ¿cuáles son los pasos que seguirı́a usted para continuar con el estudio? Explique
los distintos casos que podrı́an surgir.

2. Se quiere analizar algunas variables de un set de datos sobre el diagnóstico temprano de la


Diabetes. ¿En qué nos puede ayudar los Boxplot? ¿Qué representa cada componente del
gráfico? Ayúdese con un dibujo.

3. ¿PCA (Principal Component Analysis), es un algoritmo de Aprendizaje Supervisado o de


Aprendizaje No Supervisado? Fundamente su respuesta.

4. ¿Cuál es el objetivo del algoritmo PCA (Principal Component Analysis)? De al menos dos
aplicaciones del algoritmo.

Ejercicios Regresión Lineal

5. Suponga que para algún problema de regresión lineal (digamos, predicción del precio de la
vivienda visto en clase), tenemos algún conjunto de entrenamiento, y para nuestro conjunto
de entrenamiento nos las arreglamos para encontrar algún θ0 , θ1 tal que J(θ0 , θ1 ) = 0. Para
cada una de las siguientes afirmaciones escriba si es verdadera o falsa, y fundamente su
respuesta en ambos casos:

a) Si esto es cierto, deberı́amos tener θ0 = 0 y θ1 = 0 para que hθ (x) = 0.


b) Para estos valores de θ0 y θ1 que satisfagan J(θ0 , θ1 ) = 0, tenemos que hθ (x(i) ) = y (i)
para cada ejemplo de entrenamiento (x(i) , y (i) ).
c) Esto no es posible: por la definición de J(θ0 , θ1 ), no es posible que exista un θ0 y θ1
tal que J(θ0 , θ1 ) = 0.
d ) Podemos predecir perfectamente el valor de y incluso para nuevos ejemplos que no
hemos visto aún.
6. Suponga m = 4 alumnos que han tomado algún curso, y el curso tiene una prueba a la
mitad de este y un examen final. Usted ha recolectado un set de datos de sus puntajes de
la prueba y del examen final:

prueba (prueba)2 examen final


89 7921 96
72 5184 74
94 8836 87
69 4761 78

Desea utilizar la regresión polinómica para predecir el puntaje del examen final de un
alumno dado su puntaje en la prueba. Concretamente, supongamos que desea ajustar un
modelo de la forma hθ (x) = θ0 + θ1 x1 + θ2 x2 , donde x1 es el puntaje de la prueba y x2 es
(puntaje prueba)2 . Además, tiene previsto escalar las variables (dividiendo por el “max-
min”, o rango, de una variable) y normalizar a la media.

(1)
¿Cuál es el valor de x1 normalizado?

7. Digamos que f es una función tal que la salida de f (θ0 , θ1 ) es un número. Para este
problema, f es una función suave desconocida (no es necesariamente la función de costo
de una regresión lineal, ası́ que f puede tener óptimos locales). Suponer que usamos el
descenso del gradiente para tratar de minimizar f (θ0 , θ1 ) en función de θ0 y θ1 . Para cada
una de las siguientes afirmaciones escriba si es verdadera o falsa, y fundamente su respuesta
en ambos casos:

a) Ajustar una tasa de aprendizaje α muy pequeña no es dañino, sólo puede acelerar la
convergencia del descenso del gradiente.
b) Si θ0 y θ1 son inicializados en un mı́nimo local, una iteración no cambiará sus valores.
c) Incluso si la tasa de aprendizaje α es muy grande, cada iteración del descenso del
gradiente disminuirá el valor de f (θ0 , θ1 ).
d ) Si θ0 y θ1 son inicializados en el mı́nimo global, una iteración no cambiará sus valores.

8. Considerar el problema de predecir que tan bien le va a ir a un alumno en su segundo año


de universidad, dado que tan bien le fue en su primer año. Especificamente, dejar x como
la cantidad de promedios sobre 5 que el alumno obtuvo en su primer año de universidad.
Nos gustarı́a predecir el valor de y, el cual está definido como el número de promedios
sobre 5 que obtendrá en su segundo año.

Usaremos el siguiente conjunto de entrenamiento que es una pequeña muestra del rendi-
miento de distintos alumnos. Cada fila es un ejemplo de entrenamiento. Vamos a utilizar
una regresión lineal, por lo tanto nuestra hipótesis es: hθ (x) = θ0 + θ1 x, y usaremos m
para expresar el número de ejemplos de entrenamiento.

x y
3 4
2 1
4 3
0 1
a) ¿Cuál es el valor de m?
1 Pm (i) ) − y (i) )2 .
b) La función de costo para una regresión lineal es J(θ0 , θ1 ) = 2m i=1 (hθ (x
¿Cuál es el valor de J(0, 1)?
c) Suponga que tenemos que θ0 = −1, θ1 = 0,5. ¿Cuál es el valor de hθ (4)?

Ejercicios Regresión Logı́stica

9. Suponga que tiene el siguiente conjunto de entrenamiento y ajusta una regresión logı́stica
hθ (x) = g(θ0 + θ1 x1 + θ2 x2 ).
2

1,5
x1 x2 y
x2 1 1 0.5 0
1 1.5 0
0,5 2 1 1
3 1 0

0 1 2 3 4
x1
Para cada una de las siguientes afirmaciones escriba si es verdadera o falsa, y fundamente
su respuesta en ambos casos:

a) J(θ) es una función convexa, por lo tanto el descenso del gradiente deberı́a converger
a un mı́nimo global.
b) Con el valor óptimo de θ, tendrı́amos J(θ) ≥ 0.
c) Agregando variables polinómicas (por ejemplo: usamos hθ (x) = g(θ0 + θ1 x1 + θ2 x2 +
θ3 x21 + θ4 x1 x2 + θ5 x22 )) aumentarı́a J(θ) porque ahora estarı́amos sumando más térmi-
nos.
d ) Si entrenamos el descenso del gradiente las suficientes iteraciones, para algún ejemplo
x(i) en el conjunto de entrenamiento es posible obtener hθ (x(i) ) ≥ 1.

10. Suponga que ha ejecutado dos veces una regresión logı́stica,  una vez con λ = 0, y otra
81,47
vez con λ = 1. Una de las veces, obtuvo el parámetro θ = , y la otra vez obtuvo
12,69
 
13,01
θ= . Sin embargo, usted olvidó qué valor de λ corresponde a qué valor de θ. ¿A
0,91
cuál de estos valores de θ piensa que corresponde λ = 1? Justifique su respuesta.

11. Explique por qué la función de costo de la Regresión Logı́stica es convexa. Podrı́a ser útil
ayudarse con gráficos.
"m #
1 X (i) (i) (i) (i)
J(θ) = − y log(hθ (x )) + (1 − y ) log(1 − hθ (x ))
m
i=1
12. Suponga que ha entrenado un regresión logı́stica, y la salida de un nuevo ejemplo x predice
hθ (x) = 0,4. Según esto ¿Cuál es el valor de P (y = 0|x; θ)?

Ejercicios Aplicación de Algoritmos de Aprendizaje

13. Suponga que usted ha implementado una regresión logı́stica regularizada para clasificar
qué objeto representa una imagen. Sin embargo, cuando se prueba la hipótesis de un nuevo
conjunto de imágenes, usted encuentra que tiene errores inaceptablemente grandes con sus
predicciones sobre las nuevas imágenes. Sin embargo, su hipótesis se desempeña bien (tiene
un bajo error) en el conjunto de entrenamiento. ¿Cuáles son los pasos que deberı́a seguir?

14. Usted ha entrenado un modelo de clasificación con la regresión logı́stica. Para cada una
de las siguientes afirmaciones escriba si es verdadera o falsa, y fundamente su respuesta
en ambos casos:

a) Agregar nuevas variables al modelo siempre resulta en un rendimiento igual o mejor


sobre ejemplos fuera del conjunto de entrenamiento.
b) Agregar algunas variables al modelo hace más probable que se sobre ajuste al conjunto
de entrenamiento.
c) Introducir la regularización al modelo siempre resulta en un rendimiento igual o mejor
sobre el conjunto de entrenamiento.
d ) Introducir la regularización al modelo siempre resulta en un rendimiento igual o mejor
sobre ejemplos fuera del conjunto de entrenamiento.

15. Supongamos que usted ha implementado regresión logı́stica regularizada para predecir
qué artı́culos comprarán los clientes en un sitio web. Sin embargo, cuando se prueba la
hipótesis en un nuevo conjunto de clientes, usted encuentra que tiene errores inacepta-
blemente grandes en sus predicciones. Por otra parte, el rendimiento de la hipótesis en el
conjunto de entrenamiento es malo. ¿Cuáles son los pasos que deberı́a seguir?

16. Suponga que está entrenando una regresión logı́stica regularizada (con λ = 0,5), con 100
variables (n = 100) y 1.500 ejemplos (m = 1500). Al graficar su curva de aprendizaje y el
parámetro de regularización λ para distintos valores, obtiene los siguientes gráficos:

Jcv (θ)
Error

Error

Jcv (θ)
Jtrain (θ)
Jtrain (θ)

0 750 1500 0 0,5 1 1,5 2


m (tamaño conjunto de entrenamiento) λ

a) ¿Cuál serı́a el diagnóstico de su algoritmo? Justifique su respuesta.


b) ¿Cuáles deberı́an ser los próximos pasos a seguir? Comente cómo cada paso puede
mejorar el rendimiento de su algoritmo.
17. Suponga que está entrenando una regresión logı́stica regularizada (con λ = 0,5), con 2
variables (n = 2) y 6.500 ejemplos (m = 6500). Su hipótesis serı́a la siguiente:

hθ (x) = g(θ0 + θ1 x1 + θ2 x2 )

Al graficar su curva de aprendizaje y el parámetro de regularización λ para distintos


valores, obtiene los siguientes gráficos:

Jcv (θ)
Jcv (θ)
Error

Error
Jtrain (θ) Jtrain (θ)

0 3250 6500 0 0,5 1 1,5 2


m (tamaño conjunto de entrenamiento) λ

a) ¿Cuál serı́a el diagnóstico de su algoritmo? Justifique su respuesta.


b) ¿Cuáles deberı́an ser los próximos pasos a seguir? Comente cómo cada paso puede
mejorar el rendimiento de su algoritmo.

Vous aimerez peut-être aussi