Académique Documents
Professionnel Documents
Culture Documents
INFORMACIN BSICA
NOMBRE DE LA PRCTICA:
Reduccin de dimensionalidad mediante funciones de
MATLAB.
ASIGNATURA:
Reconocimiento de patrones
TEMA DE LA PRCTICA
Extraccin de caractersticas
CONTENIDO DE LA GUA
PRCTICA No: 2
OBJETIVOS.
INTRODUCCIN.
Como se ha visto anteriormente en la asignatura, la reduccin de la dimensionalidad es
deseable por dos factores principales, uno es el costo computacional al tener mayor cantidad
de variables, y el otro es el de la exactitud de la clasificacin.
La reduccin de la dimensionalidad se clasifica en dos tpicos: extraccin de caractersticas
y seleccin de caractersticas. El propsito de este taller es ahondar en la extraccin de
caractersticas estudiando el mtodo Anlisis de Componentes Principales PCA (Por sus
siglas en ingles) tambin llamado expansin Karhunen-Loeve.
MARCO TEORICO
El anlisis de componentes principales tiene como finalidad eliminar variables de una matriz
reduciendo su dimensin con la perdida mnima de informacin posible. Bsicamente lo que
se busca es eliminar las variables que presentan una correlacin ms fuerte, dejando
nicamente, las que presentan una varianza mayor
Como consecuencia de la reduccin se obtendr que existan menos coeficientes de
correlacin y las nuevas variables se ordenaran con respecto a su varianza.
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
CONSULTA PREVIA.
Anlisis de Componentes Principales
Reduccin de dimensionalidad
Extraccin de caractersticas
METODOLOGIA.
El taller se realiza dirigidos por Edwin Zapata y Guillermo Vallejo, bajo la supervisin de la
docente Laura Cortes.
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
Usar el acceso a Internet solamente para consulta de los temas del laboratorio.
PROCEDIMIENTO A UTILIZAR
1. Ejecutar MATLAB (Inicio Todos los programas buscar MATLAB).
2. Descargar el archivo data250.txt en la carpeta: Mis Documentos > MATLAB
3. Una vez cargada la ventana de MATLAB seguimos las indicaciones siguientes en
la ventana de comandos (Command Window):
Se cargarn los datos suministrados:
load data250.txt
Trasladamos los datos a una matriz XY
XY=data250;
Seleccionamos la matriz X con solo las variables independientes. Debe verificar con
anticipacin cuantas columnas corresponden a X.
En este caso son 9 y estn ubicadas entre la columna 2 y 10
X=XY(:,2:10);
size(X)
ans =
Luego la variable respuesta ser
Y=XY(:,11)
Esta muestra estratificada de acuerdo a la variable dependiente y, ser explorada a fin de
determinar si se le puede aplicar reduccin de variables.
Emplearemos los dos mtodos que pueden determinar los componentes principales.
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
Z1=SX*cp;
Z2=SX*v;
En esta fase se hace la estimacin de la matriz de correlacin entre las variables latentes en
Z (Z1 o Z2) y la variable respuesta Y. Para ello, en una matriz ZY todas las columnas para
estimar la matriz de correlacin Rzy y observar los valores de la variable y los componentes
en Z no retenidos en la primera oportunidad. Hallamos ZY:
ZY=[Z1 Y];
Ahora
Rxy = corrcoef(ZY)
Simplifiquemos. Como en este ejercicio result una matriz de correlacin de orden 10x10,
revisaremos la ltima columna que se corresponde con la variable Y y las nuevas variables
independientes z, a fin de seleccionar los k2 restantes componentes que indicarn la
incorporacin de nuevas variables, para mejorar el nivel de estimacin del modelo resultante
Rxy(:,10)
Podemos observar que a pesar de seleccionar algunos primeros componentes (en el caso de
este ejemplo fueron los primeros cinco), se pueden agregar aquellos que tengan una buena
correlacin de las variables latentes z con y. De ah que estos ltimos componentes,
mencionados como los k2 componentes, pueden ser incorporados como parte de los
componentes definitivamente seleccionados en el proceso de reduccin. Por tanto, los
componentes definitivos que se podran incluir como variable independientes dados por la
matriz de variables latentes Z son los k resultantes de la suma k=k1+k2
La matriz definitiva de variables reducidas quedara compuesta por los k componentes
relacionados con cada columna de la matriz Z, sean los indicados por k1 como los indicados
por k2.
Por ejemplo, se agregaron los indicados como sptimo y noveno a los primeros cinco.
Var_reducidas= [Z1(:,1:5) Z1(:,7) Z1(:,9)];
Finalmente, estas variables reducidas ms la variable Y forman el nuevo conjunto de datos
para un modelo de estimacin. Por ejemplo, el entrenamiento de un modelo de redes
neuronales.
En efecto, el conjunto final de datos para entrenamiento sera una matriz compuesta por
estas variables reducidas y la variable Y
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
DatosZY = [Var_reducidas,Y];
size(DatosZY)
BIBLIOGRAFA RECOMENDADA.
Duda, R. O., Hart, P. E., & Stork, D. G. (2012). Pattern classification. John Wiley &
Sons.
Friedman, M., & Kandel, A. (1999). Introduction to pattern recognition.
INFORME DE LABORATORIO
(Para elaborar por el Estudiante)
ESTUDIANTES:
John Ramirez
Julian Olarte
GRUPO:
NOTA:
CUESTIONARIO
1. Por qu al final la matriz DatosZY tiene 8 columnas, a diferencia de data250?
Se realiza una agrupacin de los datos observando que caractersticas son
similares
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015
Bajo
Medio
Alto
(1 Punto)
(2 Puntos)
(3 puntos)
Nota:
1
puntos obtenidos
3
POLITECNICO GRANCOLOMBIANO
MAESTRIA DE INGENIERIA DE SISTEMAS
FORMATO PARA PRACTICAS DE LABORATORIO
Fecha: Septiembre de 2015