Vous êtes sur la page 1sur 11

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION

FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Anlisis de Componentes Principales (ACP)


Prctica para el Aprendizaje Activo de los Estudiantes
IN1089C MAT4201 Anlisis Multivariado
Profesor Alba Martnez Ruiz
Ayudantes: Ana Carolina Ulloa, Rodrigo Ortiz Henrquez
___________________________________________________________________
Contexto
A partir del ao 2011, la Facultad de Ingeniera implant un nuevo plan de estudios para
la carrera Ingeniera Civil Industrial. Este plan de estudios es el producto de una
renovacin curricular de las carreras de ingeniera basado en el Modelo CDIO (concebir,
disear, implementar, operar) diseado por el MIT.
El Modelo CDIO define 12 caractersticas o estndares de la educacin de la ingeniera. El
estndar ocho aprendizaje activo se define como la enseanza y aprendizaje basado en
mtodos de aprendizaje activo, lo que implica que el estudiante debe tener un rol activo y
protagnico en su aprendizaje, y no ser un mero espectador.
Por otro lado, el curso de Anlisis de Multivariado y como est definido en el programa
del cursobusca alcanzar cuatro resultados de aprendizaje:
1. Conocer y comprender los fundamentos tericos de los mtodos de anlisis
multivariado.
2. Aplicar los mtodos de anlisis multivariado en problemas del mbito de la ingeniera y
otros.
3. Interpretar los resultados de los mtodos de anlisis multivariado en problemas del
mbito de la ingeniera y otros.
4. Utilizar aplicaciones informticas del rea de la estadstica, tales como: R-project, SAS
y SPSS.
Para alcanzar estos resultados de aprendizaje y adems los estndares definidos por el
Modelo CDIO, el curso de Anlisis Multivariado est siendo reformulado, de manera de
incorporar en las prcticas o ayudantas mtodos de aprendizaje activo. Por lo tanto, esta
prctica est diseada para que usted el alumno sea el promotor y responsable de su
propio aprendizaje, y el profesor o ayudante, un facilitador de su aprendizaje.

Instrucciones
Este documento es una prctica de Anlisis Multivariado diseada para que usted tenga
un rol protagnico en su aprendizaje. La prctica se organiza de la siguiente manera. Se
presenta un problema prctico que se desea resolver aplicando un mtodo de anlisis
multivariado. A continuacin, se muestran los resultados obtenidos. Cada resultado tiene
asociado los aspectos matemticos relacionados y un conjunto de preguntas.
Usted debe formar un grupo de trabajo de tres estudiantes. Para comenzar, uno de los
estudiantes asume el rol de moderador y lee el problema planteado, presenta los
resultados obtenidos y los aspectos matemticos, y luego plantea las preguntas a los otros

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

compaeros. Los tres estudiantes deben contestar las preguntas. El rol de moderador se
va turnando entre los estudiantes del grupo. Usted puede resolver una duda o preguntar
al ayudante solo si no sabe la respuesta a una pregunta.

Recomendaciones. Sea respetuoso de las opiniones de sus compaeros. Concntrese


en el desarrollo de la prctica.

Planteamiento del problema


Usted tiene 5 minutos para leer el planteamiento del problema. Se desean analizar las
caractersticas y/o habilidades de los alumnos de un curso de enseanza bsica de un
colegio de la VIII regin. Una vez identificadas las reas del conocimiento ciencias
sociales, ciencias naturales, matemticas, etc. en las cuales los estudiantes tienen un
alto rendimiento, el colegio desea ofrecer talleres optativos de aprendizaje con el fin de
incentivarlos a trabajar en equipo y as descubrir sus nuevas habilidades y talentos. Por
ejemplo, a aquellos alumnos que tengan mejores resultados en el rea de matemtica se
les podra asignar un taller de ajedrez o un taller de juegos de ingenio.
Para alcanzar el objetivo planteado, se analizan de forma exploratoria 9 variables
(promedios por asignatura) medidas para un total de 40 alumnos; es decir, tenemos una
matriz de datos de n x p = 40 x 9. Las variables consideradas son:

Promedio
Promedio
Promedio
Promedio
Promedio
Promedio
Promedio
Promedio
Promedio

de
de
de
de
de
de
de
de
de

notas
notas
notas
notas
notas
notas
notas
notas
notas

Lenguaje y Comunicacin
Matemtica
Ciencias Naturales
Historia, Geografa y Ciencias Sociales
Artes Visuales
Msica
Tecnologa
Educacin Fsica y Salud
Religin.

Una vez que se ha realizado la descripcin estadstica de las variables, se aplica un


Anlisis de Componentes Principales (ACP). El objetivo del ACP es la representacin de
individuos y variables en un espacio de dimensin menor de manera de explicar las
asociaciones (varianza) y comportamiento que tienen los individuos y las variables.
Analice ahora los resultados presentados y conteste las preguntas planteadas. La tabla de
datos originales se encuentra al final del documento.

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderador 1: Resultado 1 Estadstica descriptiva

Variable
Lenguaje
Matemtica
Cs. Naturales
Historia
Artes
Msica
Tecnologa
Ed. Fsica
Religin

Mnimo Q1
Media Mediana
Q3 Mximo
3,1
4,525 5,24
5,4
5,9
6,8
2,7
4,4
5,083
5,2
5,875
6,8
4,6
5,45 5,9125
6
6,3
7
2,6
4,6
5,035
5,1
5,75
6,6
4,3
5,5
6,138
6,3
6,9
7
4,2
5,7
6,182
6,4
6,875
7
4
5,7
6,11
6,3
6,95
7
4
5,25 5,955
6,2
6,8
7
4
4,6
5,605
5,55
6,475
7

Desviacin
0,932
1,004
0,6231
0,928
0,742
0,783
0,885
0,978
0,971

Asimetra
-0,61
-0,5
-0,24
-0,61
-0,5
-0,88
-0,96
-0,68
-0,14

Kurtosis
-0,22
-0,3
-0,74
0,27
-0,65
-0,1
0,09
-0,83
-1,41

Histogramas.
LENGUAJE Y COMUNICACIN

10

10

MATEMTICA

CIENCIAS NATURALES

10

0
3

HISTORIA, GEOGRAFA Y CIENCIAS

10

TECNOLOGA

6,0

6,6

0
4,4 4,8 5,2 5,6 6,0 6,4 6,8 7,2

4,4 4,8 5,2 5,6 6,0 6,4 6,8 7,2

EDUCACIN FSICA Y SALUD

RELIGIN

10

10

5,4

MSICA

0
3

4,8

ARTES VISUALES

5,0
5

2,5

0
4,0

4,8

5,6

6,4

7,2

0,0
4,0

4,8

5,6

6,4

7,2

4,0

4,8

5,6

6,4

7,2

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Box-plots o diagramas de caja.


LENGUAJE Y COMUNICACIN

MATEMTICA

CIENCIAS NATURALES

7
6,0

6,0

4,5

4,5

3,0

3,0
HISTORIA, GEOGRAFA Y CIENCIAS

ARTES VISUALES

MSICA

TECNOLOGA

EDUCACIN FSICA Y SALUD

RELIGIN

6,5

6,5

6,5

5,5

5,5

5,5

4,5

4,5

4,5

Matriz de Correlaciones:

Lenguaje
Matemtica
Cs. Naturales
Historia
Artes
Msica
Tecnologa
Ed. Fsica
Religin

Lenguaje
1,000
0,825
0,839
0,802
0,761
0,761
0,716
0,606
0,604

Matemtica

Cs. Naturales

Historia

Artes

Msica

Tecnologa

Ed. Fsica

Religin

1,000
0,760
0,697
0,764
0,713
0,689
0,636
0,551

1,000
0,743
0,625
0,681
0,596
0,510
0,468

1,000
0,605
0,709
0,592
0,474
0,505

1,000
0,769
0,895
0,874
0,797

1,000
0,796
0,766
0,767

1,000
0,851
0,769

1,000
0,815

1,000

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderador 1: Resultado 1 Aspectos Matemticos

p variables numricas medidas en cada una de las n observaciones pueden ser


representadas en una matriz X de dimensiones n x p dada por:

Desviacin Tpica Muestral:

Media Muestral:

Varianza Muestral:

Coeficiente de Asimetra:

Coeficiente de Kurtosis:

Covarianza Muestral

Matriz de correlaciones
Matriz cuadrada y simtrica

El coeficiente de correlacin lineal


entre xj y xk es:

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderador 1: Resultado 1 Preguntas


1. Observe las medias, medianas, mnimos, mximos y desviaciones estndar de las
variables. Qu descripcin general puede hacer del rendimiento de los estudiantes en
cada una de las asignaturas? Por ejemplo, cmo son las medias de las notas en las
distintas asignaturas?
2. Qu interpretacin tienen los coeficientes de asimetra? Justifique utilizando el valor del
coeficiente de asimetra y observando los histogramas.
3. La muestra tomada contiene datos atpicos?, las variables toman valores que puedan
ser considerados atpicos? por qu?
4. Observe la matriz de correlaciones cmo interpretara las relaciones lineales entre las
variables? Distinga las asociaciones fuertes, moderadas o dbiles.
5. Qu puede decir del comportamiento de la variable Artes Visuales y Msica? Existe
alguna similitud entre ellas? Fundamente.

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderador 2: Resultado 2 Valores y vectores propios - ACP Normalizado

Valores Propios:
Componente h

Valor Propio o Auto valor

6,6474 1,0442 0,3652 0,2316 0,2032 0,1915 0,1429 0,1032 0,0707

Proporcin Varianza

0,739

0,116

0,041

0,026

0,023

0,021

0,016

0,011

0,008

Varianza Acumulada

0,739

0,855

0,895

0,921

0,944

0,965

0,981

0,992

1,000

Vectores Propios:
Variable

U1

U2

U3

U4

U5

U6

U7

U8

U9

Lenguaje

0,347

-0,312

-0,057

0,026

0,000

-0,316

-0,516

-0,591

0,250

Matemtica

0,333

-0,241

-0,514

-0,204

-0,624

0,200

0,066

0,261

0,149

Cs. Naturales

0,311

-0,449

-0,132

0,665

0,312

-0,092

0,262

0,246

-0,086

Historia
Artes

0,306
0,357

-0,420
0,225

0,533
-0,283

-0,541
-0,226

0,104
0,107

-0,073
-0,252

0,366
0,003

0,052
-0,090

0,016
-0,780

Msica

0,350

0,053

0,397

0,227

-0,148

0,700

-0,264

-0,109

-0,269

Tecnologa

0,348

0,258

-0,123

-0,230

0,532

0,123

-0,363

0,458

0,324

Ed. Fsica

0,329

0,423

-0,152

0,058

0,118

0,166

0,570

-0,461

0,329

Religin

0,316

0,409

0,394

0,253

-0,414

-0,500

-0,020

0,278

0,119

Grfico de sedimentacin
7
6

Valor propio

5
4
3
2
1
0
1

4
5
6
Componente principal

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderador 2: Resultado 2 Aspectos Matemticos

Proyeccin de individuos:

Proyeccin de variables:

Valor propio o autovalor, (lambda). Proporcin de la variabilidad total explicada por la


componente h es:

con h = 1,2,3,,p

Moderador 2: Resultado 2 Preguntas

1. Cuntos valores propios se obtuvieron de la matriz de correlaciones? por qu?


cmo interpretara cada valor obtenido?
2. A partir de los valores propios obtenidos, proporcin de varianza explicada y grfico de
sedimentacin cuntas componentes seleccionara usted para construir los planos de
proyeccin de individuos y los crculos de correlaciones de variables? Fundamente.
3. Cmo interpretara los vectores propios? qu representan los coeficientes en los
vectores propios obtenidos? Fundamente.
4. Identifique si hay presencia de factor global de forma y/o factor global de tamao.
Interprete este resultado.

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderado 3: Resultado 3 Planos de Proyeccin utilizando componentes 1 y 2

Proyeccin de las variables o crculo de correlaciones.


0,50

Segundo componente

EDUC A C I N FSIC A Y SA LUD


RELIGI N
TEC NO LOGA

0,25

A RTES VISUA LES


MSIC A

0,00

MA TEM TIC A

-0,25

LENGUA JE Y C OMUNIC AC IN
HISTORIA , GEOGRA FA Y C IENC IA S
C IENC IA S NA TURA LES

-0,50
-0,50

-0,25

0,00
Primer componente

0,25

0,50

Plano de proyeccin de los individuos.


3
6

2
Segunda componente

29
33

11

17

20

24

30

26

5
36

32

10

22

0
23

13
15 8
39

34

16
31

38

37
21

-1

18
3

12

14

19

28
25
40

35
27

-2
4

-3
-7,5

-5,0

-2,5
0,0
Primer componente

2,5

5,0

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Moderador 3: Resultado 3 Aspectos Matemticos

Tenemos p puntos columnas (variables) en Rn que representamos en los crculos de


correlaciones, y n puntos fila (observaciones) en Rp que proyectamos en los planos de
proyeccin de mxima varianza.

Las combinaciones lineales permiten encontrar las coordenadas de cada una de las
observaciones en los planos de proyeccin.

Ynxp = X

nxp

U pxp

Utilizando las puntuaciones se tiene:

donde, u1 define los coeficientes de cada variable en el primer componente principal Y1.

Moderador 3: Resultado 3 Preguntas

1. Cmo interpretara la relacin entre las variables y las componentes?, qu variables


estn ms relacionadas con cada una de las componentes?, cmo interpretara las
relaciones entre las variables? Fundamente.
2. Qu nombre dara usted a la primera y segunda componente? por qu?
3. En relacin a la proyeccin de las observaciones, explique la posicin relativa de las
observaciones situadas en los cuadrantes II y III Qu taller recomendara usted a los
alumnos 11, 29 y 27 respectivamente? Fundamente.

UNIVERSIDAD CATOLICA DE LA SANTSIMA CONCEPCION


FACULTAD DE INGENIERA
DEPARTAMENTO DE INGENIERA INDUSTRIAL

Tabla de datos originales


Alumno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

LyC
4,90
5,60
5,40
5,40
4,80
4,40
5,40
6,20
5,70
5,90
3,50
5,60
6,00
6,20
5,90
6,00
4,20
5,40
6,10
4,00
4,10
4,80
3,10
5,70
6,60
4,50
5,80
6,30
5,00
3,10
6,50
4,30
4,20
5,20
5,40
5,20
4,60
5,90
5,90
6,80

Mat
4,80
5,60
4,80
5,70
5,50
4,40
5,10
5,70
4,50
5,50
2,90
6,20
6,00
5,50
5,70
6,10
4,00
5,50
6,20
2,70
4,70
4,30
3,30
4,90
6,20
4,10
4,80
5,30
4,40
4,50
6,40
3,60
4,10
5,80
6,20
4,90
4,20
5,90
6,50
6,80

Cs. Nat
5,10
6,10
6,30
6,20
5,90
5,10
6,10
6,00
6,00
6,10
4,60
6,10
6,20
6,80
5,80
6,70
5,70
5,40
6,60
4,80
5,60
6,10
5,00
5,70
6,70
5,70
6,80
6,80
6,00
5,10
6,70
5,00
5,20
5,70
6,30
5,20
5,70
6,10
6,50
7,00

Cs. Soc
4,70
4,80
5,50
5,80
4,60
4,60
5,10
5,40
5,40
5,40
2,60
5,60
5,20
6,00
5,80
5,90
3,80
6,30
6,00
3,00
5,20
4,20
4,00
4,80
6,50
5,10
6,30
6,10
5,30
3,40
5,10
3,80
4,10
4,90
4,30
5,40
4,90
5,10
4,80
6,60

A. Vis
5,80
7,00
5,80
5,00
6,30
6,50
5,80
7,00
5,50
6,80
4,30
6,90
7,00
6,60
6,90
7,00
5,50
6,40
6,50
4,80
5,30
6,00
4,90
6,50
7,00
6,30
5,40
6,90
6,60
5,50
7,00
5,60
5,40
6,10
5,80
5,80
5,50
6,50
7,00
7,00

Mus
5,00
6,70
6,30
6,50
5,50
6,90
6,20
7,00
5,70
6,30
4,20
6,00
7,00
6,50
6,80
7,00
5,70
6,00
7,00
4,50
5,50
5,70
4,70
6,70
7,00
6,50
6,30
7,00
6,70
5,00
7,00
5,00
6,50
6,80
6,00
6,70
5,70
5,80
7,00
6,90

Tec
5,70
7,00
6,00
4,30
5,80
6,50
6,00
7,00
4,70
6,70
4,00
6,80
7,00
6,30
6,70
7,00
5,30
6,00
6,80
4,70
6,20
5,50
4,00
6,70
7,00
6,30
6,30
7,00
7,00
5,00
7,00
5,70
6,30
6,30
5,80
6,00
5,20
6,80
7,00
7,00

Ed. Fis
6,00
6,80
5,50
4,20
6,40
6,80
5,90
7,00
4,70
6,30
4,30
6,60
7,00
6,10
7,00
6,70
5,40
5,00
6,60
4,00
4,60
5,70
4,20
6,50
7,00
6,30
5,60
7,00
7,00
6,00
7,00
4,20
5,90
6,70
4,60
6,10
5,20
6,30
7,00
7,00

Relg
5,90
6,80
5,00
4,90
6,10
6,30
4,30
6,60
4,40
6,00
4,10
4,60
6,80
6,00
6,40
7,00
5,50
5,50
6,50
4,50
4,50
4,80
4,10
6,40
6,60
6,60
5,00
6,40
7,00
4,00
5,60
4,30
5,40
6,30
4,60
5,50
4,60
5,50
6,80
7,00

Vous aimerez peut-être aussi