Vous êtes sur la page 1sur 24

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

EJERCICIOS
CLASE 5
Correlaciones Cannicas (CC)
Regresin por Mnimos Cuadrados Parciales (PLS)

Ejercicio 1 (CC) - Presentacin de datos

Pgina 2

Ejercicio 1 (CC) - Consignas

Pgina 3

Ejercicio 1 (CC)- Respuestas

Pgina 4

Ejercicio 1 (CC)- Pasos en Infostat

Pgina 8

Ejercicio 1 (CC)- Salida del software

Pgina 10

Ejercicio 2 (PLS) - Presentacin de datos

Pgina 11

Ejercicio 2 (PLS) - Consignas

Pgina 13

Ejercicio 2 (PLS)- Respuestas

Pgina 14

Ejercicio 2 (PLS)- Pasos en Infostat

Pgina 18

Ejercicio 2 (PLS)- Salida del software

Pgina 20

Otros ejercicios

Pgina 23

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Ejercicio 1
Base de datos: CAVILA_ejercicio CC.IDB2
Descripcin de los datos: La base de datos contiene 3 indicadores de diversidad gentica (P
SW y Pn) de 18 poblaciones de P. australis y 4 indicadores ambientales de los sitios donde se
encuentran dichas poblaciones (Precipitacin, Temperatura media, Temperatura Mxima y
Temperatura mnima). Es de inters conocer si existe relacin entre la diversidad gentica de
las poblaciones y las condiciones ambientales.

Variable
Pop

Poblacin de P. australis

Div.Gen (P)

Porcentaje de loci polimrficos

Div.Gen (SW)

ndice de Shannon Weaver

Div.Gen (Pn)

Diversidad gnica

Pp

Precipitacin

Tmedia

Temperatura media anual

Tmax

Temperatura mxima anual

Tmin

Temperatura mnima anual

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Consignas:
Realice un Anlisis de Correlaciones Cannicas entre los indicadores de diversidad
gentica y las caractersticas ambientales de los sitios.

1) Existe asociacin entre diversidad gentica de las poblaciones y las condiciones


ambientales de los sitios? Justifique.

2) Cuntos pares de variables cannicas se correlacionan significativamente? Realice


una tabla especificando el coeficiente de correlacin y el valor p de los dos primeros
pares de variables cannicas obtenidos.

3) Cmo se correlacionan los componentes de cada variable cannica con la variable


cannica correspondiente? Realice una tabla presentando los coeficientes de
correlacin simple de Pearson entre las tres componentes de diversidad gentica y la
variable cannica compuesta por los mismos y entre los cuatro componentes
ambientales y la cannica correspondiente.

4) Realice un grfico de dispersin entre las dos primeras variables cannicas e


interprete los resultados teniendo en cuenta lo obtenido en el punto 4.

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Respuestas

1) S. Los resultados del ACC indican que existe una asociacin entre la diversidad
gentica de las poblaciones de P. australis y las condiciones ambientales de los sitios
donde se encuentran ya que el primer par de variables cannicas se correlaciona
significativamente (p=0.00078) con un coeficiente de correlacin de 0.95.

2) Slo el primer par de variables cannicas se correlaciona significativamente.

Coeficientes de corelacin canonica y valores p


Ejes Cannicos

Correlacin Cannica

Valor p

0.95

0.00078

0.51

0.64

Nota: esto puede observarlo en la ventana de Resultados de Infostat, en la tabla


Correlaciones Cannicas:

Correlaciones cannicas
L(1)
R
0.95
R
0.89
Lambda
33.60
gl
12.00
p-valor
7.8E-04

L(2)
0.51
0.26
4.30
6.00
0.64

L(3)
0.17
0.03
0.40
2.00
0.82

3) Los tres indicadores de diversidad gentica se correlacionan alta y positivamente con


la variable cannica compuesta por ellos. El ndice de Shannon Weaver (SW) es el
indicador ms correlacionado con la variable cannica (r=0.99), seguido por Pn
(r=0.92). El porcentaje de loci polimrficos es el indicador de diversidad gentica
menos correlacionado con la variable cannica, si bien el coeficiente de correlacin es
alto (r=0.81). En el caso de las variables ambientales, las cuatro se correlacionan
negativamente con la variable cannica correspondiente. La temperatura mnima es la
variable que presenta mayor correlacin con la mism (r=-0.75)

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Coeficientes de Correlacin de Pearson entre el primer eje cannico


compuesto por indicadores de diversidad gentica y sus componentes.
Eje 1DG
Porcentaje de loci polimrficos (P)

0.81

Indice de Shannon Weaver (SW)

0.99

Diversidad Gnica (Pn)

0.92

Coeficientes de Correlacin de Pearson entre el primer eje cannico


compuesto por indicadores ambientales y sus componentes.
Eje 1Amb
Precipitacin

-0.29

Temperatura media

-0.27

Temperatura maxima

-0.34

Temperatura mnima

-0.75

Nota: para obtener estos resultados debe guardar las variables cannicas al realizar el
ACC. Luego, se debe ir a Estadsticas, Anlisis de Correlacin, Coeficientes de
correlacin y pedir la correlacin entre las variables originales y la variable cannica
correspondiente. Cmo sabemos cul es variable cannica correspondiente?
Depende de cmo se pidi el ACC, es decir qu variables se pusieron en el grupo 1 y
qu variables se pusieron en el grupo 2. Si se pusieron las de diversidad gentica en el
grupo 1, entonces se deben correlacionar estas 3 variables con la Can1_1 y las
variables ambientales con la Can2_1.

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

4) El grfico de dispersin obtenido entre las dos primeras variables cannicas es

Eje Cannico Diversidad Gentica

1.84

0.96

0.08

-0.81

-1.69
-1.74

-0.80

0.14

1.08

2.02

Eje Cannico Ambiental

Se observa una relacin negativa entre ambas variables cannicas pero dado que los
indicadores ambientales estn correlacionados negativamente con la variable cannica
correspondiente, se concluye que la diversidad gentica se relaciona positivamente
con las variables ambientales. Es decir, sitios con mayor precipitacin y mayores
temperaturas media, mxima y mnima presentan poblaciones de P. australis con
mayores niveles de diversidad gentica. En particular, la temperatura mnima es la
variable ambiental que mayor asociacin presenta con la diversidad gentica.

Nota: para interpretar los resultados de un ACC, es conveniente analizar la


correlacin de las componentes y las variables cannicas y luego la relacin entre los
pares de variables cannicas, tal como se realiz en ste ejercicio.

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Pasos en Infostat
Cmo pedir el ACC

Seleccionamos las variables en cada grupo

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Seleccionamos estandarizar variables (son variables muy diferentes con varianzas muy
distintas) y guardar variables cannicas.

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Salida del software


Correlaciones cannicas
Matriz de correlacin
Div.Gen (P)
Div.Gen. (SW)
Div.Gen (Pn)
Pp
Tmedia
Tmax
Tmin

Div.Gen (P)
1.00
0.74
0.90
0.30
0.27
0.31
0.66

Div.Gen. (SW) Div.Gen


0.74
1.00
0.89
0.26
0.24
0.31
0.69

(Pn) Pp
Tmedia Tmax
0.90 0.30
0.27 0.31
0.89 0.26
0.24 0.31
1.00 0.37
0.32 0.42
0.37 1.00
-0.23 0.50
0.32 -0.23
1.00 0.61
0.42 0.50
0.61 1.00
0.75 0.20
0.77 0.60

Tmin
0.66
0.69
0.75
0.20
0.77
0.60
1.00

Correlaciones cannicas
L(1)
L(2) L(3)
R
0.95
0.51 0.17
R
0.89
0.26 0.03
Lambda
33.60
4.30 0.40
gl
12.00
6.00 2.00
p-valor
7.8E-04
0.64 0.82
Interpretar p-valor segn manual de referencia
Coeficientes de las combinaciones lineales
L(1) L(2) L(3)
Div.Gen (P)
0.15 -1.00 -2.26
Div.Gen. (SW)
0.88 -2.08 0.20
Div.Gen (Pn)
0.01 3.13 1.75
Pp
Tmedia
Tmax
Tmin

1.16 1.89 1.40


2.26 2.38 1.78
-1.02 -1.01 -2.28
-2.12 -1.13 -0.15

10

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Ejercicio 2 (PLS)
Base de datos: CAVILA_ejercicio DURAZNOS.IDB2
Descripcin de los datos: La base de datos contiene indicadores de calidad de frutos de
duraznos. Algunos son obtenidos como variables instrumentales y otros como variables
sensoriales ya que los mtodos utilizados para evaluar calidad de frutas son: 1) escalas
objetivas basadas en instrumentos de medicin y 2) mtodos subjetivos basados en el juicio
humano (anlisis sensorial) (Kader, 1992). Toda vez que la seguridad e higiene de un
alimento est garantizada, lo satisfactorio de sus propiedades organolpticas pasa a ser el
criterio ms importante, el que determina la eleccin y, ms an, la fidelidad de un
consumidor hacia un producto o marca. (Grupo Eroski, 2002). La calidad como aceptabilidad
por parte del consumidor de un determinado producto est integrada por distintos aspectos
recogidos por los sentidos: vista (color y defectos), olfato (aroma y flavor), tacto (manual y
bucal), odo (tacto y durante la masticacin) y gusto (sabor). Todos los aspectos de la calidad,
tanto externos como internos, son contemplados y valorados por el consumidor a la hora de
decidir sobre la adquisicin de un producto para consumo en fresco.
El objetivo del estudio del cual proveyeron los datos que analizaremos fue evaluar la
potencialidad de una serie de parmetros reolgicos obtenidos como variables instrumentales
en la prediccin variables medidas desde un anlisis sensorial. Ambos mtodos estn
orientados a evaluar calidad organolptica de duraznos (Datos: gentiliza Ing. Loreto
Contador).

Para cada una de seis variedades se tomaron varios frutos al azar que se

procesaron en un laboratorio de fruticultura. All se midieron, sobre cada mitad de cada fruto,
variables instrumentales relacionadas con propiedades fsicas-qumicas del mismo. La otra
mitad del fruto fue usada en una prueba sensorial de la que se obtuvieron 5 variables.

11

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Variables
Fza Max P2 (N)
Area Total P2 (N.mm)
Instrumentales

Fza Final P2 (N)


Area Total 7,9 (N.mm)
N Peaks 7,9
Hardeness/Force 2 B (N)
Resilence B (%)
Chewiness B (%)
N Peaks Acoustic B
Peaks Min Acoustic B (dBs)
PAM.1

______________________

_______________________________
Crujencia
Dureza

Sensoriales

Crocancia
Jugosidad
Fundencia

12

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Consignas:
Realice un Anlisis de Regresion por Minimos Cuadrados Parciales entre las variables
sensoriales y las instrumentales usando estas ltimas como predictoras de las primeras.

1) Cmo es posible explicar Y (matriz de variables sensoriales) a partir de X (matriz de


variables instrumentales)?

2) Represente grficamente la relacin entre combinaciones lineales de variables


instrumentales y combinaciones de variables sensoriales en un espacio que maximice
la estructura de covarianza comn entre ambos tipos de variables (TRIPLOT).
Interprete.

3) Cuntas variables latentes pueden construirse para modelar la relacin y cuntas


deberan analizarse para visualizar las principales relaciones?

4) Cmo se correlacionan las variables respuestas y predictoras con cada una de las dos
primeras variables latentes? Realice una tabla presentando los coeficientes de
correlacin simple de Pearson entre las variables en estudio y las dos primeras
variables latentes.

5) Realice un grfico de dispersin de las observaciones usando las dos primeras


variables latentes como ejes e interprete los resultados teniendo en cuenta lo
observado en el TRIPLOT del punto 1.

13

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Respuestas

1) Las variables sensoriales pueden predecirse a partir de las variables latentes


construidas usando como modelo la expresin Y=T*B*QT o tambien como
Y=X*Beta-pls siendo T, B, Q y Beta-pls matrices resultantes del ajuste de un modelo
desarrollado para explicar la estructura de covariacion comn de las variables en Y
(variables sensoriales) con las variables en X (variables instrumentales). Todas estas
matrices se encuentran presentes en la ventana de resultados de InfoStat. Una
descripcin breve de las mismas es:
P matriz que indica cmo combinar las 11 variables predictoras para generar 11
nuevas variables sintticas que las representen.
U matriz conteniendo las nuevas variables sintticas que surgieron de la combinacin
de las variables en X
B matriz de coeficientes asociados a cada variable latente
W matriz que indica ponderaciones de las variables predictoras en las variables
latentes
Q matriz que indica ponderaciones de las variables dependientes en las variables
latentes
T matriz de variables latentes usadas para predecir Y
Beta-pls coeficientes de regresin PLS los que postmultiplicando X pueden ser
usados para predecir Y.

14

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

2) En la Figura 1 se presenta el triplot de la regresin PLS.

3.00

Dureza

1.50

Factor 2 (17.1%)

Hardness/Force 2 B (N)
Peaks Min Acoustic B (dBs)
Chew iness (b)
resilence B (%)
N Peaks 7,9
Crocancia
0.00

PAM.1
4B29

Fza Final P2 (N)


rea Total P2 (N.mm)
rea Total 7,9(N.mm)

4B12

Carson
NPeaks Acoustic B Fundencia
Andross

Fza Mx P2 (N) Crujencia

Jugosidad

Venus
-1.50

Andes Nec 1 (16B20)

-3.00
-3.00

-1.50

0.00

1.50

3.00

Factor 1 (45.9%)

Figura 1: Triplot obtenido por regresin PLS en datos de calidad de 6 variedades de durazno.
En verde se indican los indicadores sensoriales de la calidad (variables dependientes) y en
amarillo los indicadores instrumentales (variables predictoras). Las variedades se
representan en azul.

Interpretacin:
La Dureza y la Crocancia como caractersticas organolpticas correlacionadas
negativamente con la Fundencia del fruto de durazno, se correlacionaron
positivamente con las variables instrumentales hardeness/force 2 B (N), Area Total
7,9 (N.mm), Area Total P2(N.mm) y Fza final P2 (N), variables estas que alcanzaron
mayores valores en las variedades Venus y 4B29. La variedad 4B12 con altos valores
de fundencia (seguida por la variedad Carson) present baja crocancia y menores
valores para los parmetros reologicos mencionados. Tambin existe relacin entre
15

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Crujencia y Numero de Peaks acoustic B, aunque de menor magnitud que la


observada entre Crocancia alta y baja Fundencia con los parmetros reolgicos
mencionados anteriormente (capaz de explicar el 17% de la estructura de covarianza
comn entre ambos tipos de variables). Las relaciones descriptas en el espacio
construido por los dos primeros ejes de la regresin PLS explicaron un 63% de la
estructura de covarianza comn entre ambos tipos de variables.

3) Pueden construirse tantas variables latentes como predictoras. Para este problema se
construyeron 11 variables latentes pero se usaron solo dos ya que estas explicaron ms del
60% de la estructura de relacin entre Y y X. Para calcular este porcentaje para cada eje
o factor de anlisis, es menester calcular la varianza de la variable latente (se puede
realizar usando el modulo Medidas Resumen de Infostat) y analizar el cociente entre la
varianza de la variable latente y la varianza total (suma de las varianzas de todos los
factores).

4) Los indicadores organolpticos y las variables instrumentales se correlacionaron con las


variables latentes. La Dureza, la Crocancia y la Fundencia fueron las ms
correlacionadas. Excepto tres, las variables instrumentales se mostraron altamente
correlacionadas con el eje 1. Todas, excepto Npeaks asumieron mayores valores en las
variedades con mayor crocancia y dureza. El segundo factor permite explicar a travs de
la mayora de las variables instrumentales (nuevamente correlacionadas de manera
estadsticamente significativa) la crujencia de la fruta.
Nota: para obtener estos resultados debe guardar las variables latentes al realizar el
PLS. Luego, se debe ir a Estadsticas, Anlisis de Correlacin, Coeficientes de
correlacin y pedir la correlacin entre las variables originales y los factores de
interes. En este caso se pidi formato compacto, lista y se seleccionaron las
correlaciones de las variables latentes 1 y 2.

Coeficientes de correlacin
Correlacin de Pearson
Variable(1)
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1
Latente1

Variable(2)
n
Latente2
Fza Mx P2 (N)
rea Total P2 (N.mm)
Fza Final P2 (N)
rea Total 7,9(N.mm)
N Peaks 7,9
Hardness/Force 2 B (N)
resilence B (%)
Chewiness (b)
NPeaks Acoustic B
Peaks Min Acoustic B (dBs)..
PAM.1
Crujencia

Pearson
74
74
74
74
74
74
74
74
74
74
74
74
74

p-valor
0.00
>0.9999
-0.64
<0.0001
-0.79
<0.0001
-0.70
<0.0001
-0.81
<0.0001
0.47
<0.0001
-0.78
<0.0001
-0.52
<0.0001
-0.67
<0.0001
-0.16
0.1626
0.08
0.5163
0.10
0.4171
-0.13
0.2792

16

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Latente1
Latente1
Latente1
Latente1

Dureza
Crocancia
Jugosidad
Fundencia

74
74
74
74

-0.52
-0.40
0.19
0.61

<0.0001
0.0004
0.1093
<0.0001

Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2
Latente2

Fza Mx P2 (N)
rea Total P2 (N.mm)
Fza Final P2 (N)
rea Total 7,9(N.mm)
N Peaks 7,9
Hardness/Force 2 B (N)
resilence B (%)
Chewiness (b)
NPeaks Acoustic B
Peaks Min Acoustic B (dBs)..
PAM.1
Crujencia
Dureza
Crocancia
Jugosidad
Fundencia

74
74
74
74
74
74
74
74
74
74
74
74
74
74
74
74

-0.66
-0.51
-0.50
-0.42
0.32
0.54
0.59
0.63
-0.08
0.13
0.21
-0.23
0.33
0.03
-0.18
-0.08

<0.0001
<0.0001
<0.0001
0.0002
0.0059
<0.0001
<0.0001
<0.0001
0.5080
0.2718
0.0728
0.0494
0.0045
0.7875
0.1233
0.5009

5) El grfico de dispersin de las observaciones obtenido a partir de las dos primeras


variables latentes indica la similitud/diferencia de las variedades fundada en la
correlacin entre las variables instrumentales y las sensoriales
5

Latente2

-1

-2

-3

-4
-6

-5

-4

-3

-2

-1

Latente1
4B12

4B29

Andes Nec 1 (16B20)

Andross

Carson

Venus

Figura 2: Grfico de dispersin entre las dos primeras variables latentes obtenidas
mediante PLS entre indicadores instrumentales y sensoriales de calidad de duraznos.
17

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Pasos en Infostat
Cmo pedir el PLS

Seleccionamos las variables dependientes e independientes y variedad como variable de


clasificacin.

18

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Seleccionamos estandarizar variables (son variables muy diferentes con varianzas muy
distintas) y guardar tantas races como variables latentes haya (cantidad de predictoras).

19

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Salida del software


Mnimos cuadrados parciales (PLS)
P
1
2
3
4
5
6
7
8
9
10
11

1
-0.42
-0.37
-0.43
0.25
-0.41
-0.28
-0.35
-0.09
0.04
0.05
-0.34

2
-0.35
-0.34
-0.29
0.22
0.37
0.40
0.43
-0.05
0.09
0.14
-0.45

3
0.15
0.08
-0.07
0.04
-0.10
-0.08
-0.15
-0.48
0.76
-0.51
0.17

5
-0.27
0.01
-0.34 -0.01
-0.09 -0.15
-0.68
0.55
0.03 1.1E-03
-0.11
0.20
-2.3E-03
0.02
0.35
0.80
-0.08 -0.30
-0.63 -0.37
-0.08
0.19

6
0.18
-0.21
-0.34
0.03
-0.14
0.86
-0.37
-0.06
-0.09
0.36
0.31

7
-0.03
-0.42
0.04
-0.43
-0.35
0.18
0.28
0.05
0.56
0.50
0.20

8
0.03
-0.54
0.16
0.16
0.24
-0.57
0.33
-0.21
0.04
0.09
0.39

9
-0.09
0.08
-0.11
-0.26
0.39
-0.17
-0.36
0.43
0.40
0.56
0.02

10
0.13
0.43
-0.78
-0.23
-0.13
-0.09
0.30
-0.04
-0.06
0.09
0.14

11
0.75
-0.20
-0.24
-0.09
0.25
-0.22
-0.16
0.10
0.01
0.08
-0.43

1
1.51
-2.77
-2.30
-0.26
2.16
0.04
0.95
-1.25
0.06
1.36
0.77
2.38
0.51
-1.24
-0.73
-0.45
2.15
1.07
-0.53
-0.80
-1.95
-1.62
-1.92
-2.12
0.95
-0.18
0.10
0.29
0.53
0.65
1.40
2.77
2.02
0.37
-1.49
0.50
0.93
1.11
2.55
-1.73
-0.92
-1.87
0.09
-1.37
-0.28
-3.03
-2.35
-3.18
0.50
-0.66
0.93
-0.50
1.68
1.43
0.10
1.70
1.30
0.09
1.88

3
-1.76
1.62
1.45
-0.61
-0.52
-0.13
0.24
0.15
-0.12
0.26
0.90
-0.31
0.52
-0.53
0.16
-0.42
-0.48
0.47
-0.13
-1.51
0.29
0.68
-1.37
0.82
-1.39
-1.00
-0.73
1.15
-0.45
0.18
-0.17
-0.41
-0.84
-1.82
0.07
-0.41
-0.73
-0.01
-0.81
0.95
0.11
0.57
0.49
0.73
0.05
1.24
0.71
0.29
0.97
-0.68
0.58
0.30
0.03
-0.10
0.43
-0.17
0.51
1.27
-0.57

4
-0.87
1.15
0.89
1.36
-1.15
-0.31
-0.54
0.90
-0.09
0.29
-0.02
-1.27
0.74
0.92
0.06
0.04
-1.41
-0.68
-1.91
-0.55
1.17
0.23
0.07
-0.03
-0.37
-0.48
0.84
0.28
-0.22
-0.03
-0.72
-1.27
-0.62
1.25
1.13
0.17
0.17
0.04
-0.48
-0.44
0.99
0.74
-0.66
0.13
0.63
1.81
0.75
1.59
-0.89
-0.10
-1.33
1.45
-0.48
-0.71
0.26
-1.06
0.37
0.35
-1.21

6
-1.52 -1.32
-0.65 2.33
-0.49 0.89
-0.25 -0.36
1.61 -1.51
0.65 -0.05
0.09 -1.03
0.15 0.31
-0.61 0.33
1.02 1.82
1.54 -0.35
1.38 -0.90
0.99 -0.65
-0.17 0.17
0.14 1.24
-0.21 0.68
0.28 -0.92
2.01 0.96
0.90 -2.29
-0.80 -0.71
-0.19 0.14
-1.2E-03 1.20
0.59 -0.07
0.83 -0.07
0.72 -1.32
-0.95 -1.53
-1.08 -0.12
0.47 0.94
-1.42 -1.12
0.40 0.40
-1.10 0.23
1.23 -0.82
-0.57 -0.44
-1.96 0.43
-2.08 2.63
-1.86 0.36
-0.82 0.28
0.60 1.25
1.57 -1.94
-1.07 -0.59
0.33 -1.18
-0.68 0.63
0.42 0.35
-0.24 0.14
0.28 -0.34
-2.45 2.84
-0.81 0.97
-1.72 2.28
0.29 -0.09
-0.80 -0.30
0.83 -0.63
-0.58 1.01
1.14 -1.25
0.86 -0.98
-0.17 0.81
-1.0E-03 -1.16
1.03 -0.98
0.12 1.89
0.48 -1.52

7
-1.16
-1.82
-2.65
-0.40
1.70
0.83
-0.04
-0.17
-0.01
0.03
0.83
1.36
-0.09
0.52
-0.15
0.08
0.90
1.70
1.39
1.01
-0.83
-0.96
-0.11
0.07
1.17
0.31
-0.90
0.02
-0.86
-0.02
-0.35
1.26
-0.31
-1.49
-1.89
-1.39
-1.16
0.10
1.75
-1.14
0.24
-1.22
-0.04
-0.46
0.60
-3.09
-0.97
-2.67
0.28
0.43
1.12
-1.00
1.79
1.64
-0.16
0.98
0.59
0.67
1.24

8
-1.16
1.36
0.99
-0.26
-0.79
-0.08
-1.00
-0.08
-0.61
2.17
-0.18
-0.37
-0.01
-0.74
0.36
0.30
-1.08
0.79
-1.82
-1.17
0.21
0.74
1.60
-0.26
-0.41
-1.86
-0.14
0.42
-1.69
0.51
-0.63
-0.39
-0.54
0.49
1.60
-0.29
0.72
1.64
-1.19
-1.52
-0.68
0.21
0.44
-0.13
-0.33
1.90
0.99
2.46
-0.20
-0.43
-0.40
1.35
-0.83
-0.79
0.83
-1.31
-0.32
1.19
-1.06

9
-0.49
1.77
2.52
0.19
-1.11
-0.28
0.52
-0.10
-0.35
-0.78
0.33
-0.36
0.58
-0.61
-0.06
-0.92
0.10
-1.33
-0.34
-0.47
0.76
0.86
-0.85
0.84
-1.31
0.05
0.36
0.91
0.31
-0.07
0.47
-0.72
-0.62
-0.21
1.15
0.67
0.29
-0.36
-1.49
0.82
-0.05
0.84
-0.43
0.57
-0.67
2.49
0.80
1.14
0.37
-0.32
-0.13
0.67
-1.07
-0.92
0.46
-0.30
0.03
0.09
-1.09

10
0.49
-0.48
0.88
0.35
0.31
-0.45
-0.80
-0.18
-1.32
0.56
-0.18
0.25
0.26
0.27
0.38
-0.48
-0.39
0.41
-0.99
-0.79
0.18
0.16
1.43
0.15
0.50
-1.26
0.39
-0.71
-0.72
0.70
-1.46
0.45
-0.09
0.98
-0.43
-0.88
0.57
0.71
0.72
-0.99
0.32
0.74
0.93
0.06
-0.25
0.39
-0.49
1.45
-0.70
-0.56
-0.58
0.65
-0.35
-0.14
-0.08
-0.80
0.11
-1.43
0.13

11
-1.24
-0.96
-1.98
-1.04
1.59
0.62
-0.21
0.20
0.17
0.83
0.63
0.92
-0.59
0.06
-0.17
0.86
0.36
2.44
0.81
-0.69
-0.43
-0.92
-0.03
1.01
0.85
-0.42
-0.87
0.27
-0.84
0.72
-0.39
1.42
-0.05
-1.41
-1.40
-1.48
-1.04
0.88
1.69
-0.49
-0.18
-1.62
0.84
-0.09
0.61
-2.82
-0.78
-1.69
0.37
-0.09
0.45
-1.00
1.21
1.36
-0.44
0.25
-0.03
0.82
1.00

U
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59

0.83
0.65
1.54
0.08
-0.71
-1.19
0.40
-0.06
-0.56
-1.07
-0.52
-1.00
0.19
-0.32
0.25
-0.95
-0.25
-1.20
0.72
-0.38
1.09
0.84
0.85
1.24
-0.71
1.7E-04
0.72
-0.25
1.06
0.28
-0.33
-0.49
0.17
0.25
-0.36
0.42
0.15
-0.76
-0.24
2.53
1.17
1.37
0.80
1.46
0.26
1.69
0.76
1.59
0.32
-0.15
0.09
0.38
-0.74
-0.77
-0.56
-0.52
0.34
-1.53
-0.43

20

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5


60
61
62
63
64
65
66
67
68
69
70
71
72
73
74

0.34
2.67
2.15
1.58
-0.31
0.41
-1.63
0.39
-1.11
-0.67
-0.60
-0.92
-1.49
-0.76
-1.36

-0.21
-0.91
0.07
-0.86
-1.33
-1.38
-0.79
0.33
0.29
-0.81
0.19
-0.09
-1.47
-0.45
-1.03

0.38
-0.26
-0.18
-0.47
-0.74
0.08
0.39
-0.64
0.30
0.27
1.49
0.08
-0.42
0.38
-0.69

0.12
-0.89
-1.21
-1.43
-1.24
-0.52
-1.21
0.23
-0.52
-0.51
0.38
0.61
1.64
0.53
3.16

3
0.00
0.00
0.24
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00

4
0.00
0.00
0.00
0.32
0.00
0.00
0.00
0.00
0.00
0.00
0.00

0.76 0.76
1.55 -1.08
0.42 -1.12
-0.08 -0.93
0.81 -0.99
0.80 0.12
0.01 -0.41
-0.50 -1.51
-0.97 -1.24
-0.18 -0.09
1.23 0.56
-0.84 0.69
-0.05 2.47
0.16 -0.08
-0.81 1.89

2015

0.01
1.87
0.81
1.00
1.16
0.94
0.10
0.05
-0.69
-0.24
0.23
-1.07
-0.41
0.09
-0.94

1.40
-0.13
-0.93
-0.90
-0.79
0.37
-0.04
-1.29
-1.64
-0.19
0.75
0.58
2.59
-0.04
1.71

-0.15
-1.27
-0.82
-0.87
-1.98
-0.72
0.42
0.03
0.59
0.38
0.92
0.58
-0.44
0.48
-0.31

1.47
0.48
-0.14
-0.42
0.47
0.17
-0.20
0.02
-0.51
-0.35
0.33
0.05
0.96
-0.78
0.54

0.25
1.67
0.68
0.63
1.99
0.93
-0.01
-0.68
-0.76
-0.33
0.38
-1.24
0.04
-0.58
-0.82

9
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.51
0.00
0.00

10
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.30
0.00

11
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
1.09

B
1
2
3
4
5
6
7
8
9
10
11

1
0.49
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00

2
0.00
0.31
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00

5
0.00
0.00
0.00
0.00
0.27
0.00
0.00
0.00
0.00
0.00
0.00

6
0.00
0.00
0.00
0.00
0.00
0.57
0.00
0.00
0.00
0.00
0.00

7
0.00
0.00
0.00
0.00
0.00
0.00
0.70
0.00
0.00
0.00
0.00

8
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.42
0.00
0.00
0.00

1
-0.33
-0.29
-0.34
0.26
-0.52
-0.35
-0.38
-0.04
-0.02
0.11
-0.26

2
-0.36
-0.21
-0.32
0.24
0.44
0.30
0.34
-0.13
0.22
-0.02
-0.46

4
0.15 -0.25
0.08 -0.38
-0.15 -0.19
0.19 -0.64
-5.0E-03 0.15
-0.01 0.01
-0.26 -0.19
-0.16 0.09
0.72 -0.19
-0.49 -0.49
0.25 0.08

5
0.07
-0.17
-0.11
0.32
-0.12
0.07
0.24
0.84
-0.03
-0.22
0.15

6
0.15
-0.28
-0.28
0.25
0.13
0.51
-0.35
-0.15
-0.26
0.25
0.45

7
0.15
-0.40
0.06
-0.37
-0.48
0.34
0.28
-0.04
0.41
0.28
-0.01

8
9
-9.2E-05 -0.28
-0.44 0.13
0.01 -0.05
0.11 -0.23
0.22 0.33
-0.59 -0.12
0.38 -0.32
-0.20 0.41
0.05 0.39
0.13 0.54
0.45 0.12

10
0.05
0.45
-0.75
-0.22
-0.16
-0.07
0.32
-0.05
-0.07
0.08
0.18

11
0.75
-0.20
-0.24
-0.09
0.25
-0.22
-0.16
0.10
0.01
0.08
-0.43

1
-0.14
-0.56
-0.44
0.20
0.66

2
-0.51
0.73
0.07
-0.40
-0.18

3
0.05
0.75
-0.35
0.32
-0.45

4
0.07
-0.06
0.79
0.11
-0.60

5
-0.33
0.26
-0.31
0.84
0.17

6
0.76
0.22
0.55
0.16
-0.19

7
-0.08
-0.48
-0.56
0.60
0.28

8
0.47
0.27
0.76
0.35
0.02

10
-0.42
0.39
0.67
0.10
0.45

11
0.02
-0.20
-0.49
0.69
0.50

1
1.67
-0.85
-0.91
0.33
0.68
-1.62
1.74
-1.43
0.28
2.42
0.82
1.18
1.49
-2.06
-0.68
-1.73
1.86
0.18
-3.60
-3.18
-1.32
-1.35
-4.43
-2.88
-1.16
-1.56
1.74
1.81
1.94
1.83
2.44
2.49

3
4
-0.29
-0.36 0.20
0.03
-0.32 1.55
-2.27
-0.57 -0.56
-0.67
-0.72 1.09
-0.34
-1.00 1.15
-1.10
-1.05 1.18
0.18
-0.76 1.33
-0.40
-0.17 1.53
0.14 -8.0E-04 1.65
0.26
-0.03 -0.39
-1.32
-0.59 1.32
-0.95
-1.69 -0.28
-0.93
-0.22 1.62
0.23
-0.31 0.92
1.87
-0.43 -1.49
-0.04
-0.30 -0.92
0.43
-2.29 -1.37
0.86
-0.31 0.17
2.61
-0.90 0.34
2.54
-1.74 0.05
1.07
-1.14 0.28
1.69
-0.48 -1.63
4.43
-1.44 -0.08
1.80
-2.07 -0.19
0.09
-1.23 0.92
0.26
-1.65 0.08
0.14
-1.45 0.32
-0.42
-1.23 -0.69
-0.12
-0.33 0.76
0.22
-0.97 0.93
-0.38
-1.53 -2.06
-0.14
-1.63 -0.67

5
1.47
1.24
1.34
1.07
0.43
1.00
1.22
1.11
1.67
1.93
1.30
0.88
2.08
-0.09
1.62
0.77
-0.35
0.72
-0.09
-0.59
-0.76
1.91
0.72
-0.97
-0.10
-0.63
-1.69
-0.49
-0.60
-1.29
-0.52
-0.43

6
-0.38
0.29
-0.58
0.35
-0.33
0.09
-0.88
0.53
0.30
-0.46
0.04
-0.07
-0.72
1.92
1.70
-0.19
0.45
0.91
-1.03
0.84
-0.30
0.58
-1.54
0.53
-0.61
-0.17
-0.01
0.32
-0.12
0.07
0.17
0.15

7
-0.22
-0.30
-0.17
0.32
0.22
0.56
-0.05
-0.48
-0.42
-0.41
0.39
0.97
0.30
-0.18
0.03
-1.03
0.78
-0.31
0.10
1.29
-0.66
0.06
0.49
-0.33
0.23
0.17
-0.39
-0.16
-0.91
-0.52
-0.19
0.18

8
0.12
0.34
-0.53
-0.04
-0.11
0.18
-0.79
0.78
0.13
0.24
0.10
-0.58
-0.37
-1.48
-0.45
-0.86
-0.46
-0.27
0.21
-0.57
-0.12
0.20
1.13
0.54
-0.13
-0.30
-0.32
0.36
-0.17
-0.09
0.70
0.21

Matriz W
1
2
3
4
5
6
7
8
9
10
11

Matriz Q
1
2
3
4
5

9
-0.04
0.76
-0.04
-0.23
-0.60

Matriz T
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

9
10
11
-0.11
-0.12
-0.13
0.38
0.11
-0.07
0.83
0.57
-0.54
0.16
0.38
0.08
-0.02
-0.36
-0.18
0.47
-0.74
-0.25
0.29
-0.24
0.12
0.33
-0.41
-0.12
0.16
0.06
-0.05
-0.46
-0.05
0.10
0.02
0.24
0.21
0.55
-0.01
-0.03
-0.23
-0.10
0.29
-0.40
-0.41
0.13
-0.30
-0.50
-0.27
0.69
0.41
0.04
0.57
0.18
0.10
-0.35
0.31
0.20
-0.91
0.25 -4.1E-03
-0.94
0.25
-0.31
0.32
-0.36
0.12
-0.24
-0.24
0.06
-0.32
0.91
0.05
1.60
0.35
0.20
-0.03
-0.35
0.28
0.48 -2.5E-03
0.33
-0.17
-0.23
-0.13
-0.02
0.12
0.15
-0.59
0.19
0.11
-0.48
-0.06
-0.19
0.14
0.02
-0.10
0.14
0.16
0.15

21

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5


33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74

2.96
2.02
0.43
2.55
2.01
1.76
1.97
-0.41
-0.45
-1.04
0.52
-0.41
0.01
1.17
-1.61
-1.10
1.05
-1.56
0.46
1.79
1.14
0.53
0.60
1.23
2.38
1.40
0.72
0.50
2.03
2.17
0.20
-5.01
-1.55
-5.46
0.30
-2.57
-2.66
0.03
-0.85
-2.05
-1.26
-0.04

0.22
-0.48
-1.17
0.04
-0.45
-0.18
-0.11
3.02
1.65
0.83
1.38
2.29
1.96
0.83
1.80
1.40
1.00
1.29
2.00
0.06
-1.9E-03
-0.49
-1.11
-0.89
0.34
-0.25
-0.62
-0.91
0.03
0.51
-1.18
-2.99
-2.24
-2.94
-1.13
-3.65
-3.48
-0.49
-1.57
-1.26
-0.97
-1.57

-0.53 -1.18
-1.35 0.31
-1.27 0.46
-0.83 -0.66
-1.24 -1.19
-1.30 -0.96
-0.80 0.39
1.98 -0.52
1.53 0.81
2.14 -1.28
1.89 0.02
1.18 -0.03
1.55 -0.38
1.22 1.17
1.24 0.45
1.21 0.91
1.19 -1.03
0.41 0.22
1.31 -0.95
1.09 0.50
1.74 0.97
1.14 0.63
0.92 -0.77
1.03 -0.42
1.53 -1.08
1.50 1.37
1.32 0.18
1.45 -0.42
0.96 -0.32
1.66 -0.94
1.46 -0.04
0.67 -0.45
1.02 -0.33
0.38 -1.68
0.59 0.66
1.73 0.31
-0.23 -1.07
0.34 0.11
0.84 -1.11
-0.84 0.17
-0.54 -0.19
-0.41 0.33

0.33
-1.30
-1.30
-0.23
0.21
-0.90
-0.90
0.35
-0.56
0.91
0.01
-0.60
-0.21
-0.94
-0.71
-1.07
-0.10
-1.44
0.37
-0.75
-0.22
-0.87
-0.34
-0.25
0.57
-0.65
-0.51
-0.06
-0.47
0.58
-0.35
-0.10
0.06
-0.86
-0.51
-0.05
-0.21
-0.37
0.59
-0.50
-0.03
-0.47

-0.15
0.14
0.53
-0.31
-0.89
-0.35
0.09
0.22
-0.20
1.09
0.24
0.26
0.02
0.45
-0.93
-0.46
-0.47
0.08
-0.41
-0.37
-0.19
0.36
0.08
0.30
-0.41
0.04
-0.16
0.15
-0.49
-0.05
-0.01
0.05
0.18
-1.01
0.12
-0.01
-0.28
0.23
0.05
0.48
-0.48
0.63

-0.73
-0.25
-0.01
-0.46
-0.10
-0.32
-0.49
-1.15
-0.15
0.28
-0.40
-0.24
-0.52
0.33
-0.11
-0.15
-0.05
0.53
0.67
0.28
0.26
0.43
0.72
0.67
0.22
0.24
0.23
0.51
0.43
0.01
0.46
-1.26
0.37
0.23
0.42
-0.36
-0.18
0.41
0.23
0.17
0.03
-0.53

0.41
-0.03
0.82
-0.15
-0.60
-0.12
0.09
0.57
-0.09
-0.03
-0.16
-0.10
-0.46
-0.86
0.15
0.01
-0.49
0.03
-0.35
-0.27
-0.15
0.19
0.53
0.57
0.13
0.09
-0.09
0.21
-0.57
0.37
0.09
-0.27
0.66
-1.14
0.45
-0.05
-0.03
0.49
0.69
1.00
0.23
0.66

-0.46
-0.06
-0.22
-0.44
0.13
-0.17
-0.59
0.53
-0.03
-0.43
0.09
0.47
0.41
-0.06
-0.01
0.31
0.22
0.42
-0.55
0.23
-0.46
0.31
0.22
0.12
0.03
-0.17
0.07
-0.03
0.32
0.08
-0.07
-0.45
1.8E-03
0.09
0.23
0.04
-0.62
0.19
0.17
-0.29
-1.01
-0.13

2015

-0.28
0.01
0.26 -4.0E-03
0.23
0.02
0.10
0.12
-0.01
-0.12
0.23
-0.13
8.5E-05 1.9E-03
-0.46
-0.11
-0.01
0.07
0.80
0.31
-0.03
0.15
0.24
-0.03
0.33
-0.22
0.15
-0.02
-0.48
0.08
-0.34
-0.08
-0.65
0.10
-1.20
-0.18
0.28
-0.12
0.15
-0.13
0.26
-0.08
0.08
-0.08
-0.25
0.06
0.14
0.05
-0.26
-0.03
0.29
0.28
0.24
0.09
0.07
-0.01
0.38
-0.08
-0.10
-0.13
0.06
0.20
0.19
0.22
-0.58
0.21
-0.10
0.10
0.16 5.0E-04
0.96
-0.56
-0.49
0.31
0.05
-0.03
-0.44
0.14
0.22
-0.10
-0.74
-0.50
0.25
-0.15

Betas-PLS
1
2
3
4
5
6
7
8
9
10
11

1
0.09
-0.27
-0.02
-0.10
0.20
0.12
-0.33
-0.25
-0.24
0.01
0.38

2
-0.33
0.22
-0.26
0.06
0.84
0.12
-0.17
-0.12
0.12
-0.09
0.43

3
-0.53
0.01
-0.28
-0.24
0.66
0.10
-0.18
-0.45
-0.52
-0.15
0.78

4
0.84
-0.49
-0.10
0.06
-0.44
-0.11
0.17
0.35
0.20
-0.01
-0.21

5
0.56
-0.22
-0.09
0.18
-0.63
-0.23
0.24
0.11
-0.05
0.13
-0.46

22

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Otros ejercicios
Ejercicio 3
En el archivo CorrCan (datos de prueba de InfoStat) contiene los resultados de un estudio
realizado con alumnos del ltimo ao de la escuela secundaria, en el que se deseaba conocer
si las calificaciones en asignaturas de naturaleza cuantitativa como Matemtica, Fsica y
Contabilidad se correlacionaban o no con las calificaciones obtenidas en asignaturas de
naturaleza no cuantitativa como Lengua, Literatura e Historia.

2.1)

2.2)

2.3)

Existe asociacin entre las calificaciones obtenidas en asignaturas de naturaleza


cuantitava y no cuantitativa? Presente los resultados de los tres primeros pares de
variables cannicas (coeficiente de correlacin y valor p).
Cmo se correlacionan los componentes de cada variable cannica con la variable
cannica correspondiente? Realice una tabla presentando los coeficientes de
correlacin simple de Pearson entre las calificaciones de asignaturas cuantitativas y la
variable cannica compuesta por las mismas y entre las calificaciones de asignaturas
no cuantitativas y la cannica correspondiente.
Realice un grfico de dispersin entre las dos primeras variables cannicas e
interprete los resultados teniendo en cuenta lo obtenido en el punto anterior.

Ejercicio 4
El archivo gimnasio.idb (archivo de datos de prueba de Infostat) contiene datos de un estudio
realizado en un gimnasio. Las tres primeras columnas del archivo corresponden a variables
fsicas (peso, cintura y pulso) tomadas sobre un grupo de 20 individuos y las tres ltimas son
variables que miden el desempeo de la actividad fsica de los mismos individuos (nmero de
ejercicios continuados en la barra, nmero de abdominales y nmero de saltos). Se puede
decir que el desempeo en las actividades se correlaciona con el fsico del individuo?

Ejercicio 5
En el archivo vinos_PLS se presentan los resultados de un estudio realizado con 5 vinos, en
el que se deseaba conocer si tres calificaciones subjetivas, dadas por una escala hednica de
calidad (mayor valor, mayor calidad) y la opinin sobre si el vino es ms apropiado para
acompaar carne o dulces, se pueden predecir a partir de otros atributos del vino como son el
precio, el contenido de azucares, el grado de alcohol y la acidez del mismo.
Existe asociacin entre las 4 predictoras con las apreciaciones subjetivas que se le asignan a
estos 5 vinos?
23

Aplicaciones del Anlisis estadstico multivariado - Ejercicios Clase 5

2015

Ejercicio 6
El artculo en pdf que se adjunta en esta clase, corresponde a un estudio sobre compuestos
voltiles en vinos. El ejercicio que proponemos es identificar la metodologa estadstica
utilizada para el anlisis del mismo, en particular la aplicacin de la regresin PLS y la forma
de reporte de los resultados.
Usan un triplot para reportar los resultados?
Informan el modelo explicativo de Y derivado de la regresin PLS?
Para que podra servir ese modelo con futuros vinos?

24

Vous aimerez peut-être aussi