Vous êtes sur la page 1sur 7

Clase de análisis multivariante

Software Infostat data sets:

Proteínas (ACP). Método de Interdependencia o no supervisado

Garbanzo (Conglomerados). Método de Interdependencia o no supervisado

Iris (CART, MANOVA). Método de Dependencia o supervisado

Alcoholismo (AC). Método de Interdependencia o no supervisado

Manual Infostat Guía del Usuario

Análisis multivariado _____________________________________________ 167


Estadística descriptiva multivariada _________________________________________ 168
Análisis de conglomerados ________________________________________________ 173
Métodos de agrupamiento jerárquicos ________________________________________ 177
Métodos de agrupamiento no jerárquicos______________________________________ 181
Distancias ______________________________________________________________ 182
Componentes principales ___________________________________________________ 182
Biplot __________________________________________________________________ 188
Arboles de Recorrido Mínimo (ARM) _________________________________________ 189
Análisis discriminante ______________________________________________________ 189
Correlaciones canónicas _____________________________________________________ 197
Regresión por Mínimos Cuadrados Parciales _____________________________________ 201
Análisis de la varianza multivariado____________________________________________ 204
Correlación-distancias-similitudes _____________________________________________ 212
Análisis de correspondencias _________________________________________________ 217
Análisis de coordenadas principales ____________________________________________ 221
Árboles de clasificación y árboles de regresión ___________________________________ 223
Biplot y árbol de mínimo recorrido ____________________________________________ 225
Procrustes generalizado _____________________________________________________ 227

Gráficos _____________________________________________________________ 258


Herramientas Gráficas ______________________________________________________ 259
Solapa Series ___________________________________________________________ 259
Solapa Eje X____________________________________________________________ 262
Solapa Eje Y____________________________________________________________ 263
Solapa Herramientas _____________________________________________________ 264
Ventana Gráficos __________________________________________________________ 265
Suscripción y copia de formatos gráficos______________________________________ 266
Leyendas ______________________________________________________________ 266
Líneas de texto __________________________________________________________ 267
Diagrama de dispersión _____________________________________________________ 268
Gráfico de Puntos __________________________________________________________ 270
Gráfico de barras __________________________________________________________ 271
Gráfico de cajas (box-plot) ___________________________________________________ 273
Gráfico de densidad de puntos ________________________________________________ 274
Q-Q plot _________________________________________________________________ 275
Gráfico de la distribución empírica ____________________________________________ 276

Histograma________________________________________________________________277
Diagrama de perfiles multivariados _____________________________________________278
Gráfico de estrellas _________________________________________________________280
Gráfico de Sectores _________________________________________________________281
Gráfico de barras apiladas ____________________________________________________284
Matriz de diagramas de dispersión______________________________________________286
Graficador de funciones______________________________________________________287
Componentes principales
Menú ESTADÍSTICAS ANÁLISIS MULTIVARIADO COMPONENTES
PRINCIPALES permite analizar la interdependencia de variables métricas y encontrar una
representación gráfica óptima de la variabilidad de los datos de una tabla de n observaciones
y p columnas o variables.

En la ventana Análisis de componentes principales, se deben indicar las variables


respuesta y las de clasificación en caso que existan. En caso de señalar un criterio de
clasificación InfoStat trabajará con la matriz axp de datos siendo a el número de niveles del
criterio de clasificación y p la cantidad de variables seleccionadas. En la solapa General hay
opciones para guardar las componentes obtenidas (Guardar los ejes) según el número de
componentes que se indique o según el criterio utilizado para la selección automática del
número de ejes a guardar. Cuando el usuario, activa el casillero # automático, InfoStat
guardará tantos ejes como autovalores mayores al valor promedio de los autovalores haya.
Si se guardan componentes principales se adicionarán como nuevas columnas a la tabla
activa. Estas componentes pueden ser utilizadas posteriormente para realizar gráficos de
dispersión de las observaciones (el gráfico de dispersión usando como ejes la CP1 y la CP2
permite visualizar la mayor variabilidad entre observaciones). Si se realizan varios ACP, se
generarán tantas nuevas columnas como componentes se decidan guardar en cada análisis.
Para evitar esta acumulación de nuevas columnas se puede activar la opción
Sobrescribirlos, así sólo se guardarán las del último ACP. Se puede pedir la
estandarización de cada variable antes de comenzar el análisis (Estandarizar datos), la
visualización de la matriz de covarianza o correlación (Mostrar matriz de
covarianzas/correlación) sobre la que se realiza el análisis, la correlación de cada
componente principal con las variables originales, el coeficiente de correlación
cofenética, gráficos Biplot y Árbol de recorrido mínimo (ARM). En caso de que ese haya
indicado un criterio clasificación en la solapa Medidas de resumen, InfoStat permite
escoger entre medidas de posición como la media, mediana, mínimo, máximo y de
dispersión como la varianza y desviación estándar como estadísticos para resumir la
información de cada variable en cada conjunto de registros indexado por el criterio
(opcional).
Ejemplo 34: En un estudio que tuvo como objetivo estudiar los alimentos que se utilizan
como fuentes proteicas, en las dietas de los habitantes de países europeos, se registraron
los alimentos consumidos. Los datos se encuentran en el archivo Proteínas.
Si además de solicitar el gráfico Biplot, en el ejemplo anterior se activaba la opción ARM
se obtiene el siguiente gráfico:
Ejemplo 33: se realizó un plan de recolección de datos para analizar semejanzas y
diferencias morfométricas entre 14 genotipos (cultivares) de garbanzo. Se midieron 9
variables, como son el largo, el ancho y el espesor de la vaina entre otras, sobre cada
observación correspondiente a un genotipo. Existen varias observaciones por objeto que se
desea agrupar. Los datos (gentileza Ing. Julia Carreras, Facultad de Ciencias
Agropecuarias-U.N.C.), se encuentran en el archivo Garbanzo.
archivo Iris.
Archivo: Alcoholismo.
Archivo: Iris

Vous aimerez peut-être aussi