Vous êtes sur la page 1sur 9

Anlisis Descriptivo

Estadstica Descriptiva
Multivariada

Profesor: Danilo Gmez Correa

Universidad de Concepcin

Segundo Semestre 2015

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Contenidos

1 Anlisis Descriptivo

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Variables
En Estadstica Descriptiva se estudian caractersticas (Variables) de colecciones de
datos, que presentan cierta variabilidad debido a factores aleatorios (no se pueden pre-
decir).

1 Cuantitativas: lo que observamos es medible, una cantidad


Discretas: Se asocia a un nmero entero. Por ejemplo: El nmero de her-
manos de 5 amigos: 2, 1, 0, 1, 3.
Continuas: Se asocia a un nmero real. Por ejemplo: La altura de los 5
amigos: 1,73; 1,82; 1,77; 1,69; 1,75.
2 Cualitativa: lo que observamos es una cualidad
Nominal: presenta modalidades no numricas que no admiten un criterio de
orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero,
casado, separado, divorciado y viudo.
Ordinal: presenta modalidades no numricas, en las que existe un orden.
Por ejemplo: Medallas de una prueba deportiva: oro, plata, bronce.
Profesor: Danilo Gmez Correa. Estadstica Descriptiva
Anlisis Descriptivo

Cmo transformar variables cuantitativas en cualitativas?

La conversin de una variable cuantitativa en cualitativa se denomina


categorizacin.

Se ordena la variable
Se decide el nmero k de categoras
Se buscan los lmites e intervalos para cada categora
(max min) (max min)
[min, min + [, [min, min + 2 [, . . .
k k
Se asigna una etiqueta para cada categora
En la variable original (sin ordenar) se cambia cada valor por
una etiqueta segn el intervalo al que corresponda

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Los Datos en Mtodos Descriptivos


Matriz de n filas (individuos u objetos) y p columnas (variables).

x11 x12 ... x1p



x21 x22 ... x2p
X= . .. ..

.. ..
. . .
xn1 xn2 ... xnp

donde xij es la i-sima observacin de la j-sima variable, i = 1, . . . , n y j = 1, . . . , p


X(i): i-simo vector fila.
X(j): j-simo vector columna.

Objetivos
Resumir los datos mediante un pequeo conjunto de nuevas variables,
construidas como transformaciones de las originales.
Encontrar grupos en los datos, si existen.
Clasificar nuevas observaciones en grupos definidos.
Relacionar dos conjuntos de variables.

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Estadstica Multivariada Descriptiva

Definicin
Vector de Medias:
t 1 t
X = 1 X = (
x1 , x
2 , . . . , x
p )
n
donde 1t es el vector columna de unos.
n
1 X
x
j = xij , j = 1, . . . , p.
n j=1

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Definicin
Matriz de varianza-covarianza:

s11 s12 ... s1p


1 t 1 s21 s22 ... s2p


S= X (In 1t 1)X = .. .. ..

..
n n . . . .
sp1 sn2 ... spp

n
1 X
sij = (xij x
j )(xik x
k ), j, k = 1, . . . , p.
n 1 i=1

Definicin
Varianza generalizada: V G = |S|; donde | | representa el determinante de la matriz.

Definicin
Traza:
p
X
V T = tra(S) = s2j
j=1

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Definicin
Matriz de correlacin: A partir de S se puede obtener.

1 r12 ... r1p



r21 1 ... r2p
R= .. .. ..

..
. . . .
rp1 rn2 ... 1

considerando cada elemento rij de la forma:

sjk
rij =
sjj skk

1 1 1
Adems, R = D 2 SD 2 , donde D 2 es la matriz diagonal  con los
 inversos de las
1 1
desviaciones estndar sobre la diagonal, es decir: D 2 = diag
sj

Profesor: Danilo Gmez Correa. Estadstica Descriptiva


Anlisis Descriptivo

Pasos para una buena exploracin de datos

1 Anlisis Descriptivo.
Medidas de tendencia central.
Medidas de Dispersin.
Medidas de Posicin.
Medidas de Relacin.
2 Anlisis Grfico.
Unidimensional: histogramas, box-plot.
Bidimensional: diagramas de dispersin.
Tridimensional.
Multidimensional: grfico de estrella.
3 Datos Atpicos.
Mtodo rango: 2 sigma o 3 sigma (Previa normalidad de los datos).
Box-plot.
Mximo y Mnimo.
4 Datos Faltantes.
Regresin multiple. (Mas usado y seguro)
Remplazo por el id similar.
Promedio de la variable.

Profesor: Danilo Gmez Correa. Estadstica Descriptiva

Vous aimerez peut-être aussi