Vous êtes sur la page 1sur 25

Estadstica Ecolgica

Leonel Lopez-Toledo
Facultad de Biologa
UMSNH
Semestre 2013-2014

Manejo elemental de datos (cont).


Funcin tapply( )
Calcular promedios y varianzas fcilmente a partir de la base de
datos, agrupando por niveles de factores

Promedios<-tapply(Y_Var,factor,mean)
tapply(Y_Var,factor,mean)
Cualquier
nombre

Variable de
respuesta Factor para
agrupar la
Variable de
respuesta

Qu se va a
calcular:
mean
var
sd
length

Manejo elemental de datos (cont).


Funcin tapply( ) para dos o mas factores
Calcular promedios y varianzas fcilmente a partir de la base de
datos, agrupando por dos niveles de factores

Promedios<-tapply(Y_Var,list(f1,f2),mean)
Cualquier
nombre

Variable de
respuesta 2 factores para
agrupar la
Variable de
respuesta

Qu se va a
calcular:
mean
var
sd
length

Como muchas cosas en la vida, arpender R es un proceso


De fracaso-triunfo-fracaso-triunfo-fracaso-fracasotriunfo
Aprender R es algo as como el arte de
disfrutar aprendiendo de los errores.

Principales tipos de error:


1) Digitales (osase de dedo, errores ortogrficos);
2) Gramaticales (uso incorrecto de los componentes del
lenguaje);
3) Lgico-estructurales (construccin incorrecta del
algoritmo).

Pasos en el anlisis estadistico


1.- Formulacin de hiptesis
Teora-fundamento biolgico, observaciones

2.- Exploracin de datos


Tipo de variables
Variable de respuesta
Variables explicativas
Las variables son continuas o categoricas, proporciones, conteos

Exploracin de datos
Tipo de variable
Variable de respuesta
Variables explicativas
Las variables son continuas o categoricas, proporciones, conteos

Checar outliers De caja (boxplot), de dispersion


(scatterplot), ndice (indexplot)

Homogeneidad en Y entre tratamientos


- Caja por factores o niveles
- Barras

Exploracin de datos (mas)


Normalidad de X y Y
Histogramas y de normalidad (qqplot)

Colinearidad (Xs). Regresiones Correlaciones entre


variables explicativas (independientes)

Dispersion
Pares

Relaciones (X,Y)

Exploracin de datos
(mas)
Interacciones
Aplicacin de modelo estadstico
Variables explicativas (Independiente = X)
Continuas
Regresin
Categoricas
ANOVA
Continuas y categricas
ANCOVA
Variable de respuesta (Dependiente =Y)
Continua
Regresion, ANOVA, ANCOVA
Proporciones
Regresin logstica
Conteos
Log-lineares
Binarios
Logsticos binarios
Tiempo de muerte
Analisis de sobrevivencia

Grficas. De dos variables

> plot(x,y)

Scatterplot de dos variables continuas

Grficas. Diagramas de caja y bigotes (boxplot)


(box and whiskers).
plot(Factor,y)

En lugar de que X sea continua, como en el caso


anterior, ahora es categrica. Muy utiles para explorar
ver si hay diferencias
75avo percentil

Bigotes
(whiskers)

Caja
(box)

Mediana
25avo percentil

Grficas. Diagramas de caja y bigotes


(box and whiskers).v
Sin valores atpicos (outliers)

Los bigotes muestran los


valores mximos y mnimos

Con valores atpicos (outliers)

Los bigotes muestran 1.5 veces el


rango intercuantil de los datos
( 2 desvos tpicos).

Grfica de barras (Barplot)

> barplot(y)

Grafica de barras de un factor


o de dos factores

Grficas. Histogramas.
hist(x)
Grfica de una sola variable (barras), que ordena la variable
de mayor a menor, divide el rango de la variable en categorias
(clases) y cuenta el numero de datos (frecuencia) que hay en
cada clase.

Son excelentes para mostrar la dispersion de los datos y la


simetra o sesgo

Grficas. Histogramas.
Esta es la funcin completa:
hist(x, breaks = "Sturges", freq = NULL, probability = !freq, include.lowest =
TRUE, right = TRUE, density = NULL, angle = 45, col = NULL, border = NULL,
main = paste("Histogram of" , xname), xlim = range(breaks), ylim = NULL,
xlab = xname, ylab = yname, axes = TRUE, plot = TRUE, labels = FALSE,
nclass = NULL, ...)

Pero las partes fundamentales son estas:


hist(x, breaks = "Sturges", freq = F/T)
Datos
organizados
como
vector

a) Nmero de
categoras que tendr
el histograma
b) Mtodo para construir
las categoras

El histograma
mostrar
frecuencias (T) o
valores absolutos (F)

Muchas graficas dentro un cuadro


Las dimensiones de cada grfica se especifican con 4 nmeros
que indican, adems, la posicin relativa de la grfica en el
espacio NDC:
c(Izq,Der,Fondo,Arriba)

(1,1)

0.95
0.7

c(0.6,0.9,0.7,0.95)

0.6

0.9

(0,0)

{graphics} split.screen

Por tanto, las dimensiones (y posiciones) de las grficas se pueden


almacenar en una matriz.
Un arreglo de figuras
como este:

1
5

6
7

Tiene la siguiente
representacin matricial:

{graphics} split.screen

Queda algo como esto:

{graphics} split.screen

Tipos de grfica en {lattice}

{lattice}

Tarea. El dataframe sp_productivity1.txt en la carpeta de datos


en dropbox representa datos del nmero de especies en sitios con
diferente productividad.
- Diga las propiedades del dataframe, que variables y de que tipo
contiene y haga una exploracin descriptiva y grfica explicando
las posibles relaciones entre variables.

Manejo elemental de datos (cont).


Se puede acceder a cualquier componente de un
data.frame, especificando el rengln y la columna en la
que est:
NombreArchivo[renglon,columna]
(notar los corchetes!!)

Manejo elemental de datos (cont).


CREAR UN NUEVO DATAFRAME
De un dataframe previamente creado se puede sacar una seccion y
crear un nuevo dataframe independiente
Datos originales

El factor de interes

El nivel dentro
de ese factor

Nombre!Dataframe1(Dataframe1$factor==nivel del factor)


Nombredf!data.frame(Nombre)

Manejo elemental de datos (cont).


Crear nuevos dataframes
> misdatos<-read.table(brosimum.txt",header=T)
> names(misdatos)
> levels(misdatos$suelo)
misdatosAluvial<-misdatos[misdatos$suelo==Aluvial",]

Ejercicio
Ejercicios: utilizar las siguientes funciones con el archivo
- brosimum.txt
"read.table(nombredearchivo.txt, header=T)
> mean(afn)
> sd(afn)
> Usando tapply( calcular el crecimiento promedio entre el factor luz, por separado y
luego suelo-luz) y graficarlo con barplot(
> levels(nombredataframe$columnacategorica
> unique(nombredataframe$cualquier columna
-Utilizando nuevodataframe <-dataframeoriginal[dataframe$factor==nivel",]
generar un nuevo dataframe para cerrado y otro abierto.

Vous aimerez peut-être aussi