Académique Documents
Professionnel Documents
Culture Documents
1 Introduccion
2 Funciones en R
3 Creacion de objetos
5 Clases de objetos en R
6 Graficas en R
7 Ejercicios
Una de las principales ventajas que tiene R es que los usuarios pueden, de
manera facil, escribir sus propios codigos y personalizar las funciones.
Sitio oficial de R
Introduccion a R (espanol)
Wiki para R
Blog de R
Objeto:
Nombre <- datos de la variable o informacion almacenada
*Las funciones son un tipo especial de objetos disenados para llevar a cabo
operaciones. Las funciones emplean argumentos, con base en los cuales se
genera un resultado despues de ejecutar una o un conjunto de operaciones.
raizenesima<-function(x, n=2) {
if ((round(n)==n)==FALSE)
stop("n debe ser entero")
res<-x**(1/n)
return(res)
}
raizenesima(4)
raizenesima(9,1.5)
Asignacion de elementos
Asignar elementos a un objeto: Posterior al nombre del objeto se usan
los smbolos <- (< menor que y - guion, unidos) para indicar que
elementos se asignaran a ese objeto, as: x<-1:4
La asignacion de elementos a un objeto tambien se puede realizar con
la funcion assign (). as:
assign("nombre del objeto", elementos)
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 13 / 40
Definicion de un vector en R
x<-seq(0,1.5,0.2)
r<-c(8,9,3,10,12,0,37,48,50)
y<-seq(min(r),max(r),(max(r)-min(r))/100)
z<-seq(along.with=r)
Una funcion relacionada con el uso de seq() es rep(), la cual sirve para
duplicar objetos o elementos.
R tambien maneja vectores logicos, los cuales solo pueden tomar uno de
dos valores: FALSE (falso) o TRUE (verdadero), estos valores tambien se
representan por las letras F y T. Los vectores logicos aparecen como
resultado de evaluar condiciones. Por ejemplo:
x<-c(1:3,NA)
ind<-is.na(x)
0/0
Inf - Inf
Ciudades<-
c("Bogota","Medelln","Barranquilla","Pasto","Leticia")
NombreDelVector[vector.de.ndices]
new<-labs[-c(2,4,6,8)]
PostreFavo<-c(5,10,1,20)
names(PostreFavo)<-c("naranja","banano","manzana","pera")
postre<-PostreFavo[c("manzana","naranja")]
La principal ventaja de caso es que los nombres son mas faciles de recordar
que los ndices numericos. Esta opcion es util cuando se trabaja con la
estructura de hojas de datos (data frame)
Aunque los vectores son los tipos basicos de objetos en R existen muchos
otros, dentro de los cuales los mas usados son los siguientes: matrices,
factores, listas y hojas de datos.
Las listas (list) son una forma generalizada de vectores en las cuales los
elementos no tienen por que ser del mismo tipo y a menudo son otros
vectores o listas.
Hojas de datos (data frames) son estructuras similares a una matriz pero
cada columna puede ser de un tipo distinto. Las hojas de datos (como las
de Excel) son apropiadas para describir matrices de datos donde cada fila
representa a un individuo y cada columna una variable, que a su vez puede
ser numerica o categorica. Las hojas de datos pertenecen a la clase
data.frame, y pueden entenderse como matrices en las cuales las
columnas pueden tener diferentes modos y atributos. La seleccion sobre
hojas de datos, filas y columnas, se puede hacer con la misma estructura
de indexacion de matrices. Aunque las hojas de datos se pueden crean en R
usando la funcion data.frame() lo mas comun es leer este tipo de objetos
desde un archivo usando funciones como read.table() o read.csv() .
NombreObjeto<-read.table(ruta.archivo.txt", header=TRUE,
sep=, dec=",")
NombreObjeto<-read.csv(ruta.archivo.csv", header=TRUE,
sep=",", dec=",")
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 33 / 40
Graficas en R
Alto Nivel: crean un nuevo grafico con ejes, etiquetas, ttulos etc.
Bajo Nivel: Son funciones que anaden informacion a un grafico ya
existente, como por ejemplo anadir lneas o puntos adicionales
Interactivas: Son funciones que permiten interactuar con el grafico,
anadiendo o eliminando informacion con un dispositivo como el raton
del computador.
plot(x,y):
Si x y y son vectores de la misma longitud, plot(x,y) produce un
diagrama de dispersion de y sobre x.
plot(x):
Si x es una serie temporal, produce un grafico temporal, si x es un vector
numerico, produce un grafico de sus elementos sobre el ndice de los
elementos.
plot(f,y):
Si f es un factor, y y un vector numerico, se genera un diagrama de barras
de f.
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 35 / 40
Otras funciones graficas
pairs()
Cargaremos un conjunto de datos almacenado en R data(iris)
Usaremos la funcion pairs() para crear una matriz de diagramas de
dispersion para cuatro variables.
pairs( Sepal.Length + Sepal.Width + Petal.Length +
Petal.Width, data=iris)
coplot()
Para crear graficos condicionales, usando funciones del paquete base, se
emplea la funcion coplot.
coplot(Sepal.Width Sepal.Length | Species, data=iris)
hist()
Genera un histograma. Si prob= FALSE, el histograma representa las
frecuencias; si es TRUE, el grafico representa la densidad de probabilidad.
hist(iris[,2], prob=F, nclass=15, main=Ancho del sepalo)
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 36 / 40
Funciones de bajo nivel
points(x,y) o lines(x,y)
Anaden puntos (points(x,y)) o lneas (lines(x,y)) a un grafico ya
existente. Debe tenerse en cuenta que las coordenadas esten dentro de los
limites graficos de la grafica existente, en caso contrario deben modificarse
con los argumentos ylim y xlim en funcion de alto nivel.
text(x,y,labels)
Anade texto al grafico en las coordenadas x,y. El argumento etiquetas es
un vector de enteros o de caracteres que se dibujaran en las coordenadas
x[i], y[i]
locator(n,type)
Determinar las coordenadaa x, y sobre una grafica mediante un clic del
cursor.
Selecciones
Seleccione los registros (filas) que cumplan la siguiente caracterstica:
la vegetacion pertenezca a la categora Grassland.
Seleccione los registros (filas) que cumplan la siguiente caracterstica:
las localidades que no tienen humedad y que al mismo tiempo tienen
una densidad de lombrices mayor 3.
Selecciones y graficas
Seleccione las columnas Area, Slope, SoilpH y WormDensity y
guardelas en un nuevo objeto que se llame cuantitativas
Elabore un grafico de dispersion de las variable WormDensity sobre
SoilpH
Elabore un histograma con los conteos sobre 6 intervalos de la
variable Area