Vous êtes sur la page 1sur 40

Modelos probabilsticos y analisis estadstco

Introduccion al uso de R para analisis estadstico

Carlos Ricardo Bojaca


carlos.bojaca@utadeo.edu.co

Departamento de Ciencias Basicas y Modelado


Facultad de Ciencias Naturales e Ingeniera
Universidad de Bogota Jorge Tadeo Lozano
Modulo 6, piso 5

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 1 / 40
Tabla de contenidos

1 Introduccion

2 Funciones en R

3 Creacion de objetos

4 Construccion y manejo de vectores en R

5 Clases de objetos en R

6 Graficas en R

7 Ejercicios

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 2 / 40
Introduccion - Que y por que?

R es un lenguaje de programacion, basado en S, otro lenguaje de


programacion estadstico desarrollado por los laboratorios Bell (Bell Labs)
desde 1976. S fue desarrollado para apoyar proyectos de investigacion y
analizar datos de alta complejidad.

Actualmente, S ha evolucionado a S-Plus, que requiere la compra de la


licencia.

R, es una plataforma libre similar a S desarrollada por Robert Gentleman y


Ross Ihaka (U. de Auckland, NZ) durante la decada de los 90s. Desde
1997 se creo un equipo internacional de desarrolladores del nucleo de R.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 3 / 40
Introduccion- Que y por que?

Una de las principales ventajas que tiene R es que los usuarios pueden, de
manera facil, escribir sus propios codigos y personalizar las funciones.

La sintaxis usada por R es considerada por programadores de otros


lenguajes como extremadamente facil de aprender, incluso para usuarios
que no tienen experiencia programando.

Una vez que se logra entender y manipular las estructuras basicas de R,


este lenguaje se convierte en una herramienta poderosa para manipular y
analizar casi cualquier tipo de datos.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 4 / 40
Interfaz grafica de usuario : Rstudio

Se puede trabajar con varios ficheros de comandos de R


(libretos-scripts) simultaneamente, agrupados por pestanas (en la
ventana superior izquierda).
El editor de comandos esta pensado para programar en R.
Autocompletado de comandos. Si no recordamos la sintaxis exacta de
un comando de R, basta con escribir las primeras letras, pulsar la tecla
Tab, y RStudio despliega informacion sobre ese comando. Funciona
igual para las variables, ficheros y demas objetos que se hayan creado.
Gestion de los graficos de R mucho mas eficaz.
Mayor facilidad para instalar paquetes, consultar ayudas, etcetera.
Cuando se tienen varias versiones de R instaladas, es facil seleccionar
la que utilizara en cada sesion.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 5 / 40
Paginas web recomendadas

Sitio oficial de R

Sitio oficial de RStudio

Introduccion a R (espanol)

Wiki para R

Blog de R

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 6 / 40
Lenguaje de programacion orientada a objetos

Objeto: Es toda variable, conjunto de datos, funciones*, resultados y


otros, que se guardan en la memoria activa del computador y que tienen
asignado un nombre. Los usuarios manipulan los objetos con operadores
(aritmeticos, logicos y comparativos) o a traves de funciones*.

Objeto:
Nombre <- datos de la variable o informacion almacenada

*Las funciones son un tipo especial de objetos disenados para llevar a cabo
operaciones. Las funciones emplean argumentos, con base en los cuales se
genera un resultado despues de ejecutar una o un conjunto de operaciones.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 7 / 40
Funciones en R

En R, las funciones realizan un procedimiento en especfico con base en


unos argumentos, los cuales estan, generalmente, definidos por defecto
pero pueden ser modificados a traves de las opciones disponibles.

En R las funciones son creadas por la funcion: function(), y son


almacenadas como objetos en R. En R las funciones tienen la siguiente
estructura general:

F <- function(argumento 1, argumento 2, ....)


{comandos}

donde F es la designacion que se le da a la funcion; function() es la


instruccion que le indica a R que se esta creando una nueva funcion;
argumento 1 , argumento 2, son las entradas que se emplearan para
realizar los procedimientos, y comandos son los procedimientos especficos
que desarrolla R con base en los argumentos definidos.
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 8 / 40
Ejemplo de una funcion

raizenesima<-function(x, n=2) {
if ((round(n)==n)==FALSE)
stop("n debe ser entero")
res<-x**(1/n)
return(res)
}

raizenesima(4)
raizenesima(9,1.5)

Que operacion realiza la funcion?


Argumentos
Estan separados por coma (,) y tienen nombres. En este caso uno de los
argumentos tienen asignados valores por defecto.
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 9 / 40
Caractersticas de las funciones en R

En R las funciones son un objeto de primera clase, lo cual significa que


pueden ser usandas sin restricciones y como cualquier otro objeto. En la
practica esto trae como consecuencia que:

Una funcion pueda ser pasada como argumento a otra funcion.


Las funciones tienen argumentos con nombres especficos que pueden
tener valores por defecto.
Para usar algunas funciones no es necesario especificar valores para
todos los argumentos.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 10 / 40
Caractersticas de las funciones en R

La funcion formals() devuelve una lista de todos los argumentos formales


de la funcion. Los argumentos formales son los argumentos incluidos en la
definicion de la funcion. Los argumentos de una funcion en R pueden ser
organizados por posicion o por nombre. A manera de ejemplo se muestran
diferentes maneras de aplicar la funcion sd() que son equivalentes:

Funcion sd - Desviacion estandar


mydata <- rnorm(100)
sd(mydata)
sd(x=mydata)
sd(x=mydata, na.rm=FALSE)
sd(na.rm=FALSE, x=mydata)

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 11 / 40
Caractersticas de las funciones en R

A pesar de que cualquiera de las maneras presentadas es correcta, no es


recomendable alterar demasiado el orden de los argumentos debido a que
se puede generar confusion.

El uso de los nombres de los argumentos es util cuando se emplean


funciones que tienen un gran numero de argumentos, pero solo se desea
modificar unos pocos y los demas se quieren dejar con los valores por
defecto. Ademas, los argumentos con nombres facilitan el trabajo en R
debido a que es mas facil recordar el nombre del argumento que la posicion
en la cual se encuentra.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 12 / 40
Asignar nombre y elementos a un nuevo objeto en R
Asignacion de nombres
Debe iniciar con un letra mayuscula o minuscula de A a Z.
Puede contener dgitos y para fijar periodos, se suele usar el punto (.).
Ejemplo: Enero.2004, Monitoreo.1, etc.
R distingue minusculas de mayusculas en nombres de objetos
(incluidas las funciones) y nombres de argumentos, por ejemplo:
mydata y MyData no son objetos iguales.

Asignacion de elementos
Asignar elementos a un objeto: Posterior al nombre del objeto se usan
los smbolos <- (< menor que y - guion, unidos) para indicar que
elementos se asignaran a ese objeto, as: x<-1:4
La asignacion de elementos a un objeto tambien se puede realizar con
la funcion assign (). as:
assign("nombre del objeto", elementos)
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 13 / 40
Definicion de un vector en R

R utiliza distintas estructuras de datos. La estructura mas simple es el


vector, entendida como una coleccion ordenada de numeros. La funcion c,
que es la abreviatura de concatenar se puede utilizar para crear vectores.
Por ejemplo, se desea crear el objeto x, que sera un vector que contendra
los siguientes numeros: 10.4, 5.6, 3.1, 6.4 y 21.7. El codigo sera:

x <- c(10.4, 5.6, 3.1, 6.4, 21.7)

En R a un solo numero se le considera un vector de longitud uno.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 14 / 40
Aritmetica vectorial

Sobre los vectores se pueden ejecutar operaciones aritmeticas, las cuales se


realizaran elemento a elemento. Si dos vectores involucrados en una misma
operacion no tienen la misma longitud (numero de elementos) el resultado
se obtendra reciclando los valores del mas corto tantas veces como sea
necesario hasta que coincida con el mas largo. En este caso R advertira
mediante un mensaje que la longitud de los vectores no es la misma.
x<-c(1,3,5,6,8,10,12)
y<-c(5,6,7)
x+y

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 15 / 40
Aritmetica vectorial

Cuadro: Operadores aritmeticos en R


Operador Descripcion
+ Adicion
- Sustraccion
* Multiplicacion
/ Division
** o Exponencial
%/ % Resultado entero en una division

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 16 / 40
Aritmetica vectorial

Cuadro: Operadores logicos en R


Operador Descripcion
< Menor a
<= Menor o igual a
> Mayor a
>= Mayor o igual a
== Exactamente igual a
! Negacion
x|y x o y, union (disyuncion)
x&y x y y, interseccion (conjuncion)
isTRUE(x) Probar si x es verdadero

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 17 / 40
Aritmetica vectorial

Cuadro: Algunas funciones comunmente empleadas en R


Operador Descripcion
log() Logaritmo natural
exp() Valor exponencial, e x
sin() Seno
cos() Coseno
tan() Tangente
sqrt() Raz cuadrada
max() Valor maximo
min() Valor mnimo
range() Rango
length() Numero de elementos
sum() Sumatoria de los elementos
prod() Productoria de los elementos

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 18 / 40
Generacion de sucesiones

En R existen varias funciones para generar sucesiones numericas. El


operador mas basico es : (dos puntos), el cual genera una sucesion de
numeros desde el primer numero hasta el valor del segundo numero,
haciendo saltos de una (1) unidad. Si el primer numero es mayor que el
segundo, la sucesion generada tendra orden descendente.
x<-1:5
y<-100:90

Para crear sucesiones mas complejas se emplea la funcion seq(), en la cual


los dos primeros argumentos corresponden al comienzo y el final de la
sucesion, si la funcion se ejecuta con solo estos dos argumentos el
resultado sera identico al que se obtendra usando el operador :
x<-seq(1,5)
y<-seq(100,90)

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 19 / 40
Generacion de sucesiones

En la funcion seq() los argumentos son: from= que corresponde al


valor inicial de la sucesion, to= que corresponde al valor final, by= que
especifica el paso o salto de la sucesion, length.out= que determina la
longitud que tendra la sucesion; la ultima es along.with= que
corresponde a un vector, se emplea como unico argumento y crea una
sucesion 1, 2, ..., length(vector).

x<-seq(0,1.5,0.2)
r<-c(8,9,3,10,12,0,37,48,50)
y<-seq(min(r),max(r),(max(r)-min(r))/100)
z<-seq(along.with=r)

Una funcion relacionada con el uso de seq() es rep(), la cual sirve para
duplicar objetos o elementos.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 20 / 40
Vectores logicos

R tambien maneja vectores logicos, los cuales solo pueden tomar uno de
dos valores: FALSE (falso) o TRUE (verdadero), estos valores tambien se
representan por las letras F y T. Los vectores logicos aparecen como
resultado de evaluar condiciones. Por ejemplo:

x<-c(10.4, 5.6, 3.1, 6.4, 21.7)


temp <- x > 13

R almacenara en un objeto llamado temp un vector de la misma longitud


de x, cuyos valores seran: T o F , dependiendo de si los elementos de x
cumplen o no la condicion de ser mayores que 13, as:

[1] FALSE FALSE FALSE FALSE TRUE

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 21 / 40
Valores faltantes

Algunas veces en un vector aparecen elementos con valores que no son


conocidos, en estos casos se les denomina valor faltante y se les asigna un
valor especial, NA (Not Available). Cuando se opera un vector que contiene
elementos con valores faltantes, en general, el resultado sera NA. Esto se
debe a que al no poder especificar de manera completa la operacion el
resultado no puede ser conocido. Para verificar si algun elemento del vector
contiene valores faltantes se emplea la funcion is.na(), la cual evalua si
los elementos que componen el vector corresponden a datos faltantes o no.

x<-c(1:3,NA)
ind<-is.na(x)

Tenga en cuenta que la expresion logica x == NA es distinta de la funcion


is.na(x), debido a que NA no es un valor, sino un indicador de que un
elemento no esta disponible.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 22 / 40
Valores faltantes

En R tambien existe otra clase de datos faltantes que surgen como


consecuencia de algunas operaciones y que son llamados NaN (Not a
Number). Ejemplo operaciones cuyo resultado es un NaN:

0/0
Inf - Inf

La funcion, is.na() identifica tanto valores NA como NaN, si se desea


identificar unicamente los NaN se debe usar la funcion is.nan() que solo
toma el valor TRUE para valores NaN.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 23 / 40
Vectores de caracteres

Las cadenas de caracteres tambien pueden organizarse dentro de vectores


en R. Para crear los elementos dentro de un vector de caracteres, estos se
debe escribir entre comillas, por ejemplo: Altura ,Densidad
,Concentracion etc. Los elementos que componen un vector de caracteres
pueden conectarse usando la funcion c().

Ciudades<-
c("Bogota","Medelln","Barranquilla","Pasto","Leticia")

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 24 / 40
Seleccion y modificacion de vectores

En R se pueden seleccionar elementos de un vector (subvector), anadiendo


un vector de ndices entre corchetes cuadrados [ ]; con la siguiente
estructura general:

NombreDelVector[vector.de.ndices]

Los vectores de ndices usados para seleccionar elementos de un vector


puede ser de cuatro tipos: logico, numeros naturales positivos, numeros
naturales negativos o caracteres.

Un vector logico: Solo se seleccionaran los elementos que tengan valor


verdadero TRUE y se omitiran lo demas.
x<-c(1:3,NA)
y<-x[!is.na(x)]

Interprete la siguiente expresion:


z<-x[(!is.na(x)) & x>1]
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 25 / 40
Seleccion y modificacion de vectores

Un vector de numeros naturales positivos: En este caso los elementos


del vector de ndices deben pertenecer al conjunto
{1,2,....,length(x)}. El resultado es un vector formado por los
elementos del vector que corresponden a los ndices y en el orden en
que aparecen en el vector de ndices.

labs<-paste(c("x","z"), 1:10, sep=)


labs[c(2,4,6,8)]

Un vector de numeros naturales negativos: En este caso los elementos


del vector se excluyen.

new<-labs[-c(2,4,6,8)]

Almacena en el nuevo vector los elementos de labs excepto los que se


encuentran en las posiciones pares.
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 26 / 40
Seleccion y modificacion de vectores

Un vector de caracteres: Esta opcion solo puede realizarse si el vector


tiene asociado el atributo names para identificar a cada uno de los
elementos.

PostreFavo<-c(5,10,1,20)
names(PostreFavo)<-c("naranja","banano","manzana","pera")
postre<-PostreFavo[c("manzana","naranja")]

La principal ventaja de caso es que los nombres son mas faciles de recordar
que los ndices numericos. Esta opcion es util cuando se trabaja con la
estructura de hojas de datos (data frame)

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 27 / 40
Clases de objetos en R

Aunque los vectores son los tipos basicos de objetos en R existen muchos
otros, dentro de los cuales los mas usados son los siguientes: matrices,
factores, listas y hojas de datos.

Principales atributos de los objetos: Para conocer las principales


atributos de objeto se usan la funciones:
str ()
attributes()
mode()
length()
class()

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 28 / 40
Matrices

Las matrices o variables indexadas (matrix o array): son vectores


multidimensionales que estan indexados por dos o mas ndices que se
imprimen de modo especial. En R se emplean las funciones matrix() y
array() para crear matrices, asi:

x<-matrix(1:20, ncol=5, byrow=FALSE)


x<-array(1:20, dim=c(4,5))

En R se pueden seleccionar elementos de una matrix, anadiendo un


vectores de ndices entre corchetes cuadrados [ ] separando las
dimensiones con una coma ,.En matrices de dos dimensiones como las
creadas anteriormente la seleccion se definira siguiendo la siguiente
estructura.
x[vector.de.ndices.filas, vector.de.ndices.columnas]
Si un vector ndice es vaco, equivale a utilizar todo el rango de valores
para dicho ndice.
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 29 / 40
Operaciones con matrices

A continuacion se presentan algunas operaciones que pueden


realizarse con matrices en R
Crear las matrices mat8 y mat9
mat8 <- matrix(1:6, 2)
mat9 <- matrix(c(rep(1, 3), rep(2, 3)), 2, byrow = T)

Suma de dos matrices


mat9 + mat8

Suma de una matriz mas un vector de longitud 1 o constante


mat9 + 3

Resta de dos matrices


mat8 - mat9

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 30 / 40
Operaciones con matrices

Inversa de una matriz, aplicada sobre una seleccion


solve(mat8[, 2:3])

Transpuesta de una matriz


t(mat9)

Multiplicacion de dos matrices, se transpone la matriz mat9 para


que el numero de columnas de mat8 coincida con el numero de filas
de mat9
mat8 %* % t(mat9)

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 31 / 40
Factores y listas

Los factores (factor) sirven para representar datos categoricos.

data <- factor(c(1,2,2,3,1,2,3,3,1,2,3,3,1))


[1] 1 2 2 3 1 2 3 3 1 2 3 3 1
Levels: 1 2 3

Las listas (list) son una forma generalizada de vectores en las cuales los
elementos no tienen por que ser del mismo tipo y a menudo son otros
vectores o listas.

x <- list(1:10, rnorm(25), letters[1:3])

Note que la lista contiene tres elementos que corresponden a vectores de


diferente tipo y longitud. Ademas, observe que al igual que en los casos
anteriores se emplean funciones como argumentos dentro de otra funcion.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 32 / 40
Hojas de datos

Hojas de datos (data frames) son estructuras similares a una matriz pero
cada columna puede ser de un tipo distinto. Las hojas de datos (como las
de Excel) son apropiadas para describir matrices de datos donde cada fila
representa a un individuo y cada columna una variable, que a su vez puede
ser numerica o categorica. Las hojas de datos pertenecen a la clase
data.frame, y pueden entenderse como matrices en las cuales las
columnas pueden tener diferentes modos y atributos. La seleccion sobre
hojas de datos, filas y columnas, se puede hacer con la misma estructura
de indexacion de matrices. Aunque las hojas de datos se pueden crean en R
usando la funcion data.frame() lo mas comun es leer este tipo de objetos
desde un archivo usando funciones como read.table() o read.csv() .

NombreObjeto<-read.table(ruta.archivo.txt", header=TRUE,
sep=, dec=",")
NombreObjeto<-read.csv(ruta.archivo.csv", header=TRUE,
sep=",", dec=",")
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 33 / 40
Graficas en R

Una de las mayores virtudes de R es su versatilidad para la elaboracion de


graficas. Las funciones graficas en R se pueden dividir en tres grupos.

Alto Nivel: crean un nuevo grafico con ejes, etiquetas, ttulos etc.
Bajo Nivel: Son funciones que anaden informacion a un grafico ya
existente, como por ejemplo anadir lneas o puntos adicionales
Interactivas: Son funciones que permiten interactuar con el grafico,
anadiendo o eliminando informacion con un dispositivo como el raton
del computador.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 34 / 40
Funciones de alto nivel
La funcion plot(): Es la funcion generica, es decir, el tipo de grafico
producido es dependiente de la clase del primer argumento.

plot(x,y):
Si x y y son vectores de la misma longitud, plot(x,y) produce un
diagrama de dispersion de y sobre x.

plot(x):
Si x es una serie temporal, produce un grafico temporal, si x es un vector
numerico, produce un grafico de sus elementos sobre el ndice de los
elementos.

plot(f,y):
Si f es un factor, y y un vector numerico, se genera un diagrama de barras
de f.
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 35 / 40
Otras funciones graficas
pairs()
Cargaremos un conjunto de datos almacenado en R data(iris)
Usaremos la funcion pairs() para crear una matriz de diagramas de
dispersion para cuatro variables.
pairs( Sepal.Length + Sepal.Width + Petal.Length +
Petal.Width, data=iris)

coplot()
Para crear graficos condicionales, usando funciones del paquete base, se
emplea la funcion coplot.
coplot(Sepal.Width Sepal.Length | Species, data=iris)

hist()
Genera un histograma. Si prob= FALSE, el histograma representa las
frecuencias; si es TRUE, el grafico representa la densidad de probabilidad.
hist(iris[,2], prob=F, nclass=15, main=Ancho del sepalo)
Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co
Modelos probabilsticos
(UJTL) y analisis estadstco 36 / 40
Funciones de bajo nivel

points(x,y) o lines(x,y)
Anaden puntos (points(x,y)) o lneas (lines(x,y)) a un grafico ya
existente. Debe tenerse en cuenta que las coordenadas esten dentro de los
limites graficos de la grafica existente, en caso contrario deben modificarse
con los argumentos ylim y xlim en funcion de alto nivel.

text(x,y,labels)
Anade texto al grafico en las coordenadas x,y. El argumento etiquetas es
un vector de enteros o de caracteres que se dibujaran en las coordenadas
x[i], y[i]

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 37 / 40
Importar una hoja de datos

locator(n,type)
Determinar las coordenadaa x, y sobre una grafica mediante un clic del
cursor.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 38 / 40
Ejercicios

Importar hoja de datos


Importar a R la hoja de datos (DatosEjercicios) , use las funciones
read.table o read.csv segun corresponda. Para ver el encabezado de
los datos use la funcion head() usando como argumento el nombre del
objeto. Para ver toda la hoja de datos use la funcion View() usando
como argumento el nombre del objeto. Con las funciones head() y
View() puede verificar que la importacion se realizo correctamente.

Selecciones
Seleccione los registros (filas) que cumplan la siguiente caracterstica:
la vegetacion pertenezca a la categora Grassland.
Seleccione los registros (filas) que cumplan la siguiente caracterstica:
las localidades que no tienen humedad y que al mismo tiempo tienen
una densidad de lombrices mayor 3.

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 39 / 40
Ejercicios

Selecciones y graficas
Seleccione las columnas Area, Slope, SoilpH y WormDensity y
guardelas en un nuevo objeto que se llame cuantitativas
Elabore un grafico de dispersion de las variable WormDensity sobre
SoilpH
Elabore un histograma con los conteos sobre 6 intervalos de la
variable Area

Carlos Ricardo Bojacacarlos.bojaca@utadeo.edu.co


Modelos probabilsticos
(UJTL) y analisis estadstco 40 / 40

Vous aimerez peut-être aussi