Vous êtes sur la page 1sur 22

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Ministerio del Medio Ambiente


Curso de R

Sesión Nº 1: Introducción al uso del R, comandos básicos

1. Historia del R
R es una implementación libre, independiente, “open-source” del lenguaje de
programación S que actualmente es un producto comercial llamado S-PLUS
y es distribuido por Insightful Corporation.
El lenguaje S, fue escrito a mediados de los años 70 en Bell Labs (de AT&T
y actualmente Lucent Technologies).
Originalmente R fue un programa para el sistema operativo Unix. Sin
embargo, R ahora puede obtenerse también en versiones para Windows y
Macintosh y Linux.
A pesar de que hay diferencias menores entre R y S-PLUS (la mayoría en la
interfase gráfica), son esencialmente idénticos.
El proyecto R fue iniciado por Robert Gentleman y Ross Dhaka (de donde se
deriva “R”) del Statistics Department in the University of Auckland en Nueva
Zelanda en 1993.
En la actualidad, R es mantenido por un grupo internacional de
desarrolladores voluntarios: Core development team.
R forma parte de un proyecto colaborativo y abierto. Sus usuarios pueden
publicar paquetes que extienden su configuración básica. Existe un repositorio
oficial de paquetes cuyo número superó en otoño de 2009 la cifra de los 2000.
Dado el enorme número de nuevos paquetes, éstos se han organizado
en vistas (o temas), que permiten agruparlos según su naturaleza y función.
Por ejemplo, hay grupos de paquetes relacionados con estadística
bayesiana, econometría, series temporales, etc.

La página web del proyecto R es http://www.r-project.org. Este es el sitio


principal sobre información de R: documentación, FAQs (FAQ son las
iniciales de Frequently Asked Questions, o sea preguntas más frecuentes).
Para bajar el software directamente se puede visitar el Comprehensive R
Archive Network (CRAN) http://cran.us.r-project.org/

Tomado del curso de Análisis de Datos de la Dra. Diana M. KELMANSKY

1
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
2. Obtención e Instalación del programa R
Ingresar a la página http://www.r-project.org/ y seleccionar CRAN

Posteriormente aparecerá la siguiente pantalla de donde se debe seleccionar


un CRAN Mirrors o lugar donde se encuentra almacenado los instaladores
del programa. Por ejemplo aquí se eligió Brazil http://cran-r.c3sl.ufpr.br/ de
Universidade Federal do Parana.

Seleccionar el Sistema Operativo con el que se va a trabajar (Linux, Mac Os


X o Windows).

2
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Seleccionar el subdirectorio base

Seleccionar el ejecutable R-3.0.3-win32.exe

Le aparecerá una ventana para Ejecutar directamente la aplicación o


Cancelar la descarga la instalación.

3
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
3. Instalación del RStudio
Una vez que haya descargado e instalado R, puede descargar e
instalar RStudio.
RStudio es el entorno de desarrollo integrado para utilizar R. Está disponible
en código abierto y se ejecuta en el escritorio Windows, Mac y Linux) o en la
web con RStudio Server.
RStudio es software independiente que trabaja con R para hacerlo mucho
más fácil de usar y a la vez añade algunas características útiles.
Para poder instalar RStudio hay que ingresar a la dirección
https://www.rstudio.com/, con lo aparecerá la siguiente pantalla:

Luego, dar un clic en el botón Download now, aparecerá la siguiente ventana

Finalmente, dar un clic en el botón Download RStudio Desktop, con lo cual


aparecerá a siguiente ventana:

4
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R

Dar un clic en el enlace RStudio 0.98.501 Windows XP/Vista/7/8 para que se


inicie la descarga del programa.
Luego de que se haya descargado el programa, puede realizar la instalación.

RStudio está organizado en cuatro zonas de trabajo distintas, como se


aprecia en la siguiente figura:

 En la zona superior izquierda pueden abrirse y editarse ficheros con


código R (aunque también otros de otro tipo).
 En la zona inferior izquierda hay una consola de R en la que pueden
ejecutarse comandos de R.
 La zona superior derecha tiene dos pestañas:
o Workspace, donde aparece la lista de los objetos creados en
memoria.
o History, que contiene el histórico de las líneas de código
ejecutadas en R.

 La zona inferior derecha dispone de cuatro pestañas:

5
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
o Files, que da acceso al árbol de directorios y ficheros del disco
duro.
o Plots, donde aparecen los gráficos creados en la consola.
o Packages, que facilita la administración de los paquetes de R
instalados en la máquina.
o Help, en el que se abren las páginas de ayuda.

4. El entorno del software R


Al ingresar al R se encontrará con el ambiente de trabajo o entorno del R, el
cual se denomina consola.

4.1 La consola
Es el área donde el usuario debe escribir las instrucciones necesarias para
poder ejecutarlas. Para su ejecución solo se debe presionar la tecla enter
después de la instrucción Así mismo, en ella aparecen los resultados
obtenidos al ejecutar las instrucciones.
La línea de ordenes (prompt) esta identificada con el símbolo “>”.
La línea de resultados de operaciones básicas esta identificada con el
símbolo “ “.
Si la orden es demasiado grande, se puede presionar enter y el sistema le
indica con un “+” para continuar escribiendo. También si la orden no esta
terminada correctamente (por ejemplo le falta cerrar un paréntesis) en la línea
de ordenes aparecerá el símbolo “+”.
Los gráficos se presentan en otra ventana independiente.

4.2 Las Opciones de la Barra de Menú


A continuación se describirá los principales usos de la barra de menú:
 Archivo: Es utilizado para manejar archivos de comandos o de datos. Con
esta opción se puede crear un Nuevo Script, Abrir un Script existente,
Imprimir, Guardar un archivo, cambiar el directorio, Salir del programa, etc.
 Editar: Esta opción es usada para editar líneas de comandos creados en la
consola. Aquí se puede encontrar las opciones de: Copiar, Pegar,
Seleccionar todo, Limpiar la consola. También, permite hacer cambios en la
interface mediante la opción Preferencias de la interface gráfica.
 Visualizar: Para poder visualizar la barra de herramientas y barra de status.

 Misc: Usado principalmente para listar o remover objetos.

6
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
 Paquetes: Es la opción más importante de la barra de menú. Permite cargar,
instalar o actualizar un paquete externo a la base existente para que puede
ser utilizado.
 Windows: Usado para manejar las ventanas activas.
 Ayuda: Es la ayuda del programa.

Por ejemplo la opción Paquetes es la siguiente:

4.3 Las Opciones de la Barra de Herramientas


La Barra de Herramientas, presenta opciones que se encuentran dentro de
la Barra de Menú

Abrir un Script previamente almacenado.


Permite cargar un área de trabajo.
Guarda un área de trabajo.
Permite copiar líneas de comandos.
Permite pegar líneas de comandos.
Permite copiar y pegar líneas de comandos.
Detiene la ejecución de una línea de comando.
Imprime un script o resultados.

Limpiar la consola
Se puede hacer de tres manera diferentes:
 Usar la opción de la Barra de Menú
Editar / Limpiar consola.
 Click con el botón derecho del mouse elegir limpiar pantalla.
 Presione las teclas ctrl y “L” simultáneamente.

Cargar paquetes
R permite cargar paquetes que ya se encuentran instalados; para poder
realizar esta acción se puede hacer uso de la opción de la Barra de Menú
Paquetes / Cargar paquetes, con lo cual aparecerá una ventana donde se
podrá visualizar todos los paquetes que ya se encuentran instalados
(ordenados alfabéticamente). Se debe elegir el paquete que se debe utilizar
y dar un clic en el botón Ok.
Otra forma de cargar un paquete es usar el comando library
library(nombre del paquete).

7
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R

Instalar paquetes
R permite instalar paquetes nuevos y adicionarlos a los que ya se encuentran
instalados; para poder realizar esta acción se puede hacer uso de la opción
de la Barra de Menú
Paquetes / Instalar paquete(s)

Aparecerá una ventana donde se debe elegir el país considerado como


repositorio y dar clic en el botón Ok.

8
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R

Finalmente, aparecerá una ventana donde se observará el listado (ordenado


alfabéticamente) con todos los nombres de los paquetes que se pueden
instalar. Se debe elegir el nombre del paquete deseado y dar clic en el botón
Ok, con lo cual se dará inicio a la instalación.

Vale la pena mencionar que para instalar algunos paquetes se puede


necesitar la instalación adicionalmente otros paquetes. Esto debido a que
para la elaboración de un paquete se pueden utilizar funciones desarrolladas
en otros paquetes.
Para instalar un paquete también se puede hacer uso de la función
install.packages("nombre del paquete").
Una vez instalado el paquete, este no queda para el uso directo, debe ser
cargado mediante cualquiera de las opciones vistas anteriormente.

Ayuda en R
Para pedir ayuda sobre el uso de las funciones en R se puede utilizar una de
las siguientes dos opciones: ?nombre de función y help(nombre de función).
Por ejemplo
?print
help(sqrt)
Para pedir ayuda sobre el contenido de un paquete se puede usar:
help(package=foreign)

Salida del programa.


Para salir del programa, utilice la opción Archivo / Salir o escriba en la línea
de comandos q() y presione la tecla Enter.

9
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R

5. Tipos de estructura de datos


Existen 5 tipos de estructura de datos básicos: data frames, matrices,
vectores, listas y funciones.
 Data frame: Permite almacenar datos bidimensionales. Aquí todas las
columnas deben tener la misma longitud.
 Matrices: Son similares a las data frames, salvo que sus elementos deben
tener datos con el mismo modo (carácter, numérico, lógico). Las filas y las
columnas pueden tener nombres.
 Vectores: Es un conjunto ordenado de elementos que tienen el mismo
modo. Los elementos de un vector pueden tener nombres.
 Listas: Son colecciones de otros objetos. Sus componentes pueden ser
data frames, matrices, vectores u otras listas.
 Funciones: Existen gran cantidad de funciones incorporadas al R.
También es posible agregar funciones definidas por el usuario.

6. Manejo de datos
6.1 Asignaciones de objetos
Hay varios operadores con los que es posible realizar asignaciones a objetos,
estos son: "<-" signo menor seguido del signo menos (sin espacios), “->”signo
menos seguido del signo mayor y por el signo igual “=”.
Ejemplos
Asignar la suma de 3+5 al objeto A
A = 3+5
A
[1] 8

Asignar la suma de 3+5 al objeto B


B<-3+5
B
[1] 8

Asignar la suma de 3+5 al objeto C


3+5->C
C
[1] 8
Asigne el objeto A + B al objeto D
D = A + B

6.2 Tipos de objetos


Lógicos: Pueden tomar valores T, F, TRUE o FALSE.
Carácter: Es una cadena alfanumérica, se ingresan entre comillas.
Numeric: Es un número real.
Complex: Es un número complejo de la forma a+bi

6.3 Prueba y coerción de tipos de objetos:


Comprobación: is.numeric( ), is.complex( ), is.logical( ), is.character( )
Coercion: as.numeric( ), as.complex( ), as.logical( ), as.character( )

10
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Ejemplos:
text=as.character(num1)
text
[1] "2.345"
is.character(text)
[1] TRUE

6.4 Creación de Datos


Existen diferentes formas para crear datos, nos centraremos en la creación
de vectores, matrices y dataframes.
Vectores
Se puede usar la función c() la cual permite crear un objeto de varios
elementos separados por comas.
Ejemplos:
 Crear el vector de edades de cinco personas:
edad = c(18, 21, 26, 19, 30)
 Crear el vector precio de seis productos
precio <- c(11.4, 12.3, 8.6, 19, 30, 11)
 Crear el vector temperatura de siete días
c(13.5, 15.4, 16, 19.2, 13, 14.2, 14.5)->temperatura
 Crear el vector del color de preferencia de cinco personas:
color = c("azul", "rojo", "rojo", "verde", "azul")
 Crear el vector día de compra en un supermercado de cinco personas:
dia<-c("lunes", "domingo", "sábado", "domingo","lunes")
 Crear el vector raza de ganado vacuno:
c("B.S.", "Hol.", "Hol.", "Hol", "B.S.")->raza

Se puede colocar nombre a los elementos de un vector con la función names


Ejemplo:
Sea el vector x=c(19,23,12), asigne los nombres: abogados, doctores,
profesores.
x=c(19,23,12)
names(x)=c("abogados", "doctores", "profesores")
x
abogados doctores profesores
19 23 12

Matrices
Las matrices se crean con la función matrix
matrix(data, nrow, ncol, byrow)
data: Es un vector de datos.
nrow: Número de filas que tiene la matriz.
ncol: Número de columnas que tiene la matriz.
byrow: FALSE, la matriz es llenada por columnas; TRUE la matriz es llenada por
filas.
Una forma práctica de crear una matriz es indicar su dimensión e iniciándola
con ceros para después digitar en un formato de celdas, los valores de sus
filas y columnas mediante el comando fix.

Ejemplo:

11
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Crear la matriz datos1 que contenga los siguientes datos de pesos, estaturas
y edad de 4 personas:
 64.3 1.67 28
72.0 1.70 32 
datos   
56.9 1.62 26 
 
87.3 1.72 34 
datos1=matrix(0,4,2)
fix(datos)

Nota: Para poder visualizar los vectores o matrices se debe digitar el nombre
del objeto o print(nombre del objeto)

Dataframes
Los componentes de este tipo de datos son vectores (numéricos, caracteres, o
lógicos), factores, matrices numéricas o otros data.frames.
Los vectores deben de tener la misma longitud.
Se define con la función data.frame( )
Ejemplo
dataframe1=
data.frame(nombres=c("Clase1","Clase2","Clase3"),v1=c(3,
4,6),v2=c(3,4,1))

dataframe1
nombres v1 v2
1 Clase1 3 3
2 Clase2 4 4
3 Clase3 6 1

Cuando hay datos que no son numéricos, el data.frame los considera como
factores tomando como niveles la cantidad de valores diferentes que hay.
str(dataframe1)
'data.frame': 3 obs. of 3 variables:
$ nombres: Factor w/ 3 levels "Clase1","Clase2",..: 1 2 3
$ v1 : num 3 4 6
$ v2 : num 3 4 1

6.5 Importar Datos


En muchas situaciones los conjuntos de datos se encuentran almacenados
en otros programas como: Excel, SPSS o Minitab. Cuando se tienen datos
almacenados en esos programas y se quiere utilizar el R para procesarlos se
debe cargar previamente el paquete: foreign.
Una forma de utilizar los datos almacenados en otros programas es pegando
dicha información a un block de notas y abrirla mediante el siguiente
comando:
datos = read.table(file.choose(),header=T)

12
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
La opción header=T es un valor lógico que se utiliza siempre y cuando las
variables (columnas) presenten etiquetas. Caso contrario se debe usar
header=F)

Otra forma práctica de obtener los datos almacenados en otros programas es


de realizando los siguientes pasos:
a) Abrir el archivo de datos que se desea utilizar.
b) Copiar las columnas y filas que se desean leer.
c) En la consola de R digitar la función:
read.delim("clipboard")
La función read.delim considera por defecto a la primera fila como las
etiquetas o encabezados.

6.6 Listar Objetos Creados


Se puede realizar mediante la opción de la Barra de Menú
Misc / Listar objetos
O también se puede hacer mediante los comandos:
ls()
objects()

Para listar objetos que contienen un determinado carácter, usar la opción


pattern,
ls(pattern="carácter") , donde carácter es el carácter en particular que se
busca en los objetos.
Ejemplo:
ls(pattern="d")

Para mostrar los objetos que empiezan con un determinado carácter, usar
ls(pattern="^caracter")
Ejemplo:
ls(pattern="^d")

6.7 Eliminar Objetos


Si se quiere eliminar un objeto se puede digitar:
rm(nombre del objeto)
Si se quiere eliminar todos los objetos se puede digitar:
rm(list=ls())
rm(list=objects())
O también se puede hacer uso de la opción de la Barra de Menú
Misc / Remover todos los objetos

6.8 Listar atributos de un objeto


Al utilizar una función y almacenar estos resultados en un objeto, este objeto
puede contener varios elementos, mediante la función attributes, se puede
listar a todos estos elementos
Ejemplo
a=lm(women[,2]~women[,1])
attributes(a)

13
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
6.9 Operaciones con Objetos
a) Operadores Aritméticos
Las operaciones + (suma), - (diferencia), * (producto), / (cociente) realizadas
en vectores y/o matrices se realizan término a término. Por ejemplo
 Restar los vectores fila1 y fila 2, guardarlos en el objeto resul1
resul1=fila1-fila2
[1] -7.70 -0.03 -4.00

 Sumar la matriz datos2 y datos3 y al resultado multiplicarla por 4,


guardarlos en el objeto resul2
resul2=4*(datos2+datos3)
col1 col2 col3
[1,] 514.4 13.36 224
[2,] 576.0 13.60 256
[3,] 455.2 12.96 208
[4,] 698.4 13.76 272

 Dividir los vectores col3 y col2, , guardarlos en el objeto resul3


resul3=col3/col2
[1] 16.76647 18.82353 16.04938 19.76744

 Multiplicar la matriz datos1 y datos3 dividir el resultado entre 2, guardarlos


en el objeto resul4
resul4=(datos1*datos3)/2

col1 col2 col3


[1,] 2067.245 1.39445 392
[2,] 2592.000 1.44500 512
[3,] 1618.805 1.31220 338
[4,] 3810.645 1.47920 578

Nota: Este último resultado no es el producto usual de matrices que se ve en


un curso de álgebra.

Otros operadores matemáticos


 %% Indica x módulo de y
 %/% Indica la división entera.
 x^y: Indica x elevado a la y.

Ejemplos
15%/%3
[1] 5

15%%2
[1] 1
Nota: Si desea hacer una consulta sobre estos operadores puede digitar
help(Arithmetic) o ? Arithmetic

14
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Algunas funciones matemáticas
 abs(nombre del objeto): Permite obtener el valor absoluto de los
elementos que componen un objeto.
 sqrt(x): Permite obtener la raíz cuadrada de los elementos que componen
un objeto.
 exp(x): Calcula ex de los elementos que componen un objeto.
 log(x): Calcula ln(x) de los elementos que componen un objeto.
 log10(x): Calcula log(x) de los elementos que componen un objeto.
 log2(x): Calcula log2(x) de los elementos que componen un objeto.
 log(x,b): Calcula logb(x) de los elementos que componen un objeto.
 factorial(k): Permite obtener el factorial de los elementos que componen
un objeto.
 choose(n,k): Permite obtener la combinación de n y k.

Ejemplos:
 Sea el vector x = c(1,2,3,4,5), obtenga el vector módulo de dividir x
entre 2, guárdelo en el objeto resul5
x = c(1,2,3,4,5)
resul5=x%%2
resul5
[1] 1 0 1 0 1

 Sea el vector y = c(3,4,5,6,7,8,9,10), obtenga el vector de


cocientes dividir y entre 2, guardarlos en el objeto resul6
resul6=y%/%2

 Sea el vector z=c(2,4,6,8,10) eleve al cubo los elementos de dicho vector,


guardarlos en el objeto resul7.
z=c(2,4,6,8,10)
resul7= z^3
resul7
[1] 8 64 216 512 1000

 Sea el vector w=c(1,2,3), obtenga ew y guárdelos en el objeto resul8


w=c(1,2,3)
exp(w)
[1] 2.718282 7.389056 20.085537

 Sea el vector x=c(4,8,16), obtenga log2(x)


x=c(4,8,16)
log2(x)
[1] 2 3 4

 Calcule el factorial de x
factorial(x)
[1] 2.400000e+01 4.032000e+04 2.092279e+13

15
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Funciones de redondeo de números:
 ceiling(x): al entero más cercano no menor que el elemento
 floor(x) : el entero más cercano no mayor que el elemento
 round(x,digitos): tiene dos argumentos, el primero es el número que se
quiere redondear y el segundo argumento es el número de decimales.
 trunc: al entero más cercano entre el elemento y cero.

Ejemplos:
num1=2.345
floor(num1)
[1] 2
ceiling(num1)
[1] 3
trunc(num1)
[1] 2
round(num1,2)
[1] 2.35

b) Operadores Lógicos
Sirven para realizar comparaciones y expresiones lógicas. Algunos
operadores lógicos son:
 ! x , es la negación de x
 x & y, es la intersección, operador lógico y. T y T da T, otro par de
comparaciones da F.
 x | y, es la unión, operador lógico o. F y F da F, otro par de comparaciones
da T.

c) Operadores Relacionales
Al igual que los operadores lógicos sirven para realizar comparaciones y
expresiones lógicas. Algunos operadores relacionales son:
 > (mayor que)
 < (menor que)
 >= (mayor igual)
 <= (menor igual)
 == (igual)
 != (diferente).
Los resultados son verdadero (TRUE) o falso (FALSE).

Ejemplos:
Sean los vectores v1=c(5,3,9) y v2=c(3,1,10), guardarlos en el objeto resul8
 Indique que elementos de v1 son diferentes a 3
resul8=v1!=3
[1] TRUE FALSE TRUE

 Comparar si los elementos del vector v1 son superiores a los del vector v2,
guardarlos en el objeto resul9
resul9=v1>v2
[1] TRUE TRUE FALSE

16
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
 Compare que elementos de resul8 y resul9 para obtener el vector resul10
que indique como verdadero los elementos en ambos vectores.
resul10=resul8&resul9
[1] TRUE FALSE FALSE

d) Operaciones con matrices


Algunos operadores para matrices son los siguientes:
 %*%: Multiplicación de matrices
 t(nombre de la matriz): Transpuesta de la matriz.
 solve(nombre de la matriz): Para calcular la inversa de una matriz.
 det(nombre de la matriz): Para calcular el determinante de una matriz.
 diag(nombre de la matriz): Para capturar la diagonal de una matriz.

Ejemplo
 Multiplicar la matriz datos1 por la transpuesta de la matriz datos3, dividir
el resultado entre 2, guardarlos en el objeto resul9. Compare el resultado
con resul4
resul9=(datos1%*%t(datos3))/2

[1,] 2460.639 2764.219 2194.688 3284.131


[2,] 2764.219 3105.445 2465.777 3688.262
[3,] 2194.688 2465.777 1958.117 2927.078
[4,] 3284.131 3688.262 2927.078 4390.124

Ejemplos:
Sea m1 una matriz de dimensiones 3x3
12 6 10 
m1   4 4 9 
10 5 9 
Calcule la inversa de la matriz m1, guárdelo en resul10
resul10=solve(m1)
[,1] [,2] [,3]
col1 -0.5625 -2.500000e-01 0.875
col2 3.3750 5.000000e-01 -4.250
col3 -1.2500 -3.330669e-16 1.500

Sume los elementos de la diagonal de la matriz m1, guárdelo en resul11


resul11=sum(diag(m1))

Halle el determinante de la matriz m1


det(m1)

6.10 Extracción de datos


En algunos casos se quiere extraer un subconjunto específico de datos de un
conjunto de datos completo. Si se tiene un vector o una matriz, algunos
comandos que pueden ayudar a realizar la extracción de algunos elementos
se presentan a continuación:

17
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Vectores
Sea el vector x=seq(0,n), donde n=10
x[n]: Presenta la n-ésima observación.
x[-n]: Presenta las observaciones menos la n-ésima observación.
x[1:n]: Presenta las primeras n-observaciones.
x[-(1:n)]: Presenta los elementos a partir de la observación n+1.
x[c(3,7,9)]: Presenta las observaciones de ubicación 3, 7 y 9.
x[x>4]: Presenta las observaciones mayores a 4.
x[x>3&x<5]: Presenta las observaciones mayores a 3 y menores a 5.
x[x>3|x<5]: Presenta las observaciones mayores a 3 o menores a 5.
x[x%%2==0]: Presenta las observaciones cuyo módulo (entre 2) es igual a
cero.

Matrices
x[i,j] Selecciona el elemento de la i-ésima fila y la j-ésima columna.
x[i,]: Selecciona los elementos de la i-ésima fila.
x[,j]: Selecciona los elementos de la j-ésima columna.
x[,c(1,3)]: Selecciona las columnas una y tres.
x[c(1,3),]: Selecciona las filas una y tres.

7. Algunas funciones básicas


 data(): Lista los conjuntos de datos que se encuentran en memoria y que
pueden ser utilizados.

 names(nombre del conjunto de datos): Lista el nombre de las variables


que conforman un conjunto de datos.

 attach(nombre del conjunto de datos): Permite el acceso a cada una de


las variables del conjunto de datos. Después de usar esta función se
puede utilizar los nombres de las variables con los corchetes [] para
indicar que datos se desean utilizar.
Ejemplo:
attach(rock)
perm[1:10]

 str(nombre del objeto): Para vizualizar la estructura de un objeto.


Ejemplo:
str(fila1)

 rep(valor, cierto número de veces): Repite un valor o vector, cierto número


de veces.
Ejemplo:
rep(0,10)
rep(c(1,3),5)

 seq(mínimo valor, máximo valor, por): Genera una secuencia de números.


Ejemplo:
seq(2:16)

 length(nombre del vector): Determina la longitud del vector.

18
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Ejemplo:
length(col2)

 dim(nombre de la matriz): Determina las dimensiones de una matriz.


Ejemplo:
dim(datos1)

 table(vector X, vector Y): Genera tablas de frecuencia y de contingencia.


Ejemplo:
table(color,dia)

 sort(nombre del vector): Ordena los elementos de un vector.


Ejemplo:
sort(col3)

 nrow(nombre de objeto): Determina el número de filas.


Ejemplo:
nrow(datos2)

 ncol (nombre de objeto): Determina el número de columnas.


Ejemplo:
ncol(datos2)

 which.max( nombre del vector): Retorna la ubicación de el elemento mas


grande.
Ejemplo:
which.max(fila3)

 which.min( nombre del vector): Retorna la ubicación de el elemento mas


pequeño.
Ejemplo:
which.min(fila1)

 sqrt(nombre del objeto): Permite obtener la raíz cuadrada de un objeto.


Ejemplo
sqrt(fila1)

 by(nombre del vector, índices, función): Permite calcular algunas medidas


de diferentes grupos.
Ejemplo
by(CO2[,5], CO2[,2], min)

 cbind(objeto1, objeto2,….): Permite unir vectores o matrices por columnas


que deben ser de igual longitud o igual dimensión.
Ejemplo
a=seq(1,5)
b=seq(6,10)
cbind(a,b)

19
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
 rbind(objeto1, objeto2,….): Permite unir vectores o matrices por filas, que
deben ser de igual longitud o igual dimensión.
Ejemplo
rbind(a,b)

 rank(objeto1): Permite obtener los rangos de un vector de datos.


Ejemplo
x1 <- c(3, 1, 4, 15, 92)
rank(x1)

 sample(objeto,n,replace): Permite seleccionar una muestra de tamaño n


de un vector de datos. Esta muestra puede ser con reemplazo o sin
reemplazo.
Ejemplo
sample(x1,2,F)
sample(x1,2,T)

 apply(matriz, fila(1) o columna(2), función): Permite obtener el resultado


de una función aplicada a una matriz por fila o columna.
apply(rock1,1,sum)
apply(rock1,2,sum)

8. Algunas observaciones importantes


 El nombre de los objetos, así como los nombres de las funciones en R
son muy sensibles a mayúsculas y minúsculas.
Por ejemplo:
La función “sqrt” existe pero “Sqrt” no.
Si se crea el objeto casa es diferente a crear el objeto CASA.
 El símbolo # sirve para realizar comentarios y estos no serán ejecutados
en la línea de comandos.
 Los gráficos pueden ser exportados fácilmente a un editor de textos
mediante un copiado y pegado simple.
 Se utiliza el carácter “;” para separar comandos diferentes en la misma
línea de comando.
 Las funciones en R tiene algunos parámetros predeterminados los que
serán usados si es que no se especifica algún parámetro diferente.
Por ejemplo
seq(1,10)
[1] 1 2 3 4 5 6 7 8 9 10
seq(1,10,3)
[1] 1 4 7 10
 Las funciones en R tienen un orden predeterminado de sus parámetros
pero estos pueden modificarse si se antepone el nombre del parámetro.
Por ejemplo:
rep(0,10)
[1] 0 0 0 0 0 0 0 0 0 0
rep(times=10,x=0)
[1] 0 0 0 0 0 0 0 0 0 0

20
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
Ejercicios Propuestos

1. Instale el paquete aplpack, responda lo siguiente:


 ¿Para qué es útil este paquete?
 ¿Quién es el autor del paquete?
 ¿En qué versión se encuentra actualmente?
 ¿Cuál es la fecha de su última actualización?

x 
b a b
2. Verifique con un ejemplo si las siguientes operaciones xa y son
similares en R.

3. Presente la función, con sus argumentos, que permita obtener los siguientes
vectores:
 5 10 15 20 25 30 35 40 45 50 55 60
 -3 -4 -5 -6 -7 -8 -9 -10 –11
 -3 -1 1 3 5 7 9 11
 5 5 5 4 4 4 4 7 7 7 7 7
 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3 1 3
 El tercer vector repetido 10 veces.
 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5

4. En el conjunto de datos rock seleccionar:


 Todas las observaciones de la tercera y cuarta variable, guárdelos con el
nombre roca1
 Todas las observaciones de la tercera y cuarta variable pero de solo las
observaciones 10 a 20, guárdelos con el nombre de roca2
 Los datos correspondientes a la primera y tercera variable pero solo las
observaciones 25,28 y 32, guárdelos con el nombre de roca3.

5. Con el conjunto de datos CO2 elabore una tabla que cruce las variables Type
y Treatment pero solo de las primeras 40 observaciones.
¿Es posible extraer alguna frecuencia de la tabla? Si su respuesta es
afirmativa extraiga la frecuencia ubicada en la primera fila y segunda columna
de la tabla y guárdelo en el objeto frec12.

6. Con el conjunto de datos Orange


a) Obtenga la ubicación del valor máximo de la tercera variable.
b) Obtenga la ubicación del valor mínimo de los primeros 40 datos de la
segunda variable.
 3 1
1 2 3  
7. Sea la matriz A    y la matriz B   2 4 
 4 0 2   1 3 
 Halle C=AxB y el determinante de C
 Calcule la inversa y guárdelo en el objeto D.
 Guarde los elementos de la diagonal de la matriz D en el objeto E.
 Sume los elementos de la diagonal y guarde sus resultados en el objeto
F.

21
UNIVERSIDAD NACIONAL AGRARIA LA MOLINA
Ministerio del Medio Ambiente
Curso de R
8. Use las funciones adecuadas para presentar un vector conteniendo todos los
enteros del 1 al 100 que no son divisibles por 2 y 3 a la vez.

9. Si a Ud. le presentan las siguientes tablas de frecuencias:

Número de Número de Tipo de Número de


hijos por familias vivienda familias
familia Propia 55
0 15 Alquilada 20
1 30
2 18
3 12
Cree los vectores nhijos y tvivienda utilizando las funciones adecuadas y
luego una estos vectores en el objeto datos de tal manera que datos tenga
una estructura de dataframe.

 54.3 1.67 28


72.0 1.70 32 
10. Sea la matriz: m1   
56.9 1.62 26 
 
87.3 1.72 30 
Ordene los datos según la segunda columna y almacénelos en el objeto m2
Sugerencia: Utilice la función rank

11. La varianza muestral de un vector de datos se calcula de la siguiente manera:


 X 
n 2

i
X
S2  i 1

n1
Utilice las funciones necesarias para realizar el cálculo de la varianza de la
primera variable del conjunto de datos women, compare su resultado con el
de la función var.

12. En el Análisis de Regresión la forma de estimar los coeficientes del modelo


es mediante la fórmula
   X´X  X´Y
1

Donde:
X: Es la matriz de variables independientes incluyendo un vector de unos, es
decir:
1 x11 x12 x13 x1p 
1 x 21 x 22 x 23 x 2p 
 
X  1 x 31 x 32 x 33 x3 p 
 
 
1 x n1 xn 2 xn 3 xnp 
 
Y: Es el vector de la variable dependiente.
Utilice el conjunto de datos rock, considerando a la última variable (perm)
como variable dependiente y al resto de variables como independientes y
estime los coeficientes del modelo de regresión lineal múltiple.

22

Vous aimerez peut-être aussi