Vous êtes sur la page 1sur 42

DATA FAIR: “RSTUDIO”

MG.ING.ESTAD.VILLENA ZAPATA, LUIGI


Introducción
¿Qué es R?
• Es un software libre (GNU)
• Es gratis
• Herramientas estadísticas
¿Qué es R?
• Creadores
¿Qué es R?
• Capacidad gráfica
¿Qué es R?
• Contiene paquetes R gratis
https://cran.r-project.org/
Instalación
Instalación del Software R
• R es un software libre accesible desde la página web:
http://www.r-project.org/
Instalación de R Studio
• R Studio es un entorno de R que complementa R console. Se trata de
software libre que puede ser obtenido en la página oficial del
programa.
http://www.rstudio.com/rtudio/download/
Números y Operaciones
Aritméticas
Signos de operaciones aritméticas
Operación Signo
Suma +
Diferencia -
Producto *
División /
Potencia ^ o **
Operadores comparativos
Operador Signo
Menor que <
Mayor que >
Menor igual que <=
Igual a ==
Diferente de !=
Operadores Lógicos
Operador Signo
Y lógico &
O lógico |
Objetos en R
Todas las cosas que manipula R se llaman objetos. Los objetos más
simples se denomina atómicas y que son las siguientes:

character (cadena de caracteres)


numeric (números reales)
logical (lógicos o booleanos, que sólo toman los valores True o
False)
Variables simples
R studio no requiere ningún tipo de comando para declarar variables.
Sencillamente crea la variable mediante asignación directa de su valor,
utilizando uno de los tres operadores "<-", "->", "=" y nombrando la
variable.
Por ejemplo:
>v=3 #3 se asigna a v
>v
[1]3
Funciones objects(); ls()
Por defecto, R guarda todas las variable creadas en la sesión. Para
encontrar las variables de una sesión, use la función objects () o ls ().
Función rm()
Para eliminar una variable x, escriba:
>rm(x)
y para eliminar múltiples variables
>rm(var1,var2,var3)
Finalmente si se desea eliminar todas las variables:
rm(list=ls())
Variables Vectoriales
Vectores
Los vectores son objetos atómicos, es decir, son de un tipo único (
lógico, numérico, etc.), formados por un conjunto de valores llamados
componentes, coordenadas o elementos.

La primera manera de crear vectores es a partir de los elementos


individuales que compondrán el vector. Para esto se utiliza la función
c() como se muestra a continuación.
c(4,2,-8) # Creación de un vector sin asignarlo a una variable
[1] 4 2 -8
Variables Vectoriales
Para representar a un vector de n elementos se puede definir en R una
variable de la siguiente forma:
V=c(v1,v2,v3,…,vn)
Ejemplo
>vector1=c(1,4,9,2.25,1/4)
>vector1
[1]1.00 4.00 9.00 2.25 0.25
Data Frame
Data frame
Un marco o estructura de datos es la forma más natural de R de
presentar un conjunto de datos con una colección de observaciones
registradas para una o más variables. Al igual que las listas, los marcos
de datos no tienen restricciones sobre los tipos de datos de las
variables; puede almacenar datos numéricos, datos de factores, etc.
Data frame
El marco de datos R se puede considerar como una lista con algunas
reglas adicionales adjuntas. La distinción más importante es que en un
marco de datos (a diferencia de una lista), todos los miembros deben
ser vectores de la misma longitud. El marco de datos es una de las
herramientas más importantes y más utilizadas en R para el análisis de
datos estadísticos. Los marcos de datos son realmente un tipo especial
de lista o estructura.
Data frame
#Crea el siguiente data.frame con las siguientes variables:
misdatos
NOMBRES EDAD SEXO ESTRATO PESO ALTURA
1 Peter 42 Masculino Alto 85 1.70
2 Lois 40 Femenino Alto 78 1.82
3 Meg 17 Femenino Bajo 70 1.64
4 Chris 14 Masculino Medio 65 1.60
5 Stewie 1 Masculino Alto 10 1.00
6 Brian 7 Masculino Medio 35 1.20
Data frame
#Crea el siguiente data.frame con las siguientes variables:
NOMBRES=c("Peter","Lois","Meg","Chirs","Stewie","Brian")
EDAD=c(42,40,17,14,1,7)
SEXO=c("Masculino","Femenino","Femenino","Masculino","Masculino"
,"Masculino")
ESTRATO=c("Alto","Alto","Bajo","Medio","Alto","Medio")
PESO=c(85,78,70,65,10,35)
ALTURA=c(1.70,1.82,1.64,1.60,1.00,1.20)
Data frame
misdatos=data.frame(NOMBRES,EDAD,SEXO,ESTRATO,PESO,ALTURA)
misdatos
NOMBRES EDAD SEXO ESTRATO PESO ALTURA
1 Peter 42 Masculino Alto 85 1.70
2 Lois 40 Femenino Alto 78 1.82
3 Meg 17 Femenino Bajo 70 1.64
4 Chris 14 Masculino Medio 65 1.60
5 Stewie 1 Masculino Alto 10 1.00
6 Brian 7 Masculino Medio 35 1.20
Guadar un Data frame
#Para visualizar la ruta donde se alojará el data.frame:
getwd()
[1] "C:/Users/LENOVO/Desktop“
#Si queremos guardar el archivo en la unidad D:
setwd(“D:/”)
getwd()
[1] "D:/“
write.table(misdatos,"misdatos.csv")
datos=read.csv("D:/misdatos.csv",header=TRUE,sep="")
Guadar un Data frame
datos
NOMBRES EDAD SEXO ESTRATO PESO ALTURA
1 Peter 42 Masculino Alto 85 1.70
2 Lois 40 Femenino Alto 78 1.82
3 Meg 17 Femenino Bajo 70 1.64
4 Chris 14 Masculino Medio 65 1.60
5 Stewie 1 Masculino Alto 10 1.00
6 Brian 7 Masculino Medio 35 1.20
attach(A)
Habilita los elementos del data frame A, para que sean accesibles como vectores sin necesidad de utilizar el comando
A$elemento.
Habilitar los elementos del data frame misdatos, y calcula la media o promedio.
datos
NOMBRES EDAD SEXO ESTRATO PESO ALTURA
1 Peter 42 Masculino Alto 85 1.70
2 Lois 40 Femenino Alto 78 1.82
3 Meg 17 Femenino Bajo 70 1.64
4 Chris 14 Masculino Medio 65 1.60
5 Stewie 1 Masculino Alto 10 1.00
6 Brian 7 Masculino Medio 35 1.20
mean(EDAD)
[1] 20.16667
transform()
Reemplaza la edad en meses
> datos=transform(datos,EDADN=EDAD*2)
> datos
NOMBRES EDAD SEXO ESTRATO PESO ALTURA EDADN
1 Peter 42 Masculino Alto 85 1.70 84
2 Lois 40 Femenino Alto 78 1.82 80
3 Meg 17 Femenino Bajo 70 1.64 34
4 Chirs 14 Masculino Medio 65 1.60 28
5 Stewie 1 Masculino Alto 10 1.00 2
6 Brian 7 Masculino Medio 35 1.20 14
Funciones Estadísticas
Funciones Estadísticas
Función Descripción
range(A) Valores mínimo y máximo de los elementos del vector A.
range(A)=c(min(A),max(A)).
mean(A) Media aritmética del vector o columnas de la matriz A.
median(A) Mediana de los elementos del vector A.
quantile(A,probs=0.k) K-ésimo cuantil de los elementos del vector A.
sd() Cuasidesviación típica de los elementos del vector A.
var() Cuasivarianza de los elementos del vector A.
Funciones Estadísticas
> Villena Actividad:
Peso Talla Sexo EstaCivil 1.- Construye el siguiente
1 65 1.65 F Casado data.frame, luego agregue la
variable IMC y alojarlo en la unidad
2 75 1.80 M Casado
D, con el nombre de su primer
3 80 1.95 M Casado apellido y extensión csv.
4 67 1.75 F Soltero 2.- Importa el archivo y calcula las
5 67 1.85 M Divorciado medidas de tendencia central de la
6 72 1.78 M Casado variable peso.
Funciones Estadísticas
#Calcula el rango de la variable peso.
> range(Peso)
[1] 65 80
Funciones Estadísticas
#Calcula el peso promedio.
mean(datos1$Peso)
[1] 71
#Calcula la mediana de la variable talla.
> median(datos1$Talla)
[1] 1.79
#Calcula los cuartiles de la variable talla.
> quantile(datos1$Talla)
0% 25% 50% 75% 100%
1.6500 1.7575 1.7900 1.8375 1.9500
Funciones Estadísticas
#Calcula la desviación estándar muestral de la variable talla.
sd(datos1$Talla)
[1] 0.1003328
#Calcula la varianza de la variable talla.
var(datos1$Talla)
[1] 0.01006667
La función summary()
Es una función que nos proporciona una descripción básica de los
datos. En concreto, nos da el mínimo, el primer cuartil, la media, la
mediana, el tercer cuartil y el máximo.
#Mostrar la descripción básica de la variable peso.
summary(datos1$Peso)
Min. 1st Qu. Median Mean 3rd Qu. Max.
65.00 67.00 69.50 71.00 74.25 80.00
Funciones Estadísticas
Para calcular la moda, hay que activar en la biblioteca “modeest” y usar
la función mfv(vector).
#Calcular la moda de la variable Peso.
library(modeest)
mfv(datos1$Peso)
[1] 67
Análisis Estadístico con Librería
library(fBasics)
También podríamos usar la librería fBasics, con la función basicStats.
Para ello en la ventana script tecleamos:
install.packages(“fBasics”)
library(fBasics)
basicStats(Talla)

Link de descarga: https://cran.r-project.org/web/packages/fBasics/index.html


Análisis Estadístico con Librería
library(fBasics)
basicStats(Talla)
Talla
nobs 20.000000
NAs 0.000000
.
Variance 104.344737
Stdev 10.214927
Skewness 0.097645
Kurtosis -1.206594
Análisis Estadístico con Librería
library(pastecs)
También podríamos usar la librería pastecs, con la función stat.desc.
Para ello en la ventana script tecleamos:
install.packages(“pastecs”)
> library(pastecs)
data.frame(stat.desc(PESO))

Link de descarga: https://cran.r-project.org/web/packages/fBasics/index.html


Análisis Estadístico con Librería
library(pastecs)

Vous aimerez peut-être aussi