Vous êtes sur la page 1sur 12

25 DE MARZO DE 2019

TRABAJO GRUPAL 1
EST 291
a
a.1 a.2 a.3 a.4 a.5 b c d e f g Nota
0,5 1 1 1 1 8,5 4 0 5 3 5 40

Ejercicio 1 Commented [est1]: En general está muy bien. Han


analizado todas las variables. Han agregado el anexo con los
scripts. Podría ser un poquito más prolijo y ordenado. Vean
A) Genere muestras de tamaño 100 de 4 variables aleatorias para los comentarios más adelante en el trabajo.

construir datos sobre ciertas bombas de agua:


a.1)
Peso=rnorm(100,100,4)

Gracias a este código podremos generar 100 números aleatorios de una población normal, con
media 100 y desviación estándar 4. Commented [AC2]: La desviación estándar es 2. Falta
calcular el valor absoluto.
a.2)
Tiempo=rexp(100,0.01)

Con este código podremos generar 100 números aleatorios de una población exponencial,con un
lambda igual a 0.01.

a.3)
Forma=rbinom(100,1,0.25)

Forma<-factor(Forma, levels=c(0,1), labels=c("aplastado", "estirado"))

Con este código podremos generar 100 números aleatorios de una población binomial, con una
probabilidad de 0.25. Ademas le codificamos para que los valores igual a 0 sean “aplastado” y 1
correspondan a “estirado”.

a.4)
Marca=rbinom(100,3,0.5)

Marca<-factor(Marca, levels=c(0,1,2,3), labels=c("Pentax", "Loncin","Grundfos","Pedrollo"))

Con este código podremos generar 100 números aleatorios de una población binomial, con una
probabilidad de 0.5. Ademas le codificamos para que los valores igual a 0 sean “Pentax”, 1
correspondan a “Loncin”, 2 corresponda a “Grundfos” y 3 corresponda a “Pedrollo”.

a.5)
data=data.frame(Peso,Tiempo,Forma,Marca)

attach(data)

Con este código podemos pegar las 4 variables en una misma matrix. Commented [est3]: Falta presentar los datos.
B) Análisis Variables continuas
-Primera variable “Peso de la Bomba”
Tabla 1: Medidas descriptivas para la variable “Peso de la bomba”

Mínimo 1er Cuartil Mediana Media 3er Cuartil Máximo


91.14 98.02 100.46 100.44 102.77 109.61

En esta la tabla 1 podemos ver las principales medidas de resumen sobre estos datos. Podemos Commented [est4]: Citar número de tablas y/o gráficos
observar que tanto la mediana como la media son bastante similares, lo cual nos indica que es una en el texto.
distribución aparentemente simétrica. OJO: se pedían al menos 3 medidas de centralidad (media,
mediana, algún cuartil) y 3 de dispersión.

Gráfico 1

El Grafico 1 nos muestra la distribución de los datos de la variable “Peso de la bomba”. Acá
verificamos lo dicho anteriormente, estamos ante una distribución simétrica con leva sesgo a la
izquierda. Commented [est5]: Falta histograma de áreas (área 1).
Gráfico 2

En el Gráfico 2 podemos observar que no estamos en presencia de datos con valores extremos,
además de reiterar nuevamente la distribución simétrica.

-Segunda variable “Tiempo antes de la inspección”


Tabla 2: Medidas descriptivas para la variable “Tiempo antes de la inspección

Mínimo 1er Cuartil Mediana Media 3er Cuartil Máximo


2.025 34.288 75.638 93.126 142.569 325.934

En la Tabla 2 se observan las principales medidas de resumen sobre estos datos. Podemos
observar que tanto la mediana como la media difieren, lo cual nos indica que es una distribución
asimétrica. Además podemos ver que la diferencia entre el mínimo y el máximo (rango) es 323.909
lo cual es bastante.
Gráfico 3

El Grafico 2 nos muestra la distribución de los datos de la variable “Tiempo de inspección”. Acá
verificamos lo dicho anteriormente, estamos ante una distribución asimétrica con sesgo a la
derecha.

Gráfico 4

En el Gráfico 4 podemos observar que estamos en presencia de un dato extremo, además de


reiterar nuevamente la distribución asimétrica a la derecha. Commented [est6]: Falta Tallo y hoja.
C) Análisis Variables categóricas

-Tercera variable “Forma del cilindro” Commented [est7]: Falta un texto introductorio: “Se
analiza la variable Forma del cilindro utilizando diagrama de
Gráfico 5 barras y gráfico de sectores, junto con tablas de
frecuencias.”

El Grafico 5 nos muestra la distribución de los datos de la variable “Forma del cilinfdro”. Hay 75
cilindros aplastados y 25 cilindors estirados
Gráfico 6

El Gráfico 6 nos muestra la misma información anterior. El porcentaje de cilindros aplastados es


del 75% mientras que de los estirados corresponde al 25%.

-Cuarta variable “Marca de las bombas”


Gráfico 7
El Grafico 5 nos muestra la distribución de los datos de la variable “Marca de la bomba”. Se
observa la frecuencia de las marcas. Se ve por ejemplo que la marca Grpundfos tiene una
frecuencia de 40.

Gráfico 8

El Gráfico 6 nos muestra de otra forma las distribuciones de las marcas, se ve que las marcas
Pentax y Pedrollo son las que tienen menos frecuencia.

Faltan las tablas de frecuencias. Falta el boxplot segmentado por una variable categórica.Falta
título en el último gráfico.
Anexo

set.seed(1)

Peso=rnorm(100,100,4)

Tiempo=rexp(100,0.01)

Forma=rbinom(100,1,0.25)

Forma<-factor(Forma, levels=c(0,1), labels=c("aplastado", "estirado"))

Marca=rbinom(100,3,0.5)

Marca<-factor(Marca, levels=c(0,1,2,3), labels=c("Pentax", "Loncin","Grundfos","Pedrollo"))

data=data.frame(Peso,Tiempo,Forma,Marca)

attach(data)

#Variable continua

#Peso

hist(Peso,col="chocolate",xlab="Peso bomba",ylab ="Cantidad",main="Histograma Peso de la


bomba")

boxplot(Peso,col="chocolate",xlab="Cantidad",ylab ="Peso de la bomba",main="Boxplot Peso de


la bomba")

summary(Peso)

stem(Tiempo)

#Tiempo

hist(Tiempo,col="chocolate",ylab="Cantidad de inspecciones",main="Tiempo de inspección")

boxplot(Tiempo,col="chocolate",main="Caja con bigotes del tiempo de inspección")

summary(Tiempo)

#varables categoricas

#Forma

table(Forma)

t <- table( Forma)

t
prop.table( t ) ##proporcion respecto al total

prop.table( t ) * 100 ##proporcion en porcdentaje

prop.table( t, 1 ) ## por filas

prop.table( t, 2 )*100 ##por columnas

t1<-table(Forma) ##

diagrama<-barplot(t1, col=c("chocolate","chocolate"),ylab="formato de cilindro")

title(main = "Distribucion de frecuencias de la variable", font.main = 4)

pie(t1,col =c( "lightblue","chocolate"))

tabla.destino<-prop.table(t1)

tabla.destino<-round(100*tabla.destino,2)

sectores.destino<-pie(tabla.destino,col =c(
"lightblue","chocolate"),labels=paste(names(tabla.destino),tabla.destino," %"),main="Distribucion
de porcentajes de la variable formato")

#Marca

table(Marca)

t <- table( Forma)

prop.table( t ) ##proporcion respecto al total

prop.table( t ) * 100 ##proporcion en porcdentaje

prop.table( t, 1 ) ## por filas

prop.table( t, 2 )*100 ##por columnas


t1<-table(Forma) ##

diagrama<-barplot(t1, col=rainbow(2),ylab="formato de cilindro")

title(main = "Distribucion de frecuencias de la variable", font.main = 4)

pie(t1,col =c( "lightblue","darkblue"))

tabla.destino<-prop.table(t1)

tabla.destino<-round(100*tabla.destino,2)

sectores.destino<-pie(tabla.destino,col =c(
"lightblue","darkblue"),labels=paste(names(tabla.destino),tabla.destino," %"),main="Distribucion
de porcentajes de la variable formato")

#variable marca de cilindro

table(Marca)

f <- table(Marca)

prop.table( f ) ##proporcion respecto al total

prop.table( f ) * 100 ##proporcion en porcdentaje

t1<-table(Marca) ##

diagrama<-barplot(t1, col=c("chocolate","chocolate","chocolate","chocolate"))

title(main = "Distribucion de frecuencias de la variable marca de la bomba",ylab = "Cantidad de


marca de la bomba", font.main = 4)

pie(t1,col =c( "lightblue","chocolate"))

tabla.destino<-prop.table(t1)
tabla.destino<-round(100*tabla.destino,2)

sectores.destino<-pie(tabla.destino,col =c(
"lightblue","darkblue"),labels=paste(names(tabla.destino),tabla.destino," %"),main="Distribucion
de porcentajes de la variable formato")