Vous êtes sur la page 1sur 5

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLN

ESCUELA DE ESTADSTICA
Primer trabajo.
Base de Datos Asignada

Anlisis Descriptivo de Datos (10%)


25

Sem. 01_2014

Duracin: 1 hora 20 min.

Entren a mi PC. En la direccin ftp:APOLO1\Estadistica I encontrar 50 bases de datos. Dichas bases de


datos corresponden a muestras aleatorias de una gran base de datos. Usted debe trabajar con la base
previamente asignada por su profesor. SOLO trabaje con dicha base de datos y reprtela en el presente
formato.
Para acceder a la base de datos, usted debe hacer doble clic en dicho archivo y guardarlo en la carpeta D:\
SOLO en dicha carpeta, luego entre al R y abra la librera R comander, desde all debe importar la base de
datos.
Cada conjunto de datos contiene informacin sobre el contenido de DDT en ppm de 2 variedades de peces.
Las variables registradas fueron: ESPECIE (BAGRE, ROBALO), GENERO (HEMBRA, MACHO),
LONGITUD (Longitud del pez, en centmetros), PESO (Peso del pez, en Gramos), LOCALIDAD (Sitio de
cultivo del pez, LAGO RIO), DDT (Cantidad de DDT, en ppm).
Usted debe presentar un informe escrito de MXIMO 6 PAGINAS, inclusive esta pgina debidamente
diligenciada, con la solucin a las preguntas formuladas, resultados en SAS (resmenes y/o grficos)
NOTA: Todas las interpretaciones y / o conclusiones debe hacerlas en el contexto de los datos.
Usando la informacin de su base de datos responda a las siguientes preguntas.
1.
2.
3.
4.

Identifique el tipo de variables contenidas en su base de datos.


Para las variables continuas calcule Media, Mediana y desviacin estndar. Interprete sus
resultados. en el contexto de los datos.
Realice el grfico o la tabla adecuada para contestar, cuantos peces viven en el lago y son machos?
Se puede afirmar que el peso promedio de las hembras, es inferior al peso promedio de los
machos? Justifique su respuesta.

NOTA: TENGA PRESENTE LLENAR ESTE FORMATO Y ENTREGARLO CONJUNTAMENTE CON EL


DESARROLLO DE LAS PREGUNTAS. LOS FORMATOS INCOMPLETOS NO SE CALIFICARAN.

1. El tipo de variables que encontramos en nuestra base de datos son:

Especie: Cualitativa de tipo Ordinal


Gnero: Cualitativa de tipo Ordinal
Longitud: Cuantitativa, de tipo Continua
Peso: Cuantitativa, de tipo Continua
Localidad: Cualitativa de tipo Ordinal
DDT: Cuantitativa, de tipo Continua

.
2. Para las variables continuas calcule Media, Mediana y desviacin estndar. Interprete sus
resultados. en el contexto de los datos
Para DDT:
Datos
Min. :14.81
1st Qu.:17.09
Median :18.81
Mean :18.62
3rd Qu.:20.01
Max. :22.50
En trminos del DDT tenemos la medida del promedio del contaminante DDT en ppm como
18.6204, lo que significa que para valores entre 14.81 y 22.50, la sumatoria de los datos, divido el
nmero de datos (n=100), es 18.6204.
Media
18.6204

Desviacin Estndar
1.936283

Mediana

No. De Datos
18.81
100

Si discriminamos estos resultados con respecto a otras variables como gnero por ejemplo, vamos
a ver el siguiente comportamiento: Para La especie Robalo, tenemos un valor de 18.9577 y para
Bagre un valor de 18.3090, lo cual nos muestra que no dista mucho del valor inicial del promedio
que mencionamos anteriormente, es decir, podemos ver que se mantiene constante alrededor del
valor 18.6.
De la misma manera podemos observar que para un anlisis entre la magnitud del contaminante
respecto a otra variable, por ejemplo, el Gnero, tenemos el siguiente comportamiento: Para
Machos vemos un valor de 18.72 y para hembras18.52. Esto lo podemos observar en las siguiente
figura 1. Vale aclarar que este anlisis es solo para los valores del promedio, ya que si nos fijamos
en los valores de la desviacin estndar o la mediana, van a cambiar segn la variable que estemos
analizando.

Figura 1. Valores Estadsticos. Promedio de DDT discriminado por variables Gnero y Especie.

La desviacin estndar significa cuan alejados los datos estn de la media, es decir, para el DDT
tenemos un valor de 1.93, es decir que los datos se alejan en magnitud de 1.93 del valor de la
media que es 18.6.
La mediana o percentil 50, es en este caso para el DDT, 18.81 y significa que con los datos
ordenados, el valor justamente de la mitad de la poblacin (n=100), el valor que ocupa la posicin
50 equivale a 18.81.
Para Longitud

Para el analsis de la longitud del pez, tenemos un valor promedio de 8.9601 entre los valores 6.330
y 12.250, lo que significa que para la sumatoria de todos los datos de longitud divido el numero de
datos (n=100), el valor promedio es 8.9601.
Como en el ejercicio anterior vemos que los datos no cambian radicalmente (promedio) si
contrastamos el valor de la longitud entre otras variables como el gnero o la especie y todos los
valores se mantienen cercanos a 8.9 como lo podemos ver en la figura 2. Vale aclarar que este
anlisis es solo para los valores del promedio, ya que si nos fijamos en los valores de la desviacin
estndar o la mediana, van a cambiar segn la variable que estemos analizando.
La desviacin estndar significa cuan alejados los datos estn de la media, es decir, para la
longitud tenemos un valor de1.3026, es decir que los datos se alejan en magnitud de 1.3 del valor
de la media que es 8.9
La mediana o percentil 50, es en este caso para la longitud es 9.015 y significa que con los datos
ordenados, el valor justamente de la mitad de la poblacin (n=100), el valor que ocupa la posicin
50 equivale a 9.015.
Media
8.9601

Desviacin Estndar
1.302612

Mediana
9.015

No. De Datos
100

Figura 2. Valores Estadsticos. Promedio de Longitud discriminado por variables Gnero y Especie.

Para Peso

Para el analsis del peso del pez, tenemos un valor promedio de 7.034 entre los valores 2.320 y
16.530, lo que significa que para la sumatoria de todos los datos de longitud divido el numero de
datos (n=100), el valor promedio es 7.034
La desviacin estndar significa cuan alejados los datos estn de la media, es decir, para la
longitud tenemos un valor de3.0125, es decir que los datos se alejan en magnitud de 3.0 del valor
de la media que es 7.034
La mediana o percentil 50, es en este caso para la longitud es 7.015y significa que con los datos
ordenados, el valor justamente de la mitad de la poblacin (n=100), el valor que ocupa la posicin
50 equivale a 7.015 y lo podemos apreciar a continuacin:
Media
7.0339

Desviacin Estndar
3.012599

Mediana

No. De Datos
7.015 100

3. Peces que viven en el Lago y son machos

> .Table
localidad
genero
Lago Rio
Hembra 27 21
Macho
22 30
Como podemos observar tanto en la grafica como en la tabla, tenemos que el numero de Machos
en el lago, es de 22 individuos. Como dato adicional tenemos que el numero de hembras es de 27.
Esto se ve reflejado en la grafica anterior.

4. Se puede afirmar que el peso promedio de las hembras, es inferior al peso promedio de los
machos?

Tabla 1. Resumen estadisticos de promedio de peso discriminado por gnero.


Como vemos en la anterior tabla, el peso promedio para los machos es de 8.97750 y el valor promedio en
peso para las hembras es de 4.9283, por lo que evidentemente el peso promedio de las hembras es menos
que el de los machos por una diferencia de 4.0 unidades. El diagrama de caja que veremos a continuacin,
nos habla de los mismos valores que observamos en la tabla 1., por ejemplo que el valor promedio en peso
para las hembras es mucho menor (4<x<6) y para machos es mayor (8<x<11).

Figura 3. Diagrama de Caja de promedio de Peso discriminado por Gnero.

Vous aimerez peut-être aussi