Vous êtes sur la page 1sur 14

TRABAJO FINAL ESTADISTICA Y

PROBABILIDAD
Lucia Gonzalez Quiroz

MAY 24, 2019


UNIVERSIDAD NACIONAL DE VILLA MARIA
Ingeniería en Alimentos
Ejercicio 1: Se tomaron muestras de tamaño 100 de cada uno de tres estadios larvales de una especie
de polilla forestal. Cada individuo es pesado y se registraron los datos. Una vez procesado los datos,
la información de resumen que tenemos se presenta a continuación:
Estadística descriptiva

Estadio Larval Resumen Peso(mg)


Estadio 1 n 100,00 Diagramas de Caja y Sesgo
Estadio 1 Media 0,70
Estadio 1 D.E. 0,89 25
Estadio 1 Var(n-1) 0,80
22
Estadio 1 CV 126,98
Estadio 1 Mín 0,00 18
Estadio 1 Máx 4,52
15

Peso(mg)
Estadio 1 Mediana 0,38
Estadio 1 Q1 0,06 12
Estadio 1 Q3 0,90
Estadio 2 n 100,00 9
Estadio 2 Media 4,76 5
Estadio 2 D.E. 2,81
Estadio 2 Var(n-1) 7,89 2
Estadio 2 CV 59,01
-1
Estadio 2 Mín 0,35 Estadio 1 Estadio 2 Estadio 3
Estadio 2 Máx 14,67 Estadio Larval
Estadio 2 Mediana 4,11
Estadio 2 Q1 2,81
Estadio 2 Q3 6,09
Estadio 3 n 100,00
Estadio 3 Media 9,74 a) Realice una descripción de la distribución de
Estadio 3 D.E. 4,65 los pesos en cada uno de los estadios.
Estadio 3 Var(n-1) 21,64
Estadio 3 CV 47,78 b) Realice una comparación entre los diferentes
Estadio 3 Mín 2,63 estadios.
Estadio 3 Máx 23,73
Estadio 3 Mediana 9,31
Estadio 3 Q1 6,04
Estadio 3 Q3 11,30

A partir de los datos presentados se observa que:


En el estadio 1, se obtuvieron los menores pesos, con una media de 0,70mg y una
mediana de 0,38 (peso que determina la división de los datos a la mitad,
deduciéndose que los valores a partir del mismo, se dispersan demasiado en valor.
Adicionándole la observación del Coeficiente de variación se confirma la escasa
homogeneidad de los pesos tomados.
En el estadio 2, con media 4,75 y mediana de 4,11, adicionándole los valores de
los pesos mínimos y máximos (0,35 y 14,67 respectivamente), el CV (59,01) y los
Cuartiles 1 y 2(2,81 y 6, 09, indicándose la concentración del 50% de los datos
entre ambos) se infiere que tienen un comportamiento homogéneo hasta cierto valor
y a medida que aumentan, se dispersan ampliamente.
En el estadio 3, teniendo en cuenta las mismas medidas de distribución se ven
variaciones similares a las anteriores, presentándose el menor CV pero significando
aun una distribución con valores atípicos y dispersos, teniendo en cuenta que el
peso máximo es de 23,73 y el 75% de los pesos son menores o iguales a 11,30mg.
Comparando los 3 estadios y el peso de la larva, se concluye de manera general que
en todos hay homogeneidad de pesos hasta cierta cantidad de muestras y presentan
valores atípicos. Sin embargo, se presenta mayor dispersión en el estadio 1.
Los mayores pesos se obtienen en el estadio 3 de la larva.

1
Ejercicio 2: USE INFOSTAT El contenido de sales en el suelo tiene distribución normal con media
30,1 ppm y desviación estándar de 7 ppm. Se seleccionan 9 muestras de suelo de la zona sur de la
provincia de Córdoba. Calcular la probabilidad de que:
a) El contenido de sales del suelo sea superior a 22.5 ppm
b) El contenido promedio de sales del suelo sea superior a 22.5 ppm
c) El contenido promedio de sales del suelo esté entre 27.8 y 31.5 ppm
a)

Figura 1. Probabilidad de que las sales del suelo sean mayores a 22,5ppm.
b)

Figura 2. Distribución normal del contenido promedio de sales en el suelo mayores a 22,5

2
c)

Figura 3. Probabilidad de que el contenido promedio de sales este entre 27,8 y 31,5.

En las figuras 1, 2 y 3 se muestran distribuciones normales de las probabilidades de encontrar


determinadas cantidades de sales en el suelo.
Se puede inferir que hay altas probabilidades de encontrar contenidos mayores a 22,5 ppm o mg,
estimándose en un 86% aproximadamente. Sin embargo, al tener en cuenta el valor promedio de
contenido de sales, hay casi un 100% de probabilidades de que sean superiores a 22,5.

Ejercicio 3: USE INFOSTAT. A continuación, se presentan los promedios y desvíos


correspondientes a tres muestras de tamaño 16 provenientes de una población con distribución
Normal de media 𝜇 = 80
Muestra Media Desvio a) A partir de los datos muestrales construir, para cada muestra, un
1 77.76 8.45 intervalo de confianza del 95% para la media de la distribución.
2 74.46 5.27 b) ¿Contienen los intervalos al parámetro en cuestión? Realizar
3 78.58 7.29 gráficos.
c) Explique los resultados de lo ocurrido en b) a partir del significado
de la confianza.
d) Las muestras provienen todas de la misma población?

3
a)

N.º muestra LI LS
1 73,61 81,9
2 71,87 81,16
3 75,01 82,15
Tabla 1. Limites de intervalos calculados por muestra.

Figura 4. Intervalos de confianza para la muestra 1.

4
Figura 5. Intervalos de confianza para muestra 2.

Figura 6. Intervalos de confianza para muestra 3.

5
Figura 7. Intervalo de confianzas de las 3 muestras.

Para las figuras 4, 5 y 6 se observan altos niveles de intervalos que muestras contener el parámetro
en cuestión, siendo 96%, 92% y 96 respectivamente.
A partir de los límites calculados en el punto a) y los gráficos observados en el punto b) se observa
que no solo el parámetro se encuentra dentro de los intervalos establecidos por los limites
inferior y superior (tabla 1), sino que también se determina que, por la comparación de los tres
gráficos y superposición de intervalos, pertenecen a la misma población.

Ejercicio 4: Se sospecha que una máquina embotelladora de leche no funcionada adecuadamente. El


volumen promedio de leche de las botellas debe ser de 970 cm3. Se supone que el desvío estándar de
la variable volumen sume un valor de 20 cm3.
a) ¿Cuál es el objetivo del estudio? En el marco de la teoría de las pruebas de hipótesis, ¿Cómo
plantearía este objetivo?
b) Para las hipótesis planteadas en el inciso anterior, ¿Qué estadístico de contraste debe usar?
c) Hallar la zona de rechazo para un nivel de significación de 0.05
d) Para poder tomar una decisión respecto a las hipótesis planteadas se tomaron al azar 9 botellas,
encontrándose una media de 977 cm3. ¿Hay evidencia estadística para concluir que la máquina
funciona mal?
e) ¿Cuál sería la conclusión si se hubiesen tomado 49 botellas obteniendo también un volumen medio
de 977 cm3?

6
a) El objetivo del estudio es, por el planteo de hipotesis y su comprobación, determinar el correcto
funcionamiento de la envasadora, determinando que las botellas tienen como volumen medio
970cm3 (media) y con variaciones no mayores a 20cm3(DE). Esto vendría a ser, la hipotesis
nula. Mientras que la hipotesis alternativa, al contrastar la nula, supone que estos datos son
distintos. Por lo que se demostraría de la siguiente manera:

Hipòtesis nula(H0): cm3

Hipotesis alternativa (H1): ≠cm3

b) El estadístico de contraste que debería utilizarse al ser conocida la media, además de contar con
la desviación estándar (√varianza), es la prueba T bilateral, ya que la idea es buscar una media
distinta y puede ser superior o inferior a 970.

c) Al tener un nivel de significación  de 0,05, la zona de rechazo se representa por


.

0,05
𝑍𝑜𝑛𝑎 𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 = 2

Ecuación 1. Cálculo de zona de rechazo.

𝑍𝑜𝑛𝑎 𝑑𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 = 0,025


Ecuación 2. Resultado final.

d) Si, es información suficiente ya que con la fórmula del valor Z, según el resultado obtenido, y
conociendo los puntos críticos Z0,025 (-1,96 y 1,96) obtenidos de tablas que determinan el fin de
la zona de aceptación y el inicio de la zona de rechazo, se puede determinar si se considera la
hipotesis nula o la alternativa.
El valor z, determina la diferencia entre un estadístico observado y su parámetro establecido
como hipotético de población en unidades de la desviación estándar.
𝑥̅ −𝜇0
𝑧= 𝜎
√𝑛

Ecuación 3. Formula para calcular valor z

977−970
𝑧= 20
√9

Ecuación 4.

7
𝒛 = ±𝟏, 𝟎𝟓
Ecuación 5. Valor z final.

Como se observa el valor es inferior al Zpor lo que se encuentra dentro de la zona de


aceptación. En conclusión, se acepta la hipotesis nula, determinando el buen funcionamiento de la
envasadora.

e) En caso de tomar una cantidad muestral de 49 se obtiene el siguiente valor de z

977−970
𝑧= 20
√49

Ecuación 6.

𝒛 = ±𝟐, 𝟒𝟓
Ecuación 7.

Se observa una gran diferencia al tomar mas botellas como muestra, siendo mas representativo
y homogéneo. En este caso la hipotesis nula queda rechazada debido a que es superior al Z

Ejercicio 5: Desarrolle un breve resumen sobre REGRESION LINEAL y utilice los conceptos para
plantear una regresión entre las variables perímetro y peso de los ajos, Base de datos de prueba de
infostat: Ajoblanc

A partir del análisis de regresión lineal se obtiene un modelo funcional lineal que describa como
varia el promedio de la variable dependiente respecto a los cambios en la variable independiente o
regresora. Además, tiene como objetivo la estimación de parámetros de muestras aleatorias, validación
del modelo y contrastes de hipotesis sobre los mismos parámetros obtenidos. También el empleo del
modelo para obtener el valor esperado de la variable independiente según un valor determinado de la
A dependiente.

8
Figura 8. Gráfico de dispersión del peso del ajo blanco según respecto al perímetro.

9
Figura 9. Gráfico de dispersión del peso del ajo blanco respecto al perímetro.

Figura 10.Grafico de Residuos vs. Predichos.

10
Tabla 2. Análisis de regresión lineal

Tabla 3.Coeficientes de regresión y estadísticos asociados

Tabla 4.Analisis de la varianza.

Figura 11. Comprobación con Q-Q Plot.

Iniciando por el planteo de un gráfico de dispersión (figura 8), se observa un comportamiento de


tendencia lineal por lo que se prosiguió con el análisis de regresión lineal.

Observados los datos obtenidos se puede deducir que:

Según el R2(tabla 2), que es el coeficiente que demuestra proporcionalidad en la variación de la


variable dependiente respecto a la regresora, la relación de dependencia entre el perímetro y el peso

11
del ajo blanco es altamente probable, cuantizada en un 91%. Además, el p valor (<0,0001) indica una
óptima correlación entre ambas variables.

Observando el grafico de la figura 9, obtenido por el análisis de regresión lineal, se puede deducir una
relación de proporcionalidad entre ambas variables, ya que, a medida que aumenta el perímetro del
ajo, su peso también.

En el gráfico de residuos, aun así, se observan valores que se consideran anormales o distintos a la
distribución.

Por el método Q-Q plot como comprobación, se observa un escaso acercamiento a un comportamiento
normal de los residuos, sin embargo, no se garantiza que pueda confirmarte la exacta relación entre
perímetro y peso del ajo. Sin embargo, teniendo en cuenta los coeficientes de la tabla 2, se plantea el
modelo funcional:

𝑦 = −83,32 + 7,99𝑥 + 𝑐
Ecuación 8. Modelo funcional para estimación de peso a partir de un perímetro.

12
Bibliografía:

Apuntes de clases prestados por la profesora.

Di Rienzo, Casanoves, Gonzalez, Tablada, Diaz, Robledo, Balzarini. Estadisticas para la ciencias
agropecuarias, septima edicion.

Dr. Depool Rivero, Ramon; Ing. Monasterio, Dioscoro. Probabilidad y Estadistica. Aplicaciones a la
ingenieria.

Manual de Infostat.

13