Vous êtes sur la page 1sur 18

INTRODUCCIÓN

En el desarrollo de la materia de estadística y probabilidad se logró obtener bases para la


investigación que de seguro será muy útil en la vida profesional de cada uno de los estudiantes
ya que permite tener un amplio conocimiento para investigar y obtener datos precisos de la
problemática en un caso real.

Además con el desarrollo y elaboración de esta última fase se logró plantear un caso de
investigación de la vida cotidiana y real al cual se le dio un seguimiento y solución buscando
una respuesta a los diferentes planteamientos poniendo en práctica el desarrollo de cada fase
que se desarrolló dentro del curso de probabilidad y estadística brindando a cada estudiante
cambiar de ejercicio y brindar un nuevo análisis adquiriendo más conocimientos.

Planteamiento del caso a desarrollar:


En la fábrica de Nestlé purina empresa dedicada a la producción de alimentos concentrados
para mascotas presenta disminución hasta el 70 % en su proceso de producción por
generación de re trabajo debido a la calidad de sus productos finales, algunos de estos no
están cumpliendo con los requerimientos que exige el Ica y por ende no están saliendo al
mercado, esto tiene con gran preocupación al jefe de producción y al departamento de
calidad, es indispensable realizar inmediatamente un estudio estadístico de los datos
suministrados por tal motivo fue designada Andrés Rivera estudiante de ingeniería de
alimentos de la UNAD para realizar dicho estudio y así tomar decisiones en cuanto a los
problemas que presentan los productos, de igual manera el departamento de calidad
suministro 50 datos para realizar dicho estudio en este se encuentran las variables.

Porcentaje de grasa producto terminado

Porcentaje de proteína producto terminado

Porcentaje de humedad semielaborado

Porcentaje de cenizas semielaborado

Color de las partículas

Forma de las partículas

Con el estudio de estas variables se busca identificar que parámetros no cumplen con los
requerimientos de calidad o cuales están cumpliendo, de tal forma tomar una decisión en
cuanto a cómo mejorar la calidad de sus productos y aumentar la eficiencia en su proceso
productivo.

Base de datos:

GRASA PROTEINA HUMEDAD CENIZAS COLOR FORMA


9 7 11 4 CUMPLE CUMPLE
7,2 12 9 4 CUMPLE CUMPLE
7,2 14 9 4 CUMPLE CUMPLE
6,5 7 8,9 4 CUMPLE CUMPLE
9 9,5 12,4 4 CUMPLE CUMPLE
7,3 6,3 11 4 CUMPLE CUMPLE
NO
7,6 6,4 8,4 5 CUMPLE CUMPLE
7,3 12 8,5 5 CUMPLE CUMPLE
7,6 12 8,5 5 CUMPLE CUMPLE
NO
5,6 6,4 8,9 5 CUMPLE CUMPLE
NO
8,2 8,6 8,9 5 CUMPLE CUMPLE
11 8,6 12,4 5 CUMPLE CUMPLE
4,5 7 6,4 5,5 CUMPLE CUMPLE
5,4 6,2 6,5 5,5 CUMPLE CUMPLE
8,2 6,2 6,5 5,5 CUMPLE CUMPLE
5,6 6,2 6,5 5,5 CUMPLE CUMPLE
5,5 6,3 7,7 5,5 CUMPLE CUMPLE
NO
7,6 8,6 8,4 5,5 CUMPLE CUMPLE
NO
6,9 12 9 5,5 CUMPLE CUMPLE
8,2 12 9 5,5 CUMPLE CUMPLE
NO
7,2 6,3 11 5,5 CUMPLE CUMPLE
8,2 12 9 6 CUMPLE CUMPLE
NO
8,2 9,5 12,4 6 CUMPLE CUMPLE
NO NO
7,6 14 7,7 6 CUMPLE CUMPLE
NO NO
8,2 14 7,7 6 CUMPLE CUMPLE
NO NO
6,5 14 7,7 6 CUMPLE CUMPLE
NO
6,9 14 7,7 6 CUMPLE CUMPLE
NO NO
7,3 7 7,7 6 CUMPLE CUMPLE
NO
7,6 9,5 8,4 6 CUMPLE CUMPLE
7,6 6,1 8,4 6 CUMPLE CUMPLE
8,2 6,1 8,4 6 CUMPLE CUMPLE
9,6 6,1 8,4 6 CUMPLE CUMPLE
8,2 6,1 8,5 6 CUMPLE CUMPLE
8,2 6,4 8,9 6 CUMPLE CUMPLE
NO NO
8,2 7 8,9 6 CUMPLE CUMPLE
6,5 12 9 6 CUMPLE CUMPLE
6,9 14 9 6 CUMPLE CUMPLE
NO
9,6 6,1 11 6 CUMPLE CUMPLE
NO
8,2 6,3 11 6 CUMPLE CUMPLE
NO
9,6 9,5 12,4 6 CUMPLE CUMPLE
NO
9,6 9,5 12,4 6 CUMPLE CUMPLE
7,6 7 8,9 6,2 CUMPLE CUMPLE
NO
8,2 12 9 6,2 CUMPLE CUMPLE
6,5 6,2 11 6,2 CUMPLE CUMPLE
NO
5,4 11 8,5 6,2 CUMPLE CUMPLE
7,6 14 9 6,2 CUMPLE CUMPLE
9,6 7 8,9 6,4 CUMPLE CUMPLE
8,2 14 9 6,4 CUMPLE CUMPLE
9 7 8,9 6,5 CUMPLE CUMPLE
NO
9,6 6,3 11 6,5 CUMPLE CUMPLE

DESARROLLO A CADA UNO DE LOS PLANTEAMIENTOS SOLICITADOS.


Planteamiento 1: Realizar con las variables tanto cualitativas como cuantitativas un
análisis descriptivo. Se recomienda usar tablas de frecuencia, gráficos, medidas de
tendencia central, de posición y de dispersión.
Realizar análisis en mínimo dos párrafos
Planteamiento 2: Encontrar en las variables presentadas cuál de ellas tiene mejor tendencia
lineal con respecto a la variable respuesta (justificar y graficar), realizar una regresión lineal
entre ellas (hacer el diagrama de dispersión junto con su recta de regresión). Interpretar los
estadísticos obtenidos, esto es: La pendiente, el intercepto y Correlación de Pearson y de
determinación.
La tendencia lineal es la relación entre una variable dependiente y una independiente por tal
motivo la variables a tratar son humedad: variable independiente porque es una característica
de una realidad, evento o fenómeno, que tiene la capacidad para influir, incidir o afectar a
otras y ceniza: variable dependiente porque es el objeto de estudio, el cual puede estar
afectando la calidad del producto.
El fin de la investigación es poder determinar que esta afectando en la calidad del producto
por ese motivo se interpretara las variables de humedad y ceniza con el fin de saber si hay
valores muy altos que estén afectando el producto final y alterando algunos análisis.
 Variable humedad. Línea de regresión con los valores dados por la empresa

HUMEDAD
14

12
y = 0.0137x + 8.7856
10 R² = 0.0157

0
0 10 20 30 40 50 60

Línea de regresión variable de ceniza:


CENIZAS
8

7 y = 0.044x + 4.4835
6 R² = 0.791

0
0 10 20 30 40 50 60

Humedad Vs. Ceniza

6 y = -0.0595x + 6.1498
R² = 0.0172
5

4
HUMEDA

3
humedad vs ceniza
2
D

1 Linear (humedad vs
ceniza)
0
0 5 10 15

CENIZA

Planteamiento 3. Identificar cuál(es) de las variables tiende a un tipo de distribución de


probabilidad específica: binomial, normal
Con la distribución que tienda a una binomial calcular la proporción de éxito y la de
fracaso. Plantear al menos un cálculo de probabilidad con dicha variable. Con la
distribución que tienda a la normal calcular la media y su desviación estándar.
Plantear al menos un cálculo de probabilidad con dicha variable y sus estadísticos, se deben
realizar cálculos con la tabla de distribución de probabilidad normal.
DISTRIBUCIÓN NORMAL
GRASA
Media 7,70
385,4
∑= = 7,70
50
Desviación típica: 1,31

PROTEÍNA
Media: 9,08
454,3
∑= = 9,08
50
Desviación típica: 2,99

HUMEDAD
Media 9,13
456,7
∑= = 9.13
50
Desviación típica: 1,58

CENIZAS
Media 5,60
280,3
∑= = 5,60
50
Desviación típica: 0,72

Planteamiento 4. Calcular al menos dos intervalos (Media, proporciones, diferencia de


medias… etc.) de confianza al 95%, con 2 de las variables cuantitativas del estudio. Y
escribir las conclusiones respectivas
VARIABLE HUMEDAD CENIZAS
No.
50 50
MUESTRAS

1. ¿Qué se puede concluir del proceso?

Para poder hallar los intervalos de confianza se debe conocer la media, la desviación estándar
y el número de muestras.

Solución

HUMEDAD
MEDIA:
∑ 𝑥𝑖
𝑥̅ =
𝑛
456,7
𝑥̅ =
50
𝑥̅ = 9,1

VARIANZA:

2
∑(𝑥̅ − 𝑥𝑖)2
𝑆 =
𝑛−1
123,85
𝑆2 =
49
𝑆 2 = 2,5275
DESVIACIÓN TÍPICA

𝑆 = √𝑆 2
𝑆 = 1,5898
DATOS OBTENIDOS EN LA HUMEDAD

𝑛 = 50 µ = 9,1 𝜎 = 1,5898 𝐼𝐶 = 95%

Los intervalos de confianza están dados por la siguiente fórmula:

(µ − 𝐸 , µ + 𝐸)

Fórmula.

(1 + 𝐼𝐶)
𝐸 = 𝑃( 𝑍 < = 𝑍𝛼/2) . 𝜎 / √𝑛 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑍𝛼/2 =
2

𝑍𝛼 (1 + 𝐼𝐶)
=
2 2

𝑍𝛼 (1 + 0,95)
=
2 2

Operación se tiene que

𝑍𝛼
= 0,975.
2

Este es el valor que se encuentra dentro de la tabla Z.

La tabla el valor de 0,975

𝑍𝛼
𝑃(𝑍 <= ) = 1,96
2

Hallar el error E de la siguiente forma:

𝑍𝛼
𝐸 = 𝑃 (𝑍 < = ) . 𝜎 / √𝑛
2

Reemplazando

1,5898
𝐸 = 1,96 ( )
√50
Realizando la operación se tiene entonces la raíz cuadrada de 50 es 7,071

𝐸 = 0,4406

Este es el error que presenta nuestra variable con un intervalo de confianza del 95%.

Ahora hallar los intervalos según la fórmula

(µ − 𝐸 , µ + 𝐸)

Reemplazando

(9,1 – 0,4406 ; 9,1 + 0,4406) = (8,6594 ; 9,5406).

Intervalos de confianza para la variable humedad (8,6594 ; 9,5406).

CENIZAS

MEDIA:
∑ 𝑥𝑖
𝑥̅ =
𝑛
280,3
𝑥̅ =
50
𝑥̅ = 5,6

VARIANZA:
∑(𝑥̅ − 𝑥𝑖)2
𝑆2 =
𝑛−1
25,51
𝑆2 =
49
𝑆 2 =0,52
Diferencias de medias

𝑥̅ = 5,6-0,52 = 5,08

𝑥̅ = 5,08

DESVIACIÓN TÍPICA

𝑆 = √𝑆 2
𝑆 = 0,7211

DATOS OBTENIDOS EN LA CENIZAS

𝑛 = 50 µ = 5,6𝜎 = 0,7211 𝐼𝐶 = 95%

Los intervalos de confianza están dados por la siguiente fórmula:

(µ − 𝐸 , µ + 𝐸)

Fórmula.

(1 + 𝐼𝐶)
𝐸 = 𝑃( 𝑍 < = 𝑍𝛼/2) . 𝜎 / √𝑛 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑍𝛼/2 =
2

𝑍𝛼 (1 + 𝐼𝐶)
=
2 2

𝑍𝛼 (1 + 0,95)
=
2 2

Operación se tiene que

𝑍𝛼
= 0,975.
2
Este es el valor que se encuentra dentro de la tabla Z.

La tabla el valor de 0,975

𝑍𝛼
𝑃(𝑍 <= ) = 1,96
2

Hallar el error E de la siguiente forma:

𝑍𝛼
𝐸 = 𝑃 (𝑍 < = ) . 𝜎 / √𝑛
2

Reemplazando

0,7211
𝐸 = 1,96 ( )
√50

Realizando la operación se tiene entonces la raíz cuadrada de 50 es 7,071

𝐸 = 1,1998

Este es el error que presenta nuestra variable con un intervalo de confianza del 95%.

Ahora hallar los intervalos según la fórmula

(µ − 𝐸 , µ + 𝐸)

Reemplazando (5,6 – 1,1998 ; 5,6 + 1,1998) = (4,4002 ; 6,7998).

Intervalos de confianza para la variable humedad (4,4002 ; 6,7998)

VARIABLE INTERVALO DE CONFIANZA


HUMEDAD 8,6594 ; 9,5406
CENIZAS 4,4002 ; 6,7998

Se realiza la conclusión a la fábrica de Nestlé purina.

Observando las variables de la humedad y cenizas:

El respectivo intervalo de confianza de la humedad ira desde 8,6594 hasta 9,5406


Valor de la Media de nuestro proceso (9,1)

Intervalo de confianza de la cenizas ira desde 4,4002 hasta 6,7998

Valor de la Media de nuestro proceso (5,6)

Como el valor de la media de la humedad y cenizas de nuestro proceso, podemos afirmar que
se encuentra dentro del intervalo de confianza.

Planteamiento 5: Plantear dos pruebas de hipótesis, que me permitan demostrar o concluir


una relación entre al menos dos variables y la variable respuesta, se debe mostrar el
procedimiento.

Los valores que se adjuntan corresponden a la fabricación de un yogur, la cual fue realizada
en tres días sucesivos. La especificación para este yogur es de 50000 ± 6000 mililitros.
Pruebe con un nivel de confianza de 0,01 que los datos siguen un comportamiento con base
en una distribución normal.
 H1: La distribución normal con un α de 0,01 es una buena descripción del proceso
de fabricación del yogur

 H2: La distribución normal con un α de 0,01 no es una buena descripción del proceso
de fabricación del yogur

LI LS Frec Frec. XK
acom

35.000 40.000 6 6 37.500

40.000 45.000 15 21 42.500

45.000 50.000 58 79 47.500


50.000 55.000 139 218 52.500

55.000 60.000 66 284 57.500

60.000 65.000 11 295 62.500

65.00 70.000 5 300 67.500

D Frec* D Frec* D2 Prob. Frec. Frec. Esp


Esperada Esperada acom

-3 -18 54 0.0087 2.61

-2 -30 60 0.0677 20.31 22.92

-1 -58 58 0.2428 72.84 72.84

0 0 0 0.3687 110.61 110.61

1 66 66 0.2385 71.55 71.55

2 22 44 0.0654 19.62 21.96

3 15 45 0.0078 2.34

-3 327

(∑ 𝑛 𝑘 ∗ 𝑑) ∗ 𝑖
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝐴 +
𝑛
A= Punto medio de la clase que contiene a la media supuesta (d=0)
D= Desviación del punto medio con respecto a la posición de la media supuesta, es medida
en unidades de intervalo de clase.
i= amplitud o intervalo de clase
nk = número de clases
x = valores de la variable en estudio
n = tamaño de la muestra
(−3 ∗ 5000) ∗ 52.450
𝑀𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 52.500 +
300

(∑ 𝑛 𝑘 ∗ 𝑑2 ) (∑ 𝑛 𝑘 ∗ 𝑑)2
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝑖 ∗ √ −
𝑛 𝑛2

327 −32
S = 5000 * √300 − = 5219.91
3002

 Probabilidad esperada
𝑙𝑖𝑚𝑖𝑡𝑒𝑠 − 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑍=
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛

40.000 − 52.450
𝑍= = −2.38
5219.91

𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 = 𝑃(−2.38) = .0087

 Frecuencia Esperada
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 = 𝑃𝑟𝑜𝑏. 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 ∗ 300
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 = .0087 ∗ 300 = 2.61
Frecuencia Frecuencia Fo-Fe (𝐅𝐨 − 𝐅𝐞)𝟐 (𝐅𝐨 − 𝐅𝐞)𝟐
Observada Esperada 𝑭𝒆

21 22.92 -1.92 3.69 0.16

58 72.84 -14.84 220.23 3.02

139 110.61 28.39 805.99 7.29

66 71.55 -5.96 30.80 0.43

16 21.96 -5.96 35.52 1.62

X2 12.52

𝑽𝒂𝒍𝒐𝒓 𝒅𝒆 𝒙𝟐 𝒄𝒖𝒂𝒏𝒅𝒐 𝑽 = 𝟒
𝒙𝟐 = 𝟏𝟑. 𝟐𝟕𝟕

Como conclusión podemos determinar que la distribución normal con un α de 0,01 es una
buena descripción del proceso de fabricación del yogur. Por lo que la hipótesis es aceptada.
Conclusiones
Bibliografías

Vous aimerez peut-être aussi