Vous êtes sur la page 1sur 22

Universidad Nacional Micaela Bastidas De Apurmac

Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
REVISIN DE LOS FUNDAMENTOS DE ESTADSTICA
I. INTRODUCCIN.
La estadstica est formada por un conjunto de conceptos orientados a la recoleccin y
anlisis de datos tomando en cuenta la variacin de los mismos. Por su parte, el control
estadstico de la calidad es la aplicacin de tcnicas estadsticas al control de calidad.
Reducir la variacin de los procesos es un objetivo clave del control estadstico. Por lo tanto,
es necesario entender los motivos de la variacin, y para ello se parte de que en un proceso
industrial interactan materiales, mquinas, mano de obra (gente), mediciones, medio
ambiente y mtodos. Estos seis elementos (las 6 M) determinan de manera global todo
proceso y cada uno aporta algo de la variabilidad y de la calidad de la salida del proceso.
Teniendo en cuenta todo lo anterior en este presente informe se realizara una breve revisin
sistemtica y coherente acerca de los fundamentos de la estadstica aplicados al control
estadstico de la calidad de los procesos agroindustriales.
II. OBJETIVO.
o Conocer los principales conceptos de estadstica, debido a su importante relacin con
las actividades de control de calidad.

III. FUNDAMENTOS DE ESTADSTICA
La estadstica es la ciencia que proporciona un conjunto de mtodos y procedimientos para
recopilar, organizar (clasificar, agrupar), presentar, y analizar datos con el fin de describirlos
o de realizar generalizaciones vlidas (Crdova, 2003).
3.1. DISTRIBUCIN DE FRECUENCIAS
3.1.1. DEFINICIONES RELATIVAS A LA DISTRIBUCIONES DE FRECUENCIAS
a) Rango de datos (Rx): Es denominado tambin recorrido de datos.
Esto es: Rx = Xmax- Xmin
b) Intervalos de clase (Ii): Denotados generalmente por: Ii = [

[
Dnde:

: lmite inferior de clase;

lmite superior de clase


c) Numero de intervalos de clase (K): Se recomienda usar una de las siguientes
formulas:
K=5, si n 25; K=, si n 25;

y la Regla de Sturges: K= 1+ 3.3 log (n), si n 25


d) Ancho o amplitud de intervalo (C): C=


e) Limites reales de clase (LRi): LRi =


f) Marca de clase (Xi): Xi=*

+
g) Frecuencia absoluta (fi): La frecuencia absoluta fi, es el nmero de datos observados
en cada categora o modalidad.


h) Frecuencia relativa (hi): Se define en cada categora por:

x 100;
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
3.1.2. REPRESENTACIONES GRFICAS
Existe una gran variedad de grficas para la distribucin de frecuencias de variable cualitativa
y cuantitativa.
3.1.2.1. Para variables cuantitativas
Entre las utilizadas tenemos:
a) Histograma de frecuencia: Es la representacin de graficas mediante barras o
rectngulos contiguos, cuyas bases son los limites reales de clase y las alturas estn
dadas por la frecuencias absolutas o relativas: (Ii, fi); (Ii, hi); (Ii, hi%) (Ilasaca, 2012)..
b) Polgono de frecuencias: Es una grfica poligonal cerrada, que se obtiene uniendo
con segmentos de recta, los puntos que tienen proporcionalmente como abscisa a la
marca de clase y como ordenada a la frecuencia respectiva: (Xi, fi); (Xi, hi); (Xi, hi%)
(Ilasaca, 2012).
c) Grfico de lneas o puntos: utilizados para series de tiempos. Est construida
uniendo los pares ordenados tiempo (ti) y frecuencia (fi) mediante segmentos de recta
(Ilasaca, 2012).
3.1.2.2. Para variables cualitativas
Existe una gran variedad de grficas para la distribucin de frecuencias de variable
cualitativa, las ms comunes son la de barras y la de sectores circulares (Crdova, 2003).
a) Grafico o diagrama de barras: En una grfica de barras los datos de cada una de las
modalidades C se representan por una barra rectangular vertical (u horizontal), cuya
altura (o largo) es proporcional a su frecuencia. Las barras se dibujan dejando un
espacio entre ellas (fi, hi o hi%) (Ilasaca, 2012). Si la escala es nominal las categoras
pueden ser colocadas en cualquier orden. Pero, si el nivel es ordinal las categoras
deben ir ordenadas (Crdova, 2003).
b) Grfico de sectores circulares: En una grfica circular, los datos de cada categora C,
se representan por un sector circular cuyo ngulo en el centro es igual a hi x 360. Si la
grfica por sectores circulares es tridimensional es denominada de pastel (Crdova,
2003).
3.1.3. MEDIDAS ALGEBRAICAS DE LA DISTRIBUCIN DE FRECUENCIAS
Los indicadores y medidas resumen los datos en medidas descriptivas que se refieren a la
centralizacin o posicin, a la dispersin o variacin, a la asimetra (Crdova, 2003).
3.1.3.1. Medidas de tendencia central
Las medidas de posicin reflejan la tendencia central y la localizacin de los datos.
a) Media aritmtica (

): Se denomina tambin promedio aritmtico, es un estadgrafo


de posicin.
Media para datos no agrupados:


Media para datos agrupados:


b) Mediana (

): La mediana o valor mediano de una serie de valores observados es el


nmero (

) que separa a la serie de datos ordenados en forma creciente (o


decreciente) en dos partes de igual nmero de datos.
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Mediana para datos no agrupados
i. Si n es par:

=
(

)

ii. Si n es par:


c) Moda (

): Es aquel valor que posee la mxima frecuencia dentro de un conjunto de


datos o distribucin de frecuencias.

3.1.3.2. Medidas de posicin
a) Cuartil. Es cada uno de los tres valores Q1, Q2, Q3 que divide a la distribucin de los
datos en 4 partes iguales. El cuartil Q2 es igual a

.
b) Percentil (o centil). Es cada uno de los 99 valores P1,...,P25,...,P50 ,...,P75,...,P99 que divide
a la distribucin de los datos en 100 partes iguales. El P25 = Q1, P50 = Q2, P75 = Q3

3.1.3.3. Medidas de dispersin
Las medidas de dispersin o variabilidad son nmeros que miden el grado de separacin de
los datos con respecto a un valor central, que generalmente es la media aritmtica.
a) Desviacin media absoluta: Definida como la media asimtrica de los valores
absolutos de las desviaciones de los datos a P (media, mediana y moda), se presentan
los siguientes casos:
i. Para datos no agrupados: Dm ()=
|

; donde : (P=

)
ii. Para de datos agrupados: Dm ()=


b) Varianza (S
2
): La varianza, es una medida que cuantifica el grado de dispersin o de
variacin de los valores de una variable cuantitativa con respecto a su media
aritmtica.
i. Para datos no agrupados: S
2
=
(


ii. Para datos agrupados: S
2
=


c) Desviacin estndar (S): Denominada tambin desviacin tpica, est definida como
la raz cuadrada positiva de la varianza.
i. Para datos no agrupados: S =


ii. Datos agrupados: S =


Interpretacin de la varianza y desviacin estndar:
El valor numrico de la desviacin estndar (S), mide el grado de dispersin de las
observaciones Xi respecto de su media aritmtica (

).
d) Coeficiente de variacin (CV(X)): medida de dispersin relativa, empleada
fundamentalmente para la comparacin de la dispersin de dos o ms muestras, con
diferentes unidades de medida.
CV(X)=

x 100
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Si CV(X) 50%: indica un alto grado de dispersin, la media aritmtica no es adecuada
para representar al conjunto de datos.
Si CV(X)50%: indica un bajo grado de dispersin, la media aritmtica no ser
relativamente adecuada para representar al conjunto de datos.
3.1.3.4. Medidas de asimetra:
a) Primer coeficiente de Pearson: AS =


b) Segundo coeficiente de Pearson: AS =


Si AS0 la distribucin o conjunto de datos es sesgada la izquierda.
Si AS=0 la distribucin o conjunto de datos se distribuyen en forma simtrica,
Si AS0 la distribucin o conjunto de datos es sesgada hacia la derecha.
c) Coeficiente de Curtosis (K): Denominado tambin coeficiente de agudeza, es una
medida que calcula la deformacin vertical, de una distribucin de frecuencias.
K=

)

Si K0.263, la curva es LEPTOCURTICA, la mayora de las observaciones se halla
alrededor del centro de la distribucin de frecuencias.
Si K=0.263, la curva es MESOCURTICA, los datos se hallan regularmente dispersos y
la amplitud de los datos es relativamente mayor que en el caso anterior.
Si K0.263, la curva es PLATOCURTICA, los datos se hallan dispersos en todos los
intervalos y su rango es mayor que en el caso anterior, al igual que S
2
.

3.2. DISTRIBUCIONES MS COMUNES
3.2.1. DISTRIBUCIN NORMAL
La distribucin de probabilidad sigue una distribucin normal de media y desviacin tpica
, y lo representaremos por N ( ; ) cuando la grfica de su funcin de densidad es una curva
positiva continua, simtrica respecto a la media, de mximo en la media.

Figura 01. Distribucin normal N( ; ). El mximo est en ( ,

)
Distribucin normal estndar: Si la variable aleatoria X tiene distribucin normal N ( ,

),
entonces, la variable aleatoria est n Z = (X- )/ , tiene distribucin normal N (0,1). En efecto
E(Z)=0 y Var(Z)=1

Ejemplo aplicativo 1 de la distribucin normal
La utilidad o ganancia liquida diaria, generada por un pequea planta agroindustrial de
yogurt tiene distribucin normal con media $600 y desviacin estndar $100.
a) Calcular la probabilidad de que el ingreso de una familia escogida al azar sea menor
que $400.
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
b) Si el 5% de las familias con mayores ingresos deben pagar un impuesto, a partir de
que ingreso familiar se debe pagar el impuesto?.
Solucin.
Sea X la variable que representa la utilidad de la planta agroindustrial. La distribucin de X es
N (600, (100)
2
).
a) P [ X < 400] = P[Z <

]= p [ z < -2] = 0.0228


b) Se debe hallar K tal que, P[X > K] = 0.05 o P [X < K] = 0.95 , entonces,
0.95 = P[X < K] = P[Z <

] , de donde resulta

= 1.645; K = 764.5.
3.2.2. DISTRIBUCIN BINOMIAL
Se denomina experimento binomial a un nmero fijo, n, de repeticiones independientes de un
experimento aleatorio de Bernoulli, y por lo tanto, se caracteriza por que el espacio muestral
del experimento binomial es el conjunto:

Si k es cualquier valor de la variable binomial, el evento [X= k] consiste de todos los elementos
de que contengan k xitos (E) y n-k fracasos (F). La probabilidad de cada uno de estos
eventos elementales es igual a p
k
q
n-k
.

Por tanto, la probabilidad de obtener k xitos en n pruebas Bernoull es.

Ejemplo aplicativo 2 de la distribucin binomial
La probabilidad de que cierto producto agroindustrial pase con xito una determinada prueba
de calidad es 5/6. Se prueban 10 de tales productos. Si X es la variable aleatoria que se define
como el nmero de objetos que no pasan la prueba:
a) Calcule la media y la desviacin estndar de X.
b) Usando F(x), calcular P[1 < X < 9].
Solucin.
Cada uno de las muestras puede no pasar la prueba (E) o puede pasar la prueba (F). La
probabilidad de que el objeto no pase la prueba es 1/6 y de que pase la prueba es 5/6. La
distribucin de probabilidad X es entonces.
a) La media de esta distribucin es = np = 10( 1/6) = 1.667
Su desviacin estndar es: = ( ) = (

) (

) =1.1785
b) Usando F(x), calcular P[1 < X< 9]; P[1< X <9]=F(9)-F(7)= (

= 0.000

3.2.3. DISTRIBUCIN DE POISSON
Se dice que la variable aleatoria discreta X, cuyos valores posibles son: 0,1,2.....tiene
distribucin de Poisson con parmetro X ( X > 0 ) y se escribe X~P(X), si su funcin de
probabilidad es:

Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Ejemplo aplicativo 3 de la distribucin Poison
Una empresa textil produce un tipo de tela en rollos de 100 metros. El nmero de defectos que
se encuentra al desenrollar la tela es una variable aleatoria de Poisson que tiene en promedio
4 defectos por cada 20 metros de tela.
a) Qu probabilidad hay de que al desenrollar la tela se encuentre menos de tres
defectos en los primeros 50 metros?
Solucin.
Sea X el nmero de defectos encontrados en un segmento de 20 metros de tela que ocurre con
promedio =4. La probabilidad de encontrar k defectos en el segmento de 20xt metros de tela
es:
a) El promedio de defectos en los primeros 50 metros de tela es t = 4x2.5 = 10 (t=2.5
aumenta la longitud de 20 a 50 metros) y la probabilidad de que se encuentren menos
de tres defectos en los primeros 50 metros de tela es:
P [X < 3] = P[X 2] =

()

()

()

= 0.00277

3.2.4. DISTRIBUCIN HIPERGEOMTRICA
Un experimento hipergeomtrico consiste en escoger al azar una muestra de tamao n, uno a
uno sin restitucin, de N elementos o resultados posibles, donde r de los cuales pueden
clasificarse como xitos, y los N r restantes como fracasos.
Se dice que la variable aleatoria X que se define como el nmero de xitos en una muestra de
tamao n que se selecciona al azar uno por uno sin reposicin de N elementos o resultados
posibles, de los cuales r son clasificados como xitos y los restantes N-r como fracasos, tiene
distribucin hipergeomtrica y se escribe X~ H(N, n, r), si su funcin de probabilidad es:

Ejemplo aplicativo 4 de la distribucin Hiergeometrica
Una compaa Agroindustrial recibe semanalmente un embarque de 500 artculos que
constan como parte para ensamblar equipos. La Aduana controla la calidad de cada embarque
probando 10 artculos escogidos al azar uno por uno sin reposicin y rechaza el embarque si
ms de uno de los artculos probados no cumplen las especificaciones. Se sabe que cada
embarque semanal contiene 90% de artculos que cumplen las especificaciones.
Sea X el nmero de artculos en la muestra que no cumplen las especificaciones. Calcule con
qu probabilidad se rechaza cualquier embarque semanal?
Solucin.
Los posibles valores de X son: 0,1,2,...,10 y su distribucin es hipergeomtrica H(500,50,10),
esto es: P [X = k] =

= 1-0.7365=0.2635
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
3.3. RELACIN ENTRE DOS VARIABLES
El objetivo es estudiar la asociacin entre dos variables conocida tambin como asociacin
simple.
3.3.1. CORRELACIN
La medida del grado de relacin se denomina coeficiente o ndice de correlacin. El cuadrado
del ndice de correlacin se denomina coeficiente de determinacin.
a) Covarianza
La covarianza es una estadstica que mide el grado de dispersin o variabilidad conjunta de
dos variables X e Y con respecto a sus medias respectivas ( , ).

La covarianza a diferencia de la varianza, puede ser negativa.
b) Coeficiente o ndice de correlacin
El coeficiente de correlacin lineal de Pearson de n pares de valores (X1, Y1), (X2, Y2),, (Xn, Yn)
de una variable bidimensional (X, Y), es el nmero abstracto r que se calcula por:

El coeficiente de correlacin r es un nmero comprendido entre - 1 y + 1.
Interpretacin:
Si r = 1, se dice que hay una correlacin perfecta positiva.
Si r = -1, se dice que hay una correlacin perfecta negativa.
Si r = 0, se dice que no hay correlacin entre las dos variables.
3.3.2. REGRESION LINEAL
Dados n pares de valores (X1, Y1), (X2, Y2),,(Xn, Yn), de una variable bidimensional (X , Y) . La
regresin lineal simple de Y con respecto a X, consiste en determinar la ecuacin: Y= a + b X

y dividiendo por n la primera ecuacin normal, se tiene: el valor:
3.3.3. REGRESIN CURVILNEA O NO LINEAL
Ajustan a una lnea recta, se puede conseguir una relacin lineal mediante una transformacin
de estos valores. A continuacin se dan algunas ecuaciones no lineales y su transformacin
lineal:

Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
3.4. PRUEBAS ESTADSTICAS
Existen pruebas estadsticas que por lo general son utilizadas para verificar la
homogeneidad de las varianzas y comparar pares de medias.
3.4.1. PARAMTRICAS
3.4.1.1. DISEOS EXPERIMENTALES
A. DISEO COMPLETAMENTE AL AZAR (DCA clsico o Paramtrico).
El muestreo aleatorio o completamente al azar con o sin reposicin es un procedimiento de
seleccin de muestras con probabilidades iguales, que consiste en obtener la muestra unidad
a unidad de forma aleatoria con o sin, reposicin a la poblacin de las unidades
o Modelo Aditivo Lineal
El modelo aditivo lineal para un diseo completamente al azar es el siguiente: Yij = + i + eij
i = 1,,t j = 1,,r
Dnde:
= Es el efecto de la media general
i = es el efecto del i- esimo tratamiento.
eij= es el efecto del error experimental en el i- esimo tratamiento, j- esimo repeticin .
Yij = es el valor o rendimiento observadoen el i- esimo tratamiento j- esimo repeticin.

Ejemplo aplicativo 4 de DCA
Se realiz un experimento para evaluar el efecto de la adicin de compuestos vitamnico al
alimento balanceado en la ganancia de peso en cerdos. Tres diferentes compuestos fueron
evaluados (A, B y C) y un control de (D-sin adicin de compuesto vitamnico). El aumento de
peso tras una semana en una muestra aleatorio de 22 cerdos se da a continuacin.
Compuesto
Vitamnico
Aumento de peso tras una semana en (Lb)

Yi
A 11.1 10.85 65.1 10.2 11.4 10.7 10.85 65.1
B 11.5 11.0 66.0 10.6 11.2 10.9 11.0 66.0
C 10.1 10.5 52.5 10.2 10.4 10.5 52.5
D 9.2 9.84 49.2 9.7 10.4 9.84 49.2

=

= 10.582
El experimento fue conducido bajo el lineamiento de un DCA, por lo que el modelo aditivo
lineal es el siguiente:
Yij = +
i
+ eij i = 1,,t j = 1,,r
Dnde:
= Es el efecto de la media general de las ganancias de peso
i = es el efecto del i- esimo del compuesto vitamnico.
eij= es el efecto del error experimental en el j- esimo cerdo alimentado, con el i- esimo
compuesto vitamnico.
Yij = es la ganancia de peso obtenido en el j- esimo cerdo alimentado con el i- esimo
compuesto vitamnico.
t = 4 (nmero de tramtenos) ; r1 = 6, r2 = 6, r3 = 5, r1 = 4
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
o Estimacin de efectos
Los efectos del modelo son estimados por el mtodo de Mnimos Cuadrados. Este mtodo
permite obtener los valores de y i que minimizan la suma de los errores al cuadrado, es
decir que minimizan la siguiente expresin (Miranda, 2009)
Q =

= Q = (


Para calcular los valores de y i que minimizan la suma de los errores al cuadrado, se debe
solucionar el sistema de ecuaciones obtenido al igualar las derivadas parciales de Q con
respecto a y a cada uno de los i a cero, y la siguiente restriccin adicional:

=0 y

=0
La aplicacin de este mtodo da los siguientes resultados para la estimacin de los
parmetros:
=

eij=

i= del tratamiento y j = de la repeticin


Ejemplo aplicativo 5 continuando el ejemplo 4 de DCA
Con los datos del ejemplo anterior, la media estimada es: = 10.582

= 10.85 - 10.582 = 0.268

= 11.00 - 10.582 = 0.418

= 10.50 - 10.582 = - 0.082

= 9.840- 10.582 = - 0.742


El efecto estimado del error es:

= 9.8 - 9.840 = -0.04


B. DISEO DE BLOQUES COMPLETAMENTE AL AZAR
Conocido como diseo de doble va, se aplica cuando el material es heterogneo. Las unidades
experimentales homogneas se agrupan formando grupos homogneos llamados bloques.
Tratamientos A, B, C, D, E
o Bloque I : B A E C D
o Bloque II : C B D E A
o Bloque III: B E A D C
o Bloque IV: D C A E B
Fuentes Grados de libertad: Tratamiento (t-1) = 4 Bloques (r-1) = 3 Error (t-1)(r-1)=12
o Modelo Aditivo Lineal
Cada observacin del experimento es expresada mediante una ecuacin lineal en los
parmetros, el conjunto conforma el modelo para el diseo de bloques completos al azar:
Yij = + i j + ij i =1,2,...,t y j=1,2,...,r
= Parmetro, efecto medio
i = Parmetro, efecto del tratamiento i
j = Parmetro, efecto del bloque j
ij= valor aleatorio, error experimental.
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Yij = Observacin en la unidad experimental.
Estimacin De Parmetros por Mnimos Cuadrados del Error

El error en cada unidad experimenta es:
Sumas de Cuadrados

es el termino de correccin (TC) de las sumas de cuadrados, en las expresiones de sumas de


cuadrados se acostumbra colocar slo TC.
Ejemplo aplicativo 6 de DBCA
Tres diferentes soluciones tan siendo estudiadas para evaluar su efectividad en el retardo de
crecimiento de bacterias en contenedores de leche de 5 galones. Los anlisis son hechos en
un laboratorio y solo tres ensayos pueden efectuarse en un da dado. Debido a que los das
pueden ser una fuente de variabilidad, el investigado decide utilizar un diseo de bloques
completos al azar. Las observaciones fueron tomadas en cuatro das y los datos en (UFC) se
muestran en la siguiente tabla:
Solucin Das Yi

1 2 3 4
1 13 22 18 39 92 23.0 2498
2 16 24 17 44 101 25.5 3057
3 5 4 1 22 32 8.0 526
Yij 34 50 36 105 225 6081

11.33 16.67 12 35

=

= 10.582
El experimento fue conducido bajo el lineamiento de un DCA, por lo que el modelo aditivo
lineal es el siguiente: Yij = +
i
+ eij i = 1,,t j = 1,,r
Dnde:
= Es el efecto de la media general
i = es el efecto del i- esima solucin.
eij= es el efecto del error experimental en el i- esima solucin, j- esimo da (bloque).

= es el efecto del j- esimo da (bloque)


Yij=es el nmero de UFC observado con la en el i- esima solucin, j- esimo da (bloque).
t = 3 (nmero de tramtenos)
b = 4(nmero de das o bloques)
o Estimacin de efectos: Los efectos del modelo, , i y

; son estimados de modo


que se minimice la siguiente expresin (Mtodo de Mnimos Cuadrados) (Miranda,
2009):
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Q =

= Q = (


Teniendo las siguientes restricciones:

=0 y

=0
La aplicacin de este mtodo da los siguientes resultados para la estimacin de los
parmetros:
=

eij=


Ejemplo aplicativo 7 continuando el ejemplo 6 de DBCA
Con los datos del ejemplo anterior, la media estimada es: =

= 18.75
Los efectos estimados de los tratamientos:

= 23 18.75 = 4.25

= 25.25 - 18.75 = 4.25

= 8 18.75 = - 10.75
Los efectos estimados de los bloques:

= 11.33 18.75 = -7.42

= 16.67 - 18.75 = -2.08

= 12 18.75 = - 6.75

= 35 18.75 = - 16.25
El efecto estimado del error es

:= Y24 -

= 44-25.25-35+18.75 = 2.5
o Anlisis de Varianza
Variabilidad (Total) = Var (Tratamiento) + Var (Bloques) + Var (error)
SC(Error)=SC (Total) SC (Tratamientos) SC (Bloques)
Tabla 1. Cuadro ANVA
Fuentes de
Variacin
Grados de
Libertad
(gl)
Suma de Cuadrados
(SC)
Cuadrados Medios
(SM)
Fc
Tratamientos t-1 SC (Tratamiento) ()
()

()
()

Bloques r-1 SC (Bloques) ()
()


Error
Experimental
(t-1) (r-1) SC (Error) ()
()


Total tr-1 SC (Total)

Ejemplo aplicativo 8 de continuando el ejemplo 7 de DBCA
SC (Total)=

TC = (13
2
+ 22
2
+..+22
2
)-

()()
= 1862.25
SC (Tratamiento)=

TC = (

()()
) = 703.5
SC (Bloques)=

TC = (

()()
)= 1106.92
SC(Error)=SC (Total) SC (Tratamientos) SC (Bloques)= 51.83
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Tabla 2. Cuadro ANVA del ejemplo
Fuentes de
Variacin
Grados de
Libertad
(gl)
Suma de
Cuadrados
(SC)
Cuadrados Medios
(SM)
Fc
Tratamientos 2 703.5 351.75 40.72
Bloques 3 1106.92 368.97 42.70
Error
Experimental
6 51.83 8.64
Total 11 1862.25
Asumiendo un modelo de efectos fijos, las hiptesis en trminos de los efectos de los
tratamientos son:
H0: i =0 i=1, 2, 3 H1: i 0, para al menos un i
En trminos de las medias de los tratamientos:
H0: i = i=1, 2, 3 H1: i , para al menos un i
0, para al menos un i
O literalmente; H0: las tres soluciones son igualmente efectivas en el retardo del crecimiento
de bacterias en contenedores de leche.
H1: al menos una de las soluciones tienen una efectividad diferente en el retardo del
crecimiento de bacterias en contenedores de leche.
El estadstico de prueba Fc= 40.72; el valor de la tabla para un nivel de significacin del 5%
es F(0.95, 2,6) =5.14. dado que el estadstico de prueba resulta mayor que el valor de tabla se
rechaza H0. En conclusin existe suficiente evidencia estadstica para aceptar que las tres
soluciones no son igualmente efectivas en el retardo del crecimiento de bacterias en
contenedores de leche. El coeficiente de variacin para este experimento es:
CV =

= 15.68%
3.4.1.2. PRUEBAS DE COMPARACIN DE PROMEDIOS
A. PRUEBA DE t de STUDENT
La prueba de t Student, es un mtodo de anlisis estadstico, que compara las medias de dos
grupos diferentes. Es una prueba paramtrica, o sea que solo sirve para comparar variables
numricas de distribucin normal.
En definitiva la prueba de t Student contrasta la H0 de que la media de la variable numrica
y, no tiene diferencias para cada grupo de la variable categrica x.

Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Ejemplo aplicativo 9 de la prueba t de Student
Se desea saber si la conciencia de los empleados de una plana Agroindustrial ha variado
positivamente despus de una intervencin de capacitacin acerca de las BPM y el HACCP. Los
datos son los siguientes
Tabla 3. Resultados obtenidos en el anlisis
NIVEL DE
CONCIENCIA
ANTES DE LA
INTERVENCIN
NIVEL DE
CONCIENCIA
DESPUS DE LA
INTERVENCIN
92 94
85 97
74 93
40 99
36 92
85 98
55 77
66 93
88 96
75 100
89 95
66 93
A partir de la tabla se obtienen que:


Se Rechaza Ho: Al comparar los valores, podemos rechazar la hiptesis nula con un margen
de error de 5%, por lo cual podemos afirmar que la conciencia de los trabajadores de la planta
ha variado positivamente despus de la intervencin.
B. PRUEBA DUNCAN
La Prueba del Rango mltiple Duncan es otra prueba para determinar la diferencia entre pares
de medias despus que se ha rechazado la hiptesis nula en el anlisis de varianza.
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos"
(Duncan los llama rangos significativos mnimos) dados por la frmula:

Donde p toma valores entre 2 y K (K es el nmero de tratamientos), d se obtiene de la tabla T-
9 y el CMError se obtiene de la tabla de ANDEVA respectiva.
Ejemplo aplicativo 10 de la prueba Duncan
Se realiz un experimento para determinar la cantidad (en gramos) de grasa absorbida por 48
donas (doughnuts) usando ocho tipos diferentes de grasas (aceites y mantecas). Las medias
para los ocho tratamientos se muestran a continuacin:

Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error de
141.6, los grados de libertad del error son 48-8 =40.
Seleccionando = 0.05 para este ejemplo, los rangos de Duncan son:





Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para = 0.05,
= 0.05, 2 p 8 y 40 grados de libertad.
El siguiente paso es ordenar las medias en orden creciente para establecer los "rangos".

El rango entre las medias mxima y mnima se compara con D8, esto es, ,
entonces existe diferencia significativa entre las grasas 4 y 7.

Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
El prximo paso es comparar subconjuntos de siete medias con el rango D7.
, entonces
, entonces
Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en conjuntos de seis
medias.
, entonces
, entonces
, entonces
Nuevamente stos exceden D6, entonces stos se subdividen en subconjuntos de cinco medias
, entonces
, entonces
, entonces
, entonces
Como las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261 que fue no
significativo, los rangos de las medias en el subconjunto 3261 no se comparan
con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con D4; por lo
tanto, , entonces
Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan con D4 porque
ya fueron declarados no significativos en los conjuntos de cinco medias. Por lo tanto, el
proceso termina.
Los resultados se muestran grficamente en la siguiente figura, donde las medias que estn
debajo de una lnea no son significativamente diferentes.

El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3 son
significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor que las 8 y
7 y las dems grasas no son significativamente diferentes en relacin con la cantidad
absorbida.
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
C. MTODO DE TUKEY O MTODO DE LA DIFERENCIA SIGNIFICATIVA HONESTA DE
TUKEY (DSH)
La prueba de Diferencia Significativa Honesta (DSH) de Tukey, al igual que la DSM, slo se debe
usar despus que se ha rechazado la hiptesis nula en el anlisis de varianza y cuando todos
los tamaos de muestra son iguales; pero a diferencia de la DSM emplea el valor . En
lugar de . Este valor q se obtiene de la tabla T-8, para el nivel de significancia a , el
nmero de tratamientos K y los grados de libertad del error, entonces:

Ejemplo aplicativo 11 del anlisis de varianza (ANDEVA)
Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por
el gobierno para el control de desechos de fabricacin, pero quisiera determinar cul es la
situacin de las otras tres. Para el efecto se toman cinco muestras de los lquidos residuales de
cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del
experimento aparecen en la siguiente tabla.
Tabla 4 Cantidad de contaminantes para cuatro plantas de una empresa.
Planta contaminantes n
i



A 1.65 1.72 1.50 1.35 1.60 5 7.84 1.568
B 1.70 1.85 1.46 2.05 1.80 5 8.86 1.772
C 1.40 1.75 1.38 1.65 1.55 5 7.73 1.546
D 2.10 1.95 1.65 1.88 2.00 5 9.58 1.916
Total: N = 20
Antes de realizar el anlisis de varianza se debe trazar el diagrama de cajas mltiple para
determinar si existen casos extraordinarios y si se cumple el supuesto de varianzas iguales:

Figura 2 Diagrama de caja para los datos del ejemplo 11
Los clculos se muestran en la siguiente tabla de ANDEVA.
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
Tabla 5. ANDEVA para los datos de contaminacin.
Fuente g.l. Suma de cuadrados Cuadrados
medios
F
calculada
F
tablas

Trat.
"Plantas"
4 1=
3



Error 20 4
=16





Total
20 1
=19



Conclusin: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa
(al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.
Ejemplo aplicativo 12 de la prueba Tukey continuando el ejemplo 11
Para los datos del ejemplo 1 y = 0.05,

Los valores absolutos de las diferencias entre del ejemplo 1 se muestran
en la siguiente tabla.
Tabla 6. Valores absolutos de las diferencias
entre del ejemplo 12



-- 0.204 0.022 0.348

-- -- 0.226 0.144

-- -- -- 0.370
Como se puede observar, las diferencias que exceden (DSH) estn entre las medias ,
y , por lo tanto, slo difieren las medias 4 de 1 y de 3.
Es importante tener presente que la prueba DSH slo se debe emplear cuando el ANDEVA ha
conducido al rechazo de H0. Si las muestras no son del mismo tamao no se debe usar DSH.


Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
3.4.2. NO PARAMTRICAS
A. PRUEBAS PARA K MUESTRAS DEPENDIENTES O RELACIONADAS
Cuando las k muestras estn relacionadas de forma que las caractersticas de los i-simos
elementos de cada muestra son idnticas o lo ms parecidas posible; pueden utilizarse alguna
de las alternativas no paramtricas que se presentan a continuacin.
o PRUEBA DE FRIEDMAN
La prueba Friedman es la alternativa no paramtrica para el diseo de bloques completos al
azar. Los datos consisten en k muestras relacionadas (correspondientes a los k tratamientos),
cada bloque de tamao b (nmero de bloques). Se asigna el rango 1 a la observacin ms
pequea, 2 a la segunda y asi sucesivamente hasta la ms grande de las k observaciones
dentro de cada bloque. En caso de empates se utiliza la media de los rangos correspondientes.
Sea R(Xij) el rango asignado a la observacin Xij dentro del bloque j y sea Ri la suma de los
rangos asignados a la muestra i (Miranda, 2009).
Ri = (

; a partir de esta frmula se debe calcular Ri para cada muestra


(tratamiento)
Supuestos: primero; Los b bloque son mutuamente independientes (Los resultado dentro
de un bloque no influyen en los resultados dentro de los otros). Segundo; La escala de media
al menos ordinal, de modo que las observaciones pueden ser ordenadas dentro de cada
bloque.
Procedimiento de la prueba: Hiptesis: H0: los tratamientos tiene los mismos efectos; H1: al
menos uno de los tratamientos tiene un efecto diferente.
Estadstico de prueba: Primero calcule los valores de A y B:
A = [(

)]

B=

; si no existe empates, A se simplifica a: A =


()()


El estadstico de prueba es: T=
()[

()

]

()


Regla de decisin: La hiptesis nula s e rechaza con un nivel de significacin si T resulta
mayor que el valor de la tabla
( )

.
Ejemplo aplicativo de la prueba de Friedman
Se desea comparar la calidad de 4 marcas de vino. Para ello, se pide a 8 jueces que prueben
(en orden aleatorio) cada una de las 4 muestras y las califiquen en una escala del 0 al 10. Los
resultados se presentan a continuacin.

Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad

Tabla 7 resultados de la prueba sensorial
Vino Juez
1 2 3 4 5 6 7 8
A 9 7 8 6 5 8 6 4
B 8 5 8 2 4 4 3 2
C 9 6 7 6 4 7 5 3
D 5 5 3 5 4 5 6 4
Existen diferencias significativas entre las calidades de los vinos?
Hiptesis: H0: los 4 tipos de vinos son de la misma calidad; H1: al menos uno de los tipos de
vino es de diferente calidad.
La asignacin de los rangos a las observaciones de menor a mayor dentro de cada bloque
(juez) se presenta en el siguiente cuadro.
Tabla 8 Asignacin de los rangos a las observaciones
Vino Juez Ri
1 2 3 4 5 6 7 8
A 3.5 4 3.5 3.5 4 4 3.5 3.5 29.5
B 2 1.5 3.5 1 2 1 1 1 13
C 3.5 3 2 3.5 2 3 2 2 21
D 1 1.5 1 2 2 2 3.5 3.5 16.5
Los valores de A y B son: A = [(

)]

B=

= 219.0625
El estadstico de prueba: T=
()[()()
()

()()

]

()()()

= 13.07
El valor de la tabla para un nivel de significacin del 5% es de
( )

=7.815. como el
estadstico de prueba resulta mayor que el valor d ela tabla se rechaza H0 y se concluye que
existe suficiente evidencia estadstica que al menos uno de los tipos de vino es de diferente
calidad.
o PRUEBA Q DE COCHRAN
Cuando sobre n elementos se observa la serie de respuestas de cada uno de ellos a k
''tratamientos'' esta prueba permite contrastar la hiptesis nula de que no existe diferencia
significativa entre los k ''tratamientos''.
Esta prueba es adecuada cuando la respuesta a cada tratamiento es una variable dicotmica,
siendo X = 1 si la respuesta es ''xito'' y X = 0 si es ''no xito''
El estadstico de prueba es:
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad

Donde Li es el total de ''xitos'' del primer elemento o grupo.
Si la hiptesis nula es cierta, la distribucin de Q puede aproximarse mediante una chi-
cuadrado con k - 1 grados de libertad y se rechaza la hiptesis nula si el valor de Q es superior
al valor crtico para el nivel de significacin deseado.
A. PRUEBAS PARA K MUESTRAS INDEPENDIENTES
En este apartado se presentan dos pruebas que permiten contrastar si k >2 muestras
aleatorias e independientes proceden de una misma poblacin, es decir, si un factor que
subdivide la poblacin de origen incide de forma significativa sobre el valor central de la
poblacin.
o PRUEBA H DE KRUSKAL-WALLIS
La prueba de KRUSKAL-WALLIS, es la alternativa no paramtrica para el diseo
completamente al azar. Los datos consisten de k muestra independientes (correspondientes
a los k tratamientos) de tamaos ni (i =1,k); sea N que denota el total de observaciones.
N=


Se asigna el rango 1 a las observacin ms pequeas, 2 a la segunda y as sucesivamente hasta
la ms grande de las N, la cual recibira el rango N. En caso de empates se utiliza la media de
los rangos correspondientes. Sea R(Xij) el rango asignado a la observacin Xij y sea Ri la suma
de los rangos asignados a la muestra i (Miranda, 2009).
Ri = (

; calcular Ri para cada muestra (tratamiento)


Procedimiento de la prueba: Hiptesis: H0: las k muestras proviene de poblaciones
idnticas; H1: las k muestras no proviene de poblaciones idnticas.
Debido a que esta prueba est diseada para encontrar diferencia entre las medias de las
poblaciones, las hiptesis algunas veces (cuando la variable sea cuantitativa) pueden
definirse como siguen:
H0: las k muestras poblaciones tienen la misma media; H1: las k muestras no poblaciones
tienen la misma media.
Estadstico de prueba: H=


()

); donde:

( (

)
()

)
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
si no existe empates,

se simplifica a:

=
()

y el estadstico de prueba se reduce a:


El estadstico de prueba es: H=

()

()


Regla de decisin: La hiptesis nula se rechaza con un nivel de significacin si H resulta
mayor que el valor de la tabla
( )

.
Ejemplo aplicativo de la prueba de Kruskal-Wallis
Para evaluar el efecto de la expectativa sobre la percepcin de la calidad en vinos, un
investigador asigno aleatoriamente 24 bebedores aficionados a tres grupos A, B y C, de 8
individuos cada uno. Cada individuo fue citado para una entrevista individual.
Desafortunadamente, uno de los individuos del grupo B y 2 del grupo C no se presentaron por
lo que el investigador tuvo que trabajar con muestras de distinto tamao. A los individuos
que si se presentaron se les pidi que prueben una copa de vino y que la evalen en una
escala de 10 puntos donde 1 era el calificativo menor y 10 el mayor. En realidad, los tres
grupos probaron el mismo vino; la nica diferencia est en la presentacin de la muestra,
la cual es diseada para inducir a una alta expectativa sobre la calidad del vino en los
miembros del grupo A, una baja expectativa en os miembros del grupo C y una expectativa
en los del grupo B. la siguiente tabla muestra los calificativos asignado por los 21 individuos.
Grupo A 6 7 7 8 8 9 9 9
Grupo B 4 5 5 6 8 8 7
Grupo C 3 4 5 5 8 6
Hiptesis: H0: La presentacin del vino no influye en la percepcin de su calidad; H1: la
presentacin si influye en la percepcin de su calidad.
La asignacin de los rangos a las observaciones, de menor a mayor (desde 1 a 21), se
presentan en el siguiente cuadro
Grupo A 9 12 12 16 16 20 20 20 R1=125
Grupo B 2.5 5.5 5.5 9 16 16 12 R2=66.5
Grupo C 1 2.5 5.5 5.5 16 9 R3=39.5
Note que en este caso hay varios empates por lo que los clculos sern los siguientes:
(

9
2
+12
2
+..+9
2
=3289.5

(
()

)= 37.425
H=

()

)= 8.12
De haber pocos empates el clculo se simplificara a:

= (
()

)= 38.5 H=

()
(

) ( )= 7.89
Universidad Nacional Micaela Bastidas De Apurmac
Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Agroindustrial

Control de Calidad
El valor de la tabla para un nivel de significacin del 5% es de
( )

= 5.99. Como el
estadstico de prueba resulta mayor que el valor de la tabla se rechaza H0 y se concluye que
existe suficiente evidencia estadstica para aceptar que la presentacin del vino influye en la
percepcin sobre su calidad.
IV. CONCLUSIONES
Se conocieron los principales conceptos de estadstica, debido a su importante relacin con las
actividades de control de calidad realizando una breve descripcin de todos las herramientas
necesarias que nos brinda la estadstica para aplicar y medir la variabilidad de un fenmeno,
proceso, etc.
Los fundamentos de la estadstica nos permiten la recoleccin, agrupacin, tratamiento y
anlisis de datos tomando en cuenta la variacin de los mismos, estas variaciones son
indispensables conocerlas ya sea para ejecutar investigacin o aplicarlos al control de la
calidad, puesto que reducir la variacin de los procesos es un objetivo clave del control
estadstico. Por lo tanto, es necesario entender los motivos de la variacin.
Existen infinidad de tcnicas desde una simple elaboracin de distribucin de frecuencias,
aplicar una regresin lineal hasta realizar experimentos factoriales, pruebas paramtricas y
no paramtricas para evaluar la variabilidad de determinados datos observados.
V. REFERENCIAS BIBLIOGRFICAS
BESTERFIELD, Dale H. 2009. Control de Calidad. Octava edicin, Prentice Hall
Editorial Pearson. Mxico.
CRDOVA Z., Manuel. (2003). Estadstica descriptiva e inferencial. Editorial
Moshera Lima (Per).
GUTIERREZ P, H y DE LA VARA S, R (2009). Control estadstico de calidad y seis
sigma. Segunda edicin. McGRAW-HILL/Interamericana Editores, S.A. de C.V. Mxico.
ILASACA C., Edwar. (2012). Estadstica y probabilidad. Editorial Megabyte Lima
(Per).
MIRANDA V, F. (2009). Mtodos estadsticos para la investigacin en tecnologa de
alimentos. Universidad Nacional Agraria La Molina. Lima (Per).

Vous aimerez peut-être aussi