Académique Documents
Professionnel Documents
Culture Documents
Medidas
Estadstica Descriptiva
Distribucin
Contenidos
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 2
Entradas
Mtodos Materiales Medio ambiente Mano obra Mquina Mediciones
Salidas
Proceso
f(X) X Y
VN
Las variables de salida o de respuesta de un proceso deben cumplir ciertas metas o especificaciones. Una tarea primordial del control de la calidad es conocer la capacidad o habilidad del proceso para cumplir con esa especificacin, es decir:
Determinar la amplitud de la variacin natural del proceso para una caracterstica de calidad dada.
Capacidad de un proceso
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 3
Para realizar un estudio de capacidad se toman datos del proceso durante un perodo considerable, para que se refleje bien el desempeo del proceso para una caracterstica dada. Esto permitir saber en qu medida tal caracterstica de calidad es satisfactoria. Las tcnicas de la estadstica descriptiva son de gran utilidad para entender mejor el desempeo del proceso.
Capacidad de un proceso
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 4
El primer aspecto a investigar para determinar la capacidad del proceso consiste en conocer la tendencia central de los datos, es decir, identificar el valor en torno al cual los datos tienden a aglomerarse o concentrarse. Esto permitir saber si el proceso est centrado; es decir, si la tendencia central de la variable de salida es igual o est muy prxima a un valor nominal deseado.
Media muestral
Para las observaciones numricas de una muestra, la medida ms usual de su tendencia central es proporcionada por la media (o promedio) muestral, que es igual a la media aritmtica de todos los datos:
x1 + x2 + x3 + K + xn X= = n
xi i =1 n
Media poblacional o del proceso, Si para calcular la media se utilizan todos los elementos de la poblacin (todos los posibles individuos, especmenes o medidas de inters sobre los que se hace el estudio), entonces el promedio calculado es la media poblacional (o media del proceso).
=
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad
xi i =1
Importante destacar: La media del proceso es igual a cierto valor, aunque no siempre se conoce; mientras que el valor de se obtiene para cada muestra y es diferente (variable) de una muestra a otra, ya que su valor depende de las piezas que se seleccionan ( es una variable aleatoria).
Importante destacar: Es preciso tener cuidado con las afirmaciones que se hacen sobre la media del proceso o poblacin basadas en . Lo que se observa en los estadsticos muestrales acerca del comportamiento de los datos, es vlido para la muestra,
en la medida que sta sea representativa y grande, tambin tendr cierto grado de aproximacin para todo el proceso.
(es necesario utilizar tcnicas estadsticas para evaluar lo que significan en todo el proceso).
La mediana , es otra medida de tendencia central que es igual al valor que divide a la mitad a los datos cuando son ordenados de menor a mayor. Para calcular la mediana:
Cuando el nmero de datos es impar, estos se ordenan de manera creciente y el que quede en medio de dicho ordenamiento, ser la mediana. Cuando el nmero de datos es par, estos se ordenan de manera creciente y la mediana se calcula dividiendo entre dos la suma de los datos que estn en el centro del ordenamiento.
Mediana o percentil 50
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 10
La moda es otra forma de medir la tendencia central de un conjunto de datos, es igual al dato que se repite ms veces.
Si varios datos tienen la frecuencia ms grande, entonces cada uno de ellos es una moda y se dice que el conjunto de datos es multimodal.
Moda
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 11
Debido a que la media es la medida de tendencia central ms usual, en ocasiones se cometen los siguientes errores:
Confundir el concepto de media con el de mediana y moda respectivamente. No tener en cuenta el efecto de los datos atpicos sobre las medidas.
La media es afectada por los datos extremos o atpicos, la mediana no se ve afectada (ni cuando la muestra es sesgada).
Las medidas de tendencia central no son suficientes como criterios de calidad de un proceso. La media, mediana y moda, no toman en cuenta qu tan dispersos estn los datos, un hecho vital para evaluar la calidad del proceso.
La variabilidad es importante para evaluar la estabilidad del proceso, por lo tanto, se requieren medidas adecuadas para conocer este comportamiento.
Otro elemento vital en el estudio de capacidad de un proceso es determinar su variabilidad o dispersin, es decir, qu tan diferentes son los datos entre si. Las medidas ms comunes para determinar variabilidad son las siguientes:
Desviacin estndar (muestral y poblacional) Rango o recorrido Coeficiente de variacin Lmites reales o naturales
La Desviacin estndar muestral es la medida ms usual de variabilidad e indica qu tan esparcidos estn los datos con respecto a la media.
Se denota por la letra S y se calcula mediante la siguiente expresin:
S= S=
(x x )
n 1
2
n ( x ) ( x ) n(n 1)
La Desviacin estndar muestral S mide la distancia que en promedio hay entre los datos y la media;
Entre ms grande el valor de S, habr mayor variabilidad en los datos; Es expresada en las mismas unidades que los datos; No muestra la magnitud de los datos, slo refleja lo retirados que estn de la media; Al igual que la media, es afectada por los datos atpicos.
Si para calcular la desviacin estndar se emplean todos los individuas de la poblacin o proceso, entonces se obtiene la desviacin estndar poblacional y se denota por la letra griega sigma ()
Se calcula mediante la siguiente expresin:
(x )
El significado de la desviacin estndar como medida de dispersin con respecto a la media, se puede entender a travs de:
Desigualdad de Chebyshev Regla emprica En general, la desigualdad de Chebyshev afirma que, al menos 2
Es decir, la desigualdad de Chebyshev afirma que, entre (X 2S ) estn por lo menos el 75% de los datos de la muestra y entre (X 3S ) estn por lo menos el 89% de stos. Por su parte, la regla emprica, se afirma que en muchos de los datos que surgen en la prctica se ha observado por la experiencia que: entre ( X 1S ) est el 68% de los datos de la muestra y
Otra medida de dispersin es el rango o recorrido, R, que es igual a la diferencia entre el dato mayor y el menor de un conjunto de datos. El rango mide la amplitud de la variacin del grupo de datos y es independiente de la magnitud de los datos.
Rango o recorrido, R
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 20
El coeficiente de variacin, CV, es una medida de variacin que es relativa a la magnitud de los datos. CV es igual a la magnitud relativa de la desviacin estndar en relacin a la media de los datos.
s CV = (100 ); CV = (100 ) x
CV es til para comparar la variacin de dos o ms variables que estn medidas en diferentes escalas o unidades de medicin.
Coeficiente de variacin, CV
Dr.-Ing. J. Nez S. ILM 271: Fundamentos de la Calidad 21
CV es til para comparar la variacin de dos o ms variables que estn medidas en diferentes escalas o unidades de medicin. Suele interpretarse como una medicin en trminos porcentuales de la variacin de una variable.
Los lmites reales o naturales de un proceso, indican las magnitudes entre las cuales vara la salida de un proceso. Se obtienen de la siguiente manera:
El histograma y la tabla de frecuencia permiten visualizar, en forma conjunta, la tendencia central y la dispersin de un conjunto de datos. Adems, muestran la forma en que los datos se distribuyen dentro del rango de variacin.
La tabla de frecuencia es una lista de valores de datos (ya sea de manera individual o por grupos de intervalos o clases), junto con sus frecuencia (absoluta o conteos) correspondientes.
Clase [gr] 0 - 99 100 199 200 299 300 399 400 499 Frecuencia 11 12 14 1 2
El histograma es una representacin grfica, en forma de barras, de la distribucin de frecuencias de una variable,
donde los datos se clasifican por su magnitud en cierto nmero de clases, representadas por una barra, cuya longitud es proporcional a la frecuencia de los valores representados.
Frecuencia
16 14 12 10 8 6 4 2 0
0 - 99 100 - 199 200 - 299 300 - 399 400 - 499
Pesos [gr]
Clases: son los grupos de intervalos que se usan para organizar o resumir los datos. Numero de clases: es la cantidad de intervalos en que se divide el rango de variacin. Se recomienda de 5 a 15. (app. igual a la raz cuadrada del nmero de datos). Los lmites de clase inferiores: son las cifras ms pequeas que pueden pertenecer a las diferentes clases. Los lmites de clase superiores: son las cifras ms grandes que pueden pertenecer a las diferentes clases.
Las fronteras de clase: son las cifras utilizadas para separar las clases, aunque sin los espacios creados por los lmites de clase. Se obtienen de la siguiente manera:
Se determina el tamao del espacio entre el lmite de clase superior de una clase y el lmite de clase inferior de la siguiente. Se suma la mitad de esa cantidad a cada lmite de clase superior, para obtener las fronteras de clase superiores; se resta la mitad de esa cantidad de cada lmite de clase inferior, para obtener las fronteras de clase inferiores.
Las marcas de clase: son los puntos medios de las clases. Cada marca de clase se calcula sumando el lmite de clase inferior con el lmite de clase superior y dividiendo la suma entre dos. La anchura de clase: es la diferencia entre dos lmites de clase inferiores consecutivos o dos fronteras de clase inferiores consecutivas.
El proceso para determinar las fronteras de clase se simplifica si se comprende que stas bsicamente llenan los espacios entre clases al dividir en dos la diferencia entre el final de una clase y el inicio de la siguiente.
Debemos tener claro que el nfasis est en la interpretacin de las herramientas que proporciona la estadstica descriptiva.
Estadsticos Histograma Diagrama de caja
No perder de vista que el propsito es la evaluacin de la calidad del proceso, (su capacidad para cumplir la especificacin de la variable de calidad)
Aun cuando se cumplan las especificaciones, si el proceso no est centrado, la calidad que se produce no es adecuada, ya que entre ms se aleje del ptimo, ms mala calidad se tendr.
Las situaciones que pueden causar esto, son las mismas que las de la distribucin multimodal, pero con la particularidad de que las diferencias son menos fuertes. Sin embargo, son situaciones que afectan de manera seria la capacidad de un proceso.
Si han sido descartadas las dos situaciones anteriores, entonces la medicin se debe a un evento raro o especial. Es decir, cuando se hizo la medicin, en el proceso estaba ocurriendo una situacin especial o fuera de lo comn.
Necesidad de Estratificar
En ocasiones, en el histograma no se observa ninguna forma particular, pero existe mucha variacin, y en consecuencia, la capacidad del proceso es baja. Cuando los datos proceden de distintas mquinas, proveedores, lotes, turnos u operadores, puede encontrarse informacin valiosa si se hace un histograma por cada fuente (estrato), con lo que se podr determinar cul es la maquina o el proveedor, etc., ms problemtico.