Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCION
DEFINICIONES IMPORTANTES
Se han intentado muchas definiciones sobre la ESTADSTICA, algunos la consideran una ciencia que tiene como base la matemtica (teoria de las Probabilidades) y es tambin una metodologa de trabajo cientfico que se justifica y resalta en el uso de los mtodos estadsticos en toda investigacin. El curso desarrollado por el Sr. Celestino Ore es muy prctico y sumamente interesante por lo sencillo de su aplicacin y comprensin. El intenta definir la estadstica como una disciplina que nos proporciona un conjunto de mtodos y procedimientos que permiten recopilar, clasificar, presentar y describir datos en forma adecuada para tomar decisiones
DEFINICION DE LA ESTADISTICA
Pgina 1 de 54
Estadstica Capitulo VI
frente a la incertidumbre o predecir o afirmar algo acerca de la poblacin o sus parmetros a partir de los datos extrados de la misma.
POBLACIN Y MUESTRA
Poblacin, es el conjunto mayor o universo de objetos que por lo menos tienen una caracterstica comn, cuyo estudio nos interesa o acerca de las cuales se desea informacin. Los elementos de este conjunto se denominan Unidades Estadsticas. La poblacin puede ser finita o infinita. Si la poblacin es infinita ser imposible tener informacin completa sobre ella o si la poblacin es finita pero numerosa y no sea posible estudiar todos y cada uno de sus elementos se acude a la informacin proporcionada por una parte representativa i finita de dicha poblacin llamada MUESTRA Se llama Datos u observaciones a las unidades estadsticas obtenidas o recopiladas en forma total (datos poblacionales) o en forma parcial (datos muestrales) OBSERVACIONES CUANTITATIVAS Y CUALITATIVAS Las observaciones contables o medibles se denominan cuantitativas: ejemplo estatura de estudiantes, edad de las personas. Las cualitativas son las que no se pueden medir, ejemplo estado civil de las personas puede ser casado, soltero, viudo, etc, es una cualidad pero no se mide. PARMETRO Y ESTADIGRAFO Parmetro.- Es un nmero que describe alguna caracterstica de la poblacin y para determinar su valor es necesario utilizar la informacin poblacional completa y por tanto las decisiones se toman con certidumbre total
Pgina 2 de 54
Estadstica Capitulo VI
Estadgrafo.-Es un numero que se obtiene a partir de los datos muestrales y describe alguna caracterstica de la muestra y la toma de decisiones contiene cierto grado de incertidumbre. Se puede distinguir dos definiciones importantes
ESTADISTICA DESCRIPTIVA
ESTADISTICA INFERENCIAL
Nos proporciona la teoria necesaria para tomar decisiones frente a la incertidumbre o afirmar algo acerca de la poblacin a partir de los datos bajo estudio. Cuando no es posible una informacin completa de una poblacin se extraen muestras representativas de dicha poblacin mediante Tcnicas de Muestreo y en base al estudio o informacin obtenida de los datos muestrales se toman decisiones frente a la incertidumbre o se afirma algo acerca de la poblacin con la ayuda de la estadstica Inferencial VARIABLES, DATOS UNIVARIANTES Y MULTIVARIANTES Los datos pueden representarse simblica o matemticamente mediante variables o letras. Ejemplo n datos se representan por x1, x2, ... xn. A las variables asociadas a las observaciones cualitativas se le denominara Variables Cualitativas y son las que tienen valores que son cualidades o atributos. Las variables Cualitativas pueden ser NOMINALES (no implican orden) y ORDINALES ( existe algn orden, jerarqua o categoras entre los atributos. A las variables asociadas a observaciones cuantitativas se le denominara Variables Cuantitativas y son aquellas cuyos valores son nmeros. Las variables cuantitativas Pgina 3 de 54
Estadstica Capitulo VI
pueden ser discretas (surgen del proceso del conteo) o continuas (que surgen del proceso de medicin). Los datos pueden expresarse por medio de una sola variable (datos univariantes o unidimensionales) o se pueden expresar con dos o mas variables (datos multivariantes), en general estos ltimos se conocen como datos n-dimensionales que representan n caractersticas que pueden ser observadas simultneamente en cada dato y as estaremos frente a datos multivariantes o multidimensionales.
Pgina 4 de 54
Estadstica Capitulo VI
ESTADISTICA DESCRIPTIVA
DEFINICION
Es la ciencia o metodologa, que se ocupa de la recopilacin, clasificacin, presentacin y descripcin de datos
RECOPILACION
La recopilacin puede ser de dos tipos :
CLASIFICACION:
El objetivo de la Clasificacin de los datos es condensar y simplificar sin perder muchos detalles. Bsicamente en un conjunto de datos se observa un mximo y otro mnimo, es lo primero que se aprecia cuando los datos se ordenan en forma creciente o decreciente. Clasificar tambin significa sub-dividir en grupos mas condensados a estos grupos se les denominara clases
Pgina 5 de 54
Estadstica Capitulo VI
Se cita un ejemplo tpico muy practico, as, clasificar los datos recopilados del numero de hijos que tiene cada una de las 40 familias de un distrito minero, elegidos al azahar y que se muestra en el primer recuadro :
1 4 0 5 2 3 0 4 0 3 4 6 3 5 9 8 5 12 0 2 1 0 1 0 0 4 3 1 8 3 2 3 1 0 1 2 2 10 3 0
0 1 3 4
0 1 3 5
0 1 3 5
0 1 3 5
0 1 3 6
0 2 3 8
0 2 3 8
0 2 4 9
0 2 4 10
1 2 4 12
0 0 0 0 0 0 0 0 0
1 1 1 1 1 1
2 2 2 2 2
3 3 3 3 3 3 3
4 4 4 4
5 5 5
8 8
10
12
Los datos recopilados tal como se registran en el primer recuadro estn en completo desorden y no sugieren ninguna conclusin o interpretacin. Se procede a organizarlos en orden creciente de sus magnitudes en horizontal o bien en vertical (recuadros siguientes), se observa que el mnimo es cero y el mximo es 12 y adems que el dato que mas se repite es cero 0, pero clasificandolos se puede distinguir otras caractersticas junto a conseguir mayor simplificacin o condensacin de los datos en estudio ALCANCE : Intervalo cerrado de menor y mayor valor Ej: [0, 12 ], es decir el mnimo hasta el mximo valor encontrados.
Pgina 6 de 54
Estadstica Capitulo VI
RANGO : o Amplitud Longitud del alcance Ej. |12-0| = 12 INTERVALOS DE CLASE, sub-dividir en k-sub-grupos equivale a particionar el alcance en k partes, llamados intervalos de clase o simplemente clases. Los extremos de cada intervalo se denominaran limites inferior y superior. El intervalo puede ser cerrado o abierto, cerrado si incluye el valor , abierto si no lo incluye. El criterio para particionar un alcance en intervalos es que sea suficientemente pequeo para lograr la simplificacin deseada pero lo suficientemente amplio para minimizar los posibles errores de clasificacin. El siguiente es una regla practica para sub-dividir datos en clases.
REGLA DE STURGES :
Para dividir en intervalos de clase un alcance de manera practica, considerar la siguiente relacin K = 1 + 3.3 Log n Si n es el numero de datos, para el ejemplo n= 40, luego K = 6.2868 ; entonces el numero de clases K puede ser 5, 6 o 7 intervalos Limites de Clase : Son los valores extremos del intervalo semiabierto de clase Ej. [0, 2 > Ancho de clase (w) : Es la longitud de un intervalo de clase y se logra dividiendo el rango R entre el valor de k, as en el ejemplo w = R / K, donde R = 12 y K = 6, luego w =2 Frecuencias Absolutas (f i) : Es el numero de datos en cada intervalo de clase; tiene las siguientes propiedades: (1) 0 f i n (2) fi=n
Pgina 7 de 54
Estadstica Capitulo VI
PRESENTACION DE DATOS
En esta etapa se elaboran cuadros numricos llamados tablas o Cuadros estadsticos o Distribucin de Frecuencias y se representan mediante graficas : Para el ejemplo citado
1 4 0 5 2 3 0 4 0 3 4 6 3 5 9 8 5 12 0 2 1 0 1 0 0 4 3 1 8 3 2 3 1 0 1 2 2 10 3 0
Como se eligi k=6, el numero de intervalos, con una amplitud de 2 en la primera columna se coloca los intervalos y desde el cuadro de datos se va colocando trazas segn corresponda la clase o intervalo, el numero final de trazas por cada rango o clase ser la Frecuencia absoluta :
DISTRIBUCION DE FRECUENCIAS ABSOLUTAS INTERVALOS DE CLASE [0 , 2 > [2 , 4 > [4 , 6 > [6 , 8 > [8 , 10 > [10 ,12 > TABULACION /////////////// //////////// /////// / /// // TOTAL FRECUENCIA ABSOLUTAS 15 12 7 1 3 2 40
MARCA DE CLASE (xi): Son los puntos medios de los intervalos. Todos los datos de un intervalo pierden su individualidad y estn representados por un mismo valor que a su vez caracteriza la clase, ese valor tpico es la marca de clase
Pgina 8 de 54
Estadstica Capitulo VI
TABLA COMPLETA
INTERVALOS DE CLASE [0 , 2 > [2 , 4 > [4 , 6 > [6 , 8 > [8 , 10 > [10 ,12 > TOTALES
Xi
fi 15 12 7 1 3 2 40
Fi 15 27 34 35 38 40
1 3 5 7 9 11
La descripcin sencilla de las columnas es como sigue : Xi = marca de clase, fi = frecuencia absoluta Fi = Frecuencia absoluta acumulada, hi = Frecuencia relativa Hi = Frecuencia Relativa Acumulada, 100% hi = Frecuencia relativa Porcentual; 100Hi% = Frecuencia Relativa Acumulada Porcentual Entonces en una tabla ser sencillo saber que cada rango tiene una marca de clase que es el punto central del intervalo, un numero de datos que expresa la frecuencia absoluta, si se expresa de manera fraccionada relativa a 1 es la frecuencia relativa, y si se refiere a un total de 100 ser la frecuencia porcentual, luego habrn columnas que son frecuencias relativas y porcentuales pero Acumuladas. Como ejemplo citaremos la lectura del intervalo entre 4 a 6, se entiende que la marca de clase es 5, en ese rango hay 7 datos que seria la frecuencia absoluta, de un total de 40 datos en ese rango hay 17.5% (frecuencia porcentual), los datos menores incluidos al rango de lectura abarcan 85% del total (frecuencia porcentual acumulada) y mayores a 6 hasta 12 sern el 15% o 100 menos la frecuencia porcentual acumulada.
Pgina 9 de 54
Estadstica Capitulo VI
Del Cuadro pueden hacerse las conocidas distribuciones de Frecuencias que se representan grficamente como Histogramas , Polgono de frecuencias, Diagramas escalonados, ojivas, etc. Las graficas se levantan sobre un plano cartesiano; en el eje X se colocan el Alcance, el intervalo y los limites de clase y en el eje Y las frecuencias HISTOGRAMA : Son graficas de rectngulos cuyas bases representan los intervalos de clase, y las alturas las frecuencias absolutas o relativas o Porcentuales. Los rectngulos deben tocarse unos a otros, excepto en caso de intervalos vacos. POLGONO DE FRECUENCIA : Es una poligonal construida uniendo mediante segmentos de recta los puntos medios de los techos de los rectngulos del Histograma. En algunos casos se recomienda cerrar la poligonal hasta tocar la base de los intervalos adyacentes al primero y ultimo del histograma. Ejemplo de Histogramas Polgonos de frecuencia
Histograma
Poligono de frecuencia
El polgono de frecuencia de manera suavizado representa idealmente una curva del modelo matemtico que se puede ajustar por diversas tcnicas conocidas FUNCION ESCALONADA: Son grficos correspondientes a Distribuciones de frecuencia Absoluta acumulada, relativa acumulada o Porcentual acumulada. La grafica de este tipo es similar a la de Mximo Entero donde la frecuencia acumulada es constante durante el intervalo y Pgina 10 de 54
Estadstica Capitulo VI
haciendo un salto de discontinuidad en el extremo derecho. OJIVA : Es una poligonal construida uniendo los puntos cuyas abscisas son los limites superiores de las clases y las ordenadas son las frecuencias absolutas acumuladas o relativas o porcentuales acumuladas. Se aade una clase con frecuencia cero antes de la primera clase. La ojiva puede ser suavizada hasta lograr una curva que represente a la poblacin estudiada y se conoce como funcin de distribucin. Ejemplo de Funcin escalonada y Ojiva
40
30
20
10
10
12
DISTRIBUCION Y GRAFICAS CON OBSERVACIONES CUALITATIVAS Si las observaciones son cualitativas no es posible determinar cuantitativamente el Alcance, bastara con indicar la categora y sus respectivas frecuencias. Un ejemplo en el cuadro siguiente: De 550 estudiantes, 230 estudian Ingeniera representando 41.82% y son la mayora, el grupo minoritario corresponde a Matemticas que con solo 20 alumnos representan 3.64% del total.
Pgina 11 de 54
Estadstica Capitulo VI
La tabla anterior tambin puede ser representada en un grafico tipo Diagrama Circular, el anlisis ser similar pero talvez mas objetivo.
Campos de Especializacion
Matematicas 4% Contabilidad 18% Economia 9% Administracion 27% Ingenieria 42%
Clases con anchos desiguales: Es comn usar distribuciones con anchos de clase iguales, pero algunas veces se usan anchos de clase desiguales, si existen datos muy pequeos o bastante grandes es una necesidad, bastara definir la primera clase como menos de.. y la clase superior como mas de.. o mayores que.., la desventaja principal es que no estn definidos las marcas de clase ni los anchos por lo que solo se puede hacer un anlisis grafico circular en frecuencia.
Pgina 12 de 54
Estadstica Capitulo VI
Para el ejemplo
Ingresos Anuales ($)
menos de 500 500 a 1000 1000 a 5000 mas de 5000
totales
fi 3 15 10 20 48
La mayor cantidad de la poblacin (41.67%),gana mas de 5000 dlares anuales, los que menos ganan (<500 $) son el 6.25%.
Campos de Especializacion
menos de 500 6% mas de 5000 42% 500 a 1000 31%
DESCRIPCION DE DATOS
Es una etapa en la que se estudia el calculo de las medidas que describen o califican a los datos; (a) Medidas de Posicin o Localizacin : Tendencia central ( Promedios, mediana), Moda y Fractilas (b) Medidas de Variabilidad o de Dispersin : Varianza, desviacin tpica, coeficiente de variacin, desviacin media. (c) Medidas de asimetra y Kurtosis Pgina 13 de 54
Si el estudio descriptivo abarca toda la poblacin la medida descriptiva correspondiente es un parmetro y si comprende una muestra la medida se denomina estadgrafo muestral
Denominada simplemente como Media o Promedio; es una medida de Tendencia Central que localiza el centro fsico de la distribucin de datos. S la media es muestral se denota como X y si es referida a una poblacin u o algunas veces tambin se indica como M(X) que se lee como la media de la variable X. Sean x1, x2, x3 xn una muestra de tamao n, entonces la media es la suma de todos los datos entre n
entonces el
Pero los mismos datos anteriores pueden ser clasificados por rangos. Si aplicamos la Regla de Sturges para dividir en intervalos K = 1+ 3.3 log(30) = 5.87 o 6 intervalos. El ancho de cada clase ser (106-10)/6 = 16. Los trminos Xi son la marca de clase y fi es la frecuencia de cada clase
Pgina 14 de 54
Estadstica Capitulo VI
INTERVALOS DE CLASE [10 , 26 > [26 , 42 > [42 , 58 > [58 , 74 > [74 , 90 > [90 ,106 > TOTALES
Xi
18 34 50 66 82 98
La Media es igual a la sumatoria de todos los productos marca de clase por frecuencia y dividida entre el numero de datos, en este caso 1356/30 = 45.2; y cuando se usa las frecuencias relativas a 1 (hi), la media es la suma de todas las marcas de clase xi multiplicadas por las frecuencias relativas = 45.248. Estas dos son similares y cuestin de redondeo; podramos decir que la media es 45.2; pero es importante saber que cuando calculamos la media de todos los datos (sin clasificar) dio como resultado 44.93, ahora si hay diferencia, la media mas precisa es aquella que usa todos los datos; porque cuando no se clasifican los datos no hay perdida de informacin y el error se reduce a cero. Propiedades de la Media 1. La media de los datos todos iguales a una constante c es la misma constante c 2. Si a todos los valores de X le sumamos una constante c (traslacin), su media queda sumada por dicha constante 3. Si a todos los valores de X le multiplicamos por una constante b (cambio de escala), la media queda multiplicada por la constante b. 4. Si a todas las variables X le multiplicamos por una constante b y luego le sumamos una constante c. Entonces la media quedara multiplicada por la constante b y sumada en c. Caractersticas relevantes de la media Aritmtica
Pgina 15 de 54
Estadstica Capitulo VI
1. La Media Aritmtica es la medida mas conocida y usada en estadstica 2. Es una medida nica, es decir un conjunto de datos tiene una sola media aritmtica. 3. Se calcula tomando en cuenta la magnitud de todos y cada uno de los datos bajo consideracin. 4. Como la media localiza el centro fsico (centro de gravedad) de una distribucin de datos, es una medida de tendencia central muy sensible a los valores extremos y si estos toman valores desproporcionados desplazan el valor de la media hacia esos extremos.
MEDIANA
Es una medida de Tendencia Central que localiza el centro de la distribucin de datos en base a una ubicacin central una vez ordenados. Mediana es aquel valor que divide (distribuye o subclasifica) en dos partes iguales a un conjunto de valores ordenados Mediana de datos No- Clasificados Una vez ordenados los datos en orden creciente o decreciente Si el numero de datos es impar, la mediana es el valor central que equidista de los extremos Si el numero de datos es par, la mediana es el promedio aritmtico de los dos valores centrales que equidistan de los extremos En ambos casos se afirma que la MEDIANA es aquel valor para el cual el numero de observaciones mayores que el es igual al numero de observaciones menores que el. Ejemplo No. 1 Con el mismo ejemplo citado anteriormente, son 30 datos y los ordenamos en forma ascendente, como el numero de datos es n=30 par, entonces la media ser el promedio entre los datos centrales No. 15 que es 40 y 16 que
Pgina 16 de 54
Estadstica Capitulo VI
10
16
15
17
20
18
20
19
28
20
29
21
30
22
30
23
35
24
35
25
38
26
38
27
38
28
40
29
40
30
40
45
45
46
49
49
54
55
60
60
60
72
80
82
105
18 34 50 66 82 98
fi 4 12 7 4 2 1 30
Fi 4 16 23 27 29 30
Clase Mediana : En el cuadro anterior, es el intervalo de clase cuya frecuencia absoluta acumulada alcanza la mitad del numero total de datos o la supera por primera vez : [26, 42> Luego la mediana se estima con la siguiente relacin
Pgina 17 de 54
Estadstica Capitulo VI
Xm = Lm + Wm
n 2 fm
- Fm-1
En la relacin anterior : Lm = Limite inferior de la clase mediana = 26 Wm : Ancho de la clase mediana = 16 n : Numero de datos totales =30
Fm-1: Frecuencia absoluta acumulada la clase inmediata anterior a la clase mediana = 4, fm : Frecuencia absoluta de la clase mediana = 12 Entonces la mediana es : Xm = 40.67
Para datos clasificados Mediana es aquel valor para el cual el 50% de los datos son inferiores o iguales a el y los otros 50% son superiores a el. ALGUNAS CARACTERISTICAS RELEVANTES DE LA MEDIANA
1. Le sigue en importancia y uso a la Media, como medida de Tendencia Central 2. Es una medida nica, entonces una distribucin de datos tiene una sola mediana. 3. La suma de los valores absolutos de las desviaciones de los datos con respecto la mediana es mnima 4. En el clculo de la mediana no se consideran la magnitud de todos los datos como si en el calculo de la media. El valor de la mediana depende Pgina 18 de 54
Estadstica Capitulo VI
nicamente de los valores centrales; no cambia de valor si se agrega un nmero de datos mayores y menores que ella, de cualquier magnitud; como consecuencia no es sensible a los valores extremos como la Media. De existir valores extremos que difieren considerablemente del resto. La mediana puede ser ms representativa que la media, en el sentido de que localiza mejor el centro de la distribucin de datos, El ejemplo siguiente ilustra este criterio. Un empleador afirma que el salario promedio pagado a los ingenieros de su firma es de 2200 soles mensuales; estos sugieren que la firma paga bien. Sin embargo, un examen posterior indica que se trata de una pequea compaa que emplea cuatro jvenes ingenieros con un haber mensual de 300 soles cada uno y el haber mensual del Ingeniero Jefe es 9800 soles Se puede seguir pensando que la firma paga bien? Veamos: El promedio es de (300+300+300+300+9800)/5 = 2200 Como hay un valor extremo bastante discrepante del resto, calculemos la mediana Mediana si n es impar es el valor central Md = 300 No se puede pensar que la firma paga bien. En casos como este es ms representativo la mediana que la media.
MODA (Mo) :
Localiza el valor cuya frecuencia es mxima. Moda de datos no-clasificados.Es el valor del dato que se presenta con mayor frecuencia o se repite el mayor nmero de veces.
Pgina 19 de 54
Estadstica Capitulo VI
Ejemplo: Determinar la moda en el siguiente conjunto de datos no agrupados: 4, 7, 6, 6, 9, 8, 10, 15, 6, 7 Ordenando los datos se tiene : 4, 6, 6, 6, 7, 7, 8, 9, 10, 15 Se observa que el dato que mas se repite es 6, por tanto Mo = 6 En el caso que dos datos tengan el mismo numero de repeticiones, entonces los datos tienen dos modas o tambin se le conoce como bimodal. Si todos los datos se repiten el mismo numero de veces, se dice que no hay moda (o todos son modas) . Moda de Observaciones Clasificadas Para datos clasificados, es necesario conocer la clase modal, que es aquel rango que tiene la mayor frecuencia absoluta o relativa, en pocas palabras, el rango que tenga mas datos contenidos. Para algunos, Moda es el punto medio de la clase modal, esta seria una manera rpida de encontrar la moda Para la distribucin de datos, de los ejemplos anteriores
INTERVALOS DE CLASE [10 , 26 > [26 , 42 > [42 , 58 > [58 ,74 > [74 , 90 > [90 ,106 > TOTALES
Xi
18 34 50 66 82 98
fi 4 12 7 4 2 1 30
Fi 4 16 23 27 29 30
Es el punto medio de la clase modal o aquella que contiene la mayor cantidad de datos : [26 , 42> ; entonces la moda es 34 Puede haber una distribucin multimodal, es decir que tiene varias modas, esto sucede cuando hay dos o mas clases modales y las modas sern los puntos centrales de Pgina 20 de 54
Estadstica Capitulo VI
Cuando los datos son de tipo cualitativo, la medida descriptiva mas adecuada es la Moda. ALGUNAS CARACTERISTICAS RELEVANTES DE LA MODA 1. Le sigue en importancia a la media y a la mediana, su uso se hace imperativo cuando los datos son de tipo cualitativo. Su fcil interpretacin y su clculo sencillo hacen de la Moda una medida de Localizacin mas usual y practico. As, un gerente de una fabrica de calzados puede estar interesado en las medidas que se venden mas; esta medida esta representada mejor por la moda que por otras medidas descriptivas 2. No es una medida nica como la mediana y media. Un conjunto de datos puede tener mas de una moda. Mediante una distribucin adecuada de datos (variando el ancho del rango) una funcin multimodal puede transformarse en unimodal.
DESVIACION ESTANDAR :
Es la raz cuadrada de la varianza, tiene las mismas unidades que la media o promedio.
Pgina 21 de 54
Estadstica Capitulo VI
COEFICIENTE DE VARIACION : Es una medida de la variabilidad relativa; es la divisin entre la desviacin estandar y el promedio expresada en porcentaje. Varianza de datos no clasificados
Para estimar la varianza de una relacin de datos no clasificados es necesario calcular el inicialmente el promedio de todos los datos, luego para cada dato se calcula el cuadrado de la diferencia del dato menos el promedio = (xi-Xprom)2 , la suma de estos valores dividido entre el numero de datos ser la VARIANZA, la desviacin estndar es la raz cuadrada de la varianza. Cuando se hace manualmente se toma el numero de datos n, si se procesa en computadora el numero de datos es n-1, porque un grado de libertad se utiliza para el termino constante. La diferencia no es muy grande y es mejor hacerlo en hoja de calculo. El ejemplo siguiente aclara este asunto:
Pgina 22 de 54
Estadstica Capitulo VI
Xi 60 30 38 60 45 20 35 20 40 54 38 35 40 10 45 60 49 49 30 55 46 29 38 80 40 28 15 82 72 105 1348,00 (Xi-prom) (Xi-Xprom) 15,07 227,00 -14,93 223,00 -6,93 48,07 15,07 227,00 0,07 0,004 -24,93 621,67 -9,93 98,67 -24,93 621,67 -4,93 24,34 9,07 82,20 -6,93 48,07 -9,93 98,67 -4,93 24,34 -34,93 1220,34 0,07 0,00 15,07 227,00 4,07 16,54 4,07 16,54 -14,93 223,00 10,07 101,34 1,07 1,14 -15,93 253,87 -6,93 48,07 35,07 1229,67 -4,93 24,34 -16,93 286,74 -29,93 896,00 37,07 1373,94 27,07 732,60 60,07 3608,00 0,00 12603,87
2
SUMA
MANUAL PROMEDIO VARIANZA DESVIACION ESTANDAR COEFICIENTE DE VARIACION COMPUTADORA PROMEDIO VARIANZA DESVIACION ESTANDAR COEFICIENTE DE VARIACION
44,93 12603,87 /30 = 434,6 v 343.6 = 20.84 20,84 *100 / 44.933 = 46,40 %
Pgina 23 de 54
Estadstica Capitulo VI
18 34 50 66 82 98 58
fi 4 12 7 4 2 1 30
En este caso se establece las marcas de clase de cada rango Xi y la frecuencia de datos en cada rango (fi) y se procede como datos no clasificados:
((Xi-Xprom) )*fi n v
2
16768 30
558,93
s CV
= =
23,64 40,8 %
s*100 promedio
16768 29
578,2
s CV
= =
24,05 41,6 %
s*100 promedio
Pgina 24 de 54
Estadstica Capitulo VI
Pgina 25 de 54
Estadstica Capitulo VI
necesario cuantificar este grado de correlacin lineal entre X e Y, esta medida se denominara Coeficiente de Correlacin Lineal de Pearson denotada por r y definida por la siguiente relacin :
r =
2
n xi yi
2
- xi yi
2 2
[n xi - (xi ) ] [n yi - (yi ) ]
Se puede verificar que es indistinto correlacionar X con Y , o Y con X, la correlacin ser similar. Si dividimos los trminos de la relacin anterior entre n2
r =
r =
En el numerador se define la covarianza entre las variables X, Y y en el denominador la varianza de X y de Y respectivamente, entonces la correlacin r queda definida como :
r=
Y en el denominador, la raz cuadrada de una varianza es la desviacin estndar Sx para la variable x , Sy para la variable Y
Pgina 26 de 54
Estadstica Capitulo VI
r=
Sxy Sx.Sy
Correlacin r
Cuando r = 1 o -1 , se dice que X e Y estn perfecta y linealmente correlacionados, en este caso todos los puntos estn contenidos en una recta
r=1
y
r=-1
x
Correlacin perfecta positiva Correlacin perfecta negativa
y
r=0
x
Cuando existe cierto grado de correlacin entre las variables X e Y pueden haber dos casos, si es positiva se llama tambin directa y si es negativa se denomina Pgina 27 de 54
Estadstica Capitulo VI
inversa, en ambos casos ser mejor la correlacin que en valor absoluto este cerca a 1
y
r = 0.80
r = -0.30
x
Correlacin alta y positiva Correlacin baja y negativa
Calcular el Coeficiente de Correlacin de Pearson tomando los siguientes datos X e Y : (1.54,60), (1.82,94),
(1.57,65)(1.60,66), (1.75,85), 1.65,72.5), (1.69,77), (1.62,70), (1.77,89.5), (1.70,80)
EJERCICIO ; HALLAR LA CORRELACION ENTRE X E Y X 1,54 1,82 1,57 1,60 1,75 1,65 1,69 1,62 1,77 1,70 promedio SUMA varianza Desviacin estndar 1,671 0,07489 0,007489 0,086539009 112,94 10,6273 (X-xprom) (X-xprom)2 -0,13100 0,01716 0,14900 0,02220 -0,10100 0,01020 -0,07100 0,00504 0,07900 0,00624 -0,02100 0,00044 0,01900 0,00036 -0,05100 0,00260 0,09900 0,00980 0,02900 0,00084 Y 60,00 94,00 65,00 66,00 85,00 72,50 77,00 70,00 89,50 80,00 75,9 1129,4000 (y-Yprom) (Y-Yprom)2 -15,9000 252,8100 18,1000 327,6100 -10,9000 118,8100 -9,9000 98,0100 9,1000 82,8100 -3,4000 11,5600 1,1000 1,2100 -5,9000 34,8100 13,6000 184,9600 4,1000 16,8100 XY 92,40 171,08 102,05 105,60 148,75 119,63 130,13 113,40 158,42 136,00 127,745
Pgina 28 de 54
Estadstica Capitulo VI
determina la suma del cuadrado de los valores menos el promedio: Para X corresponder 0.07849, y para Y = 1129.4, luego la varianza se calcula dividiendo entre el numero de datos n=10. Entonces la varianza de X ser 0.007849 y la varianza de Y = 112.94 y la desviacin estndar es la raz cuadrada de las varianzas, por lo tanto Sx = 0.086539 y la correspondiente Sy = 10.6273. Para el Calculo de la Covarianza (X,Y) se determina por la media M(XY) M(x).M(Y), los datos del cuadro indican que la Cov(X,Y) = 127.745 1.671x75.9 = 0.9161 Con los datos anteriores se puede calcular la correlacin de Spearman: R = 0.9161 /(0.086539x10.6273) = 0.9961 Entonces se puede concluir que la correlacin entre X e Y es alta y directa.
1. 2. 3. 4. 5. 6. 7. 8.
De la barra de men ? Ayuda de lotus 1-2-3 Datos Valor inicial Rango de X Rango de Y
Estadstica Capitulo VI
Resultado de la regresin Constante -128,51 Error tpico de est Y 1,04707 R cuadrado 0,99223 N de observaciones 10 Grados de libertad 8 Coeficientes X Error tpico del coef 122,3261 3,826156
0,9961074
El cuadro anterior contiene el resultado de la regresin entre los valores X,Y, en recuadro se indica el termino Rcuadrado que es igual 0.99223; la raz cuadrada de este numero es 0.996174 que es justamente el termino correlacin r de Spearman. Es importante entonces saber que con ayuda de la hoja de calculo se puede determinar la correlacin de los valores. Si es directa o indirecta la relacin se determina segn el signo del Coeficiente, en este caso es positivo.
REGRESION LINEAL
Se usa cuando hay una tendencia lineal entre X e Y y se desea establecer una relacin funcional (ecuacin) entre ambas variables
b = pendiente a X
Pgina 54 Y = a 30 + de bX
Estadstica Capitulo VI
b =
n [ xiyi] - xi . yi 2 2 n xi - (xi )
a =
1 n
[ yi - b xi ]
A1 A2 A3 A4 A5 A6 A7 A8 A9 SUMA
b =
7894 11132
0,709
a =
1 n
[ Syi - b Sxi ]
147,334172 9
16,370
ECUACION QUE RELACIONA Aptitud mental (X) y Aptitud Academica (Y) Y = 16.370 + 0.709 * X
Pgina 31 de 54
Estadstica Capitulo VI
Igualmente es posible calcular los valores de las constantes de la ecuacin lineal usando regresin en Hoja de Calculo de Office 97 que esta relacionado con Ayuda de Lotus 1-2-3 y evitarnos as el engorroso trabajo del clculo por mnimos cuadrados:
A1 A2 A3 A4 A5 A6 A7 A8 A9 SUMA
1. 2. 3. 4. 5. 6. 7. 8.
De la barra de men ? Ayuda de lotus 1-2-3 Datos Valor inicial Rango de X Rango de Y Rango de Salida Actuar
Resultado de la regresin Constante 16,37046 Error tpico de est Y 5,693428 R cuadrado 0,732703 N de observaciones 9 Grados de libertad 7 Coeficientes X Error tpico del coef 0,7091268 0,1618857
Con el procedimiento de la derecha se obtiene el resultado de la regresin que indica una constante a = 16.37046 y un coeficiente b = 0.70912, con lo que se comprueba que haciendo regresin en hoja de calculo se evita el calculo por mnimos cuadrados.
Pgina 32 de 54
Estadstica Capitulo VI
A1 A2 A3 A4 A5 A6 A7 A8 A9 SUMA Promedio
(Y-Yprom) 171,901 79,012 102,235 23,901 62,235 65,790 141,346 79,012 123,457 848,889
Con el ejemplo aprovechamos para determinar el coeficiente de determinacin R2 que es igual al cuadrado de la Correlacin de Spearman. En el Cuadro anterior : 1. Calcular el promedio de los valores Yprom = 41.11 2. Con la ecuacin que relaciona X, Y para cada valor de X calcular un valor de Y, ser el Ypredicho. Ejemplo para X =20 con la ecuacin debe salir Ypred = 30.553 3. Establecer y sumar una columna de (YpredYprom)2, el resultado es 621.983 4. Establecer y sumar una columna de (Y-Yprom)2, el resultado es 848.889 5. Entonces 621.983/848.889 = 0.732703 es el coeficiente de determinacin r2
Pgina 33 de 54
Estadstica Capitulo VI
A1 A2 A3 A4 A5 A6 A7 A8 A9
1. 2. 3. 4. 5. 6. 7. 8.
R es ultado d e la regre si n C o n sta nte 16,3 70 46 E rro r tp ic o d e es t Y 5,6 9 34 28 R c ua d rado 0,7 3 27 03 N d e o bs e rva c io nes 9 G rad os d e lib ertad 7 C o e fic ie n tes X E rro r tp ic o d e l c o e f 0,7 091 2 68 0,1 618 8 57
La relacin entre dos variables esta explicada a travs del Coeficiente de Determinacin R2 o tambin por r correlacin de Spearman que es la raz cuadrada de Coeficiente de determinacin. Si al usar regresin se establece que hay correlacin R2 (siempre positiva), la relacin directa o indirecta estar definida por el signo del Coeficiente, si el coeficiente que entrega la regresin se Pgina 34 de 54
Correlacin y t-student.
Estadstica Capitulo VI
divide entre el error aparece un nuevo estadstico denominado t o t-student que es tambin una varianza, un numero representativo de significancia muy utilizado en la estadstica moderna y aplicado en calibracin de equipos tan importantes como el Analizador en Lnea Courier. Generalmente cuando la correlacin es alta tambin el t-student lo es en valor absoluto, existe una relacin directa entre las variables si el valor t es positivo y una relacin indirecta si es negativo, pero lo importante es que habr significancia estadstica si los valores son mayores a 2 (positivo o negativo); obviamente los valores de t tiene limites segn un grado de confianza estadstica y pueden ser determinados de Tablas Estadsticas corrientes y conocidas , por ejemplo para n=9 al 95% de confianza el valor de t es 1.82 y a medida que aumenta el numero de eventos va incrementando ese valor; la calibracin del Courier establece t mayor que 2 (en valor absoluto) para que el coeficiente sea significativo en la ecuacin. El estadstico t-student tambin se aplica en los anlisis de regresin del Diseo Experimental
Estadstica Capitulo VI
gran informacin que provee un estudio microscpico, es posible aplicar los conceptos de regresin estadstica para hacer una aproximacin a la probable presencia de especies mineralogicas, partiendo de un anlisis qumico; hacer microscopia sin microscopio por llamar de algn modo a este procedimiento ; Ejemplo: Una flotacin de un mineral polimetalico Pb-CuZn-Plata, necesita saber porque los minerales concentrados estn contaminados con alto arsnico y antimonio, si estos valores pueden ser eliminados en flotacin o en un tratamiento posterior. Solucin: Se hace un muestreo en diversos puntos del circuito de flotacin Bulk Pb-Cu donde se concentran mayormente los valores de As y Sb. Las muestras son secadas y posteriormente analizadas por fracciones de tamao en mallas 100,200, 325 y -325, se analizan qumicamente por Pb,Zn,Cu, Plata, Fe, As, Sb. El cuadro siguiente muestra los resultados alcanzados por el laboratorio qumico:
PRODUCTOS Espuma Rougher Malla 100 Malla 200 Malla 325 Malla -325 Bulk Pb-Cu Malla Malla Malla Malla Malla Malla Malla 100 200 325 -325 200 325 -325
%Pb 64,44 69,08 73,10 73,32 50,56 47,52 38,10 47,90 25,04 44,06 57,20
%Zn 3,24 4,46 3,62 2,84 9,52 9,50 14,60 12,38 6,46 7,92 9,90
%Cu 2,56 3,04 2,42 2,42 4,28 5,78 5,20 3,92 22,62 12,94 5,46
Oz/TCAg 68,96 78,73 72,90 69,40 77,56 93,75 79,02 70,13 292,47 181,38 98,27
%Fe 1,36 1,48 1,00 0,80 3,74 5,92 6,98 3,62 1,72 1,40 1,18
%As 1,148 1,260 0,890 0,982 1,148 1,774 1,672 1,366 5,942 3,644 1,890
%Sb 1,760 1,788 1,115 1,128 1,410 2,056 1,794 1,538 9,760 4,624 2,378
2da. Limpieza
la relacin entre las leyes de los elementos se encuentra por regresin simple ( un procedimiento estadstico que finalmente es equivalente a la microscopia porque expresa la relacin entre elementos qumicos, si estn positiva y altamente ligados, indicando una estrecha relacin Pgina 36 de 54
Estadstica Capitulo VI
mineralogica, si el signo es negativo no hay relacin mineralogica entre los elementos qumicos, ese es finalmente el significado del estadstico t-student). Por ejemplo la relacin entre Arsnico y Cobre tiene la siguiente regresin aplicando el sistema de la Hoja de Calculo, obviamente en el procedimiento se colocara en rango de X toda la columna correspondiente al ensaye por Arsnico y para el rango de Y la columna respectiva de ensaye por Cobre, invertir las columnas para hacer la regresin no cambia nada en lo que se refiere a correlacin y valor de t
ARSENICO-COBRE Resultado de la regresin Constante Error tpico de est Y R cuadrado N de observaciones Grados de libertad Coeficientes X Error tpico del coef t-STUDENT 0,246576 0,006834 36,082 0,390714 0,132674 0,993 11 9
Realizadas las regresiones por pares de elementos qumicos el Cuadro siguiente contiene el resumen expresado en trminos de correlacin y t-student:
Pgina 37 de 54
Estadstica Capitulo VI
Correlacion ARSENICO-PLOMO ARSENICO-ZINC ARSENICO-COBRE ARSENICO-PLATA ARSENICO-FIERRO ARSENICO-ANTIMONIO ANTIMONIO-PLOMO ANTIMONIO-ZINC ANTIMONIO-COBRE ANTIMONIO-PLATA ANTIMONIO-FIERRO PLATA-COBRE PLATA-PLOMO COBRE-PLOMO 0,583 0,004 0,993 0,985 0,012 0,976 0,509 0,001 0,971 0,982 0,029 0,986 0,493 0,607
El anlisis del cuadro anterior expresa lo siguiente : 1. El arsnico esta muy ligado al cobre y plata (+36.08, +24.24) 2. El Antimonio tambin esta ligado al cobre y plata (+17.36, +22.07) 3. El cobre esta altamente ligado a la Plata (+25.50) 4. La ley de Plomo tiene una relacin negativa con Cobre (-3.73), Plata (-2.96), Arsnico(-3.55) y Antimonio (-3.05); esto significa la buena liberacin de galena respecto de los valores de cobre 5. El Arsnico no tiene relacin con Zinc (+0.19), 6. El arsnico no tiene relacin con Fierro (-0.33), se descarta entonces una presencia importante de ARSENOPIRITA 7. El Antimonio no tiene relacin con Zinc(-0.09), ni fierro (-0.52)
Pgina 38 de 54
Estadstica Capitulo VI
CONCLUSIN DEL ANLISIS DE REGRESION Al haber una fuerte relacin Cu-As-Sb-Plata se debe concluir que estos valores corresponden a la familia mineralogica de los COBRES GRISES Tenantita (Cu8As2S7 ),y Tetrahedrita ( Cu8Sb2S7) Si no hay relacin entre el Fierro-Arsnico se deduce que no se trata de una gran presencia de Arsenopirita. Al no haber relacin entre el Plomo y Cobre se deduce que no es problema de molienda y liberacin de valores.
REGRESION
LINEAL
MULTIPLE
As como se hace regresiones por parejas de valores X e Y , encontrando una ecuacin que relacione a ambas variables, tambin es posible relacionar una variable Y con varias otras variables (X,Z,U,T,etc.), en este caso se considera a Y como la variable dependiente, las otras variables sern independientes, obviamente si se trata de encontrar una ecuacin que relacione la variable dependiente Y con las otras variables independientes es necesario hacer Regresin Lineal Mltiple es decir que cuando el proceso solicite el rango de Y se ingresara todos los valores de la variable dependiente y para el rango de valores X se ingresaran en conjunto todas las columnas de las variables independientes, el resto del proceso de regresin en Hoja de Calculo : Fijar un rango de salida de la respuesta y la orden de actuar quedara como es normal. El resultado de la regresin indica un trmino constante y adems coeficientes segn el orden de las columnas de la matriz de variables independientes, el clculo de t-student para cada variable independiente ser muy importante (Dividir coeficiente entre error del coeficiente), obviamente a mayor valor de t en valor absoluto se podr hacer una discrecin de que variables Pgina 39 de 54
Estadstica Capitulo VI
independientes influyen mas sobre el resultado de la variable dependiente, obviamente no todas deben la misma influencia. En lo que se refiere a la correlacin R2 si es mayor de 0.8 estaremos en un anlisis de respuesta confiable.
Pgina 40 de 54
Estadstica Capitulo VI
Se trata de hallar una respuesta sobre la influencia de los elementos qumicos sobre la ley de Pb en el concentrado de Plomo. SOLUCION: Se debe encontrar una ecuacin en que la variable dependiente sea %Pb y las variables independientes sean las columnas de Zn,Cu,Fe,Plata,Bi, obviamente el camino indicado es hacer una regresin lineal mltiple con el procedimiento conocido de la Hoja de Calculo, el resultado es el siguiente :
REGRESION PARA LEY DE PLOMO EN EL CONCENTRADO Resultado de la regresin Constante Error tpico de est Y R cuadrado N de observaciones Grados de libertad Coeficientes X Error tpico del coef student 85,32286483 0,832976197 0,894077303 38 32 %Zn %Cu %Fe OzAg/TC %Bi -1,737396225 -0,682035206 -1,2373308 -0,0443292 -6,1053466 0,160300419 0,437807849 0,5368665 0,0326703 2,88422 -10,84 -1,56 -2,30 -1,36 -2,12
En el cuadro resultado de regresin se analiza inicialmente la correlacin y al 89% es posible afirmar que el anlisis de elementos qumicos indica que para mejorar los grados de concentrado de Plomo es necesario y principal el control de la activacin de Zinc (t = -10.84); obviamente que el control del depresor Sulfato de zinc ser muy importante, le sigue en orden el desplazamiento de hierro (t=-2.30) cuya activacin se debe controlar con cianuro de sodio. Ambos elementos por el signo negativo influyen directamente en menores grados de concentrado de Plomo. As de simple e importante el uso de la estadstica de regresin.
Pgina 41 de 54
Estadstica Capitulo VI
Pgina 42 de 54
Estadstica Capitulo VI
Ejemplo: Un anlisis de malla del alimento a clasificacin esta expresada en el cuadro siguiente en las tres primeras columnas:
D Apertura (u) 300 212 150 106 74 44 -44 Analisis granulometrico de Alimento a hidrociclon W Y %Ac(+) 100/W Ln(100/W) Ln(Ln(100/W)) 24.85 4.024 1.392 0.331 38.66 2.587 0.950 -0.051 46.25 2.162 0.771 -0.260 64.69 1.546 0.436 -0.831 71.81 1.393 0.331 -1.105 78.97 1.266 0.236 -1.443 100 X Ln (D) 5.704 5.357 5.011 4.663 4.304 3.784
En el cuadro se completan las columnas de la siguiente manera: 1. La columna W indica el % retenido acumulado 2. Las siguientes columnas son correlativas y determinan inicialmente 100/W y luego el doble logaritmo hasta llegar a la columna que representa Y 3. La ultima columna que representa X es el logaritmo neperiano de la apertura de mallas D Luego se procede a hacer regresin entre X e Y, siendo el resultado el siguiente:
Resultado de la regresin Constante Error tpico de est Y R cuadrado N de observaciones Grados de libertad Coeficientes X Error tpico del coef t-student 0,955206383 0,066285509 14,41048574
Del resultado y con una correlacin 98.1% es posible determinar la ecuacin tpica de Rosin Rammler como se observa a la derecha, forma de recta recomendada para el uso de esta funcin como se puede leer en el Manual Taggart sec 19 pagina 149 Pgina 43 de 54
Estadstica Capitulo VI
REGRESION CUADRATICA
Si se desea ajustar ecuaciones cuadrticas de una variable dependiente Y, relacionada con dos variables independientes X1 y X2 y que se estima sea una curva cuadrtica con un mximo o un mnimo a determinar de manera que la relacin matemtica sea : Y = a0+a1X1+a2X2+a11X12+a22X22+a12X1X2 Las constantes aij sern los trminos a encontrar y la modo mas rpido es por regresin. Un ejemplo ilustrara mejor el tema.
PRUEBA 1 2 3 4 5 6 7 8
REAL DESARROLLADA 2 2 X1 X2 X2 20,250 400,00 410,06 20,460 225,00 418,61 20,460 25,00 418,61 20,250 0,00 410,06 20,030 25,00 401,20 20,030 225,00 401,20 20,250 100,00 410,06 20,250 100,00 410,06
Como se sabe que un diseo de optimizacin tiene una funcin cuadrtica como respuesta se procede a hacer regresin con los pasos siguientes : 1. Como se necesitan adems coeficientes para los trminos X12 , X22 y X1X2, entonces se crean nuevas columnas en base a las de X1 y X2, de es
Pgina 44 de 54
Estadstica Capitulo VI
modo se completa la matriz de valores para los trminos independientes. 2. En la barra de herramientas acceder al proceso de regresin y cuando se ingrese el Rango-X debe considerarse toda la plantilla X1,X2, X12 , X22 y X1X2. El Rango Y ser la columna de Yobs del cuadro anterior. Procediendo segn la indicacin, el resultado de regresin es el siguiente :
Resultado de la regresin Constante 4489,1 Error tpico de est Y 0,1253 R cuadrado 0,9843 N de observaciones 8 Grados de libertad 2
X1 X2 X1
2
X2
X1X2
Coeficientes X -8,2944 -438,5 0,0088 10,711 0,4022 Error tpico del co 1,1802 82,371 0,0013 2,0344 0,0583
Es importante observar que al 98% de correlacin la ecuacin cuadrtica que relaciona Y con X1,X2 es la siguiente :
Y = 4489 -8,294 X1 -438.5 X2 + 0,009 X1 + 10,71 X2 + 0,402 X1X2
2 2
Un sistema rpido y efectivo para determinar los coeficientes de una ecuacin cuadrtica, el uso posterior de esta ecuacin para determinar los puntos X1,X2 que implicaran un mximo o un mnimo en la ecuacin haciendo derivadas de la funcin Y respecto de X1 , X2 es ya otro tema que se trata en el Capitulo de Diseo Experimental.
Pgina 45 de 54
Estadstica Capitulo VI
Y
Estadsticamente fuera de control
Los diagramas de lmites de control son muy tiles para el manejo de datos histricos; se trata de establecer una banda alrededor de un valor promedio que considere la desviacin estndar , de manera que el limite superior sea Xprom+ y el limite inferior Xprom-. Los puntos que estn fuera de estos lmites de control son estadsticamente inexplicables, algo importante ocurri y debe ser motivo de anlisis. Para optimizar datos se puede tomar fracciones de la desviacin estndar cada vez mas pequeas a fin de ajustar la dispersin de resultados, trabajos iniciales pueden ser considerando EJEMPLO. Un anlisis histrico de datos de concentrado de Plomo indica una tendencia .Como resultado de la instalacin de un Analizador en Lnea Courier mostrar de
Pgina 46 de 54
Estadstica Capitulo VI
que manera cambiaron los resultados en el Concentrado de Plomo. Solucin: Se hace un cuadro con leyes de concentrado de Plomo antes y despus de la instalacin del equipo, el mismo es el siguiente:
DATOS DE ENSAYE QUIMICO PARA REGRESIONES CONCENTRADO PLOMO %Pb 68,65 65,65 68,40 65,45 69,25 68,70 69,60 70,05 72,03 71,77 66,30 64,96 64,15 70,51 68,15 66,75 68,84 62,57 68,50 69,25 69,35 66,85 66,80 70,55 68,89 71,03 66,42 68,35 63,38 71,25 67,18 67,95 71,10 70,10 70,90 70,95 65,50 68,30 68,27 2,38 3,5 %Pb im. Superio 70,65 Lim. Inferio 65,89 dato 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 promedio absoluta relativa %Zn 4,55 6,76 5,51 6,44 5,47 6,43 5,44 4,72 4,25 4,15 6,77 6,97 5,79 3,38 4,65 5,07 4,82 7,46 4,87 5,48 5,07 6,02 6,72 4,43 5,02 3,91 6,01 4,85 7,76 3,59 6,34 5,36 3,87 4,35 3,92 4,02 6,05 4,63 5,29 1,12 21,1 %Zn 6,40 4,17 antes %Cu 2,48 2,57 2,34 2,60 2,08 1,98 1,76 2,09 2,10 2,05 2,12 2,14 2,38 2,39 2,52 3,45 2,85 2,19 2,92 2,14 2,07 2,31 2,07 1,97 1,94 1,82 2,03 2,25 2,42 1,63 1,47 1,73 1,38 1,77 1,84 1,81 1,94 1,77 2,14 0,41 19,0 %Cu 2,55 1,73 %Fe 1,60 1,97 1,90 2,08 1,75 1,42 1,81 1,71 1,29 1,25 1,93 1,86 2,49 1,69 2,21 1,52 1,65 2,43 1,56 1,54 1,56 1,85 1,98 1,32 1,62 2,29 1,64 1,26 1,88 1,14 1,62 1,88 1,43 1,95 1,82 1,64 2,31 1,69 1,75 0,33 18,6 %Fe 2,08 1,42 OzAg/TC 65,90 66,38 63,28 65,90 66,41 62,77 59,26 64,81 62,69 63,13 58,03 63,93 69,98 72,90 78,29 79,25 74,07 64,08 70,57 67,69 64,23 69,47 63,35 64,08 64,74 60,44 58,76 64,23 61,24 64,01 55,84 62,62 60,43 66,35 64,59 66,12 63,42 84,73 65,74 5,88 8,9 OzAg/TC 71,61 59,86 %Bi 0,154 0,152 0,184 0,203 0,177 0,153 0,144 0,208 0,168 0,163 0,162 0,206 0,267 0,280 0,339 0,275 0,198 0,422 0,236 0,205 0,240 0,220 0,189 0,219 0,215 0,175 0,154 0,174 0,208 0,235 0,186 0,262 0,229 0,302 0,256 0,246 0,236 0,194 0,22 0,06 26,2 %Bi 0,27 0,16 %Pb
72,18 74,40 73,63 75,01 74,14 70,26 70,38 73,20 73,57 72,39 71,62 74,29 74,94 71,62 73,80 73,14 73,50 74,60 75,36 75,47 75,67 75,78 70,93 69,42 73,74 73,54 72,16 71,52 72,39 72,37 73,69 74,32 74,25 71,17 73,50 71,74 71,68 72,67
ene-05 %Zn
3,77 3,21 2,62 2,66 2,79 4,08 3,78 2,95 2,69 3,21 2,98 3,18 2,75 3,66 3,28 3,50 3,40 3,08 3,11 2,39 2,31 2,64 4,36 4,09 2,70 2,57 3,64 4,66 3,33 3,34 3,07 3,06 3,06 3,86 3,52 3,74 3,86 3,97
%Cu
1,24 0,90 1,29 0,72 1,15 1,55 1,87 1,30 1,51 1,55 1,86 1,37 1,12 1,64 1,12 1,22 0,98 0,85 0,75 0,92 0,98 1,02 1,29 1,34 1,26 1,59 1,41 1,12 1,11 1,12 1,11 0,79 0,81 0,75 0,78 0,81 1,30 1,03
%Fe
1,51 1,22 1,63 1,45 1,80 1,43 1,90 1,33 1,65 1,36 1,76 1,23 1,31 1,81 1,53 1,70 1,49 1,70 1,84 1,38 1,34 1,41 1,71 2,45 1,71 1,67 1,77 1,51 1,62 1,68 1,24 1,50 1,37 1,91 1,56 1,46 1,28 1,54
OzAg/TC
63,54 63,57 67,39 55,63 60,33 61,79 67,53 62,90 67,47 65,25 79,47 64,98 64,32 64,96 53,36 58,40 59,14 56,08 57,24 61,23 62,45 56,73 52,74 54,67 54,99 59,81 53,88 50,06 54,99 57,03 64,07 67,53 55,74 54,99 70,45 62,06 55,59 60,78
%Bi
0,250 0,320 0,300 0,210 0,240 0,270 0,240 0,320 0,240 0,250 0,300 0,222 0,280 0,260 0,210 0,190 0,170 0,170 0,180 0,170 0,160 0,170 0,150 0,130 0,140 0,170 0,170 0,110 0,140 0,170 0,260 0,250 0,220 0,110 0,500 0,340 0,230 0,290
Con los datos del cuadro para Grado de %Pb se calcula Promedio, desviacin estndar absoluta y los Lmites de Control superior e inferior:
Pgina 47 de 54
Estadstica Capitulo VI
a) Periodo Histrico (antes) : Promedio Absoluto Lim Sup Lim. Inf = 68.27 = 2.38 = 68.27+2.38 = 70.65 = 68.27-2.38 = 65.89
b) Periodo Posterior (Ene 05) : Promedio Absoluto Lim Sup Lim. Inf = 73.11 = 1.60 = 73.11+1.60 = 74.71 = 73.11-1.60 = 71.51
Graficando todos los valores con los Lmites del periodo histrico se tiene :
75,00
60,00
55,00
1 31 35 33 3 5 11 15 13 17 19 21 25 23 27 29 37 7 9
DATOS
Las lneas punteadas horizontales marcan los limites superior e inferior, antes (periodo histrico) los resultados estaban con la mayor cantidad de puntos dentro la banda. En enero 2005 todos los resultados estn por Pgina 48 de 54
Estadstica Capitulo VI
encima de la banda; este evento estadsticamente fuera de control, positivo y favorable tiene explicacin en la nueva operacin metalrgica de la Planta Concentradora con Analizador en Lnea Courier 6SL que proporciona al operador informacin cada 12 minutos. Si se repite el ejercicio con los valores de %Zn, se comprender que es por la menor activacion de zinc hacia los concentrados de Plomo.
FACTOR HUMANO
EQUIPOS
Objeto de estudio
MATERIALES
ESTRATEGIA
Diagrama que muestra la relacin entre una caracterstica de calidad y los factores
Pgina 49 de 54
Estadstica Capitulo VI
Pgina 50 de 54
Estadstica Capitulo VI
Interruptor de Faja: Este equipo recientemente instalado actu de manera perfecta, salvando la vida del accidentado. Esta parada fue accionada por el ayudante de picado bloqueando indefinidamente a la Faja alimentadora del Molino No. 3. Calificacin 100 Primeros auxilios : Planta desde hace un mes tiene suministrador de oxigeno medicinal pero no estuvo cerca . No fue necesario aplicarlo pero de haber sido necesario se hubieran tenido serias dificultades por la demora en llegar al lugar del accidente. Se ha dispuesto que este en la Oficina de Jefes de Guardia. Calificacin 50
RECURSO HUMANO (100/5 = 20) Seguridad : El TRABAJADOR actu sin cuidar su integridad fsica al pararse sobre la carga que estaba debajo de la faja alimentadora y que finalmente lo cubri de mineral prcticamente en 80% del cuerpo. Confirma que 100% de EPP no es suficiente para cuidar nuestra integridad. Calificacin CERO Filosofa : El operador Portillo no respeto el punto 6 de la poltica de Seguridad de CIA. :todo trabajador es un SUPERVISOR DE SEGURIDAD , este asunto ha sido tocado en reiteradas oportunidades durante las charlas de 5 minutos que se efectan diariamente. Calificacin CERO Concentracin : El mencionado trabajador no esta concentrado plenamente en la labor que esta realizando, se sabe que por no tener habitacin en Chicrin se preocupa demasiado del horario de salida y entrada ya que pernocta en su casa ubicada en la zona de la Quinua (5 km). Hay disponibilidad de habitaciones pero las facilidades de entrega son muy pocas de parte de COxPxOL y menos de parte del Servicio Social de CIA quienes deben hacer un anlisis de las necesidades al Pgina 51 de 54
Estadstica Capitulo VI
respecto. No olvidemos que el accidentado fatal de Noviembre 2001 viajaba todos los das a Cerro de Pasco. Calificacin CERO Experiencia : Se conoce del Trabajador accidentado es poli funcional en : Chancado, Molienda, preparacin de reactivos y hace 6 meses capacitado y autorizado para el trabajo : Picado de Tolvas. No es un improvisado en la funcin desempeada. Calificacin 100. Actitud : Las reuniones de Seguridad de 5 minutos se realizan desde Octubre 2001, son 8 meses de induccin que se espera tengan una mejor respuesta en la actitud del personal, como ya se insiste todava no se ha logrado el efecto multiplicador esperado y debemos recapacitar todos. Calificacin CERO
MINERAL E INSTALACIONES (210/3= 70) Mineral : La menor granulometra actual (90%5/8) hace que el mineral se deslice menos obligando al personal a picar con mayor frecuencia. Calificacin 50 Faja Transportadora : La extraccin del mineral desde la tolva No. 3, si bien no es constante por el tipo de mineral , esta 100% controlada con parada de emergencia desde un lugar muy cercano al ayudante y que es el sistema que finalmente actu para salvar la vida del accidentado. Calificacin 100 Tolva de finos : La tolva de finos no tiene la pendiente acorde con el Angulo de reposo del mineral y debe ser modificado. Adems las escaleras de acceso y la baranda de proteccin estn en buenas condiciones; falta colocar interiormente anillos de sujecin de lnea de vida. Calificacin 60
Pgina 52 de 54
Estadstica Capitulo VI
ESTRATEGIA DE CONTROL (150/ 4 = 37.5) Inspeccin : En noviembre de 2001 se decidi que la inspeccin seria permanente labor a cargo de personal de seguridad, a medida que transcurrieron los meses se acord retirar paulatinamente la Inspeccin por acuerdo del Comit de Seguridad, en el momento del accidente no se encontraba en esa zona el Inspector de Seguridad. Calificacin CERO Procedimiento : Para la labor del picador se tiene redactado un procedimiento de trabajo seguro, esta publicado en un lugar visible. Las normas de proteccin personal fueron cumplidas a cabalidad, el trabajador no respeto el procedimiento que indica pararse a mnimo 2 metros del centro de la tolva para evitar ser succionado. Calificacin 50 Coordinacin : Fue correcta antes y despus de ocurrido el accidente, se evito una perdida de vida. Los equipos usados fueron radios porttiles y telfonos, unidad mvil de evacuacin. Calificacin 100 Cuadrilla de rescate : No se tiene formada la cuadrilla de rescate, hubo exceso de personal en los alrededores, con un afn tpico de colaboracin pero sin funciones especificas. Calificacin CERO Cuadro resumen : Equipos de proteccin Recurso Humano Mineral e Instalaciones Estrategia de Control 70.0 20.0 70.0 37.5
CONCLUSION El anlisis indica que se debe trabajar ms aun sobre el cambio de ACTITUD del recurso Humano.
Pgina 53 de 54
Estadstica Capitulo VI
RECOMENDACION en planta concentradora se tiene charlas diarias de seguridad es un FACTOR INTERNO que debe ser repotenciado con mayor nfasis, pero sin descuidar el FACTOR EXTERNO a cargo del Departamento de Servicio Social que luego de un anlisis de la situacin actual de los trabajadores (especialmente los de contrata) debe hacer suyo el problema actual de falta de vivienda que esta obligando a muchos operadores a descansar menos horas de las que realmente debe luego de 12 horas continuas de labor
Pgina 54 de 54