Vous êtes sur la page 1sur 5

SUBTEMA 2.3.

3 CRITERIO PARA DESCARTAR UNA OBSERVACIN Algunas veces, cuando una persona est realizando una serie de mediciones repetidas, se enfrenta con un resultado que parece estar fuera del grupo, y entonces debe decidir si descarta ese resultado para una consideracin posterior. Este problema se encuentra al principio en los cursos de qumica analtica, ms tarde en el trabajo de laboratorio fsico-qumico, y aun en investigacin avanzada, aunque con menor frecuencia a medida que el estudiante progresa. En el trabajo cientfico es aceptado corno regla general que una medicin se rechaza en forma automtica cuando se sabe que se ha cometido un error; sta es una situacin definida que no estamos tratando aqu. Debe notarse que es incorrecto (pero tambin del todo humano) rechazar resultados que estuvieron sujetos a errores conocidos cuando parecen ser discordantes. La nica forma de prevenir una preferencia inconsciente en las mediciones es rechazar cada resultado en el que se sabe que se cometi un error, a pesar de que concuerden con los otros. El problema que estamos enfocando aqu es diferente: cmo decidir descartar un resultado que parece discordante cuando no se conoce ninguna razn para desconfiar de l? Si el nmero de resultados repetidos es grande, el problema de, descartar un valor no es importante; en primera, un solo valor tendr un efecto pequeo sobre la media, y segundo, las consideraciones estadsticas dan una respuesta clara, considerando la probabilidad de que el resultado sospechoso es miembro de la misma poblacin al igual que los otros. Por otro lado, cuando el nmero repetido es pequeo surge un verdadero dilema: el resultado divergente ejerce un efecto significativo sobre la media, mientras que al mismo tiempo existen datos insuficientes para permitir un anlisis estadstico real de la posicin relativa del resultado sospechoso. Las diferentes recomendaciones que han sido promulgadas por diversos autores, certifican la conclusin de que el problema de desechar o retener un valor divergente en una muestra pequea en realidad no puede ser resuelto en forma satisfactoria. Algunos de los criterios que son ms recomendados se consideran ms adelante, y se remite al estudiante a la excelente discusin de Blaedel et al. y a los interesantes y ms concisos comentarios de Laitinen y Wilson. En primer lugar, es necesario definir qu tan grande debe ser la diferencia entre el valor sospechoso y los otros datos antes de que el resultado sea descartado. Si la diferencia mnima se elige muy pequea, los datos vlidos pueden rechazarse con mucha frecuencia; se dice que ste es un "error de .la primera clase". Por otro lado, el colocar la diferencia mnima demasiado alto lleva a "errores de la segunda clase", esto es, a la conservacin frecuente de valores altamente errneos. Las diversas recomendaciones para el criterio de desechar algn dato nos: llevan a errores de extremos opuestos, algunas veces ms cerca de uno y otras veces ms cerca del otro.

La regla 2.5d se aplica como sigue: 1. Calcular la media y la desviacin promedio de los resultados "buenos". 2. Encontrar la desviacin del resultado sospechoso a partir de la media de lo resultados "buenos" 3. Si la desviacin del resultado sospechoso es por lo menos 2.5 veces la desviacin promedio de los resultados "buenos", descartar el resultado sospechoso. Si no, hay que conservarlo. En forma estricta, con la regla 2.5d el lmite para descartar es demasiado bajo: los datos vlidos tambin son rechazados con mucha frecuencia (errores de la primera clase). El grado de confianza citado con frecuencia para esta regla est basado en la estadstica de una muestra grande y se extiende a las muestras pequeas sin la compensacin adecuada. La regla 4d se utiliza en la misma forma que la 2.5d arriba mencionada: esta regla tambin conduce a los errores de la primera clase, aunque no con tanta frecuencia. No existe una justificacin estadstica para utilizar ya sea la regla 2.5d o la 4d, no obstante que ambas son muy recomendadas. Debe notarse que estas reglas sirven para aplicar la exclusin de un resultado en un grupo de cuatro a ocho resultados, no a uno de tres, o de cinco, etc. La prueba-Q, descrita por Dean y Dixo,8 es estadsticamente correcta y es muy fcil de aplicar. Cuando la prueba-Q exige que se descarte un resultado, existe una confianza elevada (90%) de que el resultado sospechoso estuvo sujeto en realidad a algn error en especial. Utilizando la prueba-Q para desechar algn valor, los errores de la primera clase son muy improbables. Sin embargo, cuando se aplica series pequeas de datos (digamos a tres o cinco resultados), la prueba-Q permite descartar slo los resultados que se desvan mucho, y por esto llevan con frecuencia a errores de la segunda clase (retencin de resultados errneos). De este modo, la prueba-Q provee una justificacin excelente para descartar valores muy errneos, pero no elimina el dilema al tratar con valores sospechosos pero menos desviados. La razn de esto es, por supuesto, que con pequeas muestras slo es posible hacer conjeturas imperfectas de la distribucin verdadera de la poblacin, y siendo as la estadstica exacta da seguridad slo a la exclusin de resultados muy divergentes. La prueba-Q se aplica como sigue: 1. Calcular el rango de los resultados.

2. Encontrar la diferencia entre el resultado sospechoso y su vecino ms cercano. 3. Dividir la diferencia obtenida en el paso 2 entre el rango del paso 1 para obtener el coeficiente de descartacin Q. 4. Consultar una tabla de valores Q. Si el valor calculado de Q es mayor que el valor de la tabla; el resultado se puede descartar con un 900/0 de confianza de que en realidad estuvo sujeto a algn factor que no actu sobre los otros resultados. Algunos valores-Q se dan en la tabla 2.8. TABLA 2.8 Valores del coeficiente de descartacin, Q Nmero de Observaciones QO.90 30.94 4 0.76 50.64 60.56 70.51 80.47 90.44 100.41 El siguiente ejemplo ilustra la aplicacin de los criterios precedentes. Ejemplo 5. Cuatro resultados obtenidos para determinar la normalidad de una solucin fueron: 0.1014, 0.1012, 0.1019 Y 0.1016. Aplique el criterio arriba mencionado para ver si el resultado 0.1019 puede ser descartado. (a) Calcule la media y la desviacin promedio de los resultados "buenos": Resultados 0.1014 0.1012 0.1016 Promedio: 0.1014 Desviaciones (ppmil) 0.0 2.0 2.0 Promedio: 1.3

(b) Calcule la desviacin del resultado sospechoso a partir de la media de los resultados "buenos"; 0.1019 - 0.1014 = 0.0005 o 5.0 ppmil Utilizando la regla 2.5d, 2.5 x 1.3 = 3.3 < 5.0

(descartar) Utilizando la regla 4d, 4.0 x 1.3 = 5.2 > 5.0 (no descartar) Utilizando la prueba Q, 0.1019 - 0.1016 0.1019 - 0.1012 0.0003 O = 0.0007 O = 0.43 Ya que Q < 0.76 (Tabla 2.8), el resultado no se descarta. Como se observ arriba, la prueba Q confirma la exclusin de un valor con un nivel de confianza del 90%. La buena voluntad para descartar un resultado con menos confianza hara posible que la prueba Q permitiera la retencin de menos valores desviados (errores de la segunda clase). Aun cuando, en forma superficial, esto parece atractivo, existen razones vlidas para ser conservadores al descartar las mediciones. En realidad, los niveles de confianza bajos (digamos que de 50%) son apenas significativos cuando slo est implicado un pequeo nmero de observaciones. Adems, a pesar de que para muchos estudiantes que estn en cursos introductorios de laboratorio las mediciones son slo ejercicios, debe recordarse que la recopilacin de datos es una actividad cientfica que tiene un propsito, y que la cuestin debe tratarse como si fuera importante. La persona que ha comprendido cuidadosamente su medicin, que la ejecuta con esmero y que tiene un motivo para esperar que el resultado sea significativo, no descartar su trabajo con facilidad. Ser ms probable que repita la medicin hasta que se haya esfumado el dilema del resultado discordante, mediante el manejo de dos factores: la dilucin de cualquier resultado por todos los dems disminuir su significancia y, a medida que el nmero de observaciones se incrementa, la evaluacin estadstica del resultado sospechoso se har ms significativa. Algunas veces se recomienda una especie de arreglo entre la exclusin sin reserva y la retencin de un valor sospechoso, el cual es reportar la mediana de todos los resultados en lugar de la media, con o sin el valor desviado. La mediana esta influida por la existencia de un resultado discordante, pero no es afectada por el grado en que difieren los resultados unos de otros. Para una muestra que tiene tres o cinco valores, Blaedel et al. recomiendan comprobar el valor sospechoso con la prueba Q y desecharlo si sta lo permite; si no, indicar la mediana en lugar de la media. Algunos autores (Wilson, p. ej.), recomiendan que deben desecharse el valor ms alto y el ms bajo, e informar la media de los

dems: "El mejor procedimiento a emplear depende de qu es lo que se conoce acerca de la frecuencia con la que ocurren los valores desordenados, del costo de observaciones adicionales y de los inconvenientes de los diversos tipos de errores. En ausencia de argumentos especiales, la utilizacin del promedio interior. .. parecera ser una buena prctica". Puede notarse que el promedio interior y la mediana son necesariamente idnticos en el caso especial en donde hay justamente tres resultados. Diagramas de control El mtodo de los diagramas de control se desarroll originalmente para mantener la calidad durante las operaciones de manufactura a gran escala. A menudo, el producto de una fabricacin es demasiado grande para permitir la inspeccin individual de cada artculo (digamos hojas de rasurar o cojinetes de bolas) yen algunos casos la prueba de calidad es destructiva (como la medida del esfuerzo requerido para romper un objeto) y por tanto no puede aplicarse a cada espcimen que se produce en una compaa. En algunos casos es necesario hacer una especie de comprobacin de unas cuantas muestras escogidas al azar a la salida de la lnea de produccin y se requiere cierto criterio para decidir si el proceso de manufactura est bajo controlo si est justificada una costosa suspensin de labores para buscar la causa de que los resultados obtenidos estn fuera de especificaciones. Tambin se ha comprobado que el mtodo del diagrama de control es til para detectar el funcionamiento de. los mtodos analticos en los laboratorios ocupados, en donde se analiza el mismo tipo de muestras da tras da, durante largos periodos de tiempo. El mtodo tiende a distinguir con un alto grado de eficiencia patrones definidos o anormalidades que se repiten con periodicidad de fluctuaciones fortuitas. El mtodo del diagrama de control aqu slo puede discutirse brevemente; el lector interesado debe remitirse a los libros sobre el tema y a varias discusiones ms breves.

Vous aimerez peut-être aussi