Vous êtes sur la page 1sur 3

Product

Information
Get Product Updates
Request A Free
Catalog
View Catalog
Standardization News
Search

Noviembre/Diciembre 2008
Mediciones sucesivas
Manejo de valores atpicos
Cmo se evala un valor aberrante o inconsistente nico
por Thomas Murphy y Alex T. Lau
P. Cmo determina si un valor es realmente un valor atpico y cmo decide
si debe continuar o no con el anlisis de datos?
A. Uno de los problemas arduos en el anlisis de datos es manejar los valores atpicos en
un grupo de datos. Un valor atpico es una observacin con un valor que no parece
corresponderse con el resto de los valores en el grupo de datos. Los valores atpicos
tambin suelen llamarse valores aberrantes o inconsistentes. Por lo general surgen dos
preguntas: 1) Es este valor realmente un valor atpico? 2) Puedo eliminar este valor y
continuar con el anlisis de datos?
La pregunta 1 se refiere a la identificacin de un valor atpico, y dos herramientas bsicas
relacionadas son la representacin grfica y la prueba estadstica. Un excelente grfico
para observar la distribucin de pequeos grupos de datos es el grfico de puntos. Por
ejemplo, tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 para los que se muestra el
grfico de puntos en la Figura 1.


Figura 1 Trazado de puntos para los datos, 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3.

Aqu, el valor 7.8 parecer ser un valor atpico porque est bien a la derecha del resto en el
grfico de puntos. En el grfico, en realidad estamos mirando los espacios entre los
valores de datos.
Dos de las pruebas estadsticas utilizadas con mayor frecuencia en un grupo de datos
nico son la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones
de los espacios entre datos de diferentes modos segn la cantidad de valores en el grupo
Site
Search



Magazines & Newsletters / ASTM Standardization News
Pgina 1 de 3 ASTM International - Standards Worldwide
26/12/2008 http://www.astm.org/SNEWS/SPANISH/SPND08/datapoints_spnd08.html
de datos. En el ejemplo anterior, el tamao de la muestra es 7, y la relacin utilizada es el
espacio entre el valor atpico (7.8) y su vecino ms prximo (5.3) dividido por el espacio
entre los valores ms grandes y ms pequeos en el grupo. Por lo tanto, el ndice de Dixon
es:
(7.8 5.3)/(7.8 3.1) = 2.5/4.7 = 0.532
Este valor se compara con un valor crtico de una tabla, y el valor se declara valor atpico
si supera ese valor crtico. El valor crtico depende del tamao de la muestra, n, y de un
nivel de representatividad elegido, que es el riesgo de rechazar una observacin vlida. La
tabla por lo general utiliza niveles de baja representatividad tal como 1% o 5%. Para Para
un n = 7 y un riesgo del 5%, el valor crtico es 0.507. El ndice de Dixon 0.532 excede este
valor crtico, indicando que el valor 7.8 es un valor atpico.
La prueba de Grubbs utiliza una estadstica de prueba, T, que es la diferencia absoluta
entre el valor atpico, X
O
, y el promedio de la muestra dividida por la desviacin
estndar de la muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86
y la desviacin estndar de la muestra es = 1.48. La estadstica calculada de la prueba es:

Para un n = 7 y un riesgo del 5%, el valor crtico es 1.938 y el T = 1.99 excede este valor
crtico, indicando que el valor 7.8 es un valor atpico.
Con respecto a la pregunta 2, debe saberse que las pruebas estadsticas se utilizan para
identificar valores atpicos, no para retirarlos del grupo de datos. Tcnicamente, una
observacin no debe retirarse a menos que una investigacin halle una causa probable
para justificar esta accin. Algunas compaas han definido procedimientos para estas
investigaciones, incluyendo la repeticin de la prueba del material asociado a la
observacin de valores atpicos, en caso de ser posible.
En algunos casos, la situacin fsica puede definir el problema. Para las tres
observaciones, 98.7, 90.0 y 99.7, el ndice de Dixon es
8.7/9.7 = 0.897
El valor crtico para un n = 3 y un riesgo de 5% es 0.941, por lo que el valor 90.0 no puede
identificarse como valor atpico! Parte del motivo puede ser la proximidad cercana de los
otros dos valores. Sin embargo, si los valores registrados son temperaturas del cuerpo
humano en grados Fahrenheit, no hace falta una prueba de valor atpico para llegar a la
conclusin de que algo est mal. Este ejemplo tambin ilustra que es difcil identificar
valores atpicos en pequeos grupos de datos, tal como n < 5. La norma ASTM E691,
mtodo para llevar a cabo un estudio entre laboratorios para determinar la precisin de
un mtodo de prueba, desalienta estas pruebas de valores atpicos para pequeos grupos
de resultados de pruebas repetidos en un mismo laboratorio y sugiere otras metodologas
para identificar grupos de datos aberrantes.
Si en la investigacin no se encuentra una causa probable, qu debe hacerse? Un enfoque
sera realizar un anlisis de datos con el valor atpico y sin l. Si las conclusiones son
diferentes, entonces se considera que el valor atpico tiene influencia y esto debera
indicarse en el informe. Otra opcin es utilizar estimadores rigurosos para caracterizar los
grupos de datos, tal como la mediana de la muestra en lugar de la media.
La ASTM E178, Prctica para manejar observaciones de valores atpicos, contiene muchos
procedimientos estadsticos para realizar pruebas de valores atpicos. En esta norma se
Pgina 2 de 3 ASTM International - Standards Worldwide
26/12/2008 http://www.astm.org/SNEWS/SPANISH/SPND08/datapoints_spnd08.html

proveen otros criterios para valores atpicos nicos, as como pruebas para valores
atpicos mltiples, y la norma tambin da pautas para la eleccin de la prueba. Una
referencia ms amplia para la prueba de valores atpicos es el libro Outliers in Statistical
Data (Valores atpicos en datos estadsticos), publicado por Wiley. Otra referencia til y
ms prctica es el Volumen 16 de la Sociedad Estadounidense de Calidad (American
Society for Quality, ASQ) "Referencias bsicas para el control de calidad, tcnicas
estadsticas" (Reference in Quality Control, Statistical Techniques): Cmo detectar y
manejar valores atpicos", ASQC Quality Press. En la prctica E178 de ASTM se indican
otras referencias.
Cuando hay mltiples valores atpicos en un grupo de datos, la investigacin resulta ms
complicada, pero existen procedimientos de prueba para estos casos. Un problema es que
un valor atpico puede enmascarar otro valor atpico en una prueba de un valor atpico
nico. La prueba de Dixon supera esto redefiniendo los espacios a utilizar a medida que
aumenta el tamao de la muestra. Este tema est bien tratado en la norma E178 y en otras
fuentes.
Resulta importante destacar que lo primero es considerar los datos grficamente para
identificar la posible existencia de ms de un valor atpico, ya sea en la misma direccin o
en la direccin opuesta, antes de utilizar la tcnica de Dixon o la tcnica de Grubbs. Estas
tcnicas estn diseadas para detectar un nico valor atpico en un grupo de datos, y por
lo tanto no son adecuadas para la deteccin de mltiples valores atpicos. Una tcnica
rigurosa y amplia para identificar eficazmente mltiples valores atpicos es el
procedimiento para muchos valores atpicos con generalizacin extrema de la desviacin
de Student, descrito en la Referencia Bsica de ASQ, Volumen 16. Si bien los valores
atpicos mltiples estn fuera del alcance deseado de este artculo, los lectores interesados
pueden consultar la bibliografa mencionada para obtener ayuda o tambin pueden
consultar a un especialista en estadsticas.
Thomas Murphy, de T.D. Murphy de Statistical Consulting LLC, es el presidente del
Subcomit E11.30 sobre control de calidad estadstico, que integra el Comit E11 de la
ASTM sobre calidad y estadsticas.
Alex T. Lau, de Engineering Services Canada, es el presidente del Subcomit D02.94
sobre aseguramiento de la calidad y mtodos estadsticos, que forma parte del Comit
D02 de la ASTM sobre productos y lubricantes derivados del petrleo y es un miembro
colaborador del Comit E11.
Dean Neubauer es el coordinador de la columna DataPoints y el presidente de las
publicaciones del Subcomit E11.90.03.

Home | Site Map | Online Support | Contact | Web Policies | IP Policy

Copyright 1996-2008 ASTM. All Rights Reserved.
ASTM International, 100 Barr Harbor Drive, PO Box C700, West Conshohocken, PA, 19428-2959 USA
Pgina 3 de 3 ASTM International - Standards Worldwide
26/12/2008 http://www.astm.org/SNEWS/SPANISH/SPND08/datapoints_spnd08.html

Vous aimerez peut-être aussi