Vous êtes sur la page 1sur 3

ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO

FACULTAD DE INFORMTICA Y ELECTRONICA

ESCUELA DE INGENIERA ELECTRNICA EN CONTROL Y REDES INDUSTRIALES

ESCUELA SUPERIOR POLITCNICA DE CHIMBORAZO

Facultad: Informtica y Electrnica


Escuela: Electrnica en Control y Redes Industriales
rea Acadmica: Ingeniera, industria y construccin.
Asignatura:

Probabilidad y Estadistica

de la Investigacin:

Tcnicas para eliminar puntos atpicos

Integrantes:

Espinoza Javier 718

Fernanda Ramirez 502

Dennis Miranda

Semestre:

Cuarto

Fecha:

27/04/2017
ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO
FACULTAD DE INFORMTICA Y ELECTRONICA

ESCUELA DE INGENIERA ELECTRNICA EN CONTROL Y REDES INDUSTRIALES

Datos anmalos: el criterio de Chauvenet

En habitual que, al realizar una serie de medidas, uno de los datos sea anormalmente distinto
de los dems. Pongamos por caso que se han efectuado las siguientes mediciones de una
variable cualquiera x: 3,8 / 3,5 / 3,9 / 3,9 / 3,4 / 1,8. El valor de la media es x=3,4 y el error es
n-1=0,8. Es evidente que el ltimo dato destaca entre los dems: 1,8 est a dos desviaciones
estndar del valor medio.

El primer impulso es pensar que algo ha salido mal en esa medida particular. Es posible que la
medida anmala se haya hecho en condiciones distintas: el instrumento era distinto o se us
uno diferente, se midi justo despus de un corte de luz, el experimentador estaba distrado,
hubo una corriente de aire, etc. Si tenemos motivos para sospechar que ha habido un error
aleatorio anormalmente alto, hay una justificacin a la hora de rechazar esa medida.

Obtener un valor tan alejado de la media es raro, pero no matemticamente imposible.


Recordemos que el error que hemos calculado es slo vlido en un rango de confianza del 68%,
lo que significa que esperamos que la medida se encuentre en el rango [ 1 , + 1 ] ,
pero tambin significa que hemos de esperar que la medida caiga fuera de ese rango un 32% de
las veces, aproximadamente una de cada tres. De modo similar, la probabilidad de que la medida
est en el rango [ 21 , + 21 ]es del 95,5%, as que la probabilidad de que caiga fuera
ser del 4,5%, una vez de cada 22.

Para determinar cundo el dato de una medida anmala debe ser rechazado se usa el criterio
de Chauvenet. Supongamos que tenemos N mediciones de una cantidad x1, x2 xn, y que una
de ellas parece sospechosa por ser demasiado grande o demasiado pequea. Llamemos xan a
ese valor anmalo. A continuacin, determinemos cuntas desviaciones estndar la separan del
valor medio:

El nmero de medidas anmalas que podemos esperar es igual a:

donde N es el nmero de medidas y P(Nde*) es la probabilidad de que un valor se diferencie de


la media en Nde desviaciones estndar. Supuesto que las medidas sigan una distribucin normal,
esa probabilidad puede obtenerse de las tablas numricas. Para simplificar el proceso aqu
consideraremos solamente valores de Nde a partir de 1,5 desviaciones estndar, es decir,
Nde*1,5 (esa es una limitacin que no aparece en el criterio de Chauvenet pero la exigiremos
aqu con el fin de simplificar el tratamiento de datos). He aqu algunos valores numricos:
ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO
FACULTAD DE INFORMTICA Y ELECTRONICA

ESCUELA DE INGENIERA ELECTRNICA EN CONTROL Y REDES INDUSTRIALES

El criterio ser el siguiente: si n es menor que 0,5 el dato es anmalo. En nuestro ejemplo
numrico anterior resulta un valor Nde=2, lo que para N=6 medida arroja un valor de n=0,27. El
dato x=1,8 es anmalo y debe ser rechazado. Para sustituirlo haremos una nueva medida.
Supongamos que el nuevo valor es x=3,5. Ahora el nuevo conjunto de valores ser 3,8 / 3,5 / 3,9
/ 3,9 / 3,4 / 3,5. El nuevo valor medio es x=3,7 y el error es n-1=0,2. IMPORTANTE: el criterio
de Chauvenet debe utilizarse solamente una vez en un conjunto de datos. Si hay dos o ms
medidas anmalas, todo el conjunto de medidas debe descartarse.

En general, el mtodo de Chauvenet solamente debe usarse cuando el experimentador tiene


motivos para sospechar que la anomala de un dato se debe a los mtodos de medida y no a
causas externas, pero no siempre es as. En los aos ochenta se descubri que la capa de ozono
se haba reducido en un 40% (casi la mitad) por efecto de los CFC; sin embargo, los datos
obtenidos una dcada antes por los satlites Nimbus 4 y 7 no indicaban ms que una cada
minscula del 1% Cuando esos mismos datos fueron reevaluados en 1986 se descubri un fallo
en la programacin de los satlites: sus ordenadores rechazaron los datos porque se crea que
una cada tan grande en los niveles de ozono se deban a un fallo de los instrumentos de medida.
En ocasiones los datos anmalos son la antesala de grandes descubrimientos, lo que no suele
ser el caso de un laboratorio de prcticas.

Bibliografa

Arturo Quirantes. (2009). Teora de errores. 27/04/2017 , de Quirantes Sitio


web:
http://www.ugr.es/~aquiran/docencia/apuntes/Apuntes%20Teora%20de%2
0errores.pdf