Vous êtes sur la page 1sur 22

Tratamiento estadstico de

los datos: errores


aleatorios
Dr. No costilla Snchez
2016-I

Errores aleatorios
Los
errores
aleatorios
llamados
tambin
indeterminados se distribuyen alrededor del valor
central. El error aleatorio tiene la misma
probabilidad de ser positivo negativo. La mayor
parte de los factores que contribuyen al error
aleatorio no pueden identificarse con certeza.
Incluso son tan pequeas que no pueden detectarse
individualmente. Sin embargo el efecto acumulativo
de cada una de las incertidumbres hace que las
medidas por duplicado de una serie, flucten al
azar del valor central del conjunto.
Si en un experimento se repite un gran nmero de
veces, y los errores son puramente aleatorios, los
resultados tienden a agruparse simtricamente al
valor medio. Cuantas ms veces se repita el
experimento, ms se acerca los resultados a una

Tratamiento estadstico de los


datos del error aleatorio
El anlisis estadstico de los datos analticos se basa
en la suposicin de que los errores aleatorio siguen
una distribucin gaussiana normal.
La leyes de la estadstica se dedujeron para usarlas
en las poblacin, y, con frecuencia deben modificarse
cuando se aplican a una muestra pequea porque un
nmero pequeo de datos podra no ser
representativo de la poblacin completa.
En Q.A., una poblacin es un conjunto de todas las
medidas al experimentador.
La muestra es un subconjunto de medidas
seleccionadas de la poblacin

Curva normal o de Gauss


N la figura se muestra una grfica de frecuencia
relativa (y) versus el valor de x.
La curva se puede representar por una ecuacin
que tiene dos parmetros: la media poblacional
y la desviacin estndar de la poblacin, .

y e

( x

)2 / 2 2

/ 2

Parmetro, es la cantidad que define la


poblacin o distribucin.
La variable estadstica, x, es la estimacin del
parmetro

Curva normal de Gauss


La desviacin estndar de la poblacin,
N

(x
i 1

)2
N

Donde N es el nmero de datos de la poblacin


La curva normal de Gauss, se puede
representar como frecuencias versus el valor
de z. El valor de z, se define como la desviacin
de un dato con respecto a la media relacionada
con una desviacin estndar, es decir,

z2 / 2
z = (x - )/

e
y
2

Curva normal o de Gauss


Las propiedades de una curva normal: (1) la
media cae en el punto central de mxima
frecuencia, (2) hay una distribucin simtrica de
las desviaciones positivas y negativas en torno al
valor mximo, (3) conforme aumenta la
magnitud de las desviaciones hay una
disminucin exponencial de la frecuencia, por lo
tanto son ms frecuentes los pequeos errores
que los grandes.
El rea de la curva con un 68.3% se sita dentro
de una desviacin estndar de 1, un rea de
95.4% se sita dentro de 2, un rea de 99.7%
se sita dentro de 3

Algunas expresiones
estadsticas
Termino estadstico para
Expresin matemtica
muestra
1-) Desviacin estndar

i 1

i 1

d
i 1

2
i

..................

1 1

DER s r

w = wf

............

s2
s
x

2
i

s
x 100
x

6-) Desviacin estndar relativa


7-) Dispersin

s
N

d i2

x)

CV

3-) Coeficiente de variacin

5-) Varianza

i 1

sm

2-) Error estndar de la media

4-) desviacin estndar


combinada

(x

Tratamiento y evaluacin de datos


estadsticos

Las aplicaciones ms comunes de las aplicaciones de las pruebas


estadsticas son:
1-) Definir un intervalo conocido como, intervalo de confianza, IC, en
el que se espera encontrar est la media del conjunto de rplicas con
una cierta probabilidad
2-) Determinar el nmero de medidas necesarias para garantizar una
media experimental
3-) Estimar la probabilidad de que una media experimental y un valor
verdadero dos medias experimentales sea diferentes; es decir si la
diferencia es real o se debe a un error aleatorio.
4-) Determinar con un nivel de probabilidad dado, si difiere la
precisin de 2 conjuntos de medidas.
5-) Comparar ms de dos medias y determinar la diferencia entre
ellas es real o deriva de errores aleatorios(anlisis de varianza)
6-) Decidir con una cierta probabilidad si un valor atpico en un
conjunto de rplicas de medidas es el resultado de un gran error y se
rechaza no hay error y se acepta

Intervalo de confianza
El intervalo de confianza de la media, IC, son los
valores de la media dentro de los cuales se espera que
est la media poblacional con una probabilidad dada.
La probabilidad, es el nivel de confianza, NC, que se
expresa generalmente en porcentaje.
Nivel de significacin nivel de significancia, es la
probabilidad de que un resultado este fuere del nivel de
confianza
El IC, cuando se conoce , su expresin matemtica
es ,
x
IC =

donde: z, es la desviacin de un dato con respecto a


la media; , la desviacin
x estndar poblacional, N es el
nmero de medidas y
es la media de las medidas N.

Intervalo de confianza
En qumica analtica el valor de N es pequeo
(3 a 30) mediciones, entonces en lugar de ,
se utiliza la desviacin estndar para pocos
valores s, en lugar de z se utiliza la t de
student, el cual tiene una definicin similar a z:
t = ( x - )/s
Los valores de z y t se encuentran en tablas.
Para conocer z basta conocer la probabilidad y
para t adems de probabilidad es necesario
conocer el valor de N
La expresin de IC para este caso es,
ts / N
IC x=

Pruebas de Hiptesis
Las pruebas de hiptesis son la base de muchas
decisiones a nivel cientfico y en ingeniera
La hiptesis nula, es una prueba estadstica que
plantea que dos o ms cantidades observadas son
una misma.
Las pruebas de hiptesis que suelen usar los
qumicos son:
la media de un conjunto de datos experimentales
frente a lo que se considera el valor verdadero
la media frente a un valor predicho o de corte
las medias o desviaciones estndar de dos mas
conjuntos de datos

Comparacin entre una media


experimental y un valor conocido
En toda hiptesis se considera dos resultados
contradictorios: 1ro, = 0 ; 2do Ha , puede expresarse
como diferente de 0 , menor de 0 mayor de 0 .
La prueba z es apropiada cuando se tiene resultados muy
numerosos, y la evaluacin de la hiptesis se procede as
Expresar la hiptesis nula:
Determinar la variable z: z
Exprese la hiptesis alterna,
rechazo
Ha : 0 , rechazar 0 si
Ha : > 0 , rechazar 0 si
Ha : < 0 , rechazar 0 si

= 0
= (x - )/ z / N
Ha y determine la regin de
z zcrit z zcrit
z zcrit
z - zcrit

Cuando se tiene, 0 , se tiene una prueba de dos


colas. Por ejemplo para un nivel de confianza, la
probabilidad de que z es mayor que zcrit es de 0.025 para

Prueba t con muestras pequeas


En el caso de contar con pocos datos se recurre a un
procedimiento similar a la prueba z, con la diferencia
que se recurre a la prueba t. El procedimiento del
anlisis de la hiptesis se desarrolla as,

Expresar la hiptesis nula: = 0


Determinar la variable
t: t = (x - )/ ts /
ts / N
Exprese la hiptesis alterna, Ha y
determine la regin de rechazo
Ha: 0 ,rechazar 0 si t tcrit t
tcrit
Ha : > 0 , rechazar 0 si t tcrit
Ha : < 0 , rechazar 0 si t - tcrit

Comparacin entre una media


experimental y un valor conocido
Cada extremo y el total es de 0.05. El nivel de
significacin es de 0.05 y el valor de z crtico es
de 1.96
Cuando > 0 , se tiene una prueba de una
cola. La probabilidad de que z > zcrit es de 0.05.
En ambas colas es de 10%. El nivel de
significacin es de = 0.10 y el valor crtico es
de 1.64. Cuando < 0 , la probabilidad de
que z < -tcrit es de 0.05. En ambas colas es del
10%, el nivel de significacin es de = 0.10 y
el valor crtico es de 1.64

Prueba t : Comparacin de 2
medias
Este anlisis permite evaluar si dos materiales son
idnticos o no. Para este caso la hiptesis nula es 1 =
2 y la hiptesis alterna Ha podra ser, 1 2 , 1 >
2 1 < 2 .

Si los datos se recopilaron de la misma manera y


ambos analistas fueron cuidadosos, se podra suponer
que las desviaciones estndar de ambos conjuntos
s12 ( N 1 emplear
1) s 22 ( N
1)
son similares, y se puede
la2 desviacin
s combinada
N 1 expresin
N 2 2es,
estndar combinada, cuya

N1 N 2
x1 x 2
t
El valor de t se calcula
con la
s combinada
N 1 expresin,
N2

Calculado el valor de t se evala con el valor de t


crtico o de tabla con el grado de libertad de N1 + N -

Prueba t: pareja de datos


Aqu se utiliza el mismo procedimiento que en
la prueba t normal, salvo que se utilizan
pares de datos. La desviacin estndar es la
desviacin de la diferencia entre las medias.
La hiptesis nula es H0: d = 0 donde 0 es
un valor especfico de d la diferencia en que se
intenta probar, frecuentemente cero, el valor
de t es,
d 0
t
N
sd

Donde
es la diferencia promedio igual a
di/N. La hiptesis alterna podra ser d
0 , d > 0 d < 0

Comparacin de precisin
La prueba F, (de Fisher) sirve para comparar
varianzas, siempre y cuando las poblaciones
tengan distribucin normal (de Gauss).
La prueba F se basa en la hiptesis nula de que
las 2 varianzas poblacionales consideradas son
iguales, 21 = 22 . Similarmente la prueba F,
que relaciona las 2 varianza muestrales (F = s21 /
s22 ), se calcula y se calcula con el valor crtico
de F segn el nivel de confianza escogido. La
hiptesis nula se rechaza cuando cuna do F
calculado es mayor que F crtico. La hiptesis
alterna puede ser, 21 > 22 21 22 .

Varianza
Conocida por la siglas de ANOVA, se usa pata verificar si
existe diferencia entre las medias de 3 ms poblaciones.
La ANOVA aprovecha los mtodos de diseo experimental
para el planteamiento y ejecucin de experimentos.
En el anlisis de varianza se distinguen 3 conceptos: el
factor o tratamiento que es la caracterstica comn de la
poblacin, el nivel que son los distintos valores del factor, y
la respuesta que es la medicin de los niveles.
Algunos ejemplos:
Existe alguna diferencia entre los resultados de 5 analistas
en la determinacin de calcio mediante un mtodo
volumtrico?: El analista es el factor, los niveles son los
analistas del 1 al 5 y el valor encontrado por los analistas
(cantidad qumica) son los resultados.
Son distintos los resultados en la determinacin de Mn

Varianza
con tres mtodos analticos diferentes?: El factor es el
mtodo, el nivel son los mtodos del 1 al 3, y la
respuesta es una concentracin de Mn.
Es distinta la fluorescencia de un ion complejo para 6
valores de pH distintos?: el factor es el pH, los niveles
son el pH del 1 al 6 y la respuesta es la intensidad de
fluorescencia
En el anlisis de un factor se pueden comparar I
medias poblaciones, 1 , 2 , 1 I , la hiptesis
nula tiene la forma,
H0 : 1 = 2 = 1 = = I
y la hiptesis alterna es,
Ha : al menos dos de las medias son diferentes.
Para la prueba F, se requiere sumas de cuadrados:

Varianza
Suma de los cuadrados debido al factor(SCF)
Suma de los cuadrados debido al error(SCE)
Suma de los cuadrados totales(SCT)
Los grados de libertad: SCT(N-1), SCF(I-1), SCE(N-I)
Los valores cuadrados medios: CMF y CME
La evaluacin de F = CMF/CME
Se rechaza H0 si F excede el valor crtico.

Resultados diferentes y Prueba Q


Para determinar la diferencia entre las medias, se aplica el
mtodo de la diferencia significativa mnima, (DSM), de
acuerdo al nmero de rplicas de cada grupo, Ng:
2 xCME
DSM t
Ng
Donde el valor de t debe tener N-I grados de libertad.
La prueba Q, es una prueba estadstica para decidir si se
acepta o rechaza un resultado discordante. Para ello se
divide el valor absoluto de la diferencia del valor
discordante y el valor ms cercano a el, entre la
dispersin, w, de todo el conjunto para obtener el valor de
Q. Previamente hay que ordenar el conjunto de datos de
una manera creciente. Luego el valor de Q calculado se
compara con el valor de Q crtico y si es menor que este
valor, se conserva el valor observado

Vous aimerez peut-être aussi