Vous êtes sur la page 1sur 31

TEMA 3

Manejo de datos

Wilman Cabrera, Ph.D.


Tratamiento y evaluación estadísticos
de los datos
INTERVALOS DE CONFIANZA
En la mayoría de los análisis químicos cuantitativos, el valor real de la media no se puede
determinar, ya que se requeriría un número inmenso (que tiende a infinito) de mediciones. Sin
embargo, con ayuda de la estadística se puede establecer un intervalo que rodea a la media x
determinada experimentalmente dentro del cual se espera que se encuentre la media
poblacional m con un cierto grado de probabilidad.

Este intervalo se conoce como intervalo de confianza. Algunas veces los límites del intervalo
se conocen como límites de confianza

Por ejemplo, podemos decir que es 99% probable que la media verdadera de la población para
un conjunto de mediciones de potasio se encuentre en el intervalo 7.25 ± 0.15% de K. Por lo
tanto, la probabilidad de que la media se encuentre dentro del intervalo de 7.10 a 7.40% de
potasio es de 99%.
Tratamiento y evaluación estadísticos
de los datos
Determinación del intervalo de confianza cuando σ es conocida o
cuando s es una buena estimación de σ
La probabilidad de que el valor verdadero caiga dentro del intervalo se llama probabilidad o
nivel de confianza, y en general se expresa como porcentaje. El nivel de confianza está dado
por:

donde t es un factor estadístico que depende del número de grados de libertad y el nivel de
confianza que se desea. El número de grados de libertad es uno menos que el número de
mediciones

Los valores de t a diferentes niveles de confianza y grados de libertad se dan en la tabla 3.1
Tratamiento y evaluación estadísticos
de los datos
Tratamiento y evaluación estadísticos
de los datos
EJEMPLO
Se analiza una muestra de carbonato de sodio comercial en el laboratorio de química analítica
por titulación con ácido clorhídrico estándar. El análisis se realiza por triplicado, con los
siguientes resultados: 93.50, 93.58 y 93.43% de Na2CO3. ¿Dentro de qué intervalo existe 95% de
confianza de que caiga el valor verdadero?
Solución
La media es 93.50%. La desviación estándar s se calcula en 0.075% de Na2CO3 (absoluto; se
calcula con una hoja de cálculo). En el nivel de confianza de 95% y dos grados de libertad, t
4.303

De manera que se tiene 95% de confianza de que, en ausencia de un error determinado, el


valor verdadero cae dentro de 93.31 a 93.69%.
Tratamiento y evaluación estadísticos
de los datos
EJEMPLO
¿Cuántas mediciones de las réplicas habría que hacer del mes 1 en el ejemplo 6.2 para reducir el
intervalo de confianza de 95% a 1100.± 10.0 mg/L de glucosa?
Tratamiento y evaluación estadísticos
de los datos

Se puede concluir que se necesitan 14 mediciones para tener una probabilidad un poco mejor
a 95% de que la media poblacional se encuentre a ±10 mg/L de glucosa de la media
experimental.
Tratamiento y evaluación estadísticos
de los datos
Un nivel de confianza demasiado alto dará un amplio intervalo que puede abarcar números no
aleatorios. Un nivel de confianza demasiado bajo dará un intervalo estrecho y excluye números
aleatorios válidos. Por lo general se aceptan como razonables niveles de confianza de 90 a 95%.

Pruebas de significancia. ¿Hay diferencia?


Al desarrollar un nuevo método analítico, a menudo es deseable comparar los resultados de ese
método con los de un método aceptado (quizá de norma). Sin embargo, ¿cómo se puede decir
si hay una diferencia significativa entre el método nuevo y el aceptado? De nuevo se recurre a la
estadística para encontrar la respuesta.

Decidir si un conjunto de resultados es significativamente diferente de otro depende no sólo de


la diferencia en las medias, sino también de la cantidad de datos disponibles y de la dispersión.

La prueba F evalúa las diferencias entre la dispersión de los resultados, en tanto que la prueba t
atiende a las diferencias entre las medias.
Tratamiento y evaluación estadísticos
de los datos
LA PRUEBA F
Ésta es una prueba diseñada para indicar si hay una diferencia significativa entre dos métodos
con base en sus desviaciones estándar. F se define en términos de las varianzas de los dos
métodos, donde la varianza es el cuadrado de la desviación estándar:

donde s12> s22. Hay dos grados de libertad diferentes, ν1 y ν2, y se definen como N -1 para cada
caso.

Si el valor de F calculado por la ecuacion excede un valor tabulado de F en el nivel de confianza


seleccionado, entonces hay una diferencia significativa entre las varianzas de los dos métodos.
En la tabla se da una lista de valores F a 95% del nivel de confianza.
Tratamiento y evaluación estadísticos
de los datos
Tratamiento y evaluación estadísticos
de los datos
Ejemplo
Se está desarrollando un nuevo procedimiento colorimétrico para determinar el contenido de
glucosa en suero de sangre. Se ha elegido el procedimiento estándar Folin-Wu para comparar
con éste sus resultados. De los dos siguientes conjuntos de análisis de réplica de la misma
muestra, determinar si la varianza de este método difiere significativamente de la del método
estándar.
Tratamiento y evaluación estadísticos
de los datos

Las varianzas se ordenan de manera que el valor de F sea >1. El valor F tabulado para ν1 =6 y
ν2 = 5 es 4.95. Como el valor calculado es menor que éste, se concluye que no hay diferencia
significativa en la precisión de los dos métodos; es decir, las desviaciones estándar son sólo de
error aleatorio y no dependen de la muestra
Tratamiento y evaluación estadísticos
de los datos
Ejemplo: Se sabe por muchos cientos de mediciones que un método estándar para la
determinación de los niveles de monóxido de carbono (CO) en mezclas gaseosas tiene una
desviación estándar de 0.21 ppm de CO. Una modificación en el método produjo un valor de s
de 0.15 ppm de CO para un conjunto de datos combinados con 12 grados de libertad. Una
segunda modificación, también basada sobre 12 grados de libertad, tiene una desviación
estándar de 0.12 ppm de CO. ¿Es alguna de las modificaciones más precisa que la original?
Tratamiento y evaluación estadísticos
de los datos

A partir de la tabla se obtiene que el valor crítico de F a un nivel de confianza de 95% es Fcrít =
2.30. Como el valor calculado es menor que éste, se concluye que no hay diferencia
significativa en la precisión de los dos métodos y se concluye que no hay mejoras en la
precisión.
No obstante, para la segunda modificación F2 > 2.30. Por lo tanto, se concluye que la segunda
modificación al método parece aumentar la precisión del mismo a un nivel de confianza de
95%.
Es interesante notar que si nos preguntamos si la precisión
de la segunda modificación es significativamente mejor
que la de la primera. En este caso, Fcrít = 2.69. Dado que F
<2.69, se debe concluir que los dos métodos tienen una
precisión equivalente.
Tratamiento y evaluación estadísticos
de los datos
LA PRUEBA T DE STUDENT. ¿HAY DIFERENCIAS EN LOS MÉTODOS?
Con frecuencia, el analista desea decidir si hay diferencia estadística entre los resultados
obtenidos usando dos procedimientos diferentes; es decir, si ambos miden en realidad lo
mismo. La prueba t es muy útil para hacer estas comparaciones.

En este método se comparan dos conjuntos de mediciones de réplicas hechas con dos métodos
diferentes; uno de ellos será el método de prueba, y el otro es un método aceptado.

Se calcula un valor estadístico de t y se compara con el valor tabulado para el número dado de
pruebas al nivel de confianza deseado. Si el valor calculado de t excede el valor tabulado de t,
entonces hay una diferencia significativa entre los resultados de los dos métodos a ese nivel
de confianza. Si no excede el valor tabulado, entonces se puede predecir que no hay
diferencia significativa entre los métodos. Esto de ninguna manera implica que los dos
resultados sean idénticos.
Tratamiento y evaluación estadísticos
de los datos
1. Prueba t cuando se conoce un valor aceptado.

Si se dispone de un buen estimado del valor “verdadero” de otros análisis, por ejemplo un
material de referencia estándar del Nacional Institute of Standards and Technology (NIST) (o lo
definitivo en análisis químico, un peso atómico), entonces la ecuación anterior se puede usar
para determinar si el valor obtenido de un método a prueba es estadísticamente igual al valor
aceptado.
Tratamiento y evaluación estadísticos
de los datos
Tratamiento y evaluación estadísticos
de los datos
Ejemplo
Se está desarrollando un procedimiento para determinar trazas de cobre en materiales
biológicos utilizando una digestión húmeda seguida de medición por espectrofotometría de
absorción atómica. Para probar la validez del método se obtiene un material de referencia
estándar NIST de hojas de árboles frutales y se analiza este material. Se muestrean y analizan
cinco réplicas y se encuentra que la media de los resultados es 10.8 ppm, con una desviación
estándar de ± 0.7 ppm. El valor tabulado es 11.7 ppm. ¿Da este método un valor
estadísticamente correcto al nivel de confianza de 95%?
Solución

Hay cinco mediciones, de modo que hay cuatro grados de


libertad (N 1). En la tabla se ve que el valor tabulado de t
al nivel de confianza de 95% es 2.776. Esto es menos que
los valores calculados, de modo que hay un error
determinado en el nuevo procedimiento; es decir, hay una
probabilidad de 95% de que la diferencia entre el valor de
referencia y el valor medido no se deba al azar.
Tratamiento y evaluación estadísticos
de los datos
2. Comparación de las medias de dos muestras.
Cuando se aplica la prueba t a dos conjuntos de datos

donde sp es la desviación estándar combinada de las mediciones individuales de dos


conjuntos:
Tratamiento y evaluación estadísticos
de los datos
Ejemplo.
Se desarrolla un nuevo método gravimétrico para hierro(III) en el que el hierro se precipita en
forma cristalina con un compuesto “jaula” de organoboro. La exactitud del método se verifica
analizando el hierro en la muestra de mineral y comparando con los resultados obtenidos
mediante la precipitación acostumbrada con amoniaco, pesando el Fe 2O3. Los resultados
expresados como porcentaje Fe para cada análisis son los siguientes:

¿Hay diferencia significativa entre los dos métodos?


Tratamiento y evaluación estadísticos
de los datos
Tratamiento y evaluación estadísticos
de los datos

Esto es menos que el valor tabulado, de modo que los dos métodos tienen desviaciones
estándar comparables y se puede aplicar la prueba t

La t tabulada para nueve grados de libertad (N1 + N2 - 2) al nivel de confianza 95% es 2.262 de
modo que no hay diferencia estadística en los resultados de los dos métodos.
Tratamiento y evaluación estadísticos
de los datos
3. Prueba pareada t.
En el laboratorio de química clínica a menudo se prueba un nuevo método contra otro aceptado
analizando varias muestras diferentes de composición ligeramente variable. En este caso, el
valor t se calcula en una forma ligeramente diferente
Se calcula la diferencia entre cada una de las mediciones pareadas de cada muestra. Se calcula
una diferencia promedio Ď, y las desviaciones individuales de cada una con respecto a Ď se
usan para calcular una desviación estándar, sd. El valor t se calcula mediante

donde Di es la diferencia individual entre los dos métodos para cada muestra, considerando el
signo, y Ď es la media de todas las diferencias individuales
Tratamiento y evaluación estadísticos
de los datos
Se desarrolla un nuevo método analítico para determinar el nitrógeno de urea en la sangre
(BUN). Se desea determinar si este método difiere de manera significativa de un método
estándar para analizar un intervalo de concentraciones en muestra que se espera encontrar en
forma sistemática en el laboratorio. Se ha determinado que los dos métodos tienen precisiones
comparables. En seguida se dan dos conjuntos de resultados para un número de muestras
individuales.
Tratamiento y evaluación estadísticos
de los datos

El valor t tabulado al nivel de confianza 95% para cinco grados de libertad es 2.571. Por tanto,
tcalc < ttabla, y no hay diferencia significativa entre los dos métodos a este nivel de confianza.
Tratamiento y evaluación estadísticos
de los datos
Gráficas de control
Una gráfica de control de calidad es una gráfica contra el tiempo de una cantidad medida que se
supone constante (con una distribución de Gauss) para corroborar que la medición permanece
dentro de un intervalo estadísticamente aceptable

Puede ser una gráfica día a día del valor medido de un estándar que se usa de manera
intermitente con las muestras. La gráfica de control se compone de una línea central que
representa el valor conocido o supuesto del control y ya sea uno o dos pares de líneas de límite,
los límites de control interior y exterior.

Por lo regular se conoce la desviación estándar del procedimiento (un buen estimado de ) y se
usa para establecer los límites de control.
Tratamiento y evaluación estadísticos
de los datos

Se debe poner especial atención a las tendencias en una dirección; es decir, que los puntos
caigan en un lado de la línea central. Esto sugeriría ya sea que el control tiene error o que hay
un error sistemático en la medición. Una tendencia de los puntos a caer fuera de los límites
de control indicaría la presencia de uno o más errores determinados en la medición, y el
analista debería verificar si no hay deterioro de reactivos, mal funcionamiento del
instrumento, efectos ambientales o de otra naturaleza
Tratamiento y evaluación estadísticos
de los datos
Uso de hojas de cálculo para graficar curvas de calibración
Ejemplo
Se determina la riboflavina (vitamina B2) en una muestra de cereal midiendo la intensidad de
fluorescencia en solución en ácido acético al 5%. Se preparó una curva de calibración midiendo
las intensidades de fluorescencia de una serie de estándares de concentraciones crecientes. Se
obtuvieron los siguientes datos. Usar el método de mínimos cuadrados para obtener la línea
más recta para la curva de calibración y para calcular la concentración de riboflavina en la
solución de muestra. La intensidad de fluorescencia de la muestra fue 15.4.
Tratamiento y evaluación estadísticos
de los datos
Tratamiento y evaluación estadísticos
de los datos
La ecuación de la línea recta es (FU unidades de fluorescencia; ppm g/mL)

La concentración de la muestra es

Ecuacion punto pendiente


Tratamiento y evaluación estadísticos
de los datos