Vous êtes sur la page 1sur 63

Capítulo

1
ERRORES Y TRATAMIENTO DE DATOS
ANALÍTICOS

1.1. IMPORTANCIA ANALÍTICA DE LAS MEDIDAS


1.2. PRECISIÓN Y EXACTITUD: FORMAS DE EXPRESIÓN
1.3. ERRORES: TIPOS Y FUENTES
1.4. RECHAZO DE RESULTADOS
1.5. INCERTIDUMBRE EN EL CÁLCULO NUMÉRICO. PROPAGACIÓN DE ERRORES
1.6. PRESENTACIÓN DE DATOS ANALÍTICOS: CIFRAS SIGNIFICATIVAS
1.7. LÍMITES DE CONFIANZA
1.8. COMPROBACIONES O ENSAYOS DE HIPÓTESIS
1.9. PROBLEMAS DE AUTOEVALUACIÓN
1.10. BIBLIOGRAFÍA
8
1

Objetivos
1. Introducir al estudiante en el tratamiento de los datos analíticos, resaltando la
necesidad de trabajar con datos de calidad.
2. Aprender las fuentes y tipos de error para eliminarlos o estimarlos.
3. Aprender a estimar la incertidumbre de los resultados y el modo de presentar
los datos analíticos.
4. Mostrar la estadística como una herramienta: para el estudio de errores aleato-
rios, para rechazar resultados, establecer límites de confianza y realizar ensa-
yos de hipótesis y significación.

Universidad Nacional de Educación a Distancia 2015


2

CONOCIMIENTOS PREVIOS
Es necesario disponer de los conocimientos generales de matemáticas (cálculo y estadística) impartidos
en asignaturas estudiadas anteriormente.

PLAN DE ESTUDIO DEL CONTENIDO DEL CAPÍTULO


Conceptos fundamentales Objetivos

 Resaltar la importancia y los diversos aspectos de las medi-


Importancia analítica de las medidas
das analíticas.

 Aprender el concepto de exactitud y la forma de expresión:


error absoluto y relativo.
Precisión y exactitud: formas de expresión
 Aprender el concepto de precisión y la forma de expresión:
desviación estándar o típica, varianza, coeficiente de variación
y rango o recorrido.

 Aprender los errores determinados, indeterminados y crasos.


 Aprender las fuentes de los errores determinados (instrumen-
Errores: tipos y fuentes
tales, de método y personales), su efecto en los resultados
(constantes y proporcionales).
 Aprender las fuentes de los errores indeterminados y la forma
de estudio mediante distribuciones.

Universidad Nacional de Educación a Distancia 2015


3

Conceptos fundamentales Objetivos

Rechazo de resultados  Aprender a aplicar algunos procedimientos de rechazo de re-


sultados discrepantes (test Q).

Incertidumbre en el cálculo numérico.  Estimar la desviación estándar de un resultado a partir de dos


Propagación de errores o más datos experimentales (de sumas y restas, productos o
cocientes, potencias, logaritmos y antilogaritmos).

Presentación de datos analíticos: cifras  Aprender la forma sencilla de indicar la incertidumbre de una
significativas medida experimental mediante las cifras significativas y la
forma de redondear los resultados de los cálculos.

Tratamiento estadístico de los datos expe-  Entender la aplicación de la estadística a los datos experimen-
rimentales tales y su uso en la estimación de los errores aleatorios o in-
determinados.

Límites de confianza  Aprender a establecer el intervalo de confianza con un nivel


de probabilidad elegido.

Comprobaciones o ensayos de hipótesis  Entender y realizar ensayos de hipótesis y comprobación es-


tadística (de media, de diferencia de medias y de varianzas).

Universidad Nacional de Educación a Distancia 2015


4

1.1. IMPORTANCIA ANALÍTICA DE LAS MEDIDAS

En Química Analítica los datos están constituidos por medidas de propiedades, siendo el objetivo final de
las medidas comprender mejor los problemas y tomar mejores decisiones. Sin embargo, la medida de
cualquier propiedad de la materia está sujeta a cierto grado de incertidumbre, no conociéndose el verdade-
ro valor de la magnitud. Por ello, es necesario aplicar cuidadosamente una técnica de medida, para obte-
ner una estimación de la magnitud que sea satisfactoria para el propósito que se pretende, y después, es-
tablecer su incertidumbre.
La fiabilidad de la estimación de la magnitud se debe basar, en:
 La experiencia acumulada sobre la técnica de medida, y
 La concordancia con resultados obtenidos utilizando materiales de referencia certificados o aplican-
do otros métodos.
En cualquier caso, es necesario cierto conocimiento sobre el error o errores asociado con el resultado para
que éste resultado tenga validez.

Universidad Nacional de Educación a Distancia 2015


5

Los errores se originan en los tres componentes implicados en cualquier análisis: observador, sistema bajo
estudio e instrumentación utilizada. Entre ellos hay interrelación y se ven también afectados por el ambien-
te (temperatura, presión, composición, etc.).
El término error suele descri-
bir la diferencia entre el valor En general, el término error suele describir la diferencia entre el valor verdadero o esperado y el
verdadero o esperado y el obtenido.
obtenido.
Después de realizadas las medidas debe estudiarse su veracidad.
En Química Analítica es imposible eliminar los errores totalmente, pero siempre se debe poder determinar
la magnitud y orientación de esos errores, con el objeto de tener un conocimiento definido y concreto de la
fiabilidad de los resultados obtenidos.
La estadística como herramienta científica posibilita el tratamiento de los resultados analíticos para propor-
cionar información sobre la fiabilidad de estos resultados.

1.2. PRECISIÓN Y EXACTITUD: FORMAS DE EXPRESIÓN

En los experimentos que se realizan medidas hay que considerar la precisión y exactitud. La exacti-
tud puede ser definida como la corrección de una medida o como la concordancia de las medidas
con el valor verdadero de la cantidad medida, indica la proximidad de una medida a su valor verdade-
ro, y se expresa por el error. Sin embargo, como el valor verdadero generalmente no se conoce, con
los datos obtenidos experimentalmente se toma como valor verdadero el valor más probable o se usa
un valor aceptado.
  X E
 , es el valor verdadero o más probable o un valor aceptado como verdadero.

Universidad Nacional de Educación a Distancia 2015


6

X , es el valor obtenido experimentalmente, generalmente es un valor representativo de un conjunto


de valores, como la medida aritmética ( x ).
E , es el error

El error absoluto es la diferencia entre un valor observado o medido y el valor verdadero (más pro-
Error absoluto:
bable o aceptado), es decir:

μ
μ

E = O- E=O-

donde: E , es el error absoluto


O , es el valor observado
 , es el valor verdadero o más probable o aceptado
El error absoluto tiene signo, el signo negativo indica que el resultado experimental es menor que el
valor aceptado (error por defecto) y el signo positivo indica que el resultado experimental es mayor
que el valor aceptado (error por exceso).

El error relativo es el cociente entre el error absoluto y el valor considerado como verdadero o más
probable o aceptado.
Error relativo:
O-μ E
O-μ E ER = = 100
ER = = 100 μ μ
μ μ
El error relativo es una forma de expresión del error, más útil que el error absoluto y suele expresarse
en %, aunque también se puede expresar en tanto por 1000 (0/00). Por ejemplo, un error por defecto
del -2% o del -200/00.
A veces, se utiliza el término exactitud relativa, referido al valor medio o media aritmética expresado
como porcentaje del valor verdadero.
Universidad Nacional de Educación a Distancia 2015
7

x
Exactitud relativa = 100
μ

La precisión expresa la reproducibilidad de una medida, es decir, la concordancia entre varias medi-
La precisión expresa
das de la misma sustancia o propiedad que han sido hechas exactamente de la misma manera.
la reproducibilidad de
una medida. La precisión puede expresarse de varias maneras, mediante: la desviación promedio, el rango o in-
tervalo, la desviación estándar, la varianza, la desviación estándar relativa y el coeficiente de varia-
ción.

Ejemplo

En una metodología analítica para ajustar un equipo se realiza una medida a cada
una de las seis porciones (alícuotas) de un material de referencia que contiene
exactamente 40,00 ppm de cadmio. Los resultados obtenidos con el mismo pro-

Universidad Nacional de Educación a Distancia 2015


8

cedimiento y una vez ordenados de forma creciente, son: X1 = 38,6; X2 = 39,0;


X3 = 39,2; X4 = 39,6; X5 = 40,2; X6 = 40,4.

El valor central de un conjunto de datos suele ser el más representativo y más fiable que cualquiera
de los resultados individuales. Como valor central y medida de centralización se utiliza frecuentemen-
te, la media y la mediana; aunque existen otras como la moda, media geométrica, media armónica,
etc.

La media o media aritmética o promedio se obtiene dividiendo la suma de los resultados de las
La media: medidas por el número de medidas realizadas.
N

x
N

x= i=1
i
x i

N x= i=1
N
38, 6  39, 0  39, 2  39, 6  40, 2  40, 4
x  39, 5 ppm de Cd
6

La mediana de una serie de resultados es el resultado que queda en el centro cuando se ordenan
por orden de magnitud y el número es impar. En el caso de un número de resultados par, se toma
como mediana, la media aritmética de los dos resultados centrales.
39,2  39,6
Mediana   39,4 ppm de Cd
2
La diferencia entre un valor particular y el valor medio se llama desviación de este valor,  i  xi  x , y
cuanto más pequeñas sean las desviaciones en una serie de medidas, tanto mayor es la precisión.
Universidad Nacional de Educación a Distancia 2015
9

La desviación prome- La desviación promedio se calcula mediante el cociente de la suma, en valor absoluto, de las des-
dio: viaciones y el número total de desviaciones, es decir:

D.P. =
x -x
i

N
D.P. =
x -xi
 0,57  0,6 ppm de Cd
N

El rango o intervalo se calcula mediante la diferencia entre el valor mayor y el menor.


El rango o intervalo:
R = x mayor - x menor R = x mayor - x menor

R = 40, 4 - 38, 6 = 1,8 ppm de Cd


La desviación estándar de una muestra se calcula mediante la expresión siguiente:
La desviación están- N
dar:  (x - x)
i
2

N s= i=1

 (xi - x)2 N-1


s= i=1
N-1 2,46
s  0,701  0,7 ppm de Cd (Para N<30)
6 1
La utilización de otras expresiones de cálculo de la desviación estándar mediante diferencia de su-
mas (véase expresión siguiente) puede dar evaluaciones erróneas cuando los datos contienen cinco
o más dígitos.

Universidad Nacional de Educación a Distancia 2015


10

2
 N 
  xi 
xi   i 1 
N

 2

N
s i 1

N 1

La varianza es el cuadrado de la desviación estándar:


La varianza:
N N

 (x - x)
i
2
 (x i - x)2
s2 = i=1 s2 = i=1

N-1 N-1

s
2
2,46 2
  0,492  0,5 (ppm de Cd)
6 1

El coeficiente de variación es el cociente entre la desviación estándar y el valor medio.


El coeficiente de va-
riación: s
s CV = 100
CV = 100 x
x
0,7
CV  100  1,772%  1,8%
39,5
El valor que se obtiene es un porcentaje que no tiene unidades y se utiliza para comparar precisiones
entre conjuntos de datos de magnitudes distintas.

Universidad Nacional de Educación a Distancia 2015


11

La desviación estándar relativa es parecida al anterior y generalmente se calcula en tantos por


1000 aunque también suele darse en %, coincidiendo con el coeficiente de variación. A veces, se uti-
liza indistintamente coeficientes de variación y desviación estándar relativa.

La desviación están- s
D.S.R. = 1000
dar relativa: x
s
D.S.R. = 1000 s 0,7
x D.S .R.  1000 ppt  1000  17,72  18 ppt
x 39,5

El error absoluto y el error relativo, en el ejemplo anterior planteado, serían negativos, es decir, por
defecto:

Error absoluto  39,5  40,00  -0,5 ppm de Cd.

Error relativo:

39,5  40, 00 0,5


ER   x100  1,3%
40, 00 40, 00

El error relativo y la exactitud relativa son valores porcentuales sin unidades.

39,5
Exactitud relativa  x100  98, 7%
40, 00
Universidad Nacional de Educación a Distancia 2015
12

1.3. ERRORES: TIPOS Y FUENTES

Teniendo en cuenta la imposibilidad de eliminar por completo los errores de laboratorio y sus causas, es
necesario conocer su procedencia para tratar de eliminar las causas y disminuir los errores.
Los errores, se clasifican en tres grandes grupos:
 Errores aleatorios o independientes o experimentales.
 Errores sistemáticos o determinados o determinables o cognoscibles.
 Errores crasos o grandes o salvajes.
Los errores aleatorios Los errores aleatorios los constituyen errores fortuitos, derivados del azar y siguen las leyes de la proba-
los constituyen errores bilidad. Se estudian utilizando la teoría estadística.
fortuitos, derivados del
azar y siguen las leyes Los errores aleatorios o indeterminados o experimentales son errores que afectan a la precisión de las
de la probabilidad. medidas y pueden evaluarse mediante los parámetros de precisión.
Los errores sistemáticos se definen como aquellos que pueden ser evitados, porque tienen un origen
definido que se puede identificar. Son la causa de que todos los resultados de las medidas repetidas sean
altos o bajos. Se ponen de manifiesto realizando el análisis por métodos distintos.
Los errores sistemáti- Las fuentes de errores determinados más importantes que pueden presentarse en análisis cuantitativo
cos se definen como son:
aquellos que pueden ser
evitados, porque tienen Universidad Nacional de Educación a Distancia 2015
un origen definido que
se puede identificar.
13

o Errores causados por el equipo utilizado (instrumentales), debidos a la mala calibración de los ins-
trumentos, como las balanzas, material volumétrico, etc.
o Errores debidos a los reactivos.
o Errores personales ocasionados por la falta de habilidad del analista para realizar observaciones
con certeza.
o Errores operacionales (operativos) que tienen su origen en la inexperiencia o falta de cuidado del
analista, por ejemplo en el trasvase de líquidos.
o Errores de método (metódicos) son inherentes a las propiedades físicas y/o químicas del sistema
objeto de análisis. En análisis cuantitativo, las interferencias son una fuente de error de método. En
análisis gravimétrico, son fuentes de error la solubilidad de los precipitados o los fenómenos de pre-
cipitación. El error determinado que tiene un método analítico se denomina sesgo (bias).
Los errores determinados o sistemáticos afectan a la exactitud de los resultados, para su estimación es
necesario conocer el valor verdadero o el más probable (generalmente, con materiales de referencia).
El error total de los resultados analíticos suele estar constituido por errores sistemáticos y errores aleato-
rios. Para identificar las causas y la magnitud de estos errores es necesario el empleo de distintos proce-
dimientos.
La utilización en el laboratorio de materiales de referencia y la participación en estudios intercomparativos
con otros laboratorios son procedimientos que se emplean para identificar las causas y los errores del la-
boratorio. Estos procedimientos de control externo e interno de calidad permiten evaluar los errores siste-
máticos del laboratorio.
Los errores determinados o sistemáticos de método son difíciles de detectar, para ello se emplea el uso de
materiales de referencia, y si esto no es posible puede utilizarse otro método (análisis independientes).
Los errores determinados constantes se detectan variando el tamaño de la muestra, y los errores constan-
tes provocados por especies interferentes, mediante las determinaciones del blanco (el blanco contiene
todos los reactivos y disolventes excepto los analitos de la muestra).
Universidad Nacional de Educación a Distancia 2015
14

La Química Analítica actual tiende a buscar la mejor exactitud posible, incertidumbres pequeñas, límites
de detección cada vez más bajos, intervalos de medida amplios, y prevención de los errores debidos a
cambios en la naturaleza de la matriz y a las interferencias. Para ello se utilizan métodos analíticos bien
contrastados que han superado los estudios comparativos interlaboratorios y que se han validado anali-
zando materiales de referencia.
También, en el laboratorio es necesario aplicar continuamente los principios de aseguramiento de la cali-
dad y las herramientas de control de calidad (por ejemplo, gráficos de control) para mantener los métodos
analíticos en un buen nivel de ejecución y bajo el control estadístico.
Teniendo en cuenta la imposibilidad de eliminar por completo los errores del laboratorio y sus causas, es
más fácil reducir los que afectan a la precisión que los que condicionan la exactitud.
A veces, en el laboratorio se producen errores importantes que afectan a los resultados falseando la infor-
mación analítica buscada y, por tanto, influyendo en el prestigio del laboratorio. Las causas más frecuentes
de estos errores denominados crasos suelen ser las siguientes:
o Confusión de las muestras.
o Alteración de las muestras por conservación negligente.
o Contaminación o dilución de las muestras.
o Pérdidas accidentales de analito en alguna fase del tratamiento previo de las muestras.
o Patrones de calibración equivocados, o confusiones en las concentraciones de los mismos.
o Deriva grave o inestabilidad del equipo analítico no controlada.
o Interferencias previsibles, pero no previstas, en el campo de aplicación normal del método.
o Errores en los cálculos, especialmente los relativos a los factores de dilución.
o Control ineficaz de los tipos de análisis que realiza laboratorio y desatención a los antecedentes de
análisis similares.
o Transcripción errónea de los resultados o de sus unidades.
Universidad Nacional de Educación a Distancia 2015
15

o Comprobación inadecuada de los resultados, en base a la información disponible de la muestra, o


de la serie de muestras.
Los errores crasos normalmente afectan sólo a un único resultado de una serie de datos repetidos, ha-
ciendo que difiera significativamente de todos los demás resultados de la serie.
Los errores crasos o salvajes difieren de los determinados o indeterminados en que normalmente ocurren
sólo en raras ocasiones, son con frecuencia grandes, y pueden causar que un resultado sea o alto o bajo.
No suelen pertenecer a la categoría de los errores sistemáticos, sino que se trata simplemente de equivo-
caciones de distintos tipos y malas prácticas de laboratorio. El factor humano es crucial en esta clase de
errores (falta de atención o motivación, necesidad de realización rápida, desinterés, negligencia, etc.) y
pueden tener lugar en cualquier fase del proceso analítico. Los errores crasos conducen a resultados abe-
rrantes, es decir, que difieren mucho de todos los demás datos de una serie de medidas repetidas.
Los errores sistemáticos pueden clasificarse en función de su magnitud, esto es, en constantes o pro-
porcionales.
En los errores constantes o aditivos, la relación entre el valor medido, x, y el valor verdadero, μ, es del tipo:
x = μ + k (error constante positivo); x = μ - k (error constante negativo). La magnitud de un error constante
no depende del tamaño de la cantidad medida. Afecta más a medida que disminuye el tamaño de la mues-
tra, por ejemplo, pérdidas por solubilidad con respecto al peso del precipitado, exceso de reactivo para que
se produzca el cambio de color. Para minimizar el efecto del error constante se utiliza una muestra lo más
grande posible.
En los errores proporcionales la relación entre el valor medido, x, y el valor verdadero, μ, es del tipo: x = μ
+ k μ (error proporcional positivo); x = μ - k μ (error proporcional negativo). Los errores proporcionales au-
mentan o disminuyen de forma proporcional respecto tamaño de la muestra tomada para el análisis. Una
causa de errores proporcionales es la presencia de interferentes en la muestra.
Los errores indeterminados o aleatorios, los causan un gran número de variables incontroladas que inter-
vienen en cualquier proceso de medida. No se pueden identificar porque la mayoría son tan pequeñas que
son indetectables. Sin embargo, el efecto acumulativo de los errores indeterminados individuales hacen
que los datos de una serie de medidas repetidas fluctúen al azar alrededor del valor medio.
Universidad Nacional de Educación a Distancia 2015
16

Con un mismo equipo, cuando se representan los resultados que se obtienen y estos van aumentando en
número, se puede hacer la representación gráfica del denominado histograma que habitualmente da lugar
a la curva de distribución normal de frecuencias o curva Gaussiana (Figura 1.1). Experimentalmente se
sabe que la distribución de datos repetidos en la mayoría de los experimentos de análisis cuantitativo se
aproxima a la curva de Gauss.

Universidad Nacional de Educación a Distancia 2015


17

Universidad Nacional de Educación a Distancia 2015


18

Universidad Nacional de Educación a Distancia 2015


19

Universidad Nacional de Educación a Distancia 2015


20

Figura 1.1. Representación gráfica de los resultados obtenidos.

Estas representaciones están caracterizadas por una medida de centralización (media) y por una medida
de dispersión (desviación estándar).
Las siguientes distribuciones normales recogidas en la Figura 1.2, tienen la misma media, pero diferentes
desviaciones estándar.
Universidad Nacional de Educación a Distancia 2015
21

Figura 1.2. Distribuciones normales con la misma media, pero diferentes


desviaciones estándar.

Universidad Nacional de Educación a Distancia 2015


22

Las siguientes distribuciones normales recogidas en la Figura 1.3, tienen diferentes medias e igual desvia-
ción estándar.

Universidad Nacional de Educación a Distancia 2015


23

Figura 1.3. Distribuciones normales recogidas con diferentes medias e


igual desviación estándar.

Universidad Nacional de Educación a Distancia 2015


24

La curva de distribución normal o de Gauss para un conjunto infinito de datos es una curva simétrica res-
pecto al valor medio, μ, y cuanto mayor sea la desviación estándar (σ), mayor será la anchura de la curva.
La media muestral, x , y la desviación estándar muestral, s, proporcionan una estimación de los paráme-
tros poblacionales, μ y σ.
Todas las distribuciones de Gauss tienen la propiedad recogida en la Figura 1.4, se pueden establecer
intervalos de: x  s ; x  2s ; x  3s donde se encuentran diferente porcentajes de resultados, o probabili-
dades de encontrar el verdadero valor, pudiéndose establecer intervalos de confianza.

Universidad Nacional de Educación a Distancia 2015


25

Figura 1.4. Curva de distribución normal o de Gauss.

1.4. RECHAZO DE RESULTADOS

A veces, en una serie de datos hay un dato discrepante, es decir, que se aleja del resto. Se debe decidir
entre rechazarlo o considerarlo de la serie de datos. En el rechazo de resultados hay que ser cuidadoso
para no rechazar datos que pertenezcan a la serie, aunque estén algo alejados. Diversos criterios y prue-
bas estadísticas se utilizan en el rechazo de resultados.
El test Q, es una prueba estadística bastante utilizada. En primer lugar se ordenan los resultados en orden
creciente de magnitud, en segundo lugar se calcula la diferencia entre el valor dudoso y el valor más pró-
ximo a él │X1-X2│, después se calcula la diferencia entre el valor más alto y el más bajo │Xmayor –Xmenor│,
incluyendo el dato dudoso, y finalmente con el cociente de las diferencias se calcula el parámetro Qexperimen-
El test Q: tal.
X1 - X 2
Q experimental =
X Mayor - X menor X1 - X 2
Qexperimental =
XMayor - Xmenor

El valor de Qexperimental se compara con un Qtabulado proporcionado por tablas, cuyo valor depende del núme-
ro de datos y del nivel de probabilidad elegido.
Se rechazará el dato dudoso si Qexperimental > Qtabulado

Universidad Nacional de Educación a Distancia 2015


26

Número Q0,90 Q0,95 Q0,99


de datos

3 0,941 0,970 0,994

4 0,765 0,829 0,926

5 0,642 0,710 0,821

6 0,560 0,625 0,740

7 0,507 0,568 0,680

8 0,468 0,526 0,634

9 0,437 0,493 0,598

10 0,412 0,466 0,568

Universidad Nacional de Educación a Distancia 2015


27

Ejemplo

Una determinación gravimétrica de níquel, proporcionó los siguientes resultados:


8,41%; 8,42%; 8,39%; 8,40 y 8,46%. ¿Este último valor debe retenerse a un nivel de
probabilidad del 90%?
Solución: Se rechazará el dato a este nivel de probabilidad del 0,90

Resolución:
8,46  8,42 0,04
Qexp erimental    0,571
8,46  8,39 0,07
Como Qexperimental (0,571)< Qtabulado (0,642), no se rechaza el dato a este nivel de probabilidad del 0,90.

Universidad Nacional de Educación a Distancia 2015


28

1.5. INCERTIDUMBRE EN EL CÁLCULO NUMÉRICO. PROPAGACIÓN DE


ERRORES

En los procesos analíticos existen diversas etapas experimentales cada una de ellas sujeta a errores. El
error que afecta a un resultado final tiene dado por los errores sistemáticos y aleatorios de cada una de las
etapas. Se puede calcular el resultado final a partir de los errores que afectan a cada dato de partida.
No se propagan igual los errores sistemáticos y los errores aleatorios, por eso es importante considerar su
propagación.
La estimación del error aleatorio (estimación de la desviación estándar) de un resultado final, a partir de
otros datos experimentales, es posible utilizando unas reglas matemáticas sencillas en base a la precisión
de cada observación.
Las expresiones de estimación de los errores aleatorios (desviación estándar, sy) en el cálculo numérico de
diversas operaciones son las siguientes:
 Suma o diferencia

y=a+b-c → s y  sa2  sb2  sc2

a, b y c son variables experimentales y sa, sb, sc, sus respectivas desviaciones estándar.

 Producto o cociente

Universidad Nacional de Educación a Distancia 2015


29

2 2 2
b sy s  s  s 
y= a →   a   b   c 
c y a b c

 Potencia

sy sa
y  ak → k
y a

 Logaritmo

sa
y=log a → s y  0,434
a

 Antilogaritmo

sy
y=antilog a →  2,303sa
y

En las sumas y en las restas, las incertidumbres absolutas son aditivas. La varianza (cuadrado de la des-
viación estándar) de una suma o diferencia de cantidades independientes, es igual a la suma de sus va-
rianzas.

Universidad Nacional de Educación a Distancia 2015


30

Ejemplo

La determinación de tres muestras de un material que contiene níquel ha proporcio-


nado los valores siguientes: 4,05±0,05; 3,95±0,02; 4,10±0,03 ¿cuál es el contenido
medio en níquel?

x
=
4
,
0
3
±
0
,
0
6
Solución:

Resolución:

y  a( sa )  b( sb )  c( sc )  4,05(0,05)  3,95(0,02)  4,10(0,03) 

s y  s a2  s b2  s c2  ( 0,05) 2  ( 0,02) 2  ( 0,03) 2  0,06

4,05  3,95  4,10


x  0,06  4,03  0,06
3

x = 4,03 ± 0,06

En las multiplicaciones y divisiones, las incertidumbres relativas son aditivas y el error más probable se
obtiene por la raíz cuadrada de la suma de las varianzas relativas.

Para hallar la desviación estándar absoluta de un producto o una división, primero hay que hallar la des-
viación estándar relativa del resultado y luego multiplicarla por el resultado.

Universidad Nacional de Educación a Distancia 2015


31

Ejemplo

El contenido de un metal en un camión de mineral de 5230±10 Kg es de


45,30±0,07%. Calcular la incertidumbre en los kilos de metal contenidos en el ca-
mión.
Solución: Cantidad de metal = 2369,2±5,7 Kg

Resolución:
5230  10 45,30  0,07   2369,19  s
y
100

 10
La incertidumbre relativa del peso del mineral del camión, es:  0,0019
5230

 0,07
La incertidumbre relativa del contenido de metal, es:  0,0015
45,30

La incertidumbre relativa del producto calculado anteriormente, es:

( S y ) relativa  (0,0019) 2  (0,0015) 2  2,4  10 3

La incertidumbre absoluta, es:

s y  2369,19(0,0024)  5,7 Kg

Universidad Nacional de Educación a Distancia 2015


32

Cantidad de metal = 2369, 2 ± 5, 7 Kg

Con frecuencia en muchos procesos de determinación es necesario combinar sumas o restas y multiplica-
ciones o divisiones, siendo necesario combinar las incertidumbres.

Ejemplo

En el análisis de una amina por el método de Kjedahl, se puede establecer la si-


guiente ecuación para el cálculo del porcentaje de nitrógeno en la amina (P)
(milim oles de ácido)  (mL de base)(molaridad de la base)
P (14,01)(100) 
(mg de muestra)

Si los datos obtenidos fueran los que se recogen en la expresión siguiente:

(4, 52  0.03)  (0,1000  0, 0009)(12, 45  0, 04)


P (14, 01)(100) 
(600, 0  0, 3)

La evaluación de la incertidumbre en el 2º término del numerador (multiplicación), será:

Universidad Nacional de Educación a Distancia 2015


33

2 2
 0,0009   0,04 
1,245  1,245      1,245±0,012
 0,1000   12,45 
La evaluación de la incertidumbre en el numerador (resta), será:

4,52  0,03  1,245  0,012   3,27  0,032  0,012 2 = 3,27±0,03


La evaluación de la incertidumbre para los términos finales (división), será:

2 2
3,27  0,03  0,03   0,3 
 0,00545  0,00545     = 0,00545±0,00005
600,0  0,3  3,27   600,0 

y la operación final, será:

P(%) = (0,00545±0,00005)(14,01)(100)=7,64±0,07 → (7,6±0,1)%

En el caso de los exponentes, esto es, cuando una cantidad está ligada a una potencia, a2, no se calcula
el error como si fuera para una multiplicación (a x a), debido a que las cantidades implicadas no son inde-
pendientes.
Para la expresión y = ak, donde el exponente está libre de incertidumbre, la desviación estándar relativa de
y, como consecuencia de la incertidumbre de a es:
Universidad Nacional de Educación a Distancia 2015
34

sy sa
k
y a

Ejemplo

Para (6,0±0,2)2
Sy 0,2
2  0,067
y 6,0
La incertidumbre absoluta es (36,0)(±0,067)=2,4
Por tanto, el resultado de la operación, (6,0±0,2)2=36±2
Así pues, la desviación estándar relativa del cuadrado de un número es el doble de la desviación estándar
relativa de dicho número, la desviación estándar de la raíz cúbica de un número es 1/3 de la desviación
estándar relativa de dicho número, y así sucesivamente.

Ejemplo

El producto de solubilidad en agua de la sal de cromato de plomo (PbCrO4↓) es


(1,8±0,2)x10-14. La solubilidad será:

Solubilidad = (Ks)1/2 = (1,8 x10-14)1/2 = 1,34 x 10-7


Si, y=solubilidad, a= Ks, y x=1/2, la incertidumbre de la solubilidad en agua será:

Universidad Nacional de Educación a Distancia 2015


35

sa 0,2 x1014

a 1,8 x1014

sy 1 0, 2
   0, 056
y 2 1,8

s y  1, 34 x10 7 (0, 056)  7, 5 x10 9

Por tanto, la solubilidad es 1,34(±0,08)x10-7 M

Para el cálculo de los logarítmos, es decir, y = log a (y = 0,434 ln a), la incertidumbre en y es igual a la
incertidumbre relativa en a multiplicada por 0,434. Es decir:
sa
y=log a → s y  0,434
a

Ejemplo

¿Cuál será el pH de una disolución que contiene iones H+ en concentración


(3,2±0,2)x10-4 M?
Solución: pH = 3,49±0,03
Universidad Nacional de Educación a Distancia 2015
36

Resolución:
pH=-log(H+)=-log ((3,2±0,2)10-4) =
La incertidumbre relativa de (H+), es:

0,2 x104
 0,062
3,2 x10 4
Sy= 0,434 (±0,062) = ±0,027

p
H
=
3
,
4
9
±
0
,
0
3
1.6. PRESENTACIÓN DE DATOS ANALÍTICOS: CIFRAS SIGNIFICATIVAS

En análisis cuantitativo las operaciones analíticas conducen a la obtención de un resultado, esto es, a un
número que representa la cantidad de analito (componente) en la muestra analizada. El resultado debería
proporcionar información sobre su fiabilidad (grado de exactitud y precisión), los procedimientos estadísti-
cos facilitan esta evaluación y junto con los materiales de referencia son imprescindibles para obtener re-
sultados de calidad. Los resultados se suelen presentar, unas veces, acompañados de los intervalos de
confianza (para un nivel de probabilidad, 0.90 ó 0,95 ó 0,99) y otras veces mediante alguna medida de
precisión (desviación estándar, coeficiente de variación, etc). Menos adecuado, aunque bastante frecuen-
te, es establecer la calidad de los resultados utilizando los criterios de cifras significativas.

Universidad Nacional de Educación a Distancia 2015


37

Un número que expresa una cantidad está formado por cifras o dígitos. Las cifras significativas son los
dígitos del número necesarios para expresar la precisión de la medida de la que fueron obtenidos, inclu-
yendo todas las cifras ciertas y la primera incierta o dudosa. En resumen, el número de cifras significativas
es el número de dígitos necesarios para explicar los resultados de una medida conforme a la precisión de
la medida, incluye todas las cifras ciertas y la primera incierta o dudosa.
El analista debe tener en cuenta la significación de las cifras o dígitos que constituyen los datos experimen-
tales, de forma que el resultado sea verdaderamente un reflejo de la veracidad del análisis. El resultado no
puede implicar una veracidad mayor que la que corresponda a las medidas de que deriva, y, evidentemen-
te, la veracidad no debe disminuir como consecuencia de los cálculos realizados a partir de los datos expe-
rimentales.
Normalmente, cuando se mide una propiedad de la materia se hace por comparación, y las medidas llevan
consigo alguna incertidumbre. El grado de incertidumbre depende, generalmente, del sistema de medida,
del operador y, fundamentalmente, de la sensibilidad del instrumento empleado. Así, por ejemplo, si se
mide el pH de una disolución con un sistema que aprecie las décimas, la medida será incierta en ±0,01
aproximadamente, mientras que si se usa un sistema que aprecie las centésimas, puede llevarse a cabo
una medida más precisa por ser incierta en ±0,001. Una medida de pH de 5,22 realizada con el primer
equipo tiene tres cifras significativas, sin embargo, la medida realizada con el segundo equipo y expresada
como 5,233 tiene cuatro cifras significativas.
El dígito cero puede ser parte significativa de la medida o usarse simplemente para señalar el punto deci-
mal (primeras cifras del número). Cuando el número que expresa la medida contiene ceros estos pueden
ser significativos o no. Cualquier cero que se encuentre después del decimal es significativo, y como se ha
señalado anteriormente no lo es si se usa para indicar el lugar del decimal. El cero será significativo cuan-
do se encuentre entre otros números enteros distintos de cero.
Por ejemplo, en los números 5200,2 y 3825,0 con cinco cifras significativas cada uno, los ceros son signi-
ficativos. El último número podría escribirse como 3,8250x103, con las cinco cifras significativas y un expo-
nente no significativo. Sin embargo, cuando los primeros dígitos son cero y se utilizan para situar la coma
para la magnitud decimal o en factores exponenciales, no se consideran como cifras significativas. Por

Universidad Nacional de Educación a Distancia 2015


38

ejemplo: 0,00433 = 4,33x10-3 = 433x10-5 todos tienen tres cifras significativas con diferente forma de ex-
presión.
El número de cifras significativas en una medida es independiente del lugar que ocupa el punto decimal.
Así, 22,034 mm; 2,2034 cm; 0,22034 dm y 0,022034 m, todos los números tienen el mismo número de
cifras significativas, cinco, y representan simplemente distintas maneras (unidades) de expresar una medi-
da.
En un resultado, los ceros finales deben utilizarse con cuidado porque si estos no son significativos no de-
berían ser escritos. Por ejemplo, el número de Avogadro (número de moléculas de un mol) es 6,023x1023
(cuatro cifras significativas) expresa perfectamente la precisión con que se conoce el número, sería inco-
rrecto escribirlo de otra forma.
En los datos, deben figurar las cifras significativas necesarias para que haya una incierta, y si estos son
base de cálculos, es utilizable una cifra más además de la incierta. Los dígitos o cifras se eliminan de
acuerdo con ciertas normas. Cuando la cifra siguiente a la última que hay que conservar es mayor de cin-
co, se incrementa la cifra que se conserva, en 1 (por ejemplo, 23,347 conservando cuatro cifras significati-
vas queda 23,35). Cuando la cifra siguiente a la última que se conserva es menor de cinco, la última cifra
que se retiene no sufre modificación (por ejemplo, 23,343 conservando cuatro cifras significativas queda
23,34). Cuando la cifra siguiente a la última que hay que conservar es cinco y hay cifras distintas de cero
después del cinco, la última cifra que se conserva se aumenta en uno, sea par o impar (por ejemplo,
23,3353 conservando cuatro cifras significativas queda 23,34). Cuando la cifra siguiente a la última que
hay que conservar es cinco y no hay otra cifra o sólo ceros después de cinco, la última cifra que se retiene
aumenta en uno si es impar y no se modifica si es par (por ejemplo, 23,335 o 23,3350 se convierte en
23,34 con cuatro cifras significativas; 23,345 ó 23,3450 se convierte en 23,34 con cuatro cifras significati-
vas). Esta regla es porque los números pares e impares son igualmente probables, el efecto de la regla es
que, en promedio, el dígito retenido aumenta la mitad de las veces y permanece sin cambio la otra mitad.
La incertidumbre puede ser absoluta o relativa, son dos formas posibles de expresión. La primera se ex-
presa directamente en las unidades de la medida. Por ejemplo, un peso en un granatario de 12,253 tiene
una incertidumbre absoluta de ±0,001 (un miligramo). La incertidumbre relativa se expresa en relación a la
cantidad que se mide, normalmente en porcentaje. Por ejemplo, en un volumen de 40,5 (se aprecia 0,1 ml
Universidad Nacional de Educación a Distancia 2015
39

en 405 décimas de ml), la incertidumbre relativa será de aproximadamente el 0,25%; en un peso de 0,105
g (se aprecia 1 mg en 105 mg) la incertidumbre relativa será de aproximadamente el 1%.
Las cifras significativas, además de para tratar los resultados de las medidas únicas, se utilizan también en
los tratamientos y cálculos matemáticos cuando se combinan varias cantidades medidas.
 En las sumas y restas, tanto en los datos de estas operaciones como en los resultados, se conserva
el número de dígitos con respecto al término que tenga mayor incertidumbre absoluta. El redondeo se
fundamenta en el término que tiene la menor precisión absoluta.
Por ejemplo, la suma:
0,183 + 73,245 + 1,44 = se convierte en 0,18 + 73,24 + 1,44 = 74,86
 En la multiplicación y división, se conservan en cada término y en el resultado las cifras suficientes
para expresar una incertidumbre relativa igual a la que tengan el término de la incertidumbre más alta
(incertidumbre más alta supone menor precisión relativa). El redondeo se fundamenta en el término que
tiene menor precisión relativa. El factor que determina la aplicación de esta regla es la precisión relativa
de los números, no el número de cifras significativas que tienen.

Ningún resultado puede ser más preciso que el dato menos preciso entre los datos originales. La preci-
sión no debe disminuir como consecuencia del cálculo.
Cuando los cálculos implican sumas/restas y multiplicaciones/divisiones, cada etapa individual deberá
tratarse separadamente.
Ejemplo:
362(661  23,54) 362(661  24) 362 x637
   154,2
33,97(39,42  4,693) 33,87(39,42  4,69) 33,9 x 44,1

Universidad Nacional de Educación a Distancia 2015


40

Suele ser recomendable retener una cifra extra en los cálculos intermedios, hasta el resultado final, y si
se utiliza calculadora, mantener todo los dígitos hasta el fin de la operación y proceder después a ex-
presar el resultado con el número correcto de cifras.
A veces, en la práctica se opera considerando que el resultado tendrá las mismas cifras significativas
que el dato con menor número de ellas. Así:
24,75  43,92  0,04200
 21,97268  21,97
2,0778
Si la magnitud de la respuesta, prescindiendo del signo y de la coma que indica los decimales, es me-
nor que el dato con menor número de cifras significativas, puede expresarse el resultado con una cifra
más que las obtenidas por aplicación de la regla anterior. Ejemplo:
33,79  782
 167 ,2142  167 ,2
241,7  0,6538
 En las operaciones al utilizar logaritmos se conservan en la mantisa del logaritmo de cada término tan-
tas cifras como se hayan conservado en el propio término, es decir, al convertir logaritmos a antilogarit-
mo y viceversa, el número que se convierte y la mantisa del logaritmo tienen el mismo número de cifras
significativas.
La característica de un logaritmo no es cifra significativa, solamente expresa la magnitud del antilogarit-
mo, sin embargo, todos los ceros de la mantisa son significativos.

Ejemplo:
log 5322 = 3,7260 (3 es la característica del número y 7260 es la mantisa).
log 3892 x 10-2 =1,5902
log 1,18 = 0,072

Universidad Nacional de Educación a Distancia 2015


41

antilogaritmo de -0,0084 = 0,9808 (0084 son los dígitos de la mantisa que se corresponden a las 4 cifras
significativas del número).
antilogaritmo de 0,00018 =1,0004
antilogarítmo de 4,32 = 21x103
Es habitual que en el transcurso de las operaciones, utilizando calculadoras, se presenten diversos dígitos
que no son significativos, debe tenerse especial cuidado para adecuar los resultados finales de modo que
sólo se incluyan las cifras significativas, aunque se redondee al finalizar los cálculos.
No debe olvidarse que para estimar la incertidumbre de un resultado debe utilizarse los procedimientos y
expresiones vistos anteriormente (apartado 1.5).

Ejemplo

En el cálculo del porcentaje de ácido benzoico (con un peso molecular de 122,125)


presente en una muestra sólida de 2,9840 g mezclado con otros componentes, que
una vez disuelta y valorada con hidróxido potásico 0,2510M hasta viraje de fenolfta-
leína, se gastan 35,40 mL, la resolución sería:

0,2510 mmol KOH 1 mmol Ac. Benz. 122,125 g Ac. Benz.


35,40mL   
mL KOH mmol KOH 1000 mmol Ac. Benz.
% Áci. Benz.  (100)
2,9842 g de muestra

Universidad Nacional de Educación a Distancia 2015


42

% Ácido Benzoico =36,36%


Las incertidumbres relativas de los datos experimentales anteriores se pueden determinar como sigue.
 El nivel del líquido en la bureta se puede estimar en ±0,02 mL, y con la lectura inicial y final, la des-
viación estándar del volumen será:

(0,02)2  (0,02)2  0,028mL


La incertidumbre relativa será:
 0,028
 100  0,079 %
35,40
 La incertidumbre absoluta de un peso medido en una balanza analítica es ±0,0001 g, y por tanto, la
incertidumbre relativa del peso de la muestra será:
 0,0001
 100  0,003 %
2,9842
 La incertidumbre absoluta de la molaridad del reactivo, suele ser, 0,0001, por tanto, la incertidumbre
relativa será:
 0,0001
 100  0,04%
0,2510
 La incertidumbre relativa del peso molecular del ácido benzoico es varios órdenes de magnitud me-
nor que los datos experimentales y no tiene incidencia.
 100% y 1000 mmol de ácido benzoico no tienen incertidumbre, puesto que son números exactos.

De ordinario es suficiente redondear el resultado de modo que su incertidumbre relativa sea del mismo
orden de magnitud que la incertidumbre relativa del número de mayor incertidumbre relativa.
Universidad Nacional de Educación a Distancia 2015
43

La mayor incertidumbre relativa de los datos utilizados es 0,079%, por tanto el resultado debe redondearse
al mismo orden de magnitud. Si el resultado se redondea a 36,4, la incertidumbre relativa sería,
(0,1/36,4)x100=0,27% que está por encima de 0,079%. Si el resultado se redondea a 36,362, la incerti-
dumbre relativa sería (0,001/36,362)x100=0,0027% que está muy por debajo de 0,079%. Si el resultado se
redondea a 36,36, la incertidumbre relativa sería (0,01/36,36)x100=0,027%, del mismo orden de magnitud
que la incertidumbre relativa del número de mayor incertidumbre relativa. También se utiliza el redondeo
del número de modo que su incertidumbre relativa quede entre 0,2 y 2 veces la mayor incertidumbre relati-
va de los datos utilizados.
Así, 0,079%x2=0,158% y 0,079x0,2=0,0158%; y entre estos dos valores está la proporcionada por el re-
sultado elegido, es decir, 0,027%.

1.7. LÍMITES DE CONFIANZA

El valor medio (verdadero), μ, de los datos de una población no puede ser determinado porque requeriría
un número infinito de medidas. Por medio de la teoría estadística es posible estimar el intervalo (los lími-
tes) en el cuál se encuentra el verdadero valor medio, μ, con un determinado grado de probabilidad. El
intervalo se le denomina intervalo de confianza y los límites son límites de confianza.
Varias son las expresiones que se puede utilizar para calcular los límites de confianza:
z
LC para   x 
N

Universidad Nacional de Educación a Distancia 2015


44

Esta expresión que utiliza la distribución de Gauss, es aplicable cuando se dispone de un gran número de
datos para que σ (desviación estándar poblacional) pueda ser estimado con la desviación estándar mues-
tral (s) y en ausencia de errores determinados, o cuando se conoce σ.
Cuando no se tienen buenas estimaciones de σ, hay que recurrir a la distribución t de Student. El estadísti-
co t tiende a z a medida que los grados de libertad (N-1) se hacen infinito.
La expresión para el cálculo de los límites de confianza cuando se dispone de un número reducido de da-
tos es la siguiente:
ts
LC para   x 
N
La Tabla 1.1 muestra los valores de t de Student para diferentes grados de libertad y probabilidad.

Universidad Nacional de Educación a Distancia 2015


45

Tabla 1.1. Valores de t de Student para diferentes grados de libertad y probabilidad.


Grados de libertad
90% 95% 99%
(N-1)
1 6,31 12,7 63,7
2 2,92 4,30 9,92
3 2,35 3,18 5,84
4 2,13 2,78 4,60
5 2,02 2,57 4,03
6 1,94 2,45 3,71
7 1,90 2,36 3,50
8 1,86 2,31 3,36
9 1,83 2,26 3,25
10 1,81 2,23 3,17
11 1,80 2,2 3,11
12 1,78 2,18 3,06
13 1,77 2,16 3,01
14 1,76 2,14 2,98
15 1,75 2,13 2,95
16 1,75 2,12 2,92
17 1,74 2,11 2,90
18 1,73 2,10 2,88
19 1,73 2,09 2,86

Universidad Nacional de Educación a Distancia 2015


46

20 1,72 2,09 2,84


25 1,71 2,06 2,79
40 1,68 2,02 2,70
∞ 1,645 1,96 2,58

Ejemplo

La determinación de mercurio en seis muestras de agua residual, proporcionó los


siguientes resultados: 0,96 ppm; 1,04 ppm; 0,89 ppm; 1,85 ppm; 1,52 ppm y 1,98
ppm. ¿Cuál es intervalo de confianza para una probabilidad del 99%?
Solución: El verdadero valor de mercurio se encuentre en el intervalo de 2,16-0,58 ppm.

Resolución:

Grados de libertad = N-1= 6-1= 5


t para 99% = 4,03
4,03  0,48
Límites de Confianza  1,37   1,37  0,79
6
Por tanto, hay un 99% de probabilidad de que, en ausencia de errores sistemáticos, el verdadero valor de
mercurio se encuentre en el intervalo de 2,16-0,58 ppm.

Universidad Nacional de Educación a Distancia 2015


47

1.8. COMPROBACIONES O ENSAYOS DE HIPÓTESIS

Existen diversas pruebas estadísticas, basadas en modelos matemáticos de distribuciones de probabilidad


que se utilizan para hacer la comparación de la precisión de dos conjuntos de datos que podrían corres-
ponder con dos métodos distintos, con un mismo método realizado por dos laboratorios diferentes, tam-
bién se utilizan para la comparación de medias y para establecer la exactitud de la determinación o de un
método de análisis, etc. Estos ensayos estadísticos se denominan ensayos de hipótesis o de significación.
En un ensayo de significación se estima la probabilidad de que se cumpla la hipótesis nula (hipótesis que
se establece para contrastar), esto es, por ejemplo que la diferencia entre las dos desviaciones estándar o
entre las dos medias se deba meramente a fluctuaciones aleatorias. Si se cumple la hipótesis nula esta-
blecida, los estimadores que se comparan corresponden a estadísticos de una misma población.
Comparación de la precisión. Para la comparación de la precisión de dos conjuntos de datos (por ejem-
El test F: plo de dos métodos distintos), se utiliza el test F.
s12 Para ello, se obtiene el valor de Fcalculado, definido por la relación de las varianzas de los dos métodos.
Fcalculado =
s22
s12
Fcalculado  2 considerando que (s12  s 22 )
s2

Universidad Nacional de Educación a Distancia 2015


48

Si el valor de Fcalculado es menor que el valor del tabulado se aceptaría la hipótesis nula planteada de que
no hay diferencia estadística significativa al nivel de probabilidad establecido, entre s1 y s2; mientras que si
el valor Fcalculado es mayor del tabulado, s1 es significativamente mayor que s2.
El test F se usa, tanto para establecer hipótesis de si un métodos es más preciso que otro o también si
hay diferencia de precisión entre los dos métodos. En la primera de estas aplicaciones, la varianza del pro-
cedimiento que se supone más preciso se pone siempre en el denominador y la del menos preciso en el
numerador (varianza mayor). En la segunda aplicación, la varianza mayor aparece siempre en el numera-
dor. Poniendo de este modo, arbitrariamente, la varianza mayor en el numerador, resulta menos cierta la
solución del test; así, el nivel de incertidumbre de los valores de F tabulados se duplican, pasando del 5%
al 10%.
La Tabla 1.2 recoge los valores de F teóricos en función de los grados de libertad en el numerador (en co-
lumnas) y del denominador (en filas), para un 0.95 de probabilidad.

Tabla 1.2. Valores de F teóricos en función de los grados de libertad en el numerador (en columnas) y del
denominador (en filas), para un 0.95 de probabilidad.
Grados de liber- Grados de libertad para la varianza mayor
tad para la
varianza menor 2 3 4 5 6 7 8 9 10 12 20 ∞

2 19,00 19,16 19,25 19,30 19,33 19,36 19,37 19,38 19,39 19,41 19,45 19,50
3 9,55 9,28 9,12 9,01 8,94 8,88 8,84 8,81 8,78 8,74 8,66 8,53
4 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,80 5,63
5 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,78 4,74 4,68 4,56 4,36
6 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,87 3,67
7 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,63 3,57 3,44 3,23

Universidad Nacional de Educación a Distancia 2015


49

8 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,34 3,28 3,15 2,93
9 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,13 3,07 2,94 2,71
10 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,77 2,54
12 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,54 2,30
20 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,12 1,84
∞ 3,00 2,60 2,37 2,21 2,10 2,10 1,94 1,88 1,83 1,75 1,57 1,00

Ejemplo

Un laboratorio realiza un procedimiento para la determinación de cadmio en siete


muestras de agua, obteniendo una desviación estándar de 1,37 ppm. Una modifica-
ción en el proceso de extracción del procedimiento proporcionó para las siete
muestras una desviación estándar de 0,98 ppm. Otra modificación en el ajuste del
pH del procedimiento proporcionó para las siete muestras una desviación estándar
de 0,78 ppm. ¿Algunas de las modificaciones realizadas en el método le hacen más
preciso que el original?
Resolución:

Universidad Nacional de Educación a Distancia 2015


50

Fcalculado 
1,37
2
 1,95
0,982
(1,37) 2
Fcalculado   3,08
(0,78) 2
Buscando en las tablas para 6 grados de libertad en el numerador y en el denominador, el valor de Ftabulado,
para un nivel de significación del 5%, es de 4,28. Comparando el valor tabulado con los valores calculados
se observa que éstos son menores y se desestima una posible hipótesis nula planteada de que la modifi-
cación tiene una precisión significativamente mayor para un nivel de probabilidad del 95%.
Si se quisiera ensayar una posible hipótesis para saber si la precisión de la segunda modificación es signi-
ficativamente mejor que la primera, tendríamos que:

Fcalculado 
0,98
2
 1,95
0,782

Al comparar el Fcalculado=1,95 con el Ftabulado=4,28 se establece que esta diferencia no ha sido demostrada.

 Comparación de una media experimental con un valor verdadero. Un procedimiento común para
comprobar la exactitud de un método de análisis y detectar posibles errores sistemáticos, consiste en
realizar diversas determinaciones de un material de referencia suministrado por algún organismo que
certifica el valor/es del analito/s de este material. Al comparar los resultados obtenidos, se puede utili-
zar los modelos estadísticos (habitualmente t de Student o z de Gauss) para calcular la probabilidad de

Universidad Nacional de Educación a Distancia 2015


51

que la diferencia observada entre la media obtenida experimentalmente, x , y el verdadero valor, μ (va-
lor fiable proporcionado por el material de referencia evaluado con un alto número de grados de liber-
tad por laboratorios de prestigio), se debe solamente a un error aleatorio.
Para ello, con la modificación de la expresión utilizada anteriormente para el cálculo de los límites de
confianza, se evalúa el estadístico t:

x      t N
s

t calculado   x   
N
s
Sustituyendo en la expresión anterior los valores correspondientes de la media obtenida ( x ), la des-
viación estándar experimental (s), el número de resultados (N) y el valor dado por el material de refe-
rencia (μ) se obtiene el valor de tcalculado. Si el valor absoluto, sin considerar signo, de tcalculado., es me-
nor que el valor tabulado (valor teórico proporcionado por la distribución t de Student y dado en la tabla
anterior) no hay evidencia de error sistemático, para un determinado nivel de confianza.

Ejemplo

La determinación mediante un nuevo procedimiento del contenido en alcohol de


una bebida, cuyo valor conocido es 12,35%, ha proporcionado los siguientes resul-

Universidad Nacional de Educación a Distancia 2015


52

tados: 11,95%; 11,85%; 11,24%; 11,55%. ¿Éstos resultados ponen de manifiesto un


error sistemático en el nuevo procedimiento?
Resolución:

t calculado   x   
N 4
 (11,65  12,35)  4,37
s 0,3205
El valor de ttabulado para el 95% de probabilidad es 3,18; menor que el valor obtenido, por tanto, a este nivel
de probabilidad se pone de manifiesto la presencia de un error sistemático en el nuevo procedimiento. Hay
un 95% de probabilidad de que la diferencia entre el valor de referencia y el valor obtenido experimental-
mente no sea debido al azar. Hay una probabilidad de equivocarse de 5 veces en cada 100.
Sin embargo, el valor de ttabulado para el 99% de probabilidad es 5,84; mayor que el valor obtenido de
tcalculado, por tanto, a este nivel de probabilidad, para no equivocarse en más de 1 vez de cada 100, debe
concluirse que no se pone de manifiesto la presencia de un error sistemático en el nuevo procedimiento, lo
cual no indica que no exista un error sistemático.

 Comparación de dos medias experimentales. Para comparar los resultados obtenidos por un méto-
do analítico con los resultados de otro método distinto o para comparar si los análisis de dos materiales
permiten afirmar que los materiales son idénticos, etc., se plantea una hipótesis nula (H0) de que los re-
sultados son iguales y las diferencias observadas en los resultados son sólo debidas a errores aleato-
rios. Frente a esta hipótesis nula se plantea una alternativa (H1) que establece que los resultados no
son iguales y las diferencias observadas son debidas a errores sistemáticos.

Universidad Nacional de Educación a Distancia 2015


53

Para tomar una decisión sobre las hipótesis estadísticas planteadas y resolver con la teoría estadística
la comparación de resultados, en primer lugar, hay que saber si la precisión de cada conjunto de datos
es significativamente igual o distinta con respecto al otro conjunto de datos.
a) Si la precisión de los conjuntos de datos que se comparan son significativamente iguales  1   2  ,
las expresiones matemáticas que se utilizan para la resolución son las siguientes:
En primer lugar se aplica la prueba F para comparar la precisión de ambos conjuntos de datos:
s12
Fcalculado  2
s2
Si el valor de Fcalculado es inferior al Ftabulado y la precisión es comparable, se calcula el valor del estadís-
tico t haciendo uso previamente de una desviación estándar combinada (sc) obtenida de los resultados
a comparar. Las expresiones que se utilizan son:
x1  x 2 x1  x 2 N1 N 2
t calculado  o también t calculado 
1 1 sc N1  N 2
sc (  )
N1 N 2

s12 ( N 1  1)  s 22 ( N 2  1)
sc  o también
N1  N 2  2

i  N1 i N2

 ( xi1  x1 ) 2   (x i2  x2 ) 2
sc  i 1 i 1

N1  N 2  2

Universidad Nacional de Educación a Distancia 2015


54

El valor de t obtenido, mediante estos cálculos, se compara con el valor tabulado de la distribución t de
Student para N1+N2-2 grados de libertad, y al nivel de probabilidad elegido. Si el valor de tcalculado es mayor
que el tabulado, las dos series de resultados son significativamente diferentes para el nivel de confianza
considerado.

Ejemplo

Se analizaron los vagones de dos trenes que contenían un mineral de hierro con el
objetivo de determinar si su contenido en hierro era equivalente y/o si procedían de
la misma zona de explotación de la mina. Los resultados obtenidos fueron: Tren 1
(%): 42,53; 42,75; 42,62; 43,30; 43,39; 42,98; 42,56; 42,98; 42,53; 42,75. Tren 2 (%):
44,35; 44,77; 44,42; 44,51; 44,45; 44,61; 44,16; 44,35. ¿Indican los datos una diferen-
cia entre los contenidos de hierro en los trenes?
Resolución:
En primer lugar, para comparar la precisión del contenido de mineral de hierro en ambos trenes, se aplica
la prueba F:
s12 0,3142
Fcalculado    2,92
s 22 0,1842
El valor obtenido es menor que el valor tabulado, para una probabilidad del 0,95 y 9 y 7 grados de libertad
en el numerador y denominador, respectivamente (F0,95; 9; 7=3,68). Por tanto, los contenidos de hierro de
los minerales de ambos trenes tienen precisiones comparables.
Universidad Nacional de Educación a Distancia 2015
55

Seguidamente, para aplicar la prueba t, se determina previamente la desviación estándar combinada:

sc 
s12 ( N 1  1)  s 22 ( N 2  1)
=
0,3142 9  0,1842 7 = 0,265
N1  N 2  2 10  8  2
El valor de tcalculado será:

x1  x 2 N1 N 2 42,84  44,45 10  8
t calculado  = = -12,81
sc N1  N 2 0,265 10  8

El valor de ttabulado para 16 grados de libertad (10+8-2=16), al 95% de probabilidad, es de 2,12; establecien-
do que las medias son significativamente diferentes. Incluso para el 99% el valor de t obtenido, en valor
absoluto, es superior del tabulado (2,92). Las diferencias encontradas en el análisis de uno y otro tren se
deben a errores aleatorios en menos del 1%, en definitiva el contenido en hierro de ambos trenes en distin-
to, proceden de zonas diferentes de la mina.

b) Si la precisión de los conjuntos de datos que se comparan son significativamente diferentes  1   2  ,


las expresiones matemáticas que se utilizan para la resolución de los casos son las siguientes:
En primer lugar al igual que en a) se aplica la prueba F para comparar la precisión de ambos conjuntos
de datos:

Universidad Nacional de Educación a Distancia 2015


56

s12
Fcalculado 
s22
Si la precisión no es comparable, es decir, las desviaciones estándar de los dos conjuntos de datos son
significativamente distintas, se calcula t mediante una expresión que tiene en cuenta las dos desviacio-
nes estándar de los dos conjuntos de datos:

x1  x 2
t calculado 
s12 s 22
(  )
N1 N 2
El valor de t obtenido se compara con el valor tabulado de la distribución t de Student para un número de
grados de libertad (g.l.) que es el número entero más próximo al resultado del siguiente cálculo:
s12 s 22 2
(  )
N1 N 2
g .l.  2
s12 2 s 22 2
( ) ( )
N1 N2

N1  1 N 2  1
Si el valor de tcalculado es mayor que el tabulado, las dos series de resultados son significativamente diferen-
tes para el nivel de confianza considerado.

 Comparación de resultados apareados o de diferencias individuales. A veces, es necesario com-


parar dos series de datos de procedencia muy distinta, con cantidades muy diferentes de analito (de
distintos puntos, en distinta época del año, cuando se dispone de poca cantidad de muestra, etc.), ob-

Universidad Nacional de Educación a Distancia 2015


57

teniendo los resultados agrupados por parejas pues si se utilizan los procedimientos anteriores, las di-
ferencias de los datos de cada serie impedirían obtener conclusiones válidas.
En estos casos de comparación de grupos de datos, se utiliza la prueba t, referida a la diferencia entre
cada par de resultados de los grupos de datos.
La expresión matemática que se utiliza es:
d
t calculado  N
sd

d es la media de las diferencias entre los resultados de los dos grupos, sd es la desviación estándar de
las diferencias, y N el número de pares de datos. Los grados de libertad se establecen con N-1.
Si el valor de tcalculado es menor que el de ttabulado no hay diferencia significativa entre los dos grupos de da-
tos, a un determinado nivel de probabilidad.

Ejemplo

En ocho lugares y en dos épocas del año (invierno y verano), se determinan en el


agua de una laguna los contenidos de un contaminante orgánico. Los resultados
obtenidos (ppm) fueron los siguientes: a) Invierno: 49,72; 35,14; 31,24; 25,30; 20,15;
13,86; 10,12 y 11,88. b) Verano: 57,20; 39,38; 29,08; 27,72; 18,04; 15,03; 13,86 y 13,42.
¿Existe diferencia significativa entre los resultados obtenidos del contaminante en
las dos épocas del año, para un nivel de probabilidad del 0,95?
Resolución:
Universidad Nacional de Educación a Distancia 2015
58

En primer lugar, se calcula la diferencia de valores en el mismo punto de muestreo, obteniendo los resulta-
dos siguientes, di:7,48; 4,24; -2,16; 2,42; -2,11; 1,17; 3,74 y 1,54.
Seguidamente se calcula el estadístico t:
d 2,04
t calculado  N= 8 = 1,80
sd 3, 2
El valor tabulado de t para una probabilidad (nivel de confianza) del 95% y 7 grados de libertad (8 pares
de valores -1=7) es 2,37. Como el valor de tcalculado (1,80) es menor del t teórico (2,37), puede concluirse que
no hay diferencia significativa entre los resultados obtenidos en las dos épocas del año, con una probabili-
dad de error del 5%.

Como consecuencia de la aplicación de la teoría estadística y la utilización de las hipótesis estadísticas se


definen 2 tipos de errores:
 Errores de primera clase (de tipo I) o errores α: son los que se cometen cuando se rechaza una hi-
pótesis que debería ser aceptada.
 Errores de segunda clase (de tipo II) o errores β: son los que se cometen cuando se acepta una hi-
pótesis que debería ser rechazada.

Universidad Nacional de Educación a Distancia 2015


59

1.9. PROBLEMAS DE AUTOEVALUACIÓN

1. Establecer los límites de confianza, a un nivel del 99%, cuando se realizan 15


medidas para determinar mercurio y se obtiene un valor medio de 1,67 ppm y
una desviación estándar de 0,10 ppm.
Nivel de Probabilidad % 80 90 95 99
Para 13 grados de libertad t 1,35 1,77 2,16 3,01
Universidad Nacional de Educación a Distancia 2015
60

Para 14 grados de libertad t 1,34 1,76 2,14 2,98

Solución: LC = 1,67 ± 0,077

2. Calcular el número de medidas que deben realizarse para disminuir el interva-


lo de confianza de una determinación de plomo en ±0,06 ppm, cuando la des-
viación estándar es 0,10 y el intervalo de confianza es del 95%. Dato: t= 1,96
Solución: N=11 medidas

3. Los análisis de tres muestras de mineral hierro indican contenidos de:


33,24±0,03; 32,37±0,04; 31,08±0,03 ¿Cuál es el contenido medio de mineral de
hierro? Debe darse el resultado final con la incertidumbre adecuada.
Solución: 32,23±0,06

Resolución

Problema 1.
ts 2, 9 8x0 ,10
LC  x ± = 1, 6 7 ± = ±0 , 077
N 15

Universidad Nacional de Educación a Distancia 2015


61

LC = 1,67 ± 0,077

Problema 2.

;
ts 1,96x0,1
LC = ± 0,06 = ± ;
N N
N = 11 medidas

Problema 3.
33,24 + 32,37 + 31,08
x= = 32,23
3
(0,03)2 + (0,04)2 + (0,03)2 = 0,06

32,23 ± 0,06

1.10. BIBLIOGRAFÍA

Universidad Nacional de Educación a Distancia 2015


62

1. Skoog, D.A., West, D.M., Holler, F.J., Crouch, S.R., Fundamentos de Química Analítica, 8ª edi-
ción. Paraninfo/Thomson Learning, 2005.

Universidad Nacional de Educación a Distancia 2015