Vous êtes sur la page 1sur 286

Prentice

Hall

---

James N. Miller
Jane C. Miller

I
,

ESTADSTICA Y QUIMIOMETRA
PARA QUMICA ANALTICA

,
1

i
1

ESTADSTICA Y QUIMIOMETRA
PARA QUMICA ANALTICA
Cuarta edicin

James N. Miller
J ane C. Miller

Traduccin
Carlos Mat ]imnez
Profesor Propio de Estadstica
Escuela Tcnica Superior de Ingeniera - Le.A.L
Universidad Pontificia Comillas de Madrid

Roberto Izquierdo Hornillos


Profesor Titular de Qumica Analtica
Universidad Complutense de Madrid

Prentice

---Hall

Madrid. Mxico. Santaf de Bogot. Buenos Aires. Caracas. Lima. Montevideo. San Juan
San Jos. Santiago. Sao PauIo White PIains

Datos de ca ta logacin bibliogrfica

ESTADSTICA Y QUIMIOMETRA PARA


QUMICA ANALTICA
MILLER, N. J. y MILLER, J. C.
PEARSON EDUCACiN. S.A .. Madrid. 2002
ISBN: 84-205-3514-1
Materia: ESTADSnCA. 311
Formato 170 x 240

Pginas: 296

No est permitida la reproduccin total o parcial de esta obra


ni su tratamiento o transmisin por cualquier medio o mtodo.
sin autorizacin escrita de la EditoriaL
DERECHOS RESERVADOS
2002 respecto a la primera edicin en espaol por:
PEARSON EDUCACIN, S.A.
Nez de Balboa, 120
28006 MADRID

MILLER, N. J. y MILLER, J. C.
ESTADSTICA y QUIMIOMETRA PARA QUMICA ANALTICA
ISBN: 84-205-3514-1
Depsito legal: M.29.356-2002
PRENTlCE HALL es un sello editorial autorizado de PEARSON EDUCACIN. S.A.
Traducido de:

Statistics and Chemometrics for Analytical Chemistry


Fourth Edition
Copyright 2000, por Pearson Education Limited
ISBN: 0-13-022888-5
Edicin en espaol:
Equipo editorial:
Editora: Isabel Capella
Tcnico editorial: Marta Caicoya
Equipo de produccin:
Director: Jos Antonio Ciares
Tcnico: Diego Marn
Equipo de diseo: Mario Guindel, La Senz y Begoa Prez
Composicin: COPIBOOK, S.L.
Impreso por: Lavel, S. A.
IMPRESO EN ESPAA - PRINTED IN SPAIN

Este libro ha sido impreso con papel y tintas ecolgicos

Contenido

Prlogo a la primera edicin

lX

Prlogo a la cuarta edicin

Xl

Agradecimientos
Glosario de smbolos
1.

2.

Xlll

xv

Introduccin.....................................................................................
1.1. Los problemas analticos

1
1

1.2. Errores en el anlisis cuantitativo


1.3. 1'ipos de errores
1.4. Errores aleatorios y sistemticos en el anlisis volumtrico.
1.5. El manejo de errores sistemticos
1.6. Planificacin y diseo de experimentos
1. 7. Calculadoras y computadoras en los clculos estadsticos
Bibliografa
Ejercicios

2
3
7
11
15
16
19
19

Estadstica de medidas repetidas


2.1. Media y desviacin estndar
2.2. La distribucin de medidas repetidas
2.3. La distribucin lag-normal......................................................

21
21
23
27
28
29
30
32
33
34

2.4.
2.5.
2.6.
2.7.
2.8.
2.9.
2.10.

Definicin de muestra
La distribucin muestral de la media
Lmites de confianza de la media para muestras grandes
Lmites de confianza de la media para muestras pequeas..
Presentacin de resultados
Otros usos de los lmites de confianza
Lmites de confianza de la media geomtrica de una distribucin lag-normal

35

2.11. Propagacin de errores aleatorios


2.12. Propagacin de errores sistemticos
Bibliografa
Ejercicios

vi
()
O
::l
r-t-

ro

::l

o:.
O

3. Contrastes de significacin
3.1.
3.2.

Introduccin.............................................................................
Comparacin de una media experimental con un valor conocido
3.3. Comparacin de dos medias experimentales
3.4. El contraste t para datos emparejados
3.5. Contrastes de una y dos colas
3.6. El contraste F para la comparacin de desviaciones estndar.
3.7. Datos anmalos
3.8. Anlisis de la varianza
3.9. Comparacin de varias medias
3.10. La aritmtica de los clculos ANOVA
3.11. El contraste chi-cuadrado
3.12. El contraste de la normalidad de una distribucin
3.13. Conclusiones a partir de los contrastes de significacin
Bibliografa
;...................
Ejercicios

4.

La calidad de las medidas analticas


4.1. Introduccin..............
4.2. Muestreo
4.3. Estimacin y separacin de varianzas usando ANOVA......
4.4. Estrategia de muestreo
4.5. Mtodos de control de calidad: Introduccin
4.6. Diagramas de Shewhart para valores medios
4.7. Diagramas de Shewhart para rangos
4.8. La determinacin de la capacidad del proceso
4.9. Longitud media de rachas: diagramas de sumas acumuladas.
4.10. Esquemas de pruebas de suficiencia
4.11. Ensayos de colaboracin
4.12. Incertidumbre
4.13. Muestreo de aceptacin
Bibliografa
Ejercicios

5.

Mtodos de calibracin en anlisis instrumental: regresin


y correlacin
5.1. Introduccin: anlisis instrumental........................................
5.2. Grficas de calibrado en anlisis instrumental......................
5.3. El coefIciente de correlacin momento-producto
5.4. La recta de regresin de y sobre x..........................................
5.5. Errores en la pendiente y ordenada en el origen de la recta
de regresin
5.6. Clculo de una concentracin y su error aleatorio
5.7. Lmites de deteccin
5.8. El mtodo de las adiciones estndar

36
39
40
41
43
43
43
45
49
51
53
55
58
59
62
65
67
68
71
72
77
77
78
79
81
82
82
84
86
88
92
96
100
104
106
106
111
111
113
115
119
120
123
125
127

5.9.

El uso de rectas de regresin para comparar mtodos analticos


. 130
5.10. Rectas de regresin ponderadas
.. 135
5.11. Interseccin de dos lneas rectas
. 140
5.12. ANOVA y los clculos de regresin
.. 141
5.13. Mtodos de regresin no lineal: Introduccin
.. 143
5.14. El ajuste de curvas
.. 146
5.15. Datos anmalos en la regresin
.. 150
Bibliografa
. 152
Ejercicios
. 152

6.

7.

Mtodos no paramtricos y robustos

.. 157

6.1. Introduccin
6.2. La mediana: anlisis inicial de los datos
6.3. El contraste de los signos
6.4. El contraste de rachas de Wald-Wolfowitz
6.5. El contraste de rangos y signos de Wilcoxon
6.6. Contrastes simples para dos muestras independientes
6.7. Contrastes no paramtricos para ms de dos muestras
6.8. Correlacin ordinal
6.9. Mtodos de regresin no paramtricos
6.10. Mtodos robustos
6.11. Mtodos de regresin robustos
6.12. El contraste de la bondad del ajuste de Kolmogorov
6.13. Conclusiones
Bibliografa
Ejercicios

.
..
.
.
..
.
..
.
.
.
..
..
..
.
.

Diseo de experimentos y optimizacin

.. 189

7.1.
7.2.
7.3.
7.4.
7.5.
7.6.
7.7.
7.8.
7.9.

Introduccin
.
.
Aleatorizacin y formacin de bloques
ANOVA de dos factores
.
..
Cuadrados latinos y otros diseos
Interacciones
.
El diseo factorial frente al de un factor cada vez
.
.
Diseo factorial y optimizacin
Optimizacin: principios bsicos y mtodos univariantes ..
Optimizacin utilizando el mtodo de bsqueda de la variable alterna
.
..
7.10. Mtodo de la mxima pendiente
7.11. Optimizacin por el mtodo simplex
.
..
7.12. El revenido simulado
Bibliografa
.
,'
.
Ejercicios

8. Anlisis multivariante
8.1.
8.2.
8.3.
8.4.
8.5.

Introduccin
Anlisis inicial
Anlisis de componentes principales
Anlisis de conglomerados <clusters)
El anlisis discriminante

157
158
163
165
166
168
172
174
176
178
182
183
184
185
186
189
190
191
194
195
200
200
204
208
211
213
217
217
218

. 221
.
..
.
..
..

221
222
224
228
232

vii
()
O
~

.-+

ro

o:.
O

viii
()
O

g.
ro

::l

o:.
O

8.6. El mtodo de los K vecinos ms prximos


8.7. El modelado de clase disjunta
8.8. Regresin mltiple
8.9. Regresin sobre componentes principales
8.10. Regresin multivariante
8.11. Regresin sobre mnimos cuadrados parciales
8.12. Calibracin multivariante
8.13. Redes neuronales artificiales
8.14. Conclusiones
Bibliografa
Ejercicios

Soluciones a los ejercicios

236
237
237
238
238
239
239
242
243
243
244

Apndice 1.

Contrastes de significacin estadstica de uso


comn
257

Apndice 2.

Tablas estadsticas

ndice

261
273

Prlogo a la primera
edicin

Aadir otro volumen a los numerosos textos sobre estadstica pudiera parecer una tarea sin excesivas garantas de xito, sin embargo, la realidad es que
muchos cientficos de prestigio ignoran desgraciadamente los mtodos estadsticos ms elementales. Es ms asombroso an que los qumicos analticos,
que practican una de las ciencias ms cuantitativas de todas las existentes,
no estn ms inmunizados que otros contra este peligroso, pero sin lugar a
dudas curable mal. Es de esperar, por lo tanto, que este libro pueda beneficiar a los cientficos analticos que deseen disear y realizar sus experimentos correctamente, as como extraer tanta informacin de los resultados como razonablemente puedan. Pretende tambin ser interesante al creciente
nmero de estudiantes que se especializan en Qumica Analtica, y a los que
utilizan mtodos analticos de forma rutinaria en el trabajo de laboratorio.
Existen otras dos razones que nos han animado a escribir este libro. Una
es el enorme impacto de la microelectrnica, en forma de microcomputadoras y calculadoras de bolsillo, sobre la estadstica: estos aparatos han resuelto
los problemas que planteaban los procedimientos analticos difciles a todos
los cientficos prcticos. La segunda es el rpido desarrollo de nuevos procedimientos quimiomtricos, incluyendo el reconocimiento de pautas, optimizacin, tcnicas de filtrado numrico, simulaciones y otros, todos ellos factibles por las ventajas que aportan las computadoras.
El ltimo captulo de este libro intenta dar al lector al menos una introduccin del potencial de algunos de estos mtodos estadsticos ms novedosos. No se ha incluido, sin embargo, ningn programa de computador en el
libro -en parte debido a las dificultades de presentar programas que puedan
ejecutarse en todos los tipos populares de microcomputadoras, y en parte debido a la existencia de una cantidad sustancial de libros y programas de computador adecuados y disponibles al pblico.

lo.

La disponibilidad de este tremendo potencial de clculo, hace que de forma natural el cientfico aplique mtodos estadsticos de manera racional y
correcta. Al limitar la extensin de este libro y recalcar su sesgo prctico, no
hemos intentado mostrar con detalle las bases tericas de los contrastes estadsticos descritos. No obstante, hemos intentado aclarar al analista aquellos
contrastes que son apropiados a los tipos de problemas con que probablemente se encuentre en el laboratorio. En el texto hay ejemplos resueltos, y
al final de cada captulo ejercicios para el lector. Muchos de ellos estn basados en los datos proporcionados por trabajos de investigacin publicados
en The Analyst. Nuestro profundo agradecimiento a Mr. Phil Weston, editor,
por permitirnos hacer uso de su distinguida revista. Tambin agradecemos a
nuestros colegas, amigos y familia su paciencia durante la preparacin del
libro; al editor de la serie, Dr. Bob Chalmers; y a nuestros editores por su
eficiente cooperacin y consejos.
]. C. Miller
]. N. Miller
abril 1984

Prlogo a la cuarta
edicin

xi
()

::l

.....

ro

::l

o:.

Desde que se public la tercera edicin de este libro, en 1993, la utilizacin


de mtodos estadsticos elementales y avanzados en la enseanza, y la prctica de las ciencias analticas ha continuado creciendo con rapidez. Esta
nueva edicin intenta adaptarse a estos desarrollos, a la vez que conserva el
planteamiento bsico de las ediciones anteriores, donde se opt por una
aproximacin pragmtica y, en la medida de lo posible, no matemtica a los
clculos estadsticos.
Un cambio relevante en los ltimos aos ha sido el uso mucho ms amplio de los mtodos ms avanzados del anlisis multivariante. Esto se ha reflejado con la incorporacin de un captulo extra en el libro (Captulo 8) que
proporciona una introduccin ms detallada a dichos mtodos, sin entrar en
el lgebra matricial que subyace en los mismos. Tambin nos hemos sentido
animados a modificar el ttulo del libro para reflejar el uso ms amplio de
estas tcnicas quimiomtricas. Actualmente este trmino se emplea a veces
para referirse tanto a los mtodos estadsticos elementales como a los multivariantes aplicados a la qumica. Sin embargo, hemos preferido el punto de
vista consistente en aplicarlos a los clculos ms avanzados que requieran la
potencia de los computadores personales.
Todos los estudiantes, investigadores y personal de laboratorio tienen
ahora acceso a dichos computadores. Como es habitual, la disponibilidad de
tal rango de tcnicas estadsticas eleva en lugar de disminuir la necesidad de
una comprensin completa de estos mtodos. Por todo ello, nos hemos animado a incluir en el texto ejemplos de clculos realizados por dos programas
de computador consolidados: Excel y Minitab. El primero resulta accesible
probablemente desde la mayora de los puestos de clculo, emplendose
ampliamente en la recogida y procesamiento de datos procedentes de instrumentos analticos, mientras el segundo se elige con frecuencia en la educa-

xii

cin as como por los cientficos prcticos. En cada programa los clculos,
por lo menos los ms simples empleados en este libro, resultan fcilmente
accesibles y se presentan de manera simple, encontrndose disponibles muchos textos como introducciones generales al paquete en cuestin. Adems,
en estos programas se encuentran disponibles prestaciones adicionales como
grficos, diagnstico de la regresin, etc.; representando oportunidades para
una mejor y ms elaborada comprensin e interpretacin de los datos. Estas
prestaciones extra se utilizan en algunos ejemplos proporcionados en el
Manual del Profesor, que acompaaba la edicin de nuestro libro la primera
vez. El Manual tambin contiene ideas para las clases y el trabajo de laboratorio, un conjunto completo de figuras para emplearlas como transparencias
(OHP masters), as como soluciones detalladas a los ejercicios comprendidos
en este volumen: este texto contiene ahora slo esbozos de soluciones.
Otra rea de evolucin rpida en las ciencias analticas ha sido la relativa
a la calidad de los resultados analticos. Por esta razn, el Captulo 4, que
comprende una serie de tpicos relevantes, se ha escrito sustancialmente de
nuevo y ampliado para esta edicin. Se ha extendido el tratamiento de los
diagramas de control y se ha dado una mayor cobertura a las importantes
reas de los esquemas de ensayo de proficiencia y de los ensayos de colaboracin. Otras reas de la estadstica donde hemos intentado proporcionar
ms detalles son varios aspectos de la regresin y la calibracin, los mtodos
robustos y el tratamiento de las observaciones anmalas, el anlisis exploratorio de datos, el anlisis de la varianza, el diseo de experimentos y la optimizacin. El Apndice 1 se ha refundido para ofrecer mayor asesoramiento
sobre la cuestin crtica del contraste estadstico ms adecuado para utilizarlo en una situacin concreta. La inclusin de ms contrastes de significacin
implica que las tablas estadsticas tambin se hayan expandido. Algunos pocos tpicos que se trataban en ediciones anteriores, pero que tenan una limitada aplicacin prctica, se han omitido para dar espacio a estas nuevas
reas.
Estamos muy agradecidos a muchos lectores, tanto del cuerpo de profesores como del grupo de estudiantes, que de forma continuada nos siguen
proporcionando comentarios y sugerencias constructivos; as como nos sealan errores pequeos y omisiones. Tambin agradecemos a la Royal Society
of Chemistry el permiso para utilizar datos de artculos publicados en The
Analyst. Por ltimo, agradecemos a Alex Seabrook y sus colegas editoriales
en Pearson Education por su perfecta mezcla de experiencia, paciencia y entusiasmo.
James N. Miller
Jane C. Miller
octubre 1999

Agradecimientos

Los editores agradecen el permiso para reproducir el material siguiente con


derechos de autor.
Las Tablas A.2, A.3, A.4, A.7, A.8, A.ll, A.12, A.13 Y A.14, reproducidas con el permiso de Routledge. La Tabla 4.5 reimpresa con permiso del
Journal of the American Statistical Association, derechos de autor de 1958 de
la American Statistical Association. Reservados todos los derechos. La Tabla
A.6 reproducida con permiso de John Wiley & Sons, Limited. La Tabla A.I0
adaptada con permiso del lnstitute of Mathematical Statistics. Datos de
artculos publicados en The Analyst utilizados con el permiso de la Royal
Society of Chemistry. Ejemplos de entradas y salidas de Minitab utilizadas
con permiso de Minitab lnc.

Glosario de smbolos

- ordenada en el origen de la recta de regresin

b
e

- pendiente de la recta de regresin


- nmero de columnas en el ANOV A de dos factores

- trmino de correccin en el ANOV A de dos factores


e
- utilizado en el contraste de Cochran para la homogeneidad de
las varianzas
F
- cociente de dos varianzas
G
- utilizado en el contraste de Grubbs para datos anmalos
h
- nmero de muestras en el ANOV A de un factor
J.1
- media aritmtica de una poblacin
M
- nmero de signos menos en el contraste de rachas de Wa1dWo1fowitz
n - t a m a o muestra1
N
- nmero de signos ms en el contraste de rachas de Wa1d-Wo1fowitz
N
- nmero total de medidas en ANOVA de dos factores
v
- nmero de grados de libertad
P(r)
- probabilidad de r
Q
- La Q de Dixon, utilizada para contrastar datos anmalos
r
- coeficiente de correlacin momento-producto
r
- nmero de filas en ANOV A de dos factores
~
r
- nmero de observaciones mas grandes y mas pequeas descartadas en los clculos de la media recortada
R2
- coeficiente de determinacin
R,2
- coeficiente de determinacin ajustado
rs
- coeficiente de correlacin ordinal de Spearmann
C

_...
i..

xvi

C)

s
Sy/x
Sb
Sa

O"
o..

S(!J/x)W

CJ)

Sxo

SB

O'
CJ)

01
-:

ro

3'cT

O'
CJ)

SXE
S,-Oll'

(J
(J2

o
2

(JI

t
T
TI

W
Wi
X
Xo
Xo

YT 2

Xi
XE

Xw

X2
y

Yw
YB
Z

desviacin estndar de una muestra


desviacin estndar de los residuos de y
desviacin estndar de la pendiente de la recta de regresin
desviacin estndar de la ordenada en el origen de la recta de
regresin
desviacin estndar de los residuos de y de la recta de regresin
ponderada
desviacin estndar del valor de X estimado utilizando la recta
de regresin
desviacin estndar de un blanco
desviacin estndar de un valor de x extrapolado
desviacin estndar de un valor de x estimado utilizando la recta de regresin ponderada
desviacin estndar de una poblacin
varianza de la medida
varianza muestral
cantidad utilizada en el clculo de los lmites de confianza y en
contrastes de significacin de la media (vase la Seccin 2.4)
gran total en el ANOVA
estadsticos utilizados en el contraste de la suma de rangos de
Wilcoxon
rango
peso dado a un punto en la recta de regresin
media aritmtica de una muestra
valor de x estimado utilizando la recta de regresin
valor anmalo de x
pseudo-valor en estadstica robusta
valor de x extrapolado
media aritmtica de los valores de x ponderados
cantidad utilizada para contrastar la bondad del ajuste
valores de y pronosticados por la recta de regresin
media aritmtica de los valores de y ponderados
seal del blanco
variable normal estndar

Introduccin

1.1.

Los problemas analticos

Un qumico analtico puede enfrentarse con dos tipos de problemas. A veces


se le solicita slo una respuesta cualitativa. Por ejemplo, la presencia de boro
en agua destilada es muy peligrosa en la produccin de componentes microelectrnicos: contiene boro esta muestra de agua destilada?. Otras veces,
es un problema comn en la ciencia forense la comparacin de muestras de
suelo: pueden proceder estas dos muestras de suelo del mismo lugar?, En
otros casos, los problemas que se le plantean son cuantitativos: cunta albmina hay en esta muestra de suero sanguneo?, cunto plomo hay en
esta muestra de agua del grifo? Esta muestra de acero contiene pequeas
cantidades de cromo, wolframio y manganeso: cunto de cada uno?. stos
son ejemplos tpicos de anlisis cuantitativo uni o multicomponente.
De todos es conocido que la qumica analtica moderna es una ciencia
cuantitativa. Obviamente en muchos casos una respuesta cuantitativa es
mucho ms valiosa que otra cualitativa. Para un analista puede ser til decir
que ha detectado boro en una muestra de agua destilada, pero es mucho ms
til para l poder decir cunto boro se encuentra presente en dicha muestra.
La persona que solicit el anlisis podra, una vez que tiene esta respuesta
cuantitativa, juzgar si la concentracin de boro es de inters o no, considerar
cmo se puede reducir, etc. Pero si slo supiese que haba boro presente, le
sera difcil juzgar el significado del resultado. En otros casos, slo tiene valor un resultado cuantitativo. Por ejemplo, casi todas las muestras de suero
sanguneo humano contienen albmina; la nica pregunta es, cunta?
Es importante considerar que aun cuando se requiera una respuesta cualitativa, a menudo se utilizan mtodos cuantitativos para obtenerla. Este aspecto se aclara con la ayuda de los ejemplos expuestos al principio de esta
seccin. En realidad, un analista nunca dira simplemente puedo o no puedo detectar boro en esta muestra de agua. Utilizara un mtodo cuantitativo
capaz de detectar boro a niveles de 1 Ilg mIl. Si su ensayo diese un resultado
negativo, podra describirse de la forma: esta muestra contiene menos de

1 Ilg ml- 1 de boro. Si el ensayo diese un resultado positivo se podra decir que

la muestra contiene al menos 11lg ml- 1 de boro (tambin con otra informacin;
vase mas abajo). Para comparar dos muestras de suelo se podran utilizar
aproximaciones cuantitativas mucho ms complejas. Por ejemplo, las muestras
podran estar sujetas a un anlisis de tamaos de partcula, cuyas proporciones se clasificaran de acuerdo con el tamao, en un nmero (por ejemplo, 10
tamaos) de intervalos de tamao de partcula, y se determinara la fraccin
de muestra en cada intervalo. Entonces cada muestra se caracterizara por estos diez datos. Se pueden emplear procedimientos muy complejos (vase el Captulo 8) que proporcionen una valoracin cuantitativa de su similitud.

1.2.

Errores en el anlisis cuantitativo

Una vez que se acepta que los estudios cuantitativos jugarn un papel predominante en cualquier laboratorio analtico, tambin se debe aceptar que los
errores que aparezcan en tales estudios son de gran importancia. Nuestro
principio gua ser que no existen resultados cuantitativos de inters si no van
acompaados de alguna estimacin de los errores inherentes a los mismos. Este
principio naturalmente se aplica no solo a la qumica analtica sino a cualquier
campo de estudio donde se obtengan resultados experimentales numricos. Se
pueden examinar rpidamente una serie de ejemplos sencillos donde no solo
se aclara el principio sino que tambin se plantean los tipos de problemas estadsticos que se encontrarn y resolvern en los prximos captulos.
Supngase que un qumico sintetiza un reactivo analtico que considera
que es completamente nuevo. Lo estudia utilizando un mtodo espectromtrico y el compuesto proporciona un valor de 104 (normalmente, muchos de
nuestros resultados se expresarn en unidades cuidadosamente elegidas,
pero en este hipottico ejemplo se pueden utilizar unidades arbitrarias). Revisando la bibliografa, el qumico encuentra que ningn compuesto descubierto hasta el momento ha proporcionado un valor de ms de 100 cuando
se ha estudiado por el mismo mtodo bajo las mismas condiciones experimentales. La pregunta surge de manera natural, ha descubierto en realidad
nuestro qumico un compuesto nuevo? La respuesta a esta pregunta reside,
desde luego, en el grado de confianza en que se puede asignar ese valor experimental de 104. Qu errores estn asociados con l? Si un estudio posterior indica que el resultado es correcto dentro de 2 unidades (arbitrarias),
es decir, el verdadero valor probablemente cae en el intervalo 104 2, entonces es muy probable que se haya caracterizado un nuevo material. No
obstante, si las investigaciones muestran que los errores pueden alcanzar
hasta 10 unidades (es decir, 104 10), entonces es muy probable que el verdadero valor sea, en realidad, menor que 100, en cuyo caso est lejos de ser
cierto el nuevo descubrimiento. En otras palabras, resulta esencial un conocimiento de los errores experimentales (tanto en este caso como en cualquier
otro) para la interpretacin adecuada de los resultados. En trminos estadsticos este ejemplo conllevara la comparacin de los resultados experimentales con un valor supuesto o de referencia: este tema se estudia con detalle en
el Captulo 3.
Una situacin muy habitual es la del analista que realiza varias determinaciones repetidas durante el anlisis de un componente. (El valor y signifi-

cacin de tales repeticiones se analiza con detalle en el prximo captulo.)


Supngase que un analista realiza un experimento volumtrico cuatro veces
y obtiene valores de 24.69, 24.73, 24.77 Y 25.39 mI. El primer aspecto a sealar es que los valores de valoracin se presentan redondeados en 0.01 mI;
este aspecto tambin se analiza en el Captulo 2. Resulta obvio que los cuatro
valores son diferentes, debido a los errores inherentes a las medidas, y a que
el cuarto valor (25.39 mI) es en esencia diferente de los otros tres. La pregunta que surge aqu es, puede rechazarse este cuarto valor con seguridad,
de manera que (por ejemplo) se proponga 24.73 mI como valor medio, precisamente el valor promedio de las otras tres lecturas? En trminos estadsticos, es el valor 25.39 mI una observacin anmala? Los Captulos 3 y 6
analizan con detalle el tpico importante del rechazo de resultados anmalos.
Otro problema frecuente consiste en la comparacin de dos (o ms) conjuntos de resultados. Supngase que un analista mide el contenido de vanadio de una muestra de acero por dos mtodos distintos. Con el primer mtodo
obtiene un valor medio de 1.04%, con un error estimado del 0.07%; utilizando el segundo mtodo obtiene un valor medio del 0.95 % Y un error del
0.04 %. De la comparacin de estos resultados surgen varias preguntas. Son
los dos valores medios significativamente diferentes, o son indistinguibles
dentro de los lmites de error experimental? Es un mtodo significativamente menos propenso a errores que el otro? Cul de los dos valores medios
est en realidad ms cerca del valor verdadero? De nuevo, el Captulo 3 analiza stas y otras cuestiones relacionadas con este problema.
Para concluir esta seccin conviene considerar que muchos anlisis se basan en mtodos grficos. En lugar de realizar medidas repetidas sobre la misma muestra, se realizan una serie de medidas sobre un pequeo grupo de
patrones que tienen concentraciones conocidas cubriendo un intervalo considerable. Por este camino se establece una curva de calibrado que puede utilizarse para estimar la concentracin de muestras de ensayo estudiadas usando
el mismo procedimiento. En la prctica, por supuesto, todas las medidas
(de patrones y muestras de ensayo) estarn sujetas a errores. Es necesario,
por ejemplo, calcular los errores involucrados en el trazado de la curva de
calibrado; estimar el error en la concentracin de una muestra determinada
utilizando la curva y estimar el lmite de deteccin del mtodo, es decir, la
cantidad de analito ms pequea que se pueda detectar con un grado de
confianza concreto. Estos procedimientos, que son especialmente frecuentes
en anlisis instrumental, se describen en el Captulo 5.
Estos ejemplos representan slo una parte de los problemas posibles que
surgen de la existencia de errores experimentales en el anlisis cuantitativo.
Sin embargo, como se ha visto, los problemas deben ser resueltos si los datos
cuantitativos tienen algn significado real. Es pues obvio que se deban estudiar los diferentes tipos de error con ms detalle.

1.3.

Tipos de error

Los cientficos experimentales hacen una distincin fundamental entre tres


tipos de error. stos son conocidos como errores groseros o accidentales,

[
~

O
O-

e(')
(')

5:

::l

aleatorios y sistemticos. Los errores groseros se reconocen rpidamente:


se pueden definir como errores que son tan importantes que no existe otra
alternativa real que abandonar el experimento y empezar de nuevo por completo. Ejemplos de los mismos podran incluir la avera total de un instrumento, la cada o vertido accidental de una muestra crucial, o descubrir durante el desarrollo de un experimento que un reactivo que se supona puro,
en realidad estaba contaminado. Tales errores (que ocurren ocasionalmente
incluso en los laboratorios mejor dotados!) normalmente se reconocen con
mucha facilidad. Por todo ello, a continuacin se va a diferenciar cuidadosamente entre los errores aleatorios y los sistemticos.
Esta diferenciacin se puede lograr mediante un cuidadoso estudio de
una situacin experimental real. Cuatro estudiantes (A-D) realizan cada uno
un mismo anlisis en el que exactamente 10.00 mI de hidrxido sdico exactamente 0.1 M es valorado con cido clorhdrico exactamente 0.1 M. Cada
estudiante repite la valoracin cinco veces y obtiene los resultados mostrados
en la Tabla 1.1.
Tabla 1.1.

Errores aleatorios y sistemticos.

Estudiante
A
B

e
D

Resultados (mI)

10.08
9.88
10.19
10.04

10.11
10.14
9.79
9.98

10.09
10.02
9.69
10.02

10.10
9.80
10.05
9.97

Comentario

10.12
10.21
9.78
10.04

Preciso, sesgado
Impreciso, insesgado
Impreciso, sesgado
Preciso, insesgado

Los resultados obtenidos por el estudiante A presentan dos caractersticas. Primera, todos ellos estn muy prximos uno de otro; todos los resultados caen entre 10.08 y 10.12 mI. En trminos cotidianos se dira que los
resultados son altamente reproducibles. La segunda caracterstica distintiva
de los resultados es que son todos demasiado grandes: en este experimento
(algo inusual) se conoce la respuesta correcta de antemano, 10.00 mI. Resulta evidente que hayan surgido dos tipos de error completamente diferentes
en el experimento de los estudiantes. Primero, existen errores aleatorios:
stos provocan que los resultados individuales difieran uno de otro de manera
que caigan a ambos lados del valor medio (10.10 mI en este caso). Los errores
aleatorios afectan a la precisin, o reproducibilidad, de un experimento.
En el caso del estudiante A queda claro que los errores aleatorios son pequeos, de manera que se dice que los resultados son precisos. Sin embargo,
tambin existen errores sistemticos: stos provocan que todos los resultados sean errneos en el mismo sentido (en este caso todos son demasiado
grandes). El error sistemtico total (ntese que en un experimento dado
pueden existir varias fuentes de error sistemtico, algunos positivos y otros
negativos, vase el Captulo 2) es denominado el sesgo de la medida. En muchos experimentos los errores aleatorios y los sistemticos no se detectan fcilmente con solo observar los resultados, sino que tambin tienen orgenes
muy distintos en cuanto a la tcnica experimental y al equipo utilizado.
Antes de examinar las causas de los errores en este experimento, sin embargo, se pueden analizar brevemente los resultados obtenidos por los estudian-

tes B-D. El estudiante B ha obtenido resultados que contrastan con los del
estudiante A. La media de los cinco resultados (10.01 mI) est muy prxima
al valor verdadero, de manera que no hay evidencia de sesgo. Sin embargo,
la variabilidad de los resultados es muy grande, lo que indica una precisin
insatisfactoria, es decir, errores aleatorios sustanciales. La comparacin de
estos resultados con los obtenidos por el estudiante A muestra claramente
que los errores aleatorios y sistemticos pueden ocurrir independientemente
unos de otros. Esta conclusin se refuerza por los datos de los estudiantes C
y D. El trabajo del estudiante C tiene una precisin pobre (intervalo 9.6910.19 mI) y el resultado promedio (9.90 mI) es sesgado. El estudiante D ha
logrado resultados precisos (intervalo 9.97-10.04 mI) e insesgados (promedio
10.01 mI). La distincin entre errores aleatorios y sistemticos se resume en
la Figura 1.1. utilizando una serie de diagramas de puntos. Este mtodo grfico simple de exposicin de datos, en el que los resultados individuales se
representan como puntos sobre una escala lineal, se utiliza frecuentemente
en el anlisis inicial de los datos (vanse los Captulos 3 y 6).
Resultado
correcto

I!

l.

_1.1
9.70

Figura 1.1.

--

el

te

el

10.00
10.30
Volumen de valorante, mi

Sesgo y precisin. Diagrama de puntos de los datos de la Tabla 1.1.

En muchos experimentos analticos la pregunta ms importante es hasta


qu punto se aproxima el resultado al verdadero valor de la concentracin o
cantidad que se pretende medir? Esto se expresa como la exactitud del experimento. La Organizacin Internacional de Estndares (ISO) define la
exactitud como el grado de concordancia entre el resultado de un ensayo y
el valor de referencia aceptado del analito. Bajo esta definicin, la exactitud
de un resultado individual puede estar afectada por los dos errores, aleatorios
y sistemticos. La exactitud de un resultado promedio tambin tiene contribuciones de ambas fuentes de error: incluso si los errores sistemticos estn
ausentes, el resultado promedio probablemente no ser exactamente igual al
valor de referencia, debido a la existencia de errores aleatorios (vanse los
Captulos 2 y 3). Los resultados obtenidos por el estudiante B ilustran estos
principios. Cuatro de las cinco medidas de este estudiante muestran inexac-

titud significativa, es decir, estn suficientemente distantes del verdadero valor de 10.00. Sin embargo, el promedio de los resultados de B (10.01) es muy
exacto, de manera que parece que la inexactitud de los resultados individuales se debe en gran medida a errores aleatorios y no a errores sistemticos.
En contraposicin, todos los resultados individuales del estudiante A, y el
promedio resultante, son inexactos: dada la buena precisin del trabajo de
este estudiante, parece cierto que estas inexactitudes se deban a errores sistemticos. Debe hacerse constar que, pese al planteamiento de muchos diccionarios, exactitud y precisin tienen significados completamente distintos
en el estudio de errores experimentales.
En resumen, la precisin describe errores aleatorios, el sesgo describe
errores sistemticos, y la exactitud, es decir, la proximidad al verdadero
valor de una medida individual o un valor promedio, incorpora ambos
tipos de error.
Aunque se utiliz anteriormente la palabra reproducibilidad como una
definicin aproximada de la precisin, el convenio moderrio establece una cuidadosa distincin entre reproducibilidad y repetibilidad. Se puede aclarar
esta distincin mediante una ampliacin del experimento anterior. Por el camino normal el estudiante A, por ejemplo, realizara las cinco medidas repetidas en una sucesin rpida; pero es muy probable que no tardara ms de
una hora aproximadamente en realizar el ejercicio completo. Utilizara la
misma serie de disoluciones y el mismo material de vidrio a lo largo del experimento, aadira la misma preparacin de indicador a cada matraz de valoracin, y permaneceran iguales la temperatura, humedad y dems condiciones de laboratorio. En tales circunstancias la precisin medida sera la
precisin dentro de rachas: esto se denomina repetibilidad. Sin embargo, supngase, que por alguna razn las valoraciones fueron realizadas por diferentes personas del laboratorio en cinco ocasiones distintas y en diferentes laboratorios, utilizando recipientes de vidrio y preparaciones de indicador
diferentes. En este caso, no sera sorprendente encontrar una gran variabilidad en los resultados. Este conjunto de datos reflejara la precisin entre rachas del mtodo, por ejemplo su reproducibilidad.
Se debe aprender otra leccin del experimento de valoracin. Es fcil
apreciar que los datos obtenidos por el estudiante e son inaceptables, y que
los del estudiante D son los ms aceptables. Sin embargo, en ocasiones puede
ocurrir que haya dos mtodos disponibles para un anlisis concreto, de los
cuales uno de ellos sea preciso pero sesgado, y el otro impreciso pero sin
sesgo. En otras palabras, puede suceder que se tenga que elegir entre los tipos
de resultados obtenidos por los estudiantes A y B respectivamente. Qu tipo
de resultado es preferible? Es imposible dar una respuesta dogmtica a esta
pregunta, ya que en la eleccin del mtodo analtico nos basaremos, en la
prctica, en el coste, facilidad de automatizacin, velocidad del anlisis, y
otros factores que caen fuera de nuestra evaluacin elemental. No obstante,
es importante darse cuenta que un mtodo que se encuentre sustancialmente
libre de errores sistemticos puede an, si es muy impreciso, dar un valor

medio que est (por azar) considerablemente alejado del valor correcto. Por
otra parte un mtodo que es preciso pero sesgado (por ejemplo, el estudiante
A) puede convertirse en otro que sea preciso e insesgado (por ejemplo, el
estudiante D) si se descubren y eliminan los errores sistemticos. Tambin
existirn casos en los que, debido a que las medidas que se obtienen son absolutamente nuevas, no sea factible controlar alguno de los errores
sistemticos. Los errores aleatorios nunca se pueden eliminar, aunque mediante una tcnica cuidadosa se pueden minimizar, y realizando medidas repetidas se puede medir y evaluar su significacin. Los errores sistemticos
pueden eliminarse en muchos casos mediante controles adecuados de nuestra tcnica experimental y de nuestro equipo. En la prxima seccin se contempla esta importante distincin entre los dos principales tipos de error.
Cuando se suministra una muestra a un laboratorio y se requiere determinar la concentracin de uno de sus constituyentes, se estimar sin duda,
o quiz se sabe por experiencia, la extensin con que se presentan los principales errores sistemticos y aleatorios. El cliente que suministra la muestra
puede querer esta informacin resumida en una afirmacin sencilla, aportando el intervalo dentro del cual es razonablemente verosmil que se encuentre la
verdadera concentracin. Este intervalo, el cual se debera dar con una probabilidad (por ejemplo, hay una probabilidad del 95 % que la concentracin
se encuentre entre oo. y ... ), se denomina la incertidumbre de la medida.
Este concepto, cuyos origenes se encuentran en la metrologa fsica, est actualmente ganando en importancia y popularidad en la qumica analtica, y
se analiza con mas detalle en el Captulo 4.

1.4.

Errores aleatorios y sistemticos


en el anlisis volumtrico

El ejemplo de los experimentos volumtricos de los estudiantes muestra con


claridad que los errores aleatorios y sistemticos pueden ocurrir independientemente unos de otros y surgir en diferentes etapas del experimento. Ya
que la volumetra es un procedimiento relativamente simple y todava ampliamente utilizado, es importante examinarlo con detalle en este contexto.
Se puede considerar que un anlisis volumtrico es completo cuando incluye
los siguientes pasos.
1.

2.

Preparacin de una solucin patrn de uno de los reactivos. Esto supone (a) pesar un pesasustancias o recipiente similar que contenga
cierta cantidad de material slido, (b) transferir el material slido a
un matraz aforado y pesar de nuevo el pesasustancias para obtener
por diferencia el peso del slido transferido (pesada por diferencia, y
(c) llenar el matraz con agua destilada hasta el enrase (suponiendo
que se contempla una valoracin en medio acuoso).
Transferir una alcuota del material estndar a un matraz de valoracin con ayuda de una pipeta. Esto supone (a) llenar la pipeta hasta
el enrase adecuado, y (b) vaciar el contenido de manera especfica en
el matraz de valoracin.

3.

Valoracin del lquido contenido en el matraz con una solucin del


otro reactivo aadido desde una bureta. Esto implica (a) llenar la bureta y permitir que el lquido contenido en ella se vace hasta que el
menisco alcance un nivel constante, (b) aadir unas pocas gotas de
solucin de indicador al matraz de valoracin, (c) leer el volumen
inicial de la bureta, (d) aadir poco a poco el lquido de la bureta al
matraz de valoracin hasta que se juzgue que se ha alcanzado el punto final, y (e) medir el nivel final del lquido contenido en la bureta.

Aunque un anlisis elemental de este tipo implica diez pasos diferentes,


generalmente los siete ltimos se repiten, como se ha visto, varias veces. En
principio, se podra examinar cada paso para evaluar los errores aleatorios y
sistemticos que pudieran ocurrir. En la prctica, es ms sencillo examinar
separadamente las etapas que utilizan pesadas [pasos 1(a) y (b)], Ylas etapas
restantes que conllevan el uso de equipo volumtrico.(No se pretende dar
descripciones detalladas de las tcnicas experimentales utilizadas en las diferentes etapas. De igual manera, no se exponen mtodos para calibrar pesas,
material de vidrio, etc.) Entre las contribuciones para detectar los errores,
son de importancia las tolerancias de las pesas utilizadas en los pasos gravimtricos, y del material de vidrio volumtrico. Algunas instituciones tales como la British Standards Institution (BS!) y la American Society for
Testing and Materials (ASTM) han publicado especificaciones estndar para
estas tolerancias. La tolerancia de una pesa de 100 g de alta calidad puede
ser tan pequea como 0.25 mg, aunque para una pesa empleada en tareas
rutinarias la tolerancia podra ser de hasta cuatro veces ms grande. De igual
manera, para un matraz aforado de grado A de 250 mI es 0.12 mI; el material volumtrico de grado B presenta generalmente tolerancias dos veces
ms grandes que el material de vidrio de grado A. Si una pesa o una pieza
de vidrio est dentro de los lmites de tolerancia, pero no posee exactamente
el peso o volumen correcto, surgir un error sistemtico. As pues, si el matraz aforado tiene en realidad un volumen de 249.95 mI, este error se reflejar en el resultado de todos los experimentos basados en el uso de dicho
matraz. La repeticin del experimento no revelar el error; en cada repeticin se supondr que el volumen es 250.00 mI cuando de hecho es menor
que ste. No obstante, si se comparan los resultados de un experimento en
el que se ha utilizado ste con los de otros experimentos (por ejemplo, en
otros laboratorios) realizados con otros matraces, entonces el hecho de que
todos los matraces tengan volmenes ligeramente diferentes contribuir a la
variacin aleatoria, por ejemplo, a la reproducibilidad de los resultados.
Los procedimientos de pesada se encuentran normalmente asociados con
errores aleatorios muy pequeos. Es muy comn que en tareas de laboratorio
rutinarias se utilicen balanzas de cuatro cifras, y el error aleatorio que se
comete no debera ser mayor que 0.0001-0.0002 g (en el prximo captulo
se describe con detalle los trminos estadsticos empleados para expresar
errores aleatorios). Debido a que la cantidad que se pesa es normalmente del
orden de 1 g o ms, resulta evidente que el error aleatorio, expresado en tanto
por ciento de la pesada efectuada, no es mayor del 0.02 %. Un buen material
estndar para el anlisis volumtrico debera tener (entre otras caractersticas) un peso molecular tan alto como sea posible, de manera que se minimi-

cen estos errores aleatorios de pesada cuando se prepare una solucin de una
molaridad dada. En algunos anlisis se utilizan microbalanzas para pesar
cantidades de unos pocos miligramos, sin embargo, los errores de pesada cometidos son slo unos pocos microgramos.
Los errores sistemticos en las pesadas pueden ser apreciables y proceder
de una serie de fuentes establecidas. Entre ellas se incluyen la adsorcin de
humedad en la superficie del recipiente de pesada; los errores provocados al
no permitir que los recipientes calentados se enfrien, antes de pesar, a la misma temperatura de la balanza (este error es especialmente frecuente en gravimetra cuando se pesan crisoles); pesas oxidadas o contaminadas por el
polvo; y el efecto boyante de la atmsfera, que acta de diferente forma sobre
objetos de diferente densidad. Con el fin de lograr un trabajo ms exacto, las
pesas se deben calibrar en relacin a estndares suministrados por cuerpos
estatutarios y autoridades de normativas (vanse los prrafos anteriores). Esta calibracin puede ser muy exacta, por ejemplo, de 0.01 mg para pesadas
en el intervalo de 1 a 10 g. El efecto atmosfrico puede ser importante. Por
ejemplo, una muestra de un lquido orgnico de densidad 0.92 g ml- 1 que
pesa 1.2100 g al aire, pesara 1.2114 g al vaco, implicando una diferencia
superior al 0.1 %. Aparte de usar procedimientos de calibracin, que se discutirn en la prxima seccin, pueden tomarse algunas precauciones experimentales sencillas para minimizar estos errores sistemticos. La pesada por
diferencia (vanse los prrafos anteriores) elimina los errores sistemticos
que proceden, por ejemplo, de la humedad u otros contaminantes en la superficie del recipiente. (Vase tambin la Seccin 2.12.) Si se toman estas
precauciones, los errores producidos en las etapas de la pesada sern mnimos, y es probable que en muchos experimentos volumtricos los errores de
pesada sean despreciables comparados con los que surjan por el uso del equipo volumtrico. De hecho, los mtodos gravimtricos se usan generalmente
para calibrar el material de vidrio volumtrico, pesando (en condiciones estndar) el agua que contenga dicho material.
Los errores aleatorios asociados a los procedimientos volumtricos provienen del uso de material de vidrio. Al llenar un matraz aforado de 250 mI
hasta el enrase, el error (es decir, la distancia entre el menisco y el enrase)
puede ser aproximadamente 0.03 cm en el cuello del matraz de dimetro
de ca. 1.5 cm. ste corresponde a un error en volumen de 0.05 mI, slo un
0.02 % del volumen total del matraz. De igual manera, al llenar una pipeta
de transferencia de 25 mI, el error aleatorio no debera exceder de 0.03 cm
en una caa de 0.5 cm de dimetro; esto proporciona un error en volumen
de aproximadamente 0.006 mI, 0.024 % del volumen total. El error en la lectura de una bureta (graduada en divisiones de 0.1 mI) es quiz de 0.01 a 0.02
mI. Cada valoracin implica dos lecturas (los errores no son simplemente aditivos; vase el Captulo 2); si el volumen de valoracin es aproximadamente
25 mI, el porcentaje de error vuelve a ser muy pequeo. Las condiciones experimentales deberan planificarse de manera que el volumen de valorante
utilizado no sea demasiado pequeo (no menos de 10 mI), ya que de otra
manera los errores seran considerables. (Esta precaucin es anloga a la utilizacin de un compuesto estndar de alto peso molecular para minimizar el
error de pesada.) Aun cuando un anlisis volumtrico suponga varios pasos,

10

y en cada uno de ellos se use una pieza de material de vidrio, resulta evidente
que los errores aleatorios deberan ser pequeos si los experimentos se realizan con cuidado. En la prctica, un buen anlisis volumtrico debera tener
una desviacin estndar relativa (vase el Captulo 2) de no ms del 0.1 %.
Hasta hace poco, tal precisin se alcanzaba en contadas ocasiones en mtodos de anlisis instrumental, y an no es habitual. Los mtodos clsicos pueden proporcionar resultados con desviaciones estndar relativas, tan bajos
como del 0.01 %, cuando se realizan por expertos y se toman todas las precauciones posibles.
Los procedimientos volumtricos incorporan varias fuentes importantes
de error sistemtico. Entre los principales se encuentran los errores de vaciado en el uso de material de vidrio volumtrico, los errores de calibracin
en el material de vidrio, y los errores de indicador. Quiz el error ms frecuente en el anlisis volumtrico rutinario sea no dejar pasar el tiempo suficiente para que una pipeta se vacie adecuadamente, o se estabilice el nivel
del menisco en la bureta. Adems, las pipetas son de dos tipos, las que se
vacan por evacuacin y las de soplado en las que el ltimo lquido remanente debe ser expulsado a la fuerza. Si se confunden los dos tipos, por ejemplo,
soplando en una pipeta de vaciado, se incurrira ciertamente en un craso
error! Los errores por vaciado tienen un efecto sistemtico y otro aleatorio:
el volumen liberado es invariablemente menor que el que debera ser. La
temperatura a la que se realiza un experimento tiene dos efectos. El equipo
volumtrico se calibra convencionalmente a 20 oC, pero la temperatura en un
laboratorio analtico puede diferir con facilidad de sta en varios grados, y
muchos experimentos, por ejemplo los anlisis bioqumicos, se llevan a cabo
en habitaciones fras a ca. de 4 oC. En segundo lugar, la temperatura afecta
tanto al volumen del material de vidrio como a la densidad de los lquidos.
El coeficiente de dilatacin para soluciones acuosas diluidas es aproximadamente del 0.025 % por grado, mientras que para recipientes de vidrio sdico
variar aproximadamente casi un 0.003 % por grado en volumen y para recipientes de vidrio borosilicatado la variacin ser del 0.001 % por grado. Resulta evidente que los cambios en los volmenes del material de vidrio sern
slo importantes en trabajos de muy alta calidad, e incluso slo si la temperatura es muy diferente de 20 oC. Adems, los efectos de la dilatacin de las
disoluciones se autocompensarn en gran parte si todas las soluciones se
mantienen a la misma temperatura. El efecto es mucho ms acusado en soluciones no acuosas.
Los errores de indicador pueden ser muy importantes: quiz ms grandes
que los errores aleatorios en un anlisis volumtrico tpico. Por ejemplo, en
la valoracin de cido clorhdrico 0.1 M con hidrxido sdico 0.1 M, se
espera que el punto final corresponda con un pH de 7. Sin embargo, en la
prctica, se estima utilizando un indicador como el naranja de metilo. En
experimentos diferentes se muestra que esta sustancia cambia de color sobre
un intervalo de pH ca. 3-4. Por lo tanto, si la valoracin se realiza aadiendo
la base al cido, el indicador conducir a un punto final aparente cuando el
pH sea ca. 3.5, es decir, justo antes del verdadero punto final. Es probable
que el error sistemtico que se ocasiona aqu sea del 0.2 %. Si la valoracin
se realiza a la inversa, es decir, aadiendo cido a la base, el punto final in-

dicado por el naranja de metilo estar en realidad un poco ms alejado del


punto final verdadero. En cualquier caso, se puede evaluar y corregir el error
realizando un experimento en blanco, es decir, determinando la cantidad de
base o cido necesaria para producir el cambio de color del indicador ante la
ausencia del cido (base).
En cualquier procedimiento analtico, clsico o instrumental, deber ser
posible considerar y estimar las fuentes de error sistemtico y aleatorio que
surjan en cada una de las etapas del experimento. Es muy recomendable que
el analista haga esto con un cuidadoso diseo experimental, ya que le permitir evitar fuentes de error mayores (vanse las Secciones 1.5 y 1.6). Sin embargo, merece la pena sealar que en los anlisis volumtricos los errores son
bastante inusuales en el sentido de que no implican ninguna etapa individual
que tenga un error mayor que los errores de otras etapas. En muchos otros
anlisis, el error global est controlado en la prctica por el error generado
en un nico paso. Este aspecto se analiza en el prximo captulo.

1.5.

El manejo de errores sistemticos

Gran parte del contenido de este libro tratar de la evaluacin de errores


aleatorios, los cuales pueden estudiarse mediante un amplio conjunto de mtodos estadsticos. En muchos casos se supondr, por conveniencia, que estn ausentes los errores sistemticos (aunque se describirn los mtodos que
prueban su existencia). Es necesario analizar en este momento los errores
sistemticos con ms detalle: cmo surgen y cmo pueden abordarse. En el
ejemplo del anlisis volumtrico expuesto en la Seccin 1.3 se muestra con
claridad que los errores sistemticos hacen que el valor medio de un conjunto de medidas repetidas se desve del verdadero valor. Se deduce que (a) en
contraposicin con los errores aleatorios, los sistemticos no se pueden apreciar con la mera repeticin de mediciones, y (b) a menos que se conozca de
antemano el resultado verdadero de un anlisis (situacin muy improbable!), podran existir errores sistemticos muy grandes, que pasen inadvertidos si no se toman las debidas precauciones. En otras palabras, es demasiado
fcil pasar por alto las principales fuentes de error sistemtico. Un pequeo
conjunto de ejemplos clarificarn tanto los posibles problemas como sus soluciones.
En los ltimos aos, se ha mostrado mucho inters en las concentraciones de metales de transicin en muestras biolgicas tales como el suero
sanguneo. Por ejemplo, se han realizado muchas determinaciones de los
niveles de cromo en suero con resultados sorprendentes. Diferentes qumicos, han obtenido concentraciones de cromo que varan desde < 1 a ca. de
200 ng ml- 1, al estudiar todos ellos muestras de suero procedentes de individuos sanos. En general, se han obtenido recientemente los resultados mas
bajos, ponindose de manifiesto que los resultados iniciales ms altos, al menos en parte, eran debidos a la contaminacin de las muestras por el cromo
procedente de las jeringas de acero inoxidable, tapones de tubos, etc. La determinacin de trazas de cromo, por ejemplo, por espectrometra de absorcin atmica es, en principio, relativamente directa, y no cabe duda que los

11

12

resultados alcanzados por cada grupo de qumicos son satisfactorios en trminos de precisin, si bien se pas por alto en varios casos el gran error
sistemtico introducido por la contaminacin. Los errores metodolgicos sistemticos de este tipo son extremadamente comunes: el lavado incompleto
de un precipitado en un anlisis gravimtrico, y el error producido por el
indicador en un anlisis volumtrico (vase la Seccin 1.4) son otros ejemplos bien conocidos.
Otra clase de error sistemtico que se presenta con frecuencia surge cuando se realizan supuestos falsos sobre la exactitud de un instrumento analtico.
Los analistas con amplia experiencia saben demasiado bien que los monocromadores en los espectrmetros se desajustan paulatinamente, de manera que
no son infrecuentes errores de varios nanmetros en las longitudes de onda
seleccionadas, a pesar de que se realicen muchos anlisis fotomtricos sin
efectuar los controles adecuados. Los instrumentos sencillos tales como el
material de vidrio volumtrico, cronmetros, pH-metros y termmetros, pueden presentar todos ellos errores sistemticos sustanciales, si bien una gran
mayora del personal de laboratorio utiliza con regularidad estos instrumentos como si no tuvieran nunca sesgo. Adems, la disponibilidad creciente de
instrumentos controlados por microprocesadores o microcomputadoras ha
reducido al mnimo el nmero de operaciones y el nivel de pericia requerido
a los operadores. En estas circunstancias es irresistible la tentacin de considerar que los resultados de los instrumentos son perfectos, aun cuando tales instrumentos estn sujetos a errores sistemticos (a menos que posean
suficiente inteligencia para poder autocalibrarse; vase la Seccin 1. 7).
Los errores sistemticos no solo surgen de procedimientos y de aparatos;
pueden tambin proceder del sesgo humano. Algunos qumicos padecen de
algn grado de astigmatismo o daltonismo (esto ltimo es mas frecuente entre los hombres que entre las mujeres), que podran provocar errores en las
lecturas de instrumentos y otras observaciones. Varios autores han registrado diferentes tipos de sesgos en el nmero, por ejemplo, una tendencia que
favorezca los nmeros pares sobre los impares, o incluso los dgitos O y 5
sobre otros dgitos, en la presentacin de resultados. Por tanto, queda claro
que las diversas clases de errores sistemticos son un riesgo constante, y a
menudo oculto, para el analista, de manera que para minimizarlos deben
considerarse las sucesivas etapas con sumo cuidado.
Existen diferentes aproximaciones a este problema, y en cada uno de los
procedimientos analticos se debe considerar cualquiera de ellas o todas ellas.
Las primeras precauciones deberan tomarse antes de empezar cualquier trabajo experimental. El analista debera considerar con cuidado cada etapa del
experimento que est a punto de realizar, el aparato que se utilice, el muestreo y el procedimiento analtico que se vaya a adoptar. En esta primera etapa, debera intentar identificar las fuentes probables de error sistemtico, tales como las funciones del instrumento que necesitan calibracin, las etapas
del procedimiento analtico donde los errores tienen mayor probabilidad de
ocurrir. Tambin debe considerar los ensayos que deban efectuarse para verificar los errores sistemticos. Las previsiones de este tipo pueden ser de
gran valor (en la prxima seccin se ver que debe prestarse igual atencin
a las fuentes de error aleatorio) y, normalmente, merece la pena el tiempo

invertido. Por ejemplo, una buena reflexin de este tipo podra haber revelado la posibilidad de que existiera contaminacin en el experimento de determinacin de cromo descrito anteriormente.
La segunda lnea de actuacin contra los errores sistemticos radica en el
diseo del experimento en cada etapa. Ya se ha visto (Seccin 1.4) que la
pesada por diferencia puede eliminar algunos errores sistemticos gravimtricos: puede suponerse que estos errores existen con la misma extensin en
ambas pesadas, de manera que el proceso de sustraccin los elimina. Otro
ejemplo de planificacin experimental previsora lo proporciona el error de
la longitud de onda del espectrmetro descrito anteriormente. Existen dos
procedimientos para determinar la concentracin de una muestra por espectrometra de absorcin. En el primero, la muestra se estudia en una clula
del espectrmetro de 1 cm de camino ptico a una longitud de onda de
400 nm, y la concentracin del componente ensayado se determina a partir
de la ecuacin conocida A = [;he [donde A, f., e y h son, respectivamente, la
absorbancia medida, el valor de referencia aceptado de la absortividad molar
(unidades 1 mol- l cm- l ) del componente ensayado, la concentracin molar de
este analito, y el paso ptico de la clula del espectrmetro (cm)]. Aqu pueden surgir varios errores sistemticos: la longitud de onda podra ser, como
ya se ha comentado, por ejemplo, de 40S nm en vez de 400 nm, con lo cual
el valor de referencia de [; es inadecuado; este valor de [; podra ser incorrecto
en cualquier caso; la escala de absorbancia del espectrmetro podra exhibir
un error sistemtico y el paso ptico de la clula podra no ser exactamente
1 cm. Alternativamente, el analista podra emplear una serie de disoluciones
de la sustancia ensayada de concentracin conocida, y medir la absorbancia
de cada una a 400 nm. (Una de estas soluciones de calibrado sera un blanco,
es decir, contendra todos los reactivos analticos excepto el de la sustancia
que se ensaya.) Entonces, se podran utilizar los resultados para construir un
grfico de calibrado para utilizarlo en el anlisis de la muestra ensayada en
las mismas condiciones experimentales. Esta importante aproximacin al
anlisis instrumental se describe con detalle en el Captulo S. Cuando se utiliza este segundo mtodo, no se requiere el valor de /;, y se anulan los errores
debidos a los desplazamientos de las longitudes de onda, errores de absorbancia e inexactitud del camino ptico, ya que ocurren igualmente en la calibracin y en los experimentos de ensayo. Todas las fuentes principales de error
sistemtico son, slo en principio, eliminadas con tal de que las condiciones
para la muestra y la calibracin sean de hecho equivalentes (por ejemplo, se
supone que la longitud de onda y las escalas de absorbancia no se alteran
durante el experimento).
La ltima y ms efectiva proteccin contra los errores sistemticos quiz
sea el uso de materiales de referencia y mtodos estndar. Antes de comenzar el experimento, se calibra cada componente del aparato mediante un procedimiento adecuado. Ya se ha visto como puede calibrarse el equipo volumtrico mediante el uso de mtodos gravimtricos. De forma anloga, se
puede calibrar la escala de las longitudes de onda del espectrmetro con la
ayuda de fuentes de luz estndar, las cuales tienen lneas de emisin estrechas a longitudes de onda bien establecidas, y las escalas de absorbancia de
los espectrmetros se pueden calibrar con filtros estndar slidos o lquidos.
De manera anloga, muchos componentes de equipos se pueden calibrar de

13

14

manera que sus errores sistemticos se conozcan de antemano. La importancia de este rea de la qumica (y otras ciencias experimentales) se refleja en
el amplio trabajo de organismos como el National Physical Laboratory and
LGC (Laboratory of the Government Chemist), en el Reino Unido, el National Institute for Science and Technology (NIST), en EEUU, y organizaciones similares en otras partes del mundo. Se han escrito volmenes completos
sobre la estandarizacin de tipos concretos de equipos, y una serie de organizaciones comerciales se especializan en la venta de materiales de referencia
estndar.
Si los errores sistemticos se producen en el transcurso de procesos qumicos o como resultado del uso de reactivos impuros, en lugar de producirse
en el equipo, puede usarse una forma de comparacin alternativa, es decir,
la determinacin debe repetirse mediante un procedimiento completamente
independiente. Si se utilizan dos (o ms) mtodos fsicos o qumicos no relacionados al efectuar un anlisis, y si conducen consistentemente a resultados que muestran slo diferencias aleatorias, entonces es razonable suponer
que no estn presentes errores sistemticos significativos. Para que esta aproximacin sea vlida, cada etapa de los dos experimentos tiene que ser independiente. Como en el caso de la determinacin de cromo en suero, no ser
suficiente sustituir la etapa de la espectrometra de absorcin atmica por un
mtodo calorimtrico o por espectrometra de plasma. Los errores sistemticos slo se revelaran alterando adems los mtodos de muestreo, por ejemplo, minimizando o eliminando el uso de jeringas de acero inoxidable. Otro
aspecto importante es que las comparaciones deben hacerse teniendo en
cuenta el intervalo total de concentraciones para el que se usa un procedimiento analtico. Por ejemplo, el mtodo de unin del colorante verde de
bromocresol a proteinas utilizado frecuentemente para la determinacin de
albmina en suero, se correlaciona bien con mtodos alternativos (por ejemplo, inmunolgicos) a niveles normales o altos de albmina, pero cuando los
niveles de albmina son anormalmente bajos (estos son inevitablemente los
casos de mayor inters clnico!) la concordancia entre los dos mtodos es
escasa, y el mtodo del colorante, proporciona en forma consistente (y errnea) concentraciones de albmina ms altas. Las aproximaciones estadsticas
utilizadas en las comparaciones de mtodos se describen con detalle en los
Captulos 3 y 5.
El predominio de los errores sistemticos en el trabajo analtico cotidiano
se puede aclarar por los resultados de los ensayos de colaboracin. Si un
analista experimentado y capaz encuentra 10 ng ml- 1 de un frmaco en una
muestra de orina, es natural pensar que otros analistas obtendran resultados
similares para la misma muestra, y las diferencias slo se deberan a errores
aleatorios. Desafortunadamente, en la prctica esto se encuentra lejos de la
verdad. En muchos ensayos de colaboracin en los que intervienen diferentes laboratorios, cuando se examinan partes alcuotas de una muestra mediante los mismos procedimientos experimentales y los mismos tipos de instrumentos, muestran variaciones en los resultados mucho mayores que las
esperadas de los errores aleatorios. La conclusin ineludible es que en muchos laboratorios no se detectan o corrigen una serie de errores sistemticos,
tanto positivos como negativos. La importancia obvia de esta situacin, con

serias implicaciones para todos los cientficos analticos, ha alentado muchos


estudios sobre la metodologa de los ensayos de colaboracin y esquemas de
suficiencia, y de la evaluacin estadstica de sus resultados. Estos esquemas
han conducido recientemente a importantes mejoras en la calidad de los resultados analticos en muchos campos. Estos temas se analizan con mayor
detalle en el Captulo 4.

1.6.

Planificacin y diseo de experimentos

Muchos qumicos consideran los contrastes estadsticos como mtodos que


slo se utilizan para evaluar los resultados de un experimento concluido.
Aunque sta es de hecho un rea de aplicacin esencial de la estadstica, es
tambin necesario ser consciente de la importancia de los conceptos estadsticos en la planificacin y diseo de experimentos. En la seccin anterior se
recalcaba el valor de intentar predecir errores sistemticos, lo cual permite
al analista hacer planes para despus valorarlos. Las mismas consideraciones
se aplican a los errores aleatorios. Como se ver en el Captulo 2, la combinacin de errores aleatorios de partes individuales de un experimento para
dar un error global requiere el us'o de frmulas estadsticas sencillas. En la
prctica, el error global est dominado a menudo por el error en una etapa
del experimento, en tanto que otros errores muestran efectos despreciables
cuando todos los errores se combinan correctamente. De nuevo, es obvio que
se espere identificar, antes de que empiece el experimento, en donde puede surgir el error dominante, y entonces intentar minimizarlo. Aunque los errores
aleatorios nunca pueden eliminarse, en realidad pueden minimizarse prestando atencin preferente a las tcnicas experimentales: un ejemplo sencillo
sera la mejora de la precisin de un experimento espectromtrico usando
una clula de muestra a temperatura constante. Por tanto, para los errores
aleatorios y sistemticos, la moraleja es clara: antes de comenzar el experimento, hay que esforzarse en identificar las fuentes graves de error, de manera que el experimento pueda ser diseado para minimizar tales errores.
Existen otros otros aspectos y an ms sutiles del diseo experimental.
En muchos anlisis, se encuentra que una o ms caractersticas deseables del
mtodo (por ejemplo sensibilidad, selectividad, velocidad de muestreo, bajo
coste, etc.) dependern de una serie de factores experimentales. Al disear
el experimento, hay que pretender que la combinacin ptima de estos factores se use de forma adecuada, y obtener la mejor sensibilidad, selectividad,
etc. Aunque puedan estar implicados algunos experimentos preliminares o
conocimientos previos, la optimizacin deber realizarse (con el objeto de
conservar recursos y tiempo) antes de que el mtodo se utilice de forma rutinaria o se haga un uso generalizado del mismo.
La complejidad de los procedimientos de optimizacin puede aclararse
con la ayuda de un ejemplo. En el anlisis enzimtico, la concentracin de
analito se determina a partir de observaciones de la velocidad de una reaccin catalizada por enzimas. El analito es a menudo el sustrato, es decir, el
compuesto que cambia en la reaccin catalizada por el enzima. Supngase
que se busca la mxima velocidad de reaccin en un experimento concreto
y que la velocidad en la prctica depende (entre otros factores) del pH de la

15

16

mezcla de reaccin, la temperatura y concentracin de enzima. Cmo se


pueden encontrar las condiciones ptimas? Es fcil identificar una aproximacin posible. El analista podra realizar una serie de experimentos, en cada
uno de los cuales la concentracin de enzima y la temperatura permanezcan
constantes, pero se vare el pH. En cada caso podra determinarse la velocidad de la reaccin catalizada por el enzima y podra obtenerse el valor del
pH ptimo (que se supone es de 7.5). Podran realizarse una segunda serie
de experimentos sobre la velocidad de reaccin, manteniendo constante el
pH a 7.5, y fijando la concentracin de enzima nuevamente, pero se variara
la temperatura. As se obtendra una temperatura ptima, que se supone es
de 40 oC. Finalmente, una serie de experimentos a pH 7.5 Y 40 oC, pero con
diferentes concentraciones de enzima, indicaran el nivel ptimo de enzima.
Esta aproximacin a la optimizacin del experimento es claramente tediosa:
en ejemplos de investigacin ms reales pueden necesitarse ms de tres factores experimentales. A ello se aade adems otra objecin fundamental que
consiste en que el mtodo supone que los factores (pH, temperatura, concentracin de enzima) afectan a la velocidad de reaccin de forma independiente.
Esto podra no ser cierto. Por ejemplo, se ha encontrado que, a pH 7.5, la
temperatura ptima es de 40 oC. Sin embargo, a un pH diferente la temperatura ptima podra no ser 40 oC. En otras palabras, estos factores pueden
afectar a la velocidad de reaccin de una forma interactiva, y las condiciones
establecidas en las series de experimentos que se acaban de describir podran
no ser en realidad las ptimas. Una vez comenzada la primera serie de experimentos en diferentes condiciones, se podra entonces obtener una serie diferente de valores ptimos. Con este ejemplo sencillo queda claro que la
optimizacin experimental puede ser un problema extremadamente complejo. Este importante aspecto de la estadstica, tal y como se aplica a la qumica
analtica, se considerar con ms detalle en el Captulo 7.

1.7.

Calculadoras y computadoras en los clculos


estadsticos

Ningn qumico puede ignorar los sorprendentes avances que recientemente


han surgido en el mbito de la microelectrnica. Estos avances han hecho
posible la construccin de aparatos que simplifican enormemente los clculos estadsticos. El rpido crecimiento de la quimiometra (la aplicacin de
mtodos matemticos a la solucin de problemas qumicos de todos los tipos)
se debe a la facilidad con que pueden manejarse grandes cantidades de datos,
y realizar clculos complejos, con calculadoras y computadoras.
Estos aparatos estn a disposicin del qumico analtico a varios niveles
de complejidad y coste. Las calculadoras de mano son muy baratas, fiables y
capaces de realizar muchos clculos estadsticos rutinarios descritos en este
libro pulsando un nmero mnimo de teclas. Las funciones preprogramadas
permiten clculos de la media y desviacin estndar (vase el Captulo 2) y
de regresin lineal y correlacin (vase el Captulo S). Otras calculadoras
pueden ser programadas por el usuario para realizar otros clculos tales como lmites de confianza (vase el Captulo 2), contrastes de significacin
(vase el Captulo 3) y regresin no lineal (vase el Captulo S). Las calcula-

doras de este tipo pueden resultar ms que adecuadas para muchas aplicaciones en laboratorios que realizan investigacin analtica o anlisis de rutina. La nica desventaja radica en la imposibilidad de manejar grandes cantidades de datos.
Las computadoras personales (PCs) se encuentran en la actualidad en todos los laboratorios qumicos. Muchos instrumentos modernos son controlados por PCs, los cuales tambin manejan y dan cuenta de los datos analticos
obtenidos, y muchos cientficos analticos tienen sus propios PCs en sus mesas de trabajo. Los PCs porttiles facilitan la recogida y clculos de datos en
el campo, y son rpidamente transferidos a otros homlogos cuando se regresa al laboratorio. En la actualidad, muchos instrumentos estn desprovistos de controles manuales, debido a que estn totalmente controlados por
PCs acoplados adecuadamente. Otras funciones de los PCs pueden incluir la
comprobacin del rendimiento del instrumento, el diagnstico e informacin
del mal funcionamiento, el almacenamiento de grandes bases de datos (por
ejemplo, de espectros digitalizados) y comparar los datos analticos con bases
de datos, optimizacin de las condiciones de operacin (vase el Captulo 7),
y seleccionar y utilizar una variedad de clculos de calibrado. Una preocupacin es que no siempre se explica al usuario el software del que est provisto el instrumento controlado por la computadora: un analista podra sufrir el infortunio de tener que interpretar una serie de datos, por ejemplo, a
travs de una rutina de calibracin que no estuviese definida y pudiera no
ser siempre apropiada. sta es una situacin indeseable, aunque el deseo de
las compaas de instrumentacin de intentar proteger software especficos
costosos de la pirateria es comprensible.
Se pueden conseguir para PCs abundantes y excelentes programas bsicos de estadstica. En la actualidad, la capacidad de memoria y velocidad de
las computadoras son ms que adecuadas para trabajar con grandes series de
datos, y los PCs estn dotados ordinariamente de procesadores de textos, los
cuales ayudan enormemente a la compilacin de informes analticos y trabajos de investigacin. Tambin son fciles de conseguir los programas de hojas de clculo. stos, aunque fueron inicialmente diseados para clculos
financieros, son ms que adecuados para el trabajo estadstico, poseyendo
muchas funciones estadsticas incorporadas y excelentes posibilidades de
presentacin grfica. La popularidad de las hojas de clculo deriva de su velocidad y simplicidad de uso, y la posibilidad de realizar clculos casi instantneos del tipo que ocurrira si... : por ejemplo, cual sera la media y la
desviacin estndar de una serie de resultados si se sospecha que se han omitido una parte de los datos? Las hojas de clculo se disean para que sea fcil
la introduccin rpida de datos, y los datos en formato de hoja de clculo
pueden exportarse fcilmente a programas estadsticos ms especializados.
Microsoft Excel es la hoja de clculo mas popular y ofrece muchas de las
posibilidades estadsticas que necesitarn muchos lectores de este libro. En
los prximos captulos se proporcionan ejemplos de su aplicacin, y la bibliografa proporciona algunos libros que describen e ilustran su aplicacin a
problemas estadsticos.
Posibilidades de clculo mas avanzadas son proporcionadas por programas estadsticos especializados. Entre ellos, Minitab es muy utilizado en

17

18

centros de educacin y laboratorios de investigacin. Adems de las funciones estadsticas convencionales, ofrece clculos mas avanzados, incluyendo
mtodos multivariantes (vase el Captulo 8), anlisis exploratorio de datos
(AED) y contrastes no paramtricos (vase el Captulo 6), diseo experimental (vase el Captulo 7) y muchos mtodos de control de calidad (vase el
Captulo 4). Tambin se pueden conseguir para PCs excelentes programas
ms especializados para diferentes tipos de anlisis multivariante: el ms conocido es Unscrambler. Versiones nuevas y actualizadas de estos programas,
con posibilidades extra y/o interfaces mejoradas para usuarios, aparecen a
intervalos de tiempo regulares. Aunque se puede acceder a funciones de ayuda en cada caso, es preciso decir que el programa se disea normalmente
para usuarios en vez de estudiantes, por lo que no hace mucho hincapi en
el nfasis tutorial. Sin embargo, el programa VAMSTAT es una herramienta
valiosa; diseado especficamente con propsitos tutoriales, con pruebas en
pantalla para estudiantes y claras explicaciones de muchos mtodos importantes.
Otra de las caractersticas de los PCs que supone una ventaja es la posibilidad de formacin de redes, es decir, un grupo de PCs del mismo laboratorio o de laboratorios prximos pueden conectarse de manera que tanto los
programas como los datos puedan pasar libremente de uno a otro. Un beneficio obvio de dichas redes consiste en el establecimiento de Sistemas de Organizacin de la Informacin del Laboratorio, Laboratory Information Management Systems (LIMS), que permite que sean identificadas y rastreadas
grandes cantidades de especmenes analticos cuando se trasladan por el laboratorio. Mediante cdigos de barras o sistemas similares se identifican las
muestras y se les puede seguir la pista. Los PCs conectados a varios instrumentos envan grupos de resultados analticos a una computadora central
que (por ejemplo) imprime un informe resumen, incluyendo una evaluacin
estadstica.
Es muy importante para el qumico analtico recordar que la disponibilidad de todos estos equipamientos en el manejo de datos aumenta, en vez de
disminuir, la necesidad de un slido conocimiento de los principios en los
que se basan los clculos estadsticos. Una computadora o calculadora realizar con rapidez cualquier clculo o contraste estadstico seleccionado por el
usuario, tanto si ese procedimiento es adecuado o no para los datos en estudio.
Por ejemplo, un programa de mnimos cuadrados lineales determinar una
lnea recta que ajuste cualquier conjunto de valores de x e y, aun en los casos
en que la inspeccin visual muestre de inmediato que dicho programa resulta
completamente inadecuado (vase el Captulo S). En otro ejemplo, un programa sencillo para probar si es significativa la diferencia entre las medias
de dos conjuntos de datos puede suponer que las varianzas (vase el Captulo
2) de los dos conjuntos sean similares; no obstante, el programa realizar a
ciegas el clculo requerido y proporcionar un resultado aun cuando las
varianzas en realidad difieran significativamente. Incluso, series muy completas de programas de computadora suelen ser incapaces de aconsejar en la
eleccin de un mtodo estadstico apropiado para una serie de datos concretos. Por tanto, el analista debe emplear sus conocimientos de estadstica y el
sentido comn para asegurar que se realiza el clculo correcto.

19

Bibliografa
[NB - Los siguientes libros son probablemente valiosos como material soporte para la mayora de los capitulos de este libro.]
Anderson, R. 1. 1987. Practical Statisticsfor Anal,ljtical ChemistrJj. Van Nostrand Reinhold, New York.
British Standards lnstitute. 1987. Schedule for Tables for Use in the Calibratiun ofVolumetric Glassware): [BS1797]. BSl, London. (Valioso ejemplo
de una monografa BSI.)
Diamond, D. and Hanratty, V. C. 1997. Spreadsheet Applications in ChemistrlJ Using Microsoft Excel. Wiley, New York. (Consejos claros del uso de
Excel, con muchos ejemplos de qumica analtica y fsica.)
Meier, P. C. and Zund, R. E. 1993. Statistical Methods in AnallJtical ChemistrlJ. Wiley, New York. (Un texto avanzado, con programas y conjuntos
de datos proporcionados en un disco.)
Middelton, M. R. 1997. Data AnallJsis Using Microsoft Excel, Duxbury, Belmonto (Una gua clara de numerosos procedimientos estadsticos disponibles en Exce1.)
Minitab Reference Manual, Versin 11. June 1996. Minitab lnc, State College,
USA.

Neave, H. R. 1981. ElementarlJ Statistics Tables. Routledge, London. (Todos


los usuarios de la estadstica requieren un buen conjunto de tablas estadsticas: ste es francamente recomendable, a la vista de las claras explicaciones de las tablas y de los contrastes estadsticos asociados.)
Youden, W. J. and Steiner, E. H. 1975. Statistical Manual of the Association
of Official AnallJtical Chemists. AOAC. Arlington. (Manual clsico sobre
exactitud y precisin, y sobre estudios de colaboracin.)

Ejercicios
1.

Una muestra patrn de suero sanguneo humano contiene 42.0 g de albmina por litro. Cinco laboratorios (A-E) realizan cada uno seis determinaciones (en el mismo da) de la concentracin de albmina, con los
siguientes resultados (en gl-l):
A
B

e
o
E

42.5
39.8
43.5
35.0
42.2

41.6
43.6
42.8
43.0
41.6

42.1
42.1
43.8
37.1
42.0

41.9
40.1
43.1
40.5
41.8

41.1
43.9
42.7
36.8
42.6

42.2
41.9
43.3
42.2
39.0

Comentar el sesgo, precisin y exactitud de cada uno de estos conjuntos


de resultados.
2.

Utilizando la misma muestra y el mtodo del ejercicio 1, el laboratorio


A realiza otras seis determinaciones posteriores de la concentracin de

20

albmina, esta vez en seis das sucesivos. Los valores obtenidos son 41.5,
40.8, 43.3, 41.9, Y 41. 7 gl- 1. Comentar estos resultados.
3.

Se ha determinado cuatro veces el nmero de lugares de unin por molcula en una muestra de anticuerpos monoclonados, con resultados de
1.95, 1.95, 1.92 Y 1.97. Comentar el sesgo, precisin y exactidud de estos
resultados.

4.

Analizar el grado de sesgo y precisin deseables o aceptables en los siguientes anlisis:


(i)
(ii)
(iii)
(iv)

5.

Determinacin de la concentracin de lactato en muestras de sangre humana.


Determinacin de uranio en una muestra de mineral.
Determinacin de una droga en plasma sanguneo despus de una
sobredosis.
Estudio de la estabilidad de un reactivo calorimtrico mediante la
determinacin de su absorbancia a una longitud de onda durante
un perodo de varias semanas.

Para cada uno de los siguientes experimentos, intente identificar las


principales fuentes probables de errores sistemticos y aleatorios, y exponga de qu manera pueden minimizarse dichos errores:
(i)

(ii)

(iii)

El contenido de hierro de un gran trozo de mineral se determina


tomando una pequea muestra, disolvindola en cido, y valorando con sulfato crico despus de reducir el Fe(III) a FeO!).
Se utiliza el mismo procedimiento de muestreo y disolucin de (i),
si bien el hierro se determina colorimtricamente despus de aadir un reactivo quelatante y de extraer el complejo coloreado resultante en un disolvente orgnico.
El contenido de sulfato en una solucin acuosa se determina gravimtricamente con cloruro brico como precipitante.

Estadstica de medidas
repetidas

2.1.

Media y desviacin estndar

En el Captulo 1 se vio que para revelar la presencia de errores aleatorios en


muchos experimentos qumicos resulta necesario habitualmente realizar medidas repetidas. Este captulo aplica a tal situacin algunos conceptos estadsticos fundamentales. Se empieza considerando de nuevo el ejemplo del
Captulo 1, el cual tena en cuenta los resultados de repetir cinco veces una
valoracin hecha por cuatro estudiantes. Estos resultados se reproducen a
continuacin.
Estudiante

A
B

e
o

Resultados (mI)

10.08
9.88
10.19
10.04

10.11
10.14
9.79
9.98

10.09
10.02
9.69
10.02

10.10
9.80
10.05
9.97

10.12
10.21
9.78
10.04

Para comparar estos resultados se utilizaron dos criterios, el valor promedio


(tcnicamente conocido como una medida de una localizacin) y el grado de
variabilidad (o dispersin). El valor promedio utilizado fue la media aritmtica (en forma abreviada, la media), que es la suma de todas las medidas
dividida por el nmero de medidas:

La media, .~, de n medidas viene dada por.~

LX

= -'

(2.1)

En el Captulo 1 la variabilidad fue medida por la diferencia entre el valor


ms alto yel ms bajo (el intervalo). Una medida ms til, que utiliza todos
los valores, es la desviacin estndar, 5, que se define como sigue:

22

La desviacin estndar, s, de n medidas viene dada por


(2.2)

El ec1lculo de estos estadsticos se aclara mediante un ejemplo.

EJEMPLO 2.1.1
Encontrar la media y la desviacin estndar de los resultados del estudiante A.

Totales

Xi

(Xi - x)

10.08
10.11
10.09
10.10
10.12
50.50

- 0.02
0.01
- 0.01
0.00
0.02
O

IXi
n

x=-=
s=
\

Ntese que

JI

(X; - ,\)2
0.0004
0.0001
0.0001
0.0000
0.0004
0.0010

50.50
5

= - - = 10.1 mi

(X- ,\)2/(n- 1) = JO.001/4 = 0.0158 mi

(Xl - ,\) es siempre igual a O.

Las respuestas a este ejemplo se han proporcionado arbitrariamente con


tres cifras significativas: en la Seccin 2.8 se discute este importante aspecto
de la presentacin de resultados. El lector puede comprobar que la desviacin estndar de los resultados de los estudiantes B, C y D son 0.172, 0.210
Y 0.0332 mI, respectivamente, y establecer as una confirmacin cuantitativa
de las evaluaciones de la precisin realizadas en el Captulo l.
En la prctica, es inusual hacer estos clculos sobre el papel. Todas las
calculadoras de bolsillo, excepto las ms bsicas, proporcionan los resultados
de estos clculos si se introducen en ellas los valores de x" Sin embargo, se
debe tener cuidado en pulsar la tecla correcta para obtener la desviacin estndar. Algunas calculadoras proporcionan dos valores diferentes para la
desviacin estndar, uno calculado utilizando la ecuacin (2.2) y el otro sustituyendo n - 1 por n en el denominador de esta ecuacin. (La razn de
estas dos formas diferentes se explicar ms adelante en la pg. 24.) Obviamente, para valores grandes de n la diferencia es despreciable. Alternativamente, para realizar estos clculos rpidamente pueden utilizarse programas
disponibles para ordenador (vase el Captulo 1).
El cuadrado de s es una cantidad estadstica muy importante conocida
como la varianza, su importancia se pondr de manifiesto en este captulo
cuando se analice la propagacin de errores.

Varianza

23

el cuadrado de la desviacibn estndar, l-_

El coeficiente de variacin (CV) es otra medida de la variabilidad extensamente utilizada, tambin conocido como la desviacin estndar relativa (DER), que viene definido por lOas/x.
Coeficiente de variacin (CV) = desviacin estndar relativa (DR) = 100 s/x
El CV o DER, cuyas unidades se expresan obviamente en tanto por ciento,
es un ejemplo de error relativo, es decir, una estimacin del error dividida
por una estimacin del valor absoluto de la cantidad medida. Los errores relativos se utilizan con frecuencia al comparar las precisiones de los resultados
que tienen diferentes unidades o magnitudes, y resultan de nuevo importantes en los clculos de la propagacin de errores.

2.2.

La distribucin de medidas repetidas

Aunque la desviacin estndar proporciona una medida de la dispersin de


un conjunto de resultados alrededor del valor medio, no indica la forma de
la distribucin. Para aclarar esto se necesita un gran nmero de medidas como las expuestas en la Tabla 2.1. Esta tabla presenta los resultados de 50
determinaciones de la concentracin de ion nitrato, con dos cifras significativas, en una muestra concreta de agua.
Tabla 2.1.
0.51
0.51
0.49
0.51
0.51

Resultados de 50 determinaciones de concentracin de ion nitrato,


en 119 ml- 1.
0.51
0.52
0.48
0.51
0.50

0.51
0.53
0.46
0.51
0.50

0.50
0.48
0.49
0.48
0.53

0.51
0.49
0.49
0.50
0.52

0.49
0.50
0.48
0.47
0.52

0.52
0.52
0.49
0.50
0.50

0.53
0.49
0.49
0.51
0.50

0.50
0.49
0.51
0.49
0.51

0.47
0.50
0.47
0.48
0.51

Estos resultados se resumen en una tabla de frecuencias (Tabla 2.2).


Esta tabla indica que, el valor 0.46 Ilg ml- l de la Tabla 2.1 aparece una vez,
el valor 0.47 Ilg ml- l aparece tres veces y as sucesivamente. El lector puede
comprobar que la media de estos resultados es 0.500 llg ml- l y la desviacin
estndar es 0.0165 llg mI-l. La distribucin de los resultados puede apreciarse ms fcilmente dibujando un histograma como el de la Figura 2.1. En l
se muestra que las medidas estn distribuidas de forma casi simtrica en torno a la media, con las medidas agrupadas hacia el centro.
Este conjunto de 50 medidas de la concentracin de nitrato constituye
una muestra de un gran nmero de ellas (en teora infinitas) que se podran
haber tomado. Este conjunto de todas las posibles medidas se denomina
poblacin. Si no existen errores sistemticos, entonces la media de la pobla-

Tabla 2.2. Tabla de frecuencias para medidas de


concentracin de ion nitrato.

24

Concentracin de ion mtrato (tg mI ')

Frecuencia

O.~

1
3
5
10
10
13
5
3

0.47
0.48
0.49
0.50
0.51
0.52
0.53

ro

10

QJ

:::3

QJ

u::

0,46
0,48
0,50
0,52
Concentracin de ion nitrato, IIQ ml- 1

Figura 2.1.

Histograma de los datos de concentracin de ion nitrato de la Tabla 2.2.

cin, denotada por fl, es el verdadero valor de la concentracin de ion nitrato


que se intenta determinar. La media de la muestra nos proporciona una estimacin de p. De manera similar, la poblacin tiene una desviacin estndar, denotada por (J. El valor de la desviacin estndar s, de la muestra nos
proporciona una estimacin de (J. El uso de la ecuacin (2.2) nos proporciona una estimacin insesgada de (J. Si en. vez de (n - 1) utilizamos 17 en el
denominador de la ecuacin, el valor que se obtiene de s tiende a infraestimar (J (vase la pg. 22).
Las medidas de concentracin de ion nitrato que aparecen en la Tabla 2.2 presentan slo valores discretos, debido a las limitaciones del mtodo
de medida. En teora una concentracin podra tomar cualquier valor, de manera que para describir la forma de la poblacin, de la que se ha extrado una
muestra, se necesita una curva continua. El modelo matemtico que habitualmente se emplea es la distribucin normal o Gausiana descrita por la
ecuacin
lJ

=
(J

lk exp [- (x - pfj2c?}
V 2n

(2.3)

Su forma se muestra en la Figura 2.2. No es necesario recordar esta frmula


complicada, aunque algunas de sus propiedades generales son importantes.

25

Figura 2.2.

La distribucin normal, y = exp [ - (x - Jlf/22]/~. La media se indica por JI.

La curva es simtrica respecto a fl y cuanto mayor sea el valor de (J mayor


es la variabilidad de la curva, como se muestra en la Figura 2.3. Un anlisis
un poco ms detallado demuestra que, cualesquiera que sean los valores de
fl y (J, la distribucin normal tiene las siguientes propiedades.
En una distribucin normal con media fl y desviacin estndar (J, aproximadamente el 68 % de los valores de la poblacin caen dentro de
1(J de la media, aproximadamente el 95 % de los valores caen dentro
de 2(J de la media, y aproximadamente el 99.7% de los valores caen
dentro de 3(J de la media.

Estas propiedades se ilustran en la Figura 2.4. Esto significara que, si las


concentraciones de ion nitrato (en Jlg ml- 1) dadas en la Tabla 2.2 se distribuyen normalmente, cerca del 68 % caera en el intervalo 0.483-0.517, alrededor del 95 % en el intervalo 0.467-0.533 y el 99.7% en el de 0.450-0.550.
De hecho, 33 de los 50 resultados (66 %) caen entre 0.483 y 0.517,49 (98 %)
entre 0.467 y 0.533, y todos los resultados se ubican entre 0.450 y 0.550, de
manera que la concordancia con la teora es bastante satisfactoria.
y

Figura 2.3. Distribuciones normales con la misma media pero con diferentes valores de la
desviacin estndar (d.e.).

26

y
(i)

i1 - 10 i1 i1 + 10
y

(ii)

x
y

Figura 2.4. Propiedades de la distribucin normal: (i) aproximadamente el 68% de los valores
caen dentro de 16 de la media; (ii) cerca del 95% de los valores se ubican dentro de 26
de la media; (iii) aproximadamente el 99.7% de los valores se encuentran dentro de 36
de la media.

En una distribucin normal con media conocida, /1, y desviacin estndar, (J, la proporcin exacta de valores que caen dentro de un intervalo cualquiera puede encontrarse a partir de las tablas, con tal que los valores se
hayan primero estandarizado, de manera que proporcionen valores z. Esto
se realiza expresando un valor de x en trminos de su desviacin de la media
en unidades de la desviacin estndar, (J. Es decir

(x - /1)

a_b_le_n_o~r_m_a_l_e_s_ta_n_d_a_r_i_za_d_a_,_z_=_ -_-_-_(J~~~ ~

________
v_a_n_

__

La Tabla A.l (Apndice 2) presenta la proporcin de valores, F(z), que


caen por debajo de un valor dado de z. F(z) se denomina la funcin de distribucin acumulativa normal estndar. Por ejemplo, la proporcin de
valores por debajo de z = 2 es F(2) = 0.9722 Y la proporcin de valores por
debajo de z = - 2 es F( - 2) = 0.0228. Entonces el valor exacto de la proporcin de medidas que caen dentro de dos veces la desviacin estndar de la
media es 0.9772 - 0.0228 = 0.9544.

EJEMPLO 2.2.1
Si las medidas repetidas de una valoracin se distribuyen de forma normal con media de
10.15 mi y desviacin estndar de 0.02 mi, encuentre la proporcin de medidas que caen
entre 10.12 y 10.20 mI.
.
Estandarizando el primer valor da z= (10.12 - 10.15)/0.02 = -1.5.
De la Tabla A.1, A., -1.5) = 0.0668.
Estandarizando el segundo valor da z= (10.20 - 10.15)/0.02 = 2.5.
De la Tabla A.1, A.,2.5) = 0.9938.
Por tanto, la proporcin de valores entre x = 10.12 Y 10.20 (que se corresponde con
z = -1.5 Y2.5) es 0.9938 - 0.0668 = 0.927.

El lector debe advertir que, en el clculo de la proporcin de valores de z,


existe una considerable variacin en el formato de las tablas. Algunas tablas
slo dan valores de z positivos, de manera que las proporciones para los valores negativos se tienen que deducir mediante consideraciones de simetra.
Tambin pueden obtenerse los valores de F(z) utilizando Excel o Minitab.
Aunque no se pueda demostrar que las medidas repetidas de cualquier cantidad analtica vayan a estar siempre distribuidas nonna1mente, la evidencia
nos indica que generalmente esta hiptesis est al menos muy cerca de ser
verdad. Adems, como se ver al estlldiar las medias muestra1es, cualquier desviacin de la normalidad en una poblacin no es habitualmente importante
en el contexto de los contrastes estadsticos utilizados con ms frecuencia.
La distribucin normal no slo se aplica cuando se toman medidas repetidas de un mismo ejemplar. A menudo, los resultados obtenidos se adaptan
a la distribucin normal cuando se mide la misma magnitud para diferentes
materiales de fuentes similares. Por ejemplo, si se miden las concentraciones
de albmina en suero sanguneo procedentes de adultos humanos sanos, se
encontrara que los resultados estaran aproximadamente normalmente distribuidos.

2.3.

La distribucin log-normal

En situaciones donde una medida se realiza sobre cada uno de una serie de
ejemplares, pueden surgir otras distribuciones adems de la normal. En concreto se encuentra con frecuencia la denominada distribucin log-normal.
En esta distribucin, la frecuencia representada frente al logaritmo de la concentracin (u otras caractersticas) proporciona una curva de distribucin
normal. Un ejemplo de una variable que tiene una distribucin lag-normal
es la concentracin de anticuerpos en suero sanguneo humano. Cuando se
representa la frecuencia frente a la concentracin, se obtiene la curva asimtrica mostrada en la Figura 2.5a. Sin embargo, si se representa la frecuencia
frente al logaritmo (por ejemplo, en base 10) de la concentracin, se obtiene aproximadamente una distribucin normal, como se muestra en la Figura 2.5b. Otro ejemplo de una variable que puede seguir una distribucin
lag-normal es el tamao de partcula de las gotas formadas por los nebulizadores utilizados en espectroscopa de llama.

27

28

(a)

140
120
ro

100

SO

::::l

3!.

60

40
20

o 1--'-'-'---'-r-'-'---L....J'-"-r....................

--'TL...L--'-'---'-r'==----'=---9'"-~";

3
4
Concentracin

c-

(b)

100 1c-

ro

1- ."

~ 50 1o

11-

cc-

LL

o
-0.5

~rJf

rt-h

0.5

Log (concentracin)

Figura 2.5. (a) Una distribucin aproximadamente log-normal: concentracin de anticuerpos


de inmunoglobulina M en suero de varones. (b) Los resultados de (a) representados frente
al logaritmo de la concentracin.

El intervalo que contiene un porcentaje concreto de medidas de una variable con distribucin log-normal se puede evaluar trabajando con los logaritmos de los valores. La distribucin de los logaritmos de la concentracin
en suero sanguneo mostrada en la Figura 2.5b tiene media 0.15 y desviacin
estndar 0.20. Esto significa que aproximadamente el 68 % de los valores logartmicos se ubican en el intervalo 0.15 - 0.20 a 0.15 + 0.20, es decir,
- 0.05 a 0.35. Tomando antilogaritmos, el 68 % de las medidas originales se
encuentran en el intervalo 10 00;; a 10:35, es decir de 0.89 a 2.24. El antilogaritmo de la media de los valores a los que se aplica la funcin logartmo,
10 015 = 1.41, proporciona la media geomtrica de la distribucin original
donde la media geomtrica viene dada por ;)X1X2, ... X".

2.4.

Definicin de muestra

En este captulo se ha introducido la palabra muestra y utilizado en sentido


estadstico para un grupo de objetos seleccionados de una poblacin de tales

objetos, por ejemplo, una muestra de 50 medidas de la concentracin de ion


nitrato de la poblacin (infinita) de todas las medidas posibles, o una muestra de adultos humanos sanos elegida de una poblacin global para medir la
concentracin de albmina srica de cada uno. La Comisin de Nomenclatura Analtica de la Divisin de Qumica Analtica de la Unin Internacional
de Qumica Pura y Aplicada ha sealado que puede surgir confusin y ambigedad si el trmino muestra se utiliza tambin en su sentido coloquial
de material real que se estudia (Comisin de Nomenclatura Analtica,
1990). Se recomienda que el trmino muestra se confine a su concepto estadstico. Se deberan utilizar otras palabras para describir el material sobre el
que se realizan las medidas, en cada caso precedido por ensayo, por ejemplo,
solucin de ensayo o muestra (alcuota) de ensayo. Entonces se puede
hablar sin ambigedad de una muestra de medidas sobre una muestra de ensayo, o de una muestra de pastillas de un lote. Una parte de ensayo de una
poblacin que vara con el tiempo, tal como un ro o fluido sanguneo, debera describirse como un espcimen o ejemplar. Desgraciadamente esta prctica no es en absoluto habitual, de manera que el trmino muestra se sigue
utilizando para los dos usos relacionados pero distintos.

2.5. La distribucin muestral de la media


Ya se ha visto que, en ausencia de errores sistemticos, la media de una
muestra de medidas proporciona una estimacin del valor verdadero, Il, de
la cantidad que se quiere medir. Sin embargo, aun en ausencia de errores
sistemticos, las medidas individuales varan debido a los errores aleatorios,
de manera que es poco probable que la media de la muestra sea exactamente
igual al valor verdadero. Por esta razn es ms til proporcionar un intervalo
de valores que sea probable que incluya al valor verdadero. La amplitud de
este intervalo depende de dos factores. El primero es la precisin de las medidas individuales, las cuales dependen a su vez de la desviacin estndar de
la poblacin. El segundo es el nmero de medidas de la muestra. El mero
hecho de repetir medidas implica que se tenga ms confianza en la media de
varios valores que en uno solo. Intuitivamente, se podra pensar que cuantas
ms medidas se tomen ms fiable ser la estimacin de 11, el verdadero valor.
Para corroborar esta idea volvamos a la determinacin de ion nitrato descrita en la Seccin 2.2. En casos como el estudiado, normalmente es poco
prctico realizar 50 medidas repetidas: un nmero ms verosmil sera cinco.
Se puede ver como las medias de las muestras de este tamao estn distribuidas alrededor de 11, tratando los resultados de la Tabla 2.2 como diez
muestras en las que cada una de ellas contiene cinco resultados. Tomando
cada columna como una muestra, las medias son 0.506, 0.504, 0.502, 0.496,
0.502, 0.492, 0.506, 0.504, 0.500, 0.486. Se puede ver que estas medias se
encuentran ms agrupadas entre s que las medidas originales. Si se siguen
tomando muestras de cinco medidas y se calculan sus medias, estas medidas
tendran una distribucin de frecuencias propia. La distribucin de todas las
medias muestrales posibles (en este caso un nmero infinito) se denomina
distribucin muestral de la media o distribucin en el muestreo de la

29

30

media. Su media es la misma que la media de la poblacin original. Su desviacin estndar se denomina error estndar de la media (e.e.m.). Existe
una relacin matemtica exacta entre el e.e.m. y la desviacin estndar, a,
de la distribucin de medidas individuales:

Para una muestra de n medidas,


el error estndar de la media (e.e.m.)

a/~

(2.5)

Como es de esperar, a mayor n, menor ser el valor del e.e.m. y consecuentemente menor la dispersin de las medias muestrales en torno a /l.
El trmino, error estndar de la media, podra dar la impresin que
alfi mide la diferencia entre y /l. Esto no es as: alfi proporciona una
medida de la variabilidad de
como se ver en la siguiente seccin.
Otra propiedad de la distribucin muestral de la media es que, aun cuando la poblacin original no est distribuida normalmente, la distribucin muestral de la media tiende a la distribucin normal cuando aumenta n. Este
resultado se conoce como teorema del lmite central. Este teorema es de
suma importancia ya que muchos contrastes estadsticos se realizan sobre la
media y suponen que se distribuye en forma normal. Ya que en la prctica
se puede suponer una distribucin casi normal para las distribuciones de medidas repetidas, es razonable asumir que las medias de muestras muy pequeas (digamos> 5) se distribuyan normalmente.

x,

2.6.

Lmites de confianza de la media


para muestras grandes

Conocida la forma de la distribucin muestral de la media, ahora se puede


volver al problema de utilizar una muestra para definir el intervalo dentro
del cual se pueda suponer de manera razonable que se encuentra el valor
verdadero. (Recurdese que al hacer esto se supone que no existen errores
sistemticos.) Tal intervalo es conocido como un intervalo de confianza y
los valores extremos de dicho intervalo se llaman lmites de confianza. El
trmino confianza implica que podemos afirmar con un grado de confianza
dado, es decir, con una cierta probabilidad, que el intervalo de confianza s
incluye al valor verdadero. El tamao del intervalo de confianza depender
obviamente de la certeza que queramos tener de que se incluya el valor verdadero: cuanto ms grande sea la certeza, ms grande ser el intervalo requerido.
La Figura 2.6 muestra la distribucin muestral de la media para muestras
de tamao n. Si se supone que esta distribucin es normal, entonces el 95 %
de las medias muestrales se encontrarn en el intervalo dado por:
ti - 1.96(a I~)

< X < /l + 1.96(a I~)

(2.6)

31

.t - 1.96cr

/w

.t

.t + 1.96cr

/w

Figura 2.6. La distribucin muestral de la media, mostrando el intervalo dentro del cual
se encuentra el 95% de las medias muestrales.

(En esta ecuacin se utiliza el valor exacto 1.96 en lugar del valor aproximado 2, citado en la Seccin 2.2 .. El lector puede utilizar la Tabla A.l para
comprobar que la proporcin de valores entre z = -1.96 Y z = 1.96 es de
hecho 0.95.)
Sin embargo, en la prctica se dispone habitualmente de una muestra, de
media conocida, y se busca un intervalo para J1, el verdadero valor. La ecuacin (2.6) puede reordenarse y expresarse de la siguiente forma:

x-

1.96((J/~) < J1 <

x + 1.96((J/~)

(2.7)

La ecuacin (2.7) proporciona el intervalo de confianza al 95 % de la media. Los lmites de confianza al 95% son 1.96((J/~).
En la prctica, es poco probable conocer exactamente (J. Sin embargo,
siempre que la muestra sea grande, (J puede ser sustituida por su estimacin, s.
A veces se utilizan otros lmites de confianza, en particular los lmites de
confianza al 99 y 99.7%.

Para muestras grandes, los lmites de confianza de la media vienen


dados por
(2.8)
x zs/~
donde el valor de z depende del grado de confianza requerido.
Para lmites de confianza del 95 %, z

1.96

Para lmites de confianza del 99 % , z

2.58

Para lmites de confianza del 99.7 %, z

2.97

32

EJEMPLO 2.6.1
Calcular los lmites de confianza de la media al 95% y 99% para las medidas de la concentracin de ion nitrato de la Tabla 2.1.
Se tiene que x = 0.500, 8 = 0.0165 Y n = 50. La ecuacin (2.8) proporciona como lmites
de confianza al 95%:

x 1.968/ J =

0.500

1.96

x 0.0165/

J50 = 0.500 0.0046

j.lg

ml- 1

y como lmites de confianza al 99%:

x 2.58sl,,!= 0.500 2.58 x 0.01651/ v /50 =

0.500

0.0060 119 ml- 1

En este ejemplo es interesante resaltar que aunque las medidas varan


entre 0.46 y 0.53, el intervalo de confianza de la media al 99 % oscila entre
0.494 y 0.506.

2.7. ....mites de confianza de la media para


muestras pequeas
Cuando el tamao de muestra se hace ms pequeo, s es menos fidedigno
como una estimacin de (J. Esto puede verse tratando nuevamente cada columna de resultados de la Tabla 2.2 como una muestra de tamao cinco. Las
desviaciones estndar de las diez columnas son 0.009, 0.015, 0.026, 0.021,
0.013, 0.019, 0.013, 0.017, 0.010, 0.018. Se vio que el valor ms grande de
s era aproximadamente tres veces el valor/tamao del ms pequeo. Para tener en cuenta esto, la ecuacin (2.8) debe ser modificada.

Para muestras pequeas, los lmites de confianza de la media vienen


dados por
(2.9)
El subndice (n ~ 1) indica que t depende de esta cantidad, que se conoce
como el nmero de grados de libertad, g.l. (cuyo smbolo habitual es \'). El
trmino grados de libertad se refiere al nmero de desviaciones independientes (Xi - .X:) que se utilizan al calcular s. En este caso dicho nmero es
(n - 1), porque cuando se conocen (n - 1) desviaciones, la ltima se puede
deducir ya que I (x - "X:) = O. El valor de t depende tambin del grado de

confianza requerido. La Tabla 2.3 recoge algunos valores de t. La Tabla A.2


del Apndice 2 proporciona una versin ms completa de esta tabla.
Para valores grandes de n, los valores de t n _ 1 para intervalos de confianza del 95 % Y 99 %, respectivamente, estn muy prximos a los valores 1.96
y 2.58 utilizados en el Ejemplo 2.6.1. El siguiente ejemplo ilustra el uso de
la ecuacin (2.9).

Tabla 2.3.

Valores de t para intervalos de confianza.


Valores de t para intervalos de confianza de

Grados de libertad

1~,>

20
50
100

2.8.

95%

99%

4.30
2.57
2.23
2.09
2.01
1.98

9.92
4.03
3.17
2.85
2.68
2.63

Presentacin de resultados

Como ya se ha recalcado, los resultados experimentales cuantitativos carecen


de inters si no van acompaados de una estimacin de los errores involucrados en su medida. Una prctica usual en la literatura de qumica analtica
es citar la media como la estimacin de la cantidad medida y a la desviacin
estndar como la estimacin de la precisin. Menos frecuente es citar el
error estndar de la media en lugar de la desviacin estndar, o dar el resultado en la forma de los lmites de confianza al 95 % de la media. (Tambin
se utilizan a veces, vase el Captulo 4, estimaciones de la incertidumbre.) Ya
que no existe un convenio universal es importante establecer la forma empleada y, siempre que el valor de n venga dado, las tres formas se pueden
convertir unas en otras utilizando las ecuaciones (2.5) y (2.9).
Un aspecto relacionado con la presentacin de resultados es el redondeo
de la respuesta. El principio importante en este caso es que el nmero de
cifras significativas dadas indican la precisin del experimento. Por ejemplo,
sera absurdo, dar el resultado de un anlisis volumtrico como 0.107846 M,
ya que ningn analista podra alcanzar la precisin implicada de 0.000001

33

34

en una concentracin aproximada de 0.1, i.e., 0.001 %. En la prctica es costumbre fijar como cifras significativas todos los dgitos que sean seguros, ms
el primero incierto. Por ejemplo, la media de los valores 10.09, 10.11, 10.09,
10.10, Y 10.12 es 10.102, y su desviacin estndar es 0.01304. Claramente
existe incertidumbre en la segunda cifra decimal; los resultados son todos
10.1 con una cifra decimal, pero difieren en la segunda cifra decimal. Mediante el mtodo sugerido el resultado podra expresarse como:

i s = 10.10 0.01

(n

5)

Si se hubiera constatado que este resultado es un redondeo inaceptable de la


desviacin estndar, entonces el resultado se podra dar como:

s =

10.102

0.01 3

(n

5)

donde el uso de los subndices nos indica que el dgito slo se da para evitar
prdida de informacin. El lector podra decidir si fue til o no.
De manera similar, cuando se calculan los lmites de confianza [vase la
ecuacin (2.9)], no es necesario dar el resultado de t n _ 1S
con ms de dos
cifras significativas. El valor de .:C debera darse en ese caso' con el correspondiente nmero de cifras decimales.
El nmero de cifras significativas fijado se utiliza a menudo en lugar de
una estimacin especfica para indicar la precisin de un resultado. Por
ejemplo, si se considera 0.1046 M se quiere indicar que los nmeros de las
tres primeras cifras decimales son seguros pero existen dudas acerca de la
cuarta. A veces se recalca la incertidumbre en la ltima cifra utilizando los
formatos 0.104(6) M o 0.104f) M, pero sigue siendo preferible dar una estimacin especfica de la precisin tal como la desviacin estndar.
Un problema que puede surgir es si un 5 debera redondearse por encima
o por debajo. Por ejemplo, si 9.65 es redondeado a una sola cifra decimal
podra convertirse en 9.6 o 9.7? Es evidente que los resultados tendrn sesgo si un 5 se redondea siempre hacia el valor superior; este sesgo puede evitarse redondeando e15 al nmero par ms prximo, dando, en este caso, 9.6.
Anlogamente, 4.75 se redondea a 4.8.
Cuando hay que utilizar varias cantidades para calcular un resultado final
(vase la Seccin 2.11), estas cantidades no deben redondearse demasiado ya
que se producir una prdida de precisin innecesaria. Una buena regla es
dejar un dgito detrs de la ltima cifra significativa y dejar el posterior redondeo hasta que se llegue al resultado final. La misma regla se aplica cuando se usan la media y la desviacin estndar en contrastes estadsticos tales
como los contrastes F y t (vase el Captulo 3): se deberan utilizar en los
clculos los valores no redondeados de i y s.

/;;Z

2.9.

Otros usos de los limites de confianza

Los intervalos de confianza se pueden utilizar como un test para detectar


errores sistemticos, como se muestra en el siguiente ejemplo.

35

EJEMPLO 2.9.1
Se comprueba la escala de absorbancia de un espectrmetro a una longitud de onda
concreta usando una solucin estndar con una absorbancia de 0.470. Diez medidas de
absorbancia con el espectrmetro dieron x= 0.461 Y s = 0.003. Encontrar el intervalo de
confianza al 95% de la absorbancia media y de aqu decidir si se encuentra presente un
error sistemtico.
Los lmites de confianza al 95% de las absorbancias medidas por el espectrmetro son
[ecuacin (2.9)]:

x /n- MI A

= 0.461

2.26 x 0.03/.)10

= 0.461

0.002

(El valor de /9 fue obtenido a partir de la Tabla A.2.)


Ya que el intervalo de confianza no incluye la absorbancia conocida de 0.470, es probable
que exista error sistemtico.

En la prctica el tipo de problema del Ejemplo 2.9.1 se resuelve comnmente de manera diferente pero relacionada (vase el Ejemplo 3.2.1).
Los lmites de confianza tambin se pueden usar cuando se toman medidas a cada uno de una serie de especmenes. Por ejemplo. supngase que se
requiere el peso medio de una pastilla en un gran lote: se consumira excesivo tiempo en pesar cada pastilla. De manera similar, al medir el contenido
medio de hierro utilizando un mtodo analtico destructivo tal como la espectrometra de absorcin atmica, es claramente imposible examinar cada
tableta. En ambos casos, podra tomarse una muestra del lote (que en tales
casos forma la poblacin) y a partir de la media y desviacin estndar de la
muestra se podda encontrar un intervalo de confianza para el valor medio
de la cantidad medida.

2.10.

Lmites de confianza de la media geomtrica


de una distribucin log-normal

En la Seccin 2.3 se mencion que las medidas de un nmero de especmenes puede no estar distribuida normalmente. Si proceden de una distribucin
log-normal, entonces los lmites de confianza deberan calcularse teniendo en
cuenta este hecho. Ya que el logaritmo de las medidas se distribuye normalmente es ms exacto trabajar con los logaritmos de las medidas al calcular
un intervalo de confianza. El intervalo de confianza obtenido ser el intervalo de confianza para la media geomtrica.
EJEMPLO 2.10.1
Los siguientes valores (expresados como porcentajes) proporcionan la concentracin de
anticuerpos en suero sanguneo humano de ocho adultos sanos.
2.15,

1.13,

2.04,

1.45,

1.35,

1.09,

0.99,

2.07

36

Calcular el intervalo de confianza de la media geomtrica al 95% suponiendo que la concentracin de anticuerpos se distribuye log-normal.
Los logaritmos (en base 10) de los valores propuestos son:
0.332,0.053,0.310,0.161,0.130,0.037,

-0.004,0.316

La media de estos valores logartmicos es 0.1669, dando 101669 = 1.47 como la media
geomtrica de los valores originales. La desviacin estndar de los valores logartmicos es
0.1365.
Los lmites de confianza al 95% para los valores logartmicos son:
0.1669

2.36

x 0.1365/

J8 = 0.1669 0.1139 = 0.0530 a 0.2808

Los antilogaritmos de estos lmites dan el intervalo de confianza de la media geomtrica al


95% como 1.13 a 1.91.

2.11.

Propagacin de errores aleatorios

En el trabajo experimental, la cantidad que se va a determinar se calcula, con


frecuencia, a partir de una combinacin de cantidades observables. Ya se ha
visto, por ejemplo, que incluso una operacin relativamente simple como un
anlisis volumtrico, implica varias etapas, estando sujeta cada una de ellas
a errores (vase el Captulo 1). El clculo final puede conllevar operaciones
tales como sumas, restas, multiplicaciones o divisiones de dos o ms cantidades, o elevar alguna cantidad a una potencia.
Es muy importante sealar que los procedimientos utilizados para combinar errores aleatorios y sistemticos son completamente distintos. Esto se
debe a que algunos errores aleatorios se compensan entre S1, mientras que
cada error sistemtico tiene lugar en un sentido definido y conocido. Supngase, por ejemplo, que el resultado final de un experimento, x, viene dado
por x = a + h. Si a y b tienen un error sistemtico de + 1, est claro que
el error sistemtico en x es de + 2. Si, sin embargo, a y h tienen cada uno un
error aleatorio de 1, el error aleatorio de x no es 2: esto es debido a que
existirn ocasiones en que el error aleatorio en a ser positivo mientras
que en otras en b ser negativo (o viceversa).
Esta seccin slo considera la propagacin de errores aleatorios (los errores sistemticos se consideran en la Seccin 2.12). Si se conoce la precisin
de cada observacin, entonces se pueden usar reglas matemticas simples para estimar la precisin del resultado final. Estas reglas se resumen a continuacin.

2.11.1

Combinaciones lineales

En este caso el valor final, y, se calcula a partir de una combinacin lineal


de cantidades medidas a, b, e, etc.) por:
(2.10)

donde le, ka' le,,, leo etc., son constantes. La varianza (definida como el cuadrado de la desviacin estndar) tiene la propiedad importante de que la varianza de una suma o diferencia de cantidades independientes es igual a la
suma de sus varianzas. Se puede demostrar que si (J", (J,,, (J" etc., son las desviaciones estndar de a, b y e, etc., entonces la desviacin estndar de Jj, (J'I'
vi.ene dada por:
(2.11)

EJEMPLO 2.11.1
En una valoracin la lectura inicial en una bureta es 3.51 mi y la lectura final es 15.67 mi,
ambas con una desviacin estndar de 0.02 mI. Cul es el volumen de valorante utilizado
y cul es su desviacin. estndar?
Volumen utilizado = 15.67 - 3.51
Desviacin estndar = ,,/(0.02)2

= 12.16 mi

+ (0.02)2

0.028 mi

Este ejemplo aclara el aspecto importante de que la desviacin estndar del


resultado final es mayor que la desviacin estndar de las lecturas individuales de la bureta, incluso aunque el volumen utilizado se calcule a partir de
una diferencia, pero es menor que la suma de las desviaciones estndar.

2.11.2

Expresiones multiplicativas

Si!J se calcula a partir de una expresin del tipo:


Jj

= kah/ed

(2.12)

(donde a, b, e y d son cantidades medidas independientes y h es una constante) entonces existe una relacin entre los cuadrados de las desviaciones
estndar relativas:

(2.13)
J)

EJEMPLO 2.11.2
El rendimiento cuntico de fluorescencia.

<Po

se calcula a partir de la expresin:

<p = IJ kc/~f.
donde las cantidades implicadas se definen a continuacin, con una estimacin de sus desviaciones estndar relativas entre parntesis:

37

38

~ =

intensidad de luz incidente (0.5%)


/1 = intensidad de luz fluorescente (2%)
1: = absortividad molar (1%)
e = concentracin (0.2%)
/ = paso ptico (0.2%)
k es una constante del instrumento.
De la ecuacin (2.13), la desviacin estndar relativa de cP viene dada por:
DER = }2 2

+ + 0.22 + 0.22 + 0.52 + 12

2.3%

Puede observarse que la desviacin estndar relativa del resultado final no


es mucho mayor que la mayor de todas las desviaciones estndar relativas
usadas para calcularlo (es decir, 2 % para Ir). Esto es fundamentalmente consecuencia de elevar al cuadrado las desviaciones estndar relativas y aclara una cuestin de importancia general: cualquier esfuerzo que se haga
para mejorar la precisin de un experimento debe ir en la direccin de mejorar la precisin de los valores menos precisos. Como corolario de esto, no
vale la pena esforzarse en incrementar la precisin de los valores ms precisos. Esto no significa que los errores pequeos no sean importantes: errores
pequeos en muchas etapas de un experimento, tales como los del anlisis
volumtrico analizados con detalle en el Captulo 1, producirn un error
apreciable en el resultado final.
Es importante resaltar que cuando una cantidad se eleva a una potencia,
por ejemplo, b3 , entonces el error no se calcula como para una multiplicacin, es decir, b x b x b, debido a que las cantidades implicadas no son independientes. Si la relacin es
(2.14)
)1 = b"
entonces las desviaciones estndar de y y b estn relacionadas por:

I~;I I = In;/i I

(2.15) I

(El signo del valor absoluto o mdulo significa que la magnitud de la cantidad encerrada en l se toma sin tener en cuenta el signo, por ejemplo,
1- 21 = 2.)

2.11.3.

Otras funciones

Siy es una funcin general de x,y = f(x), entonces las desviaciones estndar
de x e y estn relacionadas por:

(2.16)

39

EJEMPLO 2.11.3

rn

La absorbancia, A, de una solucin viene dada por A = -Iog( Ti donde Tes la transmitancia. Si el valor medido de Tes 0.50tcon una desviacin estndar de 0.001, calcular A y
su desviacin estndar.

(Ji'

Se tiene:

"

(f)

.-+

OJ

o...
.-+

OJ

A = -Iog 0.501 = 0.300

o...

ro

Tambin:

3ro

dA/d T = - (Iog e)/ T = - 0.434/ T

o...

o:.

de manera que de la ecuacin (2.17):

OJ

(f)

SA =

i(J ~ -lag e/ Til

10.001 x (- 0.434/0.501) I = 0.0008 7

'""\

ro
ro
.-+

'U

Es interesante hacer constar que para este mtodo experimental ampliamente utilizado se pueden encontrar las condiciones para que sea mnima la
desviacin estndar relativa (RSD). La desviacin estndar relativa (DER)
de A viene dada por:
DER de A

1000"AlA =

1000"Tlog e
1
T og 'I'

La derivada de esta expresin con respecto a T muestra que la DER de A es


mnima cuando T = 1 le = 0.368.

2.12.

Propagacin de errores sistemticos

Las reglas para la combinacin de errores sistemticos pueden dividirse tambin en tres grupos.

2.12.1.

Combinaciones lineales

Si Y se calcula a partir de cantidades medidas usando la ecuacin (2.10), y


los errores sistemticos de a, b, e, etc., son ~a, ~b, ~c, etc., entonces el error
sistemtico de y, ~y, se calcula a partir de:

(2.17)

Recurdese que los errores sistemticos son tanto positivos como negativos
y que estos signos deben incluirse en el clculo de ~lf.
El error sistemtico total puede ser a veces cero. Supngase, por ejemplo,
que se usa una balanza con un error sistemtico de - 0.01 g para pesadas
utilizadas en la preparacin de una solucin estndar. Puesto que el peso de
soluto utilizado se calcula por diferencia entre dos pesadas, se eliminan los
errores sistemticos. Se debera sealar que esto se aplica slo a una balanza

o:.
OJ
(f)

40

electrnica con un nico peso de referencia interno. Procedimientos como


ste, considerados cuidadosamente, pueden minimizar a menudo los errores
sistemticos, como se describi en el Captulo 1.

2.12.2. Expresiones multiplicativas


Si Jj se calcula a partir de cantidades medidas utilizando la ecuacin (2.12)
entonces se utilizan errores sistemticos relativos:
(I1Jj/Jj) = (l1a/a)

+ (l1b/b) + (l1c/c) + (l1d/d)

(2.18)

Cuando una cantidad se eleva a alguna potencia, entonces se emplea la ecuacin (2.15), con el signo del mdulo omitido y las desviaciones estndar se
sustituyen por errores sistemticos.

2.12.3.

Otras funciones

La ecuacin utilizada es idntica a la ecuacin (2.16) pero con el signo del


mdulo omitido y las desviaciones estndar se sustituyen por errores sistemticos.
En cualquier experimento analtico ocurrirn errores aleatorios y sistemticos. El error combinado estimado del resultado final es referido como la
incertidumbre. La incertidumbre combina errores sistemticos y aleatorios
y proporciona un intervalo realista de valores dentro del cual est probablemente ubicado el verdadero valor de la cantidad medida. Este tpico se trata
con detalle en el Captulo 4.

Bibliografa
Altman, D. G. 1991. Practical Statistics for Medical Research. Chapman and
Hall, London. (Proporciona una discusin completa de la distribucin
lag-normal.)
Commision on Analytical Nomenclature. 1990. Nomenclature for Sampling
in Analytical Chemistry; Pure and Applied ChemistrJj 62:1193.
Davies, O. L. and Goldsmith, P.L. 1982. Statistical Methods in Research and
Production. Longman, London. (Da un tratamiento ms detallado de la
materia objeto de este captulo.)
Moritz, P. 1981. Chapter 1 Comprehensive AnalJjtical ChemistrJj Vol. XI, G.
Svehla (ed.). Elsevier, Amsterdam. (Este artculo profundiza en la aplicacin de la teora de errores a los mtodos analticos.)
Skoog, D. A. and West, D. M. 1982. Fundamentals of AnalJjtical ChemistrJj,
4th Ed. Holt Saunders, New York. (Describe el uso de la estadstica en
la evaluacin de datos analticos.)

41

Ejercicios
1.

Para investigar la reproducibilidad de un mtodo para la determinacin


de selenio en alimentos, se realizaron nueve medidas sobre un lote de
arroz tostado, con los siguientes resultados:
0.07

0.07

0.08

0.07

0.07

0.08

0.08

0.09

0.08 flg g

(Moreno Domnguez, T., Garca Moreno, C. and Marin Font, A. 1983


AnalJjst 108:505)
Calcular la media, desviacin estndar y desviacin estndar relativa de
estos resultados.

2.

Siete medidas del pH de una solucin reguladora proporcionaron los siguientes resultados:
5.125.205.155.175.165.195.15
Calcular los lmites de confianza para el verdadero pH al nivel de confianza del (i) 95 % Y (ii) 99 %. (Suponer que no existen errores sistemticos.)

3.

Diez anlisis repetidos de la concentracin de mercurio en una muestra


de condensado de gas comercial proporcionaron los siguientes resultados:
23.3 22.5 21.9 21.5 19.9 21.3 21.7 23.8 22.6 24.7ngml- 1
(Shafawi, A., Ebdon, L., Foulkes, M., Stockwell, P. and Corns, W. 1999.
AnalJjst 124:185)
Calcular la media, desviacin estndar, desviacin estndar relativa de
estos resultados y lmites de confianza de la media al 99 % .
Seis anlisis repetidos de otra muestra proporcionaron los siguientes
valores:
13.8

14.0

13.2

11.9

12.0

12.1

ng mr

Reptanse los clculos para estos valores.

4.

Se midi la concentracin de plomo en el fluido sanguneo para una


muestra de 50 nios de un gran colegio prximo a una calle concurri
da. La media muestral fue 10.12 ng ml- l y la desviacin estndar fue
0.64 ng mI l. Calcular el intervalo de confianza al 95 % para la concentracin media de plomo de todos los nios de la escuela.
Qu tamao debera tener la muestra para reducir la longitud del intervalo de confianza a 0.2 ng ml- I (es decir 0.1 ng ml- I )?

5.

Para la evaluacin de un mtodo para la determinacin de fluoreno


en agua de mar, se adicion a una muestra sinttica de agua de mar
50 ng ml- I de fluoreno. Diez muestras repetidas de la concentracin de
fluoreno en la muestra tuvieron una media de 49.5 ng ml- I con una
desviacin estndar de 1.5 ng mI-l.
(Gonslez, M. A. and Lpez, M. H. 1998. AnalJjst 123:2217)

Calcule los lmites de confianza de la media al 95 %. Est el valor adicionado de 50 ng ml- l dentro de los lmites de confianza al 95 %?

42

6.

Se utiliz una disolucin 0.1 M de cido para valorar 10 mI de una solucin de lcali 0.1 M, registrndose los siguientes volmenes de cido:
9.88

10.18

10.23

10.39

10.21 mI

Calcule los lmites de confianza de la media al 95 % Y utilcelos para


decidir si existe alguna evidencia de error sistemtico.

7.

En este problema se consideran los errores aleatorios involucrados en


la preparacin de una disolucin estndar. Se prepar un volumen de
250 mI de una disolucin 0.05 M de un reactivo de peso molecular 40,
por diferencia de pesada. La desviacin estndar de cada pesada fue
0.0001 g: cul fue la desviacin estndar y desviacin estndar relativa
del peso de reactivo utilizado? La desviacin estndar del volumen de
disolvente utilizado fue 0.05 mI. Exprese esto como una desviacin estndar relativa. De aqu calcule la desviacin estndar relativa de la molaridad de la solucin.
Repetir el clculo para un reactivo de peso molecular 392.

8.

El producto de solubilidad del sulfato de bario es 1.3 x 1O~ 10, con una
desviacin estndar de 0.1 x 10 -10. Calcular la desviacin estndar de
la solubilidad calculada del sulfato de bario en agua.

Contrastes
de significacin

3.1.

Introduccin

Una de las propiedades ms importantes de un mtodo analtico es que debera estar libre de errores sistemticos. Esto significa que el valor dado para
la cantidad de analito debera ser el valor verdadero. Esta propiedad de un
mtodo analtico se puede contrastar al aplicar el mtodo a una muestra de
ensayo estndar que contenga una cantidad conocida de analito (Captulo 1).
Sin embargo, como se vio en el captulo anterior, incluso si no existieran
errores sistemticos, los errores aleatorios hacen poco probable que la cantidad medida sea exactamente igual que la cantidad patrn conocida. Para decidir si la diferencia entre la cantidad medida y la cantidad conocida se puede
atribuir a estos errores aleatorios, se puede aplicar una prueba estadstica denominada contraste de significacin. Como su nombre indica, esta aproximacin contrasta si son significativas las diferencias entre los dos resultados,
o si se pueden justificar slo por variaciones aleatorias. Los contrastes de
significacin se utilizan ampliamente en la evaluacin de los resultados experimentales. Este captulo considera varios contrastes que resultan especialmente tiles a los qumicos analticos.

3.2.

Comparacin de una media experimental


con un valor conocido

Al hacer un contraste de significacin se prueba la veracidad de una hiptesis denominada hiptesis nula, denotada por H o . Refirindonos al prrafo
anterior, adoptamos como hiptesis nula aquella mediante la cual un mtodo
analtico no est sujeto a errores sistemticos. El trmino nulo se emplea para
indicar que no hay otra diferencia entre el valor observado y el conocido que
la atribuible a la variacin aleatoria. Suponiendo que esta hiptesis nula es

44

verdadera, la teora estadstica se puede emplear para calcular la probabilidad


de que la diferencia observada (o una superior a ella) entre la media muestral, "\;, y el verdadero valor, ,11, se deba solamente a errores aleatorios. Cuanto
ms pequea sea la probabilidad de que la diferencia observada ocurra por
azar, menos probable ser que la hiptesis nula sea verdadera. Normalmente
la hiptesis nula se rechaza cuando la probabilidad de que dicha diferencia
observada ocurra por azar es menor que 1 en 20 veces (es decir, 0.05 5 %).
En este caso se dice que la diferencia es significativa al nivel 0.05 ( 5 %).
Utilizando este nivel de significacin se rechaza, en promedio, la hiptesis
nula, aunque sea de hecho verdadera, 1 de cada 20 veces. Para estar ms seguros de que se toma la decisin adecuada, se puede manejar un nivel de
significacin ms pequeo, normalmente 0.01 0.001 (l % 0.1 %). El nivel
de significacin se indica escribiendo, por ejemplo, P (es decir, la probabilidad) = 0.05, Y proporciona la probabilidad de rechazar una hiptesis nula
cuando sta es verdadera Es importante tener en cuenta que si se acepta la
hiptesis nula no significa que se haya probado que sea verdadera, slo que
no se ha demostrado que sea falsa. Se analizar posteriormente en este mismo captulo la probabilidad de aceptar una hiptesis nula cuando sea de hecho falsa.
Para decidir si la diferencia entre x y 1-[ es significativa, es decir para
constrastar Ha: la media de la poblacin = 1-[, se calcula el estadstico t:
(3.1)

Donde = media muestral, s = desviacin estndar muestral y n = tamao muestral.


Si Itl (es decir, el valor calculado de t sin tener en cuenta el signo) es mayor
que un cierto valor crtico entonces se rechaza la hiptesis nula. El valor
critico de t para un nivel de significacin concreto se encuentra en la Tabla
A.2. Por ejemplo, para un tamao muestral de 10 (es decir, 9 grados de libertad) y un nivel de significacin de 0.01 el valor critico es t9 = 3.25, donde, como en el Captulo 2, el subndice se utiliza para indicar el nmero de
grados de libertad.
EJEMPLO 3.2.1
En un mtodo nuevo para determinar selenourea en agua, se obtuvieron los siguientes
valores para muestras de agua de grifo adicionadas con 50 ng ml- 1 de selenourea
5004,

50.7,' 49.1,

49.0,

51.1 ng mi

(Aller, A. J. and Robles, L. C. 1998. Ana{ys/123:919)


Hay alguna evidencia de error sistemtico?
La media de estos valores es del 50.06% y la desviacin estndar 0.956. Si se adopta

la hiptesis nula de que no hay error sistemtico, es decir, fl


(3.1) resulta
/=

(50.06 -50))5
0.956

50, al emplear la ecuacin

= 0.14

De la Tabla A.2, el valor crtico es /4 = 2.78 (P = 0.05). Puesto que el valor observado de

I/1 es menor que el valor crtico, la hiptesis nula se retiene: no hay evidencia de error
sistemtico. Hay que sealar nuevamente que esto no significa que no existan errores sistemticos, sino que no se ha podido constatar su existencia.

El uso de valores crticos de tablas estadsticas en contrastes de significacin fue adoptado debido a que antiguamente era demasiado tedioso calcular
la probabilidad de que t superara al valor experimentaL Las computadoras
han alterado tal situacin, y normalmente los programas estadsticos proporcionan los resultados de los contrastes de significacin en trminos de una
probabilidad. Si los valores de los datos individuales se introducen en Minitab el resultado de realizar este contraste se muestra a continuacin.
t-test of the mean
Test of mu

= 50.000

sv mu not

= 50.000

Variable N Mean
StDev SE Mean T
P
Selenour 5 50.060 0.956 0.427
0.140.90

Esto proporciona la informacin adicional que P (Itl > 0.14) = 0.90. Puesto
que esta probabilidad es muy superior a 0.05, el resultado no es significativo
a un P = 0.05, de acuerdo con el clculo previo. Obviamente es una gran
ventaja el poder calcular una probabilidad exacta, eliminando la necesidad
de tablas estadsticas que contengan valores crticos. Sin embargo, los ejemplos de este libro utilizan valores crticos, ya que puede suceder que no todos
los lectores tengan acceso a programas adecuados, y muchos cientficos siguen realizando contrastes de significacin con ayuda de calculadoras, que
normalmente no proporcionan valores de P. Cuando no se proporcionen los
valores de los datos individuales no podrn utilizarse, por ejemplo, Minitab
o Excel. Sin embargo, cuando puedan realizarse los clculos utilizando estos
programas, se proporcionar tambin el valor de P.

3.3.

Comparacin de dos medias experimentales

Los resultados de un mtodo analtico nuevo se pueden contrastar mediante


comparacin con los obtenidos utilizando un segundo mtodo (quiz uno de
referencia). En este caso tenemos dos medias muestrales ~~ 1 Y .x z . Tomando
como hiptesis nula que los dos mtodos proporcionen el mismo resultado,
es decir Ha: It l = It2' se necesita probar si U, - z) difiere significativamente
de cero. Si las dos muestras tienen desviaciones estndar que no son significativamente diferentes (vase la Seccin 3.5 en donde se presenta un mtodo
para contrastar esta suposicin), se puede calcular una estimacin conjunta

45

46

de la desviacin estndar, s, a partir de las dos desviaciones estndar individuales 5 l Y 5.


Para decidir si la diferencia en tre dos medias muestrales, JX: 1 y X2 es significativa, es decir, para contrastar la hiptesis nula, Ha: ll = ll, se calcula el estadstico t:

!F11

C~l

t=

xz)

(3.2)

-+ni

donde s se calcula a partir de

1) SI +

( n -

/'t2 -

1)2
52

(/'tI + nz - 2)

(3.3)

Y t tiene nI + /'tz - 2 grados ele libertad.


Este mtoelo supone que las muestras se extraen de poblaciones con
desviaciones estndar iguales.

EJEMPLO 3.3.1
En una comparacin de dos mtodos para la determinacin de cromo en muestras de hierba
de centeno se obtuvieron los siguientes resultados (mg Kg 1):
Mtodo 1: Media = 1.48; desviacin estndar = 0.28
Mtodo 2: Media = 2.33; desviacin estndar = 0.31
Para cada mtodo se realizaron 5 determinaciones.
(Sahuquillo, A., Rubio, R. and Rauret. G. 1999. AnaVst124:1)
Estos dos mtodos proporcionan resultados cuyas medias difieren significatrvamente?
La hiptesis nula adoptada es que las medias de los resultados dadas por ambos mtodos
sean las mismas. De la ecuacin (3.3), el valor conjunto de la desviacin estndar es:
$2 = (5

0.28 2 + 5 x 0.31 2 )/(5 + 5 - 2) = 0.1745

s= 0.295
De la ecuacin (3.2):

t=

2.33 - 1.48

0.295

Ji + i

4.56

Hay 8 grados de libertad. por tanto el valor crtico (Tabla A.2) de ~ = 2.1 (P = 0.05); puesto
que el valor experimental de I ti es ms grande que ste, la diferencia entre los dos resultados es significativa al nivel del 5% y se rechaza la hiptesis nula. De hecho, ya que el
valor crtico de t para P = 0.01 es aproximadamente 3.36, la diferencia es significativa in
cluso al nivel del 1%. En otras palabras. si la hiptesis nula es verdadera. la probabilidad
de que esa elevada diferencia se deba al azar es menor que 1 en 100.

Otra aplicacin de este contraste se pone de manifiesto en el siguiente


ejemplo, emplendose para decidir si un cambio en las condiciones de un
experimento afecta al resultado.

47

EJEMPLO 3.3.2
En una serie de experimentos para la determinacin de estao en productos alimenticios,
las muestras fueron llevadas a ebullicin con HCI a reflujo para diferentes tiempos. Los
resultados fueron:
Tiempo de reflujo (min)

Estao encontrado (mg Kg -1)

30
75

55,
57,

57,
55,

59,
58,

56,
59,

56,
59,

59
59

(Analytical Methods Committee, 1983. AnalysI108:109)


Es significativamente diferente la cantidad media de estao encontrada para los dos tiempos de ebullicin?
La media y la varianza (cuadrado de la desviacin estndar) para los dos tiempos son:

30 min

Xl = 57.00

si =

75 min

X2 = 57.83

2.80

= 2.57

La hiptesis nula adoptada es que el tiempo de ebullicin no influye sobre la cantidad de


estao encontrada. De la ecuacin (3.3) el valor conjunto para la varianza viene dado por:
;

(5 x 2.80 + 5 x 2.57)/10 = 2.685

s= 1.64

De la ecuacin (3.2):

57.00 - 57.83
1 = ----===c/1
1
1.64 V6 + 6

-0.88

-0.88
Hay 10 grados de libertad, de manera que el valor crtico es 110 = 2.23 (P= 0.05). El valor
observado de 1~ (= 0.88) es menor que el valor crtico, aceptndose por tanto la hiptesis
nula: no hay evidencia de que el perodo de ebullicin afecte a la tasa de recuperacin.
La tabla siguiente muestra el resultado de realizar este clculo con Excel.
Contraste t: dos muestras suponiendo varianzas iguales
Variable 1
Media
57
Varianza
2.8
Observaciones
6
Varianza conjunta
2.683
Diferencia de medias como hiptesis
O
gl
10
-0.881
Estadstico t
P(T<=t) para una cola
0.199
Valor t cr tico de una cola
1.812
P(T<=t) para dos colas
0.399
Valor t cr tico de dos colas
2.228

Variable 2
57.833
2.567
6

48

La distincin entre "una y dos colas se cubrir en la Seccin 3.5. Enaste momento,
es suficiente considerar slo los valores de dos colas. Estos muestran que
RI ti > 0.88):: 0.399. Ya que esta probabilidad es mayor que 0.05, el resultado no es significativo al nivel del 5%.

Cuando sea poco probable que las desviaciones estndar de las poblaciones
sean iguales, no es muy apropiado mezclar las desviaciones estndar muestrales para dar una estimacin global o conjunto de la desviacin estndar.
Un mtodo aproximado en estas circunstancias se propone a continuacin:
Para contrastar H o: tI = JL2 cuando no puede suponerse que las dos
muestras proceden de poblaciones con desviaciones estndar iguales, se
calcula el estadstico t donde

t=

(XI - X2)
S2

S2

nI

n2

(3.4)

~+-.2

con grados de libertad

(4

4)

SI

nI2( nI - 1)

+ n2(n

(3.5)

S2

2 2 - 1)

redondendose el valor obtenido a un nmero entero.


El lector debera ser consciente de que existen varias versiones del nmero
de grados de libertad proporcionadas por la literatura, reflejando el hecho de
que el mtodo es una aproximacin. El mtodo anterior es el utilizado por
Minitab y resulta conservador al establecer un resultado significativo. Por
otra parte, ExceJ, utiliza la ecuacin (3.5) pero redondea el valor al del entera ms prximo. Por ejemplo, si la ecuacin (3.5) da un valor de 4.7, Minitab
tomada 4 grados de libertad y Excel tomara S.

EJEMPLO 3.3.3
Los datos de la siguiente tabla proporcionan la concentracin de tiol (mM) en el Iisado snguineo de dos grupos de vqluntarios, siendo el primer grupo normal y el segundo sufriendo artritis reumatoide.
\
\

Normal
Reumatoide

1:84,
2.81,

1.92,
4.06,

1.94,
3.62,

1.92,
3.27,

1.85,
3.27,

1.91,
3.76

2.07

(Banford, J. C., Brown, D. H., McConnell, A. A., McNeil, C. J., Smith, W. E., Hazelton R. A.
and Sturrock, R. D. 1983. Analyst 107:195)
La hiptesis nula adoptada es que la concentracin media de tiol es la misma para los dos
grupos.

49

El lector puede comprobar que:

n1 = 7

Xl = 1.921

s,

n = 6

X2

52 = 0.440

3.465

0.076

Sustituyendo en la ecuacin (3.4) resulta / = - 8.48 Yde la ecuacin (3.5) se obtiene 5.3,
que es redondeado a 5. El valor crtico es /5 = 4.03 (P = 0.01), de manera que se rechaza
la hiptesis nula: existe suficiente evidencia para decir que la concentracin media de tiol
difiere entre los grupos.
El resultado de realizar este clculo utilizando Minitab (donde la opcin por defecto es
el contraste sin varianza conjunta) se muestra a continuacin.
Two sam,ple t-test and confidence interval
Two samp.le T for Normal vs Rheumatoid
N

Hean

StDev

SE Mean

Normal

1.9214

Ov0756

0.029

Rheumato

3.465

0.440

0.18

95% eI for mu Normal - mu Rheumato: (-2.012, -1.08)


T-Test mu Normal = mu Rheumato (vs not =) : T= -8.48
p= 0.0004 DF = 5

Esto confirma los valores anteriores y tambin proporciona la informacin de que


RI /1 > 8.48) = 0.0004. Esta probabilidad es extremadamente baja: el resultado es de hecho
significativo al nivel P = 0.001.

3.4.

El contraste t para datos emparejados

A menudo se compararan dos mtodos de anlisis estudiando muestras de


ensayo que contienen sustancialmente diferentes cantidades de anahto. Por
ejemplo, la Tabla 3.1 proporciona los resultados de la determinacin de la
concentracin de paracetamol (% m/m) en pastillas por dos mtodos diferentes. Se analizaron diez pastillas de diez lotes diferentes para ver si diferan
los resultados obtenidos por los dos mtodos.
Como siempre existe variacin entre las medidas debida al error aleatorio
de la medida. Adems, las diferencias entre las tabletas y entre los mtodos
pueden contribuir tambin a la variacin entre las medidas. Esto ltimo es
lo que interesa en este ejemplo: se desea saber si los mtodos producen resultados significativamente diferentes. El contraste para comparar dos medias (Seccin 3.3) no es apropiado en este caso porque no separa la variacin
debida al mtodo de la que resulta de la variacin entre las pastillas: se dice
que los dos efectos se confunden. Esta dificultad se soslaya observando la
diferencia, d, entre cada par de resultados dados por los dos mtodos. Si no
existen diferencias entre los dos mtodos, entonces estas diferencias se obtienen de una poblacin con media {td = O. Para probar la hiptesis nula, se
prueba si d difiere significativamente de cero utilizando el estadstico t.

50

Tabla 3.1.

Ejemplo de datos emparejados.

Lote

Ensayo espectromtrico UV

Espectroscopia de reflectancia
en el infrarrojo cercano

8463
8438
8408
84.41
83.82
83.55
83.92
83.69
8406
84.03

83.15
8:3.72
83.84
84.20
83.92
8416
84.02
83.60
84.13
84.24

1
2
3
4
5
6
7
8
9

10

(Trafford, A. D., Jee, R. D, Moffat, A. C. and Graham, P 1999. Analys/124:163.)

Para contrastar si n resultados emparejados se extraen de la misma poblacin, es decir, Hu: {id = O, se calcula el estadstico t:
(3.6)
donde J y Sd son la media y desviacin estndar, respectivamente, de
el, la diferencia entre los valores que forman cada par.
El nmero de grados de l1bertad de t es n-l.

EJEMPLO 3.4.1
Contrstese si existe diferencia significativa entre los resultados obtenidos por los dos m
todos de la Tabla 3.1.
Las diferencias entre los pares de valores (restando el segundo valor del primero) son:
+1.48,

+0.66,

+0.24,

+0.21,

-0.10,

0.09,

-0.07,

-- 0.21

-0.61,

- 0.10,

Estos valores tienen media, d = 0.159 Ydesviacin estndar, Sd = 0.570. Sustituyendo en


la ecuacin (3.6), con n = 10, el valor de 1= 0.88. El valor crtico es Ig = 2.26 (P = 0.05).
Puesto que el valor calculado de 111 es menor que ste, no se rechaza la hiptesis nula: los
mtodos no proporcionan resultados significativamente diferentes para la concentracin de
paracetamol.
De nuevo este clculo se puede realizar con computadora, dando el resultado que
~ 0.882) = 0040. Ya que esta probabilidad es mayor que 0.05, se llega a las mismas
conclusiones: los dos mtodos no difieren significativamente al nivel P = 0.05.

111 ~

Los contrastes por parejas descritos anteriormente no requieren que las precisiones de los dos mtodos sean iguales, sino que suponen que las diferencias, d, estn distribuidas normalmente. En efecto, esto exige que cada
conjunto de medidas se distribuya normalmente y que la precisin y sesgo

-(si acaso) de cada mtodo sean constantes en el intervalo de valores en que


se realizaron las medidas. Los datos pueden constar de medidas individuales,
como en el Ejemplo 3.4.1, o de medias de medidas repetidas. Sin embargo,
es necesario que se realice el mismo nmero de medidas sobre cada muestra
por el primer mtodo y anlogamente por el segundo mtodo: es decir, n medidas de cada muestra por el mtodo 1 y m por el mtodo 2, donde m y n no
tienen porque ser iguales.
Hay diferentes circunstancias por las cuales puede ser necesario o deseable disear un experimento, de manera que cada muestra sea analizada por
cada uno de los dos mtodos, proporcionando resultados que estn emparejados de forma natural. Algunos ejemplos son:
1.
2.

3.

La cantidad de muestra disponible a examen es suficiente para slo una


determinacin por cada mtodo.
Las muestras a examen pueden presentarse durante un extenso perodo
de tiempo por lo que es necesario eliminar los efectos de las variaciones
en condiciones ambientales como temperatura, presin, etc.
Los mtodos se van a comparar utilizando una amplia variedad de muestras de diferente procedencia y posiblemente con concentraciones muy
distintas (vase el prximo prrafo).

Ya que los mtodos analticos se aplican habitualmente sobre un amplio


intervalo de concentraciones, a menudo se compara un mtodo nuevo con
otro estndar mediante el anlisis de muestras donde la concentracin del
analito puede variar a lo largo de varias potencias de diez. En este caso es
inadecuado utilizar el contraste t por parejas ya que su validez se apoya en
el supuesto de que cualquier error, ya sea aleatorio o sistemtico, es independiente de la concentracin. Este supuesto puede no ser cierto cuando se manejan amplios intervalos de concentracin. Un mtodo alternativo en dichos
casos es la regresin lineal (vase la Seccin 5.9) aunque esta aproximacin
tambin presenta dificultades.

3.5.

Contrastes de una y dos colas

Los mtodos que se han analizado hasta el momento en este captulo se refieren al contraste de la diferencia entre dos medias en cualquier direccin.
Por ejemplo, el mtodo descrito en la Seccin 3.2 contrasta si existe diferencia significativa entre el resultado experimental y el valor conocido para el
material de referencia, sin tener en cuenta el signo de la diferencia. En muchas situaciones de este tipo el analista no tiene una idea preconcebida, previa a las mediciones experimentales, en cuanto a si la diferencia entre la
media experimental y el valor de referencia ser positiva o negativa. As
pues, el contraste utilizado debe cubrir cualquier posibilidad. Dicho contraste se denomina de dos colas (o bilateral). Sin embargo, en algunos casos,
puede ser apropiado otro tipo de contraste diferente. Considrese, por ejemplo, un experimento en el que se espera aumentar la velocidad de reaccin
aadiendo un catalizador. En este caso, es evidente que antes de empezar el
experimento el nico resultado que interesa es si la nueva velocidad es
mayor que la anterior y, por tanto, slo es necesario contrastar un aumento.

51

52

Este tipo de contraste se llama de una cola (o unilateral). Para un valor


dado de n y un nivel de probabilidad concreto, el valor crtico para un contraste unilateral difiere del de un contraste bilateral. En una prueba unilateral para un incremento, el valor crtico de t (en lugar de ItI) para P = 0.05
es aquel que es superado con una probabilidad deIS %. Puesto que la distribucin muestral de la media se supone que es simtrica, esta probabilidad es
el doble de la probabilidad que es relevante en el contraste bilateral. De esta
forma para encontrar el valor adecuado para el contraste de una cola se busca en la columna de P = 0.10 en la Tabla A.2. De manera similar, para un
contraste de una cola al nivel P = 0.01, se emplea la columna 0.02. Si se
tratase de una disminucin, el valor crtico de t ser de la misma magnitud
pero con signo negativo. Si el contraste se lleva a cabo con la computadora,
ser necesario indicar si se requiere un contraste uni o bilateral.
EJEMPLO 3.5.1
Se sospecha que un mtodo de valoracin cido-base tiene un error de indicador significativo y. por tanto, tiende a dar resultados con un error sistemtico positivo (es decir, sesgo
positivo). Para comprobar esto se utiliza una disolucin exactamente 0.1 M de cido para
valorar 25.00 mi de otra disolucin exactamente 0.1 M de una bas, con los siguientes
resultados (mi):
25.06

25.18

24.8725.51

25.34

25.41

Contrastar la existencia de sesgo positivo en estos resultados.


De estos datos se tiene:
media = 25.228 mi; desviacin estndar = 0.238 mi
Adoptando la hiptesis nula de que no hay ningn sesgo, es decir, Ha: JI = 25.00, utilizando
la Ecuacin (3.1) resulta:
/ = (25.228 - 25.00) x ,;6/0.238 = 2.35

De la Tabla A.2 el valor crtico es /5 = 2.02 (P = 0.05, contraste de una cola). Puesto que
el valor observado de / es mayor que ste se rechaza la hiptesis nula y hay evidencia de
sesgo positivo.
Utilizando una computadora resulta que 11/ ~ 2.35) = 0.033. Ya que este valor es menor que 0.05, el resultado es, como antes, significativo al nivel P = 0.05.

Es interesante observar que si en el ejemplo anterior se hubiera hecho un


contraste de dos colas (para el que el valor crtico de t s = 2.57), ino se habra
rechazado la hiptesis nula! La explicacin de este hecho, aparentemente
contradictorio, reside en que la decisin de realizar un contraste de una o
dos colas depende del grado de conocimiento previo, ya que en este caso se
sospechaba o esperaba sesgo positivo. Obviamente es esencial que la decisin
sobre si el contraste es de una o dos colas se tome antes de realizar el experimento, y no despus, cuando los resultados podran prejuzgar la eleccin.
En general se encontrarn ms situaciones en las que se empleen contrastes
de dos colas que de una cola. Se identificarn con facilidad aquellas circunstancias relativamente raras en las que sea necesario emplear contrastes de
una cola.

3.6.

53

El contraste F para la comparacin


de desviaciones estndar

Los contrastes de significacin descritos hasta ahora se utilizan para comparar medias y, por tanto, para detectar errores sistemticos. En muchos casos
es tambin importante comparar las desviaciones estndar, es decir, los errores aleatorios de dos conjuntos de datos. Esta comparacin, como en el caso
de los contrastes de medias, puede tomar dos formas. Se puede pretender
probar si el Mtodo A es ms preciso que el Mtodo B (es decir, un contraste
de una cola) o si los Mtodos A y B difieren en su precisin (es decir, un
contraste de dos colas). Por ejemplo, si quisiramos contrastar si un mtodo
analtico nuevo es ms preciso que un mtodo patrn deberamos utilizar el
contraste de una cola: si quisiramos contrastar si dos desviaciones estndar
difieren significativamente (por ejemplo, antes de aplicar el contraste t; vase
la Seccin 3.3 anterior) sera adecuado un contraste de dos colas.
El contraste F considera la razn de las dos varianzas muestrales, es
decir, la razn de los cuadrados de las desviaciones estndar, 5f/51.
Para probar si es significativa la diferencia entre dos varianzas muestrales, esto es, para probar Hu: T = CT2, se calcula el estadstico F:

. = "12/S22

}~

donde 1 Y 2 se disponen en la ecuacin de modo que F sea siempre

(3.7)
~

1.

El nmero ele grados de libertad del numerador y denominador son


/11 1 Y /12 - 2, respectivamente.
El contraste supone que las poblaciones de donde se extraen las
muestras son normales.
Si la hiptesis nula es verdadera entonces la relacin de varianzas debera ser
prxima a 1. Las diferencias respecto de 1 se deben a variaciones aleatorias,
pero si la diferencia es demasiado grande no se podr achacar a esta causa. Si
el valor calculado de F supera un cierto valor crtico (obtenido de las tablas)
entonces se rechaza la hiptesis nula. Este valor crtico ele F depende del tamao de las dos muestras, elel ivel de significacin y del tipo de contraste
realizado. Los valores para P = 0.05 vienen dados en el Apndice 2 de la Tabla A.3 para un contraste de una cola y en la Tabla A.4 para un contraste de
dos colas; el uso de estas tablas se aclara en los siguientes ejemplos.

EJEMPLO 3.6.1
Se compar un mtodo propuesto para la determinacin de la demanda qumica de oxgeno
en aguas residuales con otro mtodo patrn (sales de mercurio). Los siguientes resultados
fueron obtenidos para una muestra de aguas residuales:

Media (mg r
Mtodo patrn
Mtodo propuesto

72

72

/)

Desvin estndar (mg r 1)


3.31
1.51

54

Para cada mtodo se realizaron ocho determinaciones.


(Ballinger, D., L1oyd, A. and Morrish, A. 1982. Ana~st 107:1047)
Es la precisin del mtodo propuesto significativamente ms grande que la del mtodo
estndar?
Se debe decidir si la varianza del mtodo patrn es significativamente mayor que la del
mtodo propuesto. Fviene dado por la razn de varianzas:
3.31 2
F= 1.51 2 = 4.8
Este es el caso donde se debe utilizar el contraste de una cola, ya que slo nos interesa
si el mtodo propuesto es ms preciso que el mtodo patrn. En la Tabla A.3 el nmero
de grados de libertad del denominador viene dado en la columna de la izquierda y el nmero de grados de libertad del numerador en la parte superior. Las dos muestras contienen
ocho valores, por tanto el nmero de grados de libertad es 7 en cada caso. El valor crtico
de es 07 = 3.787 (P= 0.05), donde los subndices indican el nmero de grados de libertad del numerador y denominador, respectivamente. Ya que el valor calculado de F (4.8)
excede a ste, la varianza del mtodo patrn es significativamente mayor que la del mtodo
propuesto a un nivel de probabilidad del 5%, es decir, el mtodo propuesto es ms preciso.

EJEMPLO 3.6.2
En el Ejemplo 3.3.1 se supuso que las varianzas de los dos mtodos para determinar cromo
en hierba de centeno no diferan significativamente. Este supuesto se puede contrastar ahora. Las desviaciones estndar eran 0.28 y 0.31 (cada una obtenida de cinco medidas de un
ejemplar de una planta determinada). Calculando Fde forma que sea mayor que 1, se tiene:
0.31 2 ,
F=-=
1.23
0.28 2
Sin embargo en este caso, no hay, de antemano, ninguna razn para esperar que la varianza de un mtodo deba ser mayor que la del otro, resultando por ello adecuado un contraste de dos colas. Los valores crticos que proporciona la Tabla A.3 son los valores que
F supera con una probabilidad de 0.05, suponiendo que tienen que ser mayores que 1. En
un contraste de dos colas, la razn entre una varianza y otra podra ser mayor o menor que
1, pero si F se calcula de manera que sea siempre mayor que 1, entonces la probabilidad
de que supere el valor crtico dado en la Tabla A.3 ser el doble. Por ello, estos valores
crticos no son apropiados para un contraste de dos colas y en su lugar se emplea la Tabla
A.4. De esta tabla, tomando 4 como el nmero de grados de libertad de numerador y denominador, el valor crtico es ~.4 = 9.605. El valor calculado es menor que ste, por tanto
no hay diferencia significativa entre las dos varianzas a un nivel del 5%.

Como en el caso del contraste t, se pueden emplear otros niveles de significacin en el contraste F y los valores criticas se encuentran en las tablas
listadas en la bibliografa al final del Capitulo 1. Hay que tener cuidado en
la eleccin de la Tabla correcta dependiendo de si es un contraste de una o
dos colas: para un ti. % de nivel de significacin, se utilizan los 2t1. % puntos
de la distribucin F para un contraste de una cola, mientras que para un
contraste de dos colas se utilizan los puntos ti. %. Si se utiliza una computadora ser posible obtener un valor de P. Hay que tener presente que Excel

slo lleva a cabo contraste F de una cola, siendo necesario introducir la


muestra con la varianza ms grande como primera muestra. Minitab no proporciona un contraste F para comparar las varianzas de dos muestras.

3.7.

Datos anmalos

Es muy frecuente encontrarse con la situacin en que uno (o posiblemente


ms) de los resultados que se obtienen de un conjunto de medidas difiera del
resto de forma inexplicable. Por esta razn estas medidas se denominan resultados anmalos <outliers). En algunos casos, un resultado anmalo puede atribuirse a un error humano. Por ejemplo, si se obtienen los siguientes
resultados en una valoracin:
12.12,

12.15,

12.13,

13.14,

12.12 mI

entonces es casi seguro que el cuarto valor corresponda a un error en la escritura y que debera leerse 12.14. Sin embargo, incluso cuando los datos que
son obviamente errneos hayan sido eliminados o corregidos, todava quedan datos que pudieran ser anmalos. Deberamos conservarlos, o deberamos buscar algn procedimiento para comprobar estadsticamente si deben
ser rechazados o no? Obviamente, los valores finales de la media y la desviacin estndar dependern de si los datos anmalos han sido rechazados o no.
Puesto que la discusin sobre la precisin y la exactitud de un mtodo depende de estos valores finales, tiene que quedar claro siempre si los datos
anmalos han sido rechazados y, si es as, por qu.
El contraste de Dixon (a veces llamado contraste Q) es un contraste
popular para datos anmalos debido a que el clculo es simple. Para pequeas muestras (tamaos de 3 a 7) el contraste evala una medida sospechosa
comparando la diferencia entre ella y la medida ms prxima en tamao, con
el intervalo de las medidas. (Para muestras ms grandes la forma del contraste se modifica ligeramente. Al final del captulo se proporciona una referencia que contiene detalles adicionales.)
Para usar el contraste de Dixon para un valor anmalo, esto es, para
probar H o: todas las medidas proceden de la misma poblacin, se calcula el estadstico Q:
Ivalor sospechoso - valor ms cercanol
Q- (valor ms grande - valor ms pequeo)

(3.8)

Este contraste es vlido para tamaos de muestra de 3 a 7 y supone que


la poblacin es normal.
Los valores crticos de Q para P = 0.05 se encuentran en la Tabla A.5. Si el
valor de Q calculado supera el valor crtico, se rechaza el valor sospechoso.
Los valores dados son para un contraste de dos colas, el cual es apropiado
cuando no se conoce de antemano el extremo al que puede darse el valor
anmalo.

55

56

EJEMPLO 3.7.1
Se obtuvieron los siguientes valores para la concentracin de nitrito (mg 1- 1) en una muestra de agua de ro:
0.403,

0.410,

0.401,

0.380

La ltima medida es sospechosa, debera ser rechazada?


Se tiene que:
Q= 10.380 - 0.4011/(0.410 - 0.380)

= 0.021/0.03 = 0.7

De la Tabla A.5, para un tamao de muestra de 4, el valor crtico de la Qes 0.831 (f = 0.05).
Ya que el valor calculado de la Q no lo supera, debe aceptarse que la medida sospechosa
no es una observacin anmala.
En una situacin ideal, habra que tomar nuevas medidas cuando aparezca
un valor sospechoso, especialmente si inicialmente slo se han tomado unos
pocos valores. Esto puede aclarar si debera rechazarse o no el valor sospechoso, y si se mantuviera, tambin reducira en cierta medida su efecto sobre
la media y la desviacin estndar.

E,IEMPLO 3.7.2
Si se aaden tres nuevas medidas a las dadas en el ejemplo anterior, quedara:
0.403,

0.410,

0.401,

0.380,

0.400,

0.413,

0.411

Se debera an mantener 0.380?


El valor de la Q calculado es ahora:
Q= 10.380 - 0.4001/0.413 - 0.380) = 0.606

El valor crtico de la Q para un tamao muestral 7 es 0.570, por lo que se rechaza que la
medida sospechosa no sea anmala al nivel de significacin del 5%.
Otro contraste utilizado frecuentemente para datos anmalos es el contraste
de Grubbs, que compara la desviacin entre el valor sospechoso y la media
muestral, con la desviacin estndar de la muestra. Este contraste lo recomienda ISO preferentemente al de Dixon.
Para usar el contraste de Grubbs para un valor anmalo, esto es, para
probar H o: todas las medidas proceden de la misma poblacin, se calcula el estadstico G:
G = valor sospechoso -

~~I/s

donde s se calcula incluyendo el valor sospechoso.


El contraste supone que la poblacin es normal.

(3.9)

Los valores criticas de G para P = 0.05 se encuentran en la Tabla A.6. Si el


valor de G calcu18do supera al valor critico, se rechaza la hiptesis ele que el
dato sospechoso no es anmalo.

EJEMPLO 3.7.3
Aplicar el contraste de Grubbs a los datos del ejemplo anterior.
Los siete valores tienen

x= 0.4026 Y s = 0.01121
G= 10.380 - 0.40261/0.01121

2.016

El valor crtico (P = 0.05) es 2.02. A diferencia del contraste de Dixon, el valor sospechoso
0.380 no se rechaza~ estos resultados contradictorios no son infrecuentes en contrastes de
datos anmalos.

Es importante tener en cuenta que para un nivel de significacin del 5 % hay


todava un 5 % de riesgo, o 1 de cada 20, de rechazar incorrectamente el
valor sospechoso. Esto puede tener un efecto considerable a la hora de estimar la precisin de un experimento. Por ejemplo, para los 7 valores ele la
concentracin de nitrito dados nterionnente, la desviacin estndar es
0.0112 mgl . 1, pero cuando se rechaza el valor sospechoso la desviacin estndar se convierte en 0.0056 mgl- t, es decir, la precisin parece haber mejorado en un factor de 2.
El ejemplo anterior aclara la importancia de ser C3utO 31 rechazar elatos
anmalos. Cuando las medidas se repiten slo unu:j pOC~IS veces (Jo que es
normal en un trabajo analtico), el rechazo de un vnlor origina una gran variacin sobre la media y sobre la dcsviacin eslncLlr. En concreto, d hecho
de tomar tres medidas y rechazar la que difiere ms de las otras dos debe
evitarse. Se puede demostrar que se obtiene una estimacin ms fiable de la
media, en promedio, utilizando el valor que est en medio de los tres que
utilizando la media de los dos que no fueron rechazados.
Si un conjunto de datos contiene dos o ms resultados sospechosos, al
decidir si se justifica el rechazo, surgen otras complicaciones. La Figura 3.1
ilustra en forma de diagrama de puntos dos ejemplos de tales dificultades.
En la Figura 3.1 (a) hay dos resultados (2.9 y 3.1), los cuales son altamente
sospechosos al compararlos con la media de los datos, incluso si Q fuese calculado de forma no crtica utilizando la ecuacin (3.8) se obtendra:

= 0.18

Q = (31 - 2.9)/(3.1 - 2)
a

:1
20
2.2
2.4

I
X,

I
26

1.1
2.8
3.0

I
Xn

Figura 3.1. Diagrama de puntos para ilustrar el problema del manejo de datos anmalos
(a) cuando existen dos datos sospechosos en el extremo superior de los datos de la muestra;
y (b) cuando existen dos datos sospechosos uno en cada extremo de los datos.

57

58

valor que no es significativo (P = 0.05). Claramente el posible valor anmalo


3.1 ha sido enmascarado por el otro valor anmalo posible, 2.9, dando un
valor de Q pequeo. Una situacin diferente se muestra en la Figura 3.1 (b),
donde los dos datos sospechosos estn en lugares opuestos del conjunto de
datos. Esto trae consigo un valor grande para el intervalo. Como resultado Q
es pequeo y, por tanto, no significativo. Las extensiones del contraste de
Grubbs proporcionan contrastes para parejas de datos anmalos. Entre las
referencias al final de este captulo se pueden encontrar detalles adicionales
relacionados con datos anmalos mltiples.
Los contrastes de datos anmalos descritos anteriormente suponen que
[as muestras proceden de una distribucin normal. Es importante sealar
que un resultado que parece ser un valor anmalo suponiendo una poblacin
con distribucin normal, puede que no sea un valor anmalo si la muestra
procede realmente de (por ejemplo) una distribucin lag-normal (Seccin
2.3). Por tanto, los contrastes descritos no se deberan emplear si se sospecha
que la poblacin pueda no tener una distribucin normal. Esta dificultad,
junto con otras que surgen en el caso de datos anmalos mltiples, explican
el uso creciente de los mtodos estadsticos no paramtricos y robustos descritos en el Captulo 6. Estos ltimos son insensibles a datos extremos, o al
menos tienen poco peso en los clculos, evitndose el problema de si se rechazan o no los datos anmalos.

3.8.

Anlisis de la varianza

En la Seccin 3.3 se describi un mtodo para comparar dos medias y contrastar si diferan significativamente. En el trabajo analtico se suelen presentar a menudo comparaciones en las que intervienen ms de dos medias.
Algunas situaciones posibles de estE; tipo son: comparar la concentracin media de protena en solucin para muestras almacenadas en condiciones diferentes; comparar los resultados medios obtenidos de la concentracin de un
analito utilizando diferentes mtodos; y comparar la media de los resultados
en una valoracin obtenidos por diferentes operadores usando los mismos
aparatos. En todos estos ejemplos hay dos posibles fuentes de variacin. La
primera, que siempre est presente, es debida al error aleatorio en la medida.
Esto se discuti con detalle en el captulo anterior: este tipo de error provoca
el que se obtenga un resultado diferente, cada vez que se repite una medida
bajo las mismas condiciones. La segunda fuente de variacin posible se debe
a lo que se conoce como factor controlado o de efecto fijo. Para los ejemplos anteriores los factores de control son, respectivamente, las condiciones
bajo las cuales se almacen la disolucin, el mtodo de anlisis empleado, y
los operadores que realizaron la valoracin. El anlisis de la varianza (abreviado con frecuencia como ANOVA) es una tcnica estadstica muy potente
que se utiliza para separar y estimar las diferentes causas de variacin. Para
los ejemplos concretos anteriores, se puede utilizar para separar la variacin
debida al error aleatorio de cualquier otra variacin que venga provocada al
cambiar el factor de control. De este modo se puede contrastar si una alteracin del factor de control conduce a diferencias significativas entre los valores medios obtenidos.

Tambin se pueden emplear las tcnicas ANOVA en situaciones donde


hay ms de una fuente de variacin aleatoria. Por ejemplo, considrese la
pureza del cloruro sdico contenido en un barril. Las muestras se toman,
elegidas al azar, de diferentes partes del barril, y se realizan anlisis repetidos
de las muestras. Adems del error aleatorio en la medida de la pureza, habr
tambin diferencias en la pureza de las muestras tomadas de distintas partes
del barril. Puesto que las muestras se eligieron al azar, esta variacin ser
aleatoria y a veces se conoce como factor de efecto aleatorio. Nuevamente,
se puede utilizar ANOVA para separar y estimar las fuentes de variacin.
Ambos tipos de anlisis estadsticos descritos anteriormente, es decir, donde
hay un factor, ya sea controlado o aleatorio, adems del error aleatorio de
las medidas, se conocen como ANOVA de un factor. Los procedimientos
aritmticos son similares en los casos del factor de efecto fijo y aleatorio:
ejemplos del primer caso se presentan en este captulo y del segundo en el
prximo, donde el muestreo se trata con ms detalle. Situaciones ms complejas en las que existen dos o ms factores, posiblemente interactuando entre s, se consideran en el Captulo 7.

3.9. Comparacin de varias medias


La Tabla 3.2 muestra los resultados obtenidos en una investigacin sobre la
estabilidad de un reactivo fluorescente bajo diferentes condiciones de almacenamiento. Los valores proporcionados son las seales de fluorescencia (en
unidades arbitrarias) de disoluciones diluidas de la misma concentracin. Se
tomaron tres medidas sbre cada muestra. La tabla muestra que los valores
medios de las cuatro muestras son diferentes. Sin embargo, se sabe que debido al error aleatorio, incluso si el valor verdadero que se quiere medir no
ha variado, la media muestral puede variar de una muestra a otra. El mtodo ANOVA contrasta si la diferencia entre las medias muestrales es demasiado grande para explicarse mediante errores aleatorios.
La Figura 3.2 muestra un diagrama de puntos comparando los resultados
obtenidos en diferentes condiciones. Esto sugiere que existe poca diferencia
entre las condiciones A y B, si bien las condiciones de C y D difieren de las
de A y B Y entre s.
El problema se puede generalizar al caso de considerar h muestras, cada
una con n elementos, como se expone en la Tabla 3.3 donde xii es laj-sima
medida de la i-sima muestra. Las medias de las muestras son Xl' X;2, oo., XII y
la media de todos los valores agrupados juntos es X. La hiptesis nula adop-

Tabla 3.2.

Fluorescencia de disoluciones almacenadas en diferentes condiciones.

Condiciones
A:
B:
C:
D:

preparada recientemente
almacenada una hora en la oscuridad
almacenada una hora con luz tenue
almacenada una hora con luz brillante

Medidas repetidas

Media

102, 100, 101


101, 101, 104
97,95, 99
90,92, 94

101
102
97
92

Media global: 98

59

105

60

100

95

90 '-'------>--------'----BCD
A
Condiciones

Figura 3.2.

Diagrama de puntos de los resultados de la Tabla 3.2.

Tabla 3.3.

Generalizacin de la Tabla 3.2.


Media

Muestra 1

X11

X12 '"

x, ... x1n

X,

Muestra 2

X21

X22 ...

"2'" x2n

"2.

Muestra i

x~

Muestra h

xlTI

x,e ... X ... X(

Xi

x!12 ...

XII

XII; ... Xlln

Media global

=x

tada es que todas las muestras se extraen de una poblacin con media J1 y
varianza o"~. Bajo esta hiptesis, ()~ se puede estimar de dos formas, una estudia la variacin dentro de muestras y la otra la variacin entre muestras.
1.

Variacin dentro de muestras


Para cada muestra se puede calcular una varianza utilizando la frmula:

L (Xi -

"'7)2/(n - 1) [vase la ecuacin (2.2)J

Usando los valores de la Tabla 3.2 se tiene:


Varianza de la Muestra A =

Varianza de la Muestra B =

(102 -101)2 + (100 -101)2 + (101 -101)2

3-1

=1

(101-102)2+ (101-102)2+ (104-102)2


(3 _})
= 3

De manera similar se puede demostrar que las muestras e y D tienen


ambas varianzas de 4.
Promediando estos valores resulta:
Estimacin dentro de muestras de O"~

(1 + 3 + 4 + 4) /4 = 3

Esta estimacin tiene 8 grados de libertad: la estimacin de cada muestra


tiene 2 grados de libertad y hay 4 muestras. Consttese el hecho de que
esta estimacin no depende de las medias de las muestras: por ejemplo,
si todas las medidas de la muestra A se incrementarn en 4 unidades,
no variara la estimacin de 0"5.
La frmula general para la estimacin de 0"6 dentro de muestras es:
Estimacin dentro de muestras de

xY /h(n ~ 1)

0"6 = I I (xij ,.

(3.10)

El sumatorio sobre j y la divisin por (n - 1) proporcona varianza de


cada muestra; el sumatorio sobre i y la divisin por h promedia estas
varianzas muestrales. La expresin de la ecuacin (3.10) se denomina
un cuadrado medio (CM), puesto que conlleva una suma de trminos
cuadrticos (SC) dividida por el nmero de grados de libertad. Ya que en
este caso el nmero de grados de libertad es 8 y el cuadrado medio es 3,
la suma de los trminos cuadrticos es 3 x 8 = 24.

2.

Variacin entre muestras


Si todas las muestras se extraen de una poblacin cuya varianza es O"f,
entonces sus medias proceden de una poblacin con varianza 0"6/n (vase la distribucin muestra1 de la media, Seccin 2.5). As pues, si la hiptesis nula es verdadera, la varianza de las medias de las muestras
proporciona una estimacin de O"Un. De la Tabla 3.2:
Varianza de la media muestral

(101 - 98)2 + (102- 98)Z + (97 - 98)2 + (92 - 98)2


(4 - 1)
62/3

De manera que la estimacin de 0"6 es (!3j) x 3 = 62. Esta estimacin tiene


3 grados de libertad ya que se ha calculado a partir de cuatro medias muestrales. Ntese que esta estimacin de 0"6 no depende de la variabilidad dentro de cada muestra, ya que se calcula a partir de medias muestra1es.
Sin embargo si, por ejemplo, la media de la muestra D cambiase, entonces esta estimacin de 0"6 tambin cambiara.
En general se tiene:
Estimacin de

0"5

entre muestras

(X,. - x)2/(h - 1) (3.11)

que al ser un cuadrado medio supone dividir una suma de trminos


cuadrticos entre el nmero de grados de libertad. En este caso el nmero de grados de libertad es 3 y el cuadrado medio 62, por lo que la suma
de los trminos cuadrticos es 3 x 62 = 186.
Resumiendo los clculos realizados hasta aqu:
Cuadrado medio dentro de las muestras
Cuadrado medio entre muestras

3 con 8 g.l.

62 con 3 g.l.

Si la hiptesis nula es correcta, estas dos estimaciones de 0"5 no deberan diferir significativamente. Si es incorrecta, la estimacin entre muestras de 0"6
ser mayor que la estimacin dentro de las muestras debido a la variacin

61

62

entre muestras. Para contrastar si la estimacin entre muestras es significativamente ms grande se utiliza un contraste F de una cola (Seccin 3.6):
F = 62/3 = 20.7

(Recurdese que se utiliza cada cuadrado medio, de ah que no sea necesario


elevar al cuadrado posteriormente.) De la Tabla A.3 el valor crtico de F es
4.066 (P = 0.05). Puesto que el valor calculado de F es mayor que ste, se
rechaza la hiptesis nula: las medias muestrales difieren significativamente. '
Un resultado significativo en un ANOVA de un factor se puede alcanzar
por varias razones diferentes: por ejemplo, que una media pueda diferir de
todas las dems, que todas las medias puedan diferir entre s, que las medias
puedan estar en dos grupos distintos, etc. Una forma sencilla para explicar
un resultado significativo es colocar las medias en orden creciente y comparar la diferencia entre los valores adyacentes con una cantidad llamada la
mnima diferencia significativa. Esta viene dada por:
s

j('Jj

tllCn -

1)

donde s es la estimacin dentro de muestras de 0"0 y h(n - 1) es el nmero


de grados de libertad de esta estimacin. Para el ejemplo anterior, las medias
muestrales ordenadas en orden creciente de tamao son:

Xv = 92

Xc = 97

= 101

= 102

J3

x j2i3 x 2.306 (P = 0.05), danYla mnima diferencia significativa es


do 3.26. Al comparar este valor con las diferencias entre las medias, sugiere
que las condiciones de D y e dan resultados que difieren significativamente
entre s y tambin difieren de los resultados obtenidos en las condiciones A
y B. Sin embargo, los resultados obtenidos en las condiciones A y B no difieren significativamente entre s. Esto confirma lo que se sugiri mediante
el diagrama de puntos de la Figura 3.2 e indica que lo que afecta a la fluorescencia es la exposicin a la luz.
El mtodo de la mnima diferencia significativa descrito anteriormente
no es totalmente riguroso: se demuestra que conduce a demasiadas diferencias significativas. Sin embargo, es un contraste de ejecucin simple cuando
el ANOVA indica que hay diferencias significativas entre las medias. Otros
mtodos ms rigurosos se describen en la bibliografa al final de este captulo.

3.10.

La aritmtica de los clculos ANOVA

En el clculo ANOVA anterior se estim 0"6 de dos formas distintas. Si la


hiptesis nula fuese verdadera, O"~ tambin podra estimarse de una tercera
forma tratando los datos como si fuera una muestra grande. Esto implicara
sumar los cuadrados de las desviaciones a la media total:

L L (xij i

X)2

=
=

4 2 + 22 + 32 + 32 + 3 2 + 62 + 12 + 3 2 + 12 + 12 + 82 + 6 2 + 4 2
210

Y dividir por el nmero de grados de libertad, 12 - 1 = 11.

Este mtodo de estimar 11"6 no se utiliza en el anlisis debido a que la estimacin depende de las dos variaciones: dentro y entre muestras. Sin embargo, existe una relacin algebraica exacta entre esta variacin total y las
fuentes de variacin que contribuyen a ella. Esto, especialmente en los clculos ms complicados de ANOVA, conduce a una simplificacin del trabajo
aritmtico. En la Tabla 3.4 se muestra la relacin entre las fuentes de variacin y tambin se resumen las sumas de cuadrados y los grados de libertad .
. Se observar que los valores de la variacin total, dados en la ltima fila de
la tabla, son la suma de los valores de las dos primeras filas tanto para la
suma de cuadrados como para los grados de libertad. Esta propiedad aditiva
se mantiene para todos los clculos ANOVA descritos en este libro.
Tabla 3.4.

Resumen de sumas de cuadrados y grados de libertad.

Fuente de variacin

Suma de cuadrados

Grados de libertad

Entre muestras

n (x -

h- 1= 3

Dentro de muestras

(xli

Total

W= 186
X)2 = 24

tl...n-1)=8

W= 210

hn - 1 = 11

,(xli i

De la misma forma que en el clculo de la varianza, hay frmulas que


simplifican el clculo de las sumas de cuadrados individuales. Estas frmulas
se resumen a continuacin:
Un ANOV A de un factor contrasta la existencia de diferencias significativas entre medias cuando estn presentes ms de dos muestras. Las
frmulas utilizadas son:

Grados de libertad

Fuente de variacin
Entre muestras

Suma de cuadrados
T~/n - T?-/N

Dentro de muestras

por diferencia

por diferencia

Total

x7i i

T:/N

-~

N-l

donde N = nh = Nmero total de medidas.


T, = Suma de las medidas en la i-sima muestra.
T = Suma de todas las medidas, gran total.
El estadstico del contraste es F = Cuadrado medio entre muestras/Cuadrado medio dentro de muestras y el valor crtico es F 1, N J'
"
Estas formulas pueden ilustrarse repitiendo los clculos ANOVA para los
datos de la Tabla 3.2. Los clculos completos se exponen despus.
Para hacer ms claros los principios en los que se apoya el mtodo
ANOVA de un factor, los clculos se han descrito con detalle. En la prctica,
dichos clculos se hacen en una computadora. Tanto Minitab como Excel

63

64

EJEMPLO 3.10.1
Probar si las muestras de la Tabla 3.2 se han extraido de poblaciones con igual media.
El clculo de los cuadrados de la media se expone ms abajo. A todos los valores de la
Tabla 3.2 se les ha restado 100, lo que simplifica considerablemente la aritmtica. Ntese
que esto no afecta ni a la estimacin de la varianza entre muestras ni a la estimacin de
la varianza dentro de muestras, ya que se ha restado la misma cantidad de cada valor.
A
B

2
1
3
-10

O
1
- 5
-8

1
4
-1
-6

T;

T7

3
6
-9
-24

9
36
81
576

L T7 =

T = - 24

n = 3,

h = 4, N = 12,

L L ~. =

702

258

Fuente de variacin

Suma de cuadrados

Grados de /ibet1ad Cuadrado medio

Entre muestras
Dentro de muestras
Total

702/3 - (- 24)2/12 = 186


por diferencia = 24
258 - (- 24)2112 = 210
F= 62/3 = 20.7

3
8
11

186/3 = 62
24/8 = 3

El valor crtico ~.8 = 4.066 (P = 0.05). Ya que el valor calculado es mayor que ste se
rechaza la hiptesis nula: la media muestral difiere significativamente.'

tienen una opcin que realiza el ANOVA de un factor y, como ejemplo, la


salida proporcionada por Excel se muestra a continuacin, utilizando los valores originales.
Anova: de factor nico

RESUMEN
Grupos

Frecuencia Suma Promedio Varianza

303
306
291
276

101
102
97
92

1
3
4
4

Fuente de
SC
variacin
En tre grupos
186
Dentro de grupos 24

gl

CM

62
3

20.66667 0.0004

210

11

ANOVA

Total

Valor de P F crit

4.06618

En este captulo, se han establecido ciertos supuestos al realizar los clculos


de ANOVA. El primero consiste en que la varianza del error aleatorio no
est afectada por el tratamiento utilizado. Este supuesto est impHcito en la
combinacin de varianzas dentro de muestras para calcular una estimacin
global de la varianza del error. Al hacer esto, se est suponiendo lo que se
conoce como la homogeneidad de la varianza. En el ejemplo concreto expuesto anteriormente, donde se realizan todas las medidas de la misma manera, se esperara homogeneidad de la varianza. Entre las referencias que
aparecen al final de este captulo se proporcionan mtodos para comprobar
esta propiedad.
Un segundo supuesto consiste en que la variacin incontrolada es aleatoria. ste no sera el caso si, por ejemplo, existiera algn factor incontrolado,
tal como un cambio en la temperatura, que produjese una tendencia en los
resultados a lo largo de un perodo de tiempo. El efecto de tales factores incontrolados puede superarse en gran medida mediante tcnicas de aleatorizacin y de bloques que se analizan en el Captulo 7.
Se ver que una parte importante de ANOVA consiste en la aplicacin
del contraste F. El uso de este contraste (vase la Seccin 3.6) simplemente
para comparar las varianzas de dos muestras depende de si las muestras han
sido extraidas de una poblacin nmmal. Sin embargo, afortunadamente, el
contraste F cuando se aplic en ANOVA no es demasiado sensible a las desviaciones de la normalidad de la distribucin.

3.11.

El contraste chi-cuadrado

En los contrastes de significacin descritos hasta ahora en este captulo, los


datos han tomado la forma de observaciones que, aparte de cualquier redondeo, se han medido en una escala continua. En contraposicin, esta seccin
trata con frecuencias, es decir, el nmero de veces que ocurre un suceso dado.
Por ejemplo, la Tabla 2.2 proporciona las frecuencias de los diferentes valores obtenidos para la concentracin de ion nitrato cuando se realizaron 50
medidas en una muestra. Como se estudi en el Captulo 2, se supone que
estas medidas se extraen de una poblacin que se distribuye normalmente.
El contraste chi-cuadrado se podra utilizar para contrastar si las frecuencias observadas difieren significativamente de las que cabra esperar con esta
hiptesis nula.
Para probar si las frecuencias observadas, 0" concuerdan con las esperadas, E;, de acuerdo con alguna hiptesis nula, se calcula el estadstico X 2 :

(3.12)

Puesto que el clculo requerido para probar la normalidad utilizando este


estadstico es relativamente complicado, no ser descrito aqu. (Una referencia de un ejemplo ilustrativo desarrollado con detalle se proporciona al final
del captulo.) El principio del contraste chi-cuadrado se comprende mejor a
travs del siguiente ejemplo.

65

66

~. EJEMPLO 3.11.1

'1Iilil

A continuacin se muestra el nmero de roturas en el material de vidrio de cuatro trabajadores de un laboratorio a lo largo de un perodo de tiempo. Hay alguna evidencia de que
los trabajadores difieran en su habilidad?
Nmero de roturas:

24,

17,

11,

Adoptando como hiptesis nula que no hay diferencias en cuanto a su habilidad. Suponiendo que los trabajadores utilizan el laboratorio el mismo tiempo, se esperara, a partir de la
hiptesis nula, el mismo nmero de roturas por cada trabajador. Puesto que el nmero total
de roturas es 61, el nmero de roturas esperado por trabajador es 61/4 = 15.25. Obviamente, en la prctica no es posible que haya un nmero no entero de roturas: este nmero
corresponde a un concepto matemtico. La distribucin igual" ms prxima y manejable
desde un punto de vista prctico es 15, 15, 15, 16, en algn orden determinado. La pregunta a responder es si las diferencias entre las frecuencias observadas y esperadas es tan
grande que deba rechazarse la hiptesis nula. Considerando una serie de lanzamientos de
un dado se puede entender mejor el que existan ciertas diferencias entre los dos conjuntos
de frecuencias: sera muy sorprendente, por ejemplo, si en 30 lanzamientos aparecieran con
la misma frecuencia los nmeros 1, 2, 3, etc. El clculo de X2 , se muestra a continuacin.
Frecuencia observada, O

Frecuenc;8 esperada, E

O-.E

(O - Ej2/E

24
17
11

15.25
15.25
15.25
15.25

875
1.75
- 4.25
. .~ 6.25

5.020
0.201
1.184
2.561

9
Totales

61

X-

==

8.966

Ntese que el total de la columna O-E es siempre cero, con lo cual se dispone de una
forma til de verificar los clculos.
Si
supera un cierto valor crtico, se rechazada la hiptesis nula. El valor crtico depende, como en otros contrastes de significacin, del nivel de significacin del contraste y
del nmero de grados de libertad. El nmero de grados de libertad es, en un ejemplo de
este tipo. uno menos que el nmero de clases utilizadas, es decir, 4 - 1 = 3 en este caso.
Los valores crticos de
para P = 0.05 vienen dados en la Tabla A.7. Para 3 grados de
libertad, el valor crtico es 7.81. Puesto que el valor calculado es mayor que ste, se rechaza
la hiptesis nula a un nivel de significacin del 5% se ha encontrado evidencia de que los
trabajadores difieren significativamente en su habilidad.

xe

xe

El c<1Iculo de X~ sugiere que se obtenga un result8do significativo debido


al alto nmero de roturas realizadas por el primer trabajador. Para es tudior esto posteriormente, se pueden reo1izar otros contrastes chi-cuadrado
odicion8les. Uno de ellos contr8st8 si el segundo, tercero y cuarto trabajador
difieren signific8tiv81llente entre s: en este C8S0, cada frecuenci8 esperada es
(17 + 11 + 9)3. (Ntese el hecho de que el contraste t no puede aplicarse
8qU, ya que se manej8n frecuencias .Y no variables continuas.) Otros contrastes que permiten analizar si el primer trabajador difiere del resto, es tomar a los tres restantes como un grupo. En este caso hay dos clases: las roturas hechas por el primer trabajador con una frecuencia esperada de 15.25
y el total de roturas correspondiente a los otros tres: con u na frecuencia esperada de 15.25 x 3 = 45.75. En estos casos, donde hay slo dos grupos y,

-por tanto, un grado de libertad, se debe aplicar un ajuste conocido como la


correccin de Yates. Esto implica sustituir () - E por 10 - EI- 0.5. Por
ejemplo, si O - + E = -4.5, 10 - El = 4.5 Y 10 - El - 0.5 = 4. Estos contrastes adicionales se exponen como un ejercicio al final de este Captulo.
En general, el contraste chi-cuadrado debera utilizarse c.olamente si el
nmero total de observaciones es SO o ms y las frecuencias individuales esperadas no son menores que S. sta no es una regla rgida: al final del captulo se cita una referencia que profundiza en este punto. Otras aplicaciones
del contraste chi-cuadrado se describen tambin en esta referencia.

3.12.

El contraste de la normalidad
de una distribucin

Como se ha recalcado en este captulo, muchos contrastes estadsticos suponen que los datos utilizados proceden de una poblacin normal. En la seccin anterior se mencion un mtodo para contrastar este supuesto, utilizando
el contraste chi-cuadrado. Por desgracia, este mtodo slo se puede utilizar
si hay 50 o ms datos. En el trabajo experimental lo normal es tener pocos
datos. Una forma visual simple de comprobar si un grupo de datos procede
de una poblacin normal es representar una curva de frecuencias acumuladas en un papel grfico especial denominado papel de probabilidad normal. Este mtodo se explica mejor por medio de un ejemplo.

EJEMPLO 3.12.1
Utilizar papel de probabilidad normal para contrastar si los valores siguientes proceden de
una poblacin normal:
109,

89,

99,

99,

107.

111,

86,

74,

115,

107,

134,

113,

Tabla 3.5.

Datos para el ejemplo de papel de probabilidad normal.

Medida

Frecuencia acumulada

74
86
88
89
99
104
107
109
110
111
113
115
134

1
2

3
4

6
7
9
10
11
12
13
14
15

110,

88,

104

% de Frecuencia acumulada
6.25
12.50
18.75
25.00
37.50
43.75
56.25
62.50
68.75
75.00
81.25
87.50
93.75

La Tabla 3.5 muestra los datos ordenados en orden creciente. En la segunda columna apa
recen las frecuencias acumuladas en cada medida, es decir, el nmero de medidas menores

67

68

o iguales que dicha medida. La tercera columna recoge la frecuencia acumulada en porcentaje. Este porcentaje se ha calculado utilizando la formula:
% frecuencia acumulada = 100 x frecuencia acumulada I(n + 1)

donde n es el nmero total de medidas. (Se usa un divisor n + 1 en vez de n de manera


que el porcentaje frecuencia acumulada del 50% cae en la mitad de la serie de datos, en
este caso a la octava medida.) Si los datos proceden de una distribucin normal, la grfica
que representa la frecuencia acumulada frente a las medidas tendr forma de curva en S
como se muestra en la Figura 3.3.
El papel de probabilidad normal tiene una escala no lineal en el eje del porcentaje de
frecuencia acumulada, lo que convierte la curva en forma de S en una lnea recta. Los datos
de la tabla anterior, representados en dicho papel aparecen en la Figura 3.4: los puntos se
sitan aproximadamente sobre una lnea recta, confirmando la hiptesis que los datos proceden de una distribucin normal.
Minitab proporcionar directamente un diagrama de probabilidad normal. Existe la posibilidad de elegir tres algoritmos diferentes para calcular las frecuencias acumulativas de la
Tabla 3.5. El algoritmo anteriormente utilizado se conoce como el mtodo de Herd-Johnson.

Un mtodo para contrastar la normalidad es utilizar una cantidad que mida


cunto se aproximan los puntos representados en el papel de probabilidad
normal a una recta. El clculo de esta cantidad, el coeficiente de correlacin,
r, se describe en un captulo posterior (Seccin 5.3). Una referencia bibliogrfica para el uso de r al contrastar la normalidad se expone al final de este
captulo. Esta referencia tambin proporciona una perspectiva de los diferentes contrastes de normalidad. La Seccin 6.12 describe otro mtodo, el
mtodo de Kolmogorov-Smirnov, que, entre otras aplicaciones se puede
emplear para contrastar la normalidad. En esa seccin aparece un ejemplo
desarrollado.

3.13.

Conclusiones a partir de los contrastes


de significacin

En esta seccin se profundizar ms en 10 referente a las conclusiones que


se pueden extraer de un contraste de significacin. Como se explic en la
ro 100
TI

ro

::J

E
::J
U

ro
ro

50

Q)

::J
U

jg
Q)

TI
~
o

0......,,=-------------Medida

Figura 3.3.

La curva de frecuencias acumuladas de una distribucin normal.

69

99
98

'"
"3
'"
E

"O

::>

''""
e

'C:;
Ql

::>

Ql

"O

,p
o

95
90

80
70
60
50
40
30
20
10
5
2
1

()
O
::l
r-+
'"'1

01

Ul
r-+

ro

Ul

CL

ro

Ul
tOO
2.
-...

_.
_.

()

70

80

90

100 110

120 130

Medida

Figura 3.4.

Representacin de probabilidad normal para el ejemplo de la Seccin 3.12.

Seccin 3.2, un contraste de significacin, por ejemplo, al nivel P = 0.05 supone un riesgo deIS % de que se rechazar una hiptesis nula incluso aunque
sea verdadera. A este tipo de error se le denomina error de Tipo l. El riesgo
de tal error se puede reducir al alterar el nivel de significacin del contraste
a P = 0.01 o incluso a P = 0.001. Sin embargo, ste no es el nico tipo de
error posible: es posible tambin mantener una hiptesis nula aun cuando
sea falsa. Este es el denominado error de Tipo 11. Para calcular la probabilidad de este tipo de error es necesario postular una alternativa a la hiptesis
nula, conocida como hiptesis alternativa, H 1 .
Considrese un producto qumico del cual se piensa que contiene el 3 %
de fsforo por pesada. Se tiene la impresin de que esta proporcin se ha
incrementado y para contrastar esto se ha analizado la composicin empleando un mtodo estndar con una desviacin estndar conocida del
0.036 %. Supngase que se toman cuatro medidas y se realiza un contraste
de significacin al nivel P = 0.05. Es necesario que dicho contraste sea de
una cola, ya que slo interesa un incremento. La hiptesis nula es:
H o:

fl = 3,0%

La lnea continua de la Figura 3.5 indica la distribucin muestral de la media


si H o fuese verdadera. Esta distribucin muestral tiene una media 3.0 y una
desviacin estndar (es decir, error estndar de la media) (J/n = 0.03/,)4 %.
Si la media muestral cae por encima del valor crtico indicado, Xc, la hiptesis
nula se rechaza. Por tanto, la regin sombreada, con rea 0.05, representa la
probabilidad de un error de Tipo 1. Supongamos que tenemos la hiptesis
alternativa:
H1 :

fl = 3.05%

La lnea punteada de la Figura 3.5 muestra la distribucin muestral de la


media si la hiptesis alternativa fuese verdadera. Incluso si este fuese el caso,
se aceptar la hiptesis nula si la media muestral cae por debajo de XC'

01

()

O,
::l

70

x
Xc

Figura 3.5.

Errores de Tipo 1y 11.

La probabilidad de este error de Tipo II se representa por el rea rayada. El


diagrama pone de mani5esto la interdependencia de los dos tipos de error.
Por ejemplo, si se cambia el nivel de significacin a P = 0.01 para reducir un
riesgo de un error de Tipo 1, i, aumentar y el riesgo de un error de Tipo II
aumentar tambin. Recprocamente, una disminucin en el riesgo de un
error de Tipo II slo puede lograrse a expensas de un incremento en la probabilidad de un error de Tipo 1. El nico camino por el que pueden reducirse
ambos errores (para una hiptesis alternativa dada) es aumentar el tamao
de la muestra. El efecto de incrementar n hasta 9, por ejemplo, se ilustra en
la Figura 3.6: la disminucin resultante en el error tpico de la media produce una disminucin de ambos tipos de error, para un valor dado de i("
La probabilidad de que una hiptesis nula falsa se rechace se denomina
la potencia de un contraste. Esto es, la potencia de un contraste es (l - probabilidad de un ermr de Tipo Ir). En el ejemplo expuesLo es funcin de la
media especificada en la hiptesis alternativa. Esto depende tambin del tamao de muestra, el nivel de significacin del contraste, y si el contraste es
de una o dos colas. En aquellas circunstancias donde se dispone de dos o ms
contrastes para contrastar la misma hiptesis, puede ser til comparar las
potencias de los contrastes con el fin de decidir cual es el ms adecuado.
Los errores de tipo I y Ir son tambin relevantes cuando se aplican secuencialmente contrastes de significacin. Un ejemplo de esta situacin es la

,l"\,

I
I

\
\

l'
t

"

3.00

\
I

\
Tipo I

\
"

\,

305

Xc

Figura 3.6.

Errores de Tipo I y 11 al aumentar el tamao de muestra.

aplicacin del contraste t a la diferencia entre dos medias, despus de utilizar


en primer lugar el contraste F para decidir si se pueden juntar o no las varianzas de las muestras (vanse las Secciones 3.3 y 3.6). Los dos errores de
Tipo 1 y II pueden surgir del contraste F iniciaL y si ocurre alguno de ellos
querr decir que los niveles de significacin establecidos para el subsiguiente
contraste t son incorrectos, debido a la forma incorrecta en que el contraste
t ha sido aplicado.
Este ejemplo ha vuelto a poner de manifiesto la conclusin general de
que los contrastes de significacin no dan respuestas indiscutibles: ms bien
ayudan a la interpretacin de los datos experimentales al dar las probabilidades de que ciertas conclusiones sean vlidas.

Bibliografa
Barnett, V. and Lewis, T. 1994. Ourliers in Statistical Data. 3rd Edn. Wiley,
Chichester. (Un tratamiento muy completo de la filosofa del rechazo de
datos anmalos y los contrastes empleados.)
Rox, G. E. P., Hunter, W. G. ,md Hunter,j. S. 1978. Statistiesfor Experill1C1ltas, Wiley, Nevv' York. (Proporciona ms detalles sobre los contrastes entre medias en el ANOVA.)
Campbel1, R. C. 1989. Statisticsfor Bi%gists. 3rd Edn. Cambridge University
Press, Cambridge. (Proporciona contrastes de la homogeneidad de varianzas y de normalidad.)
Crawshaw, J. and Chambers, J 1997. A Concise Course in A-Level Statistics.
3rd Edn. Stanlcy Thornes, Cheltenham. (Da ejemplos del contraste chicuadrado para la normalidad.)
Davies O. 1. and Goldsmith P. 1. 1984. Statistical JV[ethods in Research {( nd
P)'oduction. 4th Edn. Longman, London. (Proporciona ms detalles acerca
de los errores de Tipo 1 y II Y otras aplicaciones del contraste chi-cuadrado.)
Filliben, j.]. 19'15. Tcchnometrics 17: 111. (Describe el uso de r al contrastar
la normalidad, y estudia otros contrastes de normalidad.)
Kleinbaum, D. G., Kupper, 1. 1. and Muller, K. E. 1988. Applied Rqression
AnalJjsis all! Other l'v'fultivariate Methods. 2nd Edn. PWS -Kent Publishing, Boston. (Proporciona detalles adicionales de contrastes para diferencias significativas entre medias con posterioridad a un ANOV A.)
Kowalski, B. R. (ed.). 1977. Chemometrics: Theor~1j alld Application, American Chemical Society, Washington. (El Captulo 11 clescribe contrastes de
normalidad y cliscute el efecto de la no normalidad sobre los contrastes
paramtricos.)
Sokat, R. R. and Rohlf, F. j. 1994. BiometrJj. 3rd Edn. Freeman, New York
(Da informacin detallada de los contrastes de la homogeneidad de varia:~zas.)

71

72

Ejercicios
1.

Utilizando una grfica de probabilidad normal, contrastar si el siguiente conjunto de datos podra haber sido obtenido de una poblacin
normal:
11.68, 11.12,8.92,8.82, 10.31, 11.88,9.84, 11.69, 9.53, 10.30,
9.17, 10.04, 10.65, 10.91, 10.32,8.71,9.83,8.90, 10.40

2.

Para evaluar un mtodo espectrofotomtrico para determinar titanio, se


aplic el mtodo a muestras de aleaciones conteniendo diferentes cantidades certificadas de titanio. Los resultados (% Ti) se muestran a continuacin.
Muestra

Valor certificado

Media

Desviacin estndar

1
2
3
4

0.496
0.995
1.493
1.990

0.482
1.009
1.505
2.002

0.0257
0.0248
0.0287
0.0212

Para cada aleacin se realizaron 8 determinaciones repetidas.


(Qiu Xing-chu y Zhu Ying-quen. 1983. AnalJjst 108:641)
Para cada aleacin, contrastar si el valor medio difiere significativamente del valor certificado.
3.

Para los datos del Ejemplo 3.3.3, relativos a la concentracin de un tiol


en el lisado sanguneo.
(a) Verificar que 2.07 no es un dato anmalo para el grupo <<normal.
(b) Demostrar que las varianzas de los dos grupos difieren significativamente.

4.

Los siguientes datos proporcionan la recuperacin de bromuro adicionado a muestras con contenido vegetal, medido mediante un mtodo cromatogrfico gas-lquido. La cantidad de bromuro potsico aadido a cada
tipo de vegetal fue la misma.
Tomate
Pepino

777
782

790
773

759
778

790
765

770
789

758
797

764 ~g g-l
782 ~g g-l

(Roughan, ]. A., Roughan, P. A. and Wilkins,]. P. G. 1983. AnalJjst


108:742)
(a)

S.

Contrastar si la recuperacin en los dos vegetales tiene varianzas


que difieran significativamente.
(b) Contrastar si las tasas de recuperacin medias difieren significativamente.
Los siguientes resultados muestran el porcentaje del agua intersticial total recuperada al centrifugar muestras de piedra arenisca tomadas a diferentes profundidades.

Profundidad de la muestra (m)

Agua recuperada (%)

7
8
16
23

33.3
43.6
73.2
72.5

35.7
47.7
73.6
65.2

33.3
45.2
68.7
70.4

38.1
45.4
70.9
66.7

31.0
43.8
72.5
77.6

73
33.3
46.5
74.5
69.8

(Wheatstone, K. G. and Getsthorpe, D. 1982. AnalJjst 107:731)


Demostrar que el porcentaje de agua recuperada difiere significativamente a diferentes profundidades. Utilizar el mtodo de la diferencia significativa menor descrito en la Seccin 3.9 para encontrar las causas de
este resultado significativo.

()
O
::l
.....

Vl
.....
ro
Vl

o..
ro

Vl

cE'

2.
-.
(s.
O!

6.

La siguiente tabla proporciona la concentracin de norepinefrina lmol


por g de creatinina) en la orina de voluntarios sanos de veinte aos.
Machos
Hembras

0.48
0.35

0.36
0.37

0.20
0.27

0.55
0.29

0.45

0.46

0.47

0.23

(Yamaguchi, M., Ishida, J. and Yoshimura, M. 1998. AnalJjst 123:307)


Existe evidencia que la concentracin de norepinefrina difiera entre
sexos?
7.

Al leer en una bureta 0.01 mI, un analista tiene que estimar la cifra final. La siguiente tabla de frecuencias proporciona las ltimas cifras de
SO lecturas. Realizar un contraste de significacin adecuado para determinar si se prefieren algunos dgitos a otros.
Dgito
Frecuencia

8.

O 1
1 6

2
4

S 3

S
11

6
2

7
8

8
3

9
7

La siguiente tabla proporciona otros resultados del trabajo citado en el


Ejemplo 3.3.1 (Sahuquillo, A., Rubio, R. and Rauret, G. 1999. AnalJjst
124:1) en el que fueron comparados por dos mtodos diferentes los resultados de la determinacin de cromo en materiales orgnicos.
Agujas de pino:
Hojas de haya:
Planta acutica:

Mtodo
Mtodo
Mtodo
Mtodo
Mtodo
Mtodo

1
2
1
2
1
2

media
media
media
media
media
media

=
=
=
=
=
=

2.15
2.45
5.12
7.27
23.08
32.01

d.e.
d.e.
d.e.
d.e.
d.e.
d.e.

=
=
=
=
=
=

0.26
0.14
0.80
0.44
2.63
4.66

En cada caso la media es el promedio de S valores.


Para cada material probar si la media de los resultados obtenidos por
los dos mtodos difiere significativamente.
9.

Los datos dados en el ejemplo de la Seccin 3.11, para el nmero de roturas realizadas por cuatro trabajadores diferentes, se reproducen a continuacin.
24, 17, 11, 9

(')

5:

::l

74

Probar si:
(a)
(b)

10.

El nmero de roturas del primer trabajador difiere significativamente de las de los otros tres trabajadores.
El segundo, tercero y cuarto trabajadores difieren significativamente en la falta de cuidado de cada uno de los otros.

Un nuevo procedimiento enzimtico de anlisis por inyeccin en flujo


para determinar perxido de hidrgeno en agua fue comparado con un
mtodo volumtrico redox convencional con permanganato potsico
aplicando ambos mtodos a muestras de perxido de uso farmacutico.
La siguiente tabla proporciona la cantidad de perxido de hidrgeno,
en mg ml- 1). Cada valor es la media de cuatro rplicas.
Muestra n.o

Mtodo enzimtico

Mtodo del permanganato

1
2
3

31.1
29.6
31.0

32.6
31.0
30.3

(da Cruz Vieira, 1 and Fatibello-Filho, O. 1998. Analgst 123:1809)


Probar si los resultados obtenidos por ambos mtodos difieren significativamente.

11.

Seis analistas realizan seis determinaciones cada uno del contenido del
mismo lote de pastillas. Los resultados se muestran a continuacin:
Analista
A

e
D
E
F

Contenido de paracetamol (% m/m)


84.32
84.24
84.29
84.14
84.50
84.70

84.51
84.25
84.40
84.22
83.88
84.17

84.63
84.41
84.68
84.02
84.49
84.11

84.61
84.13
84.28
84.48
83.91
84.36

84.64
84.00
84.40
84.27
84.11
84.61

84.51
84.30
84.36
84.33
84.06
83.81

(Trafford, A. D., lee, R. D., Moffat, A. C. and Graham P. 1999. Ana19st 124:163)
Probar si existe alguna diferencia significativa entre las medias obtenidas por los seis analistas.
12.

Las siguientes cifras se refieren a la concentracin de albmina, en


gl- 1, en el suero sanguneo de 16 adultos sanos:
37, 39, 37, 42, 39, 45, 42, 39, 44, 40, 39, 45, 47, 47, 43, 41
(Foote, J. W. and Delves, H. T. 1983. Analgst 108:492)
Las ocho primeras cifras corresponden a hombres y las segundas ocho
cifras a mujeres. Probar si la concentracin media para hombres y mujeres difiere significativamente.

13.

Se compar un nuevo mtodo espectroscpico de absorcin atmica de


llama para determinar antimonio en la atmsfera con el mtodo calorimtrico recomendado. Para muestras de atmsfera urbana, se obtuvieron los siguientes resultados:

Muestra n.o
1

2
3
4
5
6

Antimonio encontrado (mg m J)


Mtodo nuevo
Mtodo estndar
22.2
19.2

15.7
20.4
19.6

15.7

25.0
19.5
16.6
21.3
20.7
16.8

(Castillo, J R., Lanaja, J, Marinez, M. C. y Aznrez, J 1982. AnalJlst


107:1488.)
Difieren significativamente los resultados obtenidos por los dos mtodos'?
14.

Para la situacin descrita en la Seccin 3.13 (H o : p=3.0%, H] =3.05 %,


= 0.036 %) calcular el tamao mnimo de muestra requerido para hacer que las probabilidades de error de Tipo 1 y II sean a lo sumo iguales
a 0.01.

(J

75

La calidad
de las medidas
analticas

4.1.

Introduccin

La qumica analtica, como se vio en el Captulo 1, es una ciencia de la medida aplicada, en la que predominan los estudios cuantitativos, siendo esenciales, por tanto, las estimaciones de errores inevitables. En casi todas las
aplicaciones del anlisis los resultados obtenidos se suministran a un cliente
o usuario, y es necesario que estos usuarios se encuentren satisfechos tanto
como sea posible con la calidad (adecuacin al objetivo) de las medidas. Esto tiene muchas implicaciones importantes para la prctica analtica. En primer lugar, cualquier evaluacin de los errores de medida debe tener en cuenta el proceso analtico global: incluyendo las etapas de muestreo, que a
menudo contribuyen al error global muy significativamente. En segundo lugar, las caractersticas de los anlisis acometidos en cada laboratorio deben
ser comprobados internamente de forma regular, normalmente aplicndolos
a materiales de referencia o estndar. En tercer lugar, en muchas reas de
aplicacin se deben comparar los resultados de diferentes laboratorios entre
si, de manera que los usuarios puedan estar satisfechos de que el funcionamiento de los laboratorios cumple con normativas, regulaciones y otros requerimientos. Finalmente, los resultados analticos se deben sumunistrar con
una estimacin realista de su incertidumbre, es decir, el intervalo dentro del
cual est ubicado el verdadero valor de la cantidad que es medida. stos son
los temas principales que se analizan en este captulo. Los mtodos estadsticos utilizados en dichas reas son, en principio, muy simples, basndose
muchos de ellos en tcnicas descritas en los Captulos 2 y 3. Sin embargo,
uno de los principales desarrollos en las ciencias analticas de los ltimos
aos ha sido su aplicacin cada vez ms frecuente y mejorada, propiciando
una gran mejora en la calidad y aceptabilidad de muchos resultados analticos. Adems, algunos de los mtodos analizados tienen amplias aplicaciones.
Por ejemplo, los principios empleados para controlar el funcionamiento de
un nico anlisis en un nico laboratorio durante un perodo de tiempo se
pueden aplicar tambin al seguimiento de un proceso industrial.

78

4.2.

Muestreo

Muchos anlisis dependen de muestras qumicas para proporcionarnos informacin sobre un objeto global. Por tanto, si no se consideran con cuidado
las etapas de muestreo de un anlisis, puede ser que los mtodos estadsticos
considerados en este libro no sean vlidos, ya que las muestras estudiadas
puede que no representen apropiadamente al conjunto objeto de estudio. Por
ejemplo, no es posible analizar todo el agua de un ro para analizar un contaminante txico, y no es posible analizar una cisterna de un camin llena
de leche para ver si contiene una hormona esteroide prohibida. En otros casos tiene que utilizarse una pequea cantidad de muestra debido a que el
mtodo es destructivo y se quiere conservar el material restante. As pues,
en cada caso la muestra estudiada debe tomarse de manera que asegure en
lo posible que sea verdaderamente representativa del objeto total.
Para aclarar algunos aspectos del muestreo considrese la situacin en la
que se disponga de un gran lote de pastillas y que se desee obtener una estimacin del peso medio de una pastilla. En vez de pesar todas las pastillas, se
toman unas pocas (supongamos diez) y se pesa cada una. En este ejemplo el
lote de tabletas forma la poblacin y las diez pastillas pesadas constituye una
muestra de esta poblacin (vase la Seccin 2.2). Si la muestra se va a utilizar para deducir las propiedades de la poblacin, entonces se denomina estadsticamente muestra aleatoria, es decir, una muestra tomada de tal modo que todos los miembros de la poblacin tienen la misma posibilidad de
estar incluidos en ella. Slo entonces sern vlidas las ecuaciones como la
(2.9), que proporciona los lmites de confianza de la media. Debe considerarse que el trmino aleatorio tiene, en sentido estadstico, un significado diferente de casual. Aunque en la prctica un analista pudiera diseminar las
pastillas sobre una mesa e intentar tomar una muestra de diez de una manera casual, dicho mtodo podra ocultar un sesgo inconsciente. El mejor modo
de obtener una muestra aleatoria es mediante el uso de una tabla de nmeros
aleatorios. A cada elemento de la poblacin se le asigna un nmero de tal
manera que todos los nmeros tienen el mismo nmero de dgitos, por ejemplo 001, 002, 003, etc. Entonces los nmeros aleatorios se leen de una tabla
de nmeros aleatorios (vase la Tabla A.S), partiendo de un punto arbitrario
que proporcione, por ejemplo, 964, 173, etc.; y los nmeros correspondientes
de la poblacin constituirn la muestra. Un procedimiento alternativo (y mucho ms simple) que se utiliza algunas veces es el de seleccionar los elementos de una poblacin a intervalos regulares, por ejemplo, tomar una de cada
cien pastillas de una lnea de produccin. Este mtodo no es completamente
satisfactorio ya que podra existir una periodicidad coincidente en el peso de
las pastillas: la importancia de la aleatoriedad de la muestra es evidente. De
nuevo, si las ltimas pastillas tomadas hubieran sufrido una disminucin
gradual de peso durante la produccin del lote, entonces esta muestra proporcionara un valor completamente errneo para el peso medio del lote
completo.
En el ejemplo anterior la poblacin est constituida de elementos discretos obvios, que nominalmente son el mismo, o sea, las pastillas. El muestreo
de materiales para los que esto no es cierto, como rocas, polvo, gases y lquidos, se denomina muestreo a granel. Si un material a granel fuera perfectamente homogneo entonces slo se necesitara una parte pequea o

incremento de muestra o porcin de ensayo para determinar las propiedades del conjunto. En la prctica los materiales a granel no son homogneos
por multitud de razones. Materiales como aleaciones y sedimentos estn formados por partculas macroscpicas con diferente composicin y puede que
no estn uniformemente distribuidas en el conjunto. Los fluidos puede que
no sean homogneos a escala molecular, debido a los gradientes de concentracin. Tal falta de homogeneidad se detecta slo tomando una muestra de
prueba de diferentes partes del conjunto. Si fuera posible, esto debera hacerse aleatoriamente considerando el conjunto como una coleccin de celdas de
igual tamao y seleccionando una muestra de celdas utilizando nmeros
aleatorios como se describi anteriormente.
De la muestra aleatoria, puede calcularse la media, X, y la varianza, 52.
Existen dos contribuciones al valor de S2: la varianza muestral, a-I, debida
a las diferencias entre los elementos de la muestra, por ejemplo, pastillas que
tienen diferentes pesos, y la varianza de la medida, (T~, por ejemplo, errores aleatorios en la pesada de cada pastilla. En la seccin siguiente se describe cmo pueden separarse y estimarse estas dos contribuciones utilizando el
ANOVA. Para materiales a granel la varianza muestral depende del tamao
de los incrementos de muestra relativos a la escala de las no homogeneidades.
Cuando el tamao del incremento de muestra aumenta, las no homogeneidades tienden a ser promediadas, disminuyendo de esta manera la varianza
muestral.

4.3.

Estimacin y separacin de varianzas


utilizando ANOVA

En la Seccin 3.8 se describi el uso de ANOVA de un factor para contrastar


las diferencias entre medias cuando existe una posible variacin debida a un
factor de efecto fijo. En esta seccin se considera la situacin en donde existe
un factor de efecto aleatorio, o sea, variacin muestral. El ANOVA de un
factor se utiliza entonces para separar y estimar las diferentes fuentes de variacin, en vez de contrastar si varias medias muestrales difieren significativamente. La Tabla 4.1 muestra los resultados del ensayo de pureza de un
barril de cloruro sdico. Se tomaron cinco incrementos de muestra, A-E,
de diferentes partes del barril elegidos al azar, y se realizaron cuatro anlisis
repetidos sobre cada muestra. Como se explic anteriormente, hay dos posibles fuentes de variacin: la debida al error aleatorio en la medida de la pureza, dada por la varianza en la medida, (T~ , y la debida a las variaciones
reales en la pureza del cloruro sdico en diferentes puntos del barril, dada
Tabla 4.1.

Ensayo de pureza de cloruro sdico.

Muestra

Pureza (%)

98.8,
99.3,
98.3,
98.0,
99.3,

o
E

98.7,
98.7,
98.5,
97.7,
99.4,

Media
98.9,
98.8,
98.8,
94.4,
99.9,

98.8
99.2
98.8
97.3
99.4

98.8
99.0
98.6
97.6
99.5

79

Ol
('l

o:.
Ol

o...
o...

ro

Oi
Vl

3ro

o...
o:.
Ol
Vl

Ol

:l

(S'
Ol
Vl

80

por la varianza muestral, d. Puesto que el cuadrado medio dentro de muestras no depende de la media muestral (vase la Seccin 3.9) se puede usar
para estimar (J~. El cuadrado medio entre muestras no se puede utilizar para
estimar directamente (Ji, ya que la variacin entre medias muestrales es causada tanto por el error aleatorio en la medida como por las posibles variaciones en la pureza. Se puede demostrar que el cuadrado medio entre muestras
proporciona una estimacin de (J~ + nd (donde n es el nmero de medidas
repetidas). Sin embargo, antes de realizar una estimacin de (Ji, se debera
realizar un contraste para ver si difiere significativamente de O. Esto se realiza comparando los cuadrados medios entre y dentro de muestras: si no
difieren significativamente entonces (J~ = O Y ambos cuadrados medios esti?
man (Jo.
La salida del ANOVA de un factor proporcionada por Excel para este
ejemplo se muestra a continuacin. Los resultados muestran que el cuadrado
medio entre muestras es mayor que el cuadrado medio dentro de muestras,
y el resultado del contraste F muestra que esta diferencia es sumamente significativa, es decir, que (Ji difiere significativamente de O. El cuadrado medio
entre muestras da el valor 0.0653 como una estimacin de (J~, de manera que
se puede estimar (J~ utilizando:
(J~ = (cuadrado medio entre muestras - cuadrado medio dentro de
=
=

muestras)/n
(1.96 - 0.0653)/4
0.47

Muestra A

Muestra B

Muestra

98.8
98.7
98.9
98.8

99.3
98.7
98.8
99.2

Muestra D

Muestra E

98.3
98.5
98.8
98.8

98
97.7
97.4
97.3

99.3
99.4
99.9
99.4

Frecuencia

Suma

Promedio

Varianza

4
4
4
4
4

395.2
396
394.4
390.4
398

98.8
99
98.6
97.6
99.5

0.006667
0.086667
0,06
0.1
0.073333

Anova de un factor
RESUMEN
Grupos

Muestra
Muestra
Muestra
Muestra
Muestra

A
B

e
D
E

Fuente de variacin

SC

gl

CM

Valor P

Entre muestras
Dentro de muestras

7.84
0.98

4
15

1. 96

30

5.34E-07 3.056

Total

8.82

19

0.0653

F crt

4.4.

81

Estrategia de muestreo

Si se realiza un anlisis de cada uno de los h incrementos de muestra (ejemplo anterior, Seccin 4.3), entonces los lmites de confianza para la media
vienen dados por la ecuacin (2.9):

(4.1)

donde es la media de las n medidas y 52 la varianza de las medidas; /. es


una estimacin de la varianza total, a 2 , que es la suma de las varianzas muestrales y de medida, es decir, a~ + aI (vase la Seccin 2.11), y a 2 /h) (que se
estima por 5 2 /h) es la varianza de la media, x. Si el valor para cada incremento de muestra es la media de n medidas repetidas, entonces la varianza de la
media es (a~/n + aI) /h = a~/nh + af/h. Obviamente, para alcanzar la precisin mxima, se requiere que la varianza de la media sea tan pequea como
sea posible. El trmino debido a la varianza de medida puede ser reducido
bien sea utilizando un mtodo de .anlisis ms preciso o incrementando n, el
nmero de medidas repetidas. Sin embargo, no hay que esforzarse por hacer
que la varianza de medida sea menor que un dcimo de la varianza muestral,
ya que cualquier reduccin posterior no mejorar sustancialmente la varianza total (que es la suma de las dos varianzas). Es preferible en su lugar, tomar un nmero mayor de incrementos de muestra, ya que el intervalo de
confianza disminuye cuando aumenta h. Si una muestra preliminar se ha
utilizado para estimar 5, entonces el tamao de muestra requerido para lograr un tamao dado del intervalo de confianza se puede calcular aproximadamente (ver Captulo 2, Ejercicio 4).
Una estrategia de muestreo posible con materiales a granel es tomar h
incrementos de muestra y mezclarlos antes de realizar n medidas repetidas.
La varianza de la media de estas medidas repetidas es af/n + af/h. Esta varianza total se debera comparar con la resultante de analizar n veces cada
incremento de muestra y promediar las medias de los incrementos, siendo
entonces la varianza a~/nh + af/h (vase lo anterior). Obviamente la ltima
varianza es la ms pequea, dando por resultando una media con ms precisin, aunque se requieren ms medidas (nh frente a n). El conocimiento de
los valores de a~ y aI de experiencias anteriores, y los costes de muestreo y
anlisis, se pueden utilizar para calcular el coste de las estrategias de muestreo relativas. En general, se usar el esquema ms econmico que proporcione el grado de precisin requerido.
Para materiales a granel la varianza muestral depende del tamao de los
incrementos de muestra relativo a la escala de no homogeneidades y disminuye con el aumento del tamao de los incrementos de muestra. En algunos
experimentos puede ser necesario seleccionar un lmite superior de la varianza muestral de manera que puedan detectarse cambios en la media. Se pueden tomar medidas preliminares para decidir el tamao del incremento de
muestra mnimo que se requiere para proporcionar un nivel aceptable de varianza muestra1.

3ro

o-

o:.
Ol
Ul

Ol

2....,
.....

"
Ol

Ul

82

4.5.

Mtodos de control de calidad. Introduccin

Si un laboratorio ofrece resultados analticos de una calidad aceptable para


sus clientes, y funciona bien en las pruebas de suficiencia (homologacin) o
en los ensayos de colaboracin (vase despus), resulta obvio que los resultados obtenidos en ese laboratorio deberan mostrar una consistencia elevada
da a da. La comprobacin de dicha consistencia es complicada por la existencia de errores aleatorios, de modo que se han desarrollado varias tcnicas
estadsticas para demostrar si existen o no tendencias dependientes del tiempo en los resultados, asociadas a inevitables errores aleatorios. Se trata de los
mtodos de control de calidad.
Supngase que un laboratorio utiliza un mtodo cromatogrfico para determinar el nivel de un pesticida en fruta. Los resultados se pueden emplear
para determinar si un gran lote de fruta es aceptable o no, y su calidad resulta entonces de gran importancia. La eficacia del mtodo se comprobar a
intervalos regulares aplicndose, con un nmero pequeo de anlisis repetidos, a un material de referencia estndar (MRE), en el que el nivel de
pesticida se encuentre certificado por una autoridad reguladora. Alternativamente se puede usar un estndar interno de control de calidad (ICC) de composicin conocida y muy estable. Los estndares MRE o ICC sern probablemente introducidos al azar dentro de la secuencia de materiales analizados
por el laboratorio, de manera que los materiales ICC no sean identificados
por separado por el personal del laboratorio y sean estudiados utilizando
exactamente los mismos procedimientos que los utilizados para las muestras
habituales. La concentracin conocida del pesticida en los materiales MRE/
ICC es el valor objetivo para el anlisis, /lo. El laboratorio necesita ser capaz
de detener y examinar el mtodo analtico si parece que est dando resultados errneos. Por otra parte, se malgastarn recursos, tiempo y materiales si
se interrumpe innecesariamente la secuencia de anlisis, de manera que los
mtodos de control de calidad deberan permitir su uso continuado mientras
funcionen satisfactoriamente. Si los valores para las muestras ICC no muestran tendencias dependientes del tiempo significativas, y si los errores aleatorios en las medidas no son demasiado grandes, el proceso analtico est
bajo control.
Los mtodos de control de calidad son tambin ampliamente utilizados en
el seguimiento de procesos industriales. De nuevo es importante detener un
proceso si sus resultados caen fuera de ciertos lmites, pero es igualmente
importante no parar el proceso si funciona bien. Por ejemplo, los pesos de
pastillas de uso farmacutico procedentes de una lnea de produccin pueden
controlarse tomando pequeas muestras (vase lo anterior) de pastillas de
vez en cuando. Los pesos de las pastillas estn sujetos a fluctuaciones en torno al valor objetivo 110 debido a errores aleatorios, pero si estos errores aleatorios no son demasiado grandes, y no van acompaados de tendencias que
dependan del tiempo, el proceso est bajo control.

4.6.

Diagramas de Shewhart para valores medios

En el captulo 2, se mostr como la media, X, de una muestra de medidas


podra utilizarse para proporcionar una estimacin de la media de la pobla-

cin, fl, y como la desviacin estndar de la muestra, s, proporcionaba una


estimacin de la desviacin estndar de la poblacin, rr. Para un tamao de
muestra pequeo, n, los lmites de confianza de la media vienen dados por
la ecuacin (2.9), con el valor de t elegido de acuerdo con el nmero de grados
de libertad (n - 1) Y el nivel de confianza requerido. Los mismos principios
se pueden aplicar al trabajo de control de calidad, pero con una diferencia
importante. Sobre un perodo de tiempo largo, la desviacin estndar de la
poblacin, (J, del nivel de pesticida en fruta (o, en el segundo ejemplo, de los
pesos de las tabletas), llegar a ser conocida por la experiencia. En el trabajo
de control de calidad, a (J se le da el nombre de capacidad del proceso. La
ecuacin (2.9) puede sustituirse por la ecuacin (2.8) con la estimacin de s
sustituida por la de (J conocida. En la prctica z = 1.96 se redondea a 2 para
unos lmites de confianza del 95 % Y z = 2.97 se redondea a 3 para unos
lmites de confianza del 99.7 %.

Para lmites de confianza del 95 %: fl

Para lmites de confianza del 99.7%: fl

2(J

r-

...n
3(J

x j;z,

(4.2)

(4.3)

Estas ecuaciones se utilizan en la construccin del tipo ms comn de diagramas de control, un diagrama de Shewhart (Figura 4.1). El eje vertical
de un diagrama de Shewhart representa la media del proceso, .\:, de los va-

Lnea de accin superior: 1'0+ 3a/vn

Lnea de aviso superior: 1'0 + 2a/Y

Valor objetivo: 1'0


Tiempo

Lnea de aviso inferior: 1'0 - 2a/Y

Lnea de accin superior: 1'0- 3a/Y

Figura 4.1.

Un diagrama de Shewhart para valores medios.

83

84

lores medidos, por ejemplo, de la concentracin de pesticida en la fruta, y el


eje horizontal es un eje de tiempo, de manera que puede representarse la
variacin de estos valores de i con el tiempo. El valor objetivo, /lo, se marca
con una lnea horizontal. El diagrama tambin incluye dos pares de lneas
horizontales. Las lneas situadas a /lo 26/ ~ se denominan lneas de aviso o de alerta, y las situadas a /10 36/ j;t se conocen como lneas de accin. El propsito de estas lneas lo indican sus propios nombres. Supngase
que un valor medido de x cae fuera de las lneas de accin. La probabilidad
de tal ocurrencia cuando el proceso est bajo control, se sabe que es solamente del 0.3 %, es decir 0.003, de manera que si esto ocurre en la prctica
normalmente el proceso se detiene y examina. Existe una probabilidad de
aproximadamente el 5 % (0.05) de que un nico punto caiga fuera de cualquiera de las lneas de aviso (pero dentro de las lneas de accin) en tanto
que el proceso permanece bajo control. Esto slo no dara lugar a que el proceso se detuviese, pero si dos puntos sucesivos caen fuera de la misma lnea
de aviso, la probabilidad de ocurrir (P = [0.025]2 X 2 = 0.00125 en total para las dos lneas de aviso) es de nuevo tan baja que el proceso se debe considerar que est fuera de control. Estos dos criterios: un punto fuera de las
lneas de accin, o dos puntos sucesivos fuera de la misma lnea de aviso son
los que se aplican de forma habitual en la interpretacin de los diagramas de
Shewhart. Tambin a menudo se utilizan otros: por ejemplo, la probabilidad
de que caigan ocho puntos sucesivos en un lado especfico de la lnea del
valor objetivo es francamente bajo, es decir, (0.5)8 = 0.0039, y tal existencia
sugiere de nuevo que el proceso est fuera de control. Tambin se puede predecir la parada de un proceso en los casos donde los valores representados
de i muestren una tendencia (por ejemplo, seis puntos en sucesin aumentando o disminuyendo, aun cuando los puntos estn dentro de las lneas de
aviso), o donde parecen oscilar (por ejemplo, 14 puntos sucesivos, alternando arriba y abajo). Los usuarios de diagramas de control deben establecer
claramente todos los criterios que van a utilizar para declarar su proceso fuera de control.

4.7.

Diagramas de Shewart para rangos

Hay dos posibles explicaciones al hecho de que un diagrama de Shewart para


valores medios sugiera que un proceso est fuera de control. La ms obvia
es que la media del proceso haya cambiado: la deteccin de estos cambios es
la principal razn para utilizar los diagramas de control donde se representan los valores de i. Una explicacin alternativa es que la media del proceso
se ha mantenido en su valor pero que la variacin en el proceso ha aumentado, es decir, que las lneas de aviso y accin estn demasiado juntas, dando
lugar a indicaciones de cambios que de hecho no se han producido. Errores
del tipo opuesto son tambin posibles. Si la variabilidad del proceso ha disminuido (es decir, mejorado), entonces las lneas de aviso y de accin estarn demasiado lejanas entre ellas, quiz permitiendo que no se detecten cambios reales en i. Por tanto, se debe controlar la variabilidad del proceso as
como su valor medio. Este control tiene tambin su propio valor intrnseco:
la variabilidad de un proceso o un anlisis es una medida de su calidad, y en

--la situacin del laboratorio se encuentra vinculada directamente a la repetibilidad (desviacin estndar dentro del laboratorio) del mtodo (ver Captulo 1).
La variabilidad de un proceso se puede visualizar representando otro diagrama de Shewart para mostrar el rango, R (= valor ms grande - valor
ms pequeo), de cada una de las muestras tomadas. La Figura 4.2 muestra
un diagrama de control tpico para el rango. El formato general del diagrama
es el mismo que el que se ha utilizado al representar los valores medios, con
una lnea representando el valor objetivo, y tambin pares de lneas de
accin y de aviso. La diferencia ms relevante entre los dos diagramas es que
los pares de lneas no son simtricos con respecto al valor objetivo para el
rango, R. El valor de R se puede calcular utilizando el valor de (J, y las posiciones de las lneas de aviso y de accin se pueden deducir a partir de R,
utilizando factores multiplicativos obtenidos de las tablas estadsticas. Estos
factores toman valores dependiendo del tamao de muestra, n. Las ecuaciones relevantes son:

(4.4)

Lnea de aviso inferior:

RW 1

(4.5)

Lnea de aviso superior:

RW 2

(4.6)

Lnea de accin inferior:

Ra 1

(4.7)

Lnea de accin superior:

Ra2

(4.8)

Rango
Lnea de accin superior:

Lnea de aviso superior:

Valor objetivo:

Ra2

RW2

R
Tiempo

Lnea de aviso inferior:

RW1

Lnea de accin inferior:

Figura 4.2.

Ra 1

Diagrama de Shewhart para el rango.

85

86

EJEMPLO 4.7.1
Determnese las caractersticas de los diagramas de control para la media y el rango en un
proceso, siendo el valor objetivo 57, la capacidad del proceso 5 y el tamao muestral 4.
Para el diagrama de control en que se representan los valores medios, el clculo es
sencillo. Las lneas de aviso se encontrarn en 57 2 x 5/.j4, es decir, en 57 5; y las
lneas de accin estarn en 57 3 x 5/)4, es decir, en 57 7.5. Este diagrama se
muestra en la Figura 4.3.a.
Para el diagrama de control donde se representan los valores del rango, se debe primero calcular Rutilizando la ecuacin (4.4). Esto proporciona R = 5 x 2.059 = 10.29, donde el valor de 2.059 se toma de las tablas estadsticas para n = 4. (Ver, por ejemplo, la
tabla en la coleccin de Neave, cuyos detalles se proporcionan en la Bibliografa del Captulo 1.) El valor de Rse utiliza entonces para determinar las lneas de accin y aviso inferior
y superior utilizando las ecuaciones (4.5)-(4.8). Los valores de 1+1, ~, al Y 8 para n = 4
son 0.29, 1.94, 0.10 Y2.58, respectivamente, proporcionando al multiplicar por 10.29 posiciones para las cuatro lneas de 2.98, 19.96, 1.03 Y 26.55, respectivamente. Estas lneas
se muestran en la Figura 4.3b.

A veces en la prctica de un diagrama de control para el rango no se representan las lneas de aviso y de accin, ya que una reduccin en el rango no
suele ser una causa que requiera un anlisis detallado. Sin embargo, como ya
se ha puesto de manifiesto, la variabilidad de un proceso es una medida de
su calidad, y una reduccin en R representa una mejora en la calidad, cuyas
causas pueden ser motivo de investigacin. Por tanto, se recomienda la representacin de las lneas de aviso y de accin.

4.8.

La determinacin de la capacidad del proceso

En las secciones anteriores se demostr que si la capacidad del proceso, (J, es


conocida, es posible construir diagramas de control tanto para la media
muestral como para el rango muestra!. As, es posible distinguir entre una
situacin donde un proceso se ha salido de control por un desplazamiento
en la media del proceso, de una situacin en la que la media del proceso no
ha cambiado pero se ha producido un aumento no deseado en la variabilidad
elel proceso. El establecimiento de un valor adecuado para (J es, por tanto,
muy importante y elicho valor debera basarse. en un nmero sustancial de
medidas. Pero al realizar tales medidas se debe abordar el mismo problema
(distinguir un cambio en la media del proceso, de un cambio en la variabilidad del proceso). Si (J se calcula directamente de una larga sucesin de medidas, su valor puede ser sobrestimado por cualquier cambio en la media que
ocurra durante esa secuencia, y no se podran representar diagramas de control adecuados.
La solucin a este problema es tomar un gran nmero de pequeas muestras, medir el rango, R, para cada una de ellas y, as, determinar R. Este
procedimiento asegura que se mida slo la variabilidad inherente del proceso,
eEminndose cualquier desviacin en los valores medios. Entonces, el valor
de R se puede utilizar con las ecuaciones (4.5)-(4.8) para determinar las l-

87
Lnea de accin superior: 110+ 3a/vn =64.5

(a)

Lnea de aviso superior: 110+ 2a/Y = 62

Valor objetivo: 110 = 57


Tiempo

Lnea de aviso inferior: 110 - 2a/Y = 52

Lnea de accin superior: 110- 3a/Y = 49.5

Rango
(b)
Lnea de accin superior:

Lnea de aviso superior:

Valor objetivo:

Ra2 =26.55

RW2 = 19.96

R = 10.29
Tiempo

Lnea de aviso inferior:

RW1 = 2.98

Lnea de accin inferior:

Ra1 = 1.03

Figura 4.3. (a) Diagrama de Shewart para valores medios (ejemplo). (b) Diagrama de Shewart
para el rango (ejemplo).

neas de accin y de aviso para el diagrama de control de rangos. Las lneas


de accin y de aviso para el diagrama de control para la media se pueden
determinar calculando (J mediante la ecuacin (4.4) Y luego aplicando las
ecuaciones (4.2) y (4.3). En la prctica este clculo en dos etapas no es necesario, al proporcionar muchas tablas estadsticas valores de W y A, lo que
da directamente las posiciones de las lneas de accin y de aviso de:

x WR
Lneas de accin en x AR
Lneas de aviso en

Estos mtodos se ilustran mediante el siguiente ejemplo.

(4.9)
(4.10)

88

EJEMPLO 4.8.1
Se ha analizado en un laboratorio un patrn de control de calidad interno con una concentracin de analito de 50 mg kg 1, durante 25 das consecu~vos tomndose un tamao de
muestra de cuatro cada dra. Los resultados se proporcionan en la Tabla 4.2, que est en
la forma de hoja de clculo de Excel. Determnese el valor de 11 y represntense los diagramas de control para la media y el rango de los anlisis del laboratorio.
Al examinar los resultados se aprecia de manera clara alguna evidencia de que las
medias se desvan hacia arriba y hacia abajo durante el perodo de 25 das en el cual se
ha realizado el anlisis. Todas las medias muestrales de los das 3-15 inclusive son ms
grandes que el valor objetivo de 50, mientras que cuatro de las siguientes seis .medias estn
por debajo del valor objetivo, y las ltimas cuatro estn todas por encima. Estas son las
circunstancias en las que resulta importante estimar (J utilizando el mtodo descrito anteriormente. Utilizando los valores de R en la ltima columna de datos, resulta que 11 es 4.31.
La aplicacin de la Ecuacin (4.4) estima (J como 4.31/2.059 = 2.09. La Tabla 4.2 demuestra tambin que la desviacin estndar de las 100 medidas, tratada como una muestra nica, es 2..43: porque debido a las des\liaciones en \a media esto sella una sobrestimacin

significativa de (J.
Entonces se representa el diagrama de control para la media con la ayuda de las Ecuaciones (4.9) y (4.10) con W= 0.4760, A = 0.7505, que muestra que las lneas de aviso y
accin se encuentran en 50 2.05 y 50 3.23, respectivamente. La Figura 4.4 muestra
el diagrama de control de Excel. De manera similar, las Ecuaciones (4.5)-(4.8) muestran que
en el diagrama de control para el rango, las lneas de aviso se encuentran en 1.24 y 8.32
Ylas lneas de accin en 0.42 y 11.09, respectivamente. (Excel no produce automticamente
diagramas de control para rangos, aunque genera diagramas para desviaciones estndar,
que en algunos casos se utilizan en lugar de diagramas de rango.) La Figura 4.4 muestra
que este proceso no se encuentra todava bajo control, cayendo varios puntos fuera de la
lnea de accin (superior).

ID
TI
(f)

55.00
53.00
51.00

TI
Q)

E 49.00
(f)

Cii

47.00

>

45.00

11

13

15

17

19

21

23

25

Nmero de muestra

Figura 4.4.

4.9.

Diagrama de Shewhart para medias (dalas del ejemplo de la Tabla 4.2).

Longitud media de rachas: diagramas de sumas


acumuladas

Una propiedad importante de un diagrama de control es la rapidez con que


se detecta un cambio en la media del proceso. El nmero promedio de medidas necesarias para detectar cualquier cambio particular en la media del pro-

Tabla 4.2.

Hoja de clculo de Excel (ejemplo).

Nmero de
muestra
1
2
3
4
5
6
7
8
9
10
11

12
13

14
15
16
17
18
19
20
21
22
23
24
25

89

Valores de las muestras


2
1
3
48.8
48.6
48.2
54.8
49.6
54.8
49.0
52.0
51. O
51.2
52.0
54.6
52.0
50.6
54.2
48.0
47.8
49.4
48.0
48.8
46.6
54.6
52.2
50.8
53.0

50.8
50.6
51. O
54.6
54.2
54.8
49.4
49.4
52.8
53.4
54.2
53.8
51. 7
50.9
54.9
50.3
51.9
46.5
52.5
47.7
48.9
51.1
52.5
51. 6
46.6

51. 3
49.3
49.3
50.7
48.3
52.3
52.3
49.7
49.7
52.3
49.9
51. 5
53.7
53.9
52.7
47.5
54.3
47.7
47.9
50.5
50.1
51. 5
52.9
49.1
53.9
d.e.

47.9
50.3
52.1
53.9
50.5
52.5
51.3
53.9
50.5
50.3
57.1
47.9
56.8
56.0
52.2
53.4
49.4
50.8
53. O
52.2
47.4
54.6
51.8
52.3
48.1
2.43

Media en
el diagrama

Rango

49.70
49.70
50.15
53.50
50.65
53.60
50.50
51.25
51.00
51.80
53.30
51.95
53.55
52.85
53.50
49.80
50.85
48.60
50.35
49.80
48.25
52.95
52.35
50.95
50.40

3.4
2.0
3.9
4.1
5.9
2.5
3.3
4.5
3.1
3.1
7.2
6.7
5.1
5.4
2.7
5.9
6.5
4.3
5.1
4.5
3.5
3.5
1.1
3.2
7.3
Media=4.31

ceso se denomina longitud media de racha (LMR). Ya que las posiciones


de las lneas de accin y aviso en un diagrama de Shewhart para la media
del proceso dependen del valor de (J /
el LMR de ese diagrama depender
del tamao del cambio en la media comparado con (J /
Un cambio grande
se detectar con ms rapidez que uno pequeo, y el LMR se reducir utilizando un tamao muestral ms grande, n. Puede demostrarse que si se produce un cambio igual a
y si slo se utiliza el criterio de la lnea de
accin, entonces el LMR es aproximadamente 50, es decir, se medirn aproximadamente 50 muestras antes que un valor caiga fuera de la lnea de accin. Si el proceso se detiene cuando dos medidas consecutivas caen fuera de
la lnea de aviso, entonces el LMR cae a una ca. de 25. Estos valores son
bastante grandes: por ejemplo esto sera serio si un laboratorio prosigue con
un anlisis de un pesticida durante 25 das antes de constatar que el procedimiento haba desarrollado un error sistemtico. Esto representa una desventaja significativa de los diagramas de Shewhart. Un ejemplo del problema
se muestra en la Tabla 4.3, un conjunto de medidas para las cuales el valor
objetivo es 80, y
es 2.5. Cuando la media muestra1 se representa en un

;;,

1(J;;

(J;;

;;.

01
(")

o:.
01

o..
o..
ro
6!

Ul

:3

ro

o..

o:.
01
Ul

01
~

~,
r-+

:S'
01

Ul

Ejemplo de datos para clculos de sumacu.

Tabla 4.3.

90

Nmero de
observacin

Media
muestra/

Media muestra/,"
valor objetivo

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

82
79
80
78
82
79
80
79
78
80
76
77
76
76
75

2
-1

Sumacu

2
1
1
-1
1

O
-2
2
-1

O
O

-1
-3
-3
-7
-10
-14
-18
-23

-1
-2

O
-4
-3
-4
-4
-5

diagrama de Shewhart (Figura 4.5) queda claro que a partir de aproximadamente la sptima observacin en adelante puede haber ocurrido un cambio
en la media del proceso, sin embargo todos los puntos quedan sobre o dentro
de la lnea de aviso. (Slo las lneas inferiores de aviso y de accin se muestran en la figura.)
El LMR puede reducirse significativamente utilizando un tipo de diagrama de control diferente, un diagrama de sumas acumuladas o sumacu
(<<cusum). Esta aproximacin se ilustra de nuevo con los datos de la Tabla
4.3. El clculo de la sumacu se muestra en las dos ltimas columnas de la
tabla, que muestra que la suma de las desviaciones de la media muestra1 a
partir del valor objetivo en adelante se realiza de forma acumulada, prestando cuidadosa atencin a los signos de las desviaciones. Si un proceso de fabricacin o anlisis est bajo control, las desviaciones positivas y negativas
del valor objetivo son igualmente probables y la sumacu oscilara alrededor
84

(/)

'5
<D
E
(/)

ro

>

72
70

11

13

Nmero de muestra

Figura 4.5.

Diagrama de Shewhart para los datos de la Tabla 4.3.

15

91

:::l
()

ltl

:::l

(j)

9 10 11 12 13 14 15

Nmero de observacin

Figura 4.6.

Diagrama sumacu de los datos de la Tabla 4.3.

de cero. Si la media del proceso cambia, la sumacu se alejar del cero. En el


ejemplo propuesto, la media del proceso parece que cae despus de la sptima
observacin, de manera que la sumacu se hace cada vez ms negativa. En la
Figura 4.6 se muestra la carta de control resultante.
La adecuada interpretacin de los diagrams sumacu, que muestran que ha
ocurrido un cambio genuino en la media del proceso requiere un delimitador V. El delimitador se graba en una transparencia, y se coloca sobre el
diagrama de control con su eje de simetra horizontal y su vrtice a una distancia, d a la derecha de la ltima observacin (Figura 4.7). Se dice que el
(a)

:::l
()

ltl

E
:::l

(j)

(b)

e
e

~I

:::l

(j)

Nmero de observacin

O r--.=---~---'."---------=:'"""",,,,-----------

e
e

Figura 4.7. (a) Uso de un delimitador V con el proceso bajo control. (b) Uso de un delimitador
V con el proceso fuera de control.

92

proceso est bajo control si todos los valores del diagrama caen dentro de los
brazos de la V (Figura 4.7a). El delimitador tambin se caracteriza por tg 0,
la tangente del semingulo, 0, entre los brazos de la V. Los valores de d y tg e
se eligen de manera que se detecten con rapidez cambios significativos en la
media del proceso, no obstante las falsas alarmas son escasas. La unidad de
d es la distancia entre las observaciones sucesivas. El valor utilizado de tg ()
depende claramente de las escalas relativas de los dos ejes en el diagrama: un
convenio que se emplea con frecuencia consiste en construir la distancia entre las observaciones sucesivas del eje x igual a 2(j / ~ del eje g. Un delimitador V con d = 5 unidades y tg 0= 0.35 proporciona entonces una LMR de
10 si la media del proceso cambia por 1(j/~ y slo 4 si el cambio es 2(j/~.
La LMR para un cambio cero en la media del proceso, es decir, antes de que
ocurra una falsa alarma, es aproximadamente 350. Las cifras correspondientes para un diagrama de Shewart son aproximadamente 25 (para un cambio
en la media de 1(j /~) y 320, de manera que resulta claro que el diagrama
sumacu es superior en ambos aspectos. La LMR proporcionada por el diagrama sumacu se puede reducir en torno a 8 (para un cambio de 1(j /~) utilizando tg () = 0.30, pero inevitablemente entonces crece la posibilidad de una
falsa alarma, ocurriendo una vez en aproximadamente 120 observaciones.
En resumen, los diagramas sumacu presentan la ventaja de que responden con ms rapidez que los diagramas de Shewart a un cambio en la media
del proceso (como muestra claramente la Figura 4.6), sin incrementar las posibilidades de una falsa alarma. El punto donde cambia la pendiente en un
diagrama sumacu indica el punto donde ha cambiado la media del proceso,
indicando el valor de la pendiente el tamao del cambio. Naturalmente, si
un diagrama sumacu sugiere que ha ocurrido un cambio en la media del proceso se deben comprobar los posibles cambios en (j. Esto se puede hacer utilizando un diagrama de Shewart, no obstante tambin se pueden dibujar los
diagramas sumacu para rangos. En las referencias al final del captulo se proporcionan ms detalles sobre los usos de los diagramas de control.

4.10.

Esquemas de pruebas de suficiencia

La calidad de las medidas analticas se refuerza a travs de dos tipos de esquemas de ensayo, en cada uno de los cuales una serie de laboratorios
podran participar simultneamente. En el primero de ellos, esquemas de
ensayo de suficiencia (ES), se envan partes alcuotas de materiales homogneos a una serie de laboratorios para que se hagan anlisis a intervalos
regulares (cada pocas semanas o meses), y se informa sobre los datos resultantes a un organizador central. Cada laboratorio analiza su parte utilizando
su propio mtodo habitual, y el material circulado se disea para que las
muestras se puedan volver a juntar. Los resultados de todos los anlisis circulan entre todos los participantes, beneficindose de conocer cmo se comparan sus medidas con las dems, cmo sus propias medidas mejoran o se
deterioran con el tiempo, y cmo sus propias medidas se comparan con un
estndar de calidad interno. En resumen, el objetivo de dichos esquemas es
la evaluacin de la capacidad de los laboratorios analticos. Los esquemas ES

se han desarrollado ahora para el uso en un amplio rango de campos de


aplicacin incluyendo varias reas de la qumica clnica, anlisis de aguas,
diferentes tipos de anlisis de comidas y bebidas, anlisis forense, etc. La
experiencia demuestra que en dichos esquemas surgirn resultados ampliamente divergentes, incluso entre laboratorios experimentados y bien equipados tanto de medios materiales como humanos. En uno de los anlisis
clnicos ms comunes, la determinacin de glucosa en sangre al nivel mM,
la mayora de los resultados obtenidos para una nica muestra de sangre se
aproximan a una distribucin normal con valores entre 9.5 y 12.5 mM, un
intervalo en s mismo de rango poco considerable. Pero el rango completo de
resultados fue de 6.0 a 14.5 mM, es decir, algunos laboratorios obtuvieron
valores casi 2.5 veces los de otros. Resultan obvias las implicaciones de esta
discrepancia en el diagnstico clnico. En reas de anlisis ms difciles los
resultados pueden ser tan divergentes que no existe ningn consenso autntico entre los diferentes laboratorios. Resulta muy evidente la importancia de
los esquemas ES a la hora de esclarecer dichas diferencias alarmantes, ayudando a minimizarlas y animando a los laboratorios a comparar su eficacia.
Adems, han ayudado de manera incuestionable a mejorar la calidad de los
resultados analticos en muchos campos. Aqu nos centramos slo en la evaluacin estadstica del diseo y resultado de dichos esquemas, y no en los
aspectos administrativos de su organizacin. De especial importancia son los
mtodos de evaluacin del cumplimiento de los participantes y la necesidad
de asegurar que la muestra de la que se extraen las partes alcuotas que circulan sea homognea.
El mtodo recomendado para verificar la homogeneidad de la muestra
conlleva la toma de n ~ 10 partes del material de ensayo al azar, homogeneizndolas separadamente si es necesario, tomando dos muestras de ensayo de
cada parte, y analizando las 2n partes mediante un mtodo cuya desviacin
estndar bajo condiciones de repetibilidad no sea superior al 30 % de la desviacin estndar objetivo (es decir, la reproducibilidad esperada; vase ms
adelante) del esquema de suficiencia. Si la homogeneidad resulta satisfactoria, el anlisis de la varianza de un factor debera entonces demostrar que el
cuadrado medio entre muestras no es significativamente mayor que dentro
de muestras (vase la Seccin 4.3).
Los resultados obtenidos por los laboratorios participantes en un esquema ES se suelen expresar habitualmente como puntuaciones z, donde z viene
dado por (vase la Seccin 2.2):
I

'---

x z_=__

xa

-_-(J~

(4.11)

En esta ecuacin el valor x es el resultado obtenido por un nico laboratorio


para un anlisis dado; X a es el valor asignado para el nivel del analito, y (J es
el valor objetivo para la desviacin estndar de los resultados de ensayo. El
valor asignado X a se obtiene mejor utilizando un material de referencia certificado, si es que hay uno disponible y adecuado para distribuirlo entre los
participantes. En algunos casos esto no es posible, y el valor asignado es el

93

94

valor medio obtenido mediante un nmero de laboratorios expertos seleccionados. Todava en otros casos el nico valor factible asignado es un consenso obtenido a partir de los resultados de la mayora o de todos los laboratorios. Esta ltima situacin resulta de inters ya que, cuando muchos
laboratorios participan en un esquema ES dado, se est seguro de que aparecern una serie de datos sospechosos o anmalos en un ensayo individual.
(Se debera observar que, aunque muchos esquemas ES proporcionan muestras e informan sobre caractersticas de ms de un analito, la experiencia demuestra que un laboratorio que punta bien en un anlisis especfico no necesariamente punta bien en otros.) Este problema se ve solventado bien por
el uso de la mediana (vase el Captulo 6), que es especialmente recomendado para conjuntos de datos pequeos (n < 10), una media robusta (vase el
Captulo 6), o la media del recorrido intercuartL1ico (vase el Captulo 6). Todas estas medidas de localizacin evitan o dirigen los efectos de los resultados dudosos. Se recomienda tambin que se informe de la incertidumbre del
valor asignado a los participantes en el ES. Esto tambin se puede obtener
de los resultados de laboratorios expertos: las estimaciones de la incertidumbre se analizan posteriormente con ms detalle (Seccin 4.12).
El valor objetivo para la desviacin estndar, (1, debera circular de antemano entre los participantes ES junto con un resumen del mtodo por el
cual se ha establecido. Variar con la concentracin de analito, y una aproximacin a estimarlo es utilizar una relacin funcional entre concentracin
y desviacin estndar. La relacin mejor conocida es la trompeta de Horwitz,
fechada en 1982, denominada as por su forma. Utilizando muchos resultados de ensayos de colaboracin, Horwitz demostr que la desviacin estndar relativa de un mtodo variaba con la concentracin, c (e.g. mg g-l), de
acuerdo a la ecuacin emprica y aproximada:
DER

2(1- O.51ogc)

(4.12)

Esta ecuacin conduce a la curva con forma de trompeta mostrada en la


Figura 4.8, que se puede utilizar para derivar valores objetivos de (1 para
cualquier anlisis. Dichos valores objetivos se pueden estimar tambin del
conocimiento previo de las desviaciones estndar normalmente logradas en
el anlisis en cuestin. Otra aproximacin utiliza la falta de ajuste para establecer criterios: si los resultados del anlisis, utilizados de forma rutinaria,
exigen una cierta precisin para que los datos sean interpretados adecuadamente y de forma til, esa precisin proporciona el valor aceptable ms grande (peor) de (1. Resulta una prctica pobre estimar (1 a partir de los resultados
de las rondas previas del esquema ES en s mismo, ya que esto ocultara cualquier mejora o deterioro en la calidad de los resultados con el tiempo.
Los resultados de una nica ronda de un esquema ES se resumen con
frecuencia como se muestra en la Figura 4.9. Si los resultados siguen una
distribucin normal con media X a y desviacin estndar (1, las puntuaciones
z sern una muestra de la distribucin normal estndar, es decir, una distribucin normal con media cero y varianza 1. Por tanto, un laboratorio con
un valor Izl < 2 se considera por lo general que ha funcionado satisfac-

60

95

50
o~

ro-

r-

40

O!

>

30

()

20

o:
O!

'~

~
e

"O

'ro

(])
e

-10

';;;

-20

'o
;
ro

o..
o..

10

ro

(/)

(])

-30
-40
-50
100%

0,1%

1 ppm

1 ppb

1 ppt

Concentracin (e)

Figura 4,8.

La trompeta de Horwitz,

toriamente, un valor de Izl entre 2 y 3 resulta cuestionable, y valores de


Iz I > 3 son inaceptables, Desde luego, incluso los laboratorios con puntuaciones satisfactorias se esforzarn por mejorar sus valores en las rondas posteriores del ES, En la prctica, no es infrecuente encontrar distribuciones de
colas acusadas, es decir, ms resultados de los esperados con z > 2.
Algunos valores se han adjuntado a los mtodos de combinar las puntuaciones z. Por ejemplo, los resultados de un laboratorio en un esquema ES
nico a lo largo de un ao se podran combinar (aunque esto enmascarada
cualquier mejora o deterioro en el funcionamiento sobre el ao), Si el mismo
mtodo analtico se aplica a diferentes concentraciones del mismo analito en
cada ronda del mismo esquema ES, nuevamente una puntuacin compuesta
podra tener un valor limitado. Para este propsito se utilizan dos funciones,
la suma de puntuaciones z rescaladas (SPR), y la suma de puntuaciones
z cuadradas (SPC), dadas por SPR = LiZi/~ y SPC = L,zf, respectivamente. Cada una de estas funciones tiene desventajas, no recomendndose
el uso de las puntuaciones z combinadas.
1

Laboratorio

Figura 4.9.

Resumen de resultados de una nica ronda ES,

96
tT1

~
'

Pi
'<:

.o
e

3'
o
3

ro

:::t
O'
'O

@
.o
e

3'

'

Pi
Pi

:s

a:

()

Pi

4.11.

Ensayos de colaboracin

Como se ha visto, los esquemas de prueba de habilidad permiten que sea controlada, comparada y quiz mejorada la competencia de los laboratorios. En
contraste, un ensayo de colaboracin (Ee) pretende evaluar la precisin
de un mtodo analtico, y a veces su capacidad para proporcionar resultados
libres de sesgo. Consiste normalmente en un nico experimento implicando
a laboratorios expertos y competitivos, los cuales usan por definicin la misma tcnica. Los ensayos de colaboracin quiz se describen mejor como estudios de funcionamiento de mtodos.
Un experimento preliminar crucial es el ensayo de entereza, resistencia
o robustez. Como se vio en el Captulo 1, incluso los experimentos analticos
muy sencillos suponen varios pasos individuales y, quiz, el uso de un cierto
nmero de reactivos. As, muchos factores experimentales (por ejemplo,
temperatura, composicin del disolvente, pH, humedad, pureza de reactivos
y concentracin, etc.) afectarn a los resultados, y es esencial que dichos factores se identifiquen y estudien antes de que se emprenda cualquier ensayo
de colaboracin. En algunos casos un mtodo resulta ser tan sensible a pequeos cambios en un factor, que en la prctica es dificilsimo de controlar
(por ejemplo, reactivos de alta pureza) de modo que el mtodo se rechaza por
ser impracticable antes de que se efecte el EC. En otros casos el ensayo continuar, pero se prevendr a los colaboradores de aquellos factores que deben
ser controlados con ms cuidado. Aunque en el Captulo 7 se expone una
discusin ms completa del diseo experimental, es importante indicar aqu
que puede obtenerse mucha informacin de un nmero relativamente pequeo de experimentos. Supngase que se cree que siete factores experimentales
(A-G) podran afectar a los resultados de un anlisis. Estos factores tienen
que ser probados con (al menos) dos valores, denominados niveles, para ver
si son realmente significativos. As, si se pens que la temperatura afectaba
al resultado, se deben realizar experimentos preliminares a dos temperaturas
(niveles) y comparar los resultados. De manera similar, si la pureza de los
reactivos puede ser importante, se deben realizar experimentos con lotes de
reactivos de alta y baja pureza. Entonces podra pensarse que sern necesarios 2 7 experimentos preliminares para cubrir todas las combinaciones posibles de siete factores a dos niveles. Sin embargo, en la prctica slo ocho
experimentos proporcionarn informacin importante. Los dos niveles de los
factores se denominan + y -, y la Tabla 4.4 muestra cmo estos niveles
estn situados en los ocho experimentos, cuyos resultados se denominan y l'
Yz, oo., Ys. El efecto de alterar cada uno de los factores de su nivel alto a su
nivel bajo se calcula fcilmente. As, el efecto de cambiar B de + a - viene
dado por 011 + Jjz + Ys + Y6)/4 - 013 + Y4 + Y7 + Ys)/4.
Cuando las siete diferencias de los factores (A-G) se hayan calculado en
su totalidad de este modo, es fcil identificar cualquier factor que tenga un
efecto preocupante en los resultados. Se puede demostrar que cualquier diferencia que sea ms de dos veces la desviacin estndar de medidas repetidas
es significativa y debe estudiarse posteriormente. Este simple conjunto de
experimentos, tcnicamente conocido como diseo factorial incompleto,
tiene la desventaja que no se pueden detectar las interacciones entre los factores. Este aspecto se analizar en el Captulo 7.

Tabla 4.4.

Ensayo de entereza, resistencia o robustez para siete factores.

Experimento

2
3
4
5
6
7
8

Factores

Resultado

+
+
+
+

+
+

+
+

+
+

+
+
+

+
+
+
+

+
+

.Y1
12

Y3
Y4
Y5
Y6
Y7
Y8

En los ltimos aos corporaciones internacionales se han movilizado con


vistas a un acuerdo acerca de cmo deben realizarse los EC. Al menos 8 laboratorios (k ~ 8) deben estar involucrados. Ya que la precisin de un mtodo depende normalmente de la concentracin de analito, debera aplicarse
con al menos S niveles diferentes de analito en la misma matriz de la muestra
con medidas duplicadas para cada 'nivel (n = 2). Un requerimiento decisivo
de un EC es que se debera distinguir entre la repetibilidad de la desviacin
estndar, Sr> Y la reproducibilidad de la desviacin estndar, SR' A cada nivel
de analito stas estn relacionadas por la ecuacin:
"

SR

si

S, + 51,
?

(4.13)

donde es la varianza debida a las diferencias interlaboratorios, que reflejan


diferentes grados de sesgo en diferentes laboratorios. Tngase en cuenta que
en este contexto particular, la reproducibilidad se refiere a errores que surgen en diferentes laboratorios y equipamientos, pero utilizando el mismo mtodo analtico: sta es una definicin ms restringida de reproducibilidad que
la utilizada en otros casos. Como se vio en la Seccin 4.3, ANOVA de un
factor puede utilizarse (con clculos distintos a cada nivel de concentracin
utilizada en el EC) para separar las fuentes de variacin de la ecuacin
(4.13). Sin embargo, el uso adecuado de la ecuacin involucra dos supuestos:
(1) que a cada nivel de concentracin la media obtenida en diferentes laboratorios est distribuida normalmente; y (2) que a cada concentracin sea
igual la repetitividad de la varianza entre laboratorios. Ambos supuestos son
probados utilizando mtodos estndar antes de comenzar con los clculos
ANOVA. En la prctica el segundo supuesto, el de la homogeneidad de la
varianza, se prueba primero utilizando el mtodo de Cochran. Estrictamente
hablando, este contraste se disea para detectar varianzas anmalas en vez
de probar la homogeneidad de la varianza como un conjunto, sin embargo
otros mtodos ms rigurosos para el ltimo propsito son ms complejos. El
contraste de Cochran calcula e comparando el rango mayor (es decir, la diferencia entre los dos resultados de un mismo laboratorio) con la suma de
dichos rangos. (Si n > 2 se comparan varianzas en vez de rangos), pero aqu

97

98

se supone que cada laboratorio participante hace slo dos medidas a cada
nivel):
2
W max
2
L.. Wj

e ="

(4.14)

donde j toma valores de 1 a k, el nmero de laboratorios participantes. El


valor de e obtenido se compara con los valores crticos de la Tabla A.15, y
la hiptesis nula, es decir, se rechaza que la varianza ms grande no sea un
valor anmalo, si el valor crtico es mayor que el valor adecuado de k. Cuando se rechaza la hiptesis nula, se descartan los resultados procedentes del
laboratorio en cuestin.
Se contrasta entonces el primer supuesto utilizando el contraste de
Grubbs (Seccin 3.7) el cual se aplica en primer lugar como un contraste
simple de valores anmalos, y entonces (puesto que cada laboratorio realiza
medidas por duplicado) en forma modificada como un contraste por parejas
de valores anmalos. En ambos casos todos los resultados de los laboratorios
que producen resultados anmalos son de nuevo excluidos del ensayo, a no
ser que esto d lugar a prdidas de demasiados datos. Cuando se completan
estos test de valores anmalos, se puede proceder con los clculos ANOVA
como en la Seccin 4.3.
En muchas circunstancias no es posible llevar a cabo un EC completo
como se describi anteriormente, por ejemplo, cuando los materiales de
prueba no estn disponibles en el rango de concentraciones adecuado. En
tales casos se puede usar un sistema ms simple. ste es el mtodo de Youden de pares de parejas o de las dos muestras, en el que a cada laboratorio
participante se le envan dos materiales de composicin similar, X e Y, y se
les solicita que realicen una determinacin de cada uno. Los resultados se
representan como se muestra en la Figura 4.10, representando cada punto
como un par de resultados de un nico laboratorio. Tambin se determinan
los valores medios para los dos materiales, X e y, y se dibujan lneas hori-

Muestra X

Figura 4.10.

Una representacin grfica de Youden para dos muestras.

zontales y verticales a travs del punto (X, Y), este punto divide el diagrama
en cuatro cuadrantes. Este diagrama permite evaluar la existencia en el ensayo de errores aleatorios y sesgo. Si slo existen errores aleatorios, las determinaciones de X e Y pueden dar resultados que son a la vez demasiado
altos, a la vez demasiado bajos, X alto e Y bajo, o X bajo e Y alto. Estos
cuatro resultados podran ser aproximadamente iguales, y el nmero de puntos en cada uno de los cuadrantes sera aproximadamente igual. Sin embargo, si existen errores sistemticos en el laboratorio, es probable que sus
resultados para X e Y sean altos, o bajos. As, si los errores sistemticos predominan, muchos de los puntos estarn en los cuadrantes del diagrama superior derecho e inferior izquierdo. ste es de hecho el resultado obtenido
en muchos casos. En el caso imposible de ausencia de errores aleatorios, todos los puntos deberan caer sobre la diagonal de 45 con los ejes del diagrama, de manera que cuando en la prctica tales errores estn presentes, la
distancia de la perpendicular de un punto desde esa lnea proporciona una
medida del error aleatorio del laboratorio. Adems, la distancia de la interseccin de la perpendicular con la lnea de 45 al punto (X, y) mide el error
sistemtico del laboratorio. Esta sencilla aproximacin a los ensayos de colaboracin es por tanto capaz de proporcionar de forma sencilla una buena
cantidad de informacin. La aproximacin de Youden tiene la ventaja adicional de que los laboratorios participantes no tienden a suprimir una o ms
determinaciones repetidas, pudindose estudiar muchos materiales sin considerar un gran nmero de experimentos.
Los diagramas de Youden proporcionan una buena cantidad de informacin accesible de manera inmediata pero todava se necesitan mtodos de clEl siguiente ejemplo muestra cmo se puede hacer
culo de varianzas s~ y
esto de forma sencilla.

s;.

EJEMPLO 4.11.1
Se determinaron en nueve laboratorios (1-9) los niveles de plomo (en ng g 1) en dos muestras similares (X e l') de formulaciones de leche en polvo para nios, utilizando espectrometra de absorcin atmica con hamo de grafito. Los resultados fueron:
Muestra

X
Y

Laboratorios
1

35.1
33.0

23.0
23.2

23.8
22.3

25.6
24.1

23.7
23.6

21.0
23.1

23.0
21.0

26.5
25.6

21.4
25.0

Evaluar la variacin global entre laboratorios, y sus componentes aleatorios y sistemticos.


En EC de este tipo existe una diferencia entre las muestras as como entre laboratorios.
Por el procedmiento normal, tal situacin debera ser tratada por un ANOVA de dos factores
(ver Seccin 7.4), y esto se hace en algunos casos. Sin embargo, en este ejemplo, hay
solamente dos muestras, elegidas deliberadamente con un contenido analtico similar, de
manera que es escaso el inters en la evaluacin de la diferencia entre ellos. Adems se
pueden hacer los clculos por un .camino que es numrica y conceptualmente ms simple
que un ANOVA de dos factores. Al realizar el clculo se observa que el resultado obtenido

99

100

por cada laboratorio para la muestra X puede incluir un error sistemtico. El mismo error
sistemtico se incluir presumiblemente en aquel resultado de laboratorio para la muestra
y La diferencia D( = X - Y) tendr por tanto eliminado este error, de manera que el intervalo de los valores de D proporcionarn una estimacin de los errores aleatorios o de medida. Similarmente, X e Ypuedr;ln acumularse para dar T, cuya variabilidad proporciona una
estimacin de la variacin global de los resultados. La varianza se estima por:

(D,i=_i
r

y la varianza global,

;,1;\

lJ2
_

(4.15)

2(n-1)

debida a todas las fuentes de error, se estima por:

(lj_7)2
S~=-'.i

(4.16)

2(n - 1)

Ntese que cada una de estas ecuaciones incluye un 2 en el denominador. Esto se justifica
porque Dy Tdan las estimaciones de los errores en dos series de resultados, que se restan
y suman a D y T respectivamente. Los resultados de este ensayo puede expresarse en una
tabla como sigue:

Y
D

35.1
33.0
2.1
68.1

23.0
23.2
-0.2
46.2

23.8
22.3
1.5
46.1

25.6
24.1
1.5
49.7

23.7
23.6
0.1
47.3

21.0
23.1
-2.1
44.1

23.0
21.0
2.0
44.0

26.5
25.6
0.9
52.1

21.4
25.0
-3.6
46.4

La tercera y cuarta filas de la tabla pueden utilizarse para demostrar que l) = 0.244 Y
T= 49.33. Las ecuaciones (4.15) y (4.16) muestran que la varianza global y la varinza de
las medidas son (5.296)2 y (1.383)2, respectivamente. Pueden ser comparadas corno de costumbre utilizando el contraste F, dando F = 14.67. El valor crtico, Fe.a, es 3.44(P = 0.05),
de manera que la variacin entre laboratorios no puede ser debida a errores aleatorios. El
componente debido al sesgo, SL' viene aqu dado por:
(4,17)

Ntese de nuevo la aparicin del 2 en la Ecuacin (4.17), porque se estudian dos muestras.
Es fcil calcular que la estimacin de .si es (3.615f. La media de todas las medidas es
49.33/2 = 24.665, de manera que la desviacin estndar relativa es (100 x 5.296)/
24.665 = 21.47%. ste parece ser un valor alto, pero la relacin de la trompeta de Horwitz
predecira un valor incluso ms alto de ca. 28% a este nivel de concentracin. Debera
hacerse constar que los posibles valores anmalos no se consideran en el procedimiento de
Youden, de manera que la posibilidad de rechazo de los resultados del laboratorio 1 no
prospera,

4.12.

Incertidumbre

En el Captulo 1 se aprendi que los procedimientos analticos se encontrarn afectados tanto por errores aleatorios como por sesgo. En los ltimos
aos UIl nmero cada vez mayor de qumicos analticos ha ido reconociendo

la importancia de proporcionar para cada anlisis un nico nmero que describa su efecto combinado. La incertidumbre de un resultado es un parmetro que describe un intervalo dentro del cual se espera que se encuentre
la cantidad medida, teniendo en cuenta todas las fuentes de error. El concepto se encuentra muy asentado en las medidas fsicas. Su valor en la qumica
analtica resulta tambin innegable, aunque ciertas preguntas y controversias
permanecen acerca de la facilidad de su interpretacin por parte de organismos pblicos, asociaciones profesionales y el pblico profano, as como sobre
los mejores mtodos para calcularlo. Para expresar la incertidumbre se emplean dos smbolos. La incertidumbre estndar (u) expresa el concepto como una desviacin estndar. La incertidumbre expandida (U) define un
intervalo que abarca una fraccin grande de valores dentro de los cuales caer la cantidad que se est midiendo y se obtiene multiplicando u por un factor de cobertura, k, elegido segn el grado de confianza exigido para el rango, es decir, U = u x k. Puesto que u es anloga a una desviacin estndar,
si le es 2 (ste es el valor por defecto generalmente tomado si no se da otra
informacin), entonces U proporciona aproximadamente una mitad del
intervalo de confianza del 9S %.
En principio, se encuentran disponibles dos aproximaciones bsicas para
estimar la incertidumbre. La aproximacin de abajo hacia arriba identifica
cada etapa separada de un anlisis, incluyendo siempre que sea posible fases
de muestreo, asigna errores aleatorios y sistemticos apropiados a cada una
de ellas, y luego combina estas componentes utilizando las reglas resumidas
en la Seccin 2.11 para proporcionar un valor de u global. Sin embargo, por
una serie de razones este proceso puede no ser tan simple como parece. El
primer problema es que incluso los procesos analticos simples pueden conllevar muchos pasos experimentales individuales y posibles fuentes de error.
Es fcil pasar por alto algunas de estas fuentes y, por tanto, llegar a un valor
de incertidumbre muy optimista. Si todas las fuentes de error se identifican
por completo, entonces el proceso del clculo global resultar bastante largo.
Ejemplos de fuentes de error que se deberan considerar pero que se omiten
con facilidad, incluyen sesgo del operador; sesgo del instrumento, incluyendo
el transporte de muestra; suposiciones relativas a la pureza del reactivo; uso
de aparatos volumtricos a una temperatura diferente de aquella a la que se
calibraron; cambios en la composicin de la muestra durante el anlisis, bien
debidos a la contaminacin o debidos a la inestabilidad inherente; uso de calculadoras o computadoras con prestaciones inadecuadas o con el modelo estadstico aplicado equivocado, etc. Todos estos factores puede que surjan
adems de los errores aleatorios que inevitablemente ocurren en las medidas
repetidas. Mientras que los ltimos se pueden estimar directamente mediante medidas repetidas, algunos de los sistemticos puede que no sean inherentes al experimento, y tengan que ser estimados empleando la experiencia, o
la informacin de los fabricantes del equipo tales como los certificados de
calibracin o las especificaciones del instrumento.
Otro problema es que, como se demostr en el Captulo 2, los errores sistemticos no se prestan inmediatamente por ellos mismos al tratamiento estadstico en la misma forma que los aleatorios. Entonces, cmo se pueden
combinar con los errores aleatorios para proporcionar un valor global u?
(Todava resulta una buena prctica minimizar los errores sistemticos me-

101

102

diante el uso de materiales de referencia y estndar, pero an se incluiran


los errores implicados en ese proceso de correccin en la estimacin de la
incertidumbre global.) El mtodo habitual de manejar los errores sistemticos es tratarlos como procedentes de una distribucin rectangular. Supngase, por ejemplo, que un fabricante manifiesta que la pureza de un reactivo
es 99.9 0.1 %. Esto no significa que la pureza del reactivo en su recipiente
vare aleatoriamente con una desviacin estndar del 0.1 %: significa que la
pureza del reactivo en una nica botella se encuentra entre 99.8 % Y 100 %.
Esto es, cualquier botella lleva asociado un error sistemtico, y no hay razn
para suponer que la pureza real se encuentre ms prxima al 99.9 % que a
cualquier otro valor en el rango 99.8-100.0 %. En tales casos, la contribucin
a la incertidumbre estndar se obti~ne dividiendo el error por j3, dando un
valor de 0.1/j3 = 0.0577, Y este valor se combina con otras contribuciones
como si procediese de una fuente de error aleatorio.
Un problema adicional, cuyo alcance parece que no se ha investigado por
completo, es que las reglas para combinar errores proporcionadas en el
Captulo 2 suponen que las fuentes de los errores son independientes. En realidad parece muy posible que esto no sea siempre cierto. Por ejemplo, si una
serie de experimentos se llevan a cabo durante un perodo en el cual la temperatura del laboratorio flucta, dichas fluctuaciones podran tener varios
efectos, como alterar la capacidad de aparatos volumtricos, causar prdidas
de muestra a travs de la volatilidad, afectando a la sensibilidad de detectores
pticos o electroqumicos, etc. Puesto que todos estos errores surgiran de
una nica fuente, se encontraran correlacionados, y estrictamente hablando
no se podran combinar empleando frmulas simples. En dichos casos la incertidumbre real podra ser menor que el valor u calculado sobre la hiptesis
de errores independientes.
Globalmente, la aproximacin de abajo hacia arriba para las estimaciones
de la incertidumbre puede consumir demasiado tiempo para muchos propsitos. Es posible que en algunos laboratorios no sea necesario realizar dichos
clculos muy a menudo, ya que una estimacin de la incertidumbre realizada
con detalle para un anlisis puede servir como modelo para otros anlisis a
lo largo de un perodo de tiempo. Pero en otros casos, de manera ms obvia
cuando estn presentes cuestiones legales o de regulacin (ver ms adelante),
esto no ser suficiente y una estimacin de la incertidumbre se tendr que
proporcionar para cada muestra en copflicto. A pesar de esto, la aproximacin de abajo hacia arriba es la que recomiendan actualmente muchas autoridades.
Una aproximacin completamente diferente es el mtodo de arriba hacia abajo, que busca emplear los resultados de los esquemas de ensayo de
suficiencia en una serie de laboratorios (vase la Seccin 4.10) para proporcionar estimaciones de las incertidumbres globales de las medidas sin intentar necesariamente identificar cada fuente individual de error. Claramente,
el mtodo slo se aplica en reas donde se encuentran disponibles los datos
de esquemas de suficiencia ejecutados correctamente, aunque el nmero de
dichos esquemas se est extendiendo con rapidez y puede, por tanto, proporcionar una alternativa real a los mtodos de abajo hacia arriba en muchos
campos. Se puede argumentar que los valores de incertidumbre calculados de
esta forma son ms realistas que los valores de los mtodos de abajo hacia

arriba, y hay un gran ahorro de esfuerzo, ya que los resultados del esquema
ES (pruebas de suficiencia) proporcionan directamente estimaciones de la
incertidumbre. Por otra parte, los esquemas ES emplean varios mtodos analticos, as que razonablemente se podra decir que la incertidumbre de los
resultados de un laboratorio que tiene dilatada experiencia en un nico mtodo podran ser mejores (ms pequeos) que los resultados ES sugeriran.
De nuevo, los esquemas ES utilizan materiales de una nica muestra preparados con gran cuidado. Por tanto, se podran pasar por alto algunos errores
de muestreo que ocurriran en un anlisis genuino.
Estos problemas han conducido a algunos organismos a proponer mtodos ms simples, explcitamente diseados para minimizar la carga de trabajo en laboratorios que emplean una serie de procedimientos analticos. En
una de esas aproximaciones los principios bsicos son: (1) Los errores sistemticos no se incluyen en las estimaciones de la incertidumbre, pero se
establecen empleando materiales de referencia como es habitual y as se corrigen o eliminan. (2) Se toman al menos 10 medidas replicadas sobre muestras autnticas estables y bien caracterizadas o sobre materiales de referencia.
(Esto implica nuevamente que las incertidumbres del muestreo no se incluyan en las estimaciones.) (3) Las incertidumbres se calculan de las
desviaciones estndar de las medIdas realizadas en condiciones de reproducibilidad internas, es decir, con analistas diferentes, utilizando concentraciones
diferentes (incluyendo cualquiera que sea relevante a los requerimientos legales), y en todas las matrices relevantes. Estas condiciones se supone que
reproducen mimticamente aquellas que se presentan en un laboratorio en
las operaciones diarias. Se realiza alguna provisin en aquellas circunstancias en que no se puedan lograr las condiciones de reproducibilidad (por
ejemplo, donde las muestras sean intrnsecamente inestables). Este mtodo
parece ser muy simple, pero puede ser adecuado: de hecho, puede ser el nico mtodo practicable en algunos casos.
Las estimaciones de la incertidumbre son importantes no slo para cualquiera que haya suministrado una muestra para su anlisis y que exija un
intervalo de valores donde debera caer la concentracin verdadera del analito. Tambin son valiosas para demostrar que un laboratorio tiene la capacidad para realizar anlisis de significacin legal o estatutaria. Una vez que
en un laboratorio dado se conoce un valor de incertidumbre para un anlisis
concreto, resulta simple interpretar los resultados con relacin a tal referencia o a otros lmites de especificacin. La Figura 4.11 muestra cuatro situaciones posibles, donde se supone que se ha utilizado un factor de cobertura
de 2 para determinar U al nivel del 95 % (el intervalo del 95 % se muestra
mediante las flechas dobles verticales), y donde se han especificado tanto el
lmite superior como el inferior para la concentracin del analito. Estos lmites se indican mediante lneas horizontales.
En el caso A, el intervalo de incertidumbre cae completamente entre los
lmites superior e inferior especificados, de manera que se ha logrado la conformidad con la especificacin. En el caso B, el intervalo al 95 % se extiende
ms all del lmite superior, de manera que aunque es ms verosmil que no
haya conformidad, no se puede verificar completamente al nivel del 95 %. En
el caso e la conformidad es muy improbable, aunque no imposible, y en el
caso D es claro que no 10 cumple.

103

104

t
t

Figura 4.11. El uso de la incertidumbre para contrastar conformidad con los lmites
de especificacin.

Aunque ninguna de las aproximaciones para estimar las incertidumbres


es ideal, y aunque el trmino en s mismo an provoca controversia (algunos
qumicos analticos creen que es demasiado negativo o pesimista en sus implicaciones para el pblico profano), parece seguro que los clculos de incertidumbre crecern en importancia en el futuro.

4.13.

Muestreo de aceptacin

Las secciones anteriores de este captulo han demostrado cmo la calidad de


los resultados analticos obtenidos en un laboratorio se puede controlar mediante procedimientos de control de calidad interno y la participacin en esquemas de ensayos de suficiencia. Tambin se ha demostrado cmo el concepto de incertidumbre se ha diseado para ayudar a la interpretacin de los
resultados analticos que realizan los clientes, incluyendo las autoridades reguladoras. En esta seccin se considera otro problema importante que concierne tanto a los analistas como a sus clientes llamado muestreo de aceptacin. En los captulos anteriores se han analizado ya los principios
estadsticos simples que intervienen en esta problemtica. Supngase que al
fabricante de un producto qumico se le exige asegurar que no contenga ms
de un cierto nivel de una impureza concreta. Esto se llama nivel de calidad
aceptable (NCA) del producto y viene dado por el smbolo J10. La intencin
del fabricante para asegurar que este nivel de impureza no sea superado se
controla ensayando lotes del producto. Cada ensayo conlleva n partes de ensayo, cuyo nivel medio de impureza es como se ha visto. La variacin entre
partes, eJ, se suele conocer de la experiencia previa. El problema prctico que
surge es que, incluso cuando un lote de material fabricado tiene un nivel de
impureza de J10, Y es, por tanto, satisfactorio, valores de superiores a J10
aparecern en el 50 % de los anlisis. Por tanto, el fabricante establece un
valor crtico para
dado por el smbolo .X=o. El lote ser rechazado para un
valor de > o. Este valor crtico es mayor que 110, asegurando de este modo
que el fabricante se expone slo a un riesgo pequeo de rechazar un lote
satisfactorio.

x x

x,

Al mismo tiempo el cliente desea minimizar el riesgo de aceptar un lote


con un nivel medio de impureza superior a 110' Esto se puede logr8r fijando
un nivel de calidad de tolerancia (NCT) acordado, 11[, que tenga una pequea probabilidad de aceptacin. El objetivo del muestreo de aceptacin es
que el valor crtico .\:0 minimice el riesgo tanto para el cliente como para el
fabricante. Al mismo tiempo se desea asegurar que 11 no sea ms grande de
lo necesario. Esto se puede conseguir utilizando las propiedades de la distribucin en el muestreo de la media, dado que (j es conocida.
Supngase que el fabricante acepta un riesgo del S % ele rechazar un lote
del producto qumico que de hecho sea satisfactorio, es decir, un lote para el
cual _~ > ,X lh incluso aunque 11 = JIo. Entonces se puede escribir:

(4.18)

El valor 1.64 se puede encontrar en la tabla A.2 (ver tambin la Seccin 2.2).
Supngase tambin que el cliente est preparado para aceptar un riesgo del
10 % de aceptar un lote con la impureza en el NCT. Entonces se puede escribir de manera similar:

CXo - III)/(a/~) = -1.28

(4.19)

Puesto que en la prctica los valores de Jlo Y II! se habrn acordado de antemano, las ecuaciones (4.18) y (4.19) proporcionan ecuaciones simultneas
que se pueden resolver para obtener n y ~xo'

EJEMPLO 4.13.1
. Determnese n y Xo para el caso donde el NCA y el NCT son 1.00g kg -1 Y 1.05 9 kg - 1
de impureza, respectivamente, los riesgos del fabricante y del cliente son del 5% y 10%,
respectivamente, y (J es 0.05 9 kg -- l.
.
La solucin a este problema conlleva el uso de las ecuaciones (7.10) Y (7.11) con Po Y
{11 tomando los valores de 1.00 y 1.05,' respectivamente. Mediante la transformacin de
estas ecuaciones se puede escribir:
n = [(1.64

Xo

+ 1.28)Q;05/(1.05 - 1.00)]2

[(1.64 x 1.05)

+ (1.28

1.00)/(1.64 + 1.28)

Estas ecuaciones proporcionan n = 2.92 2 = 8.53, que se redondea a un tamao muestral


de 9, y Xo = 3.00212.92= 1.028. Por tanto, un valor crtico del 1.028% de impureza y tamao muestral de 9 proporci~nar tanto al fabricante como al cliente la seguridad necesaria.

105

106

Bibliografa
Lawn, R. E., Thompson, M. and Walker, R. F. 1997. Proficiency Testing in
Analytical Chemistry, Royal Society of Chemistry, London. (Un claro y
actualizado tratado de esquemas ES.)
Massart, D. L., Vandeginste, B. G. M., Buydens, L. M. C., de long, S., Lewi,
P. J. and Smeyers-Verbeke, J. 1997. Handhook of Chemometrics and Qualimetrics, Part A. Elsevier, Amsterdam. (Extenso tratamiento de muchos
tpicos relacionados con la calidad.)
Montgomery, D. C.1985. Introduction to Statistical Quality Control. Wiley,
New York. (Un texto general clsico de la estadstica del control de calidad.)
Pritchard, E. 1995. Quality in the Analytical Chemistry Lahoratory, Wiley,
Chichester. (Introduccin clara de los aspectos generales de la calidad,
con discusin de la incertidumbre.)
Wernimont, G. T. and Spendley, W. 1985. Use of Statistics to Develop and
Evaluate Analytical Methods. AOAC, Arlington, USA. (Constituye la
continuacin de ms relevancia sobre la obra de Youden y Steiner.)
Youden, W. J. and Steiner, E.H. 1975. Statistical Manual of the Association
of Official Analytical Chemists. AOAC, Arlington, USA. (Texto clsico
con mucho nfasis sobre los ensayos de colaboracin.)

Ejercicios
1.

Se proponen dos esquemas de muestreo para una situacin en la que se


sabe, de anteriores experiencias, que la varianza muestral es 10 y la varianza de las medidas 4 (en unidades arbitrarias).
Esquema 1:
Esquema 2:

Tomar cinco incrementos de muestra, mezclarlos y realizar un anlisis por duplicado.


Tomar tres incrementos de muestra y realizar un anlisis
por duplicado de cada.

Demostrar que la varianza de la media es la misma para ambos esquemas.


Qu relacin entre el coste de muestreo y el coste del anlisis debe
sobrepasarse para que el segundo esquema sea ms econmico?
2.

Los datos de la tabla adjunta dan la concentracin de albmina medida


en el suero sanguneo de un adulto. Se tom una muestra de sangre durante cuatro das consecutivos y se determin la concentracin de albmina en el suero por triplicado.

Oa
1
2
3
4

Concentraciones
63
57
50
57

de albmina (normalizada, umdades arbitrarias)


61
62
56
56
46
46
54
59

Demostrar que la concentracin media para los diferentes das difiere


significativamente. Estimar la varianza de la variacin da a da (es
decir, la variacin muestra},,).
3.

Para estimar las varianzas de medidas y muestreos se determin la concentracin de halofuginona en hgado de pollo, se tomaron cuatro incrementos de muestra de diferentes partes del hgado y se tomaron medidas
por triplicado sobre cada una de ellas. Se obtuvieron los siguientes resultados (mg Kg- 1):
Muestra

Medidas repetidas

0.25
0.22
0.19
0.24

e
D

0.22
0.20
0.21
0.22

0.23
0.19
0.20
0.22

Verificar que la varianza muestral es significativamente ms grande que


la varianza de las medidas y estimar ambas varianzas.
Se proponen dos posibles esquemas de muestreo:
Esquema 1:
Esquema 2:

Tomar seis incrementos de muestra, mezclarlos y hacer las


medidas por cuadruplicado.
Tomar tres incrementos de muestra y sobre cada uno hacer las medidas por duplicado.

Calcular la varianza total de la media para cada esquema.


4.

Para estimar la capacidad de un proceso, se tomaron medidas sobre seis


muestras de tamao 4, como se muestra en la tabla adjunta (en la prctica se necesitaran al menos 25 de tales muestras). Estimar la capacidad
del proceso, s. Si el valor del objetivo es 50, calcular las posiciones de las
lneas de accin y de aviso de un diagrama de Shewhart para la media
muestral y el rango.
Muestra
1
2
3
4
5
6

5.

48.8
48.6
48.2
54.8
49.6
54.8

Valores
50.8
50.6
51.0
54.6
54.2
54.8

51.3
49.3
49.3
50.7
48.3
52.3

47.9
49.7
50.3
53.9
50.5
52.5

En un ensayo de colaboracin, dos muestras muy similares de aceite (A


y B) fueron enviadas a 15 laboratorios, cada uno de los cuales realizaron
una determinacin del nivel de cadmio en cada muestra utilizando la
tcnica de emisin de plasma por acoplamiento inductivo. Se obtuvieron
los siguientes resultados:

107

108

Laboratorio

Niveles de Cadmio (ppm)


A
8

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

8.8
3.8
10.1
8.0
5.0
5.2
6.7
9.3
6.9
3.2
9.7
7.2
6.5
9.7
5.0

10.0
4.7
12.1
11.0
4.7
6.4
8.7
9.6
7.5
2.8
10.4
8.3
6.8
7.2
6.0

Dibujar el diagrama de dos muestras con estos datos, y comentar la principal fuente de error en el ensayo de colaboracin. Estimar la varianza
global, la varianza de la medida y el componente de error sistemtico de
la varianza de los resultados.
6.

El valor objetivo para un anlisis particular es 120. Si los ensayos preliminares muestran que las muestras de tamao 5 dan un valor de 7, establecer los diagramas de Shewhart de la media y del rango para muestras del mismo tamao.

7.

Una muestra de sangre de control de calidad interno, utilizada para


probar la exactitud de determinaciones de alcohol en sangre, contiene
80.0 mg 100 ml- l de etanol. Se hicieron medidas sucesivas diarias del
nivel de alcohol en la muestra utilizando cuatro rplicas. La precisin
(capacidad del proceso) del mtodo es 0.6 mg 100 mI l. Se obtuvieron
los siguientes resultados:
Da

Concentracin (mg 100 m ')

1
2
3
4
5
6
7
8
9
10
11
12
13

79.8
80.2
79.4
80.3
80.4
80.1
80.4
80.2
80.0
79.9
79.7
79.6
79.5

Da

Concentracin (mg 100 mf ')

14
15
16
17
18
19
20

79.3
79.2
79.3
79.0
79.1
79.3
79.1

Dibujar el diagrama de Shewhart para la media, el diagrama de cusumas


para estos resultados y comentar los resultados obtenidos.

109

Mtodos de calibracin
en anlisis instrumental:
regresin y correlacin

5.1.

Introduccin: anlisis instrumental

Las tcnicas de anlisis clsicas o qumica hmeda como volumetras y gravimetras continuan utilizndose en muchos laboratorios y an se ensean
ampliamente en cursos de Qumica Analtica. Dichas tcnicas suministran
excelentes introducciones a la manipulacin y otras prcticas requeridas en
el trabajo analtico, son ideales para anlisis de alta precisin, especialmente
cuando estn involucrados un pequeo nmero de muestras, y algunas veces
son necesarias para anlisis de materiales patrn. Sin embargo, no hay duda
que muchos anlisis se llevan a cabo en este momento por mtodos instrumentales. Tcnicas que utilizan espectroscopa de absorcin o emisin a varias longitudes de onda, diferentes mtodos electroqumicos, espectrometra
de masas, cromatografa gaseosa y lquida, mtodos radioqumicos y trmicos, probablemente suponen al menos el 90 % de todo el trabajo analtico
actual. Hay varias razones para esto.
En primer lugar, los mtodos instrumentales pueden realizar anlisis que
son difciles o imposibles por los mtodos clsicos. Mientras que los mtodos
clsicos pueden detectar raramente especies qumicas a niveles de sub-microgramos, muchos mtodos instrumentales son sorprendentemente sensibles.
Por ejemplo, en los ltimos aos se han utilizado mtodos de fluorescencia
para detectar molculas orgnicas en volmenes de disolucin muy pequeos. Normalmente slo es posible determinar un analito de una vez mediante mtodos por va hmeda, si bien la espectrometra de plasma puede
determinar diez o ms elementos simultneamente (y a muy baja concentracin). De forma similar, los mtodos que combinan la cromatografa lquida
de alta resolucin con un procedimiento de deteccin espectroscpica pueden identificar y determinar muchos componentes de mezclas orgnicas
complejas en pocos minutos. An ms, el intervalo de concentracin de un
mtodo de anlisis clsico concreto est usualmente limitado por consideraciones tericas y prcticas. As, valoraciones con AEDT pueden ser realiza-

112

das con xito con concentraciones de reactivo del orden de 10- 4 M, sin embargo un lmite superior (ca. 0.3 M) est restringido por la solubilidad del
AEDT en agua. El intervalo de concentracin til en anlisis clsico es generalmente de 2-3 rdenes de magnitud (es decir, potencias de 10). En contraposicin, algunos mtodos instrumentales son capaces de determinar concentraciones de analito en el intervalo de seis o ms rdenes de magnitud:
esta caracterstica tiene importantes repercusiones para el tratamiento estadstico de los resultados, como se ver en la prxima seccin.
En segundo lugar, para una gran variedad de muestras, el anlisis instrumental suele ser ms rpido y a menudo ms barato que la laboriosidad de
los mtodos manuales. En anlisis clnicos, por ejemplo, se presenta con frecuencia la necesidad de realizar el mismo anlisis en una veintena o aun
cientos de muestras de sangre o suero/plasma sanguneo cada da. A pesar
del alto coste inicial del equipo, tal trabajo se realiza generalmente usando
sistemas completamente automatizados. La automatizacin ha llegado a ser
de tal importancia en la qumica analtica, que la facilidad con que una tcnica particular pueda ser automatizada, es la que a menudo determina el que
sea o no usada del todo. Un mtodo automtico tpico ofrece la posibilidad
de procesar muestras a la velocidad de 100 por hora o ms. El equipo tomar
un volumen medido de muestra, la diluir adecuadament,e, provocar una o
ms reacciones con ella, y determinar y registrar la concentracin del analito o un derivado formado en las reacciones. Otras reas donde el uso de
equipamiento automtico es decisivo incluyen el control medioambiental y
el campo del anlisis de los procesos industriales cuyo crecimiento evoluciona con rapidez. En todas estas aplicaciones del anlisis automtico, surgirn
evidentemente problemas especiales de estimacin de errores: errores sistemticos, por ejemplo, deben ser identificados y corregidos tan rpidamente
como sea posible.
En ltimo lugar, los modernos instrumentos analticos estn casi siempre
interconectados con computadoras personales que proporcionan sofisticados
sistemas de control y de almacenamiento, tratamiento (por ejemplo, la prestacin de la transformada de Fourier o clculos de espectros de derivadas) e
informes de datos. Tales sistemas pueden tambin evaluar estadsticamente
los resultados, y para comparar espectros y otra informacin se tienen en
cuenta los resultados analticos y los que existen en libreras de datos. Todos
estos recursos se consiguen actualmente utilizando computadoras de bajo
coste que operan a grandes velocidades. Otra posibilidad importante es el desarrollo de instrumentos inteligentes los cuales incorporan configuraciones
automticas y diagnosis de fallos y pueden realizar procesos de optimizacin
(vase el Captulo 7).
Los procedimientos estadsticos utilizados en anlisis instrumental deben
proporcionar siempre informacin de la precisin y exactitud de las medidas. Deben reflejar adems las ventajas tcnicas de dichos mtodos, especialmente la posibilidad de cubrir un gran intervalo de concentraciones
(incluyendo concentraciones muy bajas), y manejar con rapidez muchas
muestras. (En este captulo no se abordarn mtodos que faciliten la determinacin de ms de un analito. Este tpico se comenta en el Captulo 8.) En
la prctica se calculan los resultados y se evalan los errores de manera que
difieran de los utilizados cuando una medida sencilla se repita varias veces.

5.2.

Grficas de calibrado en anlisis instrumental

El procedimiento habitual es el siguiente. El analista toma una serie de materiales (normalmente al menos tres o cuatro, y posiblemente algunos ms)
de los que se conoce la concentracin de analito. Estos patrones de calibracin
se miden en el instrumento analtico bajo las mismas condiciones que las
utilizadas posteriormente para los materiales de ensayo (es decir, los desconocidos). Una vez establecida la grfica de calibrado, puede obtenerse la
concentracin de analito por interpolacin, como se muestra en la Figura
5.1, en cualquier material de ensayo. Este procedimiento general plantea varias cuestiones estadsticas importantes:
1.

2.

3.

4.

5.

Es lineal la lnea de calibrado? Si es una curva, qu forma tiene dicha


curva?
Teniendo en cuenta que cada uno de los puntos de la lnea de calibrado
est sujeto a errores, cul es la mejor lnea recta (o curva) que pasa por
esos puntos?
Suponiendo que el calibrado es realmente lineal, cules son los errores
y lmites de confianza de la pendiente y ordenada en el origen de la
recta?
Cuando el grfico de calibrado se usa para el anlisis de un material de
ensayo, cules son los errores y lmites de confianza de la concentracin determinada?
Cul es el lmite de deteccin del mtodo? Esto es, cul es la menor
concentracin de analito que puede detectarse con un predeterminado
nivel de confianza?

Antes de abordar estas cuestiones detalladamente, se deben considerar una


serie de aspectos importantes en el trazado de las lneas de calibrado. En primer lugar, resulta habitualmente esencial que los patrones de calibrado cubran el intervalo completo de concentraciones requerido en subsiguientes

ro
'e
Q)

(/)

Concentracin

Figura 5.1. Procedimiento de calibracin en anlisis instrumental: o puntos de calibrado;


muestra de ensayo.

113

114

anlisis. Con la importante excepcin del mtodo de las adiciones estndan>,


que es tratado aparte en una seccin posterior, la concentracin de los materiales de ensayo se determina normalmente por interpolacin y no por
extrapolacin. En segundo lugar, es de importancia decisiva incluir el valor
de un blanco en la curva de calibrado. El blanco no contiene ningn analito adicionado deliberadamente, pero contiene los mismos disolventes, reactivos, etc., que los otros materiales de ensayo, y est sujeto exactamente a la
misma secuencia del procedimiento analtico. La seal del instrumento dada
por el blanco a veces no ser cero. Esta seal est sometida a errores, como
los dems puntos del grfico calibrado, y no tiene sentido, en principio, restar el valor del blanco de los otros valores estndar antes de dibujar la curva
de calibrado. Esto es debido a que, como se mostr en el Captulo 2, cuando
se restan dos cantidades, el error en el resultado final no puede obtenerse
por simple resta. La resta del valor del blanco de cualquier otra seal del
instrumento antes de dibujar el grfico proporciona una informacin incorrecta de los errores del proceso de calibracin. Finalmente, se debe subrayar
que la curva de calibrado se establece siempre con la respuesta del instrumento
en el eje vertical (y) y la concentracin del patrn sobre el eje horizontal (x).
Esto es debido a que muchos de los procedimientos que se describen en las
secciones siguientes suponen que todos los errores residen en los valores de
y y que las concentraciones de los patrones (valores de x) se encuentran libres de error. En muchos anlisis instrumentales rutinarios este supuesto debe justificarse bien. Los patrones pueden ser preparados con un error de
ca. 0.1 % o inferior (vase el Captulo 1), mientras que las medidas instrumentales pueden tener un coeficiente de variacin del 2-3 % o mayor. Por
tanto, el error en el eje x es de hecho despreciable comparado con el del eje
y. Sin embargo, con la llegada en los ltimos aos de algunos instrumentos
automticos de alta precisin con coeficientes de variacin del 0.5 % o menores se han cuestionado estos supuestos, y ha llevado a algunos usuarios a
preparar sus disoluciones patrn por pesada en lugar de usar la combinacin
de peso y volumen, que es menos exacta. Esta aproximacin pretende asegurar que los errores en el eje x son pequeos comparados con los del
ejey.
Otros supuestos que se hacen habitualmente son que (a) si se realizan
varias medidas sobre un material patrn, los valores resultantes de y tienen
una distribucin de errores normal o Gausiana; y (b) que la magnitud de los
errores en los valores de y es independiente de la concentracin de analito.
El primero de estos dos supuestos es normalmente razonable, pero el segundo
requiere una discusin posterior. Si es cierto, implica que todos los puntos
del grfico deberan tener en los clculos igual peso, es decir, que es igualmente importante que la lnea pase cerca de los puntos con valores de y altos
o bajos. Se dice que tales grficas de calibrado son no ponderadas, y se tratan
en las Secciones 5.4-5.8. Sin embargo, en la prctica los errores en el valor
de y aumentan cuando aumenta la concentracin de analito. Esto significa
que los puntos de calibracin no deben tener un peso igual en los clculos,
de manera que es ms importante para la lnea que pase por los puntos donde los errores son menores. Estos clculos ponderados se han convertido en
la actualidad en algo bastante comn a pesar de su complejidad aadida, y
se estudian en la Seccin 5.10.

En las siguientes secciones, se supondr que la recta de calibrado toma la


forma algebraica:
(s.l)
y = a + bx
donde b es la pendiente de la recta y a su ordenada en el origen. Los puntos
individuales sobre la lnea se denotarn por (x], y]), normalmente la lectura
del blanco, (x z, Yz), (x 3, Y3) ... (Xi, yJ ... (X'" y,,), es decir, hay n puntos
como es habitual. La media de los valores de X se designa por y la media
de los valores de y por jj: la posicin (x, jj) se conoce como el centro de
gravedad de todos los puntos.

5.3.

El coeficiente de correlacin momento-producto

En esta seccin se analiza el primer problema planteado en la seccin anterior: es la representacin grfica del calibrado lineal? Para estimar la
bondad con que se ajustan los puntos experimentales a una lnea recta, se
calcula el coeficiente de correlacin momento-producto, r. Para simplificar, a este dato estadstico se le denomina coeficiente de correlacin debido
a que en las ciencias cuantitativas es con mucho el tipo de coeficiente de
correlacin ms usado. No obstante, en el Captulo 6 se encontrarn otros
tipos de coeficientes de correlacin. El valor de r viene dado por:
El coeficiente de correlacin momento-producto,

{(Xi - x) (Yi - jj)}


(5.2)

Puede demostrarse que r puede tomar valores en el intervalo - 1 ::::;; r::::;; + 1.


Como se indica en la Figura 5.2, un valor de r de - 1 describe una correla-

(=+1
o

Figura 5.2.

El coeficiente de correlacin momento-producto, r.

115

116

cin negativa perfecta, es decir, todos los puntos experimentales estn sobre
una recta de pendiente negativa. De manera similar, cuando r = + 1 se tiene
una correlacin positiva perfecta, es decir, todos los puntos estn exactamente sobre una lnea de pendiente positiva. Cuando no existe correlacin
entre x e Ji el valor de r es cero. En la prctica analtica, las grficas de calibrado proporcionan valores numricos de r mayores que 0.99, y valores de
r menores que aproximadamente 0.90 son relativamente poco comunes. Un
ejemplo tpico de un clculo de r aclara una serie de aspectos importantes.
EJEMPLO 5.3.1
Se han examinado una serie de soluciones patrn de fluoresceina en un espectrmetro de
fluorescencia, y han conducido a las siguientes intensidades de fluorescencia (en unidades
arbitrarias):
Intensidades de fluorescencia:
Concentracin, pg ml- 1

2.1
O

5.0
2

9.0
4

12.6
6

17.3
8

21.0
10

24.7
12

Determinar el coeficiente de correlacin, r.


En la prctica, tales clculos pueden ser realizados en una calculadora o computadora, junto
con otros clculos que se expondrn posteriormente, pero es importante e instructivo examinar un resultado calculado manualmente. Los datos se presentan en una tabla, como
sigue:

Sumas:

Xi-X

O
2
4
6
8
10
12

2.1
5.0
9.0
12.6
17.3
21.0
24.7

-6
-4
-2
O
2
4
6

42

91.7

(X- X2

36
16
4
O
4
16
36
112

Yi-

-11.0
-8.1
-4.1
-0.5
4.2
7.9
11.6
O

(Y_ y2

(x- X)(YI- y

121.00
65.61
16.81
0.25
17.64
62.41
134.56

66.0
32.4
8.2
O
8.4
31.6
69.6

418.28

216.2

Los nmeros por debajo de la lnea al pie de las columnas son en cada caso las sumas de
los nmeros de la tabla: ntese que I (XI - X y I (Yi - ..J1 son ambas cero. Usando estos
totales y la Ecuacin -(5.2), se tiene que:

r=

216.2
J112 x 418.28

216.2

= -- =

216.44

0.9989

De este ejemplo se extraen dos observaciones. La Figura 5.3 muestra que,


aunque varios de los puntos se desvan notablemente de la mejor" lnea recta (calculada utilizando los principios de la siguiente seccin), el valor de r
es muy cercano a 1. La experiencia muestra que aun con grficas de calibrado bastante pobres a la vista, aparecen valores correspondientes de r muy
altos. En tajes casos el numerador y denominador en la Ecuacin (5.2) son
aproximadamente iguales. Es entonces muy importante realizar el clculo
con un nmero adecuado de cifras significativas. En el ejemplo dado, des-

25

117

20

Cll

'(3

15

Q)

<.>

en
~

:::J

u::

10

Ordenada en el origen = 1.52

2. 4

10

Concentracin, pg ml-

Figura 5.3.

12
1

Grfica de calibrado de los datos del Ejemplo 5.3.1.

preciar los nmeros despus del punto decimal traera consigo un valor incorrecto de r de exactamente 1, y utilizando solamente una cifra decimal
supondra considerar para r el valor incorrecto de 0.9991. Este aspecto es
especialmente importante cuando se utiliza una calculadora o computadora
para determinar r; es necesario asegurar que tales herramientas proporcionen cifras suficientes.
Aunque los coeficientes de correlacin son simples de calcular, son con
facilidad mal interpretados. Debe tenerse siempre en cuenta que el uso de la
Ecuacin (5.2) generar un valor de r aun cuando los datos muestren de manera patente un carcter no lineal. La Figura 5.4 muestra dos ejemplos en
los que un clculo de r llevara a conclusiones errneas. En la Figura 5.4a,
los puntos del grfico de calibrado pertenecen claramente a una curva; esta
curva es suficientemente suave, sin embargo, se obtiene un alto coeficiente
de correlacin cuando se aplica la Ecuacin (5.2). La leccin que se extrae
de este ejemplo es que siempre se debe representar la curva de calibrado (en
papel milimetrado o en un monitor de computadora); si no es as, se puede
deducir errneamente del clculo de r una relacin de carcter lineal. La
Figura 5.4b pone de manifiesto que un coeficiente de correlacin cero no
significa exactamente que Jj y x no estn relacionadas; slo significa que no
estn linealmente relacionados.
Como se ha visto, los valores de r obtenidos en anlisis instrumental son
normalmente muy altos, de manera que un valor calculado, junto con la
propia grfica de calibrado, suele ser a menudo suficiente para asegurar al
analista que de hecho ha obtenido una relacin lineal til. Sin embargo, en

118

(a)

(b)

Figura 5.4.

Interpretaciones errneas del coeficiente de correlacin, r.

algunas circunstancias, se obtienen valores de r mucho ms bajos; dichas situaciones se analizarn posteriormente en la Seccin 5.9. En estos casos ser
necesario emplear un contraste estadstico adecuado para ver si el coeficiente
de correlacin es realmente significativo, teniendo en cuenta el nmero de
puntos usados en su clculo. El mtodo ms simple de hacer esto es calcular
un valor de t (vase el Captulo 3 para un estudio ms completo del contraste t), usando la siguiente ecuacin:

Para probar una correlacin significativa, es decir, Ha


cero, calcular
t

Irl~
---===-

correlacin

(5.3)

El valor de t calculado se compara con el valor tabulado al nivel de significacin deseado, utilizando un contraste t de dos colas y (n - 2) grados de
libertad. La hiptesis nula en este caso es que no existe correlacin entre x
e y. Si el valor calculado de t es mayor que el valor tabulado, se rechaza la
hiptesis nula y se concluye en tal caso que existe una correlacin significativa. Como se esperaba, cuanto ms prximo est Ir I de 1, es decir,
cuanto ms acusada se haga la relacin lineal, se obtienen valores ms
grandes de t.

5.4. La recta de regresin de y sobre x

119

En esta seccin se supone que existe una relacin lineal entre la seal analtica (y) y la concentracin (x), y se muestra cmo calcular la mejor lnea
recta a travs de los puntos de la grfica de calibrado, cada uno de los cuales
est sujeto a un error experimental. Ya que se ha supuesto que todos los
errores se encuentran en y (vase la Seccin 5.2), ahora se trata de buscar
la recta que minimice las desviaciones en la direccin y, entre los puntos
experimentales y los calculados por la lnea. Ya que algunas de estas desviaciones sern positivas y algunas negativas (conocidas tcnicamente como los
residuos de y; ver ms adelante), es -razonable intentar minimizar la suma
de los cuadrados de los residuos, debido a que estos cuadrados sern todos
positivos. Esto explica el uso frecuente del trmino mtodo de los mnimos
cuadrados para este procedimiento. La lnea recta buscada se calcula basndose en este principio: como resultado se encuentra que la lnea debe pasar
por el centro de gravedad de los puntos c.x:, jj).
Se puede demostrar que la recta de mnimos cuadrados viene dada por:
Pendiente de la recta de mnimos cuadrados:

b=

L {(Xi - .X:) (Yi - jj))


--,--_ _
L (Xi - .X:)2

..c.i

(5.4)

Ordenada en el origen de la recta de mnimos cuadrados:

jj -

bx

(5.5)

Ntese que la Ecuacin (5.4) contiene algunos de los trminos utilizados en


la Ecuacin (5.2), utilizada previamente para calcular r: esto facilita las operaciones de la calculadora o computadora. La lnea determinada por las
Ecuaciones (5.4) y (5.5) se conoce como recta de regresin de y sobre x,
es decir, la recta que indica cmo vara y cuando X se ajusta a los valores
elegidos. Es muy importante hacer constar que la recta de regresin de x sobre y no es la misma recta (excepto en el caso muy improbable en que todos
los puntos caigan sobre una lnea recta, exactamente cuando r = 1
r = -1). La recta de regresin de x sobre y (que tambin pasa por el centro
de gravedad de todos los puntos) supone que todos los errores ocurren en la
direccin de x. Si se mantiene rigurosamente el convenio que la seal analtica se representa siempre sobre el eje y y la concentracin sobre el eje x, la
recta de regresin de y sobre x es la que se debe usar siempre en los experimentos de calibracin.

120

En la Seccin 5.3 se calcul que, para esta curva de calibrado:

2.:J.r,~(y- Yl =
,

216.2;

(x

W=

112;

x= 6; y=

13.1

Usando las Ecuaciones (5.4) y (5.5) se calcula que


b = 216.121112

a = 13.1 - (1.93

= 1.93

x 6) = 13.1 - 11.58 = 1.52

La ecuacin para la recta de regresin es y

1.93x + 1.52.

Los resultados de la pendiente y ordenada en el origen se dibujan en la Figura 5.3. De nuevo es importante recalcar que las Ecuaciones (5.4) y (5.5)
no deben utilizarse mal: darn slo resultados tiles cuando un estudio previo (clculo de r y una inspeccin visual de los puntos) indique que una lnea
recta es coherente con el experimento que se trata.
Para calcular rectas de regresin pueden usarse tambin mtodos no paramtricos (es decir, mtodos que no hacen supuestos acerca de la naturaleza
de la distribucin de error), y este tema se tratar en el Captulo 6.

5.5.

Errores en la pendiente y ordenada en el origen


de la recta de regresin

La recta de regresin calculada en la seccin anterior se u tilizar en la prctica para estimar la concentracin de las muestras de ensayo por interpolacin, y quiz tambin para estimar el lmite de deteccin del procedimiento
analtico. Los errores aleatorios en los valores de la pendiente y ordenada en
el origen son importantes, considerndose ahora las ecuaciones utilizadas para calcularlos. En primer lugar se debe calcular el estadistico .~y/.\, que estima
los errores aleatorios en la direccin /jo

(5.6)

Se comprueba que esta ecuacin utiliza los residuos de g, g; - Yi' donde los
valores de Yi son los puntos sobre la recta de regresin calculada correspondientes a los valores individuales de x, es decir, los valores de y ajustados"
(Figura 5.5). El valor de Y, para un valor de .x dado se calcula rpidamente
a partir de la ecuacin de regresin. La Ecuacin (5.6) es claramente similar
a la forma de la ecuacin de la desviacin estndar de una serie de medidas
repetidas [Ecuacin (2.2)], pero difiere en que las desviaciones, (/ji - jj), se
sustituyen por los residuos, (y; - iJJ, conteniendo el denominador el trmino (n - 2) en vez de (n - 1). En un clculo de regresin lineal el nmero de

121

x
Figura 5.5.

Los residuos de y de una regresin lineal.

5'

CJl

q-

grados de libertad (vase la Seccin 2.7) es (n - 2). Esto refleja el hecho obvio que de dos puntos slo puede obtenerse una lnea recta.
Una vez obtenido un valor de Sy/x, se puede calcular Sb Y Sm l~s desviaciones estndar de la pendiente (b) y ordenada en el origen (a). Estas vienen
dadas por:

Desviacin estndar de la pendiente:

(5.7)

Desviacin estndar de la ordenada en el origen:

(5.8)

Ntese que de nuevo el trmino

(Xi -

X)2 aparece en ambas ecuaciones.

Los valores de Sb Y Sa se pueden utilizar de la manera usual (vase el Captulo 2) para estimar los lmites de confianza de la pendiente y de la ordenada
en el origen. As pues los lmites de confianza de la pendiente vienen dados
por h ten _ 2)Sb! donde el valor de t se obtiene para un nivel de confianza
deseado y (n - 2) grados de libertad. Similarmente los lmites de confianza
para la ordenada en el origen vienen dados por a ten - 2)sa'

ro

::l

122

EJEMPLO 5.5.1
Calcular la desviacin estndar y los lmites de confianza para la pendiente y ordenada en
el origen de la recta de regresin calculada en la Seccin 5.4.
Este clculo puede que no sea realizable dirctamente en una calculadora simple, aunque se encuentran disponibles programas de computadora. Aqu se desarrolla el clculo
manualmente, utilizando una tabla estructurada.
Xi

x3

lf --

O
2
4
6
8
10
12

O
4
16
36
64
100
144

2.1
5.0
9.0
12.6
17.3
21.0
24.7

1.52
5.38
9.24
13.10
16.96
20.82
24.68

0.58
0.38
0.24
0.50
0.34
0.18
0.02

I x3 = 364
i

~,

(f- ~l
0.3364
0.1444
0.0576
0.2500
0.1156
0.0324
0.0004

(f - Ji)'2 = 0.9368

A partir de esta tabla y utilizando la Ecuacin (5.6) se obtiene:


Sylx

= )0.9368/5 =

De la Seccin 5.3 se sabe que


para mostrar que:
Sb

(Xi - jf =

)0.18736

= 0.4329

112. Y la Ecuacin (5.7) puede ser utilizada

= 0.4329/jm = 0.4329/10.58 = 0.0409

El valor de t para (n - 2) = 5 grados de libertad y un nivel de confianza del 95% es 2.57


(Tabla A.2). Los lmites de confianza del 95% para b son. por tanto:
b = 1.93

(2.57

La Ecuacin (5.8) requiere conocer


puede escribir:
S8

x 0.0409) = 1.93

i/.

0.11

calculado de la tabla como 364. Entonces, se

= 0.4329

364

7 x 112 = 0.2950

de manera que los lmites de confianza al 95% son:

a = 1.52 (2.57

x 0.2950)

= 1.52 0.76

En este ejemplo, el nmero necesario de cifras significativas no es grande,


pero es conveniente utilizar siempre el nmero mximo disponible durante
el clculo, redondeando slo al final.
En la prctica no hay necesidad de clculos manuales de estos resultados,
que sern claramente tediosos en tareas rutinarias. La aplicacin a datos de
regresin de un programa con hoja de clculo se demuestra en la Seccin 5.9.
Se deberan aprovechar las ventajas extra proporonadas por programas tales como Minitab, por ejemplo, grficos de los residuos frente a valores de x
o f;, grficos de probabilidad normal para los residuos, etc. (Vase tambin
la Seccin 5.15.)

5.6.

123

Clculo de una concentracin y su error


aleatorio

Una vez que han sido determinadas la pendiente y la ordenada en el origen


de la recta de regresin, es fcil calcular la concentracin (valor de x) correspondiente a cualquier seal medida en el instrumento (valor de y). Sin embargo, tambin ser necesario estimar el error asociado a la concentracin
calculada. El clculo de un valor de x a partir de un valor dado de y utilizando la Ecuacin (5.1) conlleva el uso tanto de la pendiente (h) como de la
ordenada en el origen (a) y, como se vio en la seccin anterior, ambos valores estn sujetos a error. Adems, la seal del instrumento derivada del material de ensayo tambin est sujeta a errores aleatorios. Como resultado, la
determinacin del error global en la concentracin correspondiente es extremadamente compleja y muchos profesionales utilizan la siguiente frmula
aproximada:

(5.9)

En esta ecuacin, Yo es el valor experimental de y a partir del cual se determina el valor de la concentracin x o, sXo es la desviacin estndar estimada
de x o, y los otros smbolos tienen su significado habitual. En algunos casos
un analista puede realizar varias lecturas para obtener el valor de Yo; si se
dispone de m lecturas, entonces la ecuacin para sXo se convierte en:

(5.10)

Como se esperaba, la Ecuacin (5.10) se reduce a la Ecuacin (5.9) si m = 1.


Los lmites de confianza se calculan como X o ten _ 2)S,,0' con (n - 2) grados
de libertad. De nuevo, un sencillo programa de computadora realizar todos
estos clculos, sin embargo muchas calculadoras no sern adecuadas.

124

Para obtener los valores de s"! correspondientes a los valores de Xo utilzamos la Ecuacin
(5.9), recordando de las secciones precedentes que n= 7, b= 1.93, s)1x=0.4329,
y = 13.1, Y (x - ,1)2 = 112. Los valores de Yo 2.9, 13.5 Y23.0 proporcionan valores de

sxo de 0.26, 0.24 Y0.26, respectivamente. Los lmites de confianza correspondientes al nivel
del 95% (/5 = 2.57) son 0.72 0.68, 6.21 0.62, y 11.3 0.68 pg ml- 1, respectivamente.

Este ejemplo aclara un punto importante. Muestra que los lmites de confianza son bastante ms pequeos (es decir, mejores) para el resultado Yo = 13.5
que para los otros dos valores de Yo. El anlisis de la Ecuacin (5.9) confirma
que cuando Yo se aproxima a iJ, el tercer trmino dentro del parntesis se
aproxima a cero, y s'o entonces se aproxima a un valor mnimo. La forma
general de los lmites de confianza para una concentracin calculada se
muestra en la Figura 5.6. Entonces en la prctica, un experimento de calibracin de este tipo proporcionar los resultados ms precisos cuando la seal medida en el instrumento corresponda a un punto prximo al centro de
gravedad de la recta de regresin.
Si se desea mejorar (es decir, acercar) los lmites de confianza en este
experimento de calibracin, las Ecuaciones (5.9) y (5.10) muestran que se
pueden considerar al menos dos aproximaciones. Se puede aumentar n, el
nmero de puntos del calibrado de la recta de regresin, y/o se puede hacer
ms de una medida de Yo, usando el valor medio de m de dichas medidas en
el clculo de Xl). Los resultados de tales procedimientos pueden ser evaluados
considerando los tres trminos dentro del parntesis en las dos ecuaciones.
En el ejemplo anterior, el trmino predominante en los tres clculos es el
primero: la unidad. Se sigue que en este caso (yen muchos otros) puede llevarse a cabo una mejora en la precisin midiendo varias veces Yo Y usando
la Ecuacin (5.10) en lugar de la Ecuacin (5.9). Si, por ejemplo, el valor de
lJo de 13.5 hubiese sido calculado como la media de cuatro determinacio-

ro

'C
ID
(f)

Concentracin

Figura 5.6. Forma general de los lmites de confianza para una concentracin determinada
utilizando una recta de regresin no ponderada.

nes, entonces el valor de s'o y los lmites de confianza habran sido 0.14 y
6.21 0.36, respectivamente, indicando ambos resultados una sustancial
mejora en la precisin. Por supuesto, realizar muchas medidas repetidas (suponiendo que se dispone de suficiente muestra) genera mucho ms trabajo
obteniendo un beneficio adicional pequeo: el lector puede verificar que
ocho medidas de Yo producirn un valor de sxo de 0.12 y lmites de confianza
de 6.21 0.30.
El efecto de n, el nmero de puntos de calibrado, sobre los lmites de confianza en la determinacin de la concentracin es ms complejo. Esto se debe
a que se ha de tener en cuenta tambin los cambios que acompaan al valor
de t. El uso de un gran nmero de muestras de calibrado supone la tarea de
preparar muchos patrones exactos para slo incrementar marginalmente la
precisin (vanse los efectos de incrementar m, descritos en el prrafo anterior). Por otra parte, no es adecuado usar valores de n pequeos. En tales
casos, l/n ser ms grande, y el nmero de grados de libertad (n - 2) se har
muy pequeo, necesitndose valores muy grandes de t en el clculo de los
lmites de confianza. En muchos experimentos, como en el ejemplo dado,
aproximadamente seis puntos de calibrado sern suficientes; si es necesario
el analista ganar precisin extra repitiendo medidas de Jjo.

S'
(J)

2"
3ro

5.7. Lmites de deteccin


Como se ha visto, una de las ventajas de utilizar mtodos instrumentales de
anlisis es que son capaces de detectar y determinar cantidades traza y ultratraza de analito. Estas ventajas han conducido a apreciar la importancia de
concentraciones muy bajas de muchos materiales, por ejemplo, en muestras
biolgicas y medioambientales, contribuyendo de esta manera al desarrollo
de otras muchas tcnicas en las que el mejor criterio de aplicacin con xito
es que posean lmites de deteccin inferiores. Es pues evidente que los mtodos estadsticos resultan importantes para la evaluacin y comparacin de
lmites de deteccin. En trminos generales, el lmite de deteccin (LOD) de
un analito se puede describir como aquella concentracin que proporciona
una seal en el instrumento (y) significativamente diferente de la seal del
blanco o ruido de fondo. Esta descripcin proporciona al analista un
buen margen de libertad para decidir la definicin exacta del lmite de deteccin, basada en una adecuada interpretacin de la frase significativamente
diferente. An no existe un acuerdo total entre investigadores, editores y
asociaciones profesionales y estatutarias sobre este punto. Sin embargo, va
en aumento la tendencia a definir el lmite de deteccin como la concentracin de analito que proporciona una seal igual a la seal del blanco, Ya, ms
tres veces la desviacin estndar del blanco, SB:
Lmite de deteccin (LOD)

125

= YB

+ 3sB

(5.11 )

El significado de esta ltima definicin se aclara con ms detalle en la Figura 5.7. Un analista estudiando concentraciones traza se enfrenta con dos
problemas: es importante informar de la presencia de analito cuando de he-

::J

126

cho est ausente, pero es igualmente importante informar que est ausente
cuando de hecho est presente. (La situacin es anloga a la existencia de
errores Tipo 1 y II en los contrastes de significacin; vase en la Seccin
3.13.) La posibilidad de que ocurra cada uno de estos errores debe minimizarse bajo una definicin precisa de un limite de deteccin. En la figura, la
curva A representa la distribucin normal de valores medidos de la seal del
blanco. Sera posible identificar un punto, y = P, hacia el borde superior de
esta distribucin, y pretender que una seal ms grande que sta fuera improbable para que se debiese al blanco, mientras que una seal menor que P
supondria indicar una muestra del blanco. Sin embargo, para que una muestra d una seal promedio P, el 50 % de las seales observadas ser menor
que sta, ya que la seal tendr una distribucin normal (de la misma forma
que la del blanco; vase ms adelante) prolongando por debajo de P (curva
B). La probabilidad de concluir que esta muestra no difiera de la del blanco
cuando de hecho lo hace es, por tanto, del 50 %. El punto P, que se ha llamado
el lmite de decisin, es pues insatisfactorio como limite de deteccin, ya que
soluciona el primero de los problemas menconados antes pero no el segundo. Un punto ms adecuado est en l:J = Q de manera que Q est situado al
doble de la distancia que existe ente YB y P. Se puede demostrar que si
l:J13 - Q es 3.28 veces la desviacin estndar del blanco, SH; entonces la probabilidad de que ocurra cada uno de los dos tipos de error (indicados por las
reas sombreadas de la Figura 5.7) es slo deiS %. Si, como se sugiere en la
Ecuacin (5.11), la distancia l:JH - Q es slo 3s H, la probabilidad de cada
error es aproximadamente del 7 %: muchos analistas considerarian que sta
es una definicin razonable del lmite de deteccin.
Es preciso insistir de nuevo que esta definicin de limite de deteccin es
muy arbitraria, y est totalmente abierta a cualquier analista para que proponga una definicin alternativa para un propsito concreto. Por ejemplo,
existen ocasiones en que un analista est ansioso de evitar a toda costa la
posibilidad de dar la ausencia de analito cuando de hecho est presente,
pero no es relativamente preocupante el error contrario. Est claro que, aun
cuando se cite un lmite de deteccin en un trabajo o informe, debe proporcionarse la definicin utilizada para obtenerlo. Se han realizado algunos
intentos para definir con posterioridad otro limite, el limite de cuantifica-

ys

Limite de
decisin

Limite de
deteccin

3SB

Figura 5.7.

Definiciones del limite de decisin y del lmite de deteccin.

clOn (LOQ) (o lmite de determinacin), el cual es considerado como el


lmite inferior para medidas cuantitativas precisas, como opuesto a la deteccin cualitativa. Un valor de (LOQ) YI3 + lOs/:! ha sido sugerido para este lmite, si bien no se utiliza profusamente.
Ahora se discute cmo se obtienen en la pcictica los trminos Jjl! y SB
cuando se utiliza una recta de regresin para la calibracin, tal como se describi en las secciones precedentes. Una suposicin busica del mtodo ele los
mnimos cuadrados no ponderados es que cada punto en la representacin
grfica (incluido el punto que representa el blanco o fondo) tiene una variacin distribuida normalmente (slo en la elireccin de y) con una dcwiacin
estndar estimada por S'l!\ [Ecuacin (5.6)]. sta es la justificacin para representar las curvas de 'distribucin normal con la misma amplitud que refleja la Figura 5.7. Es, por tanto, adecuado utilizar SIIIX en lugar ele SIi en 1<1
estimacin del lmite de deteccin. Es, por supuesto, posible realizar el experimento del blanco varias veces y obtener un valor independiente para SI)' Jj
si SOIl correctos los supuestos mencionados los dos mtodos de estimar SI3 no eliferirn significativamente. Sin embargo, las determinaciones mltiples del
blanco consumen mucho tiempo, y el uso de 5 ,1 ,,\ es muy adecuado en [a prctica, El valor de a, la ordenada en el origen calculada, se puede utilizar como
u na estimacin de lf 13, la propia seal del blanco; debera ser una estimacin
ms exacta de JjI-J que el simple valor de la medida del blanco, JJI.

EJEMPLO 5.7.1
Estimar el lmite de deteccin para la determinacin de fluoresceina estudiada en las secciones previas.
Se usa la Ecuacin (5,11) con los valores de yti, = a) y ss( = 5;1 x) calculados previamente,
El valor de yen el lmite de deteccin viene dado por 1,52 + 3 x 0.4329, es decir, 2,82,
El uso de la ecuacin de regresin conduce a un lmite de deteccin de 0.67 pg mi 1, La
Figura 5.8 resume todos los clculos realizados a partir de los datos de la determinacin de
la fluoresceina,

Es importante evitar la confusin de lmite de deteccin de unn tcnica con


su sensibilidad, Estn fuente de confusin muy habitual surge probablemente
debido a que no se aceptan palabras sencillas sinnimas inglesas con "tener
un lmite de deteccin bajo, La palabra "sensible se utilizo gcneralmente
con este propsito, dando lugar a demasiada ambigedad. La sensibilidad de
una tcnica se define correctamente como la pendiente de la recta de calibrado y, siempre que la representacin sea lineal, puede ser medida en cualquier
punto de ella. Por el contrario, el lmite de deteccin de un mtodo se calcula
con la ayuda prestada por la zona de la representacin cercana al origen, y
utiliza tanto la pendiente como la ordenada en el origen.

5.8.

El mtodo de las adiciones estndar

Supngase que se desea determinar la concentracin de plata en muestras de


deshechos fotogrficos por espectrometra de nbsorcin atmica. Utilizando
los mtodos de las secciones anteriores, se podra llevar a cabo un calibrado

127

128

25
yo

= 23.0

a = 1.520.30

b = 1.930.04

20

r= 0.9989
Sy/x

= Sa= 0.433

LOD = 0.67 pg ml-1


sxo ~0.25
o:l

15

'

e
Q)
u
(/J

t"l

'"":

10

ya + 3Sa
a=ya
LOD

o"""'-_L.-_'-----'L------'_-----'---'----'-_
O

10

Concentracin, pg ml-

Figura 5.8.

12

Resumen de los clculos usando los datos del Ejemplo 5.3.1.

con el espectrofotmetro con soluciones acuosas de una sal de plata pura y


usar la lnea de calibrado resultante para determinar la plata en las muestras
de ensayo. Sin embargo, este mtodo slo es vlido si una disolucin acuosa
pura de plata y una muestra fotogrfica de deshecho conteniendo la misma
concentracin de plata dan los mismos valores de absorbancia. En otras palabras, cuando se usan disoluciones puras para establecer la lnea de calibrado
se supone que no hay efectos de matriz, es decir, aumento o disminucin
de la seal de absorbancia de plata debido a la presencia de otros componentes. Frecuentemente, en muchas reas del anlisis, tal suposicin no es vlida. Los efectos de matriz ocurren incluso con mtodos tales como la espectrometra de plasma que tiene la fama de estar relativamente libre de
interferencias.
La primera solucin posible a este problema es tomar una muestra de
deshechos fotogrficos que sea similar a la muestra problema, pero libre de
plata, y aadirle cantidades conocidas de una sal de plata para formar soluciones patrn. La lnea de calibrado se establecer utilizando una matriz aparentemente adecuada. Sin embargo, en muchos casos, esta aproximacin a
una matriz comparable es impracticable. No se eliminarn efectos de matriz
que difieran en magnitud de una muestra a otra, e incluso puede que no sea
posible obtener una muestra de la matriz que no contenga analito; por

ro

129

le
Ql

en

Seal de la muestra"

.'

.' .'

.'

.'

.'.'
.'
.'.'
Cantidad

aadida~

Cantidad de analito en
la muestra de ensayo

Figura 5.9.

El mtodo de las adiciones estndar.

ejemplo, una muestra de residuos fotogrficos sin plata, es improbable que


exista! La solucin a este problema es que todas las medidas analticas, incluyendo la lnea de calibrado, deban ser realizadas de alguna manera utilizando la propia muestra. Esto se logra en la prctica usando el mtodo de
las adiciones estndar. El mtodo es muy utilizado en espectrometra de
absorcin y emisin atmica y tambin ha encontrado aplicacin en electroqumica y otras muchas reas. Se toman volmenes iguales de solucin problema, todas salvo una son adicionadas separadamente con cantidades
conocidas y diferentes del analito, y todas se diluyen al mismo volumen. Se
determinan las seales en el instrumento para todas estas soluciones y los
resultados se representan como se muestra en la Figura 5.9. Como de costumbre, la seal se representa en el eje Jj, mientras que el eje x se expresa en
trminos de las cantidades de analito aadidas (ya sea como peso absoluto o
como concentracin). La lnea de regresin (no ponderada) se calcula de la
manera usual, si bien el espacio ocupado por ella se extrapolar al punto del
eje x en que Jj = O. Este valor negativo sobre el eje x corresponde a la cantidad de analito en la muestra problema. El anlisis de la figura muestra que
este valor viene dado por a/b, la razn entre la ordenada en el origen y la
pendiente de la recta de regresin. Ya que a y b estn sujetos a error (Seccin
5.5), el valor calculado tambin lo estar. Sin embargo, en este caso, la cantidad no se predice a partir de un nico valor medido de Jj, de manera que
la frmula de la desviacin estndar, SXE' del valor extrapolado de x (XE) no
es la misma que en la Ecuacin (5.9).

(5.12)

Aumentando el valor de n, se mejora de nuevo la precisin de la cantidad


estimada: en general, en un experimento de adiciones estndar deberan
usarse al menos seis puntos. Adems, la precisin se mejora maximizando

130

(x, - .X:), de manera que las soluciones de calibrado deberan cubrir, si

fuera posible, un intervalo considerable. Los lmites de confianza para


determinan, como siempre, como XB t('1 2)S\~;.

XL'

sr

EJEMPLO 5.8.1
La concentracin de plata en una muestra de deshechos fotogrficos fue determinada por
espectrometra de absorcin atmica con el mtodo de las adiciones estndar. Se obtuvieron los siguientes resultados,
Ag aadida: flg por mi de solucin
de muestra original O
5
Absorbancia
0.32
0.41

10
0,52

15
0.60

20
0.70

25
0.77

30
0.89

Determinar la concentracin de plata en la muestra, y obtener los lmites de confianza al


95% para esta concentracin,
Las Ecuaciones (5.4) y (5,5) conducen a a = 0.3218 Y b = 0.0186. La razn entre estos
nmeros proporciona la concentracin de plata en la muestra problema de 17,3 J.lg ml- "
Los lmites de confianza para este resultado se pueden determinar con la ayuda de la
Ecuacin (5,12). Aqu Sy/x es 0.01094, ji= 0,6014, Y (x,- X2 = 700. El valor
.

de SXE es entonces 0.749 y los lmites de confianza son 17.3


17.3 1.9 J.lg mi '.
"

2,57

x 0,749, es decir,

Aunque es una aproximacin elegante al problema comn de los efectos de


interferencia de la matriz", el mtodo de las adiciones estndar tiene varias
desventajas, La principal es qlle cada muestra ensayada requiere su propia
grftca de calibrado, en contraste con los experimentos de calibracin convencional, donde un grfico puede proporcionar valores de la concentracin
de muchas muestras de ensayo, El mtodo de las adiciones estndar puede
tambin utilizar cantidades de muestra ms grandes que en otros mtodos,
En trminos estadisticns es un mtodo de extrapolacin, y en principio menos preciso que las tcmcas de interpolacin, En la prctica, la prdida de
precisin no es muy preocupante,

5.9.

El uso de rectas de regresin para comparar


mtodos analticos

Si un qumico analitico desarroJla un mtodo nuevo para la determinacin


de un analito concreto, el mtodo debe ser validado (entre otras tcnicas)
aplicndolo a un conjunto de materiales ya estudiados mediante otro procedimiento patrn o reconocido. El inters principal al realizar tal comparacin ser la identificacin de errores sistemticos: proporciona el nuevo
mtodo resultados significativamente ms altos o ms bajos que el procedimiento establecido? En los casos donde un anlisis se repite varias veces sobre un intervalo de concentracin muy limitado, tal comparacin puede ser
hecha usando los contrastes estadisticos descritos en las Secciones 3.3 y 3.4Tales procedimientos no sern adecuados en anlisis instrumental, los cuales
son utilizados a menudo en un gran intervalo de concentraciones.

131

t
(f)

JI

..../1'

~.....{ .........
::_..!

__..

Mtodo B ---+

Figura 5.10. El uso de rectas de regresin para comparar dos mtodos analticos:
(a) muestra una concordancia perfecta entre los dos mtodos para todas las muestras;
(b) a (1) ilustran los resultados de varios tipos de errores sistemticos (vase el texto).
'"'l

ro

Cuando dos mtodos se comparan a diferentes concentraciones de analito, se adopta normalmente el procedimiento que ilustra la Figura 5.10. Uno
de los ejes del grfico de regresin se usa para los resultados obtenidos por
el nuevo mtodo, y el otro para los resultados obtenidos aplicando a las mismas muestras el de comparacin o referencia. (La razn por la que los ejes
deben asignarse a cada mtodo se discute posteriormente.) En estas circunstancias, cada punto del grfico representa una muestra nica analizada por
dos mtodos distintos. (A veces cada mtodo se aplica solamente una vez a
cada muestra problema, mientras que en otros casos se usan medidas repetidas en las comparaciones.) Los mtodos de las secciones precedentes se han
aplicado para calcular la pendiente (h), la ordenada en el origen (a) y el coeficiente de correlacin (r) de la recta de regresin. Queda claro que si cada
muestra conduce a un resultado idntico con ambos mtodos analticos, la
recta de regresin tendr una ordenada en el origen cero, y una pendiente y
un coeficiente de correlacin de 1 (Figura 5.10a). En la prctica, por supuesto, esto nunca ocurre: incluso estando completamente ausentes los errores
sistemticos, los errores aleatorios aseguran que los dos procedimientos analticos no darn resultados en exacta concordancia para todas las muestras.
Desviaciones de la situacin ideal (a = O, h = r = 1) pueden ocurrir en
una serie de situaciones diferentes. En primer lugar, es posible que la recta
de regresin tenga una pendiente de 1, pero no una ordenada en el origen
de O. Esto es, un mtodo de anlisis puede conducir a un resultado ms alto
o ms bajo que el otro en una cantidad fija. Tal error podra ocurrir si la
seal de fondo de uno de los mtodos se hubiera calculado errneamente

to

@
Vl

5:
='

'<:

(")

O
'"'l
'"'l

ro
OT

(")

5:
='

132

(Figura S.10b). Una segunda posibilidad es que la pendiente de la recta de


regresin sea> 1 < 1, indicando que puede darse un error sistemtico en
la pendiente de una de las grficas de calibrado individuales (Figura S.lOc).
Estos dos errores pueden darse simultneamente (Figura S.10d). Otros tipos
posibles de error sistemtico se ponen de manifiesto si la representacin grfica es curva (Figura S.10e). Problemas de especiacin pueden proporcionar
resultados sorprendentes (Figura S.10f). Este tipo de representacin grfica
podra surgir si un analito se encuentra en dos formas qumicas distintas, en
proporciones que varan de muestra a muestra. Uno de los mtodos bajo estudio (aqu representado en el eje y) podra detectar slo una forma del analito, mientras que el segundo mtodo detecta ambas formas.
En la prctica, el analista desea muy a menudo realizar una prueba para
contrastar una ordenada en el origen significativamente diferente de cero, y
una pendiente significativamente diferente de 1. Tales contrastes se realizan
determinando los limites de confianza para a y b, generalmente al 95 % de
nivel de significacin. El clculo es muy similar al descrito en la Seccin 5.5,
y es ms sencillo realizarlo utilizando un programa como Excel. Esta hoja de
clculo se aplica al siguiente ejemplo.
EJEMPLO 5.9.1
Se determin el nivel de cido ltico. en 20 muestras de orina mediante un mtodo cataltico
f1uorimtrico (CF), y los resultados se compararon con los obtenidos utilizando una tcnica
extracto-fotomtrica (EF) establecida. Se obtuvieron los siguientes datos (todos los resultados, en mgl- 1, son medias de medidas triplicadas).
(March, J. G., Simonet, B. M. and Grases, F. 1999. Analyst 124:897-900)

Nmero de muestra

Resultado CF

Resultado EF

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

1.87
2.20
3.15
3.42
1.10
1.41
1.84
0.68
0.27
2.80
0.14
3.20
2.70
2.43
1.78
1.53
0.84
2.21
3.10
2.34

1.98
2.31
3.29
3.56
1.23
1.57
2.05
0.66
0.31
2.82
0.13
3.15
2.72
2.31
1.92
1.56
0.94
2.27
3.17
2.36

Esta serie de datos muestra el porqu es inadecuado utilizar el contraste I por parejas, que
evala en esos casos las diferencias entre pares de resultados (Seccin 3.4). El intervalo de
concentraciones de. cido ftico (ca. 0.14-3.50 mg 1- 1) en las muestras de orina es tan amplio que una discrepancia fijada entre los dos mtodos ser de variacin significativa a diferentes concentraciones. Entonces, una diferencia de 0.05 mg I . t entre las dos tcnicas,
no sera de gran inters al nivel de ca 3.50 mg I 1, pero sera ms molesto en el extremo
ms bajo del intervalo de concentracin.
La Tabla 5.1 muestra el resumen de los resultados de la hoja de clculo de Excel utilizada para calcular la lnea de regresin de los datos anteriores. Los datos CF se han
representado en el eje y, y los resultados EF en el x (vase ms adelante). Los resultados
muestran que el valor de r (llamado por este programa "R mltiple debido a su potencial
aplicacin a mtodos de regresin mltiple) es 0.9967. La ordenada en el origen es
-0.0456, con lmites de confianza superior e inferior de -0.1352 y +0.0440: este intervalo incluye el valor ideal de cero. La pendiente de la grfica, llamada "X variable 1 debido
a que b es el coeficiente del trmino en x en la Ecuacin (5.1), es 0.9879, con un intervalo
de confianza al 95% de 0.9480 a 1.0279: nuevamente este intervalo incluye el valor del
modelo, en este caso 1.0. (Los resultados restantes no se necesitan en este ejemplo, y se
discuten en la seccin 5.11). La Figura 5.11 muestra la lnea de regresin con las caractersticas anteriores resumidas.

Tabla 5.1.

Salida de Excel para el Ejemplo 5.9.1.

Estadistica de la regresin

R mltiple
R cuadrado
R cuadrado ajustado
Error es tndar
Observaciones

0.9967
0.9934
0.9930
0.0825
20

ANOVA

Regresin
Residual
Total

Ordenada
en el origen
X Variable 1

Ordenada
en el origen
X Variable 1

gl

SC

CM

F Significativa

1
'18
19

18.342
0.122
18.465

18.342
0.007

2695.977

4.61926E-21

Coeficientes

Error
estndar

Estadistica t

Valor P

-0.0456
0.9879

0.0426
0.0190

-1.070
51.923

0.299
4.62E-21

Inferior
al 95%

Superior
al 95 %

-0.1352
0.9480

0.0440
1.0279

133

4.0

134

3.5
3.0

u.

'"o
.s
:;
'"
a:

"O

C])

2.5
2.0
1.5
1.0
0.5
O
O

0.5

1.0 1.5 2.0 2.5 3.0 3.5 4.0


Resultados EF

Figura 5.11.

Comparacin de dos mtodos analticos: datos del Ejemplo 5.9.1.

En relacin con este ejemplo pueden mencionarse otros dos aspectos. En


primer lugar, la revisin de la literatura de qumica analtica muestra que los
autores se preocupan con frecuencia por los valores del coeficiente de correlacin en estudios comparativos. Sin embargo, en este ejemplo, el establecer
si ocurren o no errores sistemticos no juega un papel directo. Incluso si la
recta de regresin hubiera sido ligeramente curva, el coeficiente de correlacin se podra haber acercado a 1 (vase la anterior Seccin 5.3). Esto significa que el clculo de r tiene menor importancia en el presente contexto que
el establecimiento de los lmites de confianza para la pendiente y ordenada
en el origen. En algunos casos se puede encontrar que el valor de r no se
acerca mucho al, aun cuando la pendiente y ordenada en el origen no sean
significativamente diferentes de 1 y 0, respectivamente. Tal resultado sugerira muy poca precisin bien sea para uno o ambos mtodos bajo estudio.
Las precisiones de los dos mtodos se pueden determinar y comparar utilizando los mtodos de los Captulos 2 y 3. En la prctica es deseable que esto
se haga antes de representar la recta de regresin que compara los dos mtodos representados; la razn de esto se explica posteriormente. El segundo
punto a sealar es que sea deseable comparar los mtodos en todo el intervalo de concentraciones, como en el ejemplo expuesto, donde las muestras
de orina examinadas contenan concentraciones de cido ftico que cubran
con suficiente uniformidad el intervalo de inters.
Aunque la aproximacin descrita haya sido ampliamente adoptada en estudios comparativos de mtodos intrumentales, est abierta a algunas objeciones tericas. En primer lugar, como se ha recalcado a travs de todo el
captulo, la recta de regresin de y sobre x se calcula bajo el supuesto de
tener errores despreciables en los valores de x (se supone que todos los errores ocurren en la direccin y). Este supuesto, generalmente vlido en la
generacin de una grfica de calibrado para un nico analito, no se puede
justificar cuando la recta de regresin se emplea con propsitos de comparacin: se puede tomar como cierto que los errores aleatorios existirn en ambos mtodos analticos, es decir, tanto en la direccin x como en la y. Esto
sugiere que no son vlidas las ecuaciones utilizadas en el clculo de la propia

recta de regresin. Sin embargo, los mtodos de regresin se siguen utilizando ampliamente, ya que las grficas que resultan proporcionan informacin
valiosa sobre la naturaleza de cualquier diferencia entre los mtodos (Figura
5.10). Adems, las simulaciones muestran que la aproximacin conduce a
resultados sorprendentemente fiables, siempre que el mtodo ms preciso se
represente en el eje x (sta es la razn de realizar investigaciones sobre las
precisiones de los dos mtodos; vase lo expuesto anteriormente), y que se
usen un nmero razonable de puntos (ca. al menos 10) cubriendo uniformemente el intervalo de concentraciones de inters. Ya que los clculos de los
lmites de confianza se basan en n-2 grados de libertad, es de particular importancia evitar valores pequeos de n. Existen mtodos de representacin
de rectas de regresin en que x e Jj estn sujetos a error, sin embargo en la
prctica no se utilizan habitualmente en estudios de comparacin debido a
su complejidad.
Una segunda objecin al utilizar la recta de regresin de Jj sobre x en la
comparacin de dos mtodos analticos, como se calcul en las Secciones 5.4
y 5.5, supone tambin que los errores en los valores de Jj son constantes. Se
dice que tales datos son homocedsticos. Como se coment anteriormente,
esto significa que todos los puntos tienen igual ponderacin cuando se calculan la pendiente y la ordenada en el origen de la lnea. Este supuesto es
probable que carezca de validez en la prctica. En muchos anlisis, los datos
son heterocedsticos, es decir, la desviacin estndar de los valores de Jj
aumenta con la concentracin del analito, en vez de tener el mismo valor
para todas las concentraciones (vase ms adelante). Esta objecin al uso de
rectas de regresin no ponderadas se aplica tambin a las representaciones
de calibrado para un nico procedimiento analtico. En principio, las lneas
de regresin ponderadas deben ser utilizadas en su lugar, como se muestra
en la siguiente seccin.

135

:5"

Ul
r-+'"'l

ro

:1

i1"
'"'l

ro

{.Q
'"'l

ro

Ul

o:

:1
'<:

5.10.

Rectas de regresin ponderadas

()

o
'"'l
'"'l

En esta seccin se esbozan las aplicaciones de los mtodos de regresin ponderada. Se supone que la recta de regresin ponderada se utiliza para la determinacin de un nico analito y no para comparar dos mtodos distintos.
En cualquier anlisis de calibracin el error aleatorio global del resultado
surga de una combinacin de las contribuciones al error de varias etapas del
anlisis (vase la Seccin 2.11). En algunos casos este error global estar
controlado por una o ms etapas del anlisis donde el error aleatorio no es
dependiente de la concentracin. En algunos casos se esperar que los errores en la curva de calibrado en la direccin Jj sean aproximadamente igual
para todos los puntos (homocedasticidad), y un clculo de regresin no ponderada es legtimo. En otros casos, los errores sern aproximadamente proporcionales a la concentracin del analito (es decir, el error relativo ser
aproximadamente constante), y en algunos ms (quiz la situacin ms comn en la prctica) el error en la direccin de Jj aumentar cuando aumenta
x, pero con menos rapidez que la concentracin. Ambos tipos de datos heterocedsticos deberan ser tratados mediante mtodos de regresin ponderados. Habitualmente un analista slo puede aprender de la experiencia si son

ro

()

o::1

136

adecuados los mtodos ponderados o no ponderados. Las predicciones son


difciles: son abundantes los ejemplos en los que dos mtodos aparentemente
similares muestran un comportamiento muy diferente frente al error. Los
clculos de regresin ponderados son bastante ms complejos que los no
ponderados, y requieren ms informacin (o el uso de ms supuestos). No
obstante, deberan utilizarse cuando se sospeche heterocedasticidad, y en la
actualidad se utilizan mucho ms que antao, en parte como resultado de la
presin de autoridades reguladoras de la industria farmacutica y de otros
organismos.
La Figura 5.12 muestra la situacin que surge cuando el error en un clculo
de regresin es aproximadamente proporcional a la concentracin del analito, es decir, las barras de error utilizadas para expresar los errores aleatorios en los diferentes puntos del calibrado se alargan a medida que aumenta
la concentracin. La recta de regresin debe ser calculada para proporcionar
una ponderacin adicional a aquellos puntos donde las barras de error son
ms cortas: es ms importante para la recta calculada pasar cerca de tales
puntos que pasar cerca de los puntos que representan concentraciones ms
altas con los errores ms grandes. Este resultado se logra dando a cada punto
una ponderacin inversamente proporcional a la varianza correspondiente,
(Este procedimiento lgico se aplica a todos los clculos de regresin ponderados y no slo a aquellos en que el error en la direccin de y es proporcional a x.) As pues, si los puntos individuales son denotados por (x], Yl),
(x 2, Y2)' etc., como es habitual, y las correspondientes desviaciones estndar
son SI' S2' etc., entonces las ponderaciones individuales, W], W 2 , etc., vienen
dadas por:

sr

Ponderaciones:

Wi =

S-2/ n
1.

(ti

le

al

(f)

Concentracin

Figura 5.12.

La ponderacin de errores en un clculo de regresin.

(5.13)

Se ver que las ponderaciones se han escalado de tal manera que su suma es
igual al nmero de puntos sobre la representacin grfica: esto simplifica los
subsiguientes clculos. La pendiente y la ordenada en el origen de la recta de
regresin vienen dadas por:

(5.14)

Pendiente ponderada:

y por

Ordenada en el origen ponderada:

a".

= j" - b.Y".

(5.15)

En la Ecuacin (5.15), j". Y "Y". representan las coordenadas del centro de lJravedad ponderado, por el que debe pasar la recta de regresin ponderada.
wx/n y
Como se esperaba, estas coordenadas vienen dadas por .x" =

jI!' =

wJj/n.

EJEMPLO 5.10.1
Calcular las rectas de regresin ponderadas y no ponderadas para los siguientes datos de
calibracin. Calcular tambin para cada recta la concentracin de las muestras de ensayo
con absorbancias de 0,100 y 0.600.
Concentracin, ~g ml- 1

Desviacin estndar.
Absorbancia

0.001
0.009

2
0.004
0.158

4
0.Q10
0.301

6
0.013
0.472

8
0.017
0.577

10
0.022
0.739

La aplicacin de las Ecuaciones (5.4) y (5.5) muestra que la pendiente y la ordenada en el


origen de la recta de regresin no ponderada son, respectivamente, 0.0725 y 0.0133. Las
concentraciones correspondientes a las absorbancias de 0.100 Y0.600 son 1.20 y 8.09 ~g
ml- 1, respectivamente.
La recta de regresin ponderada es algo ms tediosa de calcular: a falta de de un programa
de ordenadordecuado es til establecer una tabla como sigue.
X

Si

O
2
4
6
8
10

0.009
0.158
0.301
0.472
0.577
0.739

0.001
0.004
0.010
0.013
0.017
0.022

Sumas

wx

Wf

WXif

W~

62500
10000
5917
3460
2066

5.535
0.346
0.055
0.033
0.019
0.011

O
0.692
0.220
0.198
0.152
0.110

0.0498
0.0547
0.0166
0.0156
0.0110
0.0081

O
0.1093
0.0662
0.0935
0.0877
0.90813

O
1.384
0.880
1.188
1.216
1.100

1083943

5.999

1.372

0.1558

0.4380

5.768

1/57

106

137

138

Estos nmeros dan Yw = 0.1558/6 = 0.0260, Y Xw= 1.372/6 = 0.229. Mediante la Ecuacin (5.14), bwse calcula a partir de
b, =
...

0.438-- (6 x 0.229 x 0.026)


5.768 - [6 x (0.229)2]

= 0.0738

de manera que 8 w viene dado por 0.0260 - (0.0738 x 0.229) = 0.0091.


Estos valores para 8 w Y b.v pueden ser utilizados para mostrar que los valores de absorbancia de 0.100 Y 0.600 corresponden a concentraciones de 1.23 y 8.01 pg mi "
respectivamente.

La comparacin de los resultados de los clculos de regresin ponderada y


no ponderada resulta muy instructiva. Los efectos del proceso de ponderacin son claros. El centro de gravedad ponderado Cy"" gil') est mucho ms
cerca del origen del grfico que el centro de gravedad no ponderado Cy, g), y
la ponderacin dada a los puntos ms prximos al origen (en particular al
primer punto (0,0.009), que tiene el menor de todos los errores) asegura que
la recta de regresin ponderada tiene una ordenada en el origen muy cercana
a este punto. La pendiente y la ordenada en el origen de la recta ponderada
son notablemente similares a los de la recta no ponderada, sin embargo, los
resultados de los dos mtodos proporcionan valores muy similares de las
concentraciones de las muestras con absorbancias de 0.100 y 0.600. No debe
suponerse que esos valores similares surgen simplemente debido a que en
este ejemplo los puntos experimentales se ajustan muy bien a una lnea recta. En la prctica, las rectas de regresin ponderada y no ponderada obtenidas de una serie de datos experimentales tienen pendientes y ordenadas en
el origen similares, incluso si resulta sustancial la dispersin de los puntos
respecto de la recta.
Como conclusin podra pensarse que los clculos de regresin ponderada son poco recomendables. Requieren ms informacin (en la forma de calcular las estimaciones de la desviacin estndar en varios puntos sobre la
representacin grfica) y son ms complejos de ejecutar, sin embargo parece
que proporcionan datos que son muy similares a los obtenidos a partir del
mtodo de regresin no ponderado. Tales consideraciones pueden responder
al hecho habitual en la prctica de despreciar los clculos de regresin ponderada. Si bien un qumico analtico que utiliza mtodos instrumentales no
emplea clculos de regresin simplemente para determinar la pendiente y la
ordenada en el origen del grfico de calibrado y las concentraciones de muestras de ensayo. Tambin necesita obtener estimaciones de los errores o lmites de confianza de las concentraciones y es en este contexto en el que el
mtodo de regresin ponderada proporciona resultados mucho ms reales.
En la Seccin 5.6 se utiliz la Ecuacin (5.9) para estimar la desviacin estndar (s,) y de aqu los lmites de confianza de una concentracin calculada
utilizando un nico valor de lf, y una recta de regresin no ponderada. La
aplicacin de esta ecuacin a los datos en el ejemplo anterior muestra que
los lmites de confianza no ponderados para las soluciones que poseen absorbancias de 0.100 y 0.600 son 1.20 0.65 y 8.09 0.63 ~lg ml- 1, respectivamente. Como en el ejemplo de la Seccin 5.6, estos intervalos de confianza

son muy similares. Sin embargo, en el ejemplo presente, tal resultado no es


completamente real. Los datos experimentales muestran que los errores de
los valores Jj observados aumentan cuando aumentan los propios valores de
Jj, situacin esperada para un mtodo que tenga una desviacin estndar relativa aproximadamente constante. Se podra esperar que este incremento en
Si con el incremento de Jj podra tambin reflejarse en los lmites de confianza de las concentraciones determinadas: los lmites de confianza para la solucin con una absorbancia de 0.600 deberan ser mucho ms grandes (es
decir, peores) que los de la solucin con absorbancia de 0.100.
En los clculos de regresin ponderados, la desviacin estndar de una
prediccin sobre la concentracin viene dada por:

s.
w
XO

En esta ecuacin,

'(Yix)"

s0J/x)w

~+1+

Wo

(., _!J-)2 }1/2

"'"

2( 2 nxl{'-2)
b ~

(5.16)

WXi -

viene dada por:

s0J/x )w =

L WiCJJi - iJY}1/2
{ n-2
_l

(5.17)

y W o es una ponderacin adecuada del valor de Jjo. Las Ecuaciones (5.16) y


(5.17) son claramente similares en la forma a las Ecuaciones (5.9) y (5.6).
La Ecuacin (5.16) confirma que los puntos cercanos al origen, donde las
ponderaciones son ms altas, y los puntos cercanos al centro de gravedad,
donde (Jjo - iJw) es pequeo, tendrn los lmites de confianza ms estrechos
de todos (Figura 5.13). La principal diferencia entre las Ecuaciones (5.9) y
(5.16) es el trmino l/w o en la Ecuacin (5.16). Ya que W o disminuye bruscamente a medida que aumenta Jj, este trmino, como se esperaba, asegura
que los lmites de confianza aumenten cuando aumenta Jjo.
La aplicacin de la Ecuacin (5.16) a los datos del ejemplo anterior muestra que las soluciones problema con absorbancias de 0.100 y 0.600 presenten
lmites de confianza para las concentraciones calculadas de 1.23 12 y
8.01 0.72 Ilg ml-l, respectivamente. Las amplitudes de estos intervalos de
confianza son proporcionales a las absorbancias observadas de las dos soluciones. Adems, el intervalo de confianza para la muestra menos concentrada de las dos es ms pequeo que en los clculos de regresin no ponderados,
mientras que para la muestra ms concentrada es cierto lo contrario. Todos
estos resultados concuerdan mucho ms con la realidad del experimento de
calibracin que con los resultados de los clculos de regresin no ponderada.
Adems, los mtodos de regresin ponderados pueden ser esenciales
cuando se obtiene una lnea de calibrado por transformaciones algebraicas
de una representacin intrnsecamente curva (vase la Seccin 5.13). En la

139

140

ro

le
al

en

Concentracin

Figura 5.13. Forma general de los lmites de confianza para una concentracin determinada
utilizando una recta de regresin ponderada.

actualidad existen programas de computadora para clculos de regresin


ponderados, fundamentalmente a travs de paquetes informticos de estadstica muy avanzados, y esto debera fomentar el mayor uso de este mtodo.

5.11.

Interseccin de dos lneas rectas

Una serie de problemas en la ciencia analtica se resuelven representando


dos grficos de lneas rectas de los datos experimentales y determinando el
punto de su interseccin. Ejemplos habituales incluyen valoraciones potenciomtricas y conductimtricas, la determinacin de la composicin de complejos metlicos tipo quelato, y estudios de interacciones protena-ligando y
de enlace bioespecifco similares. Si se conocen las ecuaciones de las dos lneas rectas (no ponderadas), Jh = al + blXI e Jjz = az + bZX 2 (con nI Y nz
puntos, respectivamente), entonces se demuestra con facilidad que el valor
de x de su interseccin, X, viene dado por:

Punto de interseccin:

!:i.a
XI=-

!:i.b

(5.18)

donde !:i.a = al - a 2 Y !:i.b = b2 - b l . Los lmites de confianza para este valor


de XI vienen dados por las dos races de la siguiente ecuacin cuadrtica:

(5.19)

El valor de t utilizado en esta ecuacin se elige al nivel P apropiado y con


nI + n2 - 4 grados de libertad. Las desviaciones estndar en la Ecuacin
(5.19) se calculan sobre la hiptesis de que los valores para las dos lneas,
SClI/ X)! y SClI/ x )2, sean suficientemente similares para ser juntados utilizando
una ecuacin anloga a la Ecuacin (3.3):

(5.20)

Despus de este proceso de agrupamiento se puede escribir:

{1

2_2
SClI/X)P ~

S/1IJ -

L.
i

XiI

Xl

)2

1}

+~
( _ X z)2
L. Xi2

(5.21)

(5.22)

(5.23)

Estas ecuaciones parecen extraordinariamente complejas, pero si se utiliza


una hoja de clculo como Excel para obtener las ecuaciones de las dos lneas,
el punto de interseccin se puede determinar de una vez. Entonces, se pueden juntar los valores Xli/X' calcular los valores
etc., y encontrar los lmites de confianza utilizando las prestaciones de resolucin de ecuaciones del
programa.

sial

5.12. ANOVA y los clculos de regresin


Cuando se utiliza el criterio de mnimos cuadrados para determinar la mejor
lnea recta que pasa por un nico conjunto de puntos hay una solucin nica, de manera que los clculos implicados son relativamente directos. Sin
embargo, cuando un grfico de calibrado curvo se calcula utilizando el mismo criterio, ste ya no es el caso: una curva de mnimos cuadrados se podra
describir por funciones polinmicas (g = a + bx + cx 2 + ...) conteniendo diferentes nmeros de trminos, una funcin exponencial o logartmica, o en
otras formas. Por tanto, se necesita un mtodo que ayude a elegir la mejor
forma de representar una curva de entre las muchas que hay disponibles. El
anlisis de la varianza (ANOVA) proporciona dicho mtodo en todos los casos donde se mantenga la hiptesis de que los errores ocurren slo en la direccin de y. En tales situaciones en un grfico de calibracin hay dos fuentes de la variacin en la direccin de y. La primera es la variacin debida a

141

142

la regresin, es decir, debida a la relacin entre la seal del instrumento, }j,


y la concentracin del analito, x. La segunda es el error experimental aleatorio en los valores de}j, que se denomina la variacin sobre la regresin. Como
se ha visto en el Captulo 3, ANOVA es un mtodo potente para separar dos
fuentes de variacin en tales situaciones. En los problemas de regresin, el
promedio de los valores de}j de los puntos de alibracin, j, es importante
al definir estas fuentes de variacin. Los valores individuales de }ji difieren
de j por las dos razones dadas anteriormente. ANOVA se aplica para separar
las dos fuentes de variacin utilizando la relacin en que la suma de cuadrados total (SC) sobre j es igual a la SC debida a la regresin ms la SC sobre
la regresin:

Sumas de cuadrados aditivas:


(5.24)

La suma de cuadrados total, es decir, la parte izquierda de la Ecuacin


(5.24), queda claramente fijada una vez que se han determinado los valores
experimentales. Una lnea que ajuste estos puntos experimentales con proximidad se obtendr cuando la variacin debida a la regresin (el primer trmino de la parte derecha de la Ecuacin (5.24)) sea tan grande como sea
posible. La variacin sobre la regresin (tambin llamada la se residual, ya
que cada componente del trmino del lado derecho de la ecuacin es un nico residuo) debera ser tan pequea como fuera posible. El mtodo es muy
general y se puede aplicar a problemas de regresin lineal as como a regresin no lineal. La Tabla 5.1 mostr la salida Excel para un grfico lineal utilizado para comparar dos mtodos analticos, incluyendo una tabla ANOVA
en la forma usual. Como es habitual, el nmero total de grados de libertad
(19) es uno menos que el nmero de medidas (20), ya que los residuos suman cero. Para un grfico de lnea recta se tiene que determinar slo un coeficiente (b) para un trmino que tambin contenga x, ya que el nmero de
grados de libertad debido a la regresin es 1. Por tanto, hay yen - 2) = 18
grados de libertad para la variacin residual. Los valores de los cuadrados
medios (CM) se determinan como en los ejemplos ANOVA previos, y el contraste F se aplica a los dos cuadrados medios como es habitual. El valor F
obtenido es muy grande, ya que hay una relacin obvia entre x e}j, de manera que el CM de la regresin es mucho ms grande que el CM residual.
La salida Excel tambin incluye mltiple R,), que como se ha comentado
previamente es en este caso igual al coeficiente de correlacin, r, el error estndar ( = Slf/J, y los trminos adicionales R square (R cuadrado) y adjusted R square (R cuadrado ajustado), usualmente abreviado por R '2 . Los dos
ltimos estadsticos son proporcionados por Excel como decimales, pero a
menudo se expresan en su lugar como porcentajes. Se definen como sigue:
R2

SC debida a la regresin/SC total


R '2

1 - (SC residual/SC total)

1 - (CM residual/CM total)

(5.25)
(5.26)

En el caso del grfico de una lnea recta, R 2 es igual a r2 , el cuadrado del


coeficiente de correlacin, es decir el cuadrado de multiple R. Las aplicaciones de R 2 y R '2 a problemas de ajuste de curvas sern analizadas ms adelante.

5.13.

Los mtodos de regresin no lineal.


Introduccin

En muchos mtodos de anlisis instrumental la respuesta del instrumento es


proporcional a la concentracin de analito en intervalos de concentracin
sustanciales. Los clculos simplificados estimulan a los analistas a tomar precauciones experimentales para lograr tal linealidad. Ejemplos de tales precauciones incluyen tanto el control de la anchura de las lneas de emisin de
una lmpara de ctodo hueco en espectrometra de absorcin atmica, como
el tamao y posicin del portamuestras para minimizar los efectos de filtro
interno en espectrofluorimetra molecular. Sin embargo, muchos mtodos
analticos (por ejemplo, inmunoensayos y ensayos similares de unin competitiva competitive binding) producen grficas de calibrado que son intrnsecamente curvas. Es particularmente' habitual la situacin en que la grfica de
calibrado es lineal (o aproximadamente lineal) a bajas concentraciones de
analito, curvndose a niveles de analito ms grandes. Cuando se obtienen
grficas de calibrado curvas, se necesitan respuestas a las preguntas formuladas en la Seccin 5.2, si bien las preguntas plantearn problemas estadsticos mucho ms interesantes que en el caso de experimentos de calibracin
lineal.
La primera pregunta a examen es: cmo se detecta la curvatura en un
grfico de calibrado? Esto es, cmo se distingue entre un grfico que se ajusta mejor a una lnea recta y otro que se ajusta mejor a una curva poco pronunciada? Puesto que el grado de curvatura puede ser pequeo, y/o sucede
slo en parte del grfico, sta no es una pregunta directa. Adems, a pesar
del amplio uso del coeficiente de correlacin momento-producto (r) para
contrastar la bondad del ajuste de grficas lineales adecuadas, es de poco valor al contrastar la curvatura: se ha visto (Seccin 5.3) que las lneas con una
curvatura obvia pueden incluso dar valores de r muy elevados. Naturalmente
un analista esperara que algn contraste de curvatura se pudiera aplicar con
bastante facilidad en el trabajo cotidiano sin clculos extensos. Algunos de
tales contrastes existen y estn basados en la utilizacin de los residuos de Jj
de los grficos de calibrado.
Como se ha visto (Seccin 5.5) un residuo de Jj, Jji - iJi' representa la diferencia entre un valor experimental de Jj y el valor calculado Jj a partir de
la recta de regresin para el mismo valor de x. Si es apropiado un grfico de
calibrado lineal, y si los errores aleatorios en los valores de Jj estn distribuidos normalmente, los residuos en s mismos deberan estar distribuidos normalmente en torno al valor cero. Si esto no es cierto en la prctica, entonces
se debe sospechar que la recta de regresin ajustada no es la correcta. En el
ejemplo resuelto en la Seccin 5.5, los residuos Jj obtenidos fueron + 0.58,
- 0.38, - 0.24, - 0.50, + 0.34, + 0.18 y + 0.02. Estos valores suman cero
(teniendo en cuenta los posibles errores de redondeo, esto debe ser siempre

143

144

cierto), y aproximadamente estn distribuidos simtricamente en torno a O.


Aunque es imposible que sea cierto, especialmente con un nmero pequeo
de puntos, que esos residuos estn normalmente distribuidos, ciertamente no
existe evidencia en contra en este caso, es decir, no hay evidencia para
mantener un grfico de calibrado no lineal. Como se ha comentado anteriormente Minitab y otros paquetes estadsticos proporcionan amplia informacin, incluyendo salidas grficas, sobre los tamaos y distribucin de los
residuos.
Se sugiere una segunda prueba de la inspeccin de los signos de los residuos anteriormente expuestos. Si nos trasladamos a lo largo del grfico de
calibrado, es decir, cuando aumenta x, se esperar que existan residuos positivos y negativos en orden aleatorio si los datos estn bien ajustados a una
lnea recta. Si, al contrario, se intenta ajustar una lnea recta a una serie de
puntos que caen realmente sobre una curva, entonces los signos de los residuos ya no tendrn un orden aleatorio, sino que se producirn sucesiones de
valores positivos y negativos. Examinando de nuevo los residuos expuestos
anteriormente se encuentra que el orden de los signos es + - - - - + + +.
Para contrastar si estas sucesiones de residuos + y - indican la necesidad
de una lnea de regresin no lineal, es necesario conocer la probabilidad de
que tal ordenamiento pudiera ocurrir por casualidad. Tales clculos se describen en el prximo captulo. Desafortunadamente el pequeo nmero de
puntos hace muy probable que stas y otras secuencias pudieran realmente
ocurrir por casualidad, de manera que cualquier conclusin que se extraiga
debe ser tratada con precaucin. La eleccin entre mtodos de regresin lineales y no lineales se lleva a cabo probablemente mejor utilizando las tcnicas de ajuste de curvas esbozadas en la prxima seccin.
En la situacin en que un grfico de calibrado sea lineal sobre una parte
de su intervalo y curvado en otra, resulta de gran importancia tratar de establecer el intervalo sobre el que se puede asumir linealidad. Aproximaciones posibles a este problema se esbozan en el siguiente ejemplo.
EJEMPLO 5.13.1
Analizar el intervalo de calibracin lineal de los siguientes experimentos de fluorescencia.
Intensidad de fluorescencia
Concentracin, 119 mi' 1

0.1
O

8.0
2

15.7 24.2
4
6

31.5 33.0
8
10

El anlisis de los datos muestra que la parte del grfico cerca del origen se adapta bastante
bien a una lnea recta con una ordenada en el origen prxima a cero y una pendiente
prxima a cuatro. La fluorescencia de la solucin patrn de 10 I1g ml- 1 teniendo en cuenta
estas bases es claramente inferior a la esperada, y existe alguna posibilidad de que la desviacin de la linealidad afecte tambin al estndar de 8 I1g ml- 1. Primeramente se aplican
clculos de regresin lineal (no ponderada) a todos los datos. De la aplicacin de los mtodos de las Secciones 5.3 y 5.4 se obtienen los resultados a = 1.357, b = 3.479 Y
( = 0.9878. Tngase de nuevo en cuenta que el valor alto de (puede ser engaoso, aun
que se use en sentido comparativo (vase mas adelante). Los residuos de yen este caso
son -1.257, - 0.314, + 0.429, + 1.971, + 2.314 y - 3.143, con la suma de los cuadra
dos de los residuos igual a 20.981. La tendencia en los valores de los residuos sugiere que
el ltimo valor de la tabla est probablemente fuera del intervalo lineal.

Se confirman las sospechas aplicando las ecuaciones de regresin lineal solamente a


los cinco primeros puntos. Esto proporciona a = 0.100, b = 3.950 Y r = 0.9998. La pendiente y la ordenada en el origen estn mucho ms cerca a los valores esperados para la
parte del grfico ms prxima al origen, y el valor de r es mayor que en el primer clculo.
Los residuos de los primeros cinco puntos de esta segunda ecuacin de regresin son O,
0, - 0.2, + 0.4 y - 0.2, con una suma de cuadrados de slo 0.24. El uso de la segunda
ecuacin de regresin muestra que la fluorescencia esperada de un patrn de 1 ~lg ml- 1
es 39.6, es decir, el residuo es - 6.6. El uso del contraste t (Captulo 3) mostrara que este
ltimo residuo es significativamente ms grande que el promedio de los otros residuos: alternativamente se podra aplicar un contraste (Seccin 3.7) para demostrar que es un dato
anmalo entre los residuos (vase tambin la Seccin 5.15 ms adelante). En este ejemplo, dichos clculos son tediosos: el enorme residuo del ltimo punto, unido a los residuos
muy bajos de los otros cinco puntos y a la muy reducida suma de los cuadrados, confirma
que el intervalo lineal del mtodo no llega ms all de 1O ~g mi-l. Habiendo establecido
que el ltimo punto puede excluirse del intervalo de linealidad, se puede repetir el proceso
para estudiar el punto (8, 31.5). Se puede realizar esto calculando la recta de regresin slo
para los cuatro primeros puntos de la tabla, con los resultados a = 0, b = 4.00, r = 0.9998.
El valor del coeficiente de correlacin sugiere que esta lnea se ajusta bastante bien a los
puntos de la lnea anterior, en la que se usaban cinco puntos. Los residuos para este tercer
clculo son + 0.1, O, - 0.3, Y + 0.2, con una suma de cuadrados de 0.14. Con esta lnea
de calibrado el residuo y para la solucin' de 8 Jlg ml- l es - 0.5: este valor es ms grande
que los otros residuos pero probablemente no en una cantidad significativa. De este modo
se puede concluir que es razonablemente seguro incluir el punto (8, 31.5) dentro del intervalo lineal del mtodo. Al tomar una decisin marginal de este tipo, el qumico analtico
tendr en cuenta la exactitud requerida de sus resultados, y el valor reducido de un mtodo
para el que el intervalo de calibracin es muy corto. Los clculos descritos anteriormente se
resumen en la Figura 5.14.

35

j
30
25
Cll

'
e
Ql

20

(/)

Ql

(5
::J

"

.1
.1
.1

15

Concentracin, Ig ml- 1

Figura 5.14. Regresin no lineal: identificacin del intervalo de linealidad. Se usan los datos
del Ejemplo 5.13.1; se muestran las lneas de regresin lineal no ponderadas a travs de todos
los puntos (
). a travs de slo los cinco primeros puntos (- - - - -), y a travs de slo
los cuatro primeros puntos (.....).

145

146

Una vez que se ha tomado la decisin de que una serie de puntos de calibrado no se ajustan satisfactoriamente a una lnea recta, el analista puede jugar
otra carta antes de resignarse a los complejos clculos de regresin no lineal.
Se pueden transformar los datos de manera que una relacin no lineal cambie a otra lineal. Tales transformaciones se aplican regularmente a los resultados de ciertos mtodos analticos. Por ejemplo, los paquetes informticos
modernos para la interpretacin de datos de inmunoensayos ofrecen frecuentemente una opcin de transformaciones: mtodos comnmente utilizados incluyen representar log y y/o log x en vez de y y x, o el uso de funciones
logit (logitx = ln[x/(l - x)]). Es importante sealar que las transformaciones pueden afectar tambin a la naturaleza de los errores en diferentes puntos de las representaciones del calibrado. Supngase, por ejemplo, que en un
conjunto de datos de la forma y = px q , las magnitudes de los errores aleatorios en y son independientes de x. Cualquier transformacin de los datos en
forma lineal al tomar logaritmos generar datos cuyos errores en log y no son
independientes de log x. En este y en cualquier otro caso donde sea conocida
la forma esperada de la ecuacin a partir de consideraciones tericas o de
experiencia de mucho tiempo, es posible aplicar ecuaciones de regresin ponderadas (Seccin 5.10) a los datos transformados. Se puede demostrar que,
si los datos de la forma general y = f(x) se transforman en 'la ecuacin lineal
y = EX + A, el factor de ponderacin, W, utilizado en las Ecuaciones (5.14)(5.17) se obtiene de la relacin:

Wi LYi~dYir
=

(5.27)

Desgraciadamente, no existen muchos casos en qumica analtica en que se


conozca con certeza la forma matemtica exacta de una ecuacin de regresin no lineal (vase mas adelante), de modo que esta aproximacin es de
valor restringido.
Tambin debera considerarse que, a diferencia de la situacin descrita
en el prrafo anterior, los resultados se pueden transformar para generar datos que pueden ser tratados por mtodos no ponderados. Datos de la forma
y = bx, con errores en la direccin y claramente dependientes de x a veces
estn sujetos a transformaciones log-log: los errores en log y tienen entonces
una variacin sensiblemente menor con log x, de manera que los datos transformados pueden ser estudiados por ecuaciones de regresin no ponderadas.

5.14.

El ajuste de curvas

A la vista de las dificultades que surgen al transformar los datos, y de la


creciente facilidad con que pueden calcularse las curvas para ajustar una serie de puntos de calibracin, los mtodos de regresin curvilinea son en la
actualidad relativamente comunes en la qumica analtica. Es muy importante sealar que las curvas de calibrado encontradas en la prctica resultan a
menudo de la superposicin de dos o ms fenmenos fsicos o qumicos. As,
en espectrometra de fluorescencia molecular, representaciones de la seal
vs. concentracin pueden ser aproximadamente lineales en disoluciones muy
diluidas, pero a altas concentraciones exhibirn curvatura creciente (negati-

va) debida a: (a) el tipo de ptica utilizada (efectos de filtro interno), (b)
interacciones moleculares (por ejemplo, atenuacin, formacin de escimeros), y (c) a la carencia de supuestos algebraicos sobre los que se pronostique
una representacin lineal. Los efectos (a)-(c) son independientes entre si, de
manera que en la prctica pueden aparecer curvas de diferente forma. Este
ejemplo muestra porqu las curvas de calibrado con forma conocida y pronosticable se encuentran rara vez en el trabajo analtico (vase lo anterior).
As pues, el analista a priori tiene escasa nocin sobre cul de los muchos
tipos de ecuaciones que generan representaciones en forma de curva debera
utilizarse para ajustar en un caso particular los datos de calibracin. En la
prctica, mucha de la estrategia ms comn consiste en ajustar una curva
que sea un poEnomio en x, es decir, lf = a + bx + cx 2 + dx 3 + ... Entonces
los problemas matemticos a resolver son: (i) cuntos trminos deben incluirse en el polinomio?, y (ii) qu valores deben asignarse a los coeficientes
a, b, etc.? Los paquetes de software informtico que abordan estos problemas
son normalmente iterativos: en primer lugar ajustan una lnea recta a los
datos, luego una curva cuadrtica, despus una curva cbica, y as sucesivamente, presentando al usuario la informacin necesaria para decidir cual de
estas ecuaciones es la ms adecuada. En la prctica, las ecuaciones cuadrticas o cbicas se ajustan a menudo satisfactoriamente a los datos: polinomios
con muchos trminos carecen casi siempre de significado fsico y no mejoran
significativamente los resultados analticos. En cualquier caso, si una representacin tiene n puntos de calibrado, el polinomio mayor permitido es el de
orden n - 1.
Para decidir si (por ejemplo) una curva cuadrtica o cbica es la que mejor se ajusta a un conjunto de puntos de calibracin, se pueden utilizar los
mtodos ANOVA, introducidos en la Seccin 5.12. Los programas de
ANOVA generan valores de R 2 , el coeficiente de determinacin. La Ecuacin (5.25) muestra que, cuando se mejora el ajuste de mnimos cuadrados
de una curva (o linea recta) a los puntos de los datos, el valor de R 2 se aproximar a 1 (o el 100%). Podra parecer que bastara con solo calcular los
valores de R 2 para ecuaciones lineales, cuadrticas, cbicas, etc., finalizando
la bsqueda cuando no se aumente el valor de R 2 . Desgraciadamente, la incorporacin de otro trmino al polinomio hace que aumente siempre el valor
de R 2 , aunque slo sea en cantidad pequea. Entonces los programas de
ANOVA proporcionan valores de R'2 (<<R 2 ajustado) (Ecuacin 5.26) la cual
utiliza cuadrados medios (CM) en lugar de sumas de cuadrados. El uso de
R'2 tiene en cuenta que el nmero de grados de libertad de los residuos en
la regresin polinmica (dado por [n - k - 1] donde le es el nmero de trminos de la ecuacin de regresin que contiene una funcin de x) cambia
cuando cambia el orden del polinmio. Como se muestra en el siguiente
ejemplo, R'z es siempre ms pequeo que R 2 .

EJEMPLO 5.14.1
En un anlisis instrumental se obtuvieron los siguientes datos (unidades arbitrarias).
Concentracin
Seal

O
0.2

1
3.6

2
7.5

3
4
5
6
7
11.5 15.0 17.0 20.4 22.7

8
9
10
25.9 27.6 30.2

147

148

Ajustar un polinomio adecuado a estos resultados, y utilizarlo para estimar las concentraciones correspondientes a una seal de 5, 16 Y 27 unidades.
Hasta un anlisis superficial de los datos sugiere que el grfico de calibrado debera ser
una curva, pero resulta instructivo no obstante calcular la lnea recta de mnimos cuadrados
a travs de los puntos utilizando el mtodo descrito en la Seccin 5.4. Esta lnea responde
a la ecuacin y = 2.991 x + 1.555. La tabla ANOVA para los datos tiene la forma siguiente:

Fuente de variaci6n

Suma de cuadrados

g.1.

Regresin
Residual
Total

984.009
9.500
993.509

9
10

Cuadrado medio

984.009
1.056
99.351

Como ya se ha observado el nmero de grados de libertad (g.l.) para la variacin debida a


la regresin es igual al nmero de trminos (A; en la ecuacin de regresin que contiene X.
J, etc. Para una Ifnea recta, k es 1. Hay slo una restriccin en el clculo (a saber que la
suma de los residuos es cero, vase lo anterior), de manera que el nmero total de grados
de libertad es n - 1. Por tanto, el nmero de grados de libertad asignados a los residuos
es (n - k - 1) = (n - 2), en este caso. De la tabla ANOVA, :f viene dado por 984.009/
993.509 = 0.99044, es decir, 99.044%. Una ecuacin que explica alrededor del 99% de la
relacin entre x e y parece muy satisfactoria pero, como tambin sucede con el coeficiente
de correlacin, r, se deben tomar precauciones a la hora de interpretar valores absolutos
de ff-: en breve resultar claro que una curva cuadrtica proporciona un ajuste para los
datos mucho mejor. Se puede tambin calcular el valor R 2 de la Ecuacin (5.26): viene
dado por (1 -- [1.056/99.351]) = 0.98937, es decir, 98.937 %.
Como siempre un examen de los residuos habitualmente proporciona informacin valio- .
sa sobre el xito de una ecuacin de calibrado. En este caso los residuos son como siguen
X

Xi

Yi

ReSiduo y

O
1
2
3
4
5
6
7
8
9
10

0.2
3.6
7.5
11.5
15.0
17.0
20.4
22.7
25.9
27.6
30.2

1.0
4.5
7.5
10.5
13.5
16.5
19.5
22.5
25.5
28.5
31.5

-1.4
-0.9
O
1.0
1.5
0.5
0.9
0.2
0.4
-0.9
-1.3

En esta tabla, por simplicidad se han redondeado a un decimal los nmeros en las dos
columnas de la derecha. La tendencia en los signos y magnitudes de los residuos, que son
negativos a valores bajos de X. pasan a un mximo positivo, y luego vuelven a valores
negativos, seal de que una lnea recta no es un ajuste adecuado para los datos.
Cuando los datos se ajustan mediante una curva de forma cuadrtica la ecuacin resulta
ser y = 0.086 + 3.970x - 0.098r, y la tabla ANOVA toma la forma:

Fuente de variacin

Suma de cUE/drados

g.l.

Cuadrado medio

Regresin
Residual
Total

992.233
1.276
993.509

2
8
10

494.116
0.160
99.351

Ntese que el nmero de grados de libertad para las fuentes de variacin de la regresin
y residual han cambiado ahora de acuerdo con las reglas descritas anteriormente, pero que
la variacin total es naturalmente la misma como en la primera tabla ANOVA. Aqu Ff2 es
992.233/993.509 = 0,99872, es decir, 99,872%. Esta cifra es considerablemente ms grande que el valor de 99.044% obtenido dl grfico lineal, y el valor R 2 es tambin ms grande
en (1 - [0.160/99.3511]) = 0.99839, es decir, 99,839%, Cuando se calculan los residuos y,
sus signos (en orden creciente de valores X) son + - - + + - + - + - +. No hay ninguna tendencia obvia aqu, as que por encima de cualquier consideracin se debe preferir
el ajuste cuadrtico al lineal.
Por ltimo se repiten los clculos para un ajuste cbico, Aqu la ecuacin que mejor se
ajusta es y = - 0.040 + 4.170x -- 0.150r + 0,0035x3, El coeficiente cbico es muy pequeo, de manera que resulta cuestionable si esta ecuacin es un ajuste significativamente
mejor que el cuadrtico. El valor Ff2 es, inevitablemente, ligeramente ms grande que el de
la curva cuadrtica (99.879% en comparacin con 99.872%), pero el valor de R 2 es ligeramente inferior que el valor cuadrtico en 99.827%. El orden de los signos de los residuos
es el mismo como en el ajuste cuadrtico. Ya que no hay ninguna ventaja en incluir trminos
innecesarios, se puede aceptar que un ajuste cuadrtico e~ satisfactorio en este caso.
Cuando las ecuaciones anteriores se utilizan para estimar las concentraciones correspondientes a sealeS del instrumento de 5, 16 Y 27 unidades, los resultados (valores x en
unidades arbitrarias) son:
.

y=5
y= 16
y= 27

Lineal

Cuadrtico

Cbico

1.15
4.83
8.51

1.28
4.51
8.61

1.27
4.50
8.62

Como se esperaba, las diferencias entre las concentraciones calculadas de las ecuaciones
cuadrticas y cbicas son insignificantes, de manera que se utiliza la ecuacin cuadrtica
por simplicidad.

Se seal al comenzar esta seccin que las representaciones de calibrado no


lineales son a menudo el resultado de la existencia de un nmero de fenmenos fsico-qumicos y/o matemticos, de manera que es sensato suponer
que no pueden esperarse funciones matemticas sencillas que describan la
curva de calibrado de forma satisfactoria. Parece por tanto lgico intentar
ajustar los puntos a una curva con varias secciones unidas cuya forma matemtica pueda ser diferente. sta es la aproximacin utilizada con notable
frecuencia en la actualidad a travs de la aplicacin de funciones a trozos
splines. Las splines cbicas son las ms usadas en la prctica, es decir,
la curva final se construye con un conjunto de secciones unidas. Estas secciones deben formar claramente una curva continua en sus uniones
(<<nudos), de manera que las dos primeras derivadas de cualquier curva en
cualquier nudo deben ser iguales. Se han utilizado varios mtodos para estimar el nmero de nudos y las ecuaciones de las curvas que los unen: estas
tcnicas son demasiado avanzadas para considerarse detalladamente en este
momento, pero muchos paquetes estadsticos comerciales pueden actualmente proporcionar tales opciones. La aproximacin de las funciones de
splin se ha aplicado con xito a una variedad de mtodos analticos tales
como la cromatografa, gas-lquido, los inmunoensayos de competencia de

149

150

ligando y mtodos similares basados en receptores, y la espectrometra de


emisin atmica.
Es legtimo preguntar, en el caso de un grfico de calibrado cuya curvatura no sea demasiado severa, si se podra aceptar la idea de splin en su ms
simple acepcin, y dibujar la curva como una serie de lneas rectas uniendo
puntos sucesivos. El mtodo, por supuesto, no es totalmente riguroso, y no
proporcionara informacin sobre la precisin con que pueden determinarse
los valores de x. Sin embargo, su valor como mtodo sencillo de anlisis inicial de datos (AID) (vase el Captulo 6) es adecuado para aplicarlo a los
datos del ejemplo anterior. Este mtodo de interpolacin lineal entre puntos
sucesivos, para valores de y de 5, 16 Y 27, proporciona valores de x de 1.36,
4.50 Y 8.65 unidades, respectivamente. La comparacin de estos resultados,
especialmente los dos ltimos, con los de la tabla anterior muestra que seran
completamente aceptables para muchos propsitos.

5.15.

Datos anmalos en la regresin

En esta seccin se retoma un problema ya analizado en el Captulo 3, la aparicin de datos anmalos entre nuestras observaciones. Este tipo de resultados surgen inevitablemente en los experimentos de calibracin, exactamente
como aparecen en las medidas replicadas, pero resulta ms complicado tratar
con ellos en la estadstica de la regresin. Una dificultad es que, aunque en
un experimento de calibracin se supone que los valores Yi individuales son
independientes unos de otros, los residuos (Yi - ya no son independientes
unos de otros ya que su suma es siempre cero. Por tanto, no resulta habitualmente aceptable tomar los residuos como si fueran un conjunto convencional
de medidas repetidas, y aplicar (por ejemplo) un contraste Q para identificar
cualquier observacin anmala. (Si el nmero de valores de y,: es grande, una
condicin que no se encuentra por lo general en el trabajo analtico, esta
prohibicin se puede flexibilizar.)
Entonces, cmo se identifican las observaciones anmalas en un experimento de calibracin tpico? En primer lugar, se observa que, en los casos
donde haya ocurrido un error obvio como un error de transcripcin o un
funcionamiento deficiente del instrumento, resulta natural y permitido rechazar la medida resultante (y, si es posible, repetirla). Si hay medidas sospechosas para las que no hay ninguna fuente de error obvia, se debe volver
a un estudio de los residuos. Muchos programas de computadora que manejan datos de regresin proporcionan rutinas de diagnstico de los residuos
(vase lo anterior). Algunas de stas son simples, incluyendo grficos de los
residuos frente a los valores Yi individuales (Figura 5.15). Dichos grficos se
esperara que mostraran que, si se utilizase el modelo correcto de calibracin,
los residuos permaneceran aproximadamente uniformes en el tamao a medida que crece Yi, distribuyndose normalmente alrededor de cero. La figura
tambin ilustra casos donde los errores en la direccin de y crecen con Yi
(Seccin 5.10), y donde se ha utilizado la ecuacin de regresin equivocada
(Secciones 5.11 y 5.12). De manera similar, se pueden representar los residuos de y frente al tiempo si se sospecha una deriva del instrumento o cual-

151
(a)

0-

-.

(b)

O.

<~

Yi

Yi

:>;,

(e)

(d)

Yi

Yi

Figura 5.15. Grficos de residuos en el diagnstico de la regresin: (a) distribucin satisfactoria


de los residuos; (b) los residuos tienden a crecer a medida que crece Y. sugiriendo que sera
adecuado un grfico de regresin ponderado; (c) los residuos muestran una tendencia, primero
resultan ser negativos, luego pasan a travs de cero y, por ltimo, se hacen cada vez ms positivos
a medida que crece Y. sugiriendo que se debera representar una curva (diferente); y (d) un grfico
satisfactorio, excepto que podra ser un dato anmalo.

quier otro efecto dependiente del tiempo. Estos grficos revelan de manera
muy clara valores sospechosos, pero no proporcionan criterios que se puedan
utilizar inmediatamente para rechazarlos o aceptarlos. Adems, resultan de
un valor limitado en muchos experimentos de qumica analtica, donde el
nmero de puntos de calibrado es a menudo pequeo.
Para identificar posibles datos anmalos mediante programas de computadora se han utilizado algunos criterios numricos simples. Algunos
paquetes resaltan los puntos de calibrado donde el residuo de Jj es ms de
dos veces (o algn otro mltiplo) el valor de 511 /\, Se han desarrollado varios
mtodos ms avanzados, de los cuales el mejor conocido es la estimacin para cada punto de la distancia de Cook, que se propuso por primera
vez en 1977. Este estadstico se proporciona en diferentes programas estadsticos avanzados, aunque una comprensin completa de su significado
exige un conocimiento del lgebra matricial. La distancia de Cook es un
ejemplo de una funcin de influencia, es decir, mide el efecto que tendra
sobre los coeficientes de regresin a y b el rechazar el citado punto de calibracin.
Por ltimo, se observa que, exactamente como ocurra en el tratamiento
de los datos anmalos en las medidas replicadas, los mtodos robustos y no
paramtricos pueden resultar muy efectivos al manejar datos anmalos en la
regresin: los mtodos robustos de regresin se han hecho muy populares en
los ltimos aos. Estos tpicos se abordarn en el prximo captulo.

152

Bibliografa
Draper, N. R. and Smith, H. 1998. AppIied Regression AnaIysis. 3rd Edn.
Wiley, New York. (Un trabajo clsico con extensa cobertura de muchos
aspectos de los problemas de la regresin y correlacin.)
Edwards, A. L. 1984. An Introduction to Linear Regression and Correlation.
2nd Edn. W. H. Freeman, New York. (Tratado escrito con claridad, con
una buena introduccin al lgebra matricial.)
Kleinbaum, D. G., Kupper, L. L. and Muller, K. E. 1988. AppIied Regression
AnaIysis and Other MuItivariate Methods. 2nd Edn. PSW-Kent, Boston.
(Otro clsico en su campo con un buen tratamiento de la diagnosis de la
regresin.)
Mark, H. 1991. PrincipIes and Practice of Spectroscopic Calibration. Wiley,
New York. (Una explicacin clara de los principios. El fuerte nfasis sobre datos espectroscpicos del IR-cercano no es una desventaja significativa.)
Noggle, ]. H. 1993. Practical Curve-Fitting and Data AnaIysis. Ellis Horwood-PTR Prentice Hall, New Jersey. (Se proporcionan con este libro
programas y ficheros de datos, y todos los ejemplos son de qumica.)
Orvis, W.]. 1996. Excel far Scientists and Engineers. 2nd Edn. Sybex, Alameda, California. (Uno de los numerosos libros que dan guas claras sobre el uso de Excel en clculos estadsticos.)
Snedecor, G. W. and Cochran, W. G. 1989. Statistical Methods. 8th Edn.
Iowa State University, USA. (Aporta una excelente cantidad de procedimientos de regresin y correlacin.)

Ejercicios
1.

En un laboratorio provisto de equipamiento polarogrfico se tomaron


seis muestras de polvo a varias distancias del polargrafo y se determin
el contenido de mercurio de cada muestra. Se obtuvieron los siguientes
resultados.
Distancia al polargrafo, m
Concentracin de mercurio, ng g-l

1.4 3.8 7.5 10.2 11.7 15.0


2.4 2.5 1.3 1.3 0.7 1.2

Examinar la posibilidad de que la contaminacin por mercurio proceda


del polargrafo.
2.

La respuesta de un ensayo colorimtrico para glucosa se control con la


ayuda de soluciones patrn de glucosa. Determinar el coeficiente de correlacin a partir de los siguientes datos, comentando el resultado.
Glucosa, mM
Absorbancia

o
0.002

2
0.150

4
0.294

0.434

0.570

10
0.704

3.

Se obtuvieron los siguientes resultados al analizar un conjunto de soluciones patrn de plata por espectrometra de absorcin atmica.
Concentracin,
ng ml- 1
O
Absorbancia 0.003

5
0.127

10
0.251

15
0.390

20
0.498

25
0.625

30
0.763

Determinar la pendiente y ordenada en el origen de la lnea de calibrado,


y sus lmites de confianza.
4.

Utilizando los datos del ejercicio 3, estimar los lmites de confianza para
las concentraciones de plata en: (a) una muestra que proporciona una
absorbancia de 0.456 en una nica determinacin, y (b) una muestra
dando valores de absorbancia de 0.308, 0.314, 0.347 Y 0.312 en cuatro
anlisis distintos.

5.

Estimar el lmite de deteccin del anlisis de plata de los datos del ejercicio 3.

6.

Se determin el contenido de oro de una muestra concentrada de agua


de mar por espectrometra de absorcin atmica con el mtodo de las
adiciones estndar. Los resultados obtenidos fueron los siguientes:
Oro aadido, ng por
mI de muestra
concentrada O
10
20
30
40
50
60
70
Absorbancia 0.257 0.314 0.364 0.413 0.468 0.528 0.574 0.635
Estimar la concentracin del oro en el agua de mar concentrada y
determinar los lmites de confianza para esta concentracin.

7.

La fluorescencia de un conjunto de soluciones cidas de quinina fue determinada cinco veces. Los resultados se exponen a continuacin:
Concentracin, ng mI 1
Intensidad de fluorescencia
(unidades arbitarias)

o
4
3

5
4

10
22
20
21
22
21

20
44
46
45
44
44

30
60
63
60
63
63

40
75
81
79

7R
77

50
104
109
107
101
105

Determinar las pendientes y ordenadas en el origen de las rectas de regresin no ponderada y ponderada. Calcular, utilizando ambas rectas de
regresin, los lmites de confianza para la concentracin de las disoluciones con intensidades de fluorescencia de 15 y 90 unidades.
8.

Una determinacin de sulfuro procedente de sulfato reducido por bacterias con un electrodo selectivo de iones (ES!) fue comparada con una
determinacin gravimtrica. Los resultados obtenidos se expresaron en
miligramos de sulfuro.

153

1 2
3 4
5 6
7 8
9 10
108 12 152 3 106 11 128 12 160 128
105 16 113 O 108 11 141 11 182 118

Muestra:
Sulfuro (Mtodo ESI):
Sulfuro (Gravimetra):

154

Comentar la conveniencia del mtodo ESI para esta determinacin de


sulfuro.
(Al-Hitti, 1. K, Moody, G. J. and Thomas, J. D. R. 1983. AnalJjst
108:43)
9.

En la determinacin de plomo en solucin acuosa por espectrometra


de absorcin atmica con atomizacin en cmara de grafito, se obtuvieron los siguientes resultados.
Concentracin de plomo, ng mIllO
25
50
100 200 300
Absorbancia
0.05 0.17 0.32 0.60 1.07 1.40
Examinar el intervalo de calibracin lineal de este experimento.
(Basado en Giri, S. K, Shields, C. K, Littlejohn D. and Ottaway, J. M.
1983. AnalJjst 108:244)

10.

En un estudio del complejo formado entre los iones del europio (HI) y
el cido piridin-2.6-dicarboxlico (APDC), se determinaron los valores
de absorbancia de disoluciones conteniendo diferentes concentraciones
de APDC-Eu, con los resultados siguientes:
Absorbancia
APDC: Eu

0.008 0.014 0.024 0.034 0.042 0.050 0.055 0.065


0.6
0.2
0.4
1.2
1.4
1.6
0.8
1.0

Absorbancia
APDC: Eu

0.068 0.076 0.077 0.073 0.066 0.063 0.058


4.0
1.8
2.0
2.4
2.8
3.2
3.6

Utilizar estos datos para determinar las pendientes y ordenadas en el


origen de dos rectas diferentes. Estimar su punto de interseccin y su
desviacin estndar, determinando entonces la composicin del complejo DPA-Eu formado.
(Basado en Arnaud, N., Vaquer, E. and Georges, J. 1998. AnalJjst
123:261)
11.

En un experimento para determinar taninos hidrolizables en plantas mediante espectroscopa de absorcin se obtuvieron los datos siguientes:
Absorbancia
Concentracin, mg ml-

0.084
0.123

0.183
0.288

0.326
0.562

0.464
0.921

0.643
1.420

Utilizar un programa de hoja de clculo o de estadstica para calcular


una relacin cuadrtica entre la absorbancia y la concentracin. Utilizando valores de R 2 y R '2 , comentar si los datos podran describirse
mejor mediante una ecuacin cbica.
(Basado en Willis, R. B. and Allen, P. R. 1998. AnalJjst 123:435)

12.

Se obtuvieron los resultados siguientes en un experimento para determinar espermina mediante cromatografa de capa fina de alta resolucin de uno de sus derivados fluorescentes.
Intensidad de fluorescencia
Espermina, ng

36
6

69
18

184
30

235
45

269
60

301
70

327
90

Determinar la mejor curva de calibracin polinomal a travs de estos


puntos.
(Basado en Linares, R. M., Ayala,]. H., Afonso, A. M. and Gonzalez,
V. 1998. AnallJst 123:725)

155

Mtodos
no paramtricos
y robustos

6.1.

Introduccin

Todos los contrastes estadsticos desarrollados en los captulos anteriores suponen que los datos que se examinan siguen la distribucin normal (Gaussiana). Algn apoyo a este supuesto lo proporciona el teorema del lmite
central, que demuestra que la distribucin en el muestreo de la media puede
ser aproximadamente normal incluso si la poblacin de partida tiene una distribucin muy diferente. Sin embargo, el teorema en realidad no es vlido
para conjuntos de datos muy pequeos (a menudo slo tres o cuatro lecturas) utilizados frecuentemente en el trabajo analtico.
Existen otras razones de inters en mtodos que no requieren suponer
datos distribuidos segn una ley normal. Algunos conjuntos de datos de
inters para los qumicos analticos ciertamente presentan distribuciones
diferentes. Por ejemplo (vase el Captulo 2), las concentraciones de anticuerpos en el suero sanguneo de un grupo de personas diferentes puede expresarse aproximadamente como una distribucin lag-normal: dichos resultados se obtienen con frecuencia cuando se realiza una medida concreta
sobre cada elemento de un grupo humano o de animales. An ms intereseante resulta el comprobar que hay una evidencia creciente de que, incluso
cuando se toman medidas repetidas sobre un nico material de ensayo, la
distribucin de los resultados puede a veces ser simtrica pero no normal:
los datos incluyen ms resultados alejados de la media de los esperados. Tales distribuciones con colas acusadas se pueden considerar como distribuciones normales con la inclusin de resultados anmalos (vase el Captulo
3) que proceden de errores crasos. Alternativamente, los datos con colas acusadas pueden proceder de la superposicin de dos distribuciones normales
con el mismo valor medio, pero con una distribucin que tiene una desviacin estndar significativamente ms grande que la otra. Esto podra surgir

158

si, por ejemplo, las medidas se realizan por ms de un individuo o utilizando


ms de un equipo.
Este captulo introduce dos grupos de contraste estadsticos para el manejo de datos que pueden no estar distribuidos normalmente. Los mtodos
que no suponen una forma especfica de la distribucin de donde se toman
los datos se denominan mtodos no paramtricos o de distribucin libre.
Muchos de ellos tienen la ventaja adicional en cuanto a que los clculos se
simplifican enormemente: con conjuntos de datos pequeos algunos contrastes se pueden realizar mentalmente. El segundo grupo de mtodos, cuyo uso
ha ganado muchos enteros en los ltimos aos, est basado en la creencia de
que el fundamento de la distribucin de la poblacin puede realmente ser
normal (o tener otra forma bien definida), pero si se tienen en cuenta datos
como los anmalos, esta distribucin puede distorsionarse. Estas tcnicas robustas sern apropiadas en los casos de las distribuciones con colas acusadas
como las descritas anteriormente. Difieren de los mtodos no paramtricos
en otro aspecto: a menudo suponen clculos iterativos que seran muy lentos
o complejos sin una computadora, y su aumento en popularidad se debe en
gran parte a la disponibilidad de computadoras personales.

6.2.

La mediana: anlisis inicial de los datos

En los captulos anteriores se ha utilizado la media aritmtica o promedio


como la medida de tendencia central o medida de localizacin de un conjunto de resultados. Esto es bastante lgico cuando se supone la distribucin
normal (simtrica), sin embargo en estadstica no paramtrica se utiliza habitualmente en su lugar la mediana. Para calcular la mediana de n observaciones, se ordenan en orden creciente: en el caso improbable que sea muy
grande el nmero de observaciones, este proceso de ordenacin puede realizarse rpidamente con programas que disponen la mayora de las computadoras.
La mediana es el valor de la observacin que ocupa el lugar (n + 1)1/2
si n es impar: y la media de las observaciones que ocupan los lugares
n/2 y (n/2 + 1) si n es par.
La determinacin de la mediana de un conjunto de resultados experimentales requiere habitualmente pocos clculos o incluso ninguno. Adems, en
muchos casos puede ser una medida de la tendencia central ms realista que
la media aritmtica.

vaciones se encuentran ordenadas numricamente). La media es mayor que cualquiera de


los tres valores ms prximos entre s (25.01, 25.04 Y25.06 mi) y de este modo puede ser
una medida de la tendencia central menos real que la mediana. En lugar de calcular la
mediana se podran utilizar los mtodos del Captulo 3 para contrastar el valor 25.21 como
un posible resultado anmalo, y calcular la media de acuerdo con el resultado obtenido, pero
esta aproximacin supondra que los datos proceden de una poblacin normal.

Este sencillo ejemplo ilustra una propiedad valiosa de la mediana: sta se ve


afectada por los resultados anmalos. Los lmites de confianza (vase el Captulo 2) para la mediana se pueden estimar con la ayuda de la distribucin
binomial. Este clculo se puede realizar incluso cuando el nmero de medidas sea pequeo, pero no es habitualmente requerido en qumica analtica,
donde la mediana se u tiliza generalmente slo como una estimacin rpida
de un promedio. Para ms informacin se remite al lector a la bibliografa.
En estadstica no paramtrica la medida habitual de la dispersin (que
sustituye a la desviacin estndar) es el recorrido (o intervalo) intercuartlico. Como se ha visto, la mediana divide la muestra de medidas en dos
mitades iguales: si cada una de estas mitades se divide posteriormente en
otras dos mitades los puntos de divisin se denominan cuartilas inferior y
superior. Al hacer este clculo se usan varios convenios diferentes y de nuevo se remite al lector interesado a la bibliografa. El intervalo intercuartlico
no es muy utilizado en el trabajo analtico, sin embargo varios contrastes
estadsticos se pueden realizar sobre l.
La mediana y el recorrido intercuartlico de un conjunto de medidas son
precisamente dos estadsticos que caracterizan fundamentalmente al anlisis inicial de datos (AID) tambin llamado anlisis exploratorio de datos (AED). ste es un aspecto de la estadstica que ha ganado mucha popularidad en los ltimos aos. Una razn para ello es la capacidad de las
computadoras modernas y programas especficos de presentar datos casi instantneamente en un amplio rango de formatos grficos: como se ver, tales
representaciones grficas constituyen un elemento importante del AID. Un
segundo elemento en el aumento de la importancia del AID es la creciente
aceptacin de la estadstica como un sujeto prctico y pragmtico no necesariamente restringido al uso de tcnicas cuya solidez terica es incuestionable:
algunos mtodos AID parecen casi toscos en sus principios, pero no obstante
. resultan muy valiosos.

La principal ventaja de los mtodos AID es la posibilidad de indicar


que existen otros mtodos estadsticos ms apropiados para un conjunto dado de datos.

Algunas tcnicas sencillas de presentacin grfica simples son de ayuda inmediata. Ya se ha comentado (vanse los Captulos 1 y 3) el uso de grficas
de punto para ilustrar conjuntos pequeos de datos. Estas representaciones
ayudan en la identificacin visual de resultados anmalos y otras caractersticas poco usuales de los datos. El siguiente ejemplo ilustra mejor su valor.

159

""\

rr

(f)
~

O
(f)

160

EJEMPLO 6.2.2
En un experimento para determinar si los iones Pb2 + interfieren con la determinacin enzimtica de glucosa en varios alimentos, se trataron nueve alimentos con una solucin de
Pb(lI) 0.1 mM, mientras que otros cuatro (grupo de control) no se trataron. Se midieron para
cada alimento las velocidades (en unidades arbitrarias) de reaccin catalizada por enzimas
y se corrigieron para las diferentes cantidades de glucosa que se sabe estn presentes. Los
resultados fueron:
Alimentos tratados
Controles

21
22

1
22

26
23

4
32

27

11

24

21

Comntese estos datos:


Los datos, escritos en dos filas como antecede, no aportan de inmediato demasiado significado, y un analista poco reflexivo podra proceder enseguida a realizar un contraste t
(Captulo 3), o quiz uno de los contrastes no paramtricos que se describen posteriormente, para ver si los dos conjuntos de resultados son significativamente diferentes. Sin
embargo, cuando los datos se presentan como dos diagramas de puntos, o como un nico
diagrama con los dos conjuntos de datos escritos con smbolos diferentes, es manifiesto
que los resultados, aunque interesantes, son tan inconclusos que, sin ,medidas adicionales,
poco puede deducirse de ellos (Figura 6.1).
Las medianas de los dos conjuntos de resultados son similares: 21 para los alimentos
tratados y 22.5 para los controles. Pero el intervalo de velocidades de reaccin para los
materiales tratados con Pb(lI) es enorme, con los resultados manifiestamente ubicados aJ
menos en dos grupos: cinco alimentos parecen no estar afectados por el plomo (quiz porque en estos casos el Pb(lI) est complejado por otros componentes distintos de la enzima),
mientras que otros tres muestran un gran efecto de inhibicin (es decir, la velocidad de
reaccin ha disminuido mucho), y otro se ubica de alguna manera entre estos dos extremos.
Un problema adicional consiste en que uno de los resultados del grupo de control es claramente diferente del resto, y se podra considerar como un resultado anmalo (Captulo 3).
En estas circunstancias parece muy improbable que un contraste de significacin convencional vaya a revelar informacin qumicamente til: el uso del mtodo AID ms simple nos
ha conducido de la desconsideracin de los contrastes de significacin (como ocurre a menudo) hacia ms medidas experimentales.

Otra tcnica sencilla de representacin de datos, de gran valor cuando se estudian muestras ms grandes, es el grfico de cajas y bigotes. En su versin
normal dicho grfico consta de un rectngulo (la caja) con dos lneas (los
bigotes) que se extienden desde los bordes opuestos de la caja, y otra lnea
adicional dentro de la caja, cruzndola en paralelo a los mismos bordes. Los
extremos de los bigotes indican el recorrido de los datos, los bordes de

Alimentos tratados

16

Controles

Figura 6.1.

Diagrama de puntos del Ejemplo 6.2.2.

16

32

24

24

32

161
Valor
ms bajo

Figura 6.2.

Cuartil
inferior

Mediana

Cuartil
superior

Valor
ms alto

Grfico de cajas y bigotes.

la caja a partir de los cuales salen fuera los trazos representan las cuartilas
superior e inferior, y la lnea que cruza la caja representa la mediana de los
datos (Figura 6.2).
El grfico de cajas y bigotes, acompaado de una escala numrica, es
una representacin grfica del resumen de los cinco nmeros, es
decir, el conjunto de datos se describe por sus extremos, su cuartila
inferior, la superior y su mediana. El grfico muestra de un vistazo la
variabilidad y la simetria de los datos.
Algunos programas de computadora resaltan la presentacin de los datos
identificando separadamente posibles valores anmalos. En dichos casos los
datos anmalos se definen a menudo como los datos puntuales que son ms
bajos que la cuartila inferior, o que son ms altos que la cuartila superior, en
ms de 1.5 veces el recorrido intercuartlico. Los bigotes entonces slo se extienden a los lmites superior e inferior o vallas y los datos anmalos se
muestran como puntos por separado. (Estos refinamientos no se muestran
en la Figura 6.2.)

EJEMPLO 6.2.3
Se encontr que los niveles de una protena del plasma sanguneo en 20 hombres y 20
mujeres (mg 100 ml- 1) eran:
Hombres

Mujeres

18
6

2
2
5
3

1
4

4
6

2
11

1
3

3
2
7
2

2
1
2

9
8
2
2

13
5
11
1

11
1
2

3
14
1

Qu informacin puede obtenerse sobre las diferencias entre los niveles de esta protena
en hombres y mujeres?
Como en el ejemplo anterior, los datos presentados aportan muy poco, pero el uso de dos
grficos de cajas o del resumen de los cinco datos resulta muy reveladora. Los cinco datos
resumidos son:
Min.
Hombres
Mujeres

Cuartil inferior

Mediana

Cuartil superior

Mx.

2
2

3.5
2.5

8.5
5.5

18
11

Se deja que el lector demuestre como simple ejercicio de dibujo que (a) las dstribuciones
resultan muy asimtricas tanto para hombres como para mujeres, de manera que los mtodos estadsticos que suponen una distribucin normal no son apropiados (como se ha
- visto esto es a menudo cierto cuando se realiza una nica medida sobre un determinado
nmero de sujetos distintos, en particular cuando son organismos vivos); (b) las concentra-

162

ciones de la mediana para hombres y mujeres son similares: y (e) el recorrido de valores
es considerablemente ms grande para los hombres que para las mujeres. Las conclusiones
sugieren que se podra aplicar el contraste de SiegelTukey (vase la Seccin 6.6) para ver
si la mayor variacin de los niveles de protena entre hombres es significativa.
Tabla 6.1.
0.03
0.22
0.55

Niveles de pp-DDT en 30 muestras de judias blancas (mg Kg -1).

0.05
0.22
0.56

0.08
0.23
0.58

0.08
0.29
0.64

0.10
030
0.66

0.11
0.32
0.78

0.18
0.34
0.78

0.19
0.40
0.86

0.20
0.47
0.89

0.20
0.48
0.96

Aunque es habitual para los analistas manejar conjuntos de datos relativamente pequeos, existen ocasiones en que tienen que examinarse grandes
conjuntos de medidas. Ejemplos de ello tienen lugar en reas del anlisis clnico y medioambiental, donde en muchos casos se producen grandes variaciones naturales en los niveles de analito. La Tabla 6.1 muestra, en orden
numrico, los niveles de un pesticida en 30 muestras de judas blancas. Los
valores individuales cubren el intervalo de 0.03 a 0.96 mg Kg '. I Y podran
expresarse en forma de histograma. Esto mostrara que, por ejemplo, hay
cuatro valores en el intervalo 0-0.095 mg Kg' 1, cuatro en el intervalo 0.0950.195 mg Kg - 1, Y as sucesivamente. Sin embargo, un mtodo AID mejor
utiliza un diagrama de tallo-hojas, como se muestra en la Figura 6.3.
La columna de nmeros que aparece a la izquierda (el tallo) muestra el
primer dgito significativo de cada medida, mientras que los nmeros restantes
en cada fila (las hojas) proporcionan el segundo dgito significativo. La longitud de las filas corresponde entonces a las longitudes de las barras del histograma correspondiente, pero la ventaja del diagrama tallo-hojas es que mantiene el valor de cada medida. Las hojas utilizan slo nmeros enteros, de
manera que siempre debe darse alguna indicacin de la escala utilizada. En
este caso para proporcionar esta informacin se utiliza una clave. As lo hace
el paquete de software Minitab con los diagramas tallo-hojas.
En resumen, los mtodos AID son sencillos, manejados con gran rapidez por las computadoras personales, y muy valiosos al indi.car caractersticas de los datos que no son claras en la inspeccin inicial. Son de
ayuda al decidir los contrastes de significacin ms adecuados u otros
procedimientos estadsticos que se adoptan en tareas posteriores, sugiriendo incluso otras veces que la estadstica no tiene otro papel que desempear hasta que no se obtengan ms datos.

1
2
3
4
5
6
7
8

1
O
2
7
6
6
8
9

Figura 6.3.

O
O
O
5
4
8
6

8
8
2
4
8
8

8
9
2

Clave: 111 = 0.11 mg Kg-'

Diagrama tallo-hojas para los datos de la Tabla 6.1.

Por supuesto, pueden ampliarse al rea de la calibracin y otras tcnicas de


regresin: el tosco mtodo de representar una grfica de calibrado curva sugiri al final del capitulo anterior que se puede considerar como una aproximacin AID. En los libros de Chatfie1d, y de Velleman y Hoaglin, listados en
la bibliografa al final de este captulo se describen numerosas tcnicas.

6.3.

163

El contraste de los signos

El contraste de los signos es uno de los mtodos no para mtricos ms simples


y se empieza a estudiar a principios del siglo XVIII. Se puede utilizar de diferentes formas, la ms simple se ilustra con el siguiente ejemplo.

EJEMPLO 6.3.1

.,

Un preparado farmacutico exige tener un contenido mediano del 8% de un constituyente


concreto. En la prctica se encontraron lotes que contenan 7.3,7.1, 7.9, 9.1, 8.0, 7.1, 6.8
Y7.3% del constituyente. Concuerdan estos resultados con las exigencias del fabricante?

En el Captulo 3 (Seccin 3.2) se demostr que tales problemas se podran abordar utilizando el contraste t despus de calcular la media y la desviacin estndar de los datos
experimentales. Sin embargo, el contraste t supone que los datos se distribuyen normal
mente. El contraste de signos prescinde de tal hiptesis y es mucho ms fcil de realizar. Los
principios bsicos son los mismos que los utilizados en otros contrastes de significacin: se
establece una hiptesis nula, se determina la probabilidad de obtener los resultados experimentales, y se rechaza la hiptesis nula si esta probabilidad es menor que un cierto nivel
crtico. Aqu la hiptesis nula consiste en que los datos procedan de una poblacin con un
valor de la mediana del constituyente del 8.0%. A cada valor experimental se le resta a su
vez la mediana postulada, y se considera el signo de cada resultado. Se ignoran por como
pleto aquellos valores que son iguales a la mediana postulada. En este caso, por tanto, se
dispone de siete valores experimentales, seis de ellos son inferiores a la mediana y como
resultado se les asigna individualmente el signo menos, y uno ms grande que la mediana
al que se le asigna el signo ms. Para contrastar si esta preponderancia de signos menos
es significativa se utiliza la ley binomial. Esta ley establece que la probabilidad de que aparezcan rsignos menos entre nsignos viene dada por

(f)

(6.1)
donde nC,indica el nmero de combinaciones de relementos de un total de n elementos, p
es la probabilidad de que aparezca un signo menos en uno de los resultados y q la proba
bilidad de que no aparezca un signo menos en uno de los resultados individuales, es decir,
q = 1 - P. Puesto ql.le la mediana se define de manera que la mitad de los resultados
experimentales se sita por encima de ella, y la otra mitad por debajo, queda claro que si
la mediana es 8.0 en este caso, entonces tanto p como q deberan ser 1/2. Utlizando la
Ecuacin (6.1) se obtiene que R6) = 7C 6 x (1/2)6 x (1/2) = 71128. De manera similar se
puede calcular que la probabilidad de obtener siete signos negativos, R7), es 1/128. En
conjunto. por tanto, la probabilidad de obtener 6 o ms signos negativos en nuestro experimento es 8/128. La cuestin slo consiste en saber si los datos difieren significativamente
de la mediana postulada. Por consiguiente, se debe realizar un contraste de dos colas
(vase el Captulo 3), es decir, se debe calcular la probabilidad de obtener seis o ms
signos idnticos (es decir, ~ 6 signos ms o ~ 6 signos menos), cuando se toman al azar
siete resultados. Esto es claramente 16/128 = 0.125. Ya que este valor es >0.05, el nivel

ae
(f)
r+

164

de probabilidad crtico normalmente utilizado, la hiptesis nula, es decir, que los datos proceden de una poblacin de mediana 8.0, no se puede rechazar. Igual que en el Captulo 3,
es importante observar que no se ha probado que los datos procedan de tal poblacin; slo
se ha concluido que tal hiptesis no se puede rechazar.

Queda claro a partir de este ejemplo que el contraste de los signos conllevar
el uso frecuente de la distribucin binomial con p = q = 1/2. Esta aproximacin es tan comn en la estadstica no paramtrica que la mayora de las
tablas estadsticas incluyen los datos necesarios, permitiendo que tales clculos se realicen instantneamente (vase Tabla A.9). Adems, en muchas situaciones prcticas, un analista tomar siempre el mismo nmero de lecturas
o muestras y podr memorizar con facilidad las probabilidades correspondientes a los diversos signos + o -.
El contraste de los signos puede utilizarse tambin como alternativa no
paramtrica al contraste t por parejas (Seccin 3.4) para comparar dos grupos de resultados de las mismas muestras. As, si se examinan diez muestras
mediante cada uno de los dos mtodos, A y B, se puede contrastar si los dos
mtodos proporcionan lecturas significativamente diferentes, calculando para cada muestra [(resultado obtenido por el mtodo A) - (resultado obtenido
por el mtodo B) l. La hiptesis nula ser que los dos mtodos no proporcionan resultados significativamente diferentes; en la prctica esto significar
de nuevo que la probabilidad de obtener un signo ms (o un signo menos)
para cada diferencia es 0.5. Ahora se puede comparar el nmero de signos
ms o menos realmente obtenidos con la probabilidad que se deriva de la
Ecuacin (6.1). En los ejercicios del final de este captulo aparece un ejemplo
de esta aplicacin del contraste de signos.
Otro uso adicional del contraste de signos es indicar una tendencia. Esta
aplicacin se ilustra mediante el siguiente ejemplo.

EJEMPLO 6.3.2
El nivel de una hormona en el plasma sanguneo de un paciente se mide durante diez das
a la misma hora cada da. Los datos resultantes son:
Da
Nivel, ng mi

5.8

7.3

3
4.9

5
5.5

6.1

6
5.5

789
6.0

4.9

6.0

10
5.0

Existe alguna evidencia que indique una tendencia en la concentracin de hormona?


Utilizando mtodos paramtricos, sera posible establecer un grfico de regresin lineal de
tales datos y probar si su pendiente difiere significativamente de cero (Captulo 5). Tal aproximacin supondra que los errores se distribuyen normalmente, y que cualquier tendencia
que apareciese sera de tipo lineal. La aproximacin no paramtrica es de nuevo ms sencilla. Los datos se dividen en dos grupos iguales de la siguiente forma:
5.8
5.5

7.3
6.0

4.9
4.9

6.1
6.0

5.5
5.0

(Si hay un nmero impar de medidas, se ignora la medida que ocupa la posicin central en
la secuencia del tiempo.) Al resultado del primer da se le resta el del sexto da, al del

-segundo da el del sptimo, etc. LoS signos de las diferencias entre los pares de valores en
las cinco columnas se determinan de esta manera y resultan ser +, +, O, +, +. Como
es habitual, el valor O se ignora, y quedan cuatro resultados, todos ellos positivos. La probabilidad de obtener cuatro signos idnticos en cuatro intentos es claramente 2 x (1/
/16) = 0.125. (Obsrvese que de nuevo se utiliza un contraste de dos colas, ya que la
tendencia en el nivel de hormona podra ser ascendente o descendente.) La hiptesis nula,
que no exista ninguna tendencia en los resultados, no se puede rechazar de esta forma al
nivel de probabilidad P = 0.05.

El precio que se paga por la extrema sencillez del contraste de los signos es
la prdida de cierta potencia estadstica. El contraste no utiliza toda la informacin ofrecida por los datos, por esa razn no es nada sorprendente encontrar que proporcione tambin menos informacin discriminante. En secciones
posteriores se discutirn mtodos no para mtricos que utilizan tanto las
magnitudes de los resultados individuales como sus signos.

165

O
U

c:
(f)

r-t-

6.4.

El contraste de rachas de Wald-Wolfowitz

En algunos casos se puede estar interesado no slo en si las observaciones


generan signos positivos o negativos, sino tambin en si estos signos aparecen en una secuencia aleatoria. En la Seccin 5.11, por ejemplo, se demostr
que si una lnea recta es un buen ajuste para un conjunto de puntos de calibracin, los residuos positivos o negativos ocurrirn ms o menos al azar.
Por el contrario, al intentar ajustar una lnea recta a un conjunto de puntos
que de hecho se sitan en una lnea curva, resultarn sucesiones no aleatorias de signos positivos o negativos: podra considerarse, por ejemplo, una
sucesin de signos +, seguida de una sucesin de signos -, y luego otra de
signos +. Dichas secuencias se conocen tcnicamente como rachas - el significado de la palabra aqu es el mismo que cuando alguien se refiere a una
racha de mala suerte, o cuando un deportista experimenta una racha de
buenos resultados. En el caso del ajuste de curvas, queda claro que una secuencia no aleatoria de signos + y - conducir a un nmero ms pequei10
de rachas que una aleatoria.

El mtodo de Wald-Wolfowitz contrasta si el nmero de rachas es suficientemente pequei10 para que se rechace la hiptesis nula de una distribucin aleatoria de los signos.

El nmero de rachas en los datos experimentales se compara con los mmeros de la Tabla A.lO, que se refieren al nivel de probabilidad P = O.OS.
En esta tabla se entra utilizando valores apropiados de N, el nmero de
signos +, y IVI, el nmero de signos -. Si el nmero de rachas experimental es ms pequeo que el valor tabulado, entonces se puede rechazar la
hiptesis nula.

(f)

166

EJEMPLO 6.4.1
Para ajustar una recta a un conjunto de 12 puntos de calibracin se proponen ecuaciones
de regresin lineal. Los signos de los residuos resultantes ordenados por valores de x creo
cientes son: + + + + - - - - - - + +. Comente si sera mejor intentar ajustar una
curva a los puntos.
,
Aqu M= N= 6, Yel nmero de rachas es tres. La Tabla A.1D muestra que, al nivel
P = 0.05, el nmero de rachas si se rechaza la hiptesis nula debe ser < 4. As, en este
caso se puede rechazar la hiptesis nula, y concluir que la sucesin de signos + y - no
es aleatoria. Por tanto, resulta poco satisfactorio intentar ajustar una lnea recta a los puntos
experimentales, y en su lugar se recomienda una grfica de regresin no lineal.

El contraste de Wald-Wolfowitz se puede utilizar con resultados cualesquiera que se puedan dividir o convertir en slo dos categoras. Supngase, por
ejemplo, que se dispone de los tiempos de funcionamiento de 12 lmparas
que se han ido colocando sucesivamente en un espectrmetro como fuentes
de luz y que son 450,420, 500,405, 390, 370, 380, 395, 370, 370, 420 Y 430
horas. El tiempo de vida mediano, en este caso el promedio de los tiempos
de funcionamiento de las lmparas sexta y sptima cuando los datos estn
dispuestos en orden creciente, es de 400 horas. Si a todas aquellas lmparas con tiempos de funcionamiento menor que el mediano se les asigna un
signo -, y a todas aquellas con tiempos de vida superior un signo +, entonces resulta la siguiente secuencia: + + + + ~ - - - - - + +. sta es la misma secuencia que la del ejemplo anterior de regresin, donde se demostr
que era significativamente no aleatoria. En este caso, las variaciones relevantes que se producen en los tiempos de funcionamiento se pueden explicar en
virtud de la procedencia de las lmparas de diferentes fabricantes o de diferentes lotes.
Se puede estar interesado en nmeros inusualmente grandes de rachas
cortas, as como en nmeros inusualmente pequeos de rachas grandes. Si
se presentan seis signos + y seis signos - en el orden: + - + - + ~ +
- + - + -, se podra sospechar muy claramente que existe una secuencia
no aleatoria. La Tabla A.10 muestra que, con N = Ni = 6, un total de 11 o
12 rachas indica que se debera de rechazar la hiptesis nula de orden aleatorio, y sospechar una cierta periodicidad en los datos.

6.5.

El contraste de rangos y signos de Wilcoxon

La Seccin 6.3 estudiaba el uso del contraste de los signos. Su inters reside
en los supuestos mnimos que se hacen sobre los datos experimentales. La
poblacin de la que se toma la muestra no se supone que sea normal, ni incluso que sea simtrica. Por otra parte, una cierta desventaja del contraste
de signos es que no utiliza toda la informacin disponible. Slo es necesario
saber si una medida individual es ms grande o ms pequea que la mediana:
la magnitud de esta desviacin no se utiliza con ningn otro objetivo.
En muchos casos un analista tendr razones para creer que sus medidas
se distribuyen simtricamente pero no las suficientes para suponer una dis-

tribucin normal. Este supuesto de datos simtricos, y la consecuencia de


que la media y la mediana de la poblacin sean iguales, permite desarrollar
contrastes de significacin ms potentes. Wilcoxon contribuy con importantes avances a este respecto, y su contraste de rangos y signos tiene varias
aplicaciones. Su mecanismo se ilustra mucho mejor mediante un ejemplo.

167

EJEMPLO 6.5.1
Se encontr que los niveles de plomo en sangre (en pg ml- 1) de siete nios eran 104, 79,
98, 150, 87, 136 Y 101. Podran proceder estos datos de una poblacin que se supone
simtrica, con una mediana/media de 95 pg ml- 1?
La concentracin de referencia (95) se resta de los valores de los datos dados
9,

- 16,

3,

55,

- 8,

41,

6
~

En primer lugar y prescindiendo del signo se ordenan estos valores de menor a mayor,
resultando:
3,

6,

8"

6,

-8,

9,

16,

41,

2,

-3,

c:

,...,..

Ul

55

-16,

9,

41,

55

Los nmeros entonces se jerarquizan; en este proceso los nmeros mantienen sus signos
pero se les asignan nmeros que indican su orden (o rango), as:
1,

O-

Ul

A continuacin se incorporan sus signos (en la prctica estos dos pasos se haran de una
vez):
3,

4,

-5,

6,

Los rangos positivos suman 20 y los negativos 8. La menor de estas cifras (8) se toma
como el estadstico del contraste. Si los datos proceden de una poblacin con una mediana
de 95 las sumas de los rangos positivos y negativos se esperara que fuesen aproximadamente iguales; si la mediana de la poblacin fuese muy diferente de 95, la suma de los
rangos positivos y negativos sera diferente. La probabilidad de que aparezca una suma
concreta en la prctica viene dada por una serie de tablas (vase Tabla A.11). En este
contraste se rechaza la hiptesis nula si el valor experimental es menor o igual que el valor
tabulado, es decir, la situacin opuesta de la observada en la mayora de los contrastes de
significacin. En este ejemplo, el examen de la Tabla A.11 muestra que, para n = 7, el
estadstico del contraste debe ser menor o igual que 2 para que la hiptesis nula -que los
datos procedan de una poblacin con una mediana (media) de 95- se pueda rechazar a
un nivel de significacin de P = 0.05. En este ejemplo, se debe aceptar la hiptesis nula.
Como es habitual, se utiliza un contraste de dos colas, aunque quiz haya ocasiones en las
que sea ms adecuado un contraste de una cola.

Una ventaja importante del contraste de rangos y signos reside en que tambin se puede utilizar para datos por parejas, ya que se pueden transformar
en el tipo de datos dados en el ejemplo anterior. De esta forma se puede utilizar el mtodo de rangos y signos como una alternativa no paramtrica al
contraste t por parejas (Seccin 3.4),

168

EJEMPLO 6.5.2
La siguiente tabla proporciona el contenido de cinc determinado por dos mtodos diferentes,
para ocho muestras de alimentos.

Muestra

Va/oracin con AEDT

Espectrometra atmica

1
2

7.2

5.2
5.9
9.0
8.5
6.6
4.4

7.6
6.8
4.6
5.7
9.7
8.7
7.0
4.7

6.1

5
6

7
8

Hay evidencia de diferencia sistemtica entre los resultados de los dos mtodos? La aproximacin a este tipo de problemas es muy simple. Si no hay diferencia sistemtica entre los
dos mtodos, entonces es de esperar que las diferencias entre los resultados para cada
muestra, es decir, [(resultado de la valoracin - resultado de la espectrometra)], se distribuirn simtricamente en torno a cero. Las diferencias con signo son:
- 0.4,

- 0.7,

0.6,

0.2,

- 0.7,

- 0.2,

_. 0.4, . - 0.3

Colocando estos valores en ordenriumrico sin tener en cuenta el signo, se tiene:


~

0.2,

0.2,

- 0.3,

- 0.4,

0.4,

0.6,

- 0.7,

- 0.7

La asignacin de rangos de estos resultados presentan una dificultad, la de las posiciones


empatadas. Hay dos resultados con el valor numrico 0.2, dos con un valor numrico de
0.4, y dos con un valor numrico de 0.7. Cmo se calculan los rangos? Este problema se
resuelve asignando posiciones promedio a los valores empatados, con signos adecuados.
Por tanto, los rangos resultantes para estos datos es:
-1.5,

1.5,

- 3,

- 4.5,

- 4.5,

6,

- 7.5,

- 7.5

En estos casos, merece la pena verificar si se ha hecho correctamente la ordenacin calculando la suma de todos los valores sin tener en cuenta el signo. La suma de los nmeros
anteriores es 36, que es la misma que la suma de los ocho primeros nmeros enteros y,
por tanto la ordenacin es correcta. La suma de los valores positivos es 7.5, y la de los
negativos 28.5. Por tanto, el estadstico del contraste toma el valor 7.5. Al mirar la Tabla
A.11 se observa que, para n = 8, el estadstico del contraste tiene que ser ~ 3 para que
se pueda rechazar la hiptesis nula al nivel de significacin P = 0.05. En este caso, tiene
que aceptarse la hiptesis nula: no hay evidencia de que la mediana (media) de la diferencia
sea distinta de cero, y por tanto no hay ninguna evidencia sobre la existencia de diferencia
sistemtica entre los dos mtodos analticos.

De estos ejemplos se desprende que el contraste de rangos y signos es un


mtodo sencillo y valioso. Su limitacin principal radica en que no se puede
aplicar a conjuntos de datos muy pequeos: para un contraste de dos colas
al nivel de significacin P = O.OS, n tiene que ser al menos 6.

6.6.

Contrastes simples para dos muestras


independientes

El contraste de rangos con signos que se acaba de exponer es valioso para


estudiar conjuntos individuales de medidas y para conjuntos de datos por

parejas que se puedan reducir con facilidad a conjuntos individuales. Sin embargo, en muchos casos es necesario comparar dos muestras independientes
que no se puedan reducir a un conjunto nico de datos. Dichas muestras
pueden contener diferentes nmeros de medidas. Para abordar estos problemas se han propuesto varios contrastes no paramtricos. El ms sencillo de
comprender y realizar es el contraste U de Mann- Whitney, cuya ejecucin
se entiende mejor con un ejemplo.

169

EJEMPLO 6.6.1
Se analiz una muestra de material fotogrfico de desecho mediante espectrometra de absorcin atmica para conocer el nivel de plata, proporcionando para cinco determinaciones
sucesivas los valores 9.8, 10.2, 10.7, 9.5 Y10.5 pg mI"- 1. Despus de recibir un tratamiento
qumico, se volvieron a analizar por el mismo procedimiento. Los resultados obtenidos para
las cinco determinaciones sucesivas fueron los siguientes: 7.7, 9.7, 8.0, 9.9 Y9.0 ~lg mi 1.
Hay alguna evidencia de que el tratamiento traiga consigo una reduccin significativa en
los niveles de plata?
El procedimiento de Mann-Whitney implica encontrar el nmero de resultados en una muestra que supera a cada uno de los valores en la otra muestra.
En este ejemplo, se tiene la impresin de que la concentracin de plata de la solucin
tratada debera ser, si acaso, menor que la de la solucin no tratada (es decir, un contraste
de una cola es adecuado). De esta forma se espera encontrar que el nmero de casos en
los que una muestra tratada tiene un valor ms alto que una muestra no tratada debera
ser pequeo. A continuacin se lista cada uno de los valores de la muestra no tratada, y
se anota en cada caso el nmero de casos en que los valores para la muestra tratada son
mayores.
Muestra no
tratada

Va/ores ms grandes
en /a muestra tratada

Nmero de va/ores
ms grandes

9.8
10.2
10.7
9.5
10.5

9.9

1
O
O
2
O

9.7,9.9

La suma total de la tercera columna, en este caso 3, es el estadstico del contraste. La


Tabla A.12 se utiliza para el contraste- U de Mann-Whitney: de nuevo los valores crrticos que
conducen al rechazo de la hiptesis nula son aquellos que son menores o iguales a los
nmeros tabulados. La tabla muestra que para un contraste de una cola al nivel P = 0.05,
con cinco medidas de cada muestra, el estadstico del contraste debe ser ~ 4 si tiene que
rechazarse la hiptesis nula. En este ejemplo se puede, por tanto, rechazar Ho: el tratamiento del materal que contiene plta reduce probableme'nte el nivel del metal.

Cuando, como en este ejemplo, los nmeros de medidas son pequeos, el clculo se puede hacer mentalmente, lo que es una gran ventaja. Si se presentan
empates (valores idnticos) en el contraste U, a cada empate se le asigna un
valor de 0.5 en el clculo de U.
Otro mtodo conveniente que tiene algunas caractersticas interesantes es
el contraste rpido de Tukey. Su uso puede mostrarse utilizando el mismo
ejemplo.

""'\

cT

(f)
,-r

O
(f)

170

El contraste rpido de Tukey incluye calcular el nmero total de medidas en las dos muestras independientes que no se incluyen en la regin
de solapamiento de los dos conjuntos de datos.

EJEMPLO 6.6.2
Aplicar el contraste rpido de Tukey a los datos del ejemplo anterior.
Se puede considerar que el contraste consta de dos pasos, aun cuando slo se disponga
de pocos resultados; esos dos pasos se agrupan sin lugar a duda en un nico clculo
mental rpido. En el primer paso, se cuenta el nmero de resultados en el segundo conjunto
de datos que son inferiores a todos los valores delprimer conjunto. Si no existe ningn valor
con esa condicin el contraste se da por terminado, y se acepta la hiptesis nula de medianas iguales. En el ejemplo que se est analizando, hay tres de esos valores, las lecturas
7.7, 8.0 Y9.0, inferiores al menor valor del primer conjunto (9.5). El contraste contina con
el segundo paso, en el que se cuentan todos los valores del primer conjunto de datos que
son superiores a todos los valores del segundo grupo. De nuevo, si no existen esos valores
el contraste se termina y se acepta la hiptesis nula. Aqu, hay de nuevo tres valores, 10.2,
10.5 Y 10.7, que superan al mayor valor del segundo conjunto de datos (9.7). (Esta aproximacin contrasta con la del contraste U de Mann-Whitney que identifica los valores grandes
en la muestra que se esperaran tener la mediana ms pequea.) Globalmente, por tanto,
hay seis valores que no estn dentro del intervalo donde se solapan las dos muestras. Este
total (a menudo designado por 7J es el estadstico del contraste. El aspecto ms interesante
y destacado del contraste rpido de Tukey es que normalmente no son necesarias tablas
estadsticas para interpretar este resultado. Con tal que en cada muestra el nmero de
lecturas no exceda de 20, y que los dos tamaos muestrales no difieran mucho (condiciones
que probablemente sern vlidas en muchos experimentos realizados en laboratorios analticos), los valores crticos de Tpara un nivel de significacin concreto son independientes
del tamao muestra! Para un contraste de una cola se puede rechazar la hiptesis nula si
T~ 6 (para p= 0.05), ~7 (P= 0.025), ?-,10 (P= 0.005) Y ?-'14 (P= 0.0005). (Para un
contraste de dos colas los valores crticos Tpara P= 0.05, 0.025, 0.005 Y 0.0005 son 7,
8, 11 Y 15, respectivamente.) En el ejemplo que estamos analizando, el valor de Tes suficientemente grande para ser significativo a un P = 0.05 en un contraste de una cola. Se
puede por tanto rechazar la hiptesis nula y concluir que el tratamiento reduce significativamente el contenido de plata del material fotogrfico de desecho, lo que concuerda con el
contraste U de Mann-Whitney.

Si se producen empates en el contraste rpido de Tukey (es decir, si uno de


estos valores en la muestra hipotticamente ms grande es igual al mayor
valor de la otra muestra, o si uno de los valores en la muestra ms pequea
es igual al menor valor de la muestra ms grande,,), entonces cada empate
se cuenta como 0.5 en el clculo del valor de T.
Un contraste que est lejanamente relacionado con el mtodo de MannWhitney ha sido desarrollado por Siegel y Tukey para comparar la variabilidad de dos conjuntos de resultados, ofreciendo una alternativa genuinamente no paramtrica al contraste-F (vase la Seccin 3.6). Los datos procedentes de los dos conjuntos de medidas se juntan y se ordenan por orden
creciente del valor numrico, subrayando uno de los conjuntos de resultados
para diferenciarlo del otro. Luego se ordenan de una forma ingeniosa: a la

medida ms pequea se le asigna la posicin 1, a la medida ms grande se le


asigna la posicin 2, la medida inmediatamente anterior a la ms grande lleva la posicin 3, la medida inmediatamente posterior a la ms pequea lleva
la posicin 4, la medida posterior a las dos ms pequeas lleva la posicin 5
y as sucesivamente. (Si el nmero total de medidas es impar se ignora la
medida central). Esta ordenacin alterna por pares produce una situacin en
la que se asignan posiciones bajas a los resultados bajos y altos, y los resultados centrales reciben posiciones altas. Si un conjunto de datos tiene una
variabilidad significativamente mayor que el otro, su suma de rangos debera
ser mucho menor, mientras que si la dispersin en los dos conjuntos de resultados es similar, sus sumas de rangos sern tambin similares. La aplicacin de este mtodo utilizando los datos del Ejemplo 6.6.1 proporciona las
posiciones siguientes:

171

Datos

'<

3:
ro,

O
o..
O

(Jl

::l
O

"O
p

3
ro,
q-

_.

(')

(Jl

Posiciones

7.7

8.0

9.0

9.5

9.7

9.8

9.9

10.2

10.5

10.7

10

Ahora se calculan dos sumas de rangos. La suma de las posiciones correspondientes a valores subrayados (muestras tratadas que contienen plata) es 26
y la suma de rangos de las muestras no tratadas es de 29. En este ejemplo
los tamaos muestrales para los dos conjuntos de mediciones son iguales,
aunque ste no ser siempre el caso. Esto se puede permitir mediante la resta
del nmero n/ni + 1)/2 de la suma de rangos, donde los valores de ni son los
tamaos muestrales. En nuestro ejemplo, ni = 5 en cada caso, de manera que
debe restarse 15 de cada suma de rangos. El valor menor de los dos resultados es el utilizado en el contraste, y los valores crticos son los mismos que
los utilizados en el contraste de Mann-Whitney (Tabla A.12). El estadstico
del contraste obtenido en este ejemplo es (26 - 15) = 11, mucho mayor que
el valor crtico de 2 (para un contraste de dos colas a un nivel de P = 0.05).
Se acepta la hiptesis nula, en este caso que la variabilidad de los resultados
sea similar para los dos conjuntos de datos.
El contraste de Siegel-Tukey junta los datos de las dos muestras con
identificacin de cada uno, los ordena, aplica la ordenacin alterna por
pares para generar suma de rangos y teniendo en cuenta los tamaos
muestrales, proporciona un estadstico del contraste que puede ser evaluado utilizando las mismas tablas que para el contraste U de MannWhitney.
Si se analiza un poco este contraste til se ver que su validez queda reducida cuando los valores promedios de los dos conjuntos de datos son sustancialmente diferentes. En el caso extremo en que todas las medidas en una
muestra sean inferiores a todas las medidas en la otra muestra, las sumas de
rangos sern siempre muy parecidas, cualquiera que sea la variabilidad de las
dos muestras. Si se teme que este efecto es apreciable, se pueden estimar las
medias de las dos muestras, y aadir la diferencia entre las medias a cada
una de las medidas del conjunto inferior. Esto eliminar cualquier efecto de-

a
CT

O
(Jl

172

bido a medias diferentes, mientras que se mantendr la dispersin de la


muestra. Un ejemplo de aplicacin de este contraste se proporciona al final
del captulo.

6.7.

Contrastes no paramtricos para ms


de dos muestras

La seccin anterior describi contrastes en los que dos muestras estadsticas


se compararon entre s. Sin embargo, los mtodos no paramtricos no se encuentran limitados a dos conjuntos de datos: existen mtodos que comparan
tres o ms muestras. Antes de que se expongan dos de estos contrastes, es
importante mencionar un peligro que se debe evitar en todas las comparaciones de muchas muestras. Al examinar (por ejemplo) tres conjuntos de
medidas para comprobar que sus medianas son o no similares, existe la tentacin de comparar nicamente las dos muestras con las medianas mayor y
menor. Esta aproximacin simplista puede conducir a resultados engaosos.
Cuando se toman varias muestras de la misma poblacin original, hay casos
en que las medianas menor y mayor, consideradas aisladamente, resultan ser
significativamente diferentes. Esto es debido a que, a medida que aumenta el
nmero de muestras, la diferencia entre las medianas menor y mayor tender a aumentar. La aproximacin adecuada es realizar primero un contraste
que considere todas las muestras juntas: si se demuestra que no todas pueden
proceder de la misma poblacin, entonces se pueden realizar contrastes separados para intentar identificar donde se producen las diferencias significativas. Aqu se describen, en trminos generales, los principios de dos contrastes
no paramtricos para tres o ms conjuntos de datos: el lector que desee ms
informacin puede consultar los libros mencionados en la bibliografa.
El contraste de Kruskal-Wallis se aplica a la comparacin de las medianas
de tres o ms muestras no emparejadas. (Una generalizacin del anlisis de
plata descrito en la seccin anterior, con tres muestras de material fotogrfico de desecho, una sin tratamiento y las otras dos tratadas por mtodos diferentes, proporcionaran un ejemplo donde sera til el contraste.) Los resultados de tres (o ms) muestras se agrupan y se disponen por orden de
rangos. Se determina el total de posiciones de los datos de las diferentes
muestras: se promedian las posiciones empatadas con el mismo valor, como
se expuso anteriormente, aunque se aconseja un procedimiento de correccin especial si hay numerosos empates. Si cada muestra tiene el mismo nmero de medidas (esto no es una condicin del contraste), y si las muestras
tienen medianas similares, entonces sern similares la suma total de posiciones en cada muestra, y la suma de sus cuadrados sera mnima. Por ejemplo,
si tenemos tres muestras, cada una con cinco medidas, las posiciones irn de
la 1 a la 15 y la suma de todas ellas ser 120. Si se supone que las tres medianas son muy similares, y que la suma de las posiciones de cada muestra
son por tanto iguales a 40. La suma de los cuadrados de estos totales ser
40 2 + 40 2 + 40 2 = 4800. Si las medianas son significativamente diferentes,
entonces la suma de las posiciones totales de rangos sern tambin diferentes
unas de otras: supongamos 20, 40 Y 60. La suma de los cuadrados de dichos
totales ser siempre mayor que 4800 (20 2 + 40 2 + 60 2 = 5600).

Se puede determinar la probabilidad de obtener cualquier suma de cuadrados utilizando el estadstico chi-cuadrado (vase el Captulo 3). Si uno
se refiere a las muestras por A, B, e, etc. (k muestras en total), con un nmero de medidas nA' n/), ne, etc., y la suma de las posiciones por R A , R u , Re,
etc., entonces el valor de -/- viene dado por:
)

"[ =
,

R A2

12
N

+N

nA

2
RR

+-

n13

Re2.

+-

ne

+ ... - 3(N + 1)

(6.2)

donde N = nA + nI) + ne, etc. Este valor "/ se compara como de costumbre
con los valores tabulados. Estos ltimos son idnticos a los valores usuales
cuando el nmero total de medidas es mayor que ca. 15, no obstante se utilizan tablas especiales para nmeros de medidas ms pequeos. El nmero
de grados de libertad es k-l. Los valores experimentales de "/ que superen
los valores tabulados permi ten rechazar la hiptesis nula (que las medianas
de las muestras no sean significativamente diferentes). Como ya se ha indicado, en esta ltima situacin se pueden realizar otros contrastes sobre pares
individuales de muestras: de nuevo, los textos que se citan en la bibliografa
aportan ms detalles.
Ya se ha visto (Secciones 3.4 y 6.3) que cuando se comparan resultados
por parejas, se pueden utilizar contrastes estadsticos especiales. Estos contrastes se basan en el principio de que cuando dos mtodos experimentales
que no difieren significativamente se aplican a las mismas muestras qumicas, las diferencias entre pares de resultados emparejados similares deberan
estar cerca de cero. Este principio se puede extender a tres o ms conjuntos
de resultados emparejados similares utilizando un contraste no paramtrico
ideado en 1937 por Friedman. En qumica analtica, la principal aplicacin
del contraste de Friedman es la comparacin de tres (o ms) mtodos experimentales aplicados a las mismas muestras qumicas. El contraste utiliza
de nuevo el estadstico ,,/, en este caso para calcular las diferencias que aparecen entre los valores de la suma total de posiciones por distintos mtodos.
El siguiente ejemplo aclara la simplicidad de la aproximacin.

EJEMPLO 6.7.1
Se determinaron los niveles de un pesticida en cuatro extractos de planta por (A) cromatografa lquida de alta resolucin, (B) cromatografa gas-lquido, y (e) radionmunoensayo. Se
obtuvieron los siguientes resultados (todos en ng ml- 1):

Muestra
1
2

3
4

A
4.7
7.7
9.0
2.3

Mtodo
8
5.8
7.7
9.9
2.0

e
5.7
8.5
9.5
2.9

173

174

Este problema se resuelve sustituyendo los valores de la tabla por sus rangos. En cada fila
se asigna la posicin 1 al mtodo que da el resultado menor, y la posicin 3 a la que da
el resultado mayor:
Muestra

1
2
3
4

Mtodo
B

1
1.5
1
2

3
1.5
3
1

2
3
2
3

Es necesario el uso de un valor promedio en el caso de posiciones empatadas en la muestra 2 (vase la Seccin 6.5). Las sumas de los rangos para los tres mtodos A, B y e son
5.5, 8.5y 10, respectivamente. Estas sumas totalizaran nA(k + 1)/2 donde k es el nmero
de mtodos (aqu tres) y n el nmero de muestras (aqu cuatro). Se elevan al cuadrado las
sumas de los rangos dando 30.25. 72.25 Y 100, respectivamente, y estos cuadrados se
suman para dar el estadstico R que en este caso es 202.5. El valor experimental de l se
calcula entonces a partir de:
12R

l" = nA(k + 1) -

3~k+ 1)

(6.3)

que resulta en este caso 2.625. Al nivel P = 0.05, Y con k = 3, los valores crticos de l
son 6.0, 6.5, 6.4, 7.0, 7.1 Y 6.2 para n = 3, 4, 5, 6, 7 Y 8, respectivamente. (Muchos conjuntos de tablas estadsticas proporcionan ms datos, y cuando k> 7, se pueden utilizar
las tablas usuales de l con k-1 grados de libertad.) En este caso. el valor experimental de
l es mucho menor que el valor crtico, y se debe aceptar la hiptesis nula: los tres mtodos
dan resultados que no difieren significativamente.

El contraste de Friedman podra utilizarse alternativamente en forma inversa: suponiendo que los tres mtodos analticos dan resultados indistinguibles,
se podra utilizar el mismo procedimiento para contrastar diferencias entre
los cuatro extractos de plantas. En este caso h y n son 4 y 3, respectivamente,
pudiendo verificar el lector que R es 270 y que el valor resultante de / es
9.0. Este valor es mayor que el crtico para P = 0.05, n = 3, h = 4, que es
7.4. As en esta segunda aplicacin del contraste se puede rechazar la hiptesis nula, y afirmar que las cuatro muestras difieren en sus niveles de pesticida. Existen otros contrastes que permiten comparaciones entre pares de
muestras seleccionados.
El contraste de Friedman es evidentemente mucho ms simple de realizar
en la prctica que el mtodo ANOVA (Secciones 3.8-3.10), aunque no tiene
la capacidad de este ltimo de estudiar los efectos de interaccin (vase el
Capitulo 7).

6.8.

Correlacin ordinal

Los mtodos de ordenacin se pueden aplicar tambin a los problemas de


correlacin. El mtodo del coeficiente de correlacin ordinal de Spearman
que se va a describir en esta seccin es la aplicacin ms antigua de los mtodos de ordenacin en estadstica, propuesta en 1904. Como otros mtodos

de ordenacin, es especialmente ventajoso cuando alguno de los dos conjuntos de observaciones en estudio se puede expresar slo en trminos de un
orden de posicin en lugar de expresarse en unidades cuantitativas. As, en
el siguiente ejemplo, se investiga la posible correlacin entre las concentraciones de dixido de azufre en un conjunto de vinos de mesa y la calidad de
su sabor. La calidad del sabor de un vino no se expresa fcilmente en trminos cuantitativos, pero es re13tivamente sencillo ordenarlos mediante un panel de catadores de vino segn sus preferencias. Ejemplos de otros atributos
que se ordenan con facilidad pero que no se cuantifican fcilmente, incluyen
la condicin de animales experimentales, la calidad del espacio dedicado al
laboratorio, y la eficiencia del personal del laboratorio. Se debera tambin
recordar que si uno o los dos conjuntos de datos bajo estudio fueran cuantitativos, entonces (en contraste con los mtodos descritos en el Captulo 5)
no es necesario que se distribuyan normalmente. Como otros estadsticos no
paramtricos, el coeficiente de correlacin ordinal de Spearman, r" es fcil
de determinar e interpretar. Esto se muestra en el siguiente ejemplo.

EJEMPLO 6.8.1
Un panel de expertos ordena segn sus preferencias siete vinos de mesa diferentes. Al
mejor se le asigna la posicin 1, al siguiente la 2, y as sucesivamente. El contenido de
dixido de azufre de cada vino (en partes por milln) se determina mediante anlisis por
inyeccin en flujo con deteccin colorimtrica. Utilizar los resultados siguientes para determinar si hay relacin entre la calidad percibida en el vino y el contenido de dixido de azufre.
Vino
Rango segn sabor
Contenido de 802

A
1
0.9

2
1.8

1.7

2.9

5
3.5

3.3

4.7

El primer paso en los clculos es convertir los valores absolutos de las concentraciones de

802 en rangos (si aparecen posiciones empatadas se promedian como se describi en las
secciones anteriores):
Vino
Rango segn sabor
Contenido de 802

A
1
1

B
2
3

3
2

E
5
6

F
6
5

G
7
7

A continuacin, se calculan las diferencias, d, entre las dos ordenaciones. stas son O, - 1,
1, O, - 1, 1, O. El coeficiente de correlacin, (" viene dado por:

(6.4)

En este ejemplo, (s es 1 - (24/336), es decir, 0.929. La teora demuestra que, como el


coeficiente de correlacin usual, (s puede variar entre - 1 Y + 1. Cuando n = 7, !$ tiene
que superar 0.786 si se va a rechazar la hiptesis nula de ausencia de correlacin al nivel
de significacin P= 0.05 (Tabla A.13). Aqu, podemos concluir que hay una correlacin
entre el contenido de 802 de los vinos y su calidad percibida. Teniendo en cuenta la forma
en que se definen las posiciones, hay una fuerte evidencia de que ilos niveles de 802 ms
altos originan vinos con peor paladar!

175

176

Otro mtodo de correlacin ordinal, debido a Kendall, se introdujo en 1938.


Pretende tener algunas ventajas tericas sobre el mtodo de Spearman, pero
es ms complicado de calcular (especialmente cuando aparecen posiciones
empatadas) y no se emplea con tanta frecuencia.

6.9.

Metodos de regresin no paramtricos

Al analizar detalladamente los mtodos de regresin lineales en el captulo


anterior, se hizo hincapi en la hiptesis de distribucin normal para los
errores en la direccin del eje y, y qued clara la complejidad de alguno de
los mtodos de clculo. Esta complejidad se supera en gran parte al utilizar
calculadoras o computadoras, y existen tambin algunos mtodos de aproximacin rpidos para ajustar lneas rectas a datos experimentales (vase la
Bibliografa). Persiste an el inters en aproximaciones no paramtricas al
problema de ajustar una lnea recta a un conjunto de puntos. De los mtodos
disponibles, quiz el ms simple es el mtodo incompleto de Theil, denominado de esta forma para distinguirlo de otro procedimiento ms completo
desarrollado por el mismo autor (el mtodo completo).
El mtodo de Theil determina la pendiente de la recta de regresin
como la mediana de las pendientes calculadas a partir de pares de puntos seleccionados: la ordenada en el origen de la recta es la mediana de
los valores de las ordenadas en el origen calculadas a partir de la pendiente y coordenadas de los puntos individuales.
El mtodo supone que un conjunto de puntos (XI' YI), (Xz, yz), etc., va a ser
ajustado por una recta de la forma y = a + bx. El primer paso en los clculos
consiste en ordenar los puntos en orden creciente de x. Si el nmero de puntos, X, es impar, el punto medio, es decir, el valor mediano de X se elimina:
el clculo siempre exige un nmero par de puntos. Para cualquier pareja de
puntos (Xi' y), (Xj' y) donde Xj > Xi' la pendiente, bij' de la lnea que une los
puntos se puede calcular a partir de:

b
u

Cld j

y;)

(xi - xa

(6.5)

Se calculan las pendientes bij para el par de puntos (Xl' YI) Y el punto inmediatamente posterior al valor mediano de la x, para (Xz, yz) y el segundo punto posterior al valor mediano de la x, y as sucesivamente hasta que se calcule
la pendiente para la lnea que une el punto inmediatamente anterior a la mediana de X con el ltimo punto. De esta forma, si los datos originales contenan 11 puntos, se estimaran S pendientes (el punto mediano se ha omitido).
Para ocho puntos originales existiran cuatro estimaciones de la pendiente,
y as sucesivamente. Estas estimaciones de la pendiente se disponen en orden ascendente y su mediana es la pendiente estimada de la lnea recta. Con
este valor de b, los valores ai de la ordenada en el origen se estiman para cada
punto con la ayuda de la ecuacin y = a + bx. De nuevo las estimaciones de
a se disponen en orden ascendente y el valor mediano se elige como la mejor

estimacin de la ordenada en el origen de la recta. El mtodo se ilustra con


el siguiente ejemplo.

177

EJEMPLO 6.9.1
Se han obtenido los resultados siguientes en un experimento de calibracin para la determinacin absorciomtrica de un complejo metlico tipo quelato:
Concentracin, pg ml- 1
Absorbancia

O
0.04

10
0.23

20
0.39

30
0.59

40
0.84

50
0.86

60
1.24

70
1.42

Utilizar el mtodo de Theil para estimar la pendiente y la ordenada en el origen de la recta


que mejor se ajuste a esos puntos.
En este caso el clculo se simplifica al tener un nmero par de observaciones, y debido a
que los valores de la x (es decir, las concentraciones) aparecen a intervalos regulares y
estn ya ordenados. Por tanto. se calculan las estimaciones de la pendiente de los cuatro
pares de puntos:

b15 = (0.84 - 0.04)/40 = 0.0200


be = (0.86 - 0.23)/40 = 0.0158
~7

= (1.24 - 0.39)/40 = 0.0212

b48 = (1.42 - 0.59)/40 = 0.0208


Ahora se ordenan estas estimaciones de la pendiente, resultando 0.0158, 0.0200, 0.0208,
0.0212. La estimacin mediana de la pendiente es, por lo tanto, el promedio entre 0.0200
y 0.0208, es decir, 0.0204. Ahora se utiliza este valor de b para estimar la ordenada en el
origen, a. Los ocho valores a individuales son:

a, = 0.04 - (0.0204

x O) =

0.23
<% = 0.39
84 = 0.59
85 = 0.84
86 = 0.86
a7 = 1.24
8 8 = 1.42
=

(0.0204
(0.0204
(0.0204
(0.0204
(0.0204
(0.0204
(0.0204

x
x

x
x

x
x

+ 0.040
+ 0.026

10) =
20) =
30) =
40) =
50) =
60) =
70) =

0.018
- 0.022
+ 0.024
-0.160
+ 0.016
- 0.008
-

Ordenando estas estimaciones de la ordenada en el origen, se tiene - 0.160, - 0.022,


-0.018, -0.008, +0.016, +0.024, +0.026, +0:040. La estimacin mediana es
+ 0.004. Por tanto, la mejor lnea recta viene dada por y = 0.0204x + 0.004. La recta de
mnimos cuadrados, calculada por los mtodos del Captulo 5, es y = 0.0195x + 0.019.
La Figura 6.4 muestra que ambas rectas son muy similares cuando se representan. Sin
embargo, el mtodo de Theil tiene tres ventajas distintas: no supone que t090S los errores
estn en la direccin de Yo no supone que los errores en la direccin de la x o de la y se
distribuyan normalmente; y no se ve afectado por la presencia de resultados anmalos. Este
ltimo aspecto queda claramente ilustrado por el punto (50, 0.86) de este ejemplo. Tiene
toda la apariencia de ser una observacin anmala, pero su valor no afecta, en absoluto, al
clculo de Theil, ya: que ni b6 ni 86 afectan directamente a las estimaciones medianas
de la pendiente y ordenada en el origen, respectivamente. Sin embargo, en el clculo de
mnimos cuadrados, este punto anmalo tiene tanto peso como los".otros. Esto se refleja en
los resultados calculados; la lnea de mnimos cuadrados pasa ms cerca de la observacin
anmala que la lnea no paramtrica.

cr-

Ul

.-+

Ul

178

10

20

30

40

50

60

70

80

Concentracin, ;9 ml- 1

Figura 6.4. Grfico de la recta de calibrado, calculada por el mtodo de Theil ( - ) y por
el mtodo de mnimos cuadrados del Captulo 5 (- - -l.

A diferencia de la mayora de los mtodos no paramtricos, el mtodo de


Theil conlleva clculos tediosos, de manera que en la prctica se necesita un
programa de computadora tal como el de una macro de hoja de clculo. Tngase en cuenta que tambin existen otros mtodos no paramtricos para ajustar curvas, si bien stos escapan a los objetivos de este libro.

6.10.

Mtodos robustos

Al principio de este captulo se puso de manifiesto que hay una evidencia


creciente en las ciencias experimentales sobre la aparicin de distribuciones
del error con colas acusadas. stas se pueden considerar como distribuciones normales (Gaussianas) a las que se aade observaciones anmalas que
surgen de los errores groseros, o como el resultado de la superposicin de
varias distribuciones normales con medias similares pero varianzas diferentes. En cualquier caso, y en otras situaciones donde el alejamiento de la distribucin normal no sea grande, puede parecer una prdida de informacin
utilizar mtodos no paramtricos, que no hacen ninguna hiptesis en absoluto sobre la distribucin subyacente del error. Una aproximacin mejor sera
desarrollar mtodos que no excluyan por completo a resultados sospechosos,
pero que reduzcan el peso asignado a dichos datos. sta es la filosofa que
subyace en los mtodos robustos que se van a resumir en esta seccin y en
la siguiente: dichos mtodos se pueden aplicar a medidas repetidas y tambin
a datos de regresin/calibracin. Se han desarrollado muchos mtodos robustos, as que aqu slo es posible un breve resumen de este campo en desarrollo: se remite a11ect01 a la Bibliografa para fuentes de material adicional.
En todos estos mtodos surge un problema obvio. Si se pretende asignar
menos peso a la significacin de algunas de nuestras medidas, se ne'cesitan

uno o ms criterios sobre los que basar dichas decisiones, pero no se pueden
utilizar dichos criterios a menos que inicialmente se consideren todos los datos. Este problema se resuelve utilizando mtodos iterativos: se estima o adivina un valor o valores de inicio para alguna propiedad de nuestros datos, se
utilizan dichas estimaciones iniciales con nuestro criterio de ponderacin para llegar a una segunda estimacin, entonces se vuelven a aplicar nuestros
criterios, etc. Dichos mtodos son slo practicables si se dispone de una computadora, aunque debe ponerse de manifiesto que muchos programas estadsticos para computadoras no incluyen procedimientos para mtodos robustos.
Hay algunos mtodos robustos muy simples que no exigen dichas iteraciones, porque eliminan arbitrariamente, en lugar de ponderar por defecto,
una proporcin de los datos. Por ejemplo, la media recortada para cualquier conjunto de datos se encuentra omitiendo r observaciones de la parte
superior e inferior del recorrido de los datos. Este principio se puede aplicar
al conjunto de datos de alguno de los ejemplos de la Seccin 3.7. Este ejemplo consider siete medidas replicadas de ion nitrito en agua de ro (mgl- 1):

179

c:r
e
(J)
r-I-

0.380,

0.400,

0.401,

0.403,

0.410,

0.411,

0.413

Por razones de conveniencia los datos se han ordenado en orden numrico:


esto enfatiza que la cuestin obvia es si la medida 0.380 es una observacin
anmala. Si se retiene el nmero 0.380, la media de las siete medidas es
0.4026, y su desviacin estndar es 0.0112. Si, como sugiere el contraste de
Dixon (Seccin 3.7), se puede rechazar el resultado 0.380 (a P = 0.05), entonces la media y la desviacin estndar resultan ser 0.4063 y 0.0056, respectivamente. Esto confirma, como se observ en la Seccin 3.3, que la media
y (especialmente) la desviacin estndar son vulnerables a la aparicin de
observaciones anmalas. Supngase ahora la omisin de la medida ms pequea (0.380) y la ms grande (0.413) de las anteriores, y volvemos a calcular la media. Esto proporciona un nmero tcnicamente conocido como la
media recortada al 14.28 %, donde ese porcentaje se calcula como 100r/n
siendo r el nmero de medidas de la parte superior e inferior del recorrido
de los datos que se han omitido de los n resultados. Esta media recortada es
0.4050, claramente ms prxima a la segunda de las dos medias calculadas
antes, es decir, la media determinada despus del rechazo de la observacin
anmala. La robustez de esta media recortada es obvia: habra sido la misma,
cualesquiera que hubieran sido los valores que tomaran el resultado ms
grande y el ms pequeo. Pero esto tambin ilustra la crudeza del mtodo de
la media recortada. Por qu se debera omitir el valor 0.413, excepto por
razones de simetra? Es aceptable calcular un estadstico que ignore por
completo los resultados sospechosos (uno o varios)? Qu porcentaje de los
datos se debera eliminar mediante un recorte? (En la prctica es habitual un
recorte del 10 al 25 %.) Procedimientos que son superiores a mtodos de recorte agresivos son analizados a continuacin.
Una estimacin robusta simple de la desviacin estndar la proporciona
el recorrido intercuartlico (RI, vase la Seccin 6.2). Para una distribucin
del error normal, el RI es aproximadamente 1.350". Esta relacin permite conocer una estimacin de la desviacin estndar que no se ve afectada por

O
(J)

180

cualquier valor que tomen la medida ms grande o ms pequea. Desgraciadamente, el RI no es un concepto muy significativo para conjuntos de datos
muy pequeos. Adems, y algo sorprendente, hay varias convenciones diferentes para su clculo. Para muestras grandes el convenio elegido produce
pocas diferencias, pero para muestras pequeas las diferencias en los valores
de RI calculados son grandes, de manera que el RI tiene poca aplicacin en
qumica analtica.
Una aproximacin ms lgica a la estimacin robusta se puede basar en
el concepto de una funcin de distancia. Supngase que se tiene una serie
de n resultados x" ... , XII Y se desea estimar JL, la media de los resultados
"fiables". Normalmente nuestra estimacin de ,LI, indicada por el smbolo ,LI,
se obtiene minimizando la suma de cuadrados (Se) L (XI - 11)2. (Esta suma
1

de trminos cuadrticos es la fuente de la sensibilidad de la media a los errores grandes.) La expresin (x - IL)2 se considera como una funcin de distancia, ya que mide la distancia de un punto a ,LI. Una funcin de distancia
ms til en el presente contexto es Ix - rLI. Un mtodo ampliamente utilizado para contrastar medidas para datos con ponderaciones por defecto es
comparar Ix - JI I con ca donde c se suele tomar como 1.5 y e/' es una estimacin robusta de la varianza. Primero se considera la estimacin de (i2, y
luego se analiza el procedimiento de ponderaciones por defecto.
La estimacin robusta de la varianza se puede deducir de un estadstico
relacionado con la desviacin absoluta respecto a la mediana (DAM),
que se calcula a partir de
DAM = mediana [Ixi - mediana(xal]

(6.6)

DAM es un estadstico extremadamente til: un mtodo basto para evaluar


observaciones extremas (x o) es rechazarlas si [Ixo - mediana(x,JIl/DAM > 5.
Se puede demostrar que DAM/O.6745 es una estimacin robusta til de (J
(llamada ') que se puede emplear inalterada durante las estimaciones iterativas de j.

EJEMPLO 6.10.1
Estas tcnicas se pueden aplicar a las medidas analizadas antes (0.380, 00400, 0.401,
0.403, 0.410, 0.411, 0.413). Primero es necesario calcular el DAM. La mediana de estos
nmeros es 0.403 (es decir, el cuarto de los siete valores ordenados), de manera que las
desviaciones individuales (sin tener en cuenta los signos) son 0.023; 0.003. 0.002, O, 0.007,
O.OOS, 0.010, y 0.023. El DAM es la mediana de estos siete nmeros, es decir, 0.007, as
( = DAM/0.6745 = 0.007/0.6745 = 0.0104 Y 1.50- es 0.0156.
Ahora estamos en posicin para empezar las estimaciones iterativas de ./1. Este proceso
comienza tomando cualquier estimacin razonable para y calculando los valores Ix - rtl
para cada medida. En este ejemplo, supngase que el valor inicial de ji es la mediana,
0.403. Como se ha visto, las desviaciones individuales de este valor son (en orden numrico, pero despreciando sus signos) 0, 0.002, 0.003, 0.007, 0.008, 0.010 Y 0,023. En la
primera iteracin para ji las medidas originales son retenidas si estas desviaciones a la
mediana son .:;; 0.0156. Esto se aplica a todas las desviaciones listadas excepto a la ltima. En el caso de que la desviacin sea > 0.0156, el valor original en cuestin se cambia
para llegar a ser ji o ji +
dependiendo de si originalmente estaba por debajo o

ca

ca,

por encima de la mediana, respectivamente. En el presente ejemplo, el valor 0.380 que


proporciona a la desviacin grande de 0.023, se ha cambiado a il-es decir,
0.403 - 0.0156 = 0.3874.
Por tanto, ahora hay un nuevo conjunto de datos, con la medida 0.380 en el conjunto
original habindose sustituido por 0.3874. Este nuevo conjunto de nmeros se llama un
conjunto de pseudo-va/ores (X;), y el clculo se repite utilizando este nuevo conjunto. El
primer paso es calcular la media de los nuevos valores (ntese que aunque el valor inicial
de 1-1 se pueda basar en la media o en la mediana o en cualquier otra estimacin sensible,
los pasos subsiguientes en la iteracin siempre utilizan la media): esto proporciona el resultado 0.4036. Las desviaciones individuales de esta nueva estimacin de i son, en orden
numrico y sin signos, 0.0006, 0.0026, 0.0036, 0.0064, 0.0074, 0.0094 Y 0.0162. Como se
esperaba (puesto que slo una medida era sospechosa en el primer lugar) slo la ltima de
estas desviaciones supera 0.0156, lo que significa que de nuevo la medida en cuestin es
cambiada, de 0.3874 a (0.4036- 0.0156) = 0.3880. El siguiente conjunto de siete valores
es por tanto el mismo que el conjunto previo, excepto que el valor 0.3874 se sustituye por
0.3880. La nueva media (valor I) es por tanto 0.4037. Esto resulta tan prximo al valor
previo que es claramente innecesario llevar a cabo cualquier iteracin posterior: se concluye
que una estimacin robusta de 1 es 0.4037, digamos 0.404. Este ejemplo es el tpico en el
que hay una convergencia muy rpida de los valores iterados de i't

ca,

Este clculo merece varios comentarios. El primero es que, como tantos procedimientos iterativos, es mucho ms tedioso de describir y explicar que de
realizar! El segundo punto a observar es que en este ejemplo se ha estimado
p haciendo algunas hiptesis (robustas y razonables) sobre &. Hay tambin
mtodos donde lo opuesto es verdadero, es decir, se obtiene una estimacin
robusta de la precisin si se conoce un valor medio, e incluso ms mtodos
en los que ambas estimaciones robustas se calculan iterativamente cada una
por su lado. Por ltimo conviene recalcar de nuevo que estos mtodos robustos no tienen las preocupaciones y ambigedades de los contrastes de observaciones anmalas. En el ejemplo que se acaba de examinar, el contraste de
Dixon (Seccin 3.7) sugiri que el valor 0.380 podra ser rechazado como
una observacin anmala (P = 0.05), pero el simple contraste basado en
DAM (ver lo anterior) sugiri que no sera as, ya que [Ix o - mediana(x,)lJ!
DAM = [10.380 - 0.4031J!0.007 = 3.3 se encuentra muy por debajo del valor
crtico aproximado de 5. Tales cuestiones y contradicciones desaparecen en
la estadstica robusta, donde las obsenraciones anmalas ni son completamente rechazadas ni aceptadas sin cambios, sino que son aceptadas en una
forma modificada o con una ponderacin por defecto.
Otra aproximacin robusta a los estadsticos de medidas repetidas (y a la
regresin) viene proporcionada por la Winsorizacin. Esto se puede considerar como una variante del mtodo descrito antes. Las medidas que dan las
desviaciones ms grande y ms pequea de la mediana (o, en regresin, los
residuos ms grandes) se reducen en importancia movindolos de manera
que sus desviaciones/residuos sean iguales al siguiente valor ms grande
(o quiz el tercero ms grande) positivo o negativo, respectivamente. La
arbitrariedad del procedimiento resulta inferior que en los mtodos de recorte, ya que el cambio en el valor de desviacin/residuo para cualquier
punto sensible es pequeo. Dada la disponibilidad de los programas requeridos, stas y otras tcnicas robustas de regresin es seguro que encon-

181

182

trarn un uso creciente en qumica analtica en el futuro. Un rea donde su


uso ya se ha recomendado es en las comparaciones entre laboratorios (vese
el Captulo 4).

6.11.

Mtodos de regresin robustos

En las Secciones 5.13 y 6.19 se han expuesto los problemas causados por las
posibles observaciones anmalas en los clculos de regresin, y se ha analizado la problemtica del rechazo utilizando un criterio especificado y aproximaciones no paramtricas. Queda claro que las aproximaciones robustas
sern valiosas en la estadstica de la regresin as como en la estadstica de
las medidas repetidas, y de hecho, entre los cientficos analticos se ha incrementado el inters por los mtodos de regresin robustos. Un resumen de
dos de las muchas aproximaciones desarrolladas tiene que ser suficiente.
En la Seccin 6.9 se observ que una nica medida sospechosa tiene un
efecto considerable sobre los valores a y b calculados para una lnea recta
mediante el mtodo de mnimos cuadrados normal, que busca minimizar
la suma de los cuadrados de los residuos de y. Esto es debido a que, como en
el ejemplo de la determinacin de nitrito expuesto anteriormente, el uso de
los trminos cuadrticos da lugar a que dichos datos sospechosos tengan una
gran influencia sobre la suma de cuadrados. Una alternativa clara y obvia
consiste en minimizar la media de los residuos cuadrticos, que se encontrar afectada en menor extensin por los residuos grandes. Este mtodo de la
mnima mediana de cuadrados (MMC) es muy robusto: su punto de ruptura, es decir, la proporcin de observaciones extremas entre los datos que
se pueden tolerar es el 50 %, el valor mximo terico. (Si la proporcin de
resultados sospechosos supera al 50 % claramente llega a ser imposible distinguirlos de los resultados fiables.) Las simulaciones utilizando conjuntos de datos, con observaciones extremas incluidas de forma deliberada,
muestran un mejor funcionamiento que el obtenido con el mtodo de
Theil. El mtodo MMC tambin funciona bien en casos como el analizado
en la Seccin 5.11, donde se desea caracterizar la parte de una lnea recta
de un conjunto de datos que es lineal cerca del origen, pero no lineal a valores ms grandes de x e y. Su desventaja es que conlleva un clculo iterativo
que converge bastante lentamente: esto es, se exige a menudo muchas iteraciones antes de que los valores a y b estimados lleguen a ser ms o menos
constantes.
Otros mtodos de regresin robustos se estn utilizando crecientemente.
El mtodo de mnimos cuadrados iterativamente reponderados empieza
con una estimacin directa por mnimos cuadrados de los parmetros de una
recta. Entonces se asignan diferentes pesos a los residuos resultantes, usualmente a travs de una aproximacin de doble peso. Los puntos con residuos
muy grandes (por ejemplo, al menos seis veces ms grandes que el valor residual mediano) son rechazados, es decir, se le asigna peso cero, mientras
que a los puntos con los residuos ms pequeos se les asignan pesos que
crecen a medida que los residuos se hacen cada vez ms pequeos. Se aplica
entonces al nuevo conjunto de datos un clculo de mnimos cuadrados pon-

derados (Seccin 5.10); y estos pasos se repiten hasta que los valores para a
y h convergen a niveles estables. En este mtodo la convergencia suele ser
usualmente rpida.

6.12.

El contraste de la bondad del ajuste


de Kolmogorov

En el Captulo 3 se discuti el problema estadstico de la bondad del ajuste.


Este problema surge cuando se necesita contrastar la procedencia de una
muestra de observaciones de una distribucin concreta, como puede ser una
distribucin normal. El contraste chi-cuadrado es muy adecuado para este
propsito cuando los datos se presentan como frecuencias, si bien el contraste no se utiliza normalmente para menos de 50 observaciones, y es difcil de
usar con datos continuos. En esta seccin se describe el mtodo de Kolmogorov, muy apropiado para contrastar la bondad del ajuste con datos continuos. La ampliacin de este mtodo puede aplicarse a la comparacin de dos
muestras, aunque no se describir con detalle. Estos mtodos modificados
fueron descubiertos inicialmente por Smirnov, y al conjunto de estos contrastes se les conoce a menudo como el mtodo de Kolmogorov-Smirnov.
El principio de la aproximacin de Kolmogorov es muy simple. Compara
la curva de frecuencias acumuladas de los datos que se desea contrastar con
la curva de frecuencias acumuladas de la distribucin propuesta como hiptesis. El concepto de curva de frecuencias acumuladas, y su aplicacin asociada con el papel de probabilidad normal, se discuti en el Captulo 3. Cuando
se han trazado las curvas experimental e hipottica, el estadstico del contraste se obtiene encontrando la mxima diferencia vertical entre ambas, y
comparando, como de costumbre, este valor con un conjunto de valores tabulados. Si los datos experimentales distan sustancialmente de la distribucin esperada, las dos curvas se encontrarn suficientemente separadas en
alguna parte del diagrama de frecuencias acumuladas. Sin embargo, si los datos estn en gran consonancia con la distribucin esperada, las dos curvas
nunca se separarn mucho una de otra. En la prctica, el mtodo de Kolmogorov tiene dos aplicaciones habituales (los contrastes de aleatoriedad y los
contrastes de normalidad de la distribucin) y el funcionamiento de la manera de proceder con este mtodo para la ltima aplicacin se ilustrar con
un ejemplo sencillo.
Cuando se utiliza el mtodo de Kolmogorov para contrastar la normalidad de la distribucin, lo primero que hay que hacer es transformar los datos
originales, que podran tomar cualquier valor segn la media y la desviacin
estndar, en la variable normal estndar, z. Esto se hace utilizando la
ecuacin:
X-fl

z=--

(6.7)

(J

en la que cada trmino tiene su significado habitual. La funcin de distribucin acumulada se proporciona en la Tabla A.1. La Ecuacin (6.7) se puede
utilizar de dos formas. En algunos casos es necesario contrastar la proceden-

183

184

cia de un conjunto de datos de una distribucin normal concreta, de media


y desviacin estndar dada. En tal caso, se transforman directamente los datos experimentales mediante la Ecuacin (6.7) y se realiza el contraste de

Kolmogorov. Con ms frecuencia, simplemente ser necesario contrastar la


procedencia de los datos de cualquier distribucin normal. En este caso, primero se estiman la media y la desviacin estndar, por los mtodos simples
del Captulo 2; a continuacin se transforman mediante la Ecuacin (6.7); y
por ltimo se aplica el mtodo de Kolmogorov. Estos dos tipos de contraste
se analizan en el ejemplo siguiente.

EJEMPLO 6.12.1
Se realizaron ocho valoraciones, con los resultados 25.13,25.02,25.11,25.07,25.03,24.97,
25.14 Y 25.09 mI. Podran dichos resultados proceder de (a) na poblacin normal con
media 25.00 mi y desviacin estndar 0.05 mi, y (b) de cualquier otra poblacin normal?
(a) En este caso, el primer paso es transformar los valores de x en valores z utilizando la
relacin z = (x -. 25.00)/0.05, obtenida de ia Ecuacin (6.7). Los ocho resultados se transforman en 2.6, 0.4, 2.2, 1.4, 0.6, - 0.5, 2.8 Y1.8. Estos valores z se ordenan y representan
grficamente como una funcin de distribucin con un salto de 0.125 (es decir, 1/8) en cada
paso. (Obsrvese que ste no es el mismo clculo que se ilustr en la Seccin 3.12). La
comparacin con la funcin hipottica de z (Tabla A.l) indica (Figura 6.5) que la diferencia
mxima es 0.545 en un valor de z ligeramente inferior a 1.4. Para contrastar este valor se
utiliza la Tabla A.14. La tabla muestra que, para n = 8 Y P = 0.05, el valor crtico es 0.288,
de modo que se puede rechazar la hiptesis nula: los resultados de las valoraciones probablemente no proceden de una poblacin normal con media 25.00 y desviacin estndar
0.05 mI.
(b) En este caso, se estiman la media y la desviacin estndar [utilizando las Ecuaciones
(2.1) Y (2.2)] para 25.07 y 0.059 mi, respectivamente, y el ltimo resultado tiene dos cifras
significativas correctas. Los valores de zvienen ahora dados por Z= (x -- 25.07)/0.059, es
decir, por 1.02, - 0.85, 0.68, O, - 0.68, - 1.69, 1.19, 0.34. El diagrama de frecuencias
acumuladas difiere de la curva hipottica a lo sumo en 0.125 (en varios puntos). Esta diferencia es mucho ms pequea que el valor crtico de 0.288. Entonces se puede aceptar la
hiptesis nula de que los datos proceden de una poblacin normal con media 25.07 y desviacin estndar 0.059.

6.13.

Conclusiones

Los contrastes robustos y no paramtricos descritos en este captulo son slo


una pequea parte de todos los existentes. Los ejemplos expuestos ponen de
manifiesto tanto su potencia como su debilidad. En muchos casos su rapidez
y conveniencia aventajan, en cierta medida, a los mtodos convencionales, y
los contrastes no para mtricos no conllevan la hiptesis de una distribucin
normal. Se adaptan perfectamente al examen preliminar de un pequeo nmero de medidas, y a realizar clculos con rapidez (a menudo sin necesidad
de tablas) mientras el analista est en el banco de pruebas o en la fbrica. Se
pueden utilizar tambin cuando se estudian tres o ms muestras (Seccin
6.7). La potencia (es decir, la probabilidad de que una hiptesis nula falsa
sea rechazada: vase la Seccin 3.13) de un mtodo no para mtrico puede

1.0

185

ro
ro

"O

"S
E
::J
U

ro

e
'
'0
::J

.o
";:
t
'5

0.5

al
"O

e
'o
"o
e

::J

u..

-4

-3

-2

-1

Figura 6.5. El empleo del mtodo de Kolmogorov para contrastar la distribucin normal. Las
diferencias mximas entre la curva de frecuencias acumuladas terica y las dos distribuciones
contrastadas vienen reflejadas por las flechas (<-.

ser menor que la del correspondiente contraste paramtrico, pero la diferencia es realmente de escasa importancia. Por ejemplo, se han hecho muchas
comparaciones de la potencialidad en condiciones diferentes (es decir, distribuciones poblacionales y tamaos muestrales diferentes) del contraste U de
Mann-Whitney y del contraste t. El primero opera muy bien en casi todas
las circunstancias y es slo marginalmente menos potente que el contraste t
aun cuando los datos procedan de una poblacin normalmente distribuida.
Muchos programas para computadoras personales incluyen en la actualidad
varios contrastes no paramtricos. Dichos programas permiten evaluar un
conjunto concreto de datos con rapidez por dos o ms mtodos, y parece claro que el inters por estos mtodos aumenta en vez de disminuir.
Los mtodos robustos normalmente no son tan fciles de usar, a la vista
de la necesidad de clculos iterativos, pero representan la mejor manera de
abordar uno de los problemas ms difciles y comunes de los analistas prcticos, la existencia de resultados sospechosos y anmalos.
Exite una amplia variedad de contrastes de significacin (paramtricos,
no paramtricos y robustos), y a menudo en la prctica la tarea ms difcil
es decidir qu mtodo es el ms adecuado para un problema concreto. El
diagrama del Apndice 1 est diseado para tomar tales decisiones con ms
facilidad, aunque inevitablemente no puedan cubrir todas las posibles situaciones prcticas.

Bibliografa
Chatfield, C. 1988. Problem Solving: A Statistician's Guide. Chapman and Hall,
London. (Un libro eminentemente prctico y til que contiene muchos
consejos valiosos: extensos apndices resumen el conocimiento terico.)
Conover, W. J 1971. Practical Non-parametric Statistics. Wiley, New York.
(Probablemente el mejor texto general de mtodos no paramtricos.)

186

Daniel, W. 1978. Appled Non-parametric Statistics. Houghton Mifflin, Boston. (Un texto extenso que abarca un amplio rango de mtodos no paramtricos con bastante profundidad. Contiene muchos ejemplos.)
Rousseuw, P.]. and Leroy, A. M. 1987. Robust Regresion and Outlier Detection. John Wiley, New York. (Un libro excelente y de fcil lectura con
muchos ejemplos ilustrativos.)
Sprent, P. 1981. Quick Statistics. Penguin Books, London. (Una introduccin
excelente a los mtodos no paramtricos, con explicaciones claras y sin
matemticas, con muchos ejemplos y ejercicios.)
Sprent, P. 1989. Applied Non-parametric Statistical Methods. Chapman and
Hall, London. (Cubre a nivel prctico un amplio nmero de contrastes de
significacin, con una buena discusin de las tcnicas robustas.)
Velleman, P. F. and Hoaling, D. C. 1991. Applcations, Basics and Computing
ofExploratory Data Analysis. Duxbury Press, Boston. (Una introduccin
excelente a AID/AED: se incluyen programas de computadora en BASIC
y FORTRAN.)

Ejercicios
1.

Se realiz una valoracin cuatro veces, con los resultados: 9.84, 9.91,
9.89, 10.20 mI. Calcular y comentar la mediana y la media de estos resultados.

2.

El nivel de azufre en lotes de un fuel de avin exigido por el fabricante


tiene que estar normalmente distribuido con un valor mediano del
0.10 %. Lotes sucesivos poseen concentraciones de azufre de 0.09, 0.12,
0.10, 0.11, 0.08, 0.17, 0.12, 0.14 Y 0.11 %. Use el contraste de signos y
el contraste de rangos con signos para verificar las exigencias del fabricante.

3.

Las concentraciones (g 100 ml- l) de inmunoglobulina G en suero sanguneo de diez donantes se miden por inmunodifusin radial (IDR) y
por electroinmunodifusin (EID), con los siguientes resultados:
Donante
Resultados IDR
Resultados EID

1
1.3
1.1

2
1.5
1.6

3
0.7
0.5

4
0.9
0.8

5
1.0
0.8

6
1.1
1.0

7
0.8
0.7

8
1.8
1.4

9
0.4
0.4

10
1.3
0.9

Son significativamente diferentes los resultados de los dos mtodos?

4.

Se comprueba que diez cmaras de grafito utilizadas sucesivamente en


un espectrofotmetro de absorcin atmica electrotrmico duraban para
24,26,30,21, 19, 17,23,22, 25 Y 25 muestras. Contrastar la aleatoriedad de los tiempos de funcionamiento de estas cmaras.

5. Los niveles de alcohol encontrados para cinco voluntarios, despus


de beber tres jarras de cerveza cada uno, fueron de 104, 79, 88, 120 Y
90 mg 100 mI-l. Otra serie adicional de voluntarios bebieron tres jarras de

cerveza rubia cada uno, y se encontr que los niveles de alcohol en sangre
eran de 68, 86, 71, 79, 91 Y 66 mg 100 mI-l. Usar el contraste rpido de
Tukeyo el contraste U de Mann-Whitney para investigar si al beber cerveza
rubia se produce un nivel de alcohol en la sangre inferior que al beber la
misma cantidad de otro tipo de cerveza. Utilizar el mtodo de Siegel-Tukey
para verificar si las variabilidades en estos dos conjuntos de resultados difieren significativamente.
6.

Un laboratorio de qumica universitario posee siete espectrmetros de


absorcin atmica (A-G). Las encuestas sobre la opinin de los estudiantes de investigacin y del personal acadmico demuestran que el orden
de preferencia de los estudiantes en relacin a estos instrumentos es B,
G, A, D, C, F, E, Y que el orden de preferencia del personal acadmico
es G, D, B, E, A, C, F. Se encuentran correlacionadas las opiniones de
los estudiantes y del personal acadmico?

7.

Use el mtodo de Theil para calcular la lnea de regresin para los datos
del Ejercicio 1 del Captulo 5.

187

8.

Tomando los datos de inmunodifusin radial del anterior Ejercicio 3,


emplee el mtodo de Kolmogorov para contrastar la hiptesis de que
los niveles de inmunoglobulina G del suero estn distribuidos normalmente, con una media de 1.0 g 100 ml- l y una desviacin estndar de
0.2 g 100 mI]. Se ajustar mejor cualquier otra distribucin normal a
los datos?

9.

Los niveles de nquel en tres muestras de aceite crudo se determinaron


por espectrometra de absorcin atmica (seis replicaciones en cada
caso), con los siguientes resultados:

Muestra
1
2
3

14.2
14.5
18.3

Medidas (Ni, ppm)


16.8
15.9
19.1
15.5
20.0
17.7
18.0
15.4
20.1
16.9
17.7
17.9

16.0
16.1
19.3

Usar el mtodo de Kruskal-Wallis para decidir si los niveles de nquel en


los tres aceites difieren significativamente.

CJ

~
O
(Jl

Diseo
de experimentos
y optimizacin

7.1.

Introduccin

A lo largo de este libro se ha constatado que los mtodos estadsticos resultan


de innegable valor no solo en el anlisis de datos experimentales, sino tambin en el diseo y optimizacin de experimentos. As, muchos experimentos
fallan en su propsito debido a que no se planifican y disean adecuadamente en un principio, y en ese caso incluso los mejores procedimientos de
anlisis de datos no pueden compensar la total falta de previsin y planificacin. Este captulo introduce los conceptos bsicos del diseo experimental
y la optimizacin, resumiendo los mtodos que se deberan considerar y utilizar cuidadosamente antes de que comience cualquier procedimiento experimental nuevo.
En el Captulo 3 se introdujo la idea de un factor, es decir, cualquier
aspecto de las condiciones experimentales que influye en el resultado obtenido en un experimento. La Seccin 3.9 mostr el ejemplo de la dependencia
existente entre una seal de fluorescencia y las condiciones de almacenamiento de una solucin. El factor de inters era las condiciones de almacenamiento; en este caso se denomina factor controlado ya que el experimentador podra alterarlo a su voluntad. En otro ejemplo de la Seccin 4.3, se
contrastaba la pureza de la sal de diferentes partes de un tonel, el factor de
inters, es decir, la parte del tonel de la que se tomaba la sal se elega al azar.
Por esta razn este factor se denomina factor incontrolado. En estos dos
ejemplos los factores son cualitativos ya que sus posibles valores no se
pueden ordenar numricamente. Un factor cuyos valores posibles se pueden
ordenar numricamente, por ejemplo, la temperatura, se denomina cuantitativo. Los diferentes valores que toma un factor se denominan niveles o
tratamientos.
En los Captulos 3 y 4 se presentaron estos experimentos como una introduccin a los clculos que aparecen en el anlisis de la varianza (ANOVA).
No se mencionaron otras condiciones que podran haber introducido otros

190

factores que afectasen a los resultados, de manera que no pudieran considerarse otros diseos experimentales. En realidad el experimento de fluorescencia puede modificarse por otros factores tales como la temperatura
ambiente, el uso del mismo u otro fluormetro para cada medida, y las fechas,
horarios y personal encargado de realizar las medidas. Cualesquiera de estos
factores podra haber influido en los resultados que muestra el comportamiento observado e invalidar la conclusin extrada sobre el efecto de las
condiciones de almacenamiento. Queda claro que si se quiere que las conclusiones extradas de un experimento sean las correctas hay que identificar de
antemano los diferentes factores que influyen en el resultado y, si es posible,
controlarlos.
El trmino diseo experimental se utiliza habitualmente para describir las etapas de:
1.
2.
3.

Identificacin de los factores que pueden influir en el resultado de


un experimento.
Diseo del experimento de modo que se minimicen los efectos de
los factores incontrolados.
Utilizacin del anlisis estadstico para separar y evaluar los efectos de los diversos factores implicados.

Puesto que son muchos los factores que afectan a los resultados experimentales, pueden necesitarse diseos experimentales ciertamente complejos. La
eleccin de los mejores niveles prcticos de estos factores, es decir, la optimizacin de las condiciones experimentales, requerir un estudio detallado.
Estos mtodos, junto con otros mtodos multivariantes que se estudian en el
prximo captulo, se encuadran bajo el trmino general de quimiomtricos.

7.2.

Aleatorizacin y formacin de bloques

Uno de los supuestos de los clculos ANOVA de un factor (y otros) es que


la variacin incontrolada es verdaderamente aleatoria. No obstante, en aquellas medidas realizadas durante un perodo de tiempo, la variacin en un factor incontrolado como la presin, la temperatura, el deterioro de aparatos,
etc., puede producir una tendencia en los resultados. El resultado es que los
errores en un mtodo debidos a la variacin incontrolada no son durante
mucho tiempo aleatorios, ya que los errores en medidas sucesivas estn correlacionados. Esto puede conducir a un error sistemtico en los resultados.
Afortunadamente este problema se supera sin ms que utilizando la tcnica
de aleatorizacin. Supngase que se desea comparar el efecto de un nico
factor, la concentracin de cido perclrico en solucin acuosa, a tres niveles
diferentes o tratamientos (0.1 M, 0.5 M Y 1.0 M) sobre la intensidad de fluorescencia de la quinina (ampliamente utilizada como patrn primario en
espectrometra de fluorescencia). Supngase que se realizan cuatro medidas
repetidas de la intensidad para cada uno de los tratamientos, es decir, en
cada disolucin de cido perclrico. En lugar de realizar cuatro medidas en
cido 0.1 M, cuatro en cido 0.5 M Y cuatro en cido 1 M, se realizan 12

medidas en orden aleatorio mediante una tabla de nmeros aleatorios. Para


ello se asigna un nmero a cada una de las repeticiones de cada tratamiento
como sigue:
0.5 M
1M
0.1 M
01 02 03 04
OS
06 07 08
09 10 11
12
(Obsrvese que cada nmero tiene el mismo nmero de dgitos.) Despus de
entrar en una tabla de nmeros aleatorios (vase la Tabla A.8) en un punto
arbitrario, se leen los pares de dgitos, descartndose los pares de la forma
00, 13-99 Y tambin las repeticiones. Supngase que como resultado de lo
anterior aparece la sucesin 02, 10, 04, 03, 11, 01, 12, 06, 08, 07, 09, OS.
Entonces, utilizando los nmeros anteriormente asignados, se realizaran las
medidas a los niveles de cido diferentes en el siguiente orden: 0.1 M, 1 M,
0.1 M, 0.1 M, 1 M, 0.1 M, 1 M, 0.5 M, 0.5 M, 0.5 M, 1 M, 0.5 M. Este orden
aleatorio de medidas asegura que los errores en cada nivel de cido debidos
a factores incontrolados sean aleatorios.
Un inconveniente de la aleatorizacin completa es que no aprovecha las
posibles subdivisiones naturales en el material experimental. Supngase, por
ejemplo, que no se pudiesen llevar a cabo las 12 medidas del ejemplo anterior en el mismo da y se tuvieran que obtener en cuatro das consecutivos.
Utilizando el mismo orden de antes resultara:
Da
Da
Da
Da

1
2
3
4

0.1
0.1
1
0.5

M,
M,
M,
M,

1
1
0.5
1

M,
M,
M,
M,

0.1
0.1
0.5
0.5

M
M
M
M

Con este diseo las medidas que utilizan cido perclrico 0.1 M, como disolvente de la quinina se llevan a cabo (por azar) los dos primeros das, mientras que las que utilizan perclrico 0.5 M, se realizan los ltimos dos das. Si
se tuviese la impresin que existe diferencia entre los niveles de estos dos
cidos, no sera posible decir si esta diferencia es autntica o si est provocada por el efecto de utilizar los dos tratamientos en pares de das diferentes.
Un diseo mejor es aquel en el que cada tratamiento se utiliza una vez al
da, y el orden de los tratamientos se aleatoriza cada da. Por ejemplo:
Da
Da
Da
Da

1
2
3
4

0.1
0.1
1
1

M,
M,
M,
M,

1
0.5
0.5
0.1

M,
M,
M,
M,

0.5 M
1M
0.1 M
0.5 M

Un grupo de resultados que contenga una medida para cada tratamiento


(aqu, las medidas de cada da) recibe el nombre de bloque, de manera que
el diseo se llama de bloques aleatorizados. Otros diseos que no utilizan
en absoluto la aleatorizacin se consideran en la Seccin 7.4.

7.3.

ANOVA de dos factores

Cuando a los resultados de un experimento le pueden afectar dos factores, se


tiene que emplear el Anlisis de la Varianza de dos factores para estudiar sus

191

192

Tabla 7.1.

Forma general de la tabla del ANOVA de dos factores.


Totales de tila

Tratamiento
1

Bloque 1
Bloque 2

Xi1
X21

Xi2
..122

Xij
X2j

A2c

Bloque i

x~

Xij

Xc

Bloque r
Totales de columna

xt1
T1

xl2
T2

Xrj

xrc
Te

Ti

li.
12.

Xic

0T = gran total

efectos. En la Tabla 7.1 se muestra la forma del esquema general de este mtodo.
Cada una de las N medidas, xij, se clasifica bajo los trminos niveles de
los tratamientos y bloques: el ltimo trmino se introdujo en la seccin
anterior. (Estos trminos han derivado del uso original del ANOVA por
R. A. Fisher en experimentos agricolas, sin embargo son generalmente adoptados.) Utilizando los smbolos convencionales existen e niveles de tratamientos y r bloques, por tanto, N = er. Tambin aparecen los totales por fila
(T], T 2 , etc.) y por columna (T], T 2 , etc.) y el total global, T, que se necesitan en los clculos. (Los puntos en los totales de columnas y filas recuerdan
que en cada caso slo se estudia uno de los dos factores.) En la Tabla 7.2 se
proporcionan las frmulas para calcular la variacin de las tres fuentes diferentes, o sea, entre tratamientos, entre bloques, y los errores experimentales.
Su obtencin no se expondr aqu con detalle: los principios del mtodo son
similares a los descritos para el ANOVA de un factor (Seccin 3.9) y en la
Bibliografa se encuentran textos que proporcionan detalles adicionales.
Como en el ANOVA de un factor, los clculos se simplifican debido a la
aparicin repetida del trmino y2 IN, y por el hecho de obtenerse por diferencia el error residual (experimental aleatorio). Es de resaltar que puede
obtenerse una estimacin de este error experimental, aun cuando slo se haga una medida para cada combinacin del nivel de tratamiento y bloques
(por ejemplo, cada agente quelatante se ensaya slo una vez cada da en el
ejemplo siguiente).
Tabla 7.2.

Frmulas para el ANOVA de dos factores.

Fuente de variacin

Suma de cuadrados

Grados de libertad

Entre tratamientos

"!Jr- QIN

c-1

Entre bloques

I77lc-QIN

r- 1

Residual

por diferencia

por diferencia

Total

IIx7j- fIN

N-1

193

EJEMPLO 7.3.1
En un experimento para comparar la eficiencia porcentual de diferentes agentes quelatantes
en la extraccin de iones metlicos en solucin acuosa. se obtuvieron los siguientes resultados:
Agente queJatante
B
A
C

Ola
1
2
3

84
79
83

80

83
80
80

77

78

O
79
79
78

Cada da se prepara una disolucin reciente del ion metlico (con una concentracin especificada) y se realiza la extraccin con cada uno de los agentes quelatantes, tomados en
orden aleatorio.
En este experimento el uso de diferentes agentes quelatantes resulta un factor controlado ya que el experimentador elige los agentes quelatantes. El da de la realizacin del
experimento supone un factor incontrolado ya que intrGduce una variacin incontrolada causada por los cambios de la temperatura del laboratorio, presin, etc. y por ligeras diferencias
en la concentracin de la solucin del ion metlico, es decir, el da es un factor aleatorio.
En los captulos anteriores se explic la manera de utilizar el ANOVA para contrastar el
efecto significativo debido a un factor incontrolado o para estimar la varianza de un factor
aleatorio. En este experimento. donde se presentan los dos tipos de factores, el ANOVA de
dos factores se puede utilizar de las dos maneras: (i) para contrastar si los diferentes agentes quelatantes tienen eficiencias significativamente diferentes, y (ii) para contrastar si la
variacin da a da es significativamente ms grande que la variacin debida al error aleatorio de la medida y, si es as, estimar la varianza de esta variacin da a da. Como en el
ANOVA de dos factores. los clculos se pueden simplificar restando a cada medida un nmero arbitrario. La siguiente tabla muestra las medidas una vez que se les ha restado 80
a cada una de ellas.
Bloques'

Da 1
Da 2
Da 3
Totales por olumna, T.

f= 86

Tratamientos
B
C

-5

3
O
O
3

36

25

-1
3

O
-3

-2

Se tiene: r= 3, c= 4, N= 12 Y I

-1
-1
-2
16

-4

Totales por (la, 7;.

T7

6
-5

36
25
1I

-1

T7

62

O = Gran total, T

~i= 54.

El clculo de la tabla ANOVA proporciona los siguientes resultados:


Fuente de variacin

Entre tratamientos
Entre bloques
Residual
Total

Suma de cuadrados .
2

86/3 - 0 /12 = 28.6667


62/4 - 02/12 = 15.5
por diferencia = 9.8333.
54 - 02/12 = 54.0

g./.

Cuadrado medio

3
2
6
11

28.6667/3
15.5/2
9.8333/6

=
=
=

9.5556
7.75
1.6389

Es importante resaltar que, debido a que el cuadrado medio residual se obtiene por diferencia, se deben de tomar inicialmente en la tabla muchas cifras significativas para evitar erro. res significativos en los casos donde sea pequea esta diferencia calculada.

194

Es formativo verificar que este clculo separa de hecho los efectos entre tratamientos
y entre bloques. Por ejemplo, si se incrementan todos los valores de un bloque en una
cantidad fija y se vuelven a calcular las sumas de cuadrados, se llega a que, mientras se
modifica la suma de cuadrados total y entre bloques, la suma de cuadrados residual y entre
tratamientos no lo hace.
Si no hay ninguna diferencia entre las eficiencias de los quelatantes ni tampoco da a
da, entonces los tres cuadrados medios proporcionan una estimacin de a~, la varianza de
la variacin aleatoria debida al error experimental (vase la Seccin 3;9). Como en el
ANOVA de un factor, el contraste F se utiliza para ver si las estimaciones de la varianza
difieren significativamente. Comparando el cuadrado medio entre tratamientos con el cuadrado medio residual resulta:

F"" 9.5556/1.6389 "" 5.83


De la Tabla A.3 el valor crtico de F3 6 (una cola, p"" 0.05) es 4.76, de manera que se
encuentra que hay una diferencia entre las dos varianzas, es decir, entre la eficiencia de
los diferentes agentes quelatantes, al nivel del 5%. Comparando los cuadrados medios residuales y entre bloques (es decir, entre das) resulta:
F"" 7.75/1.6389 = 4.73

Aqu el valor crtico es 5.14, de manera que no hay diferencia significativa entre das. A
pesar de ello, el cuadrado medio entre bloques es considerablemente mayor que el cuadrado medio residual y hace que el experimento sea no bloqueado, de manera que estos
dos efectos se combinen en la estimacin del error experimental, el experimento no podra
probablemente haber sido posible de detectarse si diferentes tratamientos dan resultados
significativamente diferentes. Si la diferencia entre das hubiera sido significativa, indicara
que otros factores tales como la temperatura, presin, preparacin de la solucin, etc., hubieran tenido un cierto efecto. Puede demostrarse que los cuadrados medios entre bloques
proporcionan una estimacin de ~ +
donde
es la varianza de la variacin aleatoria
da a da. Puesto que el cuadrado medio residual proporciona una estimacin de a~, se
puede deducir una estimacin de ~.

cut

oi

Este ejemplo ilustra claramente la ventaja de considerar con detenimiento el


diseo de un experimento antes de que sea realizado. Entre un experimento
con bloques y otro sin bloques con el mismo nmero de medidas en cada
uno, el primero es ms sensible y produce ms informacin. La sensibilidad
del experimento depende del tamao de la variacin aleatoria: sta es tanto
ms pequea cuanto ms pequea sea la diferencia detectable entre los tratamientos. En un experimento sin bloques la variacin aleatoria sera ms
grande ya que incluira una contribucin de la variacin da a da, de manera
que se reducira la sensibilidad,
El clculo del ANOVA realizado anteriormente supone que los efectos de
los quelatantes y los das, si existen, son aditivos, pero no interactivos. Este
aspecto se discute posteriormente en la Seccin 7.5.

7.4.

Cuadrados latinos y otros diseos

En algunos diseos experimentales es posible tener en cuenta un factor extra


sin que se realice un aumento excesivo del nmero de experimentos. Un
ejemplo sencillo lo proporciona el estudio de los agentes quelatantes de la

seccin anterior, donde un factor incontrolado que no se tuvo en cuenta fue


el momento del da en el que se tomaban las medidas. La variacin sistemtica durante el da debida al deterioro de las soluciones o al cambio en la
temperatura del laboratorio podra producir una tendencia en los resultados.
En tales casos, cuando existe un nmero igual de bloques y tratamientos
(ste no fue el caso del ejemplo anterior) es posible utilizar un diseo experimental que permita la separacin de tal factor adicional. Supngase que
los tratamientos se etiquetan como A, B Y e, entonces un posible diseo
podra ser:

A B e
e A B

Da 1
Da 2
Da 3

195

o
(ji'
(\)

:JI

P-

ro

(\)

><

'
(\)

::1-

(\)

:J
.....

CJl

Este diseo de bloques, en el que cada tratamiento aparece una vez en cada
fila y una vez en cada columna, recibe el nombre de cuadrado latino. ste
permite separar la variacin entre tratamientos, entre bloques, entre los momentos del da y los componentes del error experimental aleatorio. Es posible considerar diseos ms complejos que eliminen esta restriccin de igual
nmero de bloques y tratamientos. Si existen ms de tres bloques y tratamientos son obviamente posibles ins de un diseo de cuadrados latinos
(uno puede elegirse al azar). Los tipos de diseo experimental discutidos hasta aqu se denominan de clasificacin cruzada, ya que proporcionan las
medidas para cada combinacin posible de los factores. Sin embargo, en
otros casos (por ejemplo, cuando se envan muestras a diferentes laboratorios, y se analizan por dos o ms experimentadores en cada laboratorio) los
diseos se denominan anidados o jerrquicos, debido a que los experimentadores no realizan medidas en otros laboratorios que no sean las realizadas
en el suyo propio. Tambin son posibles mezclas entre diseos anidados y
de clasificacin cruzada.

7.5.

Interacciones

En el ejemplo de la Seccin 7.3 se vio que los clculos ANOVA de dos factores utilizados suponan que los efectos de los dos factores (agentes quelatantes y das) eran aditivos. Esto significa que si, por ejemplo, slo se dispone
de dos agentes quelatantes, A y B, Y se estudian los dos das, los resultados
podran haber sido algo as:

Agentes quelatantes
Da 1
Da 2

80

82

77

79

Esto es, utilizando el agente quelatante B en lugar del A se produce un


aumento del 2 % en la eficiencia de extraccin los dos das, siendo la eficiencia de la extraccin del segundo da menor que la del primero en un 3 % ,
cualquiera que sea el agente quelatante utilizado. En un tipo de tabla sencilla
como la mostrada, esto significa que cuando se conocen tres medidas, la

'<:

O
'
.....

3'

~.
()

5:
:J

196

cuarta se puede deducir fcilmente. Supngase, sin embargo, que la eficiencia de extraccin del agente quelatante B el segundo da hubiera sido del
83 % en vez del 79 %. Entonces se concluira que la diferencia entre los dos
agentes depende del da que se realicen las medidas, o que la diferencia entre
los resultados de los dos das depende del agente que se use. Esto es, existira
una interaccin entre los dos factores que afectan a los resultados. Tales
interacciones son extremadamente importantes en la prctica: una estimacin reciente sugiere que al menos dos tercios de los procesos en la industria qumica estn afectados por interacciones, factores muy opuestos a los
aditivos.
Desafortunadamente, cuando la situacin se confunde por la presencia
de errores aleatorios, la deteccin de interacciones no es del todo tan sencilla
como implican los anteriores ejemplos,. Si se aplica un clculo de un
ANOVA de dos factores a la sencillsima tabla anterior, la suma de cuadrados residual da cero, pero si uno de los valores se modifica esto ya no es as.
Con este diseo del experimento no se puede decir si una suma de cuadrados
residual distinta de cero es debida a errores aleatorios, a una interaccin entre los factores, o a ambos efectos. Para resolver este problema deben repetirse las medidas de cada casilla. La manera de hacer esto es importante: las
medidas deben repetirse de manera que todas las fuentes de error aleatorio
estn presentes en cada caso. As pues, si en nuestro ejemplo se ha utilizado
material de vidrio diferente u otras partes de equipos en los experimentos
con diferentes agentes quelatantes, entonces las medidas repetidas aplicadas
a cada agente quelatante cada da deben utilizar tambin aparatos diferentes.
Si se utiliza el mismo equipo para estas repeticiones, se desestimar claramente el error aleatorio de las medidas. Si las repeticiones se realizan adecuadamente, el mtodo que permite separar la suma de los cuadrados de la
interaccin y el error aleatorio se ilustra mediante el siguiente ejemplo.

EJEMPLO 7.5.1
En un experimento para investigar la validez de una solucin como patrn de absorbancia
lquido, se calcul el valor de la absortividad molar, D, de soluciones con tres concentraciones diferentes a cuatro longitudes de onda diferentes. Se realizaron dos medidas repetidas
por cada combinacin de concentracin y longitud de onda y se aleatoriz el orden en que
se hicieron las medidas. Los resultados se muestran en la Tabla 7.3: para simplificar los
clculos, los valores de /: calculados se han dividido por 100.
Tabla 7.3.

Valores de absortividad molar para un posible patrn de absorbancia


Longitud de onda, nm

Concentracin, g/
0.02
0.04
0.06

240

270

300

350

94,96
93,93
93,94

106,108
106,105
106,107

48,51
47,48
49,50

78,81
78,78
78,79

La Tabla 7.4 muestra el resultado de los clculos con Minitab para estos resultados.
(NB. Al utilizar este programa para los clculos de ANOVA de dos factores con interaccin,
es esencial evitar la opcin de un modelo aditivo, ya que ste excluira el efecto deseado
de interaccin. Excel proporciona tambin opciones para incluir efectos de interaccin en el
ANOVA de los factores.) Aqu se explica con ms detalle como se obtiene esta tabla ANOVA.
Tabla 7.4.

Salida de Minitab para el Ejemplo 7.5.1.

Two-way analysis of variance


Analyss of Variance for Response
Source
DF
SS
MS
Conc .
2
12 . 33
6.17
Wavelength
3 11059.50 3686.50
0.33
Interacton
6
2.00
Error
12
16.00
1. 33
Total
23
11089.83

El primer paso en los clculos es encontrar los totales de celda. Esto se hace en la Tabla
7.5, que tambin incluye otras cantidades necesarias en los clculos. Como antes, T denota
el total de la fila ,isima, T el total de la columna fsima y T el gran total.
Tabla 7,5.

Totales de celda para los clculos de ANOVA de dos factores.


240nm

270nm

300nm

0.02 gl-l
0.06 gl 1
0.10 gl-l

190
186
187

214
211
213

99
95
99

T./

563

638

293

1"/

316969

407044

85849

L 1" = 1032646

T,

t:

159
156
157

662
648
656

438244
419904
430336

472

T= 1966

350nm

/.

222784

L T7 = 1288484

Se calculan como antes las sumas de cuadrados entre filas, entre columnas y el total. Cada
clculo, exige el trmino 1"/nrc (donde n es el nmero de medidas repetidas en cada celda,
en este caso 2, r el nmero de filas y e el nmero de columnas). A este trmino se le
denomina a veces trmino de correccin,
Aqu se tiene:

c= f-/nrc= 1966 /(2 x 3 x 4) = 161048.17

Se calculan ahora las sumas de cuadrados:


Suma de cuadrados entre filas =

T7I nc -

1288484/(2 x 4) - 161048.17

12.33

con r - 1 = 2 grados de libertad.


Suma de cuadrados entre columnas =

L 1"/nr -

1032646/(2 x 3) - 161048.17

11059.50

197

198

con e - 1 = 3 grados de libertad.

L ijk - e

Suma de cuadrados total =

donde X/k es la k-sima rplica en la ,Lsima fila y jsima columna, es decir, I xik es la
suma de los cuadrados de las medidas individuales que aparecen en la Tabla 7.3.
Suma de cuadrados total = 172138 - 161048.17

= 11089.83
con ncr - 1 = 23 grados de libertad.
La variacin debida al error aleatorio (normalmente llamada variacin residual) se estima a partir de la variacin dentro de casillas, es decir, la variacin entre repeticiones.
La suma de cuadrados residual = I x7"k T1J n, donde 0; es el total para la casilla
de la ,Lsima fila y jsima columna, es decir, la suma de las medidas replicadas en la
,Lsima fila y la jsima columna.

Suma de cuadrados residual

= x1/k -

fl;/n

= 172138 - 344244/2'
= 16

con (n - 1)re = 12 grados de libertad.


La suma de cuadrados de la interaccin y sus grados de libertad se pueden obtener
ahora por diferencia. Para contrastar si cada una de las fuentes de variacin es significativa
se comparan dichas fuentes con el cuadrado medio residual.
1.
2.

Interaccin. sta es obviamente no significativa ya que el cuadrado medio de la interaccin es menor que el cuadrado medio residual.
Entre columnas (es decir, entre longitudes de onda). sta es claramente significativa
ya que se tiene:
F = 3686.502/1.3333

= 2765

El valor crtico de F3.12 es 3.49 (P = 0.05). En este caso se esperara un resultado significativo ya que la absorbancia depende de la longitud de onda.

3.

Entre filas (es decir, entre concentraciones). Se tiene:

F= 6.17/1.3333

= 4.63

El valor crtico de F.12 es 3.885 (P = 0.05), indicando que la variacin entre filas es demasiado grande para que se cuente como variacin aleatoria. Por tanto, la solucin no es
adecuada como patrn de absorbancia. La Figura 7.1 muestra el grfico de la absortividad
molar frente a la longitud de onda, en la que los valores con la misma concentracin estn
unidos por lneas rectas. Esto aclara los resultados del anlisis anterior de la siguiente
forma:
1.
2.

3.

Las lneas son paralelas, indicando que no hay interaccin alguna.


Las lineas no son del todo horizontales, lo que indica que la absortividad molar vara
con la concentracin.
Las lneas que se encuentran a diferentes alturas en el grfico, indican que la absortividad molar depende de la longitud de onda.

-.e-----_e
.e-----

100

50

270nm

240nm

-----_e-----_I

350nm

.e-----_e-----_e

300nm

0.02
Concentracin, gl-1

Figura 7.1.

Relaciones en el ejemplo del ANOVA de dos factores (Ejemplo 7.5.1).

Las frmulas utilizadas en los clculos anteriores se resumen en la Tabla 7.6.


En este experimento los dos factores, es decir, la longitud de onda y la
concentracin de la solucin, son .factores controlados. En qumica analtica
una aplicacin importante de las tcnicas ANOVA es investigar dos o ms
factores controlados y sus interacciones en experimentos de optimizacin.
Esto se analiza en la Seccin 7.7.
Como se coment en la Seccin 4.11, otra aplicacin importante de las
tcnicas ANOVA se encuentra en las investigaciones de precisin y exactitud en los ensayos de colaboracin entre laboratorios. En un ejercicio de colaboracin a gran escala se envan varios tipos diferentes de muestras a una
serie de laboratorios, realizando cada laboratorio una serie de anlisis replicados sobre cada muestra. Un anlisis matemtico de los resultados proporcionara las sumas de cuadrados siguientes: entre laboratorios, entre muestras,
interaccin muestra-laboratorio, y residuales. El objetivo de dicho experimento sera contrastar primero si hay interaccin entre laboratorio y muestra, es decir, si algunos laboratorios daban resultados inesperadamente altos
o bajos para algunas muestras. Esto se hace comparando la suma de cuadrados residual y de interaccin. Si no hay ninguna interaccin, entonces se
podra contrastar si los laboratorios obtuvieron resultados significativamente diferentes, es decir, si existen diferencias sistemticas entre los laboTabla 7.6.

Frmulas para ANOVA de dos factores con interaccin.

Fuente de variacin

Suma de cuadrados

Entre filas

I
I

t;/nc-

Entre columnas

"f/nr-

e
e

Grados de libertad
r- 1
c- 1

Interaccin

por diferencia

Residual

I
I

Total

~jk-

~jk-

J7Jn

por diferencia

rd..,n - 1)
rcn- 1

199

200

ratorios. Si existiesen, entonces se podra estimar la varianza entre laboratorios. Sin embargo, si hay alguna interaccin significativa, el contraste sobre
diferencias significativas entre laboratorios tiene poca relevancia.
Para que un ANOVA de dos factores sea vlido se deben satisfacer las
siguientes condiciones (vase tambin la Seccin 3.10):
1.

2.

El error aleatorio es el mismo para todas las combinaciones de los niveles de los factores.
Los errores aleatorios siguen distribuciones (aproximadamente) normales.

7.6.

El diseo factorial frente al de un factor cada vez

Un experimento como el del ejemplo anterior, donde la variable de respuesta


(es decir, la absortividad molar) se mide para todas las combinaciones posibles de los niveles elegidos de los factores recibe el nombre de diseo factorial completo. El lector ha podido observar que este diseo del experimento
es la anttesis de la aproximacin clsica donde la respuesta se investiga para
cada factor a travs de diferentes etapas, mientras que el resto de los factores
se mantienen a un nivel constante. Hay dos razones de peso para utilizar un
diseo factorial en lugar de uno clsico en experimentos que contrasten si la
respuesta depende del nivel del factor:
1.

2.

El experimento factorial detecta y estima cualquier interaccin que no


puede hacer el experimento de un factor cada vez.
Si los efectos de los factores son aditivos, entonces el diseo factorial
necesita menos medidas que la aproximacin clsica para proporcionar
la misma precisin. Esto se puede ver volviendo de nuevo al experimento de absortividad molar. All, las 24 medidas se utilizaban para estimar
el efecto de variar la longitud de onda y las mismas 24 se utilizaron para
estimar el efecto de variar la concentracin. En un experimento de un
factor cada vez, en primer lugar se habra fijado la concentracin y, para
obtener la misma precisin para el efecto de variar la longitud de onda,
se hubieran necesitado seis medidas a cada longitud de onda, es decir, 24
en total. Despus se habra fijado la longitud de onda, realizndose otras
24 medidas bajo concentraciones diferentes, resultando en total 48. En
general, para 7? factores, una aproximacin clsica supone k veces tantas
medidas como en un diseo factorial con la misma precisin.

7.7.

Diseo factorial y optimizacin

En muchas tcnicas analticas la respuesta del sistema de medida depende de


una variedad de factores experimentales bajo el control del operador. Por
ejemplo, un ensayo enzimtico incluye la medida directa o indirecta de las
velocidades de reaccin. En un experimento dado la velocidad de reaccin
depender de factores tales como la temperatura, pH, fuerza inica, composicin qumica de la solucin reguladora del pH, concentracin de enzima, y
as sucesivamente. Para una aplicacin concreta ser importante establecer
los niveles de estos factores para asegurar que (por ejemplo) la velocidad de

reaccin sea tan alta como sea posible. El proceso de bsqueda de estos niveles ptimos del factor se conoce como optimizacin. En las siguientes secciones se discuten con detalle varios mtodos de optimizacin. No obstante,
antes de comenzar con un proceso de optimizacin se determinan los factores y las interacciones que afectan de manera importante a la respuesta: es
tambin valioso conocer qu factores tienen escaso o ningn efecto, de manera que no se desperdicien ni tiempo ni otros recursos en experimentos innecesanos.
Tales estudios utilizan un experimento factorial en el que cada factor tenga dos niveles, conocidos habitualmente por alto y bajo. En el caso de
una variable cuantitativa los trminos alto y bajo tienen el significado
usual. La eleccin exacta de los niveles se determina principalmente por la
experiencia y conocimiento del experimentador y las restricciones fsicas del
sistema, por ejemplo, en disolucin acuosa slo son practicables temperaturas en el intervalo 0-100 oC. Algunos problemas relacionados con la eleccin
de los niveles se discuten ms adelante. Para una variable cualitativa, alto
y bajo se refieren a condiciones diferentes, por ejemplo, la presencia o
ausencia de un catalizador, agitacin mecnica o magntica, muestras de forma granular o en polvo, etc. Como ya se han considerado experimentos con
dos factores con cierto detalle, nos centraremos en uno con tres factores: A,
B Y C. Esto significa que hay 2 x 2 x 2 = 8 combinaciones posibles de niveles de factores, como se muestra en la tabla siguiente. Un signo ms indica
que el factor est en el nivel alto y un signo menos que est en el nivel bajo.
La primera columna proporciona una notacin utilizada a menudo para describir las combinaciones, donde la presencia de la correspondiente letra en
minscula indica que el factor est en el nivel alto y su ausencia que el factor
est en el nivel bajo. El nmero 1 se u tiliza para indicar que todos los factores estn en el nivel bajo.
Combinacin

a
b
e
be
ac
ab
abe

11
Y2

+
+
+
+
+

Respuesta

+
+

+
+
+
+

Y3
Y4
Y5
Y6
Y7
Y8

El mtodo por el cual se estiman los efectos de los factores y sus interacciones se ilustra mediante el ejemplo siguiente.

EJEMPLO 7.7.1
En un experimento de cromatografa lquida de alta resolucin, se investig la dependencia
del parmetro de retencin, k, sobre tres factores. Los factores fueron pH (factor P), la
concentracin de un contran (factor T) y la concentracin de disolvente orgnico en la fase
mvil (factor e). Se utilizaron dos niveles para cada factor y se realizaron dos medidas, una

201

202

rplica de la otra, para cada combinacin. Las medidas se aleatorizaron. La tabla que se
expone a continuacin da el valor medio para cada par de rplcas.

Combinacin de niveles del factor

/(

1
P

pt
pc

4.7
9.9
7.0
2.7
15.0
5.3

12

pIe

6.0

Efecto de los factores individuales


El efecto de cambiar el nivel de P se puede hallar de la diferencia media en respuesta
cuando P cambia del nivel alto al bajo, manteniendo fijos los niveles de C y T. Hay cuatro
pares de respuestas que proporcionan una estimacin del efecto del nivel de P, como se
muestra en la tabla siguiente:

Nivel de C

Nivel de T

Nivel de P

Diferencia

+
+

+
+

9.9
5.3
15.0
6.0

4.7
2.7
7.0
3.2
Total

5.2
2.6
8.0
2.8
18.6

Efecto promedio de alterar el nivel de P = 18.6/4 = 4.65


De 10rma similar se puede obtener que los efectos promedio de alterar los niveles de T y
C son:
Efecto promedio de alterar el nivel de C = - 4.85
Efecto promedio de alterar el nivel de T = 2.15

Interaccin entre dos factores


Considrese ahora los dos factores P y T. Si no hubiera interaccin entre ellos, entonces
el cambio en respuesta entre los dos niveles de P debera ser independiente del nivel de
T. Las dos primeras cifras de la ltima columna de la tabla anterior da el cambio en la
respuesta cuando P cambia del nivel alto al bajo con T en el nivel bajo. Su promedio es
(5.2 + 2.6)/2 = 3.9. Las dos ltimas cifras en la misma columna proporcionan el efecto de
cambiar P cuando T est en el nivel alto. Su media es (8.0 + 2.8)/2 = 5.4. Si no hubiera
interaccin ni error aleatorio (vase Seccin 7.5) estas estimaciones del efecto de cambio
del nivel P deberan ser iguales. El convenio que se sigue es tomar la mitad de su diferencia
con una medida de la interaccin:
Efecto de interaccin PT = (5.4 - 3.9)/2

0.75

Es importante darse cuenta que esta cantidad estima el grado en que los efectos de P y T
no son aditivos. Igualmente, se podra haber calculado considerando que el cambio en respuesta para los dos niveles de T es independiente del nivel de P.
Las otras interacciones se calculan de manera simlar.
Efecto de interaccin CP = -1.95
Efecto de interaccin CT = - 1.55

203

Interaccin entre tres factores

La interaccin PT calculada anteriormente se puede dividir en dos partes con relacin al nivel
de C. Con C en el nivel bajo, laeslimacin de la interaccin sera (80 - 5.2)/2 = 1.4, Ycon
C en el nivel alto sera (2.8 - 2.6)/2 = 0.1. Si no hubiera interaccin entre los tres factores
ni error aleatorio, estas estimaciones de la interaccin PT deberan ser iguales. La interaccin
de los tres factores se estima por la mitad de su diferencia [= (0.1 - 1.4)/2 = - 0.65]. La
interaccin de los tres factores mide hasta que punto el efecto de la interaccin PT y el
efecto de C no son aditivos: igualmente se podra calcular considerando la diferencia entre
las estimaciones de la interaccin TC para los niveles bajo y alto de P.
Estos resultados se resumen en la siguiente tabla.
Efecto

Efecto nico (efecto principal)

4.65
2.15
-4.85

Interaccin de dos factores


TP
CT
CP

0.75
-1.55
-1.95

Interaccin de tres factores

--0.65

PTC

Los clculos se han presentado con cierto detalle de cara a mostrar con ms claridad los
principios. Un algoritmo debido a Yates (vase la Bibliografa) simplifica el clculo.
Para contrastar qu efectos, si existen, son significativos, se puede utilizar el ANOVA
(suponiendo que existe homogeneidad de varianzas). Se puede demostrar que en un expe
rimento de dos niveles, como ste, las sumas de cuadrados necesarios se pueden calcular
de los efectos estimados utilizando
Suma de cuadrados

=Nx

(efecto estimado)2/4

donde N es el nmero total de medidas incluyendo las replicaciones. En este caso N es 16


ya que se hicieron dos medidas, una rplica de la otra, por cada combinacin de los niveles
del factor. Las sumas de cuadrados calculadas se proporcionan a continuacin.
Factor (es)

Suma de cuadrados

86.49
18.49
94.09
2.25
9.61
15.21
1.69

T
C
PT
TC
PC
PCT

Se puede demostrar que' Cada suma de cuadrados tiene un grado de libertad y puesto que
el cuadrado medio viene dado por
Cuadrado medio = suma de cuadrados/nmero de grados de libertad
cada cuadrado medio es simplemente la correspondiente suma de cuadrados. Para contrastar si un efecto es significativo, se compara el cuadrado medio con el cuadrado medio del
error (residual). ste se calcula de las medidas individuales utilizando el mtodo descrito en
el ejemplo de absortividad molar de la Seccin 7.5. En este experimento el cuadrado medio

204

residual obtenido fue 0.012 con ocho grados de libertad. El contraste de significacin, empezando con la interaccin de orden ms grande, proporciona para la interaccin PTC:

F= 1.69/0.012

= 141

que es obviamente significativa. Si existe interaccin entre los tres factores no hay ninguna
razn para contrastar si los factores tomados por pares o individualmente son significativos,
ya que se tienen que considerar todos los factores en cualquier proceso de optimizacin.
Slo se debera contrastar la significacin de un nico factor si no hubiera interaccin con
otros factores.

Un problema que aparece en un experimento factorial completo como ste


es que el nmero de experimentos requerido crece rpidamente con el nmero de factores: para h factores en dos niveles con dos rplicas para cada
combinacin de valores, son necesarios i ' l experimentos, por ejemplo, para cinco factores, 64 experimentos. Cuando hay ms de tres factores es posible una simplificacin, suponiendo que sean despreciables las interacciones
de orden tres y superiores. Las sumas de cuadrados correspondientes a estas
interacciones se pueden entonces combinar para proporcionar una estimacin de la suma de cuadrados residual, no siendo necesarias ms rplicas. La
lgica de esta aproximacin es que los efectos de orden ms grande son normalmente mucho ms pequeos que los efectos principales y que los efectos
de interaccin entre los dos factores. Si las interacciones de orden superior
se pueden suponer insignificantes, una fraccin adecuada de todas las posibles combinaciones de los niveles del factor es suficiente para proporcionar
una estimacin de los efectos principales y de interaccin de dos factores.
Como se mencion en la Seccin 4.11, dicho diseo experimental se llama
diseo factorial fraccional o incompleto.
Otro problema al utilizar un diseo factorial para determinar qu factores
tienen un efecto significativo sobre la respuesta es que, para factores que son
variables continuas, el efecto depende de los niveles alto y bajo utilizados. Si
los niveles alto y bajo estn excesivamente cerca uno de otro, se puede obtener que el efecto del factor correspondiente no sea significativo a pesar del
hecho de que sobre el intervalo posible completo de los niveles del factor, el
efecto de ese factor no sea despreciable. Por otra parte, si los niveles se alejan
bastante pueden caer a ambos lados de un mximo, y an as dar lugar a una
diferencia en respuesta que no sea significativa.

7.8.

Optimizacin: principios bsicos


y mtodos univariantes

Cuando se han identificado los diferentes factores e interacciones que afectan a los resultados de un experimento, se necesitan mtodos separados para
determinar la combinacin de los niveles del factor que proporcionarn la
respuesta ptima. En primer lugar ha de definirse cuidadosamente lo que se
entiende por respuesta ptima en un procedimiento analtico dado. En algunos casos el objetivo ser asegurar que el instrumento de medida proporciona una seal de respuesta mxima, por ejemplo, la mayor absorbancia,
corriente, intensidad de emisin, etc., posible. Sin embargo, en otros muchos

casos el resultado ptimo de un experimento puede que sea la mxima relacin seal-ruido o seal fondo, la mejor resolucin (en mtodos de separacin) , o incluso una respuesta mnima (por ejemplo, cuando una seal de
interferencia se encuentra bajo estudio). En trminos matemticos, encontrar los mximos y los mnimos son procesos virtualmente idnticos, de manera que el ltimo ejemplo no causa ningn problema adicional. Hay que
poner el nfasis en algo obvio como es que el objetivo exacto de un experimento de optimizacin debe ser definido cuidadosamente de antemano, ya
que en la prctica muchos procesos de optimizacin han fallado simplemente
porque el objetivo no se defini con suficiente claridad.
Un buen mtodo de optimizacin tiene dos cualidades. Produce un conjunto de condiciones experimentales que proporcionan la respuesta mxima,
o al menos una respuesta que sea prxima al ptimo: y lo hace as con el
nmero ms pequeo posible de etapas experimentales de ensayo. En la
prctica la velocidad y la conveniencia del procedimiento de optimizacin
resulta extremadamente importante, pudiendo ser suficiente en algunos casos utilizar un mtodo que alcance de manera razonable un valor prximo
al ptimo verdadero en un nmero pequeo de pasos.
En este contexto se debe observar que incluso la optimizacin de un nico factor presenta algunos problemas interesantes. Supngase que se desea
encontrar el pH ptimo de una reaccin catalizada por enzimas dentro de un
rango de pH 2-12, siendo el mejor pH aquel cuya velocidad de reaccin sea
mxima. Cada medida de la velocidad de reaccin constituir un experimento separado, asumiendo en cada caso un tiempo y un esfuerzo significativos
y una solucin amortiguadora diferente, de manera que resulta especialmente importante conseguir tanta informacin como sea posible a partir del
mnimo nmero de experimentos. Se sugieren dos aproximaciones. Una es
realizar un nmero fijo de medidas de la velocidad de reaccin, por ejemplo,
dividiendo el intervalo de pH de inters en una serie de regiones iguales. El
segundo mtodo y ms lgico es realizar las medidas secuencialmente, de manera que el pH para cada experimento depende de los resultados de los experimentos anteriores.
La Figura 7.2 muestra el resultado de realizar cuatro medidas de la velocidad a valores del pH de 4, 6, 8 Y 10. Al considerar estos cuatro resultados
se har una suposicin que se mantendr en buena parte de la discusin de
la optimizacin, es decir, que hay slo un mximo dentro del rango de los

pH

Figura 7.2.

Experimento de optimizacin con niveles del factor igualmente espaciados.

205

206

niveles del factor bajo estudio. (Inevitablemente, esto no es siempre cierto y


se volver a este punto ms tarde.) Los cuatro puntos sobre el grfico representan los resultados de los experimentos: la velocidad de reaccin ms grande se obtiene a pH 10, Y la siguiente ms alta a pH 8. Pero incluso con la
hiptesis de un nico mximo es posible dibujar dos tipos de curvas a travs
de los puntos, es decir, este mximo puede ocurrir entre pH 8 Y 10, o entre
pH 10 Y 12. Por tanto, el resultado de los cuatro experimentos es que, empezando con el rango de pH entre 2 y 12, se concluye que el pH ptimo se
encuentra realmente entre 8 y 12, es decir, se ha acortado el intervalo para
el ptimo mediante un factor de 4/10. ste es un ejemplo del resultado general, si se realizan n experimentos utilizando intervalos iguales del nivel del
factor, el intervalo para el ptimo se acorta en un factor de 2/(n + 1) 2/5
en este caso. ste no es un resultado muy sorprendente! La debilidad del
mtodo se muestra ms adelante por el hecho de que, si se deseara definir el
pH ptimo dentro de un intervalo de 0.2 unidades, es decir, una reduccin
de 50 veces el intervalo original de 10 unidades, seran necesarios 99 experimentos, algo que obviamente es imposible.
El principio de la superioridad de la aproximacin por pasos se muestra
en la Figura 7.3, indicando una relacin posible entre la velocidad de reaccin y el pH. (Desde luego esta curva no sera conocida de antemano por el
experimentador.) Brevemente, el procedimiento es como se indica a continuacin. Los dos primeros experimentos se realizan a pH A Y B, equidistantes de los extremos del intervalo de pH 2-12. (La eleccin de los valores de
pH para estos primeros experimentos se analiza ms adelante.) El experimento B proporcionar la velocidad de reaccin ms grande, ya que hay slo
un mximo en la curva, pudindose rechazar la parte de la curva entre pH
2 Y A. El resto del intervalo de pH, entre A y 12, incluye ciertamente el
mximo y ya tiene una lectura, B, dentro de l. Se realiza entonces una nueva medida a un pH tal que la diferencia de pH entre C y A sea la misma que
entre B y 12. El pH en C proporciona una velocidad de reaccin ms grande
que en B, de manera que ahora se puede rechazar el intervalo entre B y 12,
Y tomar una nueva medida, D, de manera que las distancias A-D y C-B sean
iguales. El resto de medidas utilizan el mismo principio, as que slo queda
por establecer cuntos pasos son necesarios, y dnde deberan estar los puntos de iniciacin A y B.

10

6
pH

Figura 7.3.

Aproximacin por etapas a la bsqueda univariante.

12

En una aproximacin las distancias entre los pares de medidas y los extremos de los rangos correspondientes se relacionan con la serie de Fibonacci.
Esta serie de nmeros, conocida desde el siglo XIII, empieza con 1 y 1 (estos
trminos se llaman Fa Y F 1), de manera que cada siguiente trmino es la suma de los dos previos. As, F 2 , F 3 , etc., son 2, 3, S, 8, 13, 21, 34, SS, 89, ...
Para utilizar esta serie con el objeto de optimizar un nico factor en un rango definido, se empieza por decidir bien el grado de optimizacin exigido (lo
que automticamente determina el nmero de experimentos necesario), o
bien el nmero de experimentos que se pueden realizar (lo que directamente
proporciona el grado de optimizacin obtenido). Supngase que, como antes,
se exige que el pH ptimo se conozca dentro de 0.2 unidades, con una reduccin de SO veces el intervalo de pH original de 10 unidades. Entonces se
debe tomar el primer nmero de Fibonacci por encima de SO: ste es SS, F g
El subndice nos indica que sern necesarios nueve experimentos para lograr
el resultado deseado. El espacio de los primeros dos puntos, A y B, dentro
del intervalo, tambin viene dado por la serie. Se utiliza Fg y el elemento de
la serie dos por debajo de l, F7 , para formar la fraccin F7 /F g , es decir, 21/55.
El punto A resulta entonces a pH (2 + [10 x 21/55]), y el punto B a pH
(12 - [10 x 21/55]), es decir, 5.8 y 8.2, respectivamente. (El nmero 10 aparece en estas expresiones porque el rango de pH de inters tiene 10 unidades
de ancho.) Una vez que se establecen estos primeros puntos, las posiciones
de C, D, etc., se siguen automticamente por simetra. Es impresionante que
el mtodo de bsqueda de Fibonacci logre en slo nueve experimentos un
grado de optimizacin que exige 99 experimentos utilizando el mtodo de los
intervalos iguales. Se puede demostrar que el mtodo es de hecho el procedimiento de bsqueda univariante ms eficiente para un rango dado cuando
el grado de optimizacin se conoce o decide de antemano.
En otros mtodos de optimizacin, no es necesario decidir de antemano
el nmero de experimentos o el grado de optimizacin necesario. El mtodo
de la Razn aurea o Cociente de Oro es un ejemplo de esta aproximacin.
El Cociente de Oro es (1 + )5)/2 = 1.618. Este nmero tiene la propiedad
de que 1.618 = 1 + (1/1.618). Los dos primeros puntos en la bsqueda se
posicionan dividiendo el rango total (por ejemplo 10 unidades de pH) por
1.618, y en nuestro ejemplo el resultado es que los puntos se colocan a 10/
1.618 = 6.18 unidades de pH de pH 2 Y pH 12, es decir, a pH 5.82 Y 8.18.
Si el ltimo punto proporciona la respuesta podemos estar seguros que
el pH ptimo cae entre 5.82 y 12, un intervalo que ya contiene un resultado a pH 8.18. Como en el mtodo de Fibonacci el tercer experimento
se realiza entonces a un pH colocado simtricamente, es decir, a un pH
(12 ~ [8.18 - 5.82]) = 9.64. (Ntese que, una vez que se establece este tercer pH, (12 - 8.18)/(12 - 9.64) = 1.618, se obtiene de nuevo el cociente de
oro.) Si este tercer experimento proporciona una respuesta ms grande que el
experimento al pH de 8.18, entonces resulta aparente que el ptimo no se encuentra en el intervalo de pH 5.82-8.18, de manera que el cuarto experimento
se puede realizar a pH 10.54 (porque [12 - 10.54] = [9.64 - 8.18]), Y as sucesivamente. De nuevo se ve que este mtodo es ms eficiente que la aproximacin de los intervalos iguales, despus de este cuarto experimento el pH
ptimo se situar en un intervalo de 2.36 unidades, es decir, bien entre pH

207

208

8.18 Y 10.54, o bien entre pH 9.64 Y 12. Esto es significativamente mejor, es


decir, ms corto, que el intervalo de cuatro unidades de pH proporcionado por
el mtodo de los intervalos iguales con cuatro experimentos. La iteracin se
puede continuar hasta que el analista decida que se han realizado suficientes
experimentos o que la optimizacin lograda es en la prctica suficientemente
buena. Los mtodos del Cociente del Oro y de Fibonacci son similares y de
hecho matemticamente relacionados. Ms detalles de los mtodos univariantes se proporcionan en los textos que aparecen en la Bibliografa.
Se debe aadir que el xito de ste y de otros procedimientos de optimizacin depende de la hiptesis de que los errores aleatorios en las medidas
(de las velocidades de reaccin en nuestro ejemplo) son significativamente
ms pequeos que la velocidad de cambio de la respuesta con el nivel del
factor (pH). Esta hiptesis es ms verosmil que no sea vlida cerca del valor
ptimo de la respuesta, donde la pendiente de la curva de respuesta es prxima a cero. Esto confirma que en muchos casos prcticos un mtodo de optimizacin que alcance de manera razonable un valor prximo al ptimo verdadero en un nmero pequeo de pasos resultar ms valioso: intentar
refinar el ptimo mediante experimentos extra podra fallar si los errores experimentales proporcionan resultados errneos.

7.9.

Optimizacin utilizando el mtodo de bsqueda


de la variable alterna

Cuando la respuesta de un sistema analtico depende de dos factores que son


variables continuas, la relacin entre la respuesta y los niveles de los dos
factores se puede representar por una superficie tridimensional, como se
muestra en la Figura 7.4. Esta superficie se llama superficie de respuesta,
siendo el objetivo ptimo la cima de la montaa. Una representacin ms
conveniente es el diagrama de curvas de nivel (Figura 7.5). Aqu la respuesta sobre cada curva de nivel es constante, situndose el objetivo ptimo
cerca del centro de las curvas de nivel. La forma de las curvas de nivel es,
desde luego, desconocida por el investigador, quien desea determinar los niveles ptimos, X o e !Jo para los factores X e Y, respectivamente. Un mtodo

.l9
Vi
Q)

::::l
Q.
Vi
Q)

a:

Figura 7.4.

Diagrama de las curvas de nivel para una superficie de respuesta con dos factores.

209

Nivel del factor X

Figura 7.5.

Diagrama de las curvas de nivel para una superficie de respuesta con dos factores.

de bsqueda, utilizando el enfoque de un factor cada.vez, establecera el nivel inicial de X a un valor fijo de Xl' por ejemplo, y se variara el nivel de Y,
resultando una respuesta mxima en el punto A donde el nivel de Y fuese
111. A continuacin, manteniendo el nivel de Yen Yl' y variando el nivel de
X resultara un mximo en B. Obviamente ste no es el verdadero mximo,
ya que la posicin obtenida depende del nivel inicial elegido para X l' Se puede obtener una respuesta mejor repitiendo el proceso, variando los niveles
de X e Y alternativamente. Este mtodo se conoce como el mtodo de bsqueda de la variable alterna (BVA) o mtodo univariante iterativo. Este mtodo es extremadamente eficiente cuando no existe interaccin entre
dos factores. En tal caso la superficie de respuesta tiene la forma de la Figura
7.6(a) o (b) y variando X y luego Y slo una vez conducir a la mxima
respuesta. Sin embargo, si existe interaccin entre las dos variables entonces
la superficie de respuesta tiene la forma de la Figura 7.6(c) y X e Y deben
variarse en vez de una ms veces. En algunos casos, no conducira al mximo verdadero: esto se ilustra en la Figura 7.7 donde, aunque e no es el mximo verdadero, el valor de respuesta disminuye a ambos lados del mximo
en las dos direcciones X e Y. Llegando a este punto, con el mtodo de un
factor cada vez, se concluira equivocadamente, por tanto, que representaba
la respuesta mxima.
El mtodo BV A se ha utilizado con xito en algunas reas de la qumica
analtica. No obstante, se puede aplicar slo si la respuesta se obtiene continuamente cuando el nivel del factor se altera con facilidad, por ejemplo, en
espectrometra cuando se cambian rpidamente la longitud de onda del
monocromador o la anchura de la rendija. Si tal seguimiento no es posible
entonces se tiene que elegir un tamao de la variacin para el cambio en
cada uno de los factores. Un mtodo ms sofisticado permitira cambios en
dichos tamaos dependiendo del cambio observado en la respuesta, pero en
la prctica se usaran otros mtodos de optimizacin que incluyen pocos experimentos separados.

~.

210
>-

Ul

r-l-

O!

o..

(ji'
r-l-

(=j'

es

t5
.l!!
Qi

"O

Qi

>

O!

'<

..o

Nivel del factor X

3'
o'

>-

r-l-

t5
.l!!

3ro
~

0;'
"O
O!
~
O!

(b)

es

Qi
"O

Qi

>

..o

3'
(=j'

Nivel del factor X


(e)

O!
O!

>-

~
r-l-

.l!!

::l

(=j'
O!

Qi

"O

Qi

>

Nivel del factor X

Figura 7.6. . Diagrama de las curvas de nivel simplificadas. (a) y (b) no muestran ninguna
interaccin x- ~ (e) muestra interaccin X- y significativa.

Nivel del factor X

Figura 7.7. Diagrama de curvas de nivel: un caso en el que el mtodo de un factor cada vez
no sirve para localizar el mximo.

No cabe duda que existen problemas en la teora y en la prctica al aplicar


la aproximacin de un factor cada vez a la optimizacin, de manera que se
han desarrollado otros mtodos en un intento de superar estos problemas y
minimizar el nmero de experimentos requeridos. Todos estos mtodos pueden aplicarse a cualquier nmero de factores, si bien la superficie de respuesta no se puede visualizar fcilmente para tres o ms factores: la discusin
posterior de los mtodos de optimizacin se centrar en gran parte sobre experimentos con dos factores.

7.10.

Mtodo de la mxima pendiente

El proceso de optimizacin se puede visualizar como una persona en una


montaa (Figura 7.4) con niebla espesa y que pretende llegar a la cima! En
estas circunstancias una aproximacin obvia es caminar en la direccin en
que el gradiente es de mxima pendiente. sta es la base del mtodo de la
mxima pendiente (o del gradiente). La Figura 7.8 muestra dos mapas
posibles de curvas de nivel. La direccin de mxima pendiente en cualquier
punto se encuentra entre los ngulos que haya la derecha de las curvas de
nivel de dicho punto, como se indica por las flechas. Cuando stas son circulares, dichas flechas apuntarn a la cima, pero cuando sean elipses ya no
se cumplir lo anterior. La forma de las curvas de nivel depende de las escalas elegidas para los ejes: se obtienen los mejores resultados con este mtodo
si se toma una escala en los ejes de manera que un cambio de una unidad en
cualquier direccin proporciona un cambio aproximadamente igual a la respuesta. El primer paso consiste en realizar un experimento factorial con cada
factor a dos niveles. Los niveles se eligen de manera que el diseo forme un
cuadrado como el que se muestra en la Figura 7.9. Supngase, por ejemplo,
que el experimento es una reaccin catalizada por enzimas en la que la velocidad de reaccin, que en este caso es la respuesta, se quiere maximizar
respecto al pH (X) Y la temperatura (Y). La tabla siguiente proporciona los
resultados (velocidad de reaccin, medida en unidades arbitrarias) del experimento factorial inicial.
pH (X)
6.8
10

Temperatura, oC (Y)
(a)

20
25

30

35

34

39

(b)

Figura 7.8. Diagrama de curvas de nivel: la flecha en cada diagrama indica el camino
de la mxima pendiente. En (a) se dirige aproximadamente al mximo, pero en (b) no.

211

212

.K

2
.'

[?f
, /

... e

tan

0=

4/5

Nivel del factor X

Figura 7.9. Un diseo factorial 2 x 2 para determinar la direccin de la mxima pendiente,


que viene indicada por la lnea de trazo discontinuo.

Los efectos de los dos factores se pueden separar segn se describi en la


Seccin 7.7. Escribiendo de nuevo la tabla anterior, con la notacin de esta
seccin, resulta:
Combinacin de niveles

x
y
xy

VelocIdad de reaccin
30
35
34
39

Efecto medio del cambio en el nivel de X = [(35 - 30) + (39 - 34)]/2 = 5


Efecto medio del cambio en el nivel de Y = [(34 - 30) + (39 - 35)]/2 = 4

Los efectos de X e Y indican que en la Figura 7.9 se buscara la mxima


respuesta a la derecha y por encima de la regin original. Ya que la variacin
en la direccin de X es mayor que en la direccin de Y, el incremento a dar
en la direccin de X tendra que ser mayor tambin. Concretando ms, los
incrementos a dar en las direcciones de X e Y, respectivamente, tendran que
estar en razn de 5 : 4, es decir, en la direccin indicada por la lnea de trazo
discontinuo de la Figura 7.9.
El paso siguiente en la optimizacin es realizar otros experimentos en la
direccin indicada por la lnea discontinua de la Figura 7.10, por ejemplo, en
los puntos cuya numeracin es 5, 6 Y 7. Esto indicara que el punto 6 es una
posicin aproximada para el mximo en esta direccin. Entonces se lleva a
cabo otro experimento factorial en la regin del punto 6 para determinar la
nueva direccin de la mxima pendiente.
Este mtodo proporciona una forma satisfactoria de progresar en direccin al mximo, con tal que sobre la regin del diseo factorial, las curvas
de nivel sean aproximadamente rectas. Esto es equivalente a que la superficie de respuesta sea plana, la cual puede describirse matemticamente por
una combinacin de trminos lineales en x e y. Al estar ms cerca de la

50

\\\~
50

55

213

60

20

6.6

6.8

7.0

7.2

7.4

7.6

7.8

8.0

pH

Figura 7.10. Diagrama de curvas de nivel: la direccin inicial de la mxima pendiente se muestra
mediante la lnea de trazo discontinuo. En los puntos 5, 6 Y7 se realizan nuevos experimentos.

cima se necesitan tambin trminos en xy, x 2 e y2. El trmino xy representa


la interaccin entre X e Y y se puede estimar utilizando la rplica como se
describi en la Seccin 7.7. Los trminos cuadrticos, que representan la curvatura de la superficie, se pueden estimar comparando la respuesta en el centro del diseo factorial con el promedio de las respuestas en las esquinas.
Cuando los efectos de curvatura e interaccin se hacen ms apreciables en
comparacin con el error experimental (que se estima mediante replicacin)
se emplea un diseo factorial ms elaborado que permite determinar la forma de la superficie curva y, por tanto, que se determine la posicin aproximada del mximo.
Es evidente que el diseo factorial y el mtodo de la mxima pendiente
sern muy complicados cuando estn implicados varios factores. La siguiente
seccin describe otro mtodo de optimizacin que es conceptualmente mucho ms simple.

7.11.

Optimizacin por el mtodo simplex

La optimizacin simplex se aplica cuando todos los factores son variables


continuas. Un simple x es una figura geomtrica que tiene k + 1 vrtices
cuando se trata de optimizar una respuesta respecto a k factores. Por ejemplo, para dos factores, el simp1ex ser un tringulo. El mtodo de optimizacin se ilustra mediante la Figura 7.11. El simplex inicial viene definido por
los puntos con numeracin 1, 2 y 3. En los primeros experimentos se mide
la respuesta en cada una de las tres combinaciones de los niveles del factor
dadas por los vrtices de este tringulo. La peor respuesta se encontrara en

214
>-

t5

Qj
"O

Qj

>

Nivel del factor X

Figura 7.11.

Optimizacin por el mtodo simplex.

el punto 3 y sera lgico concluir que se obtendra una respuesta mejor en el


punto simtrico del 3 respecto a la lnea que une 1 y 2, es decir, en 4. Se
forma un nuevo simplex con los puntos 1, 2 Y 4 Y se mide la respuesta para
la combinacin de los niveles del factor dada por 4. (Se puede constatar inmediatamente una ventaja muy importante del mtodo simplex, es decir, que
en cada etapa de la optimizacin, slo se requiere un nico experimento adicional.) Comparando las respuestas para los puntos 1, 2 Y 4 se observa ahora
que 1 proporciona la peor respuesta. El procedimiento anterior basado en la
reflexin sobre una recta se repite de nuevo, con lo cual resulta el simplex
definido por los puntos 2, 4 Y S. La continuacin de este proceso se muestra
en la figura. Se puede ver que no es posible progresar ms all del paso dado,
ya que los puntos 6 y 8 dan peor respuesta que S y 7.
Para mejorar las prestaciones del mtodo simplex se han propuesto varias
modificaciones. Un problema obvio con el mtodo es que, si el simplex inicial es demasiado pequeo, puede que sean necesarios demasiados experimentos para aproximar el ptimo. Si el simplex inicial es demasiado grande,
la precisin con que se determina el ptimo ser pobre. Este problema se
puede superar avanzando hacia el ptimo utilizando un simplex que puede
variar en el tamao del paso segn como se compare la respuesta para el
nuevo vrtice en un simplex con los otros vrtices. Por tanto, si el vrtice 4
en el ejemplo anterior proporcion una respuesta significativamente mejor
que los vrtices 1-3, el nuevo simplex podra ser ampliado en la misma direccin moviendo el vrtice 4 dos veces ms all de la lnea que une los
vrtices 1 y 2. Por otra parte, si el vrtice original 4 en el ejemplo anterior
proporcion una respuesta ms pobre que el vrtice 1, entonces probablemente se ha ampliado demasiado el simplex, y el vrtice 4 puede moverse
hacia atrs de manera que se coloque tan slo a la mitad de la lnea que une
los vrtices 1 y 2. En otras circunstancias, una reflexin <<negativa podra
ser apropiada, es decir, el vrtice 4 podra caer dentro del tringulo formado
por los vrtices 1-3. Cuando se optimizan dos factores, el efecto de estos tamaos de variacin variables es que los tringulos que conforman cada sim-

plex no son necesariamente equilteros. La ventaja de los tamaos de paso


variables es que inicialmente el simplex es grande y proporciona un progreso
rpido hacia el ptimo. Cerca del ptimo se contraen de manera que permiten encontrar el ptimo de manera ms precisa. Cuando haya varios factores
bajo estudio, puede ser til alterar alguno de ellos por un tamao de paso
constante, pero aplicando a otros un tamao de paso variable.
La posicin del nuevo vrtice de un simplex se puede localizar en la prctica mediante clculos en lugar de dibujos esto resulta esencial cuando hay
ms de dos factores. Los clculos (utilizando tamaos de paso constantes) se
establecen con ms facilidad como se muestra en la Tabla 7.7, numerndose
las lneas de clculo como (i)-(v). En este ejemplo hay cinco factores y, por
tanto, el simplex tiene seis vrtices. La respuesta para el vrtice 4 es la ms
pequea y en consecuencia se tiene que sustituir este vrtice. Las coordenadas del centro de gravedad de los vrtices que se conservan se calculan sumando las coordenadas de los vrtices que se conservan y el resultado se
divide por el nmero de factores, k. El desplazamiento del nuevo punto desde el centro de gravedad viene dado por (iv) = (ii) - (iii), y las coordenadas
del nuevo vrtice, vrtice 7, por (v) = (ii) + (iv). Si el simplex se vara en
tamao entonces los valores en la fila (iv) se multiplican por un factor de
escala adecuado.
Una cuestin obvia al utilizar el mtodo simplex es la eleccin del simplex inicial. Si ste se considera como una figura regular de k dimensiones,
entonces las posiciones de los vrtices para generar tal figura dependern de
las escalas utilizadas para los ejes. Como en el mtodo de la mxima pendiente (o del gradiente), estas escalas se deberan elegir de manera que el cambio
de unidad en cada factor proporcione aproximadamente el mismo cambio en
la respuesta. Si hay insuficiente informacin para lograr esto, la diferencia
entre el menor y el mayor valor factible de cada factor se puede representar
por la misma distancia. El tamao del simplex inicial no es tan crtico si se
puede expandir o contraer segn se procede con el mtodo. Se han desarrollado algoritmos que se pueden utilizar para calcular las posiciones iniciales
Tabla 7.7.

Ejemplo de optimizacin por el mtodo simplex.

Factores
A
Vrtice
Vrtice
Vrtice
Vrtice
Vrtice
Vrtice

1
2
3
4 (rechazado)
5
6

(i) Suma (excluyendo el vrtice 4)


(ii) Suma/k (excluyendo el vrtice 4)
(iii) Vrtice rechazado (es decir, 4)
(iv) Desplazamiento = (ii) - (iii)
(v) Vrtice 7 = (ii) + (iv)

Respuesta

1.0
6.0
2.5
2.5
2.5
2.5

3.0
4.3
11.5
4.3
4.3
4.3

2.0
9.5
9.5
3.5
9.5
9.5

6.0
6.9
6.9
6.9
9.7
6.9

5.0
6.0
6.0
6.0
6.0
9.6

14.50
2.90
2.50
0.40
3.30

27.40
5.48
4.30
1.18
6.66

40.00
8.00
3.50
4.50
12.50

36.40
7.28
6.90
0.38
7.66

32.60
6.52
6.00
0.52
7.04

7
8
10
6
11
9

215

216

de los vrtices: normalmente se coloca un vrtice en los niveles de los factores actualmente aceptados. Este ltimo punto es un recordatorio para el analista que rara vez anda a tientas al comienzo de un proceso de optimizacin.
La experiencia previa le aportar una gua de los valores factibles para los
vrtices del simplex de partida.
Se puede ver que, en contraste con un diseo factorial, el nmero de
experimentos exigidos en el mtodo simplex no crece rpidamente con el nmero de factores. Por esta razn, todos los factores que razonablemente pudieran pensarse que tienen relacin con la respuesta deberan ser incluidos
en la optimizacin.
Una vez que se ha encontrado un ptimo, el efecto sobre la respuesta
cuando un factor se vara mientras los otros se mantienen a sus niveles ptimos se puede a su vez analizar para cada factor (por turnos). Este procedimiento se puede utilizar para verificar la optimizacin. Tambin indica a qu
nivel son importantes para cada factor las desviaciones respecto del nivel ptimo: cuanto ms acusado es el pico de respuesta en la regin del ptimo,
ms crtica es la variacin en el nivel del factor.
La optimizacin simplex se ha utilizado con xito en muchas reas de la
qumica analtica, por ejemplo, espectrometra de absorcin atmica, cromatografa de gases, mtodos de anlisis colorimtrico, espectrometra de plasma y
tambin con analizadores centrfugos en qumica clnica. Cuando un instrumento se conecta a una microcomputadora, se pueden utilizar los resultados de
la optimizacin simplex para procurar mejoras en las variables instrumentales.
Ocasionalmente aparecen superficies de respuesta con ms de un mximo, como la expuesta en la Figura 7.12. Los mtodos de optimizacin de la
variable alterna y simplex pueden entonces localizar un ptimo local tal como el A en lugar del ptimo verdadero B. Una forma de comprobar este punto es empezar el proceso de optimizacin en una segunda regin del espacio
del factor y verificar que se obtienen las mismas condiciones ptimas. Otra
vez el mtodo simplex es valioso aqu, ya que se minimiza el trabajo extra
requerido.

>(;

13
.l!1
Ql
""C

Qi

>

Nivel de factor X

Figura 7.12. Diagrama de curvas de nivel mostrando el ptimo localizado (A)


y el ptimo verdadero (B).

7.12.

El revenido simulado

Recientemente se ha prestado mucho inters en la aplicacin de mtodos de


clculo que mimetizan procesos naturales: se les conoce colectivamente como mtodos de computacin naturales. Las redes neuronales (vase el Captulo 8) se aplican actualmente en qumica analtica con mucha frecuencia,
y en el rea de optimizacin del revenido simulado (RS) se han encontrado
algunas aplicaciones recientes. El revenido o recocido es un proceso mediante el cual una sal fundida u otro material se enfra lentamente bajo condiciones controladas a un estado de baja energa. En principio, todo el sistema
estar en equilibrio durante todo el proceso de revenido, pero en la prctica
se producen procesos aleatorios que dan como resultado incrementos energticos de corta vida y/o locales. Cuando un proceso anlogo se aplica a un
problema de optimizacin, el algoritmo utilizado permite acceder a posiciones en el espacio del factor que proporcionan una respuesta ms pobre que
la posicin anterior. El resultado es tal que, a diferencia de los mtodos BVA
y simplex, conduce casi inevitablemente a la identificacin de un ptimo que
est ms prximo al punto de partida. Los mtodos RS pueden manejar cualquier ptimo local que exista, e ide.ntificar con xito el verdadero ptimo global.
En trminos generales, el mtodo opera como sigue. El primer paso consiste en identificar, ya sea al azar o por experiencia, valores de partida para
los niveles de los k factores. Estos valores proporcionan una respuesta inicial, R l' En el segundo paso, se aade un vector al azar a los valores de
partida, obtenido utilizando k nmeros aleatorios, generndose un nuevo
conjunto de condiciones experimentales: stas dan lugar a una nueva respuesta, R z. Como en otros mtodos de optimizacin, si R z origina una respuesta mejor que R, que es un buen resultado, se repite el paso de la adicin
al azar. Sin embargo, la caracterstica crucial del mtodo, es que aun siendo
R z una respuesta peor que R , se acepta con tal que no sea mucho peor. (Obviamente, para tomar esta decisin tienen que aplicarse reglas numricas.)
Eventualmente, se puede dar una situacin en la que una respuesta se rechace y, por ejemplo, se rechacen tambin cinco alternativas generadas al azar
al proporcionar respuestas ms pobres no aceptables. En tal situacin se supone que la respuesta anterior fue la ptima. Los mtodos RS han sido aplicados en las espectroscopas UV-visible e IR cercano, encontrndose que en
algunos casos son superiores a los mtodos simplex.

Bibliografa
Gardner, W. P. 1997. Statistical Anal;ysis Methods for Chemists; A Software
Based Approach. Royal Society of Chemistry, Cambridge. (Tratamiento
extenso de los diseos experimentales en muchas ramas de la qumica.).
Massart, D. L., Vandeginste, B. G. M., Buydens, 1. M. C., De long, S., Lewi,
P. J. and Smeyers-Verbeke, M. 1997. Handbook of Chemometrics and
Qualimetrics, Part A. Elsevier, Amsterdam. (Buena cobertura general de
la optimizacin y el diseo experimental.)

217

218

Margan, E. 1991. Chemometrics: Experimental Design. Wiley, Chichester.


(Introduccin clara a los diseos factoriales.)
Otto, M. 1999. Chemometrics; Statistics and Computer Applications in Analytical Chemistry. Wiley-VCH, Weinheim. (Un tratamiento excelente de
muchos tpicos cubiertos en los Captulos 7 y 8 de este libro).

Ejercicios
1.

Se prepararon cuatro disoluciones patrn, conteniendo cada una un


16 % de cloruro (mediante pesada). Para analizar cada disolucin patrn
se emplearon tres mtodos de valoracin, cada uno con una forma diferente de determinar el punto final. El orden de los experimentos fue
aleatorizado. Los resultados del cloruro encontrado (% w/w) se muestran a continuacin:
Solucin

Mtodo
8

1
2
3
4

16.03
16.05
16.02
16.12

16.13
16.13
15.94
15.97

16.09
16.15
16.12
16.10

Comprobar si existen diferencias significativas entre (a) la concentracin de cloruro en las diferentes solucione~ y (b) los resultados obtenidos por los diferentes mtodos.
2.

Se evalu un nuevo mtodo de extraccin asistido por microondas para


la recuperacin de 2-clorofenol de muestras de suelos aplicndolo a cinco suelos diferentes durante tres das. Los porcentajes de recuperacin
obtenidos fueron:
Suelo

Da
2

1
2
3
4
5

67
78
78
70
69

69
66
73
69
71

3
82
76
75
87
80

Determinar si existen diferencias significativas en el porcentaje de recuperacin (a) entre suelos, y/o entre das.
(Datos adaptados de Egizabal, A., Zuloaga. O., Etxebarria, N., Fernndez, 1. A. Madariaga,]. M. 1988. Analyst 123:1679)
3.

En estudios con un mtodo fluorimtrico para la determinacin del surfactante aninico dodecil sulfato sdico (SDS) se estudiaron los efectos
de interferencia de cuatro compuestos orgnicos para tres relaciones molares diferentes SDS: compuesto. Los porcentajes de recuperacin de
SDS encontrados fueron:

Compuesto Orgnico

1:1

cido 2,3-naftaleno dicarboxlico


cido tnico
Fenol
Difenilamina

91
103
95
119

Relaciones molares
1:2
1:3
84
104
90
162

83
104
94
222

Determinar si la recuperacin de SDS depende de la presencia de los


compuestos orgnicos y/o de la relacin molar en que estn presentes.
Cmo se modificara el experimento para probar si estn presentes efectos de interaccin?
(Recalde Ruiz, D. L., Carvalho Torres, A. L., Andrs Garca, E. Daz
Garca, M. E. 1988. Analyst 123:2257)
4.

Las disoluciones de mercurio guardadas en matraces de polipropileno


pierden contenido por combinacin con trazas de estao del polmero.
Se midi la absorbancia de una solucin acuosa patrn de mercurio
almacenada en dichos matraces, para dos niveles de los siguientes factores:
Factor

Bajo

Alto

A- Agitacin del matraz

Ausente
Una vez
1 hora

Presente
Dos veces
18 horas

e- Limpieza del matraz

T- Tiempo de permanencia

Se obtuvieron los resultados siguientes. Calcular los efectos principales


y de interaccin.
Combinacin de los niveles de factores

Absorbancia

1
a

0.099
0.084
0.097
0.076
0.082
0.049
0.080
0.051

c
t

ac
ta
tc
atc

(Adaptado de Kuldvere, A., 1982. AnallJst 107:179)

5.

En un experimento de colaboracin entre laboratorios para la determinacin de arsnico en carbn, se enviaron muestras de carbn de tres
regiones diferentes a tres laboratorios. Cada laboratorio realiz un anlisis por duplicado de cada muestra obtenindose los resultados que se
muestran a continuacin (medidos en ~gg-l).
Muestra

A
B

Laboratorio
2

5.1, 5.1
5.8, 5.4
6.5, 6.1

5.3, 5.4
5.4, 5.9
6.6,6.7

5.3, 5.1
5.2,5.5
6.5, 6.4

219

220

Comprobar que no existe interaccin significativa laboratorio-muestra y


contrastar las diferencias significativas entre laboratorios.
6.

Se sabe que el pH ptimo en una reaccin catalizada por enzimas cae


entre S y 9. Determinar los valores de pH a los que deben realizarse los
dos primeros experimentos en un proceso de optimizacin en las siguientes circunstancias:
(a)
(b)
(c)

7.

El nmero de experimentos y el grado de optimizacin que se necesita no son predeterminados.


El pH ptimo que se necesita sea conocido en un intervalo mximo
de 0.1 unidades de pH.
Slo se pueden realizar seis experimentos.
Cul es el grado de optimizacin obtenido en (c)?

Si se encuentra que la respuesta en el vrtice 7 en el ejemplo de la optimizacin simplex (pgs. 213-216) es 12, qu vrtice debera rechazarse
al formular el nuevo simplex y cules son las coordenadas del nuevo vrtice?

Anlisis
multivariante

8.1.

Introduccin

Los mtodos modernos de anlisis automtico facilitan la recogida de grandes cantidades de datos. Por ejemplo, en qumica clnica es una tarea cotidiana la determinacin de muchos analitos en cada muestra de sangre, orina,
etc. Una serie de mtodos espectroscpicos y cromatogrficos' pueden proporcionar datos analticos sobre muchos componentes de una nica muestra.
Situaciones como stas, en que se miden varias variables para cada muestra,
proporcionan datos multivariantes. En qumica analtica estos datos se emplean, entre otras cosas, para la discriminacin, por ejemplo, para determinar si un vertido de aceite procede de una fuente concreta mediante el anlisis del espectro de fluorescencia. Otro uso es la clasificacin, por ejemplo,
dividiendo en grupos las fases estacionarias con propiedades similares empleadas en cromatografa gas-lquido estudiando el comportamiento respecto
a la retencin de una variedad de solutos con propiedades qumicas diferentes. En cada caso, sera posible comparar muestras considerando cada
variable cada vez, pero las computadoras modernas permiten mtodos de
procesado ms sofisticados en los que todas las variables se consideran simultneamente.
Cada muestra, o para generalizar, cada objeto se caracteriza por un conjunto de medidas. Cuando slo se miden dos variables esta informacin se
puede representar grficamente, como se muestra en la Figura 8.1, donde las
coordenadas del punto dan los valores que toman las dos variables. El punto
tambin se puede definir mediante un vector, llamado vector de datos,
uniendo el origen con el punto. Los objetos que tengan propiedades similares
tendrn vectores de datos similares, es decir, caern unos cerca de otros en
el espacio definido por las variables. Cada uno de esos grupos se llama un
conglomerado (<<cluster).

222

Y -----------------

(Xi' y)

>al

:oca
.~

>

Xi

Variable X

Figura 8.1. Diagrama para ilustrar un vector de datos, f. Los valores que toman las variables
X e Y son Xi e Y. respectivamente.
-

En el caso de tres variables la representacin grfica resulta menos sencilla,


siendo inviable para cuatro o ms: es aqu donde el anlisis por computadora
resulta especialmente valioso a la hora de encontrar pautas y relaciones. El
lgebra matricial resulta necesaria para describir los mtodos del anlisis
multivariante de manera completa. Sin embargo, no se intentar nada de esto en este captulo. El objetivo es proporcionar una perspectiva del propsito
y la potencia de los mtodos multivariantes. Se emplearn conjuntos de datos sencillos para ilustrar los mtodos y se describirn algunas aplicaciones
prcticas.

8.2.

Anlisis inicial

La Tabla 8.1 muestra un ejemplo de algunos datos multivariantes. Proporciona las intensidades relativas de emisin de fluorescencia a.cuatro longitudes de onda diferentes (300, 350,400,450 nm) para 12 compuestos, A-L. La
intensidad de emisin a la longitud de onda de mxima fluorescencia sera
100, en cada uno de los casos. Como un primer paso, puede resultar til calcular la media y la desviacin tpica para cada variable. Estas medidas tambin aparecen en la tabla.
Adems, puesto que tenemos ms de una variable, es posible calcular un
coeficiente de correlacin momento-producto (Pearson) para cada par de variables. Estos coeficientes aparecen resumidos en la matriz de correlacin
de la Tabla 8.2, obtenida con Minitab.
Esto muestra que, por ejemplo, el coeficiente de correlacin para las intensidades a 300 y 350 nm es 0.914. Las relaciones entre pares de variables
se puede ilustrar mediante un grfico draftsman como se muestra en la
Figura 8.2. Se trata de una representacin que proporciona diagramas de dispersin para cada par de variables. Tanto la matriz de correlacin como los
diagramas de dispersin indican que existe correlacin entre algunos pares
de variables.

Tabla 8.1. La intensidad del espectro de fluorescencia a cuatro


longitudes de onda diferentes para una serie de compuestos.
Longitud de onda (nm)

et

Compuesto

300

350

400

450

Vi'
Vi'

16
15
14
15
14
14
17
16
15
17
18
18
15.75
1.485

62
60
59
61
60
59
63
62
60
63
62
64
61.25
1.658

67
69
68
71
70
69
68
69
72
69
68
67
68.92
1.505

27
31
31
31
30
30
29
28
30
27
28
29
29.25
1.485

e
D
E
F
G
H
I

J
K
L
Media
Desviacin estndar

Tabla 8.2.

La matriz de correlacin para los datos de la Tabla 8.1.

Correlaciones (Pearson)
300
0.914
~ 0.498
-0.670

350
400
450

350

350

450

-0.464
- 0.692

0.458

63C
J
60




68 -.

71 f-

400

30

LJCJ

450
28

15

300

Figura 8.2.

223

17

60

63

350

Grfico draftsman para los datos de la Tabla 8.1.

68

400

71

3
~
:;::.
OJ

5)'
~
......

ro

224

8.3.

Anlisis de componentes principales

Un problema que aparece en el anlisis multivariante es que el volumen bruto de los datos puede dificultar el reconocimiento de pautas (<<pattern recognition) y relaciones. Por ejemplo, un espectro se caracteriza habitualmente
por varios cientos de medidas de intensidad en lugar de slo por cuatro como
en la Tabla 8.1, conteniendo en este caso la matriz de correlacin cientos de
valores. Por tanto, el objetivo de muchos mtodos del anlisis multivariante
es la reduccin de los datos. Con mucha frecuencia se presenta cierta correlacin entre las variables, como ocurre con los datos de la Tabla 8.1, de manera que algo de la informacin resulta redundante. El anlisis de componentes principales (ACP) es una tcnica para reducir la cantidad de datos
cuando est presente la correlacin. Resulta obvio afirmar que no es una tcnica til cuando las variables no estn correlacionadas.
La idea que se encuentra detrs del ACP es encontrar componentes
principales Zl, Zz, ..., Zn que sean combinaciones lineales de las variables
originales Xl' X z , ..., X", que describen cada muestra, es decir,

Zl

all Xl

+ alZX Z + a 13X 3 +

+ alnXn

Zz

aZlX l + aZzXZ + a Z3X 3 +

+ aZnXn

etc.
Por ejemplo, para los datos de la Tabla 8.1 habra cuatro componentes principales Zl, Zz, Z3 y Z4, cada une: de las cuales sera una combinacin lineal
de Xl' X z , X 3 y X 4 , las intensidades de fluorescencia a las longitudes de onda
proporcionadas. Los coeficientes all, alZ, etc., se eligen de manera que las
nuevas variables, a diferencia de las variables originales, no se encuentren
correlacionadas unas con otras. La generacin de un nuevo conjunto de variables de esta forma puede parecer un ejercicio con poco sentido puesto que
se obtienen n nuevas variables en lugar de las n originales, y en consecuencia
no hay ninguna reduccin en el conjunto de datos. Sin embargo, las componentes principales tambin se eligen de manera que la primera componente
principal (CPl), Zl' recoge la mayor parte de la variacin que hay en el conjunto de datos, la segunda (CP2), Zz, recoge la siguiente mayor parte de la
variacin y as sucesivamente. Por consiguiente, cuando haya correlacin
significativa el nmero de CPs tiles ser mucho menor que el nmero de
variables originales.
La Figura 8.3 aclara el mtodo cuando slo hay dos variables y, por tanto,
slo dos componentes principales. En la Figura 8.3a las componentes principales se muestran mediante lneas de trazos suspensivos. Las componentes
principales forman ngulos rectos unas con otras, propiedad conocida como
ortogonalidad. La Figura 8.3b muestra los puntos referidos a estos dos nuevos ejes y tambin la proyeccin de los puntos sobre CPl y CP2. Se puede
ver que en este ejemplo Zl recoge la mayor parte de la variacin y as sera
posible reducir la cantidad de datos a manejar trabajando con Zl en una dimensin en lugar de trabajar en dos dimensiones con Xl y X z. (En la prctica, no sera necesario utilizar ACP cuando haya slo dos variables, ya que
tales datos son relativamente fciles de manejar.)

225

CP1

(a)

X1
(b)

CP2

Figura 8.3. (a) Diagrama que ilustra las dos componentes principales, CP1 y CP2, para las dos
variables, X; y X;,. (b) Puntos referidos a los ejes de las componentes principales. e indica puntos
de datos, o su proyeccin sobre los ejes.

La Figura 8.3 muestra que el ACP es equivalente a una rotacin de los


ejes originales, de tal manera que CPI se encuentra en la direccin de la mxima variacin, pero manteniendo el ngulo entre los ejes. Con ms de dos
variables no resulta posible ilustrar el mtodo grficamente pero de nuevo se
puede pensar en el ACP como una rotacin de los ejes de tal manera que CPI
se encuentra en la direccin de mxima variacin, CP2 se encuentra en la
direccin de la siguiente mayor variacin y as sucesivamente. A menudo
resulta que entre CPI y CP2 recogen la mayor parte de la variacin en el
conjunto de datos. Como resultado los datos se pueden representar en slo
dos dimensiones en lugar de las n originales.
Una decisin que se ha de tomar antes de llevar a cabo un ACP es si
emplear los datos originales o primero estandarizar cada variable a media
cero y varianza unidad. Si las variables no se estandarizan y una variable
tiene una varianza mucho ms grande, entonces esta variable controlar la
primera componente principal. La estandarizacin evita esto haciendo que
todas las variables tengan el mismo peso: en el desarrollo que sigue se supondr que los datos se han estandarizado.
En trminos matemticos las componentes principales son los autovectores o vectores propios de la matriz de correlacin y la tcnica para encontrar
estos autovectores se llama anlisis propio. A cada componente principal (es
decir, autovector) le corresponde un autovalor que proporciona la cantidad
de varianza en el conjunto de datos que se encuentra explicada por esa componente principal. Para datos estandarizados cada una de las variables originales tiene una desviacin estndar, y por tanto una varianza, de 1. As, la
varianza total del conjunto de datos y la suma de los autovalores son ambos
iguales al nmero de variables.

226

EJEMPLO 8.3.1
Realcese un anlisis de componentes principales de los datos de la Tabla 8.1.
Esto se puede hacer utilizando una variedad de paquetes informticos (por ejemplo, Minitab,
SAS, The Unscrambler, ...). La salida impresa que aparece a continuacin se obtuvo con
Minitab.
Principal Component Analysis

Eigenanalysis of the Correlation Matrix


Eigenvalue
Proportion
Cumulative
Variable
300
350
400
450

2.8807
0.720
0.720
PC1
0.547
0.546
- 0.400
- 0.493

0.6453
0.161
0.881
PC2
-0.238
-0.299
- 0.913
0.145

0.3897
0.097
0.979
PC3
-0.395
-0.324
0.073
-0.856

0.0844
0.021
1.000
PC4
0.699
- 0.712
0.043
- 0.049

En este ejemplo hay cuatro variables y as la suma de las varianzas para los datos (ahora
estandarizados) es 4. La primera lnea etiquetada '<eigenvalue (<<autovalor) muestra cmo
esta varianza se comparte entre las cuatro componentesprincipals, teniendo PC1 una varianza de 2,8807, PC2 de 0,6453, y as sucesivamente. Ntese que, como se esperara,
PC1 tiene la varianza ms grande, PC2 la siguiente ms alta, y as sucesivamente. Las
componentes principales con un autovalor mayor que 1 contribuyen ms a la varianza que
las variables originales. La suma de las varianzas de las cuatro componentes principales es
4 (descartando los errores de redondeo). De nuevo esto eslo que se esperara puesto que
entre todas las componentes principales deben explicar toda la variacin en el conjunto de
datos. La segunda linea de la tabla (etiquetada "proportion) da la proporcin de la varianza
explicada por cada componente principal. La lnea siguiente muestra la proporcin acumulada. Informa, por ejemplo, de que entre PC1 y PC2 recogen el 88,1% de la variacin.
La mitad inferior de la tabla proporciona los coeficientes de las componentes principales.
(Los coeficientes se encuentran en una escala de modo que la longitud de un vector de
datos no se vea alterada por el cambio en las variables. El signo del primer coeficiente de
la primera componente principal se elige, arbitrariamente, para que sea positivo.) Por ejemplo, la primera componente principal es Z; = 0.547 ~ + 0.546X2 - OAOOX3 - 0.493X
donde ~, ~, X:! y X son las intensidades relativas estandarizadas a 300, 350, 400 Y450
nm, respectivamente. Cada variable original se estandariza restando la media a esa variable
y luego dividiendo por la correspondiente desviacin estndar (obtenida de la Tabla 8.1).
As, para el compuesto A,

Z;

0.547 x

(16 - 15.75)
1.485

+ 0.546 x

(62 - 61.25)
1.658

(67 - 68.92)
- 0.400 x .
1.505

(27 - 29.25)
- 0.493 x - - - 1.485
= 1.60
A veces este valor se conoce como una "puntuacin para PC1. La Figura 8.4 representa
las puntuaciones de las dos primeras componentes principales, calculadas de. esta manera,
para los compuestos A-L. Este diagrama revela que los compuestos caen' en dos grupos
distintos, un hecho que no resulta nada claro en los datos originales.
.

1.5

c...

c:

a.

eA

.:

0.5

al

O - ---.-- -- - --_ ---- ---~ ----- ----------

.gc:

i
.i,

1.0

ic:

227

-'G---.---------

eH

-0.5

O>
al

(fJ

-1.0

eJ

eD

-1 .5 .........
-2.0 -1.5 -1.0 -0.5

'-------'_------'_---L_----L._-J..-~___'_

0.5

1.0

__'__

___'_______'

1.5

2.0

2.5

Primera componente, CP1

Figura 8.4. Las puntuaciones de las dos primeras componentes principales para los datos
de la Tabla 8.1.

La Tabla 8.3 muestra los datos originales reordenados de manera que compuestos con espectros similares se. agrupan juntos. Las diferencias entre los
dos grupos son ahora aparentes. Hay una diferencia a las cuatro longitudes
de onda, y las magnitudes de estas diferencias son similares. Esto ;orresponde al hecho de que los coeficientes para la primera componente principal son
similares en tamao. El grupo superior en la Tabla 8.3 tiene intensidades
ms altas que el grupo inferior a 300 y 350 nm y lo opuesto es verdadero a
400 y 450 nm. Esto corresponde al hecho de que los primeros dos coeficientes de Z tienen el signo opuesto a los dos segundos. Una vez que se han
identificado dos o ms grupos utilizando ACP, resulta posible explicar las
diferencias entre ellos en trminos de estructura qumica. A veces puede ser
posible proporcionar una interpretacin fsica a las componentes principales.
Tabla 8.3. Los datos de la Tabla 8.1 ordenados de nuevo, de manera
que los compuestos con espectros similares se agrupan juntos.
Longitud de onda (nm)
Compuesto

300

350

400

450

A
G
H

16
17
16

62
63
62
63
62
64

67
68
69
69
68
67

60
59
61
60
59
60

69
68
71
70
69
72

27
29
28
27
28
29
31
31
31
30
30
30

17

K
L

18
18
15
14
15
14
14
15

D
E

F
I

228

Por esta razn, a veces las componentes prlcipales son denominadas como
variables latentes (es decir, ocultas).
En este ejemplo los valores de los coeficientes muestran que cada una de
las variables contribuye a CPl y al menos tres de ellas contribuyen a CP2.
En otros casos, se encuentra que algunas variables no contribuyen significativamente incluso l CPI. Un beneficio importante del ACP es que entonces
dichas variables se pueden rechazar.
El ACP es en primer lugar un mtodo matemtico para la reduccin de
datos y no supone que los datos tengan ninguna distribucin concreta. Se ha
visto como el ACP se puede utilizar para reducir la dimensionalidad de un
conjunto de datos y cmo puede, por tanto, revelar conglomerados. Se ha
utilizado, por ejemplo, sobre los resultados de espectroscopia de transformadas de Fourier a fin de revelar diferencias entre cabello de diferentes grupos
raciales y para clasificar diferentes tipos de fibra de algodn. En otro ejemplo
se midieron las concentraciones de una serie de clorobifenilos en muestras
de una variedad de mamiferos marinos. Un ACP de los resultados revel diferencias entre las especies, diferencias entre hombres y mujeres, y diferencias
entre individuos jvenes y adultos. Tambin encuentra el ACP aplicacin en
la regresin mltiple (vase la Seccin 8.8).

8.4.

Anlisis de conglomerados

Aunque el ACP puede revelar grupos de objetos similares, no siempre resulta


eficiente al hacerlo. La Figura 8.5 muestra una situacin en la que la primera
componente principal no proporciona una buena separacin entre dos grupos. En esta seccin se vuelven a tratar mtodos cuyo propsito explcito es
la bsqueda de grupos.
El anlisis de conglomerados (<<anlisis cluster) es un mtodo para
dividir un grupo de objetos en una serie de clases de manera que los objetos
similares se encuentren en la misma clase. Como en el ACP, los grupos no
se suelen conocer antes de realizar el anlisis matemtico y no se real1za ningn supuesto sobre la distribucin de las variables. El anlisis de conglomerados busca objetos que se encuentren prximos en el espacio de las varia-

CP1

x,
Figura 8.5. Una situacin en la que la primera componente principal no proporciona una
buena separacin entre dos grupos.

bIes. La distancia, d, entre dos puntos en un espacio n-dimensional con coordenadas (XI' Xz, ... , X r,) y (gl' Y2, ... , y,,) se calcula habitualmente a travs de
la distancia Eucldea definida por:

Por ejemplo, la distancia entre los compuestos E y F de la Tabla 8.3 (si se


utilizan las variables no estandarizadas) viene dada por:

d = J(14 - 14)2 + (60 - 59)2 + (70 - 69)2 + (30 - 39)2 =

J2

Como en el ACP, se ha de tomar la decisin de si se estandarizan o no los


datos. La estandarizacin de los datos significar que todas las variables se miden en una escala comn de manera que una variable no domina a las otras.
7
(a)

6
5

...."2.

. e :

..<3.
e :

.....1'...: .....

1 \. e .:

....."
oL---'-----'-_-'--------'--------'_-'----'
023

7
(b)

(e)

Y 3

2
1
OL--.---'------L-----.J_-'------L---l---J
O
2 3 456 7

,-.e '.

7
(d)

7
(e)

.. ..

" 4 "'\

456

\.

5',
'

,,<*.........'"

3 ," 2. "
/
3
2 '
:

..'. ..:
,

4
3

/'

...
.........,,'

0'-------'-----'---'--------'--------'--'----'

4
X

O'--------'-----'-_-L----'----I_--'----'
O
2 3 4 5 6 7
X

Figura 8.6. Etapas en la formacin de conglomerados: las lneas a trazos suspensivos


representan a los conglomerados.

229

230

30.16

53.44
E
(jj

76.72

100.00 ' - - - . L . - _ - - - L ._ _- ' - - - _ - ' - -_ _~


2
4
3
5
Observaciones

Figura 8.7. Un dendrograma ilustrando las etapas de la formacin de conglomerados


para la Figura 8.6.

Hay una serie de mtodos para la bsqueda de clusters. U n mtodo empieza considerando que cada objeto forma un conglomerado de tamao
uno y compara las distancias entre stos. Los dos puntos que se encuentren
ms prximos se unen para formar uno nuevo. Las distancias entre los conglomerados se comparan de nuevo y se combinan los dos conglomerados
que se encuentren ms prximos. Este procedimiento se repite y, si se continuara indefinidamente, agrupara todos los puntos juntos. Existe una amplia gama de formas de calcular la distancia entre dos conglomerados que
contengan ms de un miembro. El ms simple conceptualmente consiste en
tomar la distancia entre dos conglomerados como la distancia entre los elementos o puntos ms prximos de los mismos. Esto se conoce como el mtodo de vinculacin simple o del vecino ms prximo, ilustrndose
en la Figura 8.6. Las sucesivas etapas de la agrupacin se pueden mostrar
sobre un dendrograma como el de la Figura 8.7. El eje vertical puede mostrar o la distancia, d)' entre dos puntos i y j cuando se unen o alternativamente la similitud, Sj,
definida por Sij. = 100(1 - di/dm,iJ
donde dI,,,;'. es la
.
.
mxima separacin entre cualquier par de puntos. La etapa en la que se detiene la formacin de los grupos, que determina el nmero de conglomerados
en la clasificacin final, es una cuestin que queda al juicio de la persona que
realiza el anlisis.

EJEMPLO 8.4.1
Aplquese el mtodo de vinculacin simple a los datos (no estandarizados) de la Tabla 8.1.
Utilizando Minitab se obtuvo la salida siguiente. Con dicho programa de computadora las
vinculaciones continan hasta que slo haya un conglomerado, a menos que el usuario
especifique otra cosa.
El dendrograma de la Figura 8.8 ilustra las fases de la vinculacin. La escala vertical proporciona la distancia entre los dos grupos en el momento en que se combinaron. La tabla
anterior muestra que los dos primeros puntos que se unieron fueron 5 (compuesto E) y 6

231

Hierarchical Cluster Analysis of Ohservations

Euc 1idean. Distance, Single Linkage

>-

Amalgamation Steps

2!..:

Step Number of
clusters
1

11

10
9
8
7
6
5
4
3
2
1

3
4

5
6

7
8
9
10
11

Sirnilarity
level

Distance
level

Clusters
joined

80.20
80.20
75.75
75.75
75.75
75.75
75.75
71.99
71.99
68.69
49.51

1. 414
1.414
1.732
1.732
1.732
1.732
1. 732
2.000
2.000
2.236
3.606

5
3
7
7
8
2
7

6
5
12
11
10
9
3
8

New
cluster
5

Nwnber of
Obs in new
cluster
2
3
2
3
2
2

7
7
8
4

2
7
2
1
1

5
6
6
12

,/2

(compuesto F) con una separacin de 1A14 ( =


como se calcul antes). El lector puede
verificar que la distancia entre C y F tambin es ,,/2 de manera que la siguiente etapa es
unir el punto 3 al conglomerado formado por los puntos 5 y 6. El proceso contina hasta
que todos los puntos se encuentren en un conglomerado. No obstante, si cortsemos el
rbol", es decir, detuviramos la agrupacin en el momento que indica la lnea de puntos
suspensivos de la Figura 8.8, este anlisis sugerira que los compuestos A-L caen en dos
grupos distintos. No resulta sorprendente que los grupos contengan los mismos elementos
que en la aplicacin del ACP.

3.61 1m

.~

240 r-

(5

..L

r-'-

1.20 r-

0.00 '-L_'-------'-----'---l_L---'---'-----''------'-----L--l_
D
B e E F A G L K H J

Observaciones

Figura 8.8.

Un dendrograma para los datos de la Tabla 8.1.

El mtodo de anlisis de conglomerados que se acaba de describir es jerrquico, lo que significa que una vez que se ha asignado un objeto a un grupo
el proceso no se puede invertir. En los mtodos no jerrquicos se tiene justamente lo contrario. Uno de dichos mtodos es el mtodo de k-medias que
se encuentra disponible, por ejemplo, en Minitab. Empieza por dividir los

(Ji'
(Ji'

:3

e;:+
;:::.
OJ
~

0)'
~
-+

ro

232

puntos en k conglomerados o alternativamente por elegir k puntos de semilla. Entonces cada individuo se asigna al conglomerado (o punto de semilla)
cuyo centroide se encuentre ms prximo. Cuando un conglomerado pierde
o gana un punto se vuelve a calcular la posicin del centroide. El proceso
contina hasta que cada punto se encuentre en el conglomerado cuyo centro
sea el ms prximo.
Este mtodo tiene la desventaja de que el agrupamiento final refleja la
eleccin de los conglomerados o puntos de semilla. Otra desventaja es que el
valor de k se tiene que elegir de antemano. Se han sugerido muchos mtodos
para decidir el mejor valor de k, pero ninguno de ellos resulta realmente satisfactorio.
El anlisis de conglomerados se ha utilizado para clasificar la multitud de
fases empleadas en cromatografa gas-lquido. Se puede entonces seleccionar
un conjunto ms pequeo tomando una fase de cada conglomerado: esto proporciona un rango de fases estacionarias, cada una con caractersticas de separacin distintivas. Otra aplicacin es la clasificacin de antibiticos en trminos de su actividad frente a diferentes tipos de bacterias a fin de aclarar
la relacin entre actividad biolgica y estructura molecular. Otra aplicacin
reciente del anlisis de conglomerados es la clasificacin de vinagres de vino
sobre la base de una variedad de constituyentes orgnicos e inorgnicos.

8.5.

El anlisis discriminante

Los mtodos descritos hasta el momento en este captulo nos han ayudado a
ver si los objetos forman grupos cuando no se espera ningn conocimiento
a priori de los grupos. Dichos mtodos se llaman a veces reconocimiento de
pautas no supervisado. Ahora nos detendremos en el reconocimiento de
pautas supervisado. Aqu se empieza con una serie de objetos cuya pertenencia al grupo es conocida, por ejemplo, jugos de manzana extrados de diferentes variedades de fruta. Estos objetos se llaman a veces objetos de entrenamiento o aprendizaje. El objetivo de los mtodos de reconocimiento
de pautas supervisado es utilizar estos objetos para encontrar una regla para
asignar un nuevo objeto de grupo desconocido al grupo correcto.
El punto de partida del anlisis discriminante lineal (ADL) es encontrar una funcin discriminante lineal (FDL), Y, que sea una combinacin
lineal de las variables originales Xl' X 2 , etc.:

Las n medidas originales para cada objeto se combinan en un nico valor de


Y, de manera que los datos se han reducido de n dimensiones a una dimensin. Los coeficientes de los trminos se eligen de manera que Y refleje la
diferencia entre los grupos tanto como sea posible: los objetos en el mismo
grupo tendrn valores similares de Y y los objetos en grupos diferentes tendrn valores muy diferentes de Y. En consecuencia, la funcin discriminante
lineal (FDL) proporciona un medio de discriminacin entre los dos grupos.

233
(a)

(b)

25

~~CD
o os:'

20
15

X2

00'dJ

10

o:...

15

..
,.~

X2

<o

10

.~

oL----'--_L....::---'------J'------J
O

10

15

20

~.

25

20

Xl

25

O '------'-----'_--'-----'_--J
O 5 10 15 20 25
Xl

rnrrLo

___---'. ...a..
Figura 8.9. (a) Dos grupos y la distribucin de cada variable para cada grupo.
(b) La distribucin de la funcin discriminante lineal para cada grupo.

La situacin ms simple es aquella en la que hay dos clases y dos variables, Xl y X 2 , como se ilustra en la Figura 8.9a. Este diagrama tambin muestra la distribucin de las variables individuales para cada grupo en forma de
diagramas de puntos. Para ambas variables, hay un considerable solapamiento en las distribuciones para los dos grupos. Se puede demostrar que la FDL
para estos datos resulta ser Y = 0.91X j + 0.42X2 . Esta FDL se muestra en la
Figura 8.9b por la lnea etiquetada Y y el valor que la funcin toma para
un punto dado viene dado por la proyeccin del punto sobre esta lnea. La
Figura 8.9b muestra los grficos de punto de la FDL, Y, para cada grupo. Se
puede ver que no hay ningn solapamiento entre la distribucin de Y para
los dos grupos. Esto significa que Y es mejor al discriminar entre los grupos
que las variables originales.
Un objeto desconocido ser clasificado de acuerdo a su valor de Y.
Una aproximacin inicial basada en el sentido comn sera comparar Y
con Yj e Y2 , los valores para la media de Yen los dos grupos. Si Y est ms
prximo a Yj que a Y2 , entonces el objeto pertenece al grupo 1, en otro
caso pertenece al grupo 2. Para estos datos, Yj = 3.15 e Y2 = 10.85. As, si
Y - 3.15 < 10.85 - Y, esto es Y < 7.0, se clasificar al objeto en el grupo 1,
en otro caso se clasificar en el grupo 2. Este mtodo resulta slo satisfactorio si los dos grupos tienen distribuciones cuya forma sea similar. Tambin,
si la experiencia demuestra que un objeto es ms verosmil que pertenezca a
uno de los grupos que al otro, entonces la regla de decisin tendr que ser
modificada. Algunos programas de computadora como Minitab permiten dicha modificacin.
El xito del ADL al distribuir o asignar un objeto correctamente se puede
verificar de varias formas. La ms simple es utilizar la regla de clasificacin
para clasificar cada objeto en el grupo y registrar si la clasificacin resultante
es correcta. La tabla resumiendo los resultados de este procedimiento a veces
se llama matriz de confusin (siempre mostrada en Minitab). Este mtodo

234

suele tender a ser muy optimista ya que el objeto que se clasifica era parte
del conjunto que se utiliz para construir la regla. Un mtodo mejor divide
los datos originales en dos grupos elegidos al azar. El primer grupo, conocido
como el conjunto de aprendizaje, se utiliza para encontrar la FDL. Entonces los objetos en el segundo grupo (el conjunto de contraste) son asignados utilizando esta funcin y se obtiene una tasa de xito. Un tercer mtodo,
que utiliza los datos de manera ms econmica, es una validacin cruzada,
a veces llamada el mtodo de dejar uno fuera". Como sugiere el ltimo nombre, ste encuentra la FDL con un objeto omitido y verifica si la FDL entonces asigna correctamente al objeto omitido. Entonces el procedimiento se
repite una vez para cada objeto y se encuentra nuevamente una tasa de xito.
Este mtodo es una opcin de Minitab.
Si la distribucin no tiene formas similares, entonces se puede utilizar
una modificacin del ADL, conocida como anlisis discriminante cuadrtico (ADQ). Este mtodo supone que los dos grupos tienen distribuciones
normales multivariantes pero con varianzas diferentes.
Tanto el ADL como el ADQ se pueden extender a la situacin donde hay
ms de dos grupos de objetos. Para evitar reglas de decisin complejas del
tipo dado antes (si /J - 3.15 < 10.85 - y, etc.) muchos programas suponen
una distribucin normal multivariante y encuentran una nueva funcin para
cada grupo, que incluye un trmino constante. A partir de estas funciones se
calcula una puntuacin para cada nuevo objeto y el objeto se asigna al grupo
cuya puntuacin sea la ms alta. Esto se ilustra en el siguiente ejemplo.

EJEMPLO 8.5.1
La tabla siguiente proporciona la concentracin en g1- 1 de suerosa, glucosa, fructosa y
sorbitol en zumo de manzana a partir de tres fuentes diferentes: A, B Y C. Llevar a cabo
un ADL y evaluar el mtodo utilizando validacin cruzada.

Variedad

Suerosa

Glucosa

20

27

A
A
A

34
29

6
11
10
5
16

47
47
40

26
22

47

26

Fructosa

Sorbllol

40

4.3
2.9
2.5
2.9
7.2
3.8
3.5
6.3
3.2
3.5
5.3
3.3
4.9
5.6

49

B
B

10
14

21

51

B
B
C

10
8

20

20

15
14

49
49
55
59
68

15

19
17
21
19

49

74
57

5.4

Clasifquese un zumo de manzana con 11, 23, 50 Y3.9 g1'-1 de suerosa, glucosa, fructosa
y sorbitol, respectivamente.

235

El anlisis siguiente se obtuvo utilizando Minitab.


Discriminant Analysis
Linear Method for Response: Variety
Predictors: Sucrose Glucose Fructose Sorbital
Group
Count

Sumrnary of Classification
Put into

.... True Group ....

Group

A
B

5
O

O
5
5

Total N
N Correct
Proportion
N = 15

1.000
N Correct

O
5
O
5
5
1. 000

O
O
5
5
5
1. 000

= 15

Proportion Correct

= 1.000

Surrunary of Classification with Cross-validation


Put into

.... True Group ....

Group

A
B

5
O

Total N
N Correct
Proportion
N

= 15

5
5
1.000

B
O

5
O
5
5
1.000

N Correct = 15

O
O

5
5
5
1. 000
Proportion Correct

= 1.000

Linear Discriminant Function for Group

Constant
Sucrose
Glucose
Fructose
Sorbitol

-44.19
0.39
0.42
1. 46
2.19

-74.24
-1.66
1. 21
2.53
3.59

-114.01
-2.50
.0.54
3.48
5.48

La parte correspondiente a summary of classification (resumen de la clasificacin) proporciona la matriz de confusin y muestra una tasa de xito del 100%. La correspondiente a
"summary of classification with cross-validation (resumen de la clasificacin con validacin
cruzada) tambin muestra una tasa de xito del 100%.
Para el nuevo zumo de manzana las puntuaciones discriminantes lineales para cada
grupo tienen valores:
Grupo A: -44.19+ 0.39 x 11
Grupo B: -74.24 - 1.66 x 11
Grupo C: -114.01 - 2.5 x 11

+ 0.42 x 23 + 1.46 x 50 + 2.19 x 3.9 = 51.301


+ 1,.21 x 23 + 2.53 x 50 + 3.59 x 3.9 = 75.831
+ 0.54 x 23 + 3.48 x 50 + 5.48 x 3.9 = 66.282

La puntuacin para el grupo B es la ms alta, de manera que -el zumo de manzana desconocido se presupone que procede de la fuente B.

236

A diferencia de los otros procedimientos descritos en este captulo, la estandarizacin de las variables no tiene ningn efecto sobre el resultado del anlisis discriminante lineal: meramente vuelve a escalar los ejes. No obstante,
puede ser til trabajar con las variables estandarizadas a fin de decidir las
variables que son importantes al proporcionar la discriminacin entre los
grupos. Como una gua general sern aquellas variables que tengan los coeficientes ms grandes en las funciones discriminantes lineales. Una vez que
estas variables se hayan identificado, se pueden investigar las prestaciones
del mtodo con menos variables para ver si an se puede lograr una discriminacin satisfactoria entre los grupos (ver el Ejercicio 1 al final de este captulo).
Algunas aplicaciones recientes del ADL incluyen la clasificacin de aceites vegetales utilizando los datos obtenidos de una lista de sensores de gases
y el uso de espectros de resonancia magntica protnica para discriminar entre el tejido ovrico cancergeno y normal.
Aunque parece que el mtodo anterior analiza todos los grupos simultneamente, el mtodo es en realidad equivalente a analizar los grupos por
parejas. Un mtodo alternativo para ms de dos grupos es el anlisis de variables cannicas (AVC), analizndolos simultneamente de manera genuina. ste resulta ser una extensin del ADL que encuentra una serie de variables cannicas Y, Y z, etc. (que son de nuevo combinaciones lineales de
las variables originales). Como con el ADL, Y se elige de tal forma que refleje la diferencia entre los grupos tanto como sea posible. Entonces Yz se
elige de manera que refleje tanto como sea posible la diferencia restante entre los subgrupos, sujeto a la restriccin de que no hay ninguna correlacin
entre Y e Yz,y as sucesivamente. Se podra pensar en el AVC como en un
ACP para grupos pero en el que, a diferencia del ACP, los resultados no dependen de la escala, de manera que no es necesario ningn tratamiento previo de los datos.
La siguiente seccin describe un mtodo alternativo que se puede utilizar
cuando hay dos o ms grupos.

8.6.

El mtodo de los K vecinos ms prximos

ste es un mtodo conceptualmente simple para decidir cmo clasificar un


objeto desconocido cuando hay dos o ms grupos de objetos de clase conocida. No hace ninguna suposicin sobre la distribucin en las clases y se puede
utilizar cuando los grupos no puedan ser separados por un plano, como se
ilustra en la Figura S.10. En su forma ms simple un objeto desconocido es
asignado a la clase de su vecino ms prximo. Alternativamente, se toman
los K vecinos ms prximos (donde K es un entero pequeo) y la pertenencia a la clase se decide por un esquema de voto. Por ejemplo, supuesto que
K es impar, el objeto desconocido se puede asignar a la clase de la mayora
de sus K vecinos ms- prximos. En versiones ms sofisticadas, se pueden asignar pesos diferentes a los vecinos, dependiendo de sus distancias
relativas.

237
o

Grupo 1

8.7.

o o
o

Figura 8.10.

o
o
Grupo 2
o o

Dos grupos que no se pueden separar mediante un plano.

El modelado de clase disjunta

El nfasis en los mtodos descritos en las Secciones 8.5 y 8.6 ha consistido


en intentar encontrar un lmite o frontera entre dos o ms clases, de manera
que un objeto desconocido se pueda asignar a la clase correcta. Sin embargo,
se puede presentar la situacin en la que el objeto desconocido no pertenezca
a ninguna de las clases que se estn considerando. Por ejemplo, en el Ejemplo 8.5.1 se supuso que el jugo de manzana desconocido proceda de una de
las fuentes A, B o C. Sin embargo, pudiera no proceder de ninguna de estas
fuentes pero todava lo habramos asignado (incorrectamente) a una de ellas.
Se necesita una aproximacin diferente si se quiere evitar este tipo de error.
En lugar de tener una regla que discrimine entre clases, se necesita una regla
que nos permita discriminar entre la pertenencia o no a una clase dada. Esto
se hace construyendo un modelo separado para cada clase y utilizando el
modelo para contrastar si el objeto desconocido pudiera ser un miembro de
la clase. Esto se llama modelado de clase disjunta. Por ejemplo, si el
nmero de variables es pequeo, cada clase se podra modelar por una distribucin normal multivariante. Con ms variables, primero es necesario realizar alguna reduccin de datos. Uno de esos mtodos, llamado SIMCA (Modelado Independiente Suave de Analoga de Clase), construye un
modelo de cada clase en trminos de las primeras componentes principales
para esa clase.

8.8.

Regresin mltiple

Volvemos ahora a la situacin en la que las variables se pueden dividir en


dos grupos: variables respuesta y variables predictoras. La situacin en la que
se tiene una variable respuesta, Jj, dependiente de una serie de variables pred.ictoras, Xl> xz, X3, etc., se conoce como regresin mltiple. Un ejemplo
sera la situacin en la que Jj es un valor de absorbancia de una mezcla de
compuestos con concentraciones Xl> X z, X 3 ... Las tcnicas de regresin lineal

238

que se describieron en el Captulo 5, se pueden extender para encontrar una


ecuacin de regresin de la forma:

y = bo + b1x 1 + bzxz + ...


Para realizar la regresin mltiple el nmero de muestras de calibracin debe
ser ms grande que el nmero de predictores. ste es probablemente el caso
en la situacin dada antes pero puede no ser siempre as como veremos en
la Seccin 8.1l.
Como ocurrira con la regresin univariante, al evaluar el modelo resulta
importante un anlisis de los residuos. Los residuos deberan estar distribuidos normalmente y aleatoriamente. El desempeo de la prediccin se puede
validar de una manera similar a la validacin de LDA, es decir, bien dividiendo los datos en dos grupos elegidos aleatoriamente, construyendo el
modelo con un grupo y luego contrastndolo con el otro, o mediante la utilizacin de un mtodo de dejar uno fuera. Un grfico de los valores predichos frente a los valores medidos proporcionar puntos prximos a una lnea
recta si el modelo es satisfactorio.
A diferencia de la situacin univariante, existe la opcin de omitir alguna
de las variables predictoras. Se podra, si se quisiera, intentar todas las combinaciones posibles de las variables predictoras y encontrar aquella que prediga y acertadamente con el mnimo nmero de variables predictoras. El valor ajustado de R z (ver Seccin 5.14) se puede utilizar para comparar el
funcionamiento de los diferentes modelos.

8.9.

Regresin sobre componentes principales

Un problema con la regresin mltiple es que las correlaciones entre las variables predictoras pueden conducir a complicaciones matemticas, que resulten en predicciones no fiables de y. Una forma de sortear esto es realizar
un ACP sobre las variables x y luego realizar una regresin de y sobre las
componentes principales. Esto se conoce como regresin sobre componentes principales (RCP). Puesto que las componentes principales no se encuentran correlacionadas (ver Seccin 8.3), el problema de la correlacin entre las variables predictoras resulta superado.
RCP resulta tambin una tcnica valiosa cuando el nmero de variables
predictoras originales supera al nmero de muestras de calibracin disponibles. El nmero de variables predictoras se puede reducir utilizando las primeras componentes principales en lugar de las variables originales. Este mtodo proporcionar resultados satisfactorios con tal que las componentes
principales utilizadas recojan entre ellas la mayor parte de la variacin en las
variables predictoras. Esta tcnica se utiliza a menudo en la calibracin multivariante (ver Seccin 8.12).

8.10.

Regresin multivariante

El trmino regresin multivariante se aplica habitualmente a la situacin


en la que hay una respuesta multivariante. Si hay una variable predictora,

un posible mtodo de anlisis sera encontrar una ecuacin de regresin relacionando cada una de las variables respuesta, lJi' con la variable predictora.
Si existiera ms de una variable predictora se realizara una regresin mltiple de cada lJi sobre las variables predictoras. Alternativamente, se podra
realizar primero un ACP sobre las variables predictoras para producir nuevas variables no correlacionadas y luego realizar una regresin mltiple de
cada lJi sobre estas componentes principales. Otra posibilidad sera obtener
las componentes principales de las variables respuesta y establecer una regresin de stas sobre las componentes principales de las variables predictoras.
La siguiente seccin describe un mtodo que utiliza las correlaciones entre las variables respuesta y predictoras en lugar de aplicar las aproximaciones del ACP a los dos grupos de variables separadamente.

8.11.

Regresin sobre mnimos cuadrados parciales

Como la RCP, la regresin sobre mnimos cuadrados parciales (regresin


MCP) empieza encontrando combinaciones lineales de las variables predictoras. Sin embargo, la forma en que se eligen estas combinaciones resulta
diferente. En la RCP las componentes principales se eligen de manera que
describan tanto como sea posible la variacin en las variables predictoras, al
margen de la fuerza de las relaciones entre las variables respuesta y las predictoras. En MCP, a las variables que muestran una alta correlacin con las
variables respuesta se les asigna un peso extra dado porque sern ms efectivas en la prediccin. De esta forma se eligen combinaciones lineales de las
variables predictoras que estn altamente correlacionadas con las variables
respuesta y tambin expliquen la variacin en las variables predictoras. Se
suele distinguir entre la situacin cuando la respuesta consta de una nica
variable y aquella cuando la respuesta es multivariante: la primera se llama
MCPl, la ltima MCP2.

8.12.

Calibracin multivariante

Como se ha notado antes, un ejemplo de la aplicacin de la regresin multivariante se encuentra en la determinacin de la concentracin de los
constituyentes de una mezcla de analitos mediante anlisis espectral. En la
aproximacin clsica la intensidad, lJi' a cada una de una serie de longitudes
de onda estara relacionada con las concentraciones de los constituyentes
mediante una ecuacin de la forma lJi = b Oi + bliXi + b2iX2 + ... donde los
coeficientes para cada constituyente dependen de la longitud de onda. Entonces, a partir del espectro medido de un espcimen con composicin desconocida (es decir, un ejemplar de ensayo), se podran estimar las concentraciones de los analitos en este ejemplar. Este mtodo es el anlogo
multivariante del mtodo univariante descrito en la Seccin 5.4. El mtodo
requiere conocimiento del espectro de los constituyentes puros y ejemplares
de calibracin de composicin conocida. Supone que no hay otros componentes en los ejemplares que interfieran a los componentes de inters, en el

239

240

intervalo de concentracin utilizado, y que los componentes de inters no


interfieren unos con otros.
En muchos casos las muestras predictoras no contienen otras sustancias
ms que aquellas de inters y stas actan como interferentes. Si ste es el
caso, es mejor calibrar con muestras de fuentes similares (que tendrn composicin similar) y utilizar calibracin inversa. Esto significa que la concentracin de analito se modela como una funcin del espectro (es decir, lo
contrario del mtodo clsico). La calibracin inversa es apropiada ya que la
concentracin no es una variable controlada. Incluso cuando sea posible preparar muestras de calibracin de composicin conocida, si las sustancias de
inters interfieren unas con otras, entonces las concentraciones de estas sustancias ya no son en efecto variables controladas: en estas circunstancias de
nuevo la calibracin inversa resulta apropiada. El siguiente ejemplo aclara el
mtodo.

EJEMPLO 8.12.1
La tabla siguiente proporciona la absorbancia UV (x 100) registrada a tres longitudes de
onda diferentes, A" Az YAs, de 10 especfmenes (A-J) y las concentraciones medidas (mM),
c" cz, C3 Y C4, de cuatro constituyentes de inters.

Espcimen

C,

c4

A,

Az

A3

0.888
0.461
0.453
0.560
0.414
0.438
0.342
0.743
0.751
0.477

0.016
0.091
0.159
0.093
0.019
0.169
0.228
0.109
0.011
0.146

0.014
0.243
0.233
0.085
0.279
0.137
0.196
0.006
0.148
0.063

0.082
0.205
0.156
0.263
0.289
0.256
0.233
0.142
0.090
0.314

91.5
93.8
93.4
92.5
94.8
93.2
93.7
91.5 .
92.7
92.7

56.1
56.3
56,4
56.7
56.5
56.8
57.0
56.8
55.7
57.7

73.6
74.1
74.5
73.7
73.6
73.9
74.4
73.9
73.9
73.8

D
E
F
G
H
I
J

Encontrar la ecuacin de regresin para predecir

Cl>

cz, Cs y c4 a partir de A" Az YA3

La salida que se muestra a continuacin se obtuvo utilizando Minitab y proporciona la ecuacin de regresin para cl .
RegressionAnalysis
The regression equation is
el = 31.7 - 0.129 A1- 0.153A2 - 0.142 A3
Predictor
Constant
Al
A2
A3
S = 0.04664

Coef
31.688
-0.12893
-0.15260
-0.14214
R-Sq

95.5%

StDev
3.999
0.01576
0.02863
0.05228

T
7.92
-8.18
-5.33
-2.72

.R-Sq(adj) = 93.2%

P
0.000
0.000
0.002
0.035

241

Analysis of Variance
Source
Regression
Error
Total

DF
3
3
9

SS
0.275833
0.013051
0.288884

MS

0.091944
0.002175

42.27

0.000

El trmino constante y los otros tres coeficientes de la ecuacin de regresin proporcionan


valores significativos de t (llamado T en las salidas de Minitab) sugiriendo que los otros
tres predictores A" A2 YA3 se deberan incluir en la ecuacin de regresin. El valor de R2
(ajustado) proporciona una medida de la habilidad predictiva de la ecuacin de regresin.
La Figura 8.11 muestra un grfico de los residuos frente a los valores ajustados: los residuos
no muestran ningn patrn concreto. La Figura 8.12 representa los valores pronosticados
frente a los valores medidos. Los puntos se encuentran razonablemente prximos a una
lnea recta con ningn valor anmalo obvio.
Las correspondientes ecuaciones para C2. C3 Y C4 son:
c2:::

14.0 + 0.0179 Al + 0.0821 A2 + 0.106

A3

c3 = - 9.84 + 0.0846 Al - 0.0454 A2 + 0.0633 A3


c4 =

4.51 + 0.0846 Al + 0.112

0.04

0.02
(()

0.00

::::J

TI

Q)

a:

A2 - 0.0834 A3

....................
_t!.

__

-0.02
-0.04

-0.06

-0.08 '-------'---'-------'---'-------'----'
0.3
004
0.5
0.6
0.7
0.8
0.9
Valor ajustado

Figura 8.11.

Un grfico de los residuos frente a los valores ajustados para el Ejemplo 8.12.1 .

08
({)

ro
ro

TI

0.7

0.6

eo..

0.5

.~

004

03
0.3

004

0.5

0.6

0.7

0.8

0.9

e, medidas
Figura 8.12. Un grfico de los valores pronosticados frente a los valores medidos para
el Ejemplo 8.12.1.

242

En el Ejemplo 8.12.1 la regresin mltiple fue una tcnica adecuada ya que


hay slo tres variables predictoras y, como la matriz de correlacin en la
Tabla 8.4 muestra, la correlacin entre ellas no es muy alta.
Tabla 8.4. Matriz de correlacin para las concentraciones
en el Ejemplo 8.12.1.

e2
e3
e4

el
-0.647
-0.706
-0.776

e2

e3

0.094
0.410

0.281

En la prctica, se empleara un espectro de absorbancia UV conteniendo


muchos cientos de medidas, en lugar de medidas de absorbancia a slo tres
longitudes de onda como en este ejemplo. Como resultado el nmero de variables predictoras es probable que sea mucho ms grande que el nmero de
muestras de calibracin. Puesto que no es posible llevar a cabo regresin
mltiple en estas circunstancias, se debe reducir el nmero de variables predictoras. Una solucin sera utilizar las medidas de intensidad a slo algunas
longitudes de onda, pero esto plantea el problema de decidir cules seran las
longitudes de onda mejores para elegir. Tambin significara que una gran
cantidad de datos (y la informacin que ellos contienen) sera descartada.
Podra tambin ser un problema al utilizar la regresin mltiple debido a la
correlacin entre las variables predictoras. Ambos problemas se pueden superar utilizando RCP o MCPlo Estos mtodos reducen el nmero de variables
predictoras a slo unas pocas y tambin proporcionan resultados satisfactorios cuando hay correlacin entre las variables predictoras. El mtodo preferido en una situacin dada depender de la naturaleza precisa de los datos:
se puede llevar a cabo un anlisis mediante cada mtodo y evaluar los resultados a fin de encontrar el mtodo que funciona mejor.
En espectroscopia molecular han surgido muchas aplicaciones recientes
de RCP y MCP, donde a menudo surgen espectros de emisin y absorcin
fuertemente solapados, incluso en mezclas simples. Por ejemplo, se han analizado con xito un pesticida y sus metabolitos utilizando espectroscopia infrarroja con transformada de Fourier y una mezcla de fenoles muy similares
se resolvi por medio de su espectro de excitacin de fluorescencia.

8.13.

Redes neuronales artificiales

Ningn captulo sobre mtodos quimiomtricos modernos estara completo


sin una mencin de las redes neuronales artificiales (RNA). En sntesis,
stas intentan imitar el funcionamiento de las neuronas en el cerebro. Dichas redes tienen una serie de capas de neuronas artificiales vinculadas, incluyendo una capa de entrada y otra de salida. Una de estas redes se podra
utilizar, por ejemplo, para clasificar muestras en una de varias clases conocidas. La red se entrena "utilizando un conjunto (grande) de aprendizaje. Su
xito en la discriminacin se puede evaluar empleando un conjunto de contraste.

Las redes neuronales encuentran aplicaciones en muchas otras reas, por


ejemplo, reconocimiento de pautas y calibracin. Se han estudiado muchos
diseos de red neuronal pero las circunstancias, si las hay, en las que resultan superiores a los otros mtodos descritos en este captulo no estn claras.

8.14.

Conclusiones

El objetivo de este captulo ha sido proporcionar una introduccin a los mtodos del anlisis multivariante que se utilizan con ms frecuencia en la qumica analtica. En muchos casos hay que elegir entre diferentes mtodos
multivariantes que se podran aplicar al mismo conjunto de datos. Por ejemplo, en anlisis de conglomerados se debe elegir entre la aproximacin jerrquica y la no jerrquica, y cada una de estas aproximaciones ofrece la
posibilidad de elegir entre varios mtodos diferentes. En la calibracin multivariante se debe elegir entre regresin mltiple, RCP y regresin MCP.
Adems, se podran considerar varias aproximaciones en el anlisis inicial.
Por ejemplo, el anlisis de conglomerados y el anlisis de componentes principales se podran utilizar con anterioridad al anlisis discriminante lineal, para ver si los objetos que se estn analizando forman grupos de manera natural.
Hay muchos otros mtodos adems de los descritos. Por ltimo, se debe
recordar que el anlisis multivariante es un campo que se est desarrollando
rpidamente con nuevos mtodos que se encuentran disponibles a medida
que crece la potencia y velocidad de las computadoras personales.

Bibliografa
Adams, M. J. 1995. Chemometrics in AnalJjtical SpectrocospJj. The Royal Society of Chemistry, Cambridge. (Una gua tutorial para la aplicacin de
las tcnicas que se encuentran de manera ms comn al procesar e interpretar datos espectroscpicos analticos.)
Chatfield, C. and Collins, A. J. 1980. An Introduction to Multivariate AnalJjsiso Chapman & Hall, London. (Proporciona una introduccin general al
anlisis multivariante, con una mezcla de teora y prctica.)
Flury, B. and Riedwyl, H. 1988. Multivariate Statistics: A Practical Approach. Chapman & Hall, London. (Introduce mtodos seleccionados del
anlisis multivariante a un nivel no tcnico, con nfasis sobre los principios bsicos que subyacen en el anlisis multivariante.)
Manly, B. F. J. 1994. Multivariate Statistical Methods: A Primer. 2nd Edn.
Chapman & Hall, London. (Una introduccin general al anlisis multivariante a un nivel no tcnico.)
Martens, H. and Naes, T. 1989. Multivariate Calibration. John Wiley and
Sons Ltd, Chichester. (El libro est estructurado para proporcionar una
tutora sobre el uso prctico de las tcnicas de calibracin multivariante.
Compara varios modelos de calibracin, aproximaciones de validacin y
formas para optimizar modelos.)

243

244

Qtto, M. 1999. Chemometrics: Statistics and Computer Applications in Ana-

lytical Chemistry. Wiley-VCH, Weinheim. (Proporciona un tratamiento


detallado de los contenidos de este captulo.)

Vandeginste, B. G. M., Massart, D. L., Buydens, L. M. C., De long, S., Lewi,


P. L. and Smeyers-Verbecke,]. 1998. Handhook of Chemometrics and
Qualimetrics: Part B. Elsevier, Amsterdam. (Un tratado detallado y completo de la aplicacin de las tcnicas multivariantes en la qumica analtica.)

Ejercicios
1.

Para los datos del Ejemplo 8.5.1 realizar un anlisis discriminante lineal
trabajando con las variables estandarizadas. A continuacin identificar
las dos variables que resultan ms efectivas al discriminar entre los dos
grupos. Repetir el anlisis discriminante con estas dos variables. Utilizar
la tasa de xito de la clasificacin cruzada para comparar la eficiencia
empleando dos variables con la correspondiente a utilizar las cuatro variables.

2.

Los siguientes datos proporcionan la concentracin (en mg kg- 1) de


cuatro elementos encontrados en muestras de arroz. El arroz era de uno
de los dos tipos: lmpio (p) o sucio (U), perteneca a una de las dos
variedades (A o B) y haba crecido en la estacin hmeda (W) o en la
estacin seca (D).
Variedad

A
A
A
A
A
A
B
B
B
B
A
A
B
B
B
B

Tipo

Estacin

Ni

Mo

U
U
U

D
D
D
D
D
D
D
D
D
D

3555
3535
3294
1682
1593
1554
3593
3467
2003
1323
3066
1478
3629
3256
2041
1745

2581
2421
2274
1017
1032
984
2791
2833
1690
1327
1961
813
2846
2431
1796
1383

0.328
0.425
0.263
0.859
1.560
1.013
0.301
0.384
0.216
0.924
0.256
0.974
1.131
0.390
0.803
0.324

0.535
0.538
0.509
0.494
0.498
0.478
0.771
0.407
0.728
0.393
0.481
0.486
0.357
0.644
0.321
0.619

P
P
P
U
U

P
P
U

P
U
U

P
P

W
W
W
W
W
W

(Adaptado de Phuong, T. D., Choung, P. V., Khiem, D. T. Y Kokot, S.


1999. Analyst 124:553)
(a)

Realcese un anlisis de conglomerados. Parece que las muestras


se ubican en grupos? Qu caracterstica resulta importante al determinar la pertenencia a un grupo?

(b)

(c)
(d)

Calclese la matriz de correlacin. Qu pares de variables aparecen fuertemente correlacionadas? Qu variable(s) muestra(n) poca correlacin con las otras variables?
Realcese un anlisis de componentes principales y obtngase un
grfico de puntuaciones. Confirma su anlisis del Apartado (a)?
Es posible identificar la variedad de una muestra de arroz midiendo la concentracin de estos cuatro elementos? Responda a esta
cuestin realizando un anlisis discriminante lineal. Investigue si
es necesario medir la concentracin de los cuatro elementos para
lograr una discriminacin satisfactoria.

245

Soluciones a los

eJercIcIos

(Nota. Aqu se proporciona un esbozo de las soluciones: las soluciones ms


completas con comentarios estn incluidas en el Manual de los Profesores.)

Captulo 1
1.

Los resultados de la media (g 1- 1) para los laboratorios A-E son: 41.9,


41.9, 43.2, 39.1, 41.S. De aqu: A - preciso, poco sesgo, media exacta;
B - precisin pobre, poco sesgo, media exacta pero no muy fiable;
e - preciso pero sesgado a valores altos, exactitud pobre; D - precisin
pobre, sesgado a valores bajos, pobre exactitud; E - similar a A, pero el
ltimo resultado podra ser un valor anmalo.

2.

El laboratorio A an muestra poco sesgo, pero la precisin es ms pobre,


reflejando reproducibilidad (es decir, precisin entre das) en vez de repetibilidad (precisin dentro de das).

3.

El nmero de posiciones de enlace debe ser un nmero entero, obviamente 2 en este caso, de manera que los resultados son precisos, pero
sesgados a valores bajos. El sesgo no es importante, ya que pueden deducirse dos posiciones de enlace.

4.

(i) Los niveles de lactato en sangre varan ampliamente en pacientes sanos, de manera que no se necesita ni gran precisin ni gran exactitud.
(ii) Los resultados no sesgados podran ser cruciales debido a la gran
importancia econmica del U. (iii) La velocidad del anlisis es aqu
esencial, de manera que son poco importantes la exactitud y la precisin.
(iv) El objetivo es detectar incluso pequeos cambios con el tiempo, de
manera que la precisin es ms importante.

248

s.

(i) La muestra podra no ser representativa y/o la reduccin de Fe(III) a


Fe(Il) podra ser incompleta, dando resultados sesgados en cada caso. La
completitud de la reduccin se podra contrastar utilizando un material
patrn. Los errores aleatorios en cada etapa, incluyendo la volumetra,
deberan ser pequeos. (ii) Los problemas de muestreo como en (i), y
tambin la extraccin incompleta, conduciendo a sesgos (comprobados
con patrones). Los errores aleatorios en espectrometra, sern de nuevo
relativamente bajos. (iii) Los errores aleatorios en las gravimetras deberan ser muy pequeos: ms significativos sern los problemas qumicos
tales como la coprecipitacin, originando resultados sesgados.

Captulo 2
1.

Media = 0.077 ~g ml- 1, d.e. = 0.007 ~g mI-l. DER = 9 %.

2.

en 5.163 0.025; (ii) 5.163 0.038.

3.

Media = 22.3 ng ml- \ d.e. = 1.4 ng ml- l. DER = 6.2 %, LC. 99 %


= 22.3 1.4 ng mI-l. Media = 12.83 ng ml-1, d.e. = 0.95 ng mr- l .
DER = 7.4%, LC. 99% = 12.8 1.6 ng mI-l.

4.
S.

10.12 0.18 ng mI-l. Aproximadamente 160.


49.51.1ngml- l .S.

6.

10.18 0.23 mI. Sin evidencia de error sistemtico.

7.

Para el peso de reactivo: d.e. = 0.14 mg, DER = 0.028 % (0.029 %).
Para el volumen de disolvente: DER = 0.02 %.
Para la molaridad: DER = 0.034 % (0.020 %).
Los valores para el reactivo con peso frmula 392 se dan entre parnteSIS.

8.

d.e.= 0.044 x 10- 6 M.

Captulo 3
1.

Los puntos caen aproximadamente sobre una lnea recta, indicando que
los datos se han extrado de una distribucin normal.

2.

t = 1.54, 1.60, 1.18, 1.60. Ninguna de las medias difieren significativamente del valor certificado.

3.

(a) Q = 0.565 o G = 1.97. No significativo a P = 0.05. (b) F = 34. Significativo a P = 0.05.

4.

(a) F = 1.70. No significativo a P = 0.05. (b) t = 1.28. No significativo a P = 0.05.

S.

Cuadrado medio entre muestra 2121.9, cuadrado medio dentro de


muestra 8.1. F = 262. Gran diferencia significativa entre profundida-

des. Excepto el par ms profundo, todos los pares de profundidades difieren significativamente unos de otros.
6.

t = 1.20. Los sexos no difieren significativamente.

7.

X2

8.

16.8. Sin evidencia de que algunos dgitos sean preferidos a otros.

Pino: t = 2.27, no significativo. Haya: t = 5.27, significativo a


= 0.01. Acutica: t = 3.73, significativo a P = 0.01.

9.

(a) X 2 = 5.95. El primer trabajador difiere significativamente de los


otros tres. (b) X 2 = 2.81. Los ltimos tres trabajadores no difieren significativamente de los otros.

10.

t = 1.02. Los mtodos no difieren significativamente.

11.

Cuadrado medio entre muestras = 0.1144, cuadrado medio dentro de


muestras = 0.0445. F = 2.57. Slo significativo a P = 0.05. La menor
diferencia significativa (0.25) indica que A difiere de B, D Y E.

12.

t=

13.

14.

El tamao mnimo es 12.

2.2.

Hombres y mujeres difieren significativamente.

= 3.4. Los mtodos difieren significativamente.

Captulo 4
1.

Para el esquema 1: (J2 = (4/2) + (10/5) = 4. Para el esquema 2,


(J2 = 4/(2 x 3) + 10/3 = 4. Si S es el coste de muestreo y A el coste
del anlisis, entonces (coste del esquema l/coste del esquema 2) =
= (SS + 2A)/(3S + 6A). Esta relacin es > 1 si S/A es > 2.

2.

Los clculos del ANOVA demuestran que el cuadrado medio de las variaciones entre das y dentro de das son 111 y 3.25, respectivamente.
De aqu que F = 111/3.25 = 34. El valor crtico de F 38 = 4.066
(P= 0.05), de manera que las concentraciones medias difiere~ significativamente. La varianza de muestreo viene dada por (111 - 3.25)/3 = 35.9.

3.

Los cuadrados medios de las variaciones entre muestras y dentro de


muestras son 8.31 x 10- 4 y 1.75 X 10- 4 , respectivamente, por tanto
F = 8.31/1.75 = 4.746. El valor crtico de F3 ,8 es 4.066 (P = 0.05), de
manera que el cuadrado medio entre muestras no puede ser explicado slo por variacin de medidas. La ltima variacin, (J6, se estima
como 1. 75 x 10 - 4. La estimacin de la varianza muestral, (Ji, es
([8.36 - 1.75] x 10- 4 )/3 = 2.19 x 10- 4 . De aqu que la varianza de la
media para el esquema 1 sea 0.000175/4 + 0.000219/6 = 0.00008025,
Y que la varianza de la media para el esquema 2 sea (0.000175/
[2 x 3]) + 0.000219/3 = 0.0001022.

4.

Las seis muestras proporcionan seis estimaciones de (J2, que tienen


un promedio de 3.077. Por tanto, (J = 1.753. De aqu que las lneas

249

de aCClOn y de aviso se encuentran a 50 (2 x 1.753)/)4 Y


50 (3 x 1.753)/j4, respectivamente, es decir, a 50 1.75 y 50 2.63,
respectivamente.

250

5.

Las muestras A y B proporcionan valores medios de 7.01 y 7.75 ppm,


respectivamente. Utilizando una tabla de valores de D y T (por ejemplo,
para el laboratorio 1 son -1.2 y 18.8, respectivamente), se calcula que
(J2 = 11.027 Y (J~ = 0.793. Por tanto, F = 11.027/0.793 = 13.095, mucho
mayor que el valor crtico F 14 14 de ca. 2.48 (P = 0.05), obtenido de la
tabla por interpolacin. Los errores sistemticos son entonces significativos, resultando que (Ji = 5.117.

6.

Para el diagrama de Shewart para la media, los valores de W y A que se


encuentran en las tablas (n = 5) son 0.3768 y 0.5942, respectivamente.
De aqu que las lneas de aviso estn en 120 (7 x 0.3768) =
= 120 2.64, y las lneas de accin en 120 (7 x 0.5942) =
= 120 4.16. Para el diagrama de rangos, las tablas proporcionan valores de U'l, w z, al Y a z de 0.3653, 1.8045, 0.1580 Y 2.3577, respectivamente, de manera que la lnea de aviso inferior est a 7 x 0.3653 =
= 2.56, la lnea de aviso superior est a 12.63, y las lneas de accin
inferior y superior estn en 1.11 y 16.50, respectivamente.

7.

Ya que (J = 0.6 Y n = 4, las lneas de aviso y de accin para el diagrama


de Shewart para la media estn en 80 0.6 y 80 0.9, respectivamente. En esta carta, los puntos para los das 14-16 caen entre las lneas de aviso y de accin y el punto 17 est por debajo de la lnea de
accin inferior. Por tanto, la carta sugiere que el proceso analtico se ha
ido fuera de control aproximadamente el da 14. El diagrama sumacu
muestra una tendencia negativa estacionaria desde el da 9 en adelante,
sugiriendo que el mtodo se va fuera de control mucho antes.

Captulo 5
1.

Aqu r = - 0.8569. Este valor sugiere una considerable correlacin; la


Ec. (5.3) conduce a t = 3.33, muy superior al valor crtico (P = 0.05)
de 2.13. Sin embargo (a) una relacin no lineal es ms probable, y (b)
la correlacin no es la causa: la contaminacin por Hg puede surgir en
cualquier parte.

2.

En este caso r = 0.99982. Pero el incremento en el valor de y (absorbancia) con x se debe a una ligera cantidad decreciente en cada punto,
es decir, sta es realmente una curva, aunque se cometera poco error
al tratarla como una lnea recta.

3.

Las ecuaciones usuales proporcionan valores de a = 0.0021,


b = 0.0252 Y sJ/!x =0.00703. Entonces se obtiene que sa = 0.00479 Y
Sb = 0.000266. Para convertir los dos ltimos valores en intervalos de
confianza al 95 % se multiplica por t = 2.57, conduciendo a intervalos

para la ordenada en el origen y la pendiente de 0.0021


0.0252 0.0007, respectivamente.

0.0123 y

4.

(a) Un valor de g de 0.456 corresponde a la concentracin de 18.04 ng


m1- l. El valor de sXo es 0.300 de manera que los correspondientes
lmites de confianza vienen dados por 18.04 (2.57 x 0.300) =
= 18.04 0.77 ng mI-l. (b) El contraste Q demuestra que la lectura
de absorbancia 0.347 es una observacin anmala rechazable, la media
de las tres lecturas que quedan es 0.311, es decir, una concentracin de
12.28 ng ml- l. En este caso, con m = 3, sxo = 0.195, proporcionando
lmites de confianza de 12.28 0.50 ng mI l.

5.

La absorbancia en el lmite de deteccin viene dada por a + 3slf /X =


= 0.0021 + (3 x 0.00703) = 0.0232. Este valor corresponde a un valor de x de 0.84 ng ml- 1 que es el lmite de deteccin.

6.

Aqu a = 0.2569 Y b = 0.005349, de manera que la concentracin de


Au es 0.2569/0.005349 = 48.0 ng mI-J. El valor de Slf/X = 0.003693, de
manera que SX; es 0.9179. En este caso t = 2.45, de manera que los
lmites de confianza para la concentracin al 95 % son 48.03
(2.45 x 0.9179) = 48.0 2.2 ng mI-J.

7.

La lnea de regresin no ponderada tiene b = 1.982 Y a = 2.924, respectivamente. Las concentraciones correspondientes a intensidades de
fluorescencia de 15 y 90 son 6.09 y 43.9 ng ml- J respectivamente. Entonces, sJ//x = 2.991 Y SXE = 1.767. Por tanto, los lmites de confianza
para las dos concentraciones son 6.09 4.9 y 43.9 4.9 ng ml- l , respectivamente. La lnea de regresin ponderada se calcula a partir de los
valores de s para cada punto, en orden creciente 0.71,0.84,0.89, 1.64,
2.24, 3.03. Las ponderaciones correspondientes son 2.23, 1.59, 1.42,
0.42, 0.22 Y 0.12 (totalizando 6 como se esperaba). La recta de regresin ponderada tiene entonces b = 1.964 Y a = 3.483, de manera que
las concentraciones correspondientes a los valores de intensidad de 15
y 90 son 5.87 y 44.1 ng ml- 1, respectivamente. Las ponderaciones estimadas para esos dos puntos son 1.8 y 0.18, respectivamente, proporcionando valores de sXo", de 0.906 y 2.716, Y lmites de confianza de
5.9 2.5 y 44 7.6 ng mI-l.

8.

Si se representan los resultados ESI en el eje g y los datos gravimtricos


en el x, la recta resultante tiene a = 4.48 Y b = 0.963. El valor de
r = 0.970. Los lmites de confianza para a son 4.5 20.1, incluyendo
el cero, y los lmites para b son 0.96 0.20, incluyendo el 1, de manera
que no existe evidencia de sesgo entre los dos mtodos.

9.

El anlisis grfico sugiere que la representacin es lineal hasta


A = 0.7 - 0.8. La lnea que pasa por los seis puntos conducen a un
r = 0.9936, y residuos de - 0.07, - 0.02, + 0.02, + 0.06, + 0.07, y
- 0.07. La tendencia sugiere una curva. La se de los residuos es
0.0191. Si se omite el ltimo valor, se obtiene que r = 0.9972, los resi-

251

duos son -0.04, O, +0.02, +0.04, y -0.02 (SC = 0.0040). Clculos


similares demuestran que se puede omitir tambin el quinto punto, con
algn coste en el rango del experimento.

252

10.

Las representaciones grficas de las dos lneas rectas sony = 0.0014 +


+ 0.0384x, e y = 0.1058 - 0.012x. stas se cortan en un valor de x de
(0.1058 - 0.0014)/(0.0384 - [- 0.012]) = (0.1044/0.0504) = 2.07, sugiriendo la formacin de un complejo DPA:europio 2: 1.

11.

El mejor ajuste cuadrtico es y = 0.0165 + 0.600x - 0.113x 2


ste proporciona R 2 = 0.9991 Y R,2 = 0.9981. El ajuste cbico es
y = - 0.00552 + 0.764x - 0.383x 2 + 0.117x 3 . ste proporciona
R 2 = 0.9999 Y R '2 = 0.9997, de manera que ste es mejor ajuste sin
duda.

12.

Para una lnea recta, un ajuste cuadrtico y un ajuste cbico, los valores de R 2 son 0.9238, 0.9786 Y 0.9786, respectivamente, sugiriendo que
un ajuste cuadrtico ser excelente. Esto se confirma mediante los valores de R 2 , que son 0.9085, 0.9679 Y 0.9573 respectivamente, proporcionando el ajuste cuadrtico el valor ms alto de todos.

Captulo 6
1.

La media = 9.96 mI, la mediana = 9.90 mI. El contraste Q muestra que


el valor de 10.20 no se puede omitir (P = 0.05). Si fuera rechazado, la
media = 9.88 Yla mediana = 9.89. La mediana es insensible a los valores anmalos.

2.

El contraste de los signos: comparado con la mediana, los valores proporcionan signos de - + O+ - + + + +. De este modo se tienen ocho
signos, de los cuales seis son positivos. La probabilidad de seis signos
en ocho lecturas es 0.29, es decir, > 0.05, por tanto se mantiene la hiptesis nula: el contenido mediano de azufre podra ser de 0.10 %. En el
contraste de rangos y signos, se desprecia el cero y las diferencias ordenadas son: -0.01,0.01,0.01, -0.02,0.02,0.02,0.04,0.07. Por tanto,
las posiciones con sus signos son - 2, 2, 2, - 5, 5, 5, 6, 7. El total de
posiciones negativas ( - ) es 7, pero a un P = 0.05, la regin crtica ~ 3.
Por tanto, se mantiene de nuevo la hiptesis nula.

3.

Los resultados (IDR-EID) proporcionan signos de + - + + + + + + 0+.


En efecto, se tienen ocho resultados positivos de nueve. P = 0.04 para
estos resultados, por tanto la hiptesis nula (que los mtodos proporcionen resultados indistinguibles) puede rechazarse. En el contraste de
rangos y signos, el total de las posiciones negativas (-) es 2.5, muy
inferior al nivel crtico de 5, de ah que de nuevo la hiptesis nula deba
ser rechazada.

4.

Si los valores se colocan en orden ascendente, la mediana es 23.5. Por


tanto, los valores individuales tienen los signos + + + - - - - - + + .
Esta secuencia tiene tres rachas, pero para M = N = 3, el valor crtico

es 3, con lo cual la hiptesis nula de una sucesin al azar debe ser retenida.
5.

Contraste U de Mann-Whitney: se espera que los valores de cerveza


sean mayores que los de la cerveza rubia. El nmero de valores de
cerveza rubia que son mayores que los individuales = 4.5 (1 empate).
El valor crtico en un contraste de una cola es 5, con lo cual se puede
rechazar la hiptesis nula (P = 0.05). Contraste rpido de Tukey: el resultado es 5.5, por debajo del valor crtico de 6. Por tanto, los contrastes
no son concordantes: son necesarios ms datos.

6.

Para los instrumentos A-G, la ordenacin de los estudiantes es 3, 1, 5,


4, 7, 6, 2 Y la ordenacin del personal acadmico es 5, 3, 6, 2, 4,
7, 1. Por tanto, los valores de d son - 2, - 2, -1, 2, 3, -1, 1, Y los
valores d2 son 4, 4, 1, 4, 9, 1, 1, totalizando 24. As pues,
r s = 1 - [(6 x 24)/(7 x 48)] = 0.571. Para n = 7 el valor crtico a
P = 0.05 es 0.786: no hay evidencia de correlacin entre las opiniones
de los estudiantes y las del personal acadmico.

7.

Si los valores de x son las distancias y los valores de y los niveles de


mercurio, el mtodo de Thel da a = 2.575 Y b = - 0.125. (El mtodo
de mnimos cuadrados proporciona a = 2.573 Y b = -0.122.)

8.

Para contrastar = 1.0 Y (J = 0.2, se escribe que z = (x - 1.0)/0.2.


Cuando los valores de z resultantes (1.5, 2.5, etc.) se comparan con la
funcin de distribucin acumulativa de la distribucin normal, la
mxima diferencia es + 0.335 en z = 1.5. El valor crtico es 0.262
(P = 0.05), de manera que se rechaza la hiptesis nula. El aspecto de
las curvas demuestra que = 1.0 es aproximadamente correcto, pero
(J = 0.2 es bajsimo. La media y la desviacin estndar estimadas de los
datos son 1.08 y 0.41, respectivamente. Cuando se representan los nuevos valores de z (0.54, 1.02, etc.), la mxima diferencia es slo de 0.11
en z = 0.54, por tanto se acepta la hiptesis nula: los datos se ajustan
muy bien a esta distribucin normal.

9.

Si los niveles de nquel se sustituyen por rangos (se presenta un empate), las sumas de los rangos para las tres muestras son 39, 52.5 y 79.5.
(stos suman 171, como se esperaba para los 18 valores, ya que 1/2 x
18/19 = 171.) El valor correspondiente de X 2 = 4.97, menor que el valor crtico de 5.99 (P = 0.05, 2 grados de libertad), por tanto se debe
mantener la hiptesis nula de ninguna diferencia significativa entre los
niveles de nquel en los aceites crudos.

Captulo 7
1.

ste es un ANOVA de dos factores sin rplica. El cuadrado medio entre


filas (es decir, entre soluciones) es 0.00370 (3 g.l.); el cuadrado medio
entre columnas (es decir, entre mtodos) es 0.0061 (2 g.l.) y el cuadrado medio residual es 0.00470 (6 g.l.). El cuadrado medio entre soluciones es menor que el residual, luego no es significativo. La comparacin

253

254

entre los cuadrados medios entre mtodos y residual proporciona


F = 0.00601/0.00470 = 1.28. El valor crtico de F 2 .6 (p = 0.05) es 5.14,
con lo cual la variacin entre mtodos no es significativa.
2.

De nuevo, un experimento de ANOVA de dos factores sin rplica. Los


cuadrados medios entre suelos, entre das y residual son, respectivamente, 4.67 (4 g.l.), 144.8 (2 g.l.) Y 26.47 (8 g.l.). El cuadrado medio
entre suelos es menor que el residual, luego no hay diferencias significativas entre suelos. La comparacin entre los cuadrados medios entre
das y residual proporciona F = 144.8/26.47 = 5.47. El valor crtico de
F 28 es 4.46, con lo cual esta fuente de variacin es significativa a un
P ~ 0.05. La probabilidad real (Excel) es 0.0318.

3.

Otro experimento de ANOVA de dos factores sin rplica. (La rplica


sera necesaria para estudiar posibles efectos de interaccin). Los cuadrados medios entre compuestos, entre razones molares y residual son,
respectivamente, 4204 (3 g.l.), 584 (2 g.l.) Y 706 (6 g.L). Entonces las
razones molares no tienen efecto significativo. La comparacin entre
los cuadrados medios entre compuestos y residual proporciona
F = 4204/706 = 5.95. El valor crtico de F 36 es 4.76 (P = 0.05), con lo
cual esta variacin es significativa. (P se proporciona en Excel como
0.0313). El sentido comn se debera aplicar a stos y a todos los dems
datos: la difenilamina parece comportarse de forma diferente respecto
a los otros tres compuestos.

4.

Los efectos de un nico factor son A: - 0.0215, C: 0.0005, T: - 0.0265.


Los efectos de dos factores son AC: - 0.0005, CT: 0.0025, AT:
- 0.0065. El efecto de los tres factores ACT es - 0.0005.

5.

ste es un experimento de ANOVA de dos factores con rplica. Los


cuadrados medios entre filas, entre columnas, de interaccin y de variacin residual son, respectivamente, 2.53 (2 g.l.), 0.0939 (2 g.L),
0.0256 (4 g.l.) Y 0.0406 (9 g.L). El cuadrado medio de interaccin es
menor que el residual, de manera que las interacciones muestra y laboratorio no son significativas. La comparacin de los cuadrados medios
entre columnas (es decir, entre laboratorios) y residual proporciona
F = 0.0939/0.0406 = 2.31. El valor crtico de F2 ,g es 4.256 (P = 0.05),
con lo cual la variacin entre laboratorios no es significativa.

6.

(a) El cociente de oro se usa para determinar los pHs de partida de la


forma 5 + (4/1.618) = 7.47 Y 9 - (4/1.618) = 6.53. (b) Utilizando la
aproximacin de Fibonacci para alcanzar en el rango ptimo una reduccin de 40 veces, se utilizan los trminos F 7 y F g (ya que F g es el primer trmino de Fibonacci superior a 40) que proporcionen la relacin
21/55. Los pHs de partida son entonces 5 + ([21 x 4J!55) = 6.53 y
9 - ([21 x 4J!55) = 7.47. Estos valores son los mismos que en (a), lo
que demuestra que el mtodo del cociente de oro es una forma que limita la bsqueda de Fibonacci, dando los mismos resultados cuando el
grado de optimizacin conseguido por el ltimo mtodo es alto. (c)
Cuando se tienen que realizar seis experimentos el mtodo de Fibonacci

utiliza F 6 Y F 4 que generan la fraccin 5/13, con lo cual los pHs de


partida son 5 + (20/13) y 9 - (20/13), es decir, 6.54 y 7.46 (de nuevo
valores similares). El grado de optimizacin es I/F6 , es decir, 1/13, de
manera que el intervalo de pH ptimo se definir dentm de una envolvente de 4/13 = 0.31 unidades de pH.
7.

El vrtice 1 debera ser rechazado. El nuevo vrtice 8 tendr por coordenadas para los factores A-E 5.8, 9.4, 18.1, 9.2, 8.8, respectivamente,
expresndose todos los valores con una cifra decimal.

Captulo 8
1.

La salida siguiente se obtuvo utilizando Minitab.


Linear Discriminant Function for Group
Constant
Sucrose
Glucose
Fructose
Sorbitol

-14.538
15.039
-1.829
-9.612
-2.191

-2.439
-3.697
2.931
0.363
-0.229

-8.782
-11.342
-1.102
9.249
2.421

Esto sugiere que la sucrosa y la fructosa pueden ser las variables que
resultan ms efectivas en la discriminacin entre variedades.
La tasa de acierto de la clasificacin cruzada con estas dos variables es:
Summary of Classification with Cross-validation
Put into
Group

.... True Group ....


A
B

O
5
O

O
1
4

5
5
1. 000

5
5
1. 000

5
4
0.800

Total N
N Correct
Proportion
N =

2.

15

5
O
O

A
B

N Correct

= 14

Proportion Correct

= 0.933

(a) Un dendrograma muestra dos grupos claros con pertenencia a los


grupos dependiendo de si el arroz est o no limpio.
(b)

Ni
Mo

Ni

0.954
-0.531
0.150

-0.528
0.117

-0.527

255

256

Fuerte correlacin positiva entre P y K. Escasa correlacin entre Mo y


K Y entre Mo y P
(c) Llevando a cabo ACP sobre los valores estandarizados resulta:
Eigenanalysis of the Correlation Matrix
Eigenvalue
Proportion
Cumulative
Variable

2.4884
0.622
0.622
PC1
0.577
0.572
-0.509
0.283

P
K

Ni
Mo

1.1201
0.280
0.902

0.3464
0.087
0.989

0.0451
0.011
1.000

PC2
0.340
0.366
0.357
-0.789

Una representacin de las puntuaciones muestra dos grupos bastante


bien definidos: uno para muestras limpias y otro para muestras sucias.
(d) Los resultados del ADL utilizando los valores estandarizados son:
Surnmary of Classification with Cross-va1idation
Put into
Group

.... True Group ....

A
B

Total N
N Correct

Proportion
N'= 16

7
1
8
7

1
7
8
7

0.875

0.875

N Correct '= 14

Proportion Correct '= 0.875

Linear Discriminant Function for Group


Constant
P
K

Ni
Mo

-2.608
18.016
-19.319
-0.051
-1.198

-2.608
-18.016
19.319
0.051
1.198

La discriminacin entre variedades es buena (87.5 % de acierto). Los resultados sugieren que P y K son ms efectivos en la discriminacin entre
variedades. Utilizando estos dos elementos se alcanza una tasa de clasificacin cruzada de 15/16.

APNDICE 1

Contrastes de significacin
estadstica utilizados
comnmente

Problema
Valores anmalos

Con/ras/es disponible

Ver en
Seccin

Comen/arios

1. Contraste de Dixon
2. Contraste de Grubbs

3.7
3.7

Recomendado por ISO

Comparacin de
media/mediana
con valor estndar

3. Contraste /
4. Contraste de signos
5. Contraste de rangos
y signos de Wilcoxon

3.2
6.3
6.5

No paramtrico
No paramtrico

Comparacin de
variabilidad de dos
conjuntos de datos

6. Contraste F
7. Contraste de
Siegel-Tukey

3.6
6.6

Precede al contraste 8
No paramtrico

8. Contraste /
9. Contraste U de
Mann-Whitney
10. Contraste rpido
de Tukey

3.3
6.6

No paramtrico

6.6

No paramtrico

11. Contraste / de pares

3.4

12. Contraste de signos


13. Contraste de rangos
y signos de Wilcoxon
14. Grfico x- y

6.3
6.5

Intervalo pequeo
de valores
No paramtrico
No paramtrico

5.9

Intervalo grande
de valores

Comparacin de
medias/medianas
de ms de 2 muestras

15. ANOVA
16. Contraste de
Kruskal-Wallis

3.9
6.7

Ver ndice
No paramtrico

Comparacin de ms
de 2 conjuntos de
datos emparejados

17. Contraste de
Friedman

6.7

No paramtrico

Existencia de una
distribucin concreta

18. Contraste
chi-cuadrado
19. Contraste de
Kolmogorov-Smirnov

3.11

Comparacin de
medias/medianas
de dos muestras

Comparacin de
dos conjuntos datos
emparejados

6.12

Muestras pequeas

1 OJ!PUqdV

I~

Propsito del contraste


Verificar
la existencia
de datos
anmalos antes
de emplear
otros contrastes

+
Contraste
de Grubbs
Contraste 2
Contraste
de Dixon
Contraste 1

Comparar medias/medianas y desviaciones estndar

/
Contraste
chi-cuadrado
Contraste 18
Contraste de
KolmogorovSmirnov
Contraste 19

Comparar medias/medianas

CI. > 2 medias

~
ANOVA
Contraste 15
Contraste de
Kruskal-Wallis
Contraste 16

Cf. media
con valor
de referencia

~
Contraste t
Contraste 3
Contraste de
signos
Contraste 4
Contraste de
rangos
y signos de
Wilcoxon
Contraste 5

Cf. muestras
emparejadas
o conectadas

~
Contraste t
de pares
Contraste 11
Contraste de signos
Contraste 12
Contraste de rangos
y signos de Wilcoxon
Contraste 13
Grfico x- y
Contraste 14
Contraste de Friedman
(>2 muestras)
Contraste 17

Diagrama de flujo para los contrastes de significacin estadstica

Compar
desviaciones estndar

~
Cf. dos medias
de muestras
independientes

Contraste F
Contraste 6 -I~
I
Contraste de
Siegel-Tukey
Contraste 7

I
I
I
I

Contraste t
I
Contraste 8 __ - - - - - - - __ 1
Contraste U de
Mann-Whitney
Contraste 9
Contraste
rpido de
Tukey
Contraste 10

El diagrama de flujo
El diagrama de flujo est diseado para utilizarse en combinacin con la tabla para ayudar en la eleccin del contraste de significacin adecuado. Se
pretende que slo sea una gua y no debera usarse a ciegas. Esto es, una vez
que el diagrama haya indicado qu contraste o contrastes son ms adecuados
para una situacin experimental dada, el analista debe familiarizarse con los
principios del contraste seleccionado, las razones para su seleccin, cualquier
limitacin sobre su validez, etc. Slo as se aplicarn adecuadamente los resultados del contraste en todos los casos. Por ejemplo, muchos contrastes no
paramtricos no son tan potentes como los paramtricos en las condiciones
en que son adecuados los ltimos, pero pueden ser ms fiables en las situaciones en las que se conocen o sospechan desviaciones serias de la distribucin normal.
En el diagrama se utiliza cf. como abreviatura de comparacin de. El
nmero del contraste se refiere a la tabla. Los mtodos robustos no se han
incluido ni en la tabla ni en el diagrama. A pesar de su creciente importancia, an se aplican habitualmente en mayor grado por investigadores y estadsticos expertos que por la mayor parte del personal de laboratorio, y los
paquetes informticos bsicos referidos en el Captulo 1 no proporcionan un
tratamiento muy amplio de tales mtodos. Es importante hacer constar que
el ANOVA es, con mucho, un mtodo ampliamente utilizado, dependiendo
del problema a resolver la forma de su uso exacto: nicamente se proporciona en la tabla la primera referencia del ANOVA de un factor. Tambin se
han omitido, por simplicidad, el contraste de Cochran (Seccin 4.11) y el
mtodo de la menor diferencia significativa (Seccin 3.9) utilizado en combinacin con el ANOVA, yel contraste de rachas de Wald-Wolfowitz (Seccin
6.4). La lnea a trazos que relaciona a los contrastes 6 y 8 es un recordatorio
de que, estrictamente hablando, se deber aplicar el contraste F antes que el
t para comprobar si son similares las varianzas de dos muestras bajo estudio.
Algunos de los contrastes expuestos como comparacin de medias realmente comparan medianas; esto, en aras de la claridad, tambin se ha omitido.
Por ltimo, resulta importante hacer constar que adems de los contrastes expuestos anteriormente existen muchos contrastes de uso cotidiano, como puede consultarse en la referencia siguiente.

Bibliografa
Kanji, G. K. 1993. 100 Statistical Tests. Sage Publications, London.

259

APNDICE 2

Tablas estadsticas

Se presentan a continuacin tablas para la conveniencia del lector, y para su


uso en contrastes estadsticos senciiIos, ejemplos y ejercicios descritos en este
libro. Estn presentadas en un formato que es compatible con las necesidades de los qumicos analticos: en la mayor parte de los casos se ha utilizado
el nivel de significacin P = 0.05 Y se supone que el nmero de medidas disponible es suficientemente pequea. La mayor parte de estas tablas abreviadas han sido tomadas, con permiso, de Elementary Statistics Tables,
de Henry R. Neave, publicado por Routledge (Tablas A.2-A.4, A. 7, A.B,
A.ll-A.14). Se remite a estas fuentes al lector que requiera datos estadsticos
correspondientes a niveles de significacin y/o nmeros de medidas no contemplados en las tablas.
Tabla A.1.

La funcin de distribucin (acumulada) normal estndar f{l).

0.00

0.01

-3.4
-3.3
-3.2
-3.1
-3.0

0.0003
0.0005
0.0007
0.0010
0.0013

0.0003 0.0004
0.0005 0.0005
0.0007 0.0007
0.0010 0.0010
0.0014 0.0014

0.0004 0.0004 0.0004 0.0004 0.0004 0.0005


0.0005 0.0006 0.0006 0.0006 0.0006 0.0006
0.0008 0.0008 0.0008 0.0008 0.0009 0.0009
0.0011 0.0011 0.0011 0.0012 0.0012 0.0013
0.0015 0.0015 0.0016 0.0016 0.0017 0.0018

-2.9
-2.8
-2.7
-2.6
-2.5

0.0019
0.0026
0.0035
0.0047
0.0062

0.0019 0.0020
0.0026 0.0027
0.0036 0.0037
0.0048 0.0049
0.0064 0.0066

0.0021 0.0021
0.0028 0.0029
0.0038 0.0039
0.0051 0.0052
0.0068 0.0069

-2.4.
-2.3
-2.2
-2.1
-2.0

0.0082
0.0107
0.0139
0.0179
0.0228

0.0084 0.0087 0.0089 0.0091


0.0110 0.0113 0.0116 0.0119
0.0143 0.0146 0.0150 0.0154
0.0183 0.0188 0.0192 0.0197
0.0233 0.0239 0.0244 0.0250

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09
0.0005
0.0007
0.0009
0.0013
0.0018

0.0022 0.0023 0.0023


0.0030 0.0031 0.0032
0.0040 0.0041 0.0043
0.0054 0.0055 0.0057
0.0071 0.0073 0.0075

0.0024 0.0025
0.0033 0.0034
0.0044 0.0045
0.0059 0.0060
0.0078 0.0080

0.0094
0.0122
0.0158
0.0202
0.0256

0.0102 0.0104
0.0132 0.0136
0.0170 0.0174
0.0217 0.0222
0.0274 0.0281

0.0096
0.0125
0.0162
0.0207
0.0262

0.0099
0.0129
0.0166
0.0212
0.0268

262

Tabla A.1.

Continuacin.

000

001

002

003

004

005

006

007

008

009

:J
O-

-1.9
-1.8
-1.7
-1.6
-1.5

0.0287
0.0359
0.0446
0.0548
0.0668

0.0294
0.0367
0.0455
0.0559
0.0681

0.0301
0.0375
0.0465
0.0571
0.0694

0.0307
0.0384
0.0475
0.0582
0.0708

0.0314
0.0392
0.0485
0.0594
0.0721

0.0322
0.0401
0.0495
0.0606
0.0735

0.0329
0.0409
0.0505
0.0618
0.0749

0.0336
0.0418
0.0516
0.0630
0.0764

0.0344
0.0427
0.0526
0.0643
0.0778

0.0351
0.0436
0.0537
0.0655
0.0793

-1.4
-1.3
-1.2
-1.1
-1.0

0.0808
0.0968
0.1151
0.1357
0.1587

0.0823
0.0985
0.1170
0.1379
0.1611

0.0838
0.1003
0.1190
0.1401
0.1635

0.0853
0.1020
0.1210
0.1423
0.1660

0.0869
0.1038
0.1230
0.1446
0.1685

0.0885
0.1056
0.1251
0.1469
0.1711

0.0901
0.1075
0.1271
0.1492
0.1736

0.0918
0.1093
0.1292
0.1515
0.1762

0.0934
0.1112
0.1314
0.1539
0.1788

0.0951
0.1131
0.1335
0.1562
0.1814

-0.9
-0.8
-0.7
-0.6
-0.5

0.1841
0.2119
0.2420
0.2743
0.3085

0.1867
0.2148
0.2451
0.2776
0.3121

0.1894
0.2177
0.2483
0.2810
0.3156

0.1922
0.2206
0.2514
0.2843
0.3192

0.1949
0.2236
0.2546
0.2877
0.3228

0.1977
0.2266
0.2578
0.2912
0.3264

0.2005
0.2296
0.2611
0.2946
0.3300

0.2033
0.2327
0.2643
0.2981
0.3336

0.2061
0.2358
0.2676
0.3015
0.3372

0.2090
0.2389
0.2709
0.3050
0.3409

-0.4
-0.3
-0.2
-0.1
0.0

0.3446
0.3821
0.4207
0.4602
0.5000

0.3483
0.3859
0.4247
0.4641
0.5040

0.3520
0.3897
0.4286
0.4681
0.5080

0.3557
0.3936
0.4325
0.4721
0.5120

0.3594
0.3974
0.4364
0.4761
0.5160

0.3632
0.4013
0.4404
0.4801
0.5199

0.3669
0.4052
0.4443
0.4840
0.5239

0.3707
0.4090
0.4483
0.4880
0.5279

0.3745
0.4129
0.4522
0.4920
0.5319

0.3783
0.4168
0.4562
0.4960
0.5359

0.1
0.2
0.3
0.4
0.5

0.5398
0.5793
0.6179
0.6554
0.6915

0.5438
0.5832
0.6217
0.6591
0.6950

0.5478
0.5871
0.6255
0.6628
0.6965

0.5517
0.5910
0.6293
0.6664
0.7019

0.5557
0.5948
0.6331
0.6700
0.7054

0.5596
0.5987
0.6368
0.6736
0.7088

0.5636
0.6026
0.6406
0.6772
0.7123

0.5675
0.6064
0.6443
0.6808
0.7157

0.5714
0.6103
0.6480
0.6844
0.7190

0.5753
0.6141
0.6517
0.6579
0.7224

0.6
0.7
0.8
0.9
1.0

0.7257
0.7580
0.7881
0.8159
0.8413

0.7291
0.7611
0.7910
0.8186
0.8438

0.7324
0.7642
0.7939
0.8212
0.8461

0.7357
0.7673
0.7967
0.8238
0.8485

0.7389
0.7704
0.7995
0.8264
0.8508

0.7422
0.7734
0.8023
0.8289
0.8531

0.7454
0.7764
0.8051
0.8315
0.8554

0.7486
0.7794
0.8078
0.8340
0.8577

0.7517
0.7823
0.8106
0.8365
0.8599

0.7549
0.7852
0.8133
0.8389
0.8621

1.1
1.2
1.3
1.4
1.5

0.8643
0.8849
0.9032
0.9192
0.9332

0.8665
0.8869
0.9049
0.9207
0.9345

0.8686
0.8888
0.9066
0.9222
0.9357

0.8708
0.8907
0.9082
0.9236
0.9370

0.8729
0.8925
0.9099
0.9251
0.9382

0.8749
0.8944
0.9115
0.9265
0.9394

0.8770
0.8962
0.9131
0.9279
0.9406

0.8790
0.8980
0.9147
0.9292
0.9418

0.8810
0.8997
0.9162
0.9306
0.9429

0.8830
0.9015
0.9177
0.9319
0.9441

1.6
1.7
1.8
1.9
2.0

0.9452
0.9554
0.9641
0.9713
0.9772

0.9463
0.9564
0.9649
0.9719
0.9778

0.9474
0.9573
0.9656
0.9726
0.9783

0.9484
0.9582
0.9664
0.9732
0.9788

0.9495
0.9591
0.9671
0.9738
0.9793

0.9505
0.9599
0.9678
0.9744
0.9798

0.9515
0.9608
0.9686
0.9750
0.9803

0.9525
0.9616
0.9693
0.9756
0.9808

0.9535
0.9625
0.9699
0.9761
0.9812

0.9545
0.9633
0.9706
0.9767
0.9817

2.1
2.2
2.3
2.4
2.5

0.9821
0.9861
0.9893
0.9918
0.9938

0.9826
0.9864
0.9896
0.9920
0.9940

0.9830
0.9868
0.9898
0.9922
0.9941

0.9834
0.9871
0.9901
0.9925
0.9943

0.9838
0.9875
0.9904
0.9927
0.9945

0.9842
0.9878
0.9906
0.9929
0.9946

0.9846
0.9881
0.9909
0.9931
0.9948

0.9850
0.9884
0.9911
0.9932
0.9949

0.9854
0.9887
0.9913
0.9934
0.9951

0.9857
0.9890
0.9916
0.9936
0.9952

"O

ro,

"

ro

t\:)

Tabla A.1.

Continuacin.

0.00

0.01

0.02

263
0.03

0.04

0.05

0.06

0.07

0.08

0.09

2.6
2.7
2.8
2.9
3.0

0.9953
0.9965
0.9974
0.9981
0.9987

0.9955
0.9966
0.9975
0.9982
0.9987

0.9956
0.9967
0.9976
0.9982
0.9987

0.9957
0.9968
0.9977
0.9983
0.9988

0.9959
0.9969
0.9977
0.9984
0.9988

0.9960
0.9970
0.9978
0.9984
0.9989

0.9961
0.9971
0.9979
0.9985
0.9989

0.9962
0.9972
0.9979
0.9985
0.9989

0.9963
0.9973
0.9980
0.9986
0.9990

0.9964
0.9974
0.9981
0.9986
0.9990

3.1.
3.2
3.3
3.4

0.9990
0.9993
0.9995
0.9997

0.9991
0.9993
0.9995
0.9997

0.9991
0.9994
0.9995
0.9997

0.9991
0.9994
0.9996
0.9997

0.9992
0.9994
0.9996
0.9997

0.9992
0.9994
0.9996
0.9997

0.9992
0.9994
0.9996
0.9997

0.9992
0.9995
0.9996
0.9997

0.9993
0.9995
0.9996
0.9997

0.9993
0.9995
0.9997
0.9998

Tabla A.2.

La distribucin t.

Valor de t para un intervalo de confianza de


Valor cr/tico de I ti para valores de P de nmero
de grados de Itbertad

90%

95%

98%

99%

0.10

0.05

0.02

0.01

1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
30
50

6.31
2.92
2.35
2.13
2.02
1.94
1.89
1.86
1.83
1.81
1.78
1.76
1.75
1.73
1.72
1.70
1.68
1.64

12.71
4.30
3.18
2.78
2.57
2.45
2.36
2.31
2.26
2.23
2.18
2.14
2.12
2.10
2.09
2.04
2.01
1.96

31.82
6.96
4.54
3.75
3.36
3.14
3.00
2.90
2.82
2.76
2.68
2.62
2.58
2.55
2.53
2.46
2.40
2.33

63.66
9.92
5.84
4.60
4.03
3.71
3.50
3.36
3.25
3.17
3.05
2.98
2.92
2.88
2.85
2.75
2.68
2.58

CfJ

Los valores crticos de Iti son adecuados para un contraste de dos colas. Para
un contraste de una cola el valor se toma de la columna para dos veces el
valor de P deseado, es decir, para un contraste de una cola, P = 0.05,
S grados de libertad, el valor crtico se lee de la columna P = 0.10 Y es igual
a 2.02.

:J>

'"d
ro,
::l

o..
:;.
ro
l'-:)

264

:J>

'O
ro,

Valores crticos de Fpara un contraste de una cola (P = 0.05).

Tabla A.3.

V,

V2

:l

10

12

15

20

1
2
3
4
5

161.4
18.51
10.13
7.709
6.608

199.5
19.00
9.552
6.944
5.786

215.7
19.16
9.277
6.591
5.409

224.6
19.25
9.117
6.388
5.192

230.2
19.30
9.013
6.256
5.050

234.0
19.33
8.941
6.163
4.950

236.8
19.35
8.887
6.094
4.876

238.9
19.37
8.845
6.041
4.818

240.5
19.38
8.812
5.999
4.772

241.9
19.40
8.786
5.964
4.735

243.9
19.41
8.745
5.912
4.678

245.9
19.43
8.703
5.858
4.619

248.0
19.45
8.660
5.803
4.558

6
7
8
9
10

5.987
5.591
5.318
5.117
4.965

5.143
4.737
4.459
4.256
4.103

4.757
4.347
4.066
3.863
3.708

4.534
4.120
3.838
3.633
3.478

4.387
3.972
3.687
3.482
3.326

4.284
3.866
3.581
3.374
3.217

4.207
3.787
3.500
3.293
3.135

4.147
3.726
3.438
3.230
3.072

4.099
3.677
3.388
3.179
3.020

4.060
3.637
3.347
3.137
2.978

4.000
3.575
3.284
3.073
2.913

3.938
3.511
3.218
3.006
2.845

3.874
3.445
3.150
2.936
2.774

11
12
13
14
15

4.844
4.747
4.667
4.600
4.543

3.982
3.885
3.806
3.739
3.682

3.587
3.490
3.411
3.344
3.287

3.357
3.259
3.179
3.112
3.056

3.204
3.106
3.025
2.958
2.901

3.095
2.996
2.915
2.848
2.790

3.012
2.913
2.832
2.764
2.707

2.948
2.849
2.767
2.699
2.641

2.896
2.796
2.714
2.646
2.588

2.854
2.753
2.671
2.602
2.544

2.788
2.687
,2.604
2.534
2.475

2.719
2.617
2.533
2.463
2.403

2.646
2.544
2.459
2.388
2.328

16
17
18
19
20

4.494
4.451
4.414
4.381
4.351

3.634
3.592
3.555
3.522
3.493

3.239
3.197
3.160
3.127
3.098

3.007
2.965
2.928
2.895
2.866

2.852
2.810
2.773
2.740
2.711

2.741
2.699
2.661
2.628
2.599

2.657
2.614
2.577
2.544
2.514

2.591
2.548
2.510
2.477
2.447

2.538
2.494
2.456
2.423
2.393

2.494
2.450
2.412
2.378
2.348

2.425
2.381
2.342
2.308
2.278

2.352
2.308
2.269
2.234
2.203

2.276
2.230
2.191
2.155
2.124

V1 =

nmero de grados de libertad del numerador y V2

o..
f)'

ro

t\:)

nmero de grados de libertad del denominador.

Valores crticos de Fpara un contraste de dos colas (P = 0.05).

Tabla A.4.
V2

265

:t>

V1

10

12

15

20

'O
m,

_.

::l
P()

1
2
3
4
5

647.8
38.51
17.44
12.22
10.01

799.5
39.00
16.04
10.65
8.434

864.2
39.17
15.44
9.979
7.764

899.6
39.25
15.10
9.605
7.388

921.8
39.30
14.88
9.364
7.146

937.1
39.33
14.73
9.197
6.978

948.2
39.36
14.62
9.074
6.853

956.7
39.37
14.54
8.980
6.757

963.3
39.39
14.47
8.905
6.681

968.6
39.40
14.42
8.844
6.619

976.7
39.41
14.34
8.751
6.525

984.9
39.43
14.25
8.657
6.428

993.1
39.45
14.17
8.560
6.329

6
7
8
9
10

8.813
8.073
7.571
7.209
6.937

7.260
6.542
6.059
5.715
5.456

6.599
5.890
5.416
5.078
4.826

6.227
5.523
5.053
4.718
4.468

5.988
5.285
4.817
4.484
4.236

5.820
5.119
4.652
4.320
4.072

5.695
4.995
4.529
4.197
3.950

5.600
4.899
4.433
4.102
3.855

5.523
4.823
4.357
4.026
3.779

5.461
4.761
4.295
3.964
3.717

5.366
4.666
4.200
3.868
3.621

5.269
4.568
4.101
3.769
3.522

5.168
4.467
3.999
3.667
3.419

11
12
13
14
15

6.724
6.554
6.414
6.298
6.200

5.256
5.096
4.965
4.857
4.765

4.630
4.474
4.347
4.242
4.153

4.275
4.121
3.996
3.892
3.804

4.044
3.891
3.767
3.663
3.576

3.881
3.728
3.604
3.501
3.415

3.759
3.607
3.483
3.380
3.293

3.664
3.512
3.388
3.285
3.199

3.588
3.436
3.312
3.209
3.123

3.526
3.374
3.250
3.147
3.060

3.430
3.277
3.153
3.050
2.963

3.330
3.177
3.053
2.949
2.862

3.226
3.073
2.948
2.844
2.756

16
17
18
19
20

6.115
6.042
5.978
5.922
5.871

4.687
4.619
4.560
4.508
4.461

4.077
4.011
3.954
3.903
3.859

3.729
3.665
3.608
3.559
3.515

3.502
3.438
3.382
3.333
3.289

3.341
3.277
3.221
3.172
3.128

3.219
3.156
3.100
3.051
3.007

3.125
3.061
3.005
2.956
2.913

3.049
2.985
2.929
2.880
2.837

2.986
2.922
2.866
2.817
2.774

2.889
2.825
2.769
2.720
2.676

2.788
2.723
2.667
2.617
2.573

2.681
2.616
2.559
2.509
2.464

"1

= nmero de grados de libertad del numerador y "2 = nmero de grados de libertad del denominador.

Tabla A.5. Valores crticos de Q (P = 0.05) para


un contraste de dos colas.
Tamao de muestra

Valor crtico

4
5
6
7

0.831
0.717
0.621
0.570

Tomados de King. E. P. 1958. J. Am. Statlst. Assoc., 48:531.

m
t\:)

266

Tabla A.5. Valores crticos de G (P = 0.05) para


un contraste de dos colas.
Tamao de muestra

Valor crtico

3
4
5
6
7
8
9
10

1.155
1.481
1.715
1.887
2.020
2.126
2.215
2.290

Tomados de Out/iers in Statistical data, Vic Barnett and


Toby Lewis, 2nd Edition, 1984, John Wiley & Sons Limited.

Tabla A.7.

Valores crticos de )(2 (P = 0.05).

Nmero de grados de libertad

1
2
3
4
5
6

7
8
9
10

Valor crtico

3.84
5.99
7.81
9.49
11.07
12.59
14.07
15.51
16.92
18.31

Tabla A.B.
02484
83680
37336
04060
62040

Nmeros aleatorios.

88139
56131
63266
46030
01812

31788
12238
18632
23751
46847

35873
68291
79781
61880
79352

267

63259
95093
09184
40119
42478

99886
07362
83909
88098
71784

20644
74354
77232
75956
65864

41853
13071
57571
85250
84904

41915
77901
25413
05015
48901

02944
63058
82680
99184
17115

96417
42293
31378
27098
66527

63336
29755
35714
38959
73898

88491
24119
00941
49721
66912

73259
62125
53042
69341
76300

21086
33717
99174
40475
52782

51932
20284
30596
55998
29356

32304
55606
67769
87510
35332

45021
33308
59343
55523
52387

61697
51007
53193
15549
29194

73953
68272
19203
32402
21591

61621
18798
36864
10346
20582

52967
99633
66460
28822
49576

40644
32948
87303
51891
91822

91293
49802
13788
04097
63807

80576
40261
04806
98009
99450

67485
35555
31140
58042
18240

88715
76229
75253
67833
70002

45293
00486
79692
23539
75386

59454
64236
47618
37668
26035

76218
74782
20024
16324
21459

12023
48255
92956
87300
69101

82328
20815
09401
04729
21192

54810
51322
58892
57966
00256

64766
04936
59686
95672
81645

58954
33413
108Q9
49036
48500

76201
43128
89780
24993
73237

78456
21643
57080
69827
95420

98467
90674
82799
67637
98974

34166
98858
70178
09472
36036

84186
26060
40399
63356
21781

22084
28000
41662
91398
46560

03117
44301
20930
16841
00597

96937
40028
32856
51399
84561

86176
88132
91566
82654
42334

80102
07083
64917
00857
06695

48211
50818
18709
21068
26306

61149
09104
79884
94121
16832

71246
92449
44742
39197
63140

19993
27860
18010
27752
13762

79708
90196
11599
67308
15598

Tabla A.9.
4
5
6
7
8
9

10
11
12
13
14
15

El contraste de signos.

0.063
0.031
0.016
0.008
0.004
0.002
0.001
0.001
0.000
0.000
0.000
0.000

0.313
0.188
0.109
0.063
0.035
0.020
0.011
0.006
0.003
0.002
0.001
0.000

0.688
0.500
0.344
0.227
0.144
0.090
0.055
0.033
0.019
0.011
0.006
0.004

0.656
0.500
0.363
0.254
0.172
0.113
0.073
0.046
0.029
0.018

0.637
0.500
0.377
0.274
0.194
0.133
0.090
0.059

0.623
0.500
0.387
0.290
0.212
0.151

0.613
0.500
0.395
0.304

0.605
0.500

La tabla utiliza la distribucin binomial con P = 0.5 para las probabilidades de r xitos o menos
para n = 4-15. Estos valores corresponden a un contraste de signos de una cola y deberan ser
duplicados para un contraste de dos colas.

:J>

"O

ro,

_.

o.(")

ro

!'.:l

268

:J>

Tabla A.10.
N

El contraste de rachas de Wald-Wolfowitz.

A P = 0.05, el nmero de rachas es significativo si es:

'

ro~

Menor que

Mayor que

O-

(So

ro

12-20

NA

t\.)

3
3

6-14
15-20

3
4

NA
NA

4
4
4
4

5-6
7
8-15
16-20

3
3
4
5

8
NA
NA
NA

5
5
5
5
5

5
6
7-8
9-10
11-17

3
4
4
4
5

9
9
10
NA
NA

6
6
6
6

6
7-8
9-12
13-18

4
4
5
6

10
11
12
NA

7
7
7
7

7
8
9
10-12

4
5
5
6

12
12
13
13

8
8
8
8

8
9
10-11
12-15

5
6
6
7

13
13
14
15

Adaptada de Swed, F. S. e Eisenhart, C. 1943. Ann Math. Statisl, 14:66.


El contraste no puede ser aplicado a los datos con N, M ms pequeos que los nmeros dados,
o para casos marcados con NA.

Tabla A.11.

El contraste de rangos y signos de Wilcoxon. Valores crticos


para el estadstico del contraste P = 0.05.

Contraste de una cola

5
6
7
8
9
10
11
12
13
14

NA
O
2
3
5
8
10

2
3
5
8
10
13
17
21

13
17
21

25
30

15

Contraste de dos colas

25

La hiptesis nula puede rechazarse cuando el estadstico del contraste sea :(


al valor tabulado. NA indica que el contraste no puede ser aplicado.

Tabla A.12. El contraste de U de Mann-Wihtney. Valores crticos para


U o el menor T; y T a P = 0.05.
n,

fi

3
3
3
3
4
4
4
4
5
5
5
6
6
7

3
4
5
6
4
5
6
7
5
6
7
6
7
7

Contraste de una cola

O
O
1
2
1
2
3
4
4
5
6
7
8
11

Contraste de dos colas

NA
NA
O
1
O
1
2
3
2
3
5
5
6
8

La hiptesis nula puede rechazarse cuando U o el valor de T ms pequeo sea :(


al valor tabulado. NA indica que el contraste no puede ser aplicado.

269

270

Tabla A.13. El coeficiente de correlacin ordinal de Spearman.


Valores crticos de p a P = 0.05.
n
5
6
7

8
9

10
11
12
13
14
15
16
17
18
19
20

Contraste de una cola

Contraste de dos colas

0.900
0.829
0.714
0.643
0.600
0.564
0.536
0.504
0.483
0.464
0.446
0.429
0.414
0.401
0.391
0.380

1.000
0.886
0.786
0.738
0.700
0.649
0.618
0.587
0.560
0.538
0.521
0.503
0.488
0.472
0.460
0.447

Tabla A.14. El contraste de normalidad de Kolmogorov. Valores crticos


para contrastes de una y dos colas a P = 0.05.
n

Contraste de una cola

Contraste de dos colas

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

0.367
0.345
0.319
0.297
0.280
0.265
0.252
0.241
0.231
0.222
0.215
0.208
0.201
0.195
0.190
0.185
0.181
0.176

0.376
0.375
0.343
0.323
0.304
0.288
0.274
0.262
0.251
0.242
0.234
0.226
0.219
0.213
0.207
0.202
0.197
0.192

Los valores adecuados se comparan con la diferencia mxima entre las curvas de
frecuencia acumulada experimental y terica, tal y como se describe en el texto.

Tabla A.15. Valores crticos para


(P = 0.05) para n = 2.
Valor crtico

3
4
5

6
7
8

9
10

0.967
0.906
0.841
0.781
0.727
0.680
0.638
0.602

271

Indice

A
absorbancia, 13, 39, 177, 196-200, 240-241
ajuste de curvas, 141-142, 149-156, 165, 178
aleatoriedad, 183
aleatorizacim, 65, 190-191
American Society for Testing and Materials
(ASTM),8
anlisis
automtico, 112
clnico, 112, 162,216
complexomtrico, 111-112, 169
cualitativo, 1
cuantitativo, 1-3
de componentes principales, 224-227
de conglomerados, 228-232, 243
jerrquico, 231-232
de la varianza (ANOVA), 58-65, 97, 98,
174, 189, 191-194, 195-200, 257-259
aritmtica de los clculos, 62-64
cuadrado medio residual en, 192-194,
198-200
cuadrados medios en, 61-65, 193,
198-201,203
de dos factores, 99, 191-194, 195-200
de un factor, 58-65, 79-80
diferencias significativas en, 62
en clculos de regresin, 141-143, 241
mnima diferencia significativa en, 62
para comparar varias medias, 59-62
suma de cuadrados en, 61-65,
192-194, 198-200
supuestos, 65
trmino de correccin, 197-199
variacin dentro de muestras en,
59-65, 80

variacin entre bloques en, 192-194


variacin entre columnas en, 198-199
variacin entre filas en, 198-199
variacin entre muestras en, 59,
61-65, 80
variacin entre tratamientos, 192-194
variacin total en, 63-66
de la varianza de un factor (ANOVA),
vase anlisis de la varianza.
de tamaos de partculas, 2
de variables cannicas, 236
discriminante, 232-233
discriminante cuadrtico, 234
discriminante lineal, 232-236, 238
enzimtico, 15,205-207, 211-212
exploratorio de datos (AED),
vase anlisis inicial de los datos
(AID).
gravimtrico, 12, 111
inicial de datos (AID) , 5, 17, 150,
159-164
medioambiental, 162
volumtrico, 3, 8-11, 34, 111-112
analizadores centrfugos, 216
antibiticos, 232
astigmatismo, 12

B
barras de error, 136-137
bases de datos, 17, 112
blanco, 11, 114-115, 126-127
bloques, 65, 190-191, 192-194
bondad del ajuste, 183-185, 257-258
British Standards Institution (BSI), 8, 19

274

bureta, 8, 11
bsqueda de la variable alterna, 208-211,
216-217

e
calculadoras, 16, 17, 116, 123, 176
calibracin
inversa, 240-242
multivariante, 239-240
calidad, 77
capacidad del proceso, 83-92
censado de valores en ensayos de
colaboracin, 99
centro
de gravedad ponderado, 137-139
de gravedad, de puntos en grficas de
calibrado, 115, 119
cifras significativas, 33-34, 116, 122
cociente de oro, 208
coeficiente
de correlacin momento-producto, 68,
115-118,131-134,143,175,223
de correlacin mltiple, vase coeficiente
de determinacin.
de correlacin ordinal de Spearman,
174-176, 257-258, 270
de correlacin, vase coeficiente
de correlacin momento-producto.
y coeficiente de correlacin ordinal de
Spearman.
de determinacin, 142-143, 148
ajustado, 142-143, 148
de variacin, vase desviacin estndar
relativa.
colorimetra, 14, 216
combinaciones lineales
de errores aleatorios, 36-37
de errores sistemticos, 39-40
comparacin de un resultado experimental
con otro estndar, 2, 43-45, 52, 163-164,
166-167
de datos por parejas, 49-51,167-168,
257-258
de las desviaciones estndar de dos
conjuntos de datos, 53-55, 257-258
de las medias de dos conjuntos de
datos, 3, 45-49, 169-170, 257-258
de las medias de varios conjuntos de
datos, 59-62, 172-174
computacin natural, 217
concentracin de anticuerpos en suero,
27-28, 157
conglomerados, 221
conjunto
de aprendizaje, 234
de contraste, 234
contraste
bilateral (o de dos colas), 51-52, 118
chi cuadrado, 65-67, 173-175, 183-184,
257-258

de
de
de
de
de
de
de

Cochran, 97, 259


dos colas, vase contraste bilateral.
entereza, 97-98
Friedman, 173-174,257-258
Grubbs, 56-58, 98-99, 257-258, 266
Kruskal-Wallis, 172
rachas de Wald-Wolfowitz, 165-166,
259, 268
de rangos y signos de Wilcoxon, 166-168,
169, 257-258, 269
de rangos y signos, vase contraste rangos
y signos de Wilcoxon.
de Siegel-Tukey, 162, 171,257-258,269
de significacin, 17, 43-71, 162-175, 185,
259
conclusiones de los, 69-71
problemas en el uso secuencial de los,
71
de signos, 163-165, 166, 257-258, 267
de una cola, vase contraste unilateral.
F, 53-55, 62, 71, 80, 100, 142, 171, 194,
198, 204, 257-259, 264-265
Q para valores anmalos vase Q de
Dixon.
rpido de Tukey, 170, 257-258
t, 44-48, 52-53, 55; 66, 118, 145, 160,
163, 185, 257-259, 263
t por parejas, 49-51, 133, 164, 167,
257-258, 263
U de Mann-Whitney, 169-171, 185,
257-258, 269
unilateral (o de una cola), 48, 51-52
correccin de Yates, 67
correlacin, 16
ordinal, vase coeficiente de correlacin
ordinal de Spearman.
cromatografa
gas lquido, 111, 150, 173-174, 216, 232
lquida de alta resolucin, 111, 173-174,
201
cuadrados
latinos, 195
medios, en regresin no lineal, 147-149
cuartil
inferior, 159-160
superior, 159, 161
cuartiles, 160-162

D
daltonismo, 12
datos emparejados, 49-51, 173
delimitador V, 91-92
dendrograma, 230-233
desviacin
absoluta respecto a la mediana (DAM),
181-182
estndar, 16-17,21-27, 29-35, 36-39, 57,
69-70, 83-84, 93, 96, 157, 179,
183-185

de la grfica de calibrado lineal,


120-122, 127, 130
de la pendiente y ordenada en el
origen, 120-122, 127, 130
estndar relativa (DER), 23, 37-39, 94,
139
determinacin
de albumina en suero, 1, 14, 27
de cromo en suero, 11-13
de la concentracin por mtodos de
calibracin, 121, 123-125, 137-140
diagnostico de residuos, 150-151,241
diagrama
de puntos suspensivos, S, 58-59, 159, 160
de Shewhart, 84-90, 92-93
de tallo y hoja, 162
sumactl -(suma acumulada), 89-90
diagramas
de control, 82-92
de curvas de nivel, 209-217
diseo
de bloques aleatorizados, 191
experimental, 11, 13, 15-17, 96, 189-218
factorial, 200-205, 212-214, 216
factorial completo, 200
factorial incompleto, 96, 204
diseos
anidados, 195
de clasificacin cruzada, 195
experimentales de un factor cada vez y
optimizacin, 208-210
factoriales fraccionados, 204
jerarquizados, 195
distancia
de Cook, 151
eucldea, 231
distribucin
binomial, 159-164
contrastes para la, 65, 67-69, 182-184
de medidas repetidas, 23-27
Gaussiana, vase distribucin normal
lag-normal, 27-28, 58, 157
muestral de la media, 29-30,61,69-70
normal, 24-25, 30, 53, 58, 65, 67-69, 97,
126, 157, 164, 166, 178
distribuciones con colas acusadas, 95, 157,
179
doble peso, 182

enmascaramiento, en el contraste de valores


anmalos, 57
ensayos de colaboracin, 14,96-100
error estndar de la media (e.e.m.), 30, 70
errores, vase errores groseros, aleatorios
y sistemticos.
aleatorios, 3-11,13-15,29,43-51,99-101
en clculos de regresin, 120-124,
129, 139
de indicador, 10
de tipo l, en contrastes de significacin,
69-71, 126
de tipo n, en contrastes de significacin,
69-71, 126
en contrastes de significacin, 69-70
groseros, 3, 4, 9, 179
relativos, 23, 37-39
sistemticos, 3-15, 23, 29, 34, 36, 39-40,
43-45,52,99-102,112, 132,168,190,

ZOO
espcimen, 29
espectrometra
de absorcin atmica, 11, 14, 35, 129,
143, 168,216
de emisin, 104, 128
de emisin atmica, 150
de fluorescencia, 37, 59-61, 111, 143,
146-147,189-190,222
de masas, 111
de plasma, 14, 111,128,216
espectroscopa de derivadas, 112
esquemas de pruebas de suficiencia, 15,
92-95, 103, 105
estadstico t, 32-33, 44-45, 71, 81, 263
estandarizacin, 225, 236
estimacin conjunta de la desviacin
estndar, 45-48, 71, 141
eshldios de funcionamiento de mtodos,
96-97
exactitud, 5-6, SS, 112, 145
expresiones multiplicativas,
en la propagacin de errores
aleatorios, 37
en la propagacin de errores
sistemticos, 40
extracto de ensayo, 29

E
ecuaciones polinmicas en el ajuste de
curvas, 141-142, 147
efecto del filtro interno, en fluorimetra, 143,
146
efectos
atmosfricos en la pesada, 9
de la temperatura en anlisis
volumtrico, 10-11
de matriz, 128

factor
controlado, 58-62, 189, 193
de cobertura, 101
incontrolado, vase factor de efecto
aleatorio.
factores
aditivos, en diseo experimental,
195-196, 200
cualitativos, 189
cuantitativos, 189

275

276

de efecto aleatorio, 59, 79, 189, 193


de efecto fijo, vase factores controlados
que afectan a los resultados.
experimentales, 16, 96, 198, 200-205,
213
Fibonacci 207
Fisher, R.A. 192
frecuencia
acumulada, 67-69
curva de, 67-69, 183
en el contraste chi cuadrado, 65-66
esperada, en el contraste chi cuadrado,
65-67
observada, 65-67
funcin
de distancia, 180
de distribucin acumulativa normal
estndar, 26-27, 183-184, 261-263
de influencia, 151
discriminante lineal, 232-236
funciones
a trozos (spline). 149
generales en la propagacin de errores,
38-39
glucosa sangunea, 93
grados de libertad, 32-33, 46-49, 50, 61-65,
83-84,121,141,173-174,185-190,
198-200
grfico
de cajas y bigotes, 161-162
de dos muestras, vase grfico de Youden.
de Youden, 98-100
draftsman, 222
grficos de tanteo, 226-227

H
heterocedasticidad, 135
hiptesis
alternativa, 69, 70
nula, 43-45
histograma, 23, 162
hojas de clculo, 17, 122
homocedasticidad, 135
homogeneidad de la varianza, 65, 97

1
incertidumbre, 7, 33, 40, 77, 94, 101-104
estndar, 101-104
expandida, 101-104
incremento de muestra, 76-81
inmunoensayo, 14, 143, 149, 173
instrumentos inteligentes, 112
interacciones entre factores, 16, 96, 174,
194-200, 203-206
interseccin de dos lneas rectas, 140-141
intervalos de confianza de la media, 30-33,
34-36

K
Kendall, 176

L
Laboratory of the Government Chemist, 14
lmpara de ctodo hueco, 143
lmite
de cuantificacin, 126
. de decisin, 126
de deteccin, 3, 113, 125-127
de determinacin, 127
lmites de confianza de la media, 17, 30-31,
34-36, 81, 83-89, 160
en grficas de calibracin lineal, 113,
124-125, 130, 132-135, 139
lnea
de regresin de x sobre y, 119
de regresin de y sobre x, 119-123, 135
lineas
de accin, en diagramas de control, 83-90
de peligro, en diagramas de control,
83-90
longitud media de racha, 89-92

M
materiales de referencia estndar, 13, 78, 82,
111
matraz aforado, 8-11
matrices superpuestas, 128-129
matriz de confusin, 233
matriz de correlacin, 223
mxima pendiente, mtodo de optimizacin,
211-214
media, 16, 17,21-27,29-35,83-84, 168, 171,
180-181, 183
aritmtica, vase media
del proceso, 83-92
geomtrica, 28, 35-36
intervalo de confianza de la, 35-36
recortada, 179-181
mediana, 94, 158-172, 176-178, 180-182,
257-258
de la tendencia central, 158
medidas de la poblacin, 23-30, 78
mtodo
de abajo arriba para incertidumbre,
101-102
de adiciones estndar, 114, 129-131
de arriba abajo para la incertidumbre,
102
de Herd-Johnson, 68
de k medias, 232
de los K vecinos ms prximos (KVP) ,
236-237
de los mnimos cuadrados, 18, 119, 147,
177-178,182

de Theil para lneas de regresin,


176-178, 182
de vinculacin simple, 230
univariante iterativo, vase bsqueda de
la variable alterna.
mtodos
de calibracin, 3, 8, 13, 17, 111-143, 163,
177-178
de distribucin libre, vase mtodos no
paramtricos.
de interpolacin en regresin no lineal,
150
de Kolmogorov-Smirnov, 68, 183-185,
257-258
de optimizacin simplex modificados,
215
de ordenacin, 166-167
de regresin, 114, 135
de componentes principales, 238,
242-243
de mnimos cuadrados parciales, 239,
242-243
lineal, 16, 51,111-144,164-165,182
mltiple, 237-238
multivariante, 238-239
no lineal, 17, 113, 117-118, 143-150
no paramtricos, 163
para comparar mtodos analticos,
130-134
de regresin no ponderados, 111-135
de regresin ponderados, 114, 135-140,
146
de transformada de Fourier, 112
electroqumicos de anlisis, 111, 129
iterativos, 147, 159
multivariantes, 18, 190, 221-243
no paramtricos, 18, 58, 120, 151,
158-178, 182, 186,257-258
radioqumicos de anlisis, 111
robustos, 58, 151, 157, 178-182, 185,
259
trmicos de anlisis, 111
univariantes en optimizacin, 205-208
microbalanza, 9
microcomputadoras, 12, 112, 158,
162, 176
Microsoft Excel, 17, 19, 27, 45, 47-48, 54,
64, 80, 88-89, 132-133, 142
mnima
diferencia significativa, en ANOVA, 62
mediana de cuadrados (MMC), 182
mnimos
cuadrados iterativamente reponderados,
182
cuadrados parciales, vase mtodos de
regresin.
Minitab, 17, 19, 27, 45, 49, 55, 68, 122, 144,
162, 197-199, 222, 226, 230-233, 235,
240
modelado de clase disjunta, 237
monocromadores, errores sistemticos
debidos a, 12-13

muestra, 29
aleatoria, 79-80
muestreo, 12, 77-79, 103
a granel, 79
de aceptacin, 104-106

277

s'
o..

'

ro
N
Naranja de Metilo, error de indicador debido
a, 11
National1nstitute for Science and
Technology (N1ST), 14
National Physical Laboratory (NPL), 14
nebulizadores, 27
nivel
de calidad aceptable, (NCA) 104-105
de calidad de tolerancia (NCT), 105
niveles
de factores experimentales, 96, 189,
202-206, 214-216
de significacin, 44-45
nudos en funciones a trozos (spline), 149

o
objetos
de aprendizaje, 232
de entrenamiento, 232
optimizacin, 15-16
por el mtodo simplex, 214-217
ordenacin alterna por pares, 171
ordenada en el origen, en grficos de
calibracin lineal, 114, 119, 127-130,
132-135, 176
Organizacin internacional de estndares
(ISO), 5, 56
ortogonalidad, 224

p
papel de probabilidad normal, 67-69, 183
patrn de control de calidad interno (ICC),
82
pendiente de la grfica de calibrado lineal,
114,119-121,127-135,176-177
periodicidad
de signos + y -, 166
efectos en el muestreo, 78
pesada, 7-10
efectos atmosfricos en la, 8-9
por diferencia, 7-10, 39-40
recipiente de, 7
pipeta, 7-10
ponderacin de datos por defecto, 180
ponderaciones, de puntos de regresin
ponderada, 137-140, 146
posiciones empatadas, vase rangos
empatados.
potencia de un contraste estadstico, 70-71,
165, 185

278

precisin, 5, 33, 55, 112, 198


dentro de rachas, 6
entre rachas, 6
presentacin de resultados, 33-34
problemas de especiacin, 132
procesadores de texto, 17
propagacin
de errores al azar, 36-39
de errores sistemticos, 39-41
pseudovalores, 181
punto de ruptura, 182
puntuaciones z, 93-94

Q
Q de Dixon, 55-58, 179, 257, 258, 265
quimiometra, 16, 190

R
rachas de signos + y -, 144, 165-166, 259,
269
rango, 85-89
intercuartlico, 94, 159-161, 179
reconocimiento de pautas, 232
redes neuronales, 217, 242
redondeo de resultados, 33-34, 122
regla de decisin, 226
regresin
curvilineal, vase regresin,
no lineal
de componentes principales, vase
regresin
repetibilidad, 6, 97
rplicas, en diseo experimental, 196
reproducibilidad, 4-6, 97
residuos
de y, en grficas de calibrado, 119, 121,
143-145,147-151, 165-166, 181-182,
238
en clculos de regresin, vase residuos
de y.
resumen de los cinco nmeros, 161
revenido simulado, 216-218

s
secuencias de signos + y -, vase rachas de
signos + y -.
sensibilidad, 127
seal de fondo, vase blanco
sesgo, 4-6, 52, 97-99
en el nmero, 12
SIMCA,237
similaridad en anlisis de conglomerados, 230
sistemas de organizacin de la informacin
del laboratorio (LIMS), 18
solucin de contraste, 29
splines (funciones a trozos) cbicos, 150
suma de cuadrados, en regresin no lineal,
147-149, 180

sumas de rangos, 171-172


superficies de respuesta en optimizacin,
208-209
supuestos utilizados en clculos de
calibracin lineal, 114, 135

T
tabla
de frecuencias, 23-25, 173
de nmeros aleatorios, 78, 191, 217, 267
tendencias, contrastes de significacin para,
164-165
teorema
binomial, 163-164
del lmite central, 30, 157
tolerancias, de material de vidrio y pesas, 8
transformacin logit, 146
transformaciones, en regresin, 146
transmitancia, 39
tratamientos, 190-191
trompeta de Horwitz, 95, 100

u
Unin internacional de qumica pura y
aplicada (rup AC), 23
Unscrambler, The, 18
uso secuencial de contrastes de significacin,
71

v
validacin cruzada, 234-235, 238
valor
asignado, 94
objetivo, en diagramas de control, 82-93
valores
anmalos, 3, 55-58, 94, 98-99, 158-160,
179-181, 185
en la regresin, 150-152, 177-178, 182
crticos en contrastes estadsticos, 44-45
de P, 44-45
de z, 26-27, 31
vallas, 161
Vamstat, 18
variable normal estndar, 26-27, 183-184
variables latentes, 228
varianza, 18,22-23,36-38,53-54,81,97,99,
180, 194, 203
en la medida, 79-81
muestral, 79-81
vector de datos, 221-222
vidrio volumtrico, 8-11

w
Winsorizacin, 181

y
Yates, 67, 203

Vous aimerez peut-être aussi