Académique Documents
Professionnel Documents
Culture Documents
Hall
---
James N. Miller
Jane C. Miller
I
,
ESTADSTICA Y QUIMIOMETRA
PARA QUMICA ANALTICA
,
1
i
1
ESTADSTICA Y QUIMIOMETRA
PARA QUMICA ANALTICA
Cuarta edicin
James N. Miller
J ane C. Miller
Traduccin
Carlos Mat ]imnez
Profesor Propio de Estadstica
Escuela Tcnica Superior de Ingeniera - Le.A.L
Universidad Pontificia Comillas de Madrid
Prentice
---Hall
Madrid. Mxico. Santaf de Bogot. Buenos Aires. Caracas. Lima. Montevideo. San Juan
San Jos. Santiago. Sao PauIo White PIains
Pginas: 296
MILLER, N. J. y MILLER, J. C.
ESTADSTICA y QUIMIOMETRA PARA QUMICA ANALTICA
ISBN: 84-205-3514-1
Depsito legal: M.29.356-2002
PRENTlCE HALL es un sello editorial autorizado de PEARSON EDUCACIN. S.A.
Traducido de:
Contenido
lX
Xl
Agradecimientos
Glosario de smbolos
1.
2.
Xlll
xv
Introduccin.....................................................................................
1.1. Los problemas analticos
1
1
2
3
7
11
15
16
19
19
21
21
23
27
28
29
30
32
33
34
2.4.
2.5.
2.6.
2.7.
2.8.
2.9.
2.10.
Definicin de muestra
La distribucin muestral de la media
Lmites de confianza de la media para muestras grandes
Lmites de confianza de la media para muestras pequeas..
Presentacin de resultados
Otros usos de los lmites de confianza
Lmites de confianza de la media geomtrica de una distribucin lag-normal
35
vi
()
O
::l
r-t-
ro
::l
o:.
O
3. Contrastes de significacin
3.1.
3.2.
Introduccin.............................................................................
Comparacin de una media experimental con un valor conocido
3.3. Comparacin de dos medias experimentales
3.4. El contraste t para datos emparejados
3.5. Contrastes de una y dos colas
3.6. El contraste F para la comparacin de desviaciones estndar.
3.7. Datos anmalos
3.8. Anlisis de la varianza
3.9. Comparacin de varias medias
3.10. La aritmtica de los clculos ANOVA
3.11. El contraste chi-cuadrado
3.12. El contraste de la normalidad de una distribucin
3.13. Conclusiones a partir de los contrastes de significacin
Bibliografa
;...................
Ejercicios
4.
5.
36
39
40
41
43
43
43
45
49
51
53
55
58
59
62
65
67
68
71
72
77
77
78
79
81
82
82
84
86
88
92
96
100
104
106
106
111
111
113
115
119
120
123
125
127
5.9.
6.
7.
.. 157
6.1. Introduccin
6.2. La mediana: anlisis inicial de los datos
6.3. El contraste de los signos
6.4. El contraste de rachas de Wald-Wolfowitz
6.5. El contraste de rangos y signos de Wilcoxon
6.6. Contrastes simples para dos muestras independientes
6.7. Contrastes no paramtricos para ms de dos muestras
6.8. Correlacin ordinal
6.9. Mtodos de regresin no paramtricos
6.10. Mtodos robustos
6.11. Mtodos de regresin robustos
6.12. El contraste de la bondad del ajuste de Kolmogorov
6.13. Conclusiones
Bibliografa
Ejercicios
.
..
.
.
..
.
..
.
.
.
..
..
..
.
.
.. 189
7.1.
7.2.
7.3.
7.4.
7.5.
7.6.
7.7.
7.8.
7.9.
Introduccin
.
.
Aleatorizacin y formacin de bloques
ANOVA de dos factores
.
..
Cuadrados latinos y otros diseos
Interacciones
.
El diseo factorial frente al de un factor cada vez
.
.
Diseo factorial y optimizacin
Optimizacin: principios bsicos y mtodos univariantes ..
Optimizacin utilizando el mtodo de bsqueda de la variable alterna
.
..
7.10. Mtodo de la mxima pendiente
7.11. Optimizacin por el mtodo simplex
.
..
7.12. El revenido simulado
Bibliografa
.
,'
.
Ejercicios
8. Anlisis multivariante
8.1.
8.2.
8.3.
8.4.
8.5.
Introduccin
Anlisis inicial
Anlisis de componentes principales
Anlisis de conglomerados <clusters)
El anlisis discriminante
157
158
163
165
166
168
172
174
176
178
182
183
184
185
186
189
190
191
194
195
200
200
204
208
211
213
217
217
218
. 221
.
..
.
..
..
221
222
224
228
232
vii
()
O
~
.-+
ro
o:.
O
viii
()
O
g.
ro
::l
o:.
O
236
237
237
238
238
239
239
242
243
243
244
Apndice 1.
Apndice 2.
Tablas estadsticas
ndice
261
273
Prlogo a la primera
edicin
Aadir otro volumen a los numerosos textos sobre estadstica pudiera parecer una tarea sin excesivas garantas de xito, sin embargo, la realidad es que
muchos cientficos de prestigio ignoran desgraciadamente los mtodos estadsticos ms elementales. Es ms asombroso an que los qumicos analticos,
que practican una de las ciencias ms cuantitativas de todas las existentes,
no estn ms inmunizados que otros contra este peligroso, pero sin lugar a
dudas curable mal. Es de esperar, por lo tanto, que este libro pueda beneficiar a los cientficos analticos que deseen disear y realizar sus experimentos correctamente, as como extraer tanta informacin de los resultados como razonablemente puedan. Pretende tambin ser interesante al creciente
nmero de estudiantes que se especializan en Qumica Analtica, y a los que
utilizan mtodos analticos de forma rutinaria en el trabajo de laboratorio.
Existen otras dos razones que nos han animado a escribir este libro. Una
es el enorme impacto de la microelectrnica, en forma de microcomputadoras y calculadoras de bolsillo, sobre la estadstica: estos aparatos han resuelto
los problemas que planteaban los procedimientos analticos difciles a todos
los cientficos prcticos. La segunda es el rpido desarrollo de nuevos procedimientos quimiomtricos, incluyendo el reconocimiento de pautas, optimizacin, tcnicas de filtrado numrico, simulaciones y otros, todos ellos factibles por las ventajas que aportan las computadoras.
El ltimo captulo de este libro intenta dar al lector al menos una introduccin del potencial de algunos de estos mtodos estadsticos ms novedosos. No se ha incluido, sin embargo, ningn programa de computador en el
libro -en parte debido a las dificultades de presentar programas que puedan
ejecutarse en todos los tipos populares de microcomputadoras, y en parte debido a la existencia de una cantidad sustancial de libros y programas de computador adecuados y disponibles al pblico.
lo.
La disponibilidad de este tremendo potencial de clculo, hace que de forma natural el cientfico aplique mtodos estadsticos de manera racional y
correcta. Al limitar la extensin de este libro y recalcar su sesgo prctico, no
hemos intentado mostrar con detalle las bases tericas de los contrastes estadsticos descritos. No obstante, hemos intentado aclarar al analista aquellos
contrastes que son apropiados a los tipos de problemas con que probablemente se encuentre en el laboratorio. En el texto hay ejemplos resueltos, y
al final de cada captulo ejercicios para el lector. Muchos de ellos estn basados en los datos proporcionados por trabajos de investigacin publicados
en The Analyst. Nuestro profundo agradecimiento a Mr. Phil Weston, editor,
por permitirnos hacer uso de su distinguida revista. Tambin agradecemos a
nuestros colegas, amigos y familia su paciencia durante la preparacin del
libro; al editor de la serie, Dr. Bob Chalmers; y a nuestros editores por su
eficiente cooperacin y consejos.
]. C. Miller
]. N. Miller
abril 1984
Prlogo a la cuarta
edicin
xi
()
::l
.....
ro
::l
o:.
xii
cin as como por los cientficos prcticos. En cada programa los clculos,
por lo menos los ms simples empleados en este libro, resultan fcilmente
accesibles y se presentan de manera simple, encontrndose disponibles muchos textos como introducciones generales al paquete en cuestin. Adems,
en estos programas se encuentran disponibles prestaciones adicionales como
grficos, diagnstico de la regresin, etc.; representando oportunidades para
una mejor y ms elaborada comprensin e interpretacin de los datos. Estas
prestaciones extra se utilizan en algunos ejemplos proporcionados en el
Manual del Profesor, que acompaaba la edicin de nuestro libro la primera
vez. El Manual tambin contiene ideas para las clases y el trabajo de laboratorio, un conjunto completo de figuras para emplearlas como transparencias
(OHP masters), as como soluciones detalladas a los ejercicios comprendidos
en este volumen: este texto contiene ahora slo esbozos de soluciones.
Otra rea de evolucin rpida en las ciencias analticas ha sido la relativa
a la calidad de los resultados analticos. Por esta razn, el Captulo 4, que
comprende una serie de tpicos relevantes, se ha escrito sustancialmente de
nuevo y ampliado para esta edicin. Se ha extendido el tratamiento de los
diagramas de control y se ha dado una mayor cobertura a las importantes
reas de los esquemas de ensayo de proficiencia y de los ensayos de colaboracin. Otras reas de la estadstica donde hemos intentado proporcionar
ms detalles son varios aspectos de la regresin y la calibracin, los mtodos
robustos y el tratamiento de las observaciones anmalas, el anlisis exploratorio de datos, el anlisis de la varianza, el diseo de experimentos y la optimizacin. El Apndice 1 se ha refundido para ofrecer mayor asesoramiento
sobre la cuestin crtica del contraste estadstico ms adecuado para utilizarlo en una situacin concreta. La inclusin de ms contrastes de significacin
implica que las tablas estadsticas tambin se hayan expandido. Algunos pocos tpicos que se trataban en ediciones anteriores, pero que tenan una limitada aplicacin prctica, se han omitido para dar espacio a estas nuevas
reas.
Estamos muy agradecidos a muchos lectores, tanto del cuerpo de profesores como del grupo de estudiantes, que de forma continuada nos siguen
proporcionando comentarios y sugerencias constructivos; as como nos sealan errores pequeos y omisiones. Tambin agradecemos a la Royal Society
of Chemistry el permiso para utilizar datos de artculos publicados en The
Analyst. Por ltimo, agradecemos a Alex Seabrook y sus colegas editoriales
en Pearson Education por su perfecta mezcla de experiencia, paciencia y entusiasmo.
James N. Miller
Jane C. Miller
octubre 1999
Agradecimientos
Glosario de smbolos
b
e
_...
i..
xvi
C)
s
Sy/x
Sb
Sa
O"
o..
S(!J/x)W
CJ)
Sxo
SB
O'
CJ)
01
-:
ro
3'cT
O'
CJ)
SXE
S,-Oll'
(J
(J2
o
2
(JI
t
T
TI
W
Wi
X
Xo
Xo
YT 2
Xi
XE
Xw
X2
y
Yw
YB
Z
Introduccin
1.1.
1 Ilg ml- 1 de boro. Si el ensayo diese un resultado positivo se podra decir que
la muestra contiene al menos 11lg ml- 1 de boro (tambin con otra informacin;
vase mas abajo). Para comparar dos muestras de suelo se podran utilizar
aproximaciones cuantitativas mucho ms complejas. Por ejemplo, las muestras
podran estar sujetas a un anlisis de tamaos de partcula, cuyas proporciones se clasificaran de acuerdo con el tamao, en un nmero (por ejemplo, 10
tamaos) de intervalos de tamao de partcula, y se determinara la fraccin
de muestra en cada intervalo. Entonces cada muestra se caracterizara por estos diez datos. Se pueden emplear procedimientos muy complejos (vase el Captulo 8) que proporcionen una valoracin cuantitativa de su similitud.
1.2.
Una vez que se acepta que los estudios cuantitativos jugarn un papel predominante en cualquier laboratorio analtico, tambin se debe aceptar que los
errores que aparezcan en tales estudios son de gran importancia. Nuestro
principio gua ser que no existen resultados cuantitativos de inters si no van
acompaados de alguna estimacin de los errores inherentes a los mismos. Este
principio naturalmente se aplica no solo a la qumica analtica sino a cualquier
campo de estudio donde se obtengan resultados experimentales numricos. Se
pueden examinar rpidamente una serie de ejemplos sencillos donde no solo
se aclara el principio sino que tambin se plantean los tipos de problemas estadsticos que se encontrarn y resolvern en los prximos captulos.
Supngase que un qumico sintetiza un reactivo analtico que considera
que es completamente nuevo. Lo estudia utilizando un mtodo espectromtrico y el compuesto proporciona un valor de 104 (normalmente, muchos de
nuestros resultados se expresarn en unidades cuidadosamente elegidas,
pero en este hipottico ejemplo se pueden utilizar unidades arbitrarias). Revisando la bibliografa, el qumico encuentra que ningn compuesto descubierto hasta el momento ha proporcionado un valor de ms de 100 cuando
se ha estudiado por el mismo mtodo bajo las mismas condiciones experimentales. La pregunta surge de manera natural, ha descubierto en realidad
nuestro qumico un compuesto nuevo? La respuesta a esta pregunta reside,
desde luego, en el grado de confianza en que se puede asignar ese valor experimental de 104. Qu errores estn asociados con l? Si un estudio posterior indica que el resultado es correcto dentro de 2 unidades (arbitrarias),
es decir, el verdadero valor probablemente cae en el intervalo 104 2, entonces es muy probable que se haya caracterizado un nuevo material. No
obstante, si las investigaciones muestran que los errores pueden alcanzar
hasta 10 unidades (es decir, 104 10), entonces es muy probable que el verdadero valor sea, en realidad, menor que 100, en cuyo caso est lejos de ser
cierto el nuevo descubrimiento. En otras palabras, resulta esencial un conocimiento de los errores experimentales (tanto en este caso como en cualquier
otro) para la interpretacin adecuada de los resultados. En trminos estadsticos este ejemplo conllevara la comparacin de los resultados experimentales con un valor supuesto o de referencia: este tema se estudia con detalle en
el Captulo 3.
Una situacin muy habitual es la del analista que realiza varias determinaciones repetidas durante el anlisis de un componente. (El valor y signifi-
1.3.
Tipos de error
[
~
O
O-
e(')
(')
5:
::l
Estudiante
A
B
e
D
Resultados (mI)
10.08
9.88
10.19
10.04
10.11
10.14
9.79
9.98
10.09
10.02
9.69
10.02
10.10
9.80
10.05
9.97
Comentario
10.12
10.21
9.78
10.04
Preciso, sesgado
Impreciso, insesgado
Impreciso, sesgado
Preciso, insesgado
Los resultados obtenidos por el estudiante A presentan dos caractersticas. Primera, todos ellos estn muy prximos uno de otro; todos los resultados caen entre 10.08 y 10.12 mI. En trminos cotidianos se dira que los
resultados son altamente reproducibles. La segunda caracterstica distintiva
de los resultados es que son todos demasiado grandes: en este experimento
(algo inusual) se conoce la respuesta correcta de antemano, 10.00 mI. Resulta evidente que hayan surgido dos tipos de error completamente diferentes
en el experimento de los estudiantes. Primero, existen errores aleatorios:
stos provocan que los resultados individuales difieran uno de otro de manera
que caigan a ambos lados del valor medio (10.10 mI en este caso). Los errores
aleatorios afectan a la precisin, o reproducibilidad, de un experimento.
En el caso del estudiante A queda claro que los errores aleatorios son pequeos, de manera que se dice que los resultados son precisos. Sin embargo,
tambin existen errores sistemticos: stos provocan que todos los resultados sean errneos en el mismo sentido (en este caso todos son demasiado
grandes). El error sistemtico total (ntese que en un experimento dado
pueden existir varias fuentes de error sistemtico, algunos positivos y otros
negativos, vase el Captulo 2) es denominado el sesgo de la medida. En muchos experimentos los errores aleatorios y los sistemticos no se detectan fcilmente con solo observar los resultados, sino que tambin tienen orgenes
muy distintos en cuanto a la tcnica experimental y al equipo utilizado.
Antes de examinar las causas de los errores en este experimento, sin embargo, se pueden analizar brevemente los resultados obtenidos por los estudian-
tes B-D. El estudiante B ha obtenido resultados que contrastan con los del
estudiante A. La media de los cinco resultados (10.01 mI) est muy prxima
al valor verdadero, de manera que no hay evidencia de sesgo. Sin embargo,
la variabilidad de los resultados es muy grande, lo que indica una precisin
insatisfactoria, es decir, errores aleatorios sustanciales. La comparacin de
estos resultados con los obtenidos por el estudiante A muestra claramente
que los errores aleatorios y sistemticos pueden ocurrir independientemente
unos de otros. Esta conclusin se refuerza por los datos de los estudiantes C
y D. El trabajo del estudiante C tiene una precisin pobre (intervalo 9.6910.19 mI) y el resultado promedio (9.90 mI) es sesgado. El estudiante D ha
logrado resultados precisos (intervalo 9.97-10.04 mI) e insesgados (promedio
10.01 mI). La distincin entre errores aleatorios y sistemticos se resume en
la Figura 1.1. utilizando una serie de diagramas de puntos. Este mtodo grfico simple de exposicin de datos, en el que los resultados individuales se
representan como puntos sobre una escala lineal, se utiliza frecuentemente
en el anlisis inicial de los datos (vanse los Captulos 3 y 6).
Resultado
correcto
I!
l.
_1.1
9.70
Figura 1.1.
--
el
te
el
10.00
10.30
Volumen de valorante, mi
titud significativa, es decir, estn suficientemente distantes del verdadero valor de 10.00. Sin embargo, el promedio de los resultados de B (10.01) es muy
exacto, de manera que parece que la inexactitud de los resultados individuales se debe en gran medida a errores aleatorios y no a errores sistemticos.
En contraposicin, todos los resultados individuales del estudiante A, y el
promedio resultante, son inexactos: dada la buena precisin del trabajo de
este estudiante, parece cierto que estas inexactitudes se deban a errores sistemticos. Debe hacerse constar que, pese al planteamiento de muchos diccionarios, exactitud y precisin tienen significados completamente distintos
en el estudio de errores experimentales.
En resumen, la precisin describe errores aleatorios, el sesgo describe
errores sistemticos, y la exactitud, es decir, la proximidad al verdadero
valor de una medida individual o un valor promedio, incorpora ambos
tipos de error.
Aunque se utiliz anteriormente la palabra reproducibilidad como una
definicin aproximada de la precisin, el convenio moderrio establece una cuidadosa distincin entre reproducibilidad y repetibilidad. Se puede aclarar
esta distincin mediante una ampliacin del experimento anterior. Por el camino normal el estudiante A, por ejemplo, realizara las cinco medidas repetidas en una sucesin rpida; pero es muy probable que no tardara ms de
una hora aproximadamente en realizar el ejercicio completo. Utilizara la
misma serie de disoluciones y el mismo material de vidrio a lo largo del experimento, aadira la misma preparacin de indicador a cada matraz de valoracin, y permaneceran iguales la temperatura, humedad y dems condiciones de laboratorio. En tales circunstancias la precisin medida sera la
precisin dentro de rachas: esto se denomina repetibilidad. Sin embargo, supngase, que por alguna razn las valoraciones fueron realizadas por diferentes personas del laboratorio en cinco ocasiones distintas y en diferentes laboratorios, utilizando recipientes de vidrio y preparaciones de indicador
diferentes. En este caso, no sera sorprendente encontrar una gran variabilidad en los resultados. Este conjunto de datos reflejara la precisin entre rachas del mtodo, por ejemplo su reproducibilidad.
Se debe aprender otra leccin del experimento de valoracin. Es fcil
apreciar que los datos obtenidos por el estudiante e son inaceptables, y que
los del estudiante D son los ms aceptables. Sin embargo, en ocasiones puede
ocurrir que haya dos mtodos disponibles para un anlisis concreto, de los
cuales uno de ellos sea preciso pero sesgado, y el otro impreciso pero sin
sesgo. En otras palabras, puede suceder que se tenga que elegir entre los tipos
de resultados obtenidos por los estudiantes A y B respectivamente. Qu tipo
de resultado es preferible? Es imposible dar una respuesta dogmtica a esta
pregunta, ya que en la eleccin del mtodo analtico nos basaremos, en la
prctica, en el coste, facilidad de automatizacin, velocidad del anlisis, y
otros factores que caen fuera de nuestra evaluacin elemental. No obstante,
es importante darse cuenta que un mtodo que se encuentre sustancialmente
libre de errores sistemticos puede an, si es muy impreciso, dar un valor
medio que est (por azar) considerablemente alejado del valor correcto. Por
otra parte un mtodo que es preciso pero sesgado (por ejemplo, el estudiante
A) puede convertirse en otro que sea preciso e insesgado (por ejemplo, el
estudiante D) si se descubren y eliminan los errores sistemticos. Tambin
existirn casos en los que, debido a que las medidas que se obtienen son absolutamente nuevas, no sea factible controlar alguno de los errores
sistemticos. Los errores aleatorios nunca se pueden eliminar, aunque mediante una tcnica cuidadosa se pueden minimizar, y realizando medidas repetidas se puede medir y evaluar su significacin. Los errores sistemticos
pueden eliminarse en muchos casos mediante controles adecuados de nuestra tcnica experimental y de nuestro equipo. En la prxima seccin se contempla esta importante distincin entre los dos principales tipos de error.
Cuando se suministra una muestra a un laboratorio y se requiere determinar la concentracin de uno de sus constituyentes, se estimar sin duda,
o quiz se sabe por experiencia, la extensin con que se presentan los principales errores sistemticos y aleatorios. El cliente que suministra la muestra
puede querer esta informacin resumida en una afirmacin sencilla, aportando el intervalo dentro del cual es razonablemente verosmil que se encuentre la
verdadera concentracin. Este intervalo, el cual se debera dar con una probabilidad (por ejemplo, hay una probabilidad del 95 % que la concentracin
se encuentre entre oo. y ... ), se denomina la incertidumbre de la medida.
Este concepto, cuyos origenes se encuentran en la metrologa fsica, est actualmente ganando en importancia y popularidad en la qumica analtica, y
se analiza con mas detalle en el Captulo 4.
1.4.
2.
Preparacin de una solucin patrn de uno de los reactivos. Esto supone (a) pesar un pesasustancias o recipiente similar que contenga
cierta cantidad de material slido, (b) transferir el material slido a
un matraz aforado y pesar de nuevo el pesasustancias para obtener
por diferencia el peso del slido transferido (pesada por diferencia, y
(c) llenar el matraz con agua destilada hasta el enrase (suponiendo
que se contempla una valoracin en medio acuoso).
Transferir una alcuota del material estndar a un matraz de valoracin con ayuda de una pipeta. Esto supone (a) llenar la pipeta hasta
el enrase adecuado, y (b) vaciar el contenido de manera especfica en
el matraz de valoracin.
3.
cen estos errores aleatorios de pesada cuando se prepare una solucin de una
molaridad dada. En algunos anlisis se utilizan microbalanzas para pesar
cantidades de unos pocos miligramos, sin embargo, los errores de pesada cometidos son slo unos pocos microgramos.
Los errores sistemticos en las pesadas pueden ser apreciables y proceder
de una serie de fuentes establecidas. Entre ellas se incluyen la adsorcin de
humedad en la superficie del recipiente de pesada; los errores provocados al
no permitir que los recipientes calentados se enfrien, antes de pesar, a la misma temperatura de la balanza (este error es especialmente frecuente en gravimetra cuando se pesan crisoles); pesas oxidadas o contaminadas por el
polvo; y el efecto boyante de la atmsfera, que acta de diferente forma sobre
objetos de diferente densidad. Con el fin de lograr un trabajo ms exacto, las
pesas se deben calibrar en relacin a estndares suministrados por cuerpos
estatutarios y autoridades de normativas (vanse los prrafos anteriores). Esta calibracin puede ser muy exacta, por ejemplo, de 0.01 mg para pesadas
en el intervalo de 1 a 10 g. El efecto atmosfrico puede ser importante. Por
ejemplo, una muestra de un lquido orgnico de densidad 0.92 g ml- 1 que
pesa 1.2100 g al aire, pesara 1.2114 g al vaco, implicando una diferencia
superior al 0.1 %. Aparte de usar procedimientos de calibracin, que se discutirn en la prxima seccin, pueden tomarse algunas precauciones experimentales sencillas para minimizar estos errores sistemticos. La pesada por
diferencia (vanse los prrafos anteriores) elimina los errores sistemticos
que proceden, por ejemplo, de la humedad u otros contaminantes en la superficie del recipiente. (Vase tambin la Seccin 2.12.) Si se toman estas
precauciones, los errores producidos en las etapas de la pesada sern mnimos, y es probable que en muchos experimentos volumtricos los errores de
pesada sean despreciables comparados con los que surjan por el uso del equipo volumtrico. De hecho, los mtodos gravimtricos se usan generalmente
para calibrar el material de vidrio volumtrico, pesando (en condiciones estndar) el agua que contenga dicho material.
Los errores aleatorios asociados a los procedimientos volumtricos provienen del uso de material de vidrio. Al llenar un matraz aforado de 250 mI
hasta el enrase, el error (es decir, la distancia entre el menisco y el enrase)
puede ser aproximadamente 0.03 cm en el cuello del matraz de dimetro
de ca. 1.5 cm. ste corresponde a un error en volumen de 0.05 mI, slo un
0.02 % del volumen total del matraz. De igual manera, al llenar una pipeta
de transferencia de 25 mI, el error aleatorio no debera exceder de 0.03 cm
en una caa de 0.5 cm de dimetro; esto proporciona un error en volumen
de aproximadamente 0.006 mI, 0.024 % del volumen total. El error en la lectura de una bureta (graduada en divisiones de 0.1 mI) es quiz de 0.01 a 0.02
mI. Cada valoracin implica dos lecturas (los errores no son simplemente aditivos; vase el Captulo 2); si el volumen de valoracin es aproximadamente
25 mI, el porcentaje de error vuelve a ser muy pequeo. Las condiciones experimentales deberan planificarse de manera que el volumen de valorante
utilizado no sea demasiado pequeo (no menos de 10 mI), ya que de otra
manera los errores seran considerables. (Esta precaucin es anloga a la utilizacin de un compuesto estndar de alto peso molecular para minimizar el
error de pesada.) Aun cuando un anlisis volumtrico suponga varios pasos,
10
y en cada uno de ellos se use una pieza de material de vidrio, resulta evidente
que los errores aleatorios deberan ser pequeos si los experimentos se realizan con cuidado. En la prctica, un buen anlisis volumtrico debera tener
una desviacin estndar relativa (vase el Captulo 2) de no ms del 0.1 %.
Hasta hace poco, tal precisin se alcanzaba en contadas ocasiones en mtodos de anlisis instrumental, y an no es habitual. Los mtodos clsicos pueden proporcionar resultados con desviaciones estndar relativas, tan bajos
como del 0.01 %, cuando se realizan por expertos y se toman todas las precauciones posibles.
Los procedimientos volumtricos incorporan varias fuentes importantes
de error sistemtico. Entre los principales se encuentran los errores de vaciado en el uso de material de vidrio volumtrico, los errores de calibracin
en el material de vidrio, y los errores de indicador. Quiz el error ms frecuente en el anlisis volumtrico rutinario sea no dejar pasar el tiempo suficiente para que una pipeta se vacie adecuadamente, o se estabilice el nivel
del menisco en la bureta. Adems, las pipetas son de dos tipos, las que se
vacan por evacuacin y las de soplado en las que el ltimo lquido remanente debe ser expulsado a la fuerza. Si se confunden los dos tipos, por ejemplo,
soplando en una pipeta de vaciado, se incurrira ciertamente en un craso
error! Los errores por vaciado tienen un efecto sistemtico y otro aleatorio:
el volumen liberado es invariablemente menor que el que debera ser. La
temperatura a la que se realiza un experimento tiene dos efectos. El equipo
volumtrico se calibra convencionalmente a 20 oC, pero la temperatura en un
laboratorio analtico puede diferir con facilidad de sta en varios grados, y
muchos experimentos, por ejemplo los anlisis bioqumicos, se llevan a cabo
en habitaciones fras a ca. de 4 oC. En segundo lugar, la temperatura afecta
tanto al volumen del material de vidrio como a la densidad de los lquidos.
El coeficiente de dilatacin para soluciones acuosas diluidas es aproximadamente del 0.025 % por grado, mientras que para recipientes de vidrio sdico
variar aproximadamente casi un 0.003 % por grado en volumen y para recipientes de vidrio borosilicatado la variacin ser del 0.001 % por grado. Resulta evidente que los cambios en los volmenes del material de vidrio sern
slo importantes en trabajos de muy alta calidad, e incluso slo si la temperatura es muy diferente de 20 oC. Adems, los efectos de la dilatacin de las
disoluciones se autocompensarn en gran parte si todas las soluciones se
mantienen a la misma temperatura. El efecto es mucho ms acusado en soluciones no acuosas.
Los errores de indicador pueden ser muy importantes: quiz ms grandes
que los errores aleatorios en un anlisis volumtrico tpico. Por ejemplo, en
la valoracin de cido clorhdrico 0.1 M con hidrxido sdico 0.1 M, se
espera que el punto final corresponda con un pH de 7. Sin embargo, en la
prctica, se estima utilizando un indicador como el naranja de metilo. En
experimentos diferentes se muestra que esta sustancia cambia de color sobre
un intervalo de pH ca. 3-4. Por lo tanto, si la valoracin se realiza aadiendo
la base al cido, el indicador conducir a un punto final aparente cuando el
pH sea ca. 3.5, es decir, justo antes del verdadero punto final. Es probable
que el error sistemtico que se ocasiona aqu sea del 0.2 %. Si la valoracin
se realiza a la inversa, es decir, aadiendo cido a la base, el punto final in-
1.5.
11
12
resultados alcanzados por cada grupo de qumicos son satisfactorios en trminos de precisin, si bien se pas por alto en varios casos el gran error
sistemtico introducido por la contaminacin. Los errores metodolgicos sistemticos de este tipo son extremadamente comunes: el lavado incompleto
de un precipitado en un anlisis gravimtrico, y el error producido por el
indicador en un anlisis volumtrico (vase la Seccin 1.4) son otros ejemplos bien conocidos.
Otra clase de error sistemtico que se presenta con frecuencia surge cuando se realizan supuestos falsos sobre la exactitud de un instrumento analtico.
Los analistas con amplia experiencia saben demasiado bien que los monocromadores en los espectrmetros se desajustan paulatinamente, de manera que
no son infrecuentes errores de varios nanmetros en las longitudes de onda
seleccionadas, a pesar de que se realicen muchos anlisis fotomtricos sin
efectuar los controles adecuados. Los instrumentos sencillos tales como el
material de vidrio volumtrico, cronmetros, pH-metros y termmetros, pueden presentar todos ellos errores sistemticos sustanciales, si bien una gran
mayora del personal de laboratorio utiliza con regularidad estos instrumentos como si no tuvieran nunca sesgo. Adems, la disponibilidad creciente de
instrumentos controlados por microprocesadores o microcomputadoras ha
reducido al mnimo el nmero de operaciones y el nivel de pericia requerido
a los operadores. En estas circunstancias es irresistible la tentacin de considerar que los resultados de los instrumentos son perfectos, aun cuando tales instrumentos estn sujetos a errores sistemticos (a menos que posean
suficiente inteligencia para poder autocalibrarse; vase la Seccin 1. 7).
Los errores sistemticos no solo surgen de procedimientos y de aparatos;
pueden tambin proceder del sesgo humano. Algunos qumicos padecen de
algn grado de astigmatismo o daltonismo (esto ltimo es mas frecuente entre los hombres que entre las mujeres), que podran provocar errores en las
lecturas de instrumentos y otras observaciones. Varios autores han registrado diferentes tipos de sesgos en el nmero, por ejemplo, una tendencia que
favorezca los nmeros pares sobre los impares, o incluso los dgitos O y 5
sobre otros dgitos, en la presentacin de resultados. Por tanto, queda claro
que las diversas clases de errores sistemticos son un riesgo constante, y a
menudo oculto, para el analista, de manera que para minimizarlos deben
considerarse las sucesivas etapas con sumo cuidado.
Existen diferentes aproximaciones a este problema, y en cada uno de los
procedimientos analticos se debe considerar cualquiera de ellas o todas ellas.
Las primeras precauciones deberan tomarse antes de empezar cualquier trabajo experimental. El analista debera considerar con cuidado cada etapa del
experimento que est a punto de realizar, el aparato que se utilice, el muestreo y el procedimiento analtico que se vaya a adoptar. En esta primera etapa, debera intentar identificar las fuentes probables de error sistemtico, tales como las funciones del instrumento que necesitan calibracin, las etapas
del procedimiento analtico donde los errores tienen mayor probabilidad de
ocurrir. Tambin debe considerar los ensayos que deban efectuarse para verificar los errores sistemticos. Las previsiones de este tipo pueden ser de
gran valor (en la prxima seccin se ver que debe prestarse igual atencin
a las fuentes de error aleatorio) y, normalmente, merece la pena el tiempo
invertido. Por ejemplo, una buena reflexin de este tipo podra haber revelado la posibilidad de que existiera contaminacin en el experimento de determinacin de cromo descrito anteriormente.
La segunda lnea de actuacin contra los errores sistemticos radica en el
diseo del experimento en cada etapa. Ya se ha visto (Seccin 1.4) que la
pesada por diferencia puede eliminar algunos errores sistemticos gravimtricos: puede suponerse que estos errores existen con la misma extensin en
ambas pesadas, de manera que el proceso de sustraccin los elimina. Otro
ejemplo de planificacin experimental previsora lo proporciona el error de
la longitud de onda del espectrmetro descrito anteriormente. Existen dos
procedimientos para determinar la concentracin de una muestra por espectrometra de absorcin. En el primero, la muestra se estudia en una clula
del espectrmetro de 1 cm de camino ptico a una longitud de onda de
400 nm, y la concentracin del componente ensayado se determina a partir
de la ecuacin conocida A = [;he [donde A, f., e y h son, respectivamente, la
absorbancia medida, el valor de referencia aceptado de la absortividad molar
(unidades 1 mol- l cm- l ) del componente ensayado, la concentracin molar de
este analito, y el paso ptico de la clula del espectrmetro (cm)]. Aqu pueden surgir varios errores sistemticos: la longitud de onda podra ser, como
ya se ha comentado, por ejemplo, de 40S nm en vez de 400 nm, con lo cual
el valor de referencia de [; es inadecuado; este valor de [; podra ser incorrecto
en cualquier caso; la escala de absorbancia del espectrmetro podra exhibir
un error sistemtico y el paso ptico de la clula podra no ser exactamente
1 cm. Alternativamente, el analista podra emplear una serie de disoluciones
de la sustancia ensayada de concentracin conocida, y medir la absorbancia
de cada una a 400 nm. (Una de estas soluciones de calibrado sera un blanco,
es decir, contendra todos los reactivos analticos excepto el de la sustancia
que se ensaya.) Entonces, se podran utilizar los resultados para construir un
grfico de calibrado para utilizarlo en el anlisis de la muestra ensayada en
las mismas condiciones experimentales. Esta importante aproximacin al
anlisis instrumental se describe con detalle en el Captulo S. Cuando se utiliza este segundo mtodo, no se requiere el valor de /;, y se anulan los errores
debidos a los desplazamientos de las longitudes de onda, errores de absorbancia e inexactitud del camino ptico, ya que ocurren igualmente en la calibracin y en los experimentos de ensayo. Todas las fuentes principales de error
sistemtico son, slo en principio, eliminadas con tal de que las condiciones
para la muestra y la calibracin sean de hecho equivalentes (por ejemplo, se
supone que la longitud de onda y las escalas de absorbancia no se alteran
durante el experimento).
La ltima y ms efectiva proteccin contra los errores sistemticos quiz
sea el uso de materiales de referencia y mtodos estndar. Antes de comenzar el experimento, se calibra cada componente del aparato mediante un procedimiento adecuado. Ya se ha visto como puede calibrarse el equipo volumtrico mediante el uso de mtodos gravimtricos. De forma anloga, se
puede calibrar la escala de las longitudes de onda del espectrmetro con la
ayuda de fuentes de luz estndar, las cuales tienen lneas de emisin estrechas a longitudes de onda bien establecidas, y las escalas de absorbancia de
los espectrmetros se pueden calibrar con filtros estndar slidos o lquidos.
De manera anloga, muchos componentes de equipos se pueden calibrar de
13
14
manera que sus errores sistemticos se conozcan de antemano. La importancia de este rea de la qumica (y otras ciencias experimentales) se refleja en
el amplio trabajo de organismos como el National Physical Laboratory and
LGC (Laboratory of the Government Chemist), en el Reino Unido, el National Institute for Science and Technology (NIST), en EEUU, y organizaciones similares en otras partes del mundo. Se han escrito volmenes completos
sobre la estandarizacin de tipos concretos de equipos, y una serie de organizaciones comerciales se especializan en la venta de materiales de referencia
estndar.
Si los errores sistemticos se producen en el transcurso de procesos qumicos o como resultado del uso de reactivos impuros, en lugar de producirse
en el equipo, puede usarse una forma de comparacin alternativa, es decir,
la determinacin debe repetirse mediante un procedimiento completamente
independiente. Si se utilizan dos (o ms) mtodos fsicos o qumicos no relacionados al efectuar un anlisis, y si conducen consistentemente a resultados que muestran slo diferencias aleatorias, entonces es razonable suponer
que no estn presentes errores sistemticos significativos. Para que esta aproximacin sea vlida, cada etapa de los dos experimentos tiene que ser independiente. Como en el caso de la determinacin de cromo en suero, no ser
suficiente sustituir la etapa de la espectrometra de absorcin atmica por un
mtodo calorimtrico o por espectrometra de plasma. Los errores sistemticos slo se revelaran alterando adems los mtodos de muestreo, por ejemplo, minimizando o eliminando el uso de jeringas de acero inoxidable. Otro
aspecto importante es que las comparaciones deben hacerse teniendo en
cuenta el intervalo total de concentraciones para el que se usa un procedimiento analtico. Por ejemplo, el mtodo de unin del colorante verde de
bromocresol a proteinas utilizado frecuentemente para la determinacin de
albmina en suero, se correlaciona bien con mtodos alternativos (por ejemplo, inmunolgicos) a niveles normales o altos de albmina, pero cuando los
niveles de albmina son anormalmente bajos (estos son inevitablemente los
casos de mayor inters clnico!) la concordancia entre los dos mtodos es
escasa, y el mtodo del colorante, proporciona en forma consistente (y errnea) concentraciones de albmina ms altas. Las aproximaciones estadsticas
utilizadas en las comparaciones de mtodos se describen con detalle en los
Captulos 3 y 5.
El predominio de los errores sistemticos en el trabajo analtico cotidiano
se puede aclarar por los resultados de los ensayos de colaboracin. Si un
analista experimentado y capaz encuentra 10 ng ml- 1 de un frmaco en una
muestra de orina, es natural pensar que otros analistas obtendran resultados
similares para la misma muestra, y las diferencias slo se deberan a errores
aleatorios. Desafortunadamente, en la prctica esto se encuentra lejos de la
verdad. En muchos ensayos de colaboracin en los que intervienen diferentes laboratorios, cuando se examinan partes alcuotas de una muestra mediante los mismos procedimientos experimentales y los mismos tipos de instrumentos, muestran variaciones en los resultados mucho mayores que las
esperadas de los errores aleatorios. La conclusin ineludible es que en muchos laboratorios no se detectan o corrigen una serie de errores sistemticos,
tanto positivos como negativos. La importancia obvia de esta situacin, con
1.6.
15
16
1.7.
doras de este tipo pueden resultar ms que adecuadas para muchas aplicaciones en laboratorios que realizan investigacin analtica o anlisis de rutina. La nica desventaja radica en la imposibilidad de manejar grandes cantidades de datos.
Las computadoras personales (PCs) se encuentran en la actualidad en todos los laboratorios qumicos. Muchos instrumentos modernos son controlados por PCs, los cuales tambin manejan y dan cuenta de los datos analticos
obtenidos, y muchos cientficos analticos tienen sus propios PCs en sus mesas de trabajo. Los PCs porttiles facilitan la recogida y clculos de datos en
el campo, y son rpidamente transferidos a otros homlogos cuando se regresa al laboratorio. En la actualidad, muchos instrumentos estn desprovistos de controles manuales, debido a que estn totalmente controlados por
PCs acoplados adecuadamente. Otras funciones de los PCs pueden incluir la
comprobacin del rendimiento del instrumento, el diagnstico e informacin
del mal funcionamiento, el almacenamiento de grandes bases de datos (por
ejemplo, de espectros digitalizados) y comparar los datos analticos con bases
de datos, optimizacin de las condiciones de operacin (vase el Captulo 7),
y seleccionar y utilizar una variedad de clculos de calibrado. Una preocupacin es que no siempre se explica al usuario el software del que est provisto el instrumento controlado por la computadora: un analista podra sufrir el infortunio de tener que interpretar una serie de datos, por ejemplo, a
travs de una rutina de calibracin que no estuviese definida y pudiera no
ser siempre apropiada. sta es una situacin indeseable, aunque el deseo de
las compaas de instrumentacin de intentar proteger software especficos
costosos de la pirateria es comprensible.
Se pueden conseguir para PCs abundantes y excelentes programas bsicos de estadstica. En la actualidad, la capacidad de memoria y velocidad de
las computadoras son ms que adecuadas para trabajar con grandes series de
datos, y los PCs estn dotados ordinariamente de procesadores de textos, los
cuales ayudan enormemente a la compilacin de informes analticos y trabajos de investigacin. Tambin son fciles de conseguir los programas de hojas de clculo. stos, aunque fueron inicialmente diseados para clculos
financieros, son ms que adecuados para el trabajo estadstico, poseyendo
muchas funciones estadsticas incorporadas y excelentes posibilidades de
presentacin grfica. La popularidad de las hojas de clculo deriva de su velocidad y simplicidad de uso, y la posibilidad de realizar clculos casi instantneos del tipo que ocurrira si... : por ejemplo, cual sera la media y la
desviacin estndar de una serie de resultados si se sospecha que se han omitido una parte de los datos? Las hojas de clculo se disean para que sea fcil
la introduccin rpida de datos, y los datos en formato de hoja de clculo
pueden exportarse fcilmente a programas estadsticos ms especializados.
Microsoft Excel es la hoja de clculo mas popular y ofrece muchas de las
posibilidades estadsticas que necesitarn muchos lectores de este libro. En
los prximos captulos se proporcionan ejemplos de su aplicacin, y la bibliografa proporciona algunos libros que describen e ilustran su aplicacin a
problemas estadsticos.
Posibilidades de clculo mas avanzadas son proporcionadas por programas estadsticos especializados. Entre ellos, Minitab es muy utilizado en
17
18
centros de educacin y laboratorios de investigacin. Adems de las funciones estadsticas convencionales, ofrece clculos mas avanzados, incluyendo
mtodos multivariantes (vase el Captulo 8), anlisis exploratorio de datos
(AED) y contrastes no paramtricos (vase el Captulo 6), diseo experimental (vase el Captulo 7) y muchos mtodos de control de calidad (vase el
Captulo 4). Tambin se pueden conseguir para PCs excelentes programas
ms especializados para diferentes tipos de anlisis multivariante: el ms conocido es Unscrambler. Versiones nuevas y actualizadas de estos programas,
con posibilidades extra y/o interfaces mejoradas para usuarios, aparecen a
intervalos de tiempo regulares. Aunque se puede acceder a funciones de ayuda en cada caso, es preciso decir que el programa se disea normalmente
para usuarios en vez de estudiantes, por lo que no hace mucho hincapi en
el nfasis tutorial. Sin embargo, el programa VAMSTAT es una herramienta
valiosa; diseado especficamente con propsitos tutoriales, con pruebas en
pantalla para estudiantes y claras explicaciones de muchos mtodos importantes.
Otra de las caractersticas de los PCs que supone una ventaja es la posibilidad de formacin de redes, es decir, un grupo de PCs del mismo laboratorio o de laboratorios prximos pueden conectarse de manera que tanto los
programas como los datos puedan pasar libremente de uno a otro. Un beneficio obvio de dichas redes consiste en el establecimiento de Sistemas de Organizacin de la Informacin del Laboratorio, Laboratory Information Management Systems (LIMS), que permite que sean identificadas y rastreadas
grandes cantidades de especmenes analticos cuando se trasladan por el laboratorio. Mediante cdigos de barras o sistemas similares se identifican las
muestras y se les puede seguir la pista. Los PCs conectados a varios instrumentos envan grupos de resultados analticos a una computadora central
que (por ejemplo) imprime un informe resumen, incluyendo una evaluacin
estadstica.
Es muy importante para el qumico analtico recordar que la disponibilidad de todos estos equipamientos en el manejo de datos aumenta, en vez de
disminuir, la necesidad de un slido conocimiento de los principios en los
que se basan los clculos estadsticos. Una computadora o calculadora realizar con rapidez cualquier clculo o contraste estadstico seleccionado por el
usuario, tanto si ese procedimiento es adecuado o no para los datos en estudio.
Por ejemplo, un programa de mnimos cuadrados lineales determinar una
lnea recta que ajuste cualquier conjunto de valores de x e y, aun en los casos
en que la inspeccin visual muestre de inmediato que dicho programa resulta
completamente inadecuado (vase el Captulo S). En otro ejemplo, un programa sencillo para probar si es significativa la diferencia entre las medias
de dos conjuntos de datos puede suponer que las varianzas (vase el Captulo
2) de los dos conjuntos sean similares; no obstante, el programa realizar a
ciegas el clculo requerido y proporcionar un resultado aun cuando las
varianzas en realidad difieran significativamente. Incluso, series muy completas de programas de computadora suelen ser incapaces de aconsejar en la
eleccin de un mtodo estadstico apropiado para una serie de datos concretos. Por tanto, el analista debe emplear sus conocimientos de estadstica y el
sentido comn para asegurar que se realiza el clculo correcto.
19
Bibliografa
[NB - Los siguientes libros son probablemente valiosos como material soporte para la mayora de los capitulos de este libro.]
Anderson, R. 1. 1987. Practical Statisticsfor Anal,ljtical ChemistrJj. Van Nostrand Reinhold, New York.
British Standards lnstitute. 1987. Schedule for Tables for Use in the Calibratiun ofVolumetric Glassware): [BS1797]. BSl, London. (Valioso ejemplo
de una monografa BSI.)
Diamond, D. and Hanratty, V. C. 1997. Spreadsheet Applications in ChemistrlJ Using Microsoft Excel. Wiley, New York. (Consejos claros del uso de
Excel, con muchos ejemplos de qumica analtica y fsica.)
Meier, P. C. and Zund, R. E. 1993. Statistical Methods in AnallJtical ChemistrlJ. Wiley, New York. (Un texto avanzado, con programas y conjuntos
de datos proporcionados en un disco.)
Middelton, M. R. 1997. Data AnallJsis Using Microsoft Excel, Duxbury, Belmonto (Una gua clara de numerosos procedimientos estadsticos disponibles en Exce1.)
Minitab Reference Manual, Versin 11. June 1996. Minitab lnc, State College,
USA.
Ejercicios
1.
Una muestra patrn de suero sanguneo humano contiene 42.0 g de albmina por litro. Cinco laboratorios (A-E) realizan cada uno seis determinaciones (en el mismo da) de la concentracin de albmina, con los
siguientes resultados (en gl-l):
A
B
e
o
E
42.5
39.8
43.5
35.0
42.2
41.6
43.6
42.8
43.0
41.6
42.1
42.1
43.8
37.1
42.0
41.9
40.1
43.1
40.5
41.8
41.1
43.9
42.7
36.8
42.6
42.2
41.9
43.3
42.2
39.0
20
albmina, esta vez en seis das sucesivos. Los valores obtenidos son 41.5,
40.8, 43.3, 41.9, Y 41. 7 gl- 1. Comentar estos resultados.
3.
Se ha determinado cuatro veces el nmero de lugares de unin por molcula en una muestra de anticuerpos monoclonados, con resultados de
1.95, 1.95, 1.92 Y 1.97. Comentar el sesgo, precisin y exactidud de estos
resultados.
4.
5.
(ii)
(iii)
Estadstica de medidas
repetidas
2.1.
A
B
e
o
Resultados (mI)
10.08
9.88
10.19
10.04
10.11
10.14
9.79
9.98
10.09
10.02
9.69
10.02
10.10
9.80
10.05
9.97
10.12
10.21
9.78
10.04
LX
= -'
(2.1)
22
EJEMPLO 2.1.1
Encontrar la media y la desviacin estndar de los resultados del estudiante A.
Totales
Xi
(Xi - x)
10.08
10.11
10.09
10.10
10.12
50.50
- 0.02
0.01
- 0.01
0.00
0.02
O
IXi
n
x=-=
s=
\
Ntese que
JI
(X; - ,\)2
0.0004
0.0001
0.0001
0.0000
0.0004
0.0010
50.50
5
= - - = 10.1 mi
Varianza
23
El coeficiente de variacin (CV) es otra medida de la variabilidad extensamente utilizada, tambin conocido como la desviacin estndar relativa (DER), que viene definido por lOas/x.
Coeficiente de variacin (CV) = desviacin estndar relativa (DR) = 100 s/x
El CV o DER, cuyas unidades se expresan obviamente en tanto por ciento,
es un ejemplo de error relativo, es decir, una estimacin del error dividida
por una estimacin del valor absoluto de la cantidad medida. Los errores relativos se utilizan con frecuencia al comparar las precisiones de los resultados
que tienen diferentes unidades o magnitudes, y resultan de nuevo importantes en los clculos de la propagacin de errores.
2.2.
0.51
0.53
0.46
0.51
0.50
0.50
0.48
0.49
0.48
0.53
0.51
0.49
0.49
0.50
0.52
0.49
0.50
0.48
0.47
0.52
0.52
0.52
0.49
0.50
0.50
0.53
0.49
0.49
0.51
0.50
0.50
0.49
0.51
0.49
0.51
0.47
0.50
0.47
0.48
0.51
24
Frecuencia
O.~
1
3
5
10
10
13
5
3
0.47
0.48
0.49
0.50
0.51
0.52
0.53
ro
10
QJ
:::3
QJ
u::
0,46
0,48
0,50
0,52
Concentracin de ion nitrato, IIQ ml- 1
Figura 2.1.
=
(J
lk exp [- (x - pfj2c?}
V 2n
(2.3)
25
Figura 2.2.
Figura 2.3. Distribuciones normales con la misma media pero con diferentes valores de la
desviacin estndar (d.e.).
26
y
(i)
i1 - 10 i1 i1 + 10
y
(ii)
x
y
Figura 2.4. Propiedades de la distribucin normal: (i) aproximadamente el 68% de los valores
caen dentro de 16 de la media; (ii) cerca del 95% de los valores se ubican dentro de 26
de la media; (iii) aproximadamente el 99.7% de los valores se encuentran dentro de 36
de la media.
En una distribucin normal con media conocida, /1, y desviacin estndar, (J, la proporcin exacta de valores que caen dentro de un intervalo cualquiera puede encontrarse a partir de las tablas, con tal que los valores se
hayan primero estandarizado, de manera que proporcionen valores z. Esto
se realiza expresando un valor de x en trminos de su desviacin de la media
en unidades de la desviacin estndar, (J. Es decir
(x - /1)
a_b_le_n_o~r_m_a_l_e_s_ta_n_d_a_r_i_za_d_a_,_z_=_ -_-_-_(J~~~ ~
________
v_a_n_
__
EJEMPLO 2.2.1
Si las medidas repetidas de una valoracin se distribuyen de forma normal con media de
10.15 mi y desviacin estndar de 0.02 mi, encuentre la proporcin de medidas que caen
entre 10.12 y 10.20 mI.
.
Estandarizando el primer valor da z= (10.12 - 10.15)/0.02 = -1.5.
De la Tabla A.1, A., -1.5) = 0.0668.
Estandarizando el segundo valor da z= (10.20 - 10.15)/0.02 = 2.5.
De la Tabla A.1, A.,2.5) = 0.9938.
Por tanto, la proporcin de valores entre x = 10.12 Y 10.20 (que se corresponde con
z = -1.5 Y2.5) es 0.9938 - 0.0668 = 0.927.
2.3.
La distribucin log-normal
En situaciones donde una medida se realiza sobre cada uno de una serie de
ejemplares, pueden surgir otras distribuciones adems de la normal. En concreto se encuentra con frecuencia la denominada distribucin log-normal.
En esta distribucin, la frecuencia representada frente al logaritmo de la concentracin (u otras caractersticas) proporciona una curva de distribucin
normal. Un ejemplo de una variable que tiene una distribucin lag-normal
es la concentracin de anticuerpos en suero sanguneo humano. Cuando se
representa la frecuencia frente a la concentracin, se obtiene la curva asimtrica mostrada en la Figura 2.5a. Sin embargo, si se representa la frecuencia
frente al logaritmo (por ejemplo, en base 10) de la concentracin, se obtiene aproximadamente una distribucin normal, como se muestra en la Figura 2.5b. Otro ejemplo de una variable que puede seguir una distribucin
lag-normal es el tamao de partcula de las gotas formadas por los nebulizadores utilizados en espectroscopa de llama.
27
28
(a)
140
120
ro
100
SO
::::l
3!.
60
40
20
o 1--'-'-'---'-r-'-'---L....J'-"-r....................
--'TL...L--'-'---'-r'==----'=---9'"-~";
3
4
Concentracin
c-
(b)
100 1c-
ro
1- ."
~ 50 1o
11-
cc-
LL
o
-0.5
~rJf
rt-h
0.5
Log (concentracin)
El intervalo que contiene un porcentaje concreto de medidas de una variable con distribucin log-normal se puede evaluar trabajando con los logaritmos de los valores. La distribucin de los logaritmos de la concentracin
en suero sanguneo mostrada en la Figura 2.5b tiene media 0.15 y desviacin
estndar 0.20. Esto significa que aproximadamente el 68 % de los valores logartmicos se ubican en el intervalo 0.15 - 0.20 a 0.15 + 0.20, es decir,
- 0.05 a 0.35. Tomando antilogaritmos, el 68 % de las medidas originales se
encuentran en el intervalo 10 00;; a 10:35, es decir de 0.89 a 2.24. El antilogaritmo de la media de los valores a los que se aplica la funcin logartmo,
10 015 = 1.41, proporciona la media geomtrica de la distribucin original
donde la media geomtrica viene dada por ;)X1X2, ... X".
2.4.
Definicin de muestra
29
30
media. Su media es la misma que la media de la poblacin original. Su desviacin estndar se denomina error estndar de la media (e.e.m.). Existe
una relacin matemtica exacta entre el e.e.m. y la desviacin estndar, a,
de la distribucin de medidas individuales:
a/~
(2.5)
Como es de esperar, a mayor n, menor ser el valor del e.e.m. y consecuentemente menor la dispersin de las medias muestrales en torno a /l.
El trmino, error estndar de la media, podra dar la impresin que
alfi mide la diferencia entre y /l. Esto no es as: alfi proporciona una
medida de la variabilidad de
como se ver en la siguiente seccin.
Otra propiedad de la distribucin muestral de la media es que, aun cuando la poblacin original no est distribuida normalmente, la distribucin muestral de la media tiende a la distribucin normal cuando aumenta n. Este
resultado se conoce como teorema del lmite central. Este teorema es de
suma importancia ya que muchos contrastes estadsticos se realizan sobre la
media y suponen que se distribuye en forma normal. Ya que en la prctica
se puede suponer una distribucin casi normal para las distribuciones de medidas repetidas, es razonable asumir que las medias de muestras muy pequeas (digamos> 5) se distribuyan normalmente.
x,
2.6.
(2.6)
31
.t - 1.96cr
/w
.t
.t + 1.96cr
/w
Figura 2.6. La distribucin muestral de la media, mostrando el intervalo dentro del cual
se encuentra el 95% de las medias muestrales.
(En esta ecuacin se utiliza el valor exacto 1.96 en lugar del valor aproximado 2, citado en la Seccin 2.2 .. El lector puede utilizar la Tabla A.l para
comprobar que la proporcin de valores entre z = -1.96 Y z = 1.96 es de
hecho 0.95.)
Sin embargo, en la prctica se dispone habitualmente de una muestra, de
media conocida, y se busca un intervalo para J1, el verdadero valor. La ecuacin (2.6) puede reordenarse y expresarse de la siguiente forma:
x-
x + 1.96((J/~)
(2.7)
La ecuacin (2.7) proporciona el intervalo de confianza al 95 % de la media. Los lmites de confianza al 95% son 1.96((J/~).
En la prctica, es poco probable conocer exactamente (J. Sin embargo,
siempre que la muestra sea grande, (J puede ser sustituida por su estimacin, s.
A veces se utilizan otros lmites de confianza, en particular los lmites de
confianza al 99 y 99.7%.
1.96
2.58
2.97
32
EJEMPLO 2.6.1
Calcular los lmites de confianza de la media al 95% y 99% para las medidas de la concentracin de ion nitrato de la Tabla 2.1.
Se tiene que x = 0.500, 8 = 0.0165 Y n = 50. La ecuacin (2.8) proporciona como lmites
de confianza al 95%:
x 1.968/ J =
0.500
1.96
x 0.0165/
j.lg
ml- 1
0.500
Tabla 2.3.
Grados de libertad
1~,>
20
50
100
2.8.
95%
99%
4.30
2.57
2.23
2.09
2.01
1.98
9.92
4.03
3.17
2.85
2.68
2.63
Presentacin de resultados
33
34
en una concentracin aproximada de 0.1, i.e., 0.001 %. En la prctica es costumbre fijar como cifras significativas todos los dgitos que sean seguros, ms
el primero incierto. Por ejemplo, la media de los valores 10.09, 10.11, 10.09,
10.10, Y 10.12 es 10.102, y su desviacin estndar es 0.01304. Claramente
existe incertidumbre en la segunda cifra decimal; los resultados son todos
10.1 con una cifra decimal, pero difieren en la segunda cifra decimal. Mediante el mtodo sugerido el resultado podra expresarse como:
i s = 10.10 0.01
(n
5)
s =
10.102
0.01 3
(n
5)
donde el uso de los subndices nos indica que el dgito slo se da para evitar
prdida de informacin. El lector podra decidir si fue til o no.
De manera similar, cuando se calculan los lmites de confianza [vase la
ecuacin (2.9)], no es necesario dar el resultado de t n _ 1S
con ms de dos
cifras significativas. El valor de .:C debera darse en ese caso' con el correspondiente nmero de cifras decimales.
El nmero de cifras significativas fijado se utiliza a menudo en lugar de
una estimacin especfica para indicar la precisin de un resultado. Por
ejemplo, si se considera 0.1046 M se quiere indicar que los nmeros de las
tres primeras cifras decimales son seguros pero existen dudas acerca de la
cuarta. A veces se recalca la incertidumbre en la ltima cifra utilizando los
formatos 0.104(6) M o 0.104f) M, pero sigue siendo preferible dar una estimacin especfica de la precisin tal como la desviacin estndar.
Un problema que puede surgir es si un 5 debera redondearse por encima
o por debajo. Por ejemplo, si 9.65 es redondeado a una sola cifra decimal
podra convertirse en 9.6 o 9.7? Es evidente que los resultados tendrn sesgo si un 5 se redondea siempre hacia el valor superior; este sesgo puede evitarse redondeando e15 al nmero par ms prximo, dando, en este caso, 9.6.
Anlogamente, 4.75 se redondea a 4.8.
Cuando hay que utilizar varias cantidades para calcular un resultado final
(vase la Seccin 2.11), estas cantidades no deben redondearse demasiado ya
que se producir una prdida de precisin innecesaria. Una buena regla es
dejar un dgito detrs de la ltima cifra significativa y dejar el posterior redondeo hasta que se llegue al resultado final. La misma regla se aplica cuando se usan la media y la desviacin estndar en contrastes estadsticos tales
como los contrastes F y t (vase el Captulo 3): se deberan utilizar en los
clculos los valores no redondeados de i y s.
/;;Z
2.9.
35
EJEMPLO 2.9.1
Se comprueba la escala de absorbancia de un espectrmetro a una longitud de onda
concreta usando una solucin estndar con una absorbancia de 0.470. Diez medidas de
absorbancia con el espectrmetro dieron x= 0.461 Y s = 0.003. Encontrar el intervalo de
confianza al 95% de la absorbancia media y de aqu decidir si se encuentra presente un
error sistemtico.
Los lmites de confianza al 95% de las absorbancias medidas por el espectrmetro son
[ecuacin (2.9)]:
x /n- MI A
= 0.461
2.26 x 0.03/.)10
= 0.461
0.002
En la prctica el tipo de problema del Ejemplo 2.9.1 se resuelve comnmente de manera diferente pero relacionada (vase el Ejemplo 3.2.1).
Los lmites de confianza tambin se pueden usar cuando se toman medidas a cada uno de una serie de especmenes. Por ejemplo. supngase que se
requiere el peso medio de una pastilla en un gran lote: se consumira excesivo tiempo en pesar cada pastilla. De manera similar, al medir el contenido
medio de hierro utilizando un mtodo analtico destructivo tal como la espectrometra de absorcin atmica, es claramente imposible examinar cada
tableta. En ambos casos, podra tomarse una muestra del lote (que en tales
casos forma la poblacin) y a partir de la media y desviacin estndar de la
muestra se podda encontrar un intervalo de confianza para el valor medio
de la cantidad medida.
2.10.
En la Seccin 2.3 se mencion que las medidas de un nmero de especmenes puede no estar distribuida normalmente. Si proceden de una distribucin
log-normal, entonces los lmites de confianza deberan calcularse teniendo en
cuenta este hecho. Ya que el logaritmo de las medidas se distribuye normalmente es ms exacto trabajar con los logaritmos de las medidas al calcular
un intervalo de confianza. El intervalo de confianza obtenido ser el intervalo de confianza para la media geomtrica.
EJEMPLO 2.10.1
Los siguientes valores (expresados como porcentajes) proporcionan la concentracin de
anticuerpos en suero sanguneo humano de ocho adultos sanos.
2.15,
1.13,
2.04,
1.45,
1.35,
1.09,
0.99,
2.07
36
Calcular el intervalo de confianza de la media geomtrica al 95% suponiendo que la concentracin de anticuerpos se distribuye log-normal.
Los logaritmos (en base 10) de los valores propuestos son:
0.332,0.053,0.310,0.161,0.130,0.037,
-0.004,0.316
La media de estos valores logartmicos es 0.1669, dando 101669 = 1.47 como la media
geomtrica de los valores originales. La desviacin estndar de los valores logartmicos es
0.1365.
Los lmites de confianza al 95% para los valores logartmicos son:
0.1669
2.36
x 0.1365/
2.11.
2.11.1
Combinaciones lineales
donde le, ka' le,,, leo etc., son constantes. La varianza (definida como el cuadrado de la desviacin estndar) tiene la propiedad importante de que la varianza de una suma o diferencia de cantidades independientes es igual a la
suma de sus varianzas. Se puede demostrar que si (J", (J,,, (J" etc., son las desviaciones estndar de a, b y e, etc., entonces la desviacin estndar de Jj, (J'I'
vi.ene dada por:
(2.11)
EJEMPLO 2.11.1
En una valoracin la lectura inicial en una bureta es 3.51 mi y la lectura final es 15.67 mi,
ambas con una desviacin estndar de 0.02 mI. Cul es el volumen de valorante utilizado
y cul es su desviacin. estndar?
Volumen utilizado = 15.67 - 3.51
Desviacin estndar = ,,/(0.02)2
= 12.16 mi
+ (0.02)2
0.028 mi
2.11.2
Expresiones multiplicativas
= kah/ed
(2.12)
(donde a, b, e y d son cantidades medidas independientes y h es una constante) entonces existe una relacin entre los cuadrados de las desviaciones
estndar relativas:
(2.13)
J)
EJEMPLO 2.11.2
El rendimiento cuntico de fluorescencia.
<Po
<p = IJ kc/~f.
donde las cantidades implicadas se definen a continuacin, con una estimacin de sus desviaciones estndar relativas entre parntesis:
37
38
~ =
2.3%
I~;I I = In;/i I
(2.15) I
(El signo del valor absoluto o mdulo significa que la magnitud de la cantidad encerrada en l se toma sin tener en cuenta el signo, por ejemplo,
1- 21 = 2.)
2.11.3.
Otras funciones
Siy es una funcin general de x,y = f(x), entonces las desviaciones estndar
de x e y estn relacionadas por:
(2.16)
39
EJEMPLO 2.11.3
rn
La absorbancia, A, de una solucin viene dada por A = -Iog( Ti donde Tes la transmitancia. Si el valor medido de Tes 0.50tcon una desviacin estndar de 0.001, calcular A y
su desviacin estndar.
(Ji'
Se tiene:
"
(f)
.-+
OJ
o...
.-+
OJ
o...
ro
Tambin:
3ro
o...
o:.
OJ
(f)
SA =
'""\
ro
ro
.-+
'U
Es interesante hacer constar que para este mtodo experimental ampliamente utilizado se pueden encontrar las condiciones para que sea mnima la
desviacin estndar relativa (RSD). La desviacin estndar relativa (DER)
de A viene dada por:
DER de A
1000"AlA =
1000"Tlog e
1
T og 'I'
2.12.
Las reglas para la combinacin de errores sistemticos pueden dividirse tambin en tres grupos.
2.12.1.
Combinaciones lineales
(2.17)
Recurdese que los errores sistemticos son tanto positivos como negativos
y que estos signos deben incluirse en el clculo de ~lf.
El error sistemtico total puede ser a veces cero. Supngase, por ejemplo,
que se usa una balanza con un error sistemtico de - 0.01 g para pesadas
utilizadas en la preparacin de una solucin estndar. Puesto que el peso de
soluto utilizado se calcula por diferencia entre dos pesadas, se eliminan los
errores sistemticos. Se debera sealar que esto se aplica slo a una balanza
o:.
OJ
(f)
40
(2.18)
Cuando una cantidad se eleva a alguna potencia, entonces se emplea la ecuacin (2.15), con el signo del mdulo omitido y las desviaciones estndar se
sustituyen por errores sistemticos.
2.12.3.
Otras funciones
Bibliografa
Altman, D. G. 1991. Practical Statistics for Medical Research. Chapman and
Hall, London. (Proporciona una discusin completa de la distribucin
lag-normal.)
Commision on Analytical Nomenclature. 1990. Nomenclature for Sampling
in Analytical Chemistry; Pure and Applied ChemistrJj 62:1193.
Davies, O. L. and Goldsmith, P.L. 1982. Statistical Methods in Research and
Production. Longman, London. (Da un tratamiento ms detallado de la
materia objeto de este captulo.)
Moritz, P. 1981. Chapter 1 Comprehensive AnalJjtical ChemistrJj Vol. XI, G.
Svehla (ed.). Elsevier, Amsterdam. (Este artculo profundiza en la aplicacin de la teora de errores a los mtodos analticos.)
Skoog, D. A. and West, D. M. 1982. Fundamentals of AnalJjtical ChemistrJj,
4th Ed. Holt Saunders, New York. (Describe el uso de la estadstica en
la evaluacin de datos analticos.)
41
Ejercicios
1.
0.07
0.08
0.07
0.07
0.08
0.08
0.09
0.08 flg g
2.
Siete medidas del pH de una solucin reguladora proporcionaron los siguientes resultados:
5.125.205.155.175.165.195.15
Calcular los lmites de confianza para el verdadero pH al nivel de confianza del (i) 95 % Y (ii) 99 %. (Suponer que no existen errores sistemticos.)
3.
14.0
13.2
11.9
12.0
12.1
ng mr
4.
5.
Calcule los lmites de confianza de la media al 95 %. Est el valor adicionado de 50 ng ml- l dentro de los lmites de confianza al 95 %?
42
6.
Se utiliz una disolucin 0.1 M de cido para valorar 10 mI de una solucin de lcali 0.1 M, registrndose los siguientes volmenes de cido:
9.88
10.18
10.23
10.39
10.21 mI
7.
8.
El producto de solubilidad del sulfato de bario es 1.3 x 1O~ 10, con una
desviacin estndar de 0.1 x 10 -10. Calcular la desviacin estndar de
la solubilidad calculada del sulfato de bario en agua.
Contrastes
de significacin
3.1.
Introduccin
Una de las propiedades ms importantes de un mtodo analtico es que debera estar libre de errores sistemticos. Esto significa que el valor dado para
la cantidad de analito debera ser el valor verdadero. Esta propiedad de un
mtodo analtico se puede contrastar al aplicar el mtodo a una muestra de
ensayo estndar que contenga una cantidad conocida de analito (Captulo 1).
Sin embargo, como se vio en el captulo anterior, incluso si no existieran
errores sistemticos, los errores aleatorios hacen poco probable que la cantidad medida sea exactamente igual que la cantidad patrn conocida. Para decidir si la diferencia entre la cantidad medida y la cantidad conocida se puede
atribuir a estos errores aleatorios, se puede aplicar una prueba estadstica denominada contraste de significacin. Como su nombre indica, esta aproximacin contrasta si son significativas las diferencias entre los dos resultados,
o si se pueden justificar slo por variaciones aleatorias. Los contrastes de
significacin se utilizan ampliamente en la evaluacin de los resultados experimentales. Este captulo considera varios contrastes que resultan especialmente tiles a los qumicos analticos.
3.2.
Al hacer un contraste de significacin se prueba la veracidad de una hiptesis denominada hiptesis nula, denotada por H o . Refirindonos al prrafo
anterior, adoptamos como hiptesis nula aquella mediante la cual un mtodo
analtico no est sujeto a errores sistemticos. El trmino nulo se emplea para
indicar que no hay otra diferencia entre el valor observado y el conocido que
la atribuible a la variacin aleatoria. Suponiendo que esta hiptesis nula es
44
50.7,' 49.1,
49.0,
51.1 ng mi
(50.06 -50))5
0.956
= 0.14
De la Tabla A.2, el valor crtico es /4 = 2.78 (P = 0.05). Puesto que el valor observado de
I/1 es menor que el valor crtico, la hiptesis nula se retiene: no hay evidencia de error
sistemtico. Hay que sealar nuevamente que esto no significa que no existan errores sistemticos, sino que no se ha podido constatar su existencia.
El uso de valores crticos de tablas estadsticas en contrastes de significacin fue adoptado debido a que antiguamente era demasiado tedioso calcular
la probabilidad de que t superara al valor experimentaL Las computadoras
han alterado tal situacin, y normalmente los programas estadsticos proporcionan los resultados de los contrastes de significacin en trminos de una
probabilidad. Si los valores de los datos individuales se introducen en Minitab el resultado de realizar este contraste se muestra a continuacin.
t-test of the mean
Test of mu
= 50.000
sv mu not
= 50.000
Variable N Mean
StDev SE Mean T
P
Selenour 5 50.060 0.956 0.427
0.140.90
Esto proporciona la informacin adicional que P (Itl > 0.14) = 0.90. Puesto
que esta probabilidad es muy superior a 0.05, el resultado no es significativo
a un P = 0.05, de acuerdo con el clculo previo. Obviamente es una gran
ventaja el poder calcular una probabilidad exacta, eliminando la necesidad
de tablas estadsticas que contengan valores crticos. Sin embargo, los ejemplos de este libro utilizan valores crticos, ya que puede suceder que no todos
los lectores tengan acceso a programas adecuados, y muchos cientficos siguen realizando contrastes de significacin con ayuda de calculadoras, que
normalmente no proporcionan valores de P. Cuando no se proporcionen los
valores de los datos individuales no podrn utilizarse, por ejemplo, Minitab
o Excel. Sin embargo, cuando puedan realizarse los clculos utilizando estos
programas, se proporcionar tambin el valor de P.
3.3.
45
46
!F11
C~l
t=
xz)
(3.2)
-+ni
1) SI +
( n -
/'t2 -
1)2
52
(/'tI + nz - 2)
(3.3)
EJEMPLO 3.3.1
En una comparacin de dos mtodos para la determinacin de cromo en muestras de hierba
de centeno se obtuvieron los siguientes resultados (mg Kg 1):
Mtodo 1: Media = 1.48; desviacin estndar = 0.28
Mtodo 2: Media = 2.33; desviacin estndar = 0.31
Para cada mtodo se realizaron 5 determinaciones.
(Sahuquillo, A., Rubio, R. and Rauret. G. 1999. AnaVst124:1)
Estos dos mtodos proporcionan resultados cuyas medias difieren significatrvamente?
La hiptesis nula adoptada es que las medias de los resultados dadas por ambos mtodos
sean las mismas. De la ecuacin (3.3), el valor conjunto de la desviacin estndar es:
$2 = (5
s= 0.295
De la ecuacin (3.2):
t=
2.33 - 1.48
0.295
Ji + i
4.56
Hay 8 grados de libertad. por tanto el valor crtico (Tabla A.2) de ~ = 2.1 (P = 0.05); puesto
que el valor experimental de I ti es ms grande que ste, la diferencia entre los dos resultados es significativa al nivel del 5% y se rechaza la hiptesis nula. De hecho, ya que el
valor crtico de t para P = 0.01 es aproximadamente 3.36, la diferencia es significativa in
cluso al nivel del 1%. En otras palabras. si la hiptesis nula es verdadera. la probabilidad
de que esa elevada diferencia se deba al azar es menor que 1 en 100.
47
EJEMPLO 3.3.2
En una serie de experimentos para la determinacin de estao en productos alimenticios,
las muestras fueron llevadas a ebullicin con HCI a reflujo para diferentes tiempos. Los
resultados fueron:
Tiempo de reflujo (min)
30
75
55,
57,
57,
55,
59,
58,
56,
59,
56,
59,
59
59
30 min
Xl = 57.00
si =
75 min
X2 = 57.83
2.80
= 2.57
s= 1.64
De la ecuacin (3.2):
57.00 - 57.83
1 = ----===c/1
1
1.64 V6 + 6
-0.88
-0.88
Hay 10 grados de libertad, de manera que el valor crtico es 110 = 2.23 (P= 0.05). El valor
observado de 1~ (= 0.88) es menor que el valor crtico, aceptndose por tanto la hiptesis
nula: no hay evidencia de que el perodo de ebullicin afecte a la tasa de recuperacin.
La tabla siguiente muestra el resultado de realizar este clculo con Excel.
Contraste t: dos muestras suponiendo varianzas iguales
Variable 1
Media
57
Varianza
2.8
Observaciones
6
Varianza conjunta
2.683
Diferencia de medias como hiptesis
O
gl
10
-0.881
Estadstico t
P(T<=t) para una cola
0.199
Valor t cr tico de una cola
1.812
P(T<=t) para dos colas
0.399
Valor t cr tico de dos colas
2.228
Variable 2
57.833
2.567
6
48
La distincin entre "una y dos colas se cubrir en la Seccin 3.5. Enaste momento,
es suficiente considerar slo los valores de dos colas. Estos muestran que
RI ti > 0.88):: 0.399. Ya que esta probabilidad es mayor que 0.05, el resultado no es significativo al nivel del 5%.
Cuando sea poco probable que las desviaciones estndar de las poblaciones
sean iguales, no es muy apropiado mezclar las desviaciones estndar muestrales para dar una estimacin global o conjunto de la desviacin estndar.
Un mtodo aproximado en estas circunstancias se propone a continuacin:
Para contrastar H o: tI = JL2 cuando no puede suponerse que las dos
muestras proceden de poblaciones con desviaciones estndar iguales, se
calcula el estadstico t donde
t=
(XI - X2)
S2
S2
nI
n2
(3.4)
~+-.2
(4
4)
SI
nI2( nI - 1)
+ n2(n
(3.5)
S2
2 2 - 1)
EJEMPLO 3.3.3
Los datos de la siguiente tabla proporcionan la concentracin de tiol (mM) en el Iisado snguineo de dos grupos de vqluntarios, siendo el primer grupo normal y el segundo sufriendo artritis reumatoide.
\
\
Normal
Reumatoide
1:84,
2.81,
1.92,
4.06,
1.94,
3.62,
1.92,
3.27,
1.85,
3.27,
1.91,
3.76
2.07
(Banford, J. C., Brown, D. H., McConnell, A. A., McNeil, C. J., Smith, W. E., Hazelton R. A.
and Sturrock, R. D. 1983. Analyst 107:195)
La hiptesis nula adoptada es que la concentracin media de tiol es la misma para los dos
grupos.
49
n1 = 7
Xl = 1.921
s,
n = 6
X2
52 = 0.440
3.465
0.076
Sustituyendo en la ecuacin (3.4) resulta / = - 8.48 Yde la ecuacin (3.5) se obtiene 5.3,
que es redondeado a 5. El valor crtico es /5 = 4.03 (P = 0.01), de manera que se rechaza
la hiptesis nula: existe suficiente evidencia para decir que la concentracin media de tiol
difiere entre los grupos.
El resultado de realizar este clculo utilizando Minitab (donde la opcin por defecto es
el contraste sin varianza conjunta) se muestra a continuacin.
Two sam,ple t-test and confidence interval
Two samp.le T for Normal vs Rheumatoid
N
Hean
StDev
SE Mean
Normal
1.9214
Ov0756
0.029
Rheumato
3.465
0.440
0.18
3.4.
50
Tabla 3.1.
Lote
Ensayo espectromtrico UV
Espectroscopia de reflectancia
en el infrarrojo cercano
8463
8438
8408
84.41
83.82
83.55
83.92
83.69
8406
84.03
83.15
8:3.72
83.84
84.20
83.92
8416
84.02
83.60
84.13
84.24
1
2
3
4
5
6
7
8
9
10
Para contrastar si n resultados emparejados se extraen de la misma poblacin, es decir, Hu: {id = O, se calcula el estadstico t:
(3.6)
donde J y Sd son la media y desviacin estndar, respectivamente, de
el, la diferencia entre los valores que forman cada par.
El nmero de grados de l1bertad de t es n-l.
EJEMPLO 3.4.1
Contrstese si existe diferencia significativa entre los resultados obtenidos por los dos m
todos de la Tabla 3.1.
Las diferencias entre los pares de valores (restando el segundo valor del primero) son:
+1.48,
+0.66,
+0.24,
+0.21,
-0.10,
0.09,
-0.07,
-- 0.21
-0.61,
- 0.10,
111 ~
Los contrastes por parejas descritos anteriormente no requieren que las precisiones de los dos mtodos sean iguales, sino que suponen que las diferencias, d, estn distribuidas normalmente. En efecto, esto exige que cada
conjunto de medidas se distribuya normalmente y que la precisin y sesgo
3.
3.5.
Los mtodos que se han analizado hasta el momento en este captulo se refieren al contraste de la diferencia entre dos medias en cualquier direccin.
Por ejemplo, el mtodo descrito en la Seccin 3.2 contrasta si existe diferencia significativa entre el resultado experimental y el valor conocido para el
material de referencia, sin tener en cuenta el signo de la diferencia. En muchas situaciones de este tipo el analista no tiene una idea preconcebida, previa a las mediciones experimentales, en cuanto a si la diferencia entre la
media experimental y el valor de referencia ser positiva o negativa. As
pues, el contraste utilizado debe cubrir cualquier posibilidad. Dicho contraste se denomina de dos colas (o bilateral). Sin embargo, en algunos casos,
puede ser apropiado otro tipo de contraste diferente. Considrese, por ejemplo, un experimento en el que se espera aumentar la velocidad de reaccin
aadiendo un catalizador. En este caso, es evidente que antes de empezar el
experimento el nico resultado que interesa es si la nueva velocidad es
mayor que la anterior y, por tanto, slo es necesario contrastar un aumento.
51
52
25.18
24.8725.51
25.34
25.41
De la Tabla A.2 el valor crtico es /5 = 2.02 (P = 0.05, contraste de una cola). Puesto que
el valor observado de / es mayor que ste se rechaza la hiptesis nula y hay evidencia de
sesgo positivo.
Utilizando una computadora resulta que 11/ ~ 2.35) = 0.033. Ya que este valor es menor que 0.05, el resultado es, como antes, significativo al nivel P = 0.05.
3.6.
53
Los contrastes de significacin descritos hasta ahora se utilizan para comparar medias y, por tanto, para detectar errores sistemticos. En muchos casos
es tambin importante comparar las desviaciones estndar, es decir, los errores aleatorios de dos conjuntos de datos. Esta comparacin, como en el caso
de los contrastes de medias, puede tomar dos formas. Se puede pretender
probar si el Mtodo A es ms preciso que el Mtodo B (es decir, un contraste
de una cola) o si los Mtodos A y B difieren en su precisin (es decir, un
contraste de dos colas). Por ejemplo, si quisiramos contrastar si un mtodo
analtico nuevo es ms preciso que un mtodo patrn deberamos utilizar el
contraste de una cola: si quisiramos contrastar si dos desviaciones estndar
difieren significativamente (por ejemplo, antes de aplicar el contraste t; vase
la Seccin 3.3 anterior) sera adecuado un contraste de dos colas.
El contraste F considera la razn de las dos varianzas muestrales, es
decir, la razn de los cuadrados de las desviaciones estndar, 5f/51.
Para probar si es significativa la diferencia entre dos varianzas muestrales, esto es, para probar Hu: T = CT2, se calcula el estadstico F:
. = "12/S22
}~
(3.7)
~
1.
EJEMPLO 3.6.1
Se compar un mtodo propuesto para la determinacin de la demanda qumica de oxgeno
en aguas residuales con otro mtodo patrn (sales de mercurio). Los siguientes resultados
fueron obtenidos para una muestra de aguas residuales:
Media (mg r
Mtodo patrn
Mtodo propuesto
72
72
/)
54
EJEMPLO 3.6.2
En el Ejemplo 3.3.1 se supuso que las varianzas de los dos mtodos para determinar cromo
en hierba de centeno no diferan significativamente. Este supuesto se puede contrastar ahora. Las desviaciones estndar eran 0.28 y 0.31 (cada una obtenida de cinco medidas de un
ejemplar de una planta determinada). Calculando Fde forma que sea mayor que 1, se tiene:
0.31 2 ,
F=-=
1.23
0.28 2
Sin embargo en este caso, no hay, de antemano, ninguna razn para esperar que la varianza de un mtodo deba ser mayor que la del otro, resultando por ello adecuado un contraste de dos colas. Los valores crticos que proporciona la Tabla A.3 son los valores que
F supera con una probabilidad de 0.05, suponiendo que tienen que ser mayores que 1. En
un contraste de dos colas, la razn entre una varianza y otra podra ser mayor o menor que
1, pero si F se calcula de manera que sea siempre mayor que 1, entonces la probabilidad
de que supere el valor crtico dado en la Tabla A.3 ser el doble. Por ello, estos valores
crticos no son apropiados para un contraste de dos colas y en su lugar se emplea la Tabla
A.4. De esta tabla, tomando 4 como el nmero de grados de libertad de numerador y denominador, el valor crtico es ~.4 = 9.605. El valor calculado es menor que ste, por tanto
no hay diferencia significativa entre las dos varianzas a un nivel del 5%.
Como en el caso del contraste t, se pueden emplear otros niveles de significacin en el contraste F y los valores criticas se encuentran en las tablas
listadas en la bibliografa al final del Capitulo 1. Hay que tener cuidado en
la eleccin de la Tabla correcta dependiendo de si es un contraste de una o
dos colas: para un ti. % de nivel de significacin, se utilizan los 2t1. % puntos
de la distribucin F para un contraste de una cola, mientras que para un
contraste de dos colas se utilizan los puntos ti. %. Si se utiliza una computadora ser posible obtener un valor de P. Hay que tener presente que Excel
3.7.
Datos anmalos
12.15,
12.13,
13.14,
12.12 mI
entonces es casi seguro que el cuarto valor corresponda a un error en la escritura y que debera leerse 12.14. Sin embargo, incluso cuando los datos que
son obviamente errneos hayan sido eliminados o corregidos, todava quedan datos que pudieran ser anmalos. Deberamos conservarlos, o deberamos buscar algn procedimiento para comprobar estadsticamente si deben
ser rechazados o no? Obviamente, los valores finales de la media y la desviacin estndar dependern de si los datos anmalos han sido rechazados o no.
Puesto que la discusin sobre la precisin y la exactitud de un mtodo depende de estos valores finales, tiene que quedar claro siempre si los datos
anmalos han sido rechazados y, si es as, por qu.
El contraste de Dixon (a veces llamado contraste Q) es un contraste
popular para datos anmalos debido a que el clculo es simple. Para pequeas muestras (tamaos de 3 a 7) el contraste evala una medida sospechosa
comparando la diferencia entre ella y la medida ms prxima en tamao, con
el intervalo de las medidas. (Para muestras ms grandes la forma del contraste se modifica ligeramente. Al final del captulo se proporciona una referencia que contiene detalles adicionales.)
Para usar el contraste de Dixon para un valor anmalo, esto es, para
probar H o: todas las medidas proceden de la misma poblacin, se calcula el estadstico Q:
Ivalor sospechoso - valor ms cercanol
Q- (valor ms grande - valor ms pequeo)
(3.8)
55
56
EJEMPLO 3.7.1
Se obtuvieron los siguientes valores para la concentracin de nitrito (mg 1- 1) en una muestra de agua de ro:
0.403,
0.410,
0.401,
0.380
= 0.021/0.03 = 0.7
De la Tabla A.5, para un tamao de muestra de 4, el valor crtico de la Qes 0.831 (f = 0.05).
Ya que el valor calculado de la Q no lo supera, debe aceptarse que la medida sospechosa
no es una observacin anmala.
En una situacin ideal, habra que tomar nuevas medidas cuando aparezca
un valor sospechoso, especialmente si inicialmente slo se han tomado unos
pocos valores. Esto puede aclarar si debera rechazarse o no el valor sospechoso, y si se mantuviera, tambin reducira en cierta medida su efecto sobre
la media y la desviacin estndar.
E,IEMPLO 3.7.2
Si se aaden tres nuevas medidas a las dadas en el ejemplo anterior, quedara:
0.403,
0.410,
0.401,
0.380,
0.400,
0.413,
0.411
El valor crtico de la Q para un tamao muestral 7 es 0.570, por lo que se rechaza que la
medida sospechosa no sea anmala al nivel de significacin del 5%.
Otro contraste utilizado frecuentemente para datos anmalos es el contraste
de Grubbs, que compara la desviacin entre el valor sospechoso y la media
muestral, con la desviacin estndar de la muestra. Este contraste lo recomienda ISO preferentemente al de Dixon.
Para usar el contraste de Grubbs para un valor anmalo, esto es, para
probar H o: todas las medidas proceden de la misma poblacin, se calcula el estadstico G:
G = valor sospechoso -
~~I/s
(3.9)
EJEMPLO 3.7.3
Aplicar el contraste de Grubbs a los datos del ejemplo anterior.
Los siete valores tienen
x= 0.4026 Y s = 0.01121
G= 10.380 - 0.40261/0.01121
2.016
El valor crtico (P = 0.05) es 2.02. A diferencia del contraste de Dixon, el valor sospechoso
0.380 no se rechaza~ estos resultados contradictorios no son infrecuentes en contrastes de
datos anmalos.
= 0.18
Q = (31 - 2.9)/(3.1 - 2)
a
:1
20
2.2
2.4
I
X,
I
26
1.1
2.8
3.0
I
Xn
Figura 3.1. Diagrama de puntos para ilustrar el problema del manejo de datos anmalos
(a) cuando existen dos datos sospechosos en el extremo superior de los datos de la muestra;
y (b) cuando existen dos datos sospechosos uno en cada extremo de los datos.
57
58
3.8.
Anlisis de la varianza
En la Seccin 3.3 se describi un mtodo para comparar dos medias y contrastar si diferan significativamente. En el trabajo analtico se suelen presentar a menudo comparaciones en las que intervienen ms de dos medias.
Algunas situaciones posibles de estE; tipo son: comparar la concentracin media de protena en solucin para muestras almacenadas en condiciones diferentes; comparar los resultados medios obtenidos de la concentracin de un
analito utilizando diferentes mtodos; y comparar la media de los resultados
en una valoracin obtenidos por diferentes operadores usando los mismos
aparatos. En todos estos ejemplos hay dos posibles fuentes de variacin. La
primera, que siempre est presente, es debida al error aleatorio en la medida.
Esto se discuti con detalle en el captulo anterior: este tipo de error provoca
el que se obtenga un resultado diferente, cada vez que se repite una medida
bajo las mismas condiciones. La segunda fuente de variacin posible se debe
a lo que se conoce como factor controlado o de efecto fijo. Para los ejemplos anteriores los factores de control son, respectivamente, las condiciones
bajo las cuales se almacen la disolucin, el mtodo de anlisis empleado, y
los operadores que realizaron la valoracin. El anlisis de la varianza (abreviado con frecuencia como ANOVA) es una tcnica estadstica muy potente
que se utiliza para separar y estimar las diferentes causas de variacin. Para
los ejemplos concretos anteriores, se puede utilizar para separar la variacin
debida al error aleatorio de cualquier otra variacin que venga provocada al
cambiar el factor de control. De este modo se puede contrastar si una alteracin del factor de control conduce a diferencias significativas entre los valores medios obtenidos.
Tabla 3.2.
Condiciones
A:
B:
C:
D:
preparada recientemente
almacenada una hora en la oscuridad
almacenada una hora con luz tenue
almacenada una hora con luz brillante
Medidas repetidas
Media
101
102
97
92
Media global: 98
59
105
60
100
95
90 '-'------>--------'----BCD
A
Condiciones
Figura 3.2.
Tabla 3.3.
Muestra 1
X11
X12 '"
x, ... x1n
X,
Muestra 2
X21
X22 ...
"2'" x2n
"2.
Muestra i
x~
Muestra h
xlTI
Xi
x!12 ...
XII
Media global
=x
tada es que todas las muestras se extraen de una poblacin con media J1 y
varianza o"~. Bajo esta hiptesis, ()~ se puede estimar de dos formas, una estudia la variacin dentro de muestras y la otra la variacin entre muestras.
1.
L (Xi -
Varianza de la Muestra B =
3-1
=1
(1 + 3 + 4 + 4) /4 = 3
xY /h(n ~ 1)
0"6 = I I (xij ,.
(3.10)
2.
0"5
entre muestras
3 con 8 g.l.
62 con 3 g.l.
Si la hiptesis nula es correcta, estas dos estimaciones de 0"5 no deberan diferir significativamente. Si es incorrecta, la estimacin entre muestras de 0"6
ser mayor que la estimacin dentro de las muestras debido a la variacin
61
62
entre muestras. Para contrastar si la estimacin entre muestras es significativamente ms grande se utiliza un contraste F de una cola (Seccin 3.6):
F = 62/3 = 20.7
j('Jj
tllCn -
1)
Xv = 92
Xc = 97
= 101
= 102
J3
3.10.
L L (xij i
X)2
=
=
4 2 + 22 + 32 + 32 + 3 2 + 62 + 12 + 3 2 + 12 + 12 + 82 + 6 2 + 4 2
210
Este mtodo de estimar 11"6 no se utiliza en el anlisis debido a que la estimacin depende de las dos variaciones: dentro y entre muestras. Sin embargo, existe una relacin algebraica exacta entre esta variacin total y las
fuentes de variacin que contribuyen a ella. Esto, especialmente en los clculos ms complicados de ANOVA, conduce a una simplificacin del trabajo
aritmtico. En la Tabla 3.4 se muestra la relacin entre las fuentes de variacin y tambin se resumen las sumas de cuadrados y los grados de libertad .
. Se observar que los valores de la variacin total, dados en la ltima fila de
la tabla, son la suma de los valores de las dos primeras filas tanto para la
suma de cuadrados como para los grados de libertad. Esta propiedad aditiva
se mantiene para todos los clculos ANOVA descritos en este libro.
Tabla 3.4.
Fuente de variacin
Suma de cuadrados
Grados de libertad
Entre muestras
n (x -
h- 1= 3
Dentro de muestras
(xli
Total
W= 186
X)2 = 24
tl...n-1)=8
W= 210
hn - 1 = 11
,(xli i
Grados de libertad
Fuente de variacin
Entre muestras
Suma de cuadrados
T~/n - T?-/N
Dentro de muestras
por diferencia
por diferencia
Total
x7i i
T:/N
-~
N-l
63
64
EJEMPLO 3.10.1
Probar si las muestras de la Tabla 3.2 se han extraido de poblaciones con igual media.
El clculo de los cuadrados de la media se expone ms abajo. A todos los valores de la
Tabla 3.2 se les ha restado 100, lo que simplifica considerablemente la aritmtica. Ntese
que esto no afecta ni a la estimacin de la varianza entre muestras ni a la estimacin de
la varianza dentro de muestras, ya que se ha restado la misma cantidad de cada valor.
A
B
2
1
3
-10
O
1
- 5
-8
1
4
-1
-6
T;
T7
3
6
-9
-24
9
36
81
576
L T7 =
T = - 24
n = 3,
h = 4, N = 12,
L L ~. =
702
258
Fuente de variacin
Suma de cuadrados
Entre muestras
Dentro de muestras
Total
3
8
11
186/3 = 62
24/8 = 3
El valor crtico ~.8 = 4.066 (P = 0.05). Ya que el valor calculado es mayor que ste se
rechaza la hiptesis nula: la media muestral difiere significativamente.'
RESUMEN
Grupos
303
306
291
276
101
102
97
92
1
3
4
4
Fuente de
SC
variacin
En tre grupos
186
Dentro de grupos 24
gl
CM
62
3
20.66667 0.0004
210
11
ANOVA
Total
Valor de P F crit
4.06618
3.11.
El contraste chi-cuadrado
(3.12)
65
66
~. EJEMPLO 3.11.1
'1Iilil
A continuacin se muestra el nmero de roturas en el material de vidrio de cuatro trabajadores de un laboratorio a lo largo de un perodo de tiempo. Hay alguna evidencia de que
los trabajadores difieran en su habilidad?
Nmero de roturas:
24,
17,
11,
Adoptando como hiptesis nula que no hay diferencias en cuanto a su habilidad. Suponiendo que los trabajadores utilizan el laboratorio el mismo tiempo, se esperara, a partir de la
hiptesis nula, el mismo nmero de roturas por cada trabajador. Puesto que el nmero total
de roturas es 61, el nmero de roturas esperado por trabajador es 61/4 = 15.25. Obviamente, en la prctica no es posible que haya un nmero no entero de roturas: este nmero
corresponde a un concepto matemtico. La distribucin igual" ms prxima y manejable
desde un punto de vista prctico es 15, 15, 15, 16, en algn orden determinado. La pregunta a responder es si las diferencias entre las frecuencias observadas y esperadas es tan
grande que deba rechazarse la hiptesis nula. Considerando una serie de lanzamientos de
un dado se puede entender mejor el que existan ciertas diferencias entre los dos conjuntos
de frecuencias: sera muy sorprendente, por ejemplo, si en 30 lanzamientos aparecieran con
la misma frecuencia los nmeros 1, 2, 3, etc. El clculo de X2 , se muestra a continuacin.
Frecuencia observada, O
Frecuenc;8 esperada, E
O-.E
(O - Ej2/E
24
17
11
15.25
15.25
15.25
15.25
875
1.75
- 4.25
. .~ 6.25
5.020
0.201
1.184
2.561
9
Totales
61
X-
==
8.966
Ntese que el total de la columna O-E es siempre cero, con lo cual se dispone de una
forma til de verificar los clculos.
Si
supera un cierto valor crtico, se rechazada la hiptesis nula. El valor crtico depende, como en otros contrastes de significacin, del nivel de significacin del contraste y
del nmero de grados de libertad. El nmero de grados de libertad es, en un ejemplo de
este tipo. uno menos que el nmero de clases utilizadas, es decir, 4 - 1 = 3 en este caso.
Los valores crticos de
para P = 0.05 vienen dados en la Tabla A.7. Para 3 grados de
libertad, el valor crtico es 7.81. Puesto que el valor calculado es mayor que ste, se rechaza
la hiptesis nula a un nivel de significacin del 5% se ha encontrado evidencia de que los
trabajadores difieren significativamente en su habilidad.
xe
xe
3.12.
El contraste de la normalidad
de una distribucin
Como se ha recalcado en este captulo, muchos contrastes estadsticos suponen que los datos utilizados proceden de una poblacin normal. En la seccin anterior se mencion un mtodo para contrastar este supuesto, utilizando
el contraste chi-cuadrado. Por desgracia, este mtodo slo se puede utilizar
si hay 50 o ms datos. En el trabajo experimental lo normal es tener pocos
datos. Una forma visual simple de comprobar si un grupo de datos procede
de una poblacin normal es representar una curva de frecuencias acumuladas en un papel grfico especial denominado papel de probabilidad normal. Este mtodo se explica mejor por medio de un ejemplo.
EJEMPLO 3.12.1
Utilizar papel de probabilidad normal para contrastar si los valores siguientes proceden de
una poblacin normal:
109,
89,
99,
99,
107.
111,
86,
74,
115,
107,
134,
113,
Tabla 3.5.
Medida
Frecuencia acumulada
74
86
88
89
99
104
107
109
110
111
113
115
134
1
2
3
4
6
7
9
10
11
12
13
14
15
110,
88,
104
% de Frecuencia acumulada
6.25
12.50
18.75
25.00
37.50
43.75
56.25
62.50
68.75
75.00
81.25
87.50
93.75
La Tabla 3.5 muestra los datos ordenados en orden creciente. En la segunda columna apa
recen las frecuencias acumuladas en cada medida, es decir, el nmero de medidas menores
67
68
o iguales que dicha medida. La tercera columna recoge la frecuencia acumulada en porcentaje. Este porcentaje se ha calculado utilizando la formula:
% frecuencia acumulada = 100 x frecuencia acumulada I(n + 1)
3.13.
ro
::J
E
::J
U
ro
ro
50
Q)
::J
U
jg
Q)
TI
~
o
0......,,=-------------Medida
Figura 3.3.
69
99
98
'"
"3
'"
E
"O
::>
''""
e
'C:;
Ql
::>
Ql
"O
,p
o
95
90
80
70
60
50
40
30
20
10
5
2
1
()
O
::l
r-+
'"'1
01
Ul
r-+
ro
Ul
CL
ro
Ul
tOO
2.
-...
_.
_.
()
70
80
90
100 110
120 130
Medida
Figura 3.4.
Seccin 3.2, un contraste de significacin, por ejemplo, al nivel P = 0.05 supone un riesgo deIS % de que se rechazar una hiptesis nula incluso aunque
sea verdadera. A este tipo de error se le denomina error de Tipo l. El riesgo
de tal error se puede reducir al alterar el nivel de significacin del contraste
a P = 0.01 o incluso a P = 0.001. Sin embargo, ste no es el nico tipo de
error posible: es posible tambin mantener una hiptesis nula aun cuando
sea falsa. Este es el denominado error de Tipo 11. Para calcular la probabilidad de este tipo de error es necesario postular una alternativa a la hiptesis
nula, conocida como hiptesis alternativa, H 1 .
Considrese un producto qumico del cual se piensa que contiene el 3 %
de fsforo por pesada. Se tiene la impresin de que esta proporcin se ha
incrementado y para contrastar esto se ha analizado la composicin empleando un mtodo estndar con una desviacin estndar conocida del
0.036 %. Supngase que se toman cuatro medidas y se realiza un contraste
de significacin al nivel P = 0.05. Es necesario que dicho contraste sea de
una cola, ya que slo interesa un incremento. La hiptesis nula es:
H o:
fl = 3,0%
fl = 3.05%
01
()
O,
::l
70
x
Xc
Figura 3.5.
,l"\,
I
I
\
\
l'
t
"
3.00
\
I
\
Tipo I
\
"
\,
305
Xc
Figura 3.6.
Bibliografa
Barnett, V. and Lewis, T. 1994. Ourliers in Statistical Data. 3rd Edn. Wiley,
Chichester. (Un tratamiento muy completo de la filosofa del rechazo de
datos anmalos y los contrastes empleados.)
Rox, G. E. P., Hunter, W. G. ,md Hunter,j. S. 1978. Statistiesfor Experill1C1ltas, Wiley, Nevv' York. (Proporciona ms detalles sobre los contrastes entre medias en el ANOVA.)
Campbel1, R. C. 1989. Statisticsfor Bi%gists. 3rd Edn. Cambridge University
Press, Cambridge. (Proporciona contrastes de la homogeneidad de varianzas y de normalidad.)
Crawshaw, J. and Chambers, J 1997. A Concise Course in A-Level Statistics.
3rd Edn. Stanlcy Thornes, Cheltenham. (Da ejemplos del contraste chicuadrado para la normalidad.)
Davies O. 1. and Goldsmith P. 1. 1984. Statistical JV[ethods in Research {( nd
P)'oduction. 4th Edn. Longman, London. (Proporciona ms detalles acerca
de los errores de Tipo 1 y II Y otras aplicaciones del contraste chi-cuadrado.)
Filliben, j.]. 19'15. Tcchnometrics 17: 111. (Describe el uso de r al contrastar
la normalidad, y estudia otros contrastes de normalidad.)
Kleinbaum, D. G., Kupper, 1. 1. and Muller, K. E. 1988. Applied Rqression
AnalJjsis all! Other l'v'fultivariate Methods. 2nd Edn. PWS -Kent Publishing, Boston. (Proporciona detalles adicionales de contrastes para diferencias significativas entre medias con posterioridad a un ANOV A.)
Kowalski, B. R. (ed.). 1977. Chemometrics: Theor~1j alld Application, American Chemical Society, Washington. (El Captulo 11 clescribe contrastes de
normalidad y cliscute el efecto de la no normalidad sobre los contrastes
paramtricos.)
Sokat, R. R. and Rohlf, F. j. 1994. BiometrJj. 3rd Edn. Freeman, New York
(Da informacin detallada de los contrastes de la homogeneidad de varia:~zas.)
71
72
Ejercicios
1.
Utilizando una grfica de probabilidad normal, contrastar si el siguiente conjunto de datos podra haber sido obtenido de una poblacin
normal:
11.68, 11.12,8.92,8.82, 10.31, 11.88,9.84, 11.69, 9.53, 10.30,
9.17, 10.04, 10.65, 10.91, 10.32,8.71,9.83,8.90, 10.40
2.
Valor certificado
Media
Desviacin estndar
1
2
3
4
0.496
0.995
1.493
1.990
0.482
1.009
1.505
2.002
0.0257
0.0248
0.0287
0.0212
4.
Los siguientes datos proporcionan la recuperacin de bromuro adicionado a muestras con contenido vegetal, medido mediante un mtodo cromatogrfico gas-lquido. La cantidad de bromuro potsico aadido a cada
tipo de vegetal fue la misma.
Tomate
Pepino
777
782
790
773
759
778
790
765
770
789
758
797
764 ~g g-l
782 ~g g-l
S.
7
8
16
23
33.3
43.6
73.2
72.5
35.7
47.7
73.6
65.2
33.3
45.2
68.7
70.4
38.1
45.4
70.9
66.7
31.0
43.8
72.5
77.6
73
33.3
46.5
74.5
69.8
()
O
::l
.....
Vl
.....
ro
Vl
o..
ro
Vl
cE'
2.
-.
(s.
O!
6.
0.48
0.35
0.36
0.37
0.20
0.27
0.55
0.29
0.45
0.46
0.47
0.23
Al leer en una bureta 0.01 mI, un analista tiene que estimar la cifra final. La siguiente tabla de frecuencias proporciona las ltimas cifras de
SO lecturas. Realizar un contraste de significacin adecuado para determinar si se prefieren algunos dgitos a otros.
Dgito
Frecuencia
8.
O 1
1 6
2
4
S 3
S
11
6
2
7
8
8
3
9
7
Mtodo
Mtodo
Mtodo
Mtodo
Mtodo
Mtodo
1
2
1
2
1
2
media
media
media
media
media
media
=
=
=
=
=
=
2.15
2.45
5.12
7.27
23.08
32.01
d.e.
d.e.
d.e.
d.e.
d.e.
d.e.
=
=
=
=
=
=
0.26
0.14
0.80
0.44
2.63
4.66
Los datos dados en el ejemplo de la Seccin 3.11, para el nmero de roturas realizadas por cuatro trabajadores diferentes, se reproducen a continuacin.
24, 17, 11, 9
(')
5:
::l
74
Probar si:
(a)
(b)
10.
El nmero de roturas del primer trabajador difiere significativamente de las de los otros tres trabajadores.
El segundo, tercero y cuarto trabajadores difieren significativamente en la falta de cuidado de cada uno de los otros.
Mtodo enzimtico
1
2
3
31.1
29.6
31.0
32.6
31.0
30.3
11.
Seis analistas realizan seis determinaciones cada uno del contenido del
mismo lote de pastillas. Los resultados se muestran a continuacin:
Analista
A
e
D
E
F
84.51
84.25
84.40
84.22
83.88
84.17
84.63
84.41
84.68
84.02
84.49
84.11
84.61
84.13
84.28
84.48
83.91
84.36
84.64
84.00
84.40
84.27
84.11
84.61
84.51
84.30
84.36
84.33
84.06
83.81
(Trafford, A. D., lee, R. D., Moffat, A. C. and Graham P. 1999. Ana19st 124:163)
Probar si existe alguna diferencia significativa entre las medias obtenidas por los seis analistas.
12.
13.
Muestra n.o
1
2
3
4
5
6
15.7
20.4
19.6
15.7
25.0
19.5
16.6
21.3
20.7
16.8
(J
75
La calidad
de las medidas
analticas
4.1.
Introduccin
La qumica analtica, como se vio en el Captulo 1, es una ciencia de la medida aplicada, en la que predominan los estudios cuantitativos, siendo esenciales, por tanto, las estimaciones de errores inevitables. En casi todas las
aplicaciones del anlisis los resultados obtenidos se suministran a un cliente
o usuario, y es necesario que estos usuarios se encuentren satisfechos tanto
como sea posible con la calidad (adecuacin al objetivo) de las medidas. Esto tiene muchas implicaciones importantes para la prctica analtica. En primer lugar, cualquier evaluacin de los errores de medida debe tener en cuenta el proceso analtico global: incluyendo las etapas de muestreo, que a
menudo contribuyen al error global muy significativamente. En segundo lugar, las caractersticas de los anlisis acometidos en cada laboratorio deben
ser comprobados internamente de forma regular, normalmente aplicndolos
a materiales de referencia o estndar. En tercer lugar, en muchas reas de
aplicacin se deben comparar los resultados de diferentes laboratorios entre
si, de manera que los usuarios puedan estar satisfechos de que el funcionamiento de los laboratorios cumple con normativas, regulaciones y otros requerimientos. Finalmente, los resultados analticos se deben sumunistrar con
una estimacin realista de su incertidumbre, es decir, el intervalo dentro del
cual est ubicado el verdadero valor de la cantidad que es medida. stos son
los temas principales que se analizan en este captulo. Los mtodos estadsticos utilizados en dichas reas son, en principio, muy simples, basndose
muchos de ellos en tcnicas descritas en los Captulos 2 y 3. Sin embargo,
uno de los principales desarrollos en las ciencias analticas de los ltimos
aos ha sido su aplicacin cada vez ms frecuente y mejorada, propiciando
una gran mejora en la calidad y aceptabilidad de muchos resultados analticos. Adems, algunos de los mtodos analizados tienen amplias aplicaciones.
Por ejemplo, los principios empleados para controlar el funcionamiento de
un nico anlisis en un nico laboratorio durante un perodo de tiempo se
pueden aplicar tambin al seguimiento de un proceso industrial.
78
4.2.
Muestreo
Muchos anlisis dependen de muestras qumicas para proporcionarnos informacin sobre un objeto global. Por tanto, si no se consideran con cuidado
las etapas de muestreo de un anlisis, puede ser que los mtodos estadsticos
considerados en este libro no sean vlidos, ya que las muestras estudiadas
puede que no representen apropiadamente al conjunto objeto de estudio. Por
ejemplo, no es posible analizar todo el agua de un ro para analizar un contaminante txico, y no es posible analizar una cisterna de un camin llena
de leche para ver si contiene una hormona esteroide prohibida. En otros casos tiene que utilizarse una pequea cantidad de muestra debido a que el
mtodo es destructivo y se quiere conservar el material restante. As pues,
en cada caso la muestra estudiada debe tomarse de manera que asegure en
lo posible que sea verdaderamente representativa del objeto total.
Para aclarar algunos aspectos del muestreo considrese la situacin en la
que se disponga de un gran lote de pastillas y que se desee obtener una estimacin del peso medio de una pastilla. En vez de pesar todas las pastillas, se
toman unas pocas (supongamos diez) y se pesa cada una. En este ejemplo el
lote de tabletas forma la poblacin y las diez pastillas pesadas constituye una
muestra de esta poblacin (vase la Seccin 2.2). Si la muestra se va a utilizar para deducir las propiedades de la poblacin, entonces se denomina estadsticamente muestra aleatoria, es decir, una muestra tomada de tal modo que todos los miembros de la poblacin tienen la misma posibilidad de
estar incluidos en ella. Slo entonces sern vlidas las ecuaciones como la
(2.9), que proporciona los lmites de confianza de la media. Debe considerarse que el trmino aleatorio tiene, en sentido estadstico, un significado diferente de casual. Aunque en la prctica un analista pudiera diseminar las
pastillas sobre una mesa e intentar tomar una muestra de diez de una manera casual, dicho mtodo podra ocultar un sesgo inconsciente. El mejor modo
de obtener una muestra aleatoria es mediante el uso de una tabla de nmeros
aleatorios. A cada elemento de la poblacin se le asigna un nmero de tal
manera que todos los nmeros tienen el mismo nmero de dgitos, por ejemplo 001, 002, 003, etc. Entonces los nmeros aleatorios se leen de una tabla
de nmeros aleatorios (vase la Tabla A.S), partiendo de un punto arbitrario
que proporcione, por ejemplo, 964, 173, etc.; y los nmeros correspondientes
de la poblacin constituirn la muestra. Un procedimiento alternativo (y mucho ms simple) que se utiliza algunas veces es el de seleccionar los elementos de una poblacin a intervalos regulares, por ejemplo, tomar una de cada
cien pastillas de una lnea de produccin. Este mtodo no es completamente
satisfactorio ya que podra existir una periodicidad coincidente en el peso de
las pastillas: la importancia de la aleatoriedad de la muestra es evidente. De
nuevo, si las ltimas pastillas tomadas hubieran sufrido una disminucin
gradual de peso durante la produccin del lote, entonces esta muestra proporcionara un valor completamente errneo para el peso medio del lote
completo.
En el ejemplo anterior la poblacin est constituida de elementos discretos obvios, que nominalmente son el mismo, o sea, las pastillas. El muestreo
de materiales para los que esto no es cierto, como rocas, polvo, gases y lquidos, se denomina muestreo a granel. Si un material a granel fuera perfectamente homogneo entonces slo se necesitara una parte pequea o
incremento de muestra o porcin de ensayo para determinar las propiedades del conjunto. En la prctica los materiales a granel no son homogneos
por multitud de razones. Materiales como aleaciones y sedimentos estn formados por partculas macroscpicas con diferente composicin y puede que
no estn uniformemente distribuidas en el conjunto. Los fluidos puede que
no sean homogneos a escala molecular, debido a los gradientes de concentracin. Tal falta de homogeneidad se detecta slo tomando una muestra de
prueba de diferentes partes del conjunto. Si fuera posible, esto debera hacerse aleatoriamente considerando el conjunto como una coleccin de celdas de
igual tamao y seleccionando una muestra de celdas utilizando nmeros
aleatorios como se describi anteriormente.
De la muestra aleatoria, puede calcularse la media, X, y la varianza, 52.
Existen dos contribuciones al valor de S2: la varianza muestral, a-I, debida
a las diferencias entre los elementos de la muestra, por ejemplo, pastillas que
tienen diferentes pesos, y la varianza de la medida, (T~, por ejemplo, errores aleatorios en la pesada de cada pastilla. En la seccin siguiente se describe cmo pueden separarse y estimarse estas dos contribuciones utilizando el
ANOVA. Para materiales a granel la varianza muestral depende del tamao
de los incrementos de muestra relativos a la escala de las no homogeneidades.
Cuando el tamao del incremento de muestra aumenta, las no homogeneidades tienden a ser promediadas, disminuyendo de esta manera la varianza
muestral.
4.3.
Muestra
Pureza (%)
98.8,
99.3,
98.3,
98.0,
99.3,
o
E
98.7,
98.7,
98.5,
97.7,
99.4,
Media
98.9,
98.8,
98.8,
94.4,
99.9,
98.8
99.2
98.8
97.3
99.4
98.8
99.0
98.6
97.6
99.5
79
Ol
('l
o:.
Ol
o...
o...
ro
Oi
Vl
3ro
o...
o:.
Ol
Vl
Ol
:l
(S'
Ol
Vl
80
por la varianza muestral, d. Puesto que el cuadrado medio dentro de muestras no depende de la media muestral (vase la Seccin 3.9) se puede usar
para estimar (J~. El cuadrado medio entre muestras no se puede utilizar para
estimar directamente (Ji, ya que la variacin entre medias muestrales es causada tanto por el error aleatorio en la medida como por las posibles variaciones en la pureza. Se puede demostrar que el cuadrado medio entre muestras
proporciona una estimacin de (J~ + nd (donde n es el nmero de medidas
repetidas). Sin embargo, antes de realizar una estimacin de (Ji, se debera
realizar un contraste para ver si difiere significativamente de O. Esto se realiza comparando los cuadrados medios entre y dentro de muestras: si no
difieren significativamente entonces (J~ = O Y ambos cuadrados medios esti?
man (Jo.
La salida del ANOVA de un factor proporcionada por Excel para este
ejemplo se muestra a continuacin. Los resultados muestran que el cuadrado
medio entre muestras es mayor que el cuadrado medio dentro de muestras,
y el resultado del contraste F muestra que esta diferencia es sumamente significativa, es decir, que (Ji difiere significativamente de O. El cuadrado medio
entre muestras da el valor 0.0653 como una estimacin de (J~, de manera que
se puede estimar (J~ utilizando:
(J~ = (cuadrado medio entre muestras - cuadrado medio dentro de
=
=
muestras)/n
(1.96 - 0.0653)/4
0.47
Muestra A
Muestra B
Muestra
98.8
98.7
98.9
98.8
99.3
98.7
98.8
99.2
Muestra D
Muestra E
98.3
98.5
98.8
98.8
98
97.7
97.4
97.3
99.3
99.4
99.9
99.4
Frecuencia
Suma
Promedio
Varianza
4
4
4
4
4
395.2
396
394.4
390.4
398
98.8
99
98.6
97.6
99.5
0.006667
0.086667
0,06
0.1
0.073333
Anova de un factor
RESUMEN
Grupos
Muestra
Muestra
Muestra
Muestra
Muestra
A
B
e
D
E
Fuente de variacin
SC
gl
CM
Valor P
Entre muestras
Dentro de muestras
7.84
0.98
4
15
1. 96
30
5.34E-07 3.056
Total
8.82
19
0.0653
F crt
4.4.
81
Estrategia de muestreo
Si se realiza un anlisis de cada uno de los h incrementos de muestra (ejemplo anterior, Seccin 4.3), entonces los lmites de confianza para la media
vienen dados por la ecuacin (2.9):
(4.1)
3ro
o-
o:.
Ol
Ul
Ol
2....,
.....
"
Ol
Ul
82
4.5.
4.6.
2(J
r-
...n
3(J
x j;z,
(4.2)
(4.3)
Estas ecuaciones se utilizan en la construccin del tipo ms comn de diagramas de control, un diagrama de Shewhart (Figura 4.1). El eje vertical
de un diagrama de Shewhart representa la media del proceso, .\:, de los va-
Figura 4.1.
83
84
4.7.
--la situacin del laboratorio se encuentra vinculada directamente a la repetibilidad (desviacin estndar dentro del laboratorio) del mtodo (ver Captulo 1).
La variabilidad de un proceso se puede visualizar representando otro diagrama de Shewart para mostrar el rango, R (= valor ms grande - valor
ms pequeo), de cada una de las muestras tomadas. La Figura 4.2 muestra
un diagrama de control tpico para el rango. El formato general del diagrama
es el mismo que el que se ha utilizado al representar los valores medios, con
una lnea representando el valor objetivo, y tambin pares de lneas de
accin y de aviso. La diferencia ms relevante entre los dos diagramas es que
los pares de lneas no son simtricos con respecto al valor objetivo para el
rango, R. El valor de R se puede calcular utilizando el valor de (J, y las posiciones de las lneas de aviso y de accin se pueden deducir a partir de R,
utilizando factores multiplicativos obtenidos de las tablas estadsticas. Estos
factores toman valores dependiendo del tamao de muestra, n. Las ecuaciones relevantes son:
(4.4)
RW 1
(4.5)
RW 2
(4.6)
Ra 1
(4.7)
Ra2
(4.8)
Rango
Lnea de accin superior:
Valor objetivo:
Ra2
RW2
R
Tiempo
RW1
Figura 4.2.
Ra 1
85
86
EJEMPLO 4.7.1
Determnese las caractersticas de los diagramas de control para la media y el rango en un
proceso, siendo el valor objetivo 57, la capacidad del proceso 5 y el tamao muestral 4.
Para el diagrama de control en que se representan los valores medios, el clculo es
sencillo. Las lneas de aviso se encontrarn en 57 2 x 5/.j4, es decir, en 57 5; y las
lneas de accin estarn en 57 3 x 5/)4, es decir, en 57 7.5. Este diagrama se
muestra en la Figura 4.3.a.
Para el diagrama de control donde se representan los valores del rango, se debe primero calcular Rutilizando la ecuacin (4.4). Esto proporciona R = 5 x 2.059 = 10.29, donde el valor de 2.059 se toma de las tablas estadsticas para n = 4. (Ver, por ejemplo, la
tabla en la coleccin de Neave, cuyos detalles se proporcionan en la Bibliografa del Captulo 1.) El valor de Rse utiliza entonces para determinar las lneas de accin y aviso inferior
y superior utilizando las ecuaciones (4.5)-(4.8). Los valores de 1+1, ~, al Y 8 para n = 4
son 0.29, 1.94, 0.10 Y2.58, respectivamente, proporcionando al multiplicar por 10.29 posiciones para las cuatro lneas de 2.98, 19.96, 1.03 Y 26.55, respectivamente. Estas lneas
se muestran en la Figura 4.3b.
A veces en la prctica de un diagrama de control para el rango no se representan las lneas de aviso y de accin, ya que una reduccin en el rango no
suele ser una causa que requiera un anlisis detallado. Sin embargo, como ya
se ha puesto de manifiesto, la variabilidad de un proceso es una medida de
su calidad, y una reduccin en R representa una mejora en la calidad, cuyas
causas pueden ser motivo de investigacin. Por tanto, se recomienda la representacin de las lneas de aviso y de accin.
4.8.
87
Lnea de accin superior: 110+ 3a/vn =64.5
(a)
Rango
(b)
Lnea de accin superior:
Valor objetivo:
Ra2 =26.55
RW2 = 19.96
R = 10.29
Tiempo
RW1 = 2.98
Ra1 = 1.03
Figura 4.3. (a) Diagrama de Shewart para valores medios (ejemplo). (b) Diagrama de Shewart
para el rango (ejemplo).
x WR
Lneas de accin en x AR
Lneas de aviso en
(4.9)
(4.10)
88
EJEMPLO 4.8.1
Se ha analizado en un laboratorio un patrn de control de calidad interno con una concentracin de analito de 50 mg kg 1, durante 25 das consecu~vos tomndose un tamao de
muestra de cuatro cada dra. Los resultados se proporcionan en la Tabla 4.2, que est en
la forma de hoja de clculo de Excel. Determnese el valor de 11 y represntense los diagramas de control para la media y el rango de los anlisis del laboratorio.
Al examinar los resultados se aprecia de manera clara alguna evidencia de que las
medias se desvan hacia arriba y hacia abajo durante el perodo de 25 das en el cual se
ha realizado el anlisis. Todas las medias muestrales de los das 3-15 inclusive son ms
grandes que el valor objetivo de 50, mientras que cuatro de las siguientes seis .medias estn
por debajo del valor objetivo, y las ltimas cuatro estn todas por encima. Estas son las
circunstancias en las que resulta importante estimar (J utilizando el mtodo descrito anteriormente. Utilizando los valores de R en la ltima columna de datos, resulta que 11 es 4.31.
La aplicacin de la Ecuacin (4.4) estima (J como 4.31/2.059 = 2.09. La Tabla 4.2 demuestra tambin que la desviacin estndar de las 100 medidas, tratada como una muestra nica, es 2..43: porque debido a las des\liaciones en \a media esto sella una sobrestimacin
significativa de (J.
Entonces se representa el diagrama de control para la media con la ayuda de las Ecuaciones (4.9) y (4.10) con W= 0.4760, A = 0.7505, que muestra que las lneas de aviso y
accin se encuentran en 50 2.05 y 50 3.23, respectivamente. La Figura 4.4 muestra
el diagrama de control de Excel. De manera similar, las Ecuaciones (4.5)-(4.8) muestran que
en el diagrama de control para el rango, las lneas de aviso se encuentran en 1.24 y 8.32
Ylas lneas de accin en 0.42 y 11.09, respectivamente. (Excel no produce automticamente
diagramas de control para rangos, aunque genera diagramas para desviaciones estndar,
que en algunos casos se utilizan en lugar de diagramas de rango.) La Figura 4.4 muestra
que este proceso no se encuentra todava bajo control, cayendo varios puntos fuera de la
lnea de accin (superior).
ID
TI
(f)
55.00
53.00
51.00
TI
Q)
E 49.00
(f)
Cii
47.00
>
45.00
11
13
15
17
19
21
23
25
Nmero de muestra
Figura 4.4.
4.9.
Tabla 4.2.
Nmero de
muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
89
50.8
50.6
51. O
54.6
54.2
54.8
49.4
49.4
52.8
53.4
54.2
53.8
51. 7
50.9
54.9
50.3
51.9
46.5
52.5
47.7
48.9
51.1
52.5
51. 6
46.6
51. 3
49.3
49.3
50.7
48.3
52.3
52.3
49.7
49.7
52.3
49.9
51. 5
53.7
53.9
52.7
47.5
54.3
47.7
47.9
50.5
50.1
51. 5
52.9
49.1
53.9
d.e.
47.9
50.3
52.1
53.9
50.5
52.5
51.3
53.9
50.5
50.3
57.1
47.9
56.8
56.0
52.2
53.4
49.4
50.8
53. O
52.2
47.4
54.6
51.8
52.3
48.1
2.43
Media en
el diagrama
Rango
49.70
49.70
50.15
53.50
50.65
53.60
50.50
51.25
51.00
51.80
53.30
51.95
53.55
52.85
53.50
49.80
50.85
48.60
50.35
49.80
48.25
52.95
52.35
50.95
50.40
3.4
2.0
3.9
4.1
5.9
2.5
3.3
4.5
3.1
3.1
7.2
6.7
5.1
5.4
2.7
5.9
6.5
4.3
5.1
4.5
3.5
3.5
1.1
3.2
7.3
Media=4.31
;;,
1(J;;
(J;;
;;.
01
(")
o:.
01
o..
o..
ro
6!
Ul
:3
ro
o..
o:.
01
Ul
01
~
~,
r-+
:S'
01
Ul
Tabla 4.3.
90
Nmero de
observacin
Media
muestra/
Media muestra/,"
valor objetivo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
82
79
80
78
82
79
80
79
78
80
76
77
76
76
75
2
-1
Sumacu
2
1
1
-1
1
O
-2
2
-1
O
O
-1
-3
-3
-7
-10
-14
-18
-23
-1
-2
O
-4
-3
-4
-4
-5
diagrama de Shewhart (Figura 4.5) queda claro que a partir de aproximadamente la sptima observacin en adelante puede haber ocurrido un cambio
en la media del proceso, sin embargo todos los puntos quedan sobre o dentro
de la lnea de aviso. (Slo las lneas inferiores de aviso y de accin se muestran en la figura.)
El LMR puede reducirse significativamente utilizando un tipo de diagrama de control diferente, un diagrama de sumas acumuladas o sumacu
(<<cusum). Esta aproximacin se ilustra de nuevo con los datos de la Tabla
4.3. El clculo de la sumacu se muestra en las dos ltimas columnas de la
tabla, que muestra que la suma de las desviaciones de la media muestra1 a
partir del valor objetivo en adelante se realiza de forma acumulada, prestando cuidadosa atencin a los signos de las desviaciones. Si un proceso de fabricacin o anlisis est bajo control, las desviaciones positivas y negativas
del valor objetivo son igualmente probables y la sumacu oscilara alrededor
84
(/)
'5
<D
E
(/)
ro
>
72
70
11
13
Nmero de muestra
Figura 4.5.
15
91
:::l
()
ltl
:::l
(j)
9 10 11 12 13 14 15
Nmero de observacin
Figura 4.6.
:::l
()
ltl
E
:::l
(j)
(b)
e
e
~I
:::l
(j)
Nmero de observacin
O r--.=---~---'."---------=:'"""",,,,-----------
e
e
Figura 4.7. (a) Uso de un delimitador V con el proceso bajo control. (b) Uso de un delimitador
V con el proceso fuera de control.
92
proceso est bajo control si todos los valores del diagrama caen dentro de los
brazos de la V (Figura 4.7a). El delimitador tambin se caracteriza por tg 0,
la tangente del semingulo, 0, entre los brazos de la V. Los valores de d y tg e
se eligen de manera que se detecten con rapidez cambios significativos en la
media del proceso, no obstante las falsas alarmas son escasas. La unidad de
d es la distancia entre las observaciones sucesivas. El valor utilizado de tg ()
depende claramente de las escalas relativas de los dos ejes en el diagrama: un
convenio que se emplea con frecuencia consiste en construir la distancia entre las observaciones sucesivas del eje x igual a 2(j / ~ del eje g. Un delimitador V con d = 5 unidades y tg 0= 0.35 proporciona entonces una LMR de
10 si la media del proceso cambia por 1(j/~ y slo 4 si el cambio es 2(j/~.
La LMR para un cambio cero en la media del proceso, es decir, antes de que
ocurra una falsa alarma, es aproximadamente 350. Las cifras correspondientes para un diagrama de Shewart son aproximadamente 25 (para un cambio
en la media de 1(j /~) y 320, de manera que resulta claro que el diagrama
sumacu es superior en ambos aspectos. La LMR proporcionada por el diagrama sumacu se puede reducir en torno a 8 (para un cambio de 1(j /~) utilizando tg () = 0.30, pero inevitablemente entonces crece la posibilidad de una
falsa alarma, ocurriendo una vez en aproximadamente 120 observaciones.
En resumen, los diagramas sumacu presentan la ventaja de que responden con ms rapidez que los diagramas de Shewart a un cambio en la media
del proceso (como muestra claramente la Figura 4.6), sin incrementar las posibilidades de una falsa alarma. El punto donde cambia la pendiente en un
diagrama sumacu indica el punto donde ha cambiado la media del proceso,
indicando el valor de la pendiente el tamao del cambio. Naturalmente, si
un diagrama sumacu sugiere que ha ocurrido un cambio en la media del proceso se deben comprobar los posibles cambios en (j. Esto se puede hacer utilizando un diagrama de Shewart, no obstante tambin se pueden dibujar los
diagramas sumacu para rangos. En las referencias al final del captulo se proporcionan ms detalles sobre los usos de los diagramas de control.
4.10.
La calidad de las medidas analticas se refuerza a travs de dos tipos de esquemas de ensayo, en cada uno de los cuales una serie de laboratorios
podran participar simultneamente. En el primero de ellos, esquemas de
ensayo de suficiencia (ES), se envan partes alcuotas de materiales homogneos a una serie de laboratorios para que se hagan anlisis a intervalos
regulares (cada pocas semanas o meses), y se informa sobre los datos resultantes a un organizador central. Cada laboratorio analiza su parte utilizando
su propio mtodo habitual, y el material circulado se disea para que las
muestras se puedan volver a juntar. Los resultados de todos los anlisis circulan entre todos los participantes, beneficindose de conocer cmo se comparan sus medidas con las dems, cmo sus propias medidas mejoran o se
deterioran con el tiempo, y cmo sus propias medidas se comparan con un
estndar de calidad interno. En resumen, el objetivo de dichos esquemas es
la evaluacin de la capacidad de los laboratorios analticos. Los esquemas ES
'---
x z_=__
xa
-_-(J~
(4.11)
93
94
valor medio obtenido mediante un nmero de laboratorios expertos seleccionados. Todava en otros casos el nico valor factible asignado es un consenso obtenido a partir de los resultados de la mayora o de todos los laboratorios. Esta ltima situacin resulta de inters ya que, cuando muchos
laboratorios participan en un esquema ES dado, se est seguro de que aparecern una serie de datos sospechosos o anmalos en un ensayo individual.
(Se debera observar que, aunque muchos esquemas ES proporcionan muestras e informan sobre caractersticas de ms de un analito, la experiencia demuestra que un laboratorio que punta bien en un anlisis especfico no necesariamente punta bien en otros.) Este problema se ve solventado bien por
el uso de la mediana (vase el Captulo 6), que es especialmente recomendado para conjuntos de datos pequeos (n < 10), una media robusta (vase el
Captulo 6), o la media del recorrido intercuartL1ico (vase el Captulo 6). Todas estas medidas de localizacin evitan o dirigen los efectos de los resultados dudosos. Se recomienda tambin que se informe de la incertidumbre del
valor asignado a los participantes en el ES. Esto tambin se puede obtener
de los resultados de laboratorios expertos: las estimaciones de la incertidumbre se analizan posteriormente con ms detalle (Seccin 4.12).
El valor objetivo para la desviacin estndar, (1, debera circular de antemano entre los participantes ES junto con un resumen del mtodo por el
cual se ha establecido. Variar con la concentracin de analito, y una aproximacin a estimarlo es utilizar una relacin funcional entre concentracin
y desviacin estndar. La relacin mejor conocida es la trompeta de Horwitz,
fechada en 1982, denominada as por su forma. Utilizando muchos resultados de ensayos de colaboracin, Horwitz demostr que la desviacin estndar relativa de un mtodo variaba con la concentracin, c (e.g. mg g-l), de
acuerdo a la ecuacin emprica y aproximada:
DER
2(1- O.51ogc)
(4.12)
60
95
50
o~
ro-
r-
40
O!
>
30
()
20
o:
O!
'~
~
e
"O
'ro
(])
e
-10
';;;
-20
'o
;
ro
o..
o..
10
ro
(/)
(])
-30
-40
-50
100%
0,1%
1 ppm
1 ppb
1 ppt
Concentracin (e)
Figura 4,8.
La trompeta de Horwitz,
Laboratorio
Figura 4.9.
96
tT1
~
'
Pi
'<:
.o
e
3'
o
3
ro
:::t
O'
'O
@
.o
e
3'
'
Pi
Pi
:s
a:
()
Pi
4.11.
Ensayos de colaboracin
Como se ha visto, los esquemas de prueba de habilidad permiten que sea controlada, comparada y quiz mejorada la competencia de los laboratorios. En
contraste, un ensayo de colaboracin (Ee) pretende evaluar la precisin
de un mtodo analtico, y a veces su capacidad para proporcionar resultados
libres de sesgo. Consiste normalmente en un nico experimento implicando
a laboratorios expertos y competitivos, los cuales usan por definicin la misma tcnica. Los ensayos de colaboracin quiz se describen mejor como estudios de funcionamiento de mtodos.
Un experimento preliminar crucial es el ensayo de entereza, resistencia
o robustez. Como se vio en el Captulo 1, incluso los experimentos analticos
muy sencillos suponen varios pasos individuales y, quiz, el uso de un cierto
nmero de reactivos. As, muchos factores experimentales (por ejemplo,
temperatura, composicin del disolvente, pH, humedad, pureza de reactivos
y concentracin, etc.) afectarn a los resultados, y es esencial que dichos factores se identifiquen y estudien antes de que se emprenda cualquier ensayo
de colaboracin. En algunos casos un mtodo resulta ser tan sensible a pequeos cambios en un factor, que en la prctica es dificilsimo de controlar
(por ejemplo, reactivos de alta pureza) de modo que el mtodo se rechaza por
ser impracticable antes de que se efecte el EC. En otros casos el ensayo continuar, pero se prevendr a los colaboradores de aquellos factores que deben
ser controlados con ms cuidado. Aunque en el Captulo 7 se expone una
discusin ms completa del diseo experimental, es importante indicar aqu
que puede obtenerse mucha informacin de un nmero relativamente pequeo de experimentos. Supngase que se cree que siete factores experimentales
(A-G) podran afectar a los resultados de un anlisis. Estos factores tienen
que ser probados con (al menos) dos valores, denominados niveles, para ver
si son realmente significativos. As, si se pens que la temperatura afectaba
al resultado, se deben realizar experimentos preliminares a dos temperaturas
(niveles) y comparar los resultados. De manera similar, si la pureza de los
reactivos puede ser importante, se deben realizar experimentos con lotes de
reactivos de alta y baja pureza. Entonces podra pensarse que sern necesarios 2 7 experimentos preliminares para cubrir todas las combinaciones posibles de siete factores a dos niveles. Sin embargo, en la prctica slo ocho
experimentos proporcionarn informacin importante. Los dos niveles de los
factores se denominan + y -, y la Tabla 4.4 muestra cmo estos niveles
estn situados en los ocho experimentos, cuyos resultados se denominan y l'
Yz, oo., Ys. El efecto de alterar cada uno de los factores de su nivel alto a su
nivel bajo se calcula fcilmente. As, el efecto de cambiar B de + a - viene
dado por 011 + Jjz + Ys + Y6)/4 - 013 + Y4 + Y7 + Ys)/4.
Cuando las siete diferencias de los factores (A-G) se hayan calculado en
su totalidad de este modo, es fcil identificar cualquier factor que tenga un
efecto preocupante en los resultados. Se puede demostrar que cualquier diferencia que sea ms de dos veces la desviacin estndar de medidas repetidas
es significativa y debe estudiarse posteriormente. Este simple conjunto de
experimentos, tcnicamente conocido como diseo factorial incompleto,
tiene la desventaja que no se pueden detectar las interacciones entre los factores. Este aspecto se analizar en el Captulo 7.
Tabla 4.4.
Experimento
2
3
4
5
6
7
8
Factores
Resultado
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
.Y1
12
Y3
Y4
Y5
Y6
Y7
Y8
SR
si
S, + 51,
?
(4.13)
97
98
se supone que cada laboratorio participante hace slo dos medidas a cada
nivel):
2
W max
2
L.. Wj
e ="
(4.14)
Muestra X
Figura 4.10.
zontales y verticales a travs del punto (X, Y), este punto divide el diagrama
en cuatro cuadrantes. Este diagrama permite evaluar la existencia en el ensayo de errores aleatorios y sesgo. Si slo existen errores aleatorios, las determinaciones de X e Y pueden dar resultados que son a la vez demasiado
altos, a la vez demasiado bajos, X alto e Y bajo, o X bajo e Y alto. Estos
cuatro resultados podran ser aproximadamente iguales, y el nmero de puntos en cada uno de los cuadrantes sera aproximadamente igual. Sin embargo, si existen errores sistemticos en el laboratorio, es probable que sus
resultados para X e Y sean altos, o bajos. As, si los errores sistemticos predominan, muchos de los puntos estarn en los cuadrantes del diagrama superior derecho e inferior izquierdo. ste es de hecho el resultado obtenido
en muchos casos. En el caso imposible de ausencia de errores aleatorios, todos los puntos deberan caer sobre la diagonal de 45 con los ejes del diagrama, de manera que cuando en la prctica tales errores estn presentes, la
distancia de la perpendicular de un punto desde esa lnea proporciona una
medida del error aleatorio del laboratorio. Adems, la distancia de la interseccin de la perpendicular con la lnea de 45 al punto (X, y) mide el error
sistemtico del laboratorio. Esta sencilla aproximacin a los ensayos de colaboracin es por tanto capaz de proporcionar de forma sencilla una buena
cantidad de informacin. La aproximacin de Youden tiene la ventaja adicional de que los laboratorios participantes no tienden a suprimir una o ms
determinaciones repetidas, pudindose estudiar muchos materiales sin considerar un gran nmero de experimentos.
Los diagramas de Youden proporcionan una buena cantidad de informacin accesible de manera inmediata pero todava se necesitan mtodos de clEl siguiente ejemplo muestra cmo se puede hacer
culo de varianzas s~ y
esto de forma sencilla.
s;.
EJEMPLO 4.11.1
Se determinaron en nueve laboratorios (1-9) los niveles de plomo (en ng g 1) en dos muestras similares (X e l') de formulaciones de leche en polvo para nios, utilizando espectrometra de absorcin atmica con hamo de grafito. Los resultados fueron:
Muestra
X
Y
Laboratorios
1
35.1
33.0
23.0
23.2
23.8
22.3
25.6
24.1
23.7
23.6
21.0
23.1
23.0
21.0
26.5
25.6
21.4
25.0
99
100
por cada laboratorio para la muestra X puede incluir un error sistemtico. El mismo error
sistemtico se incluir presumiblemente en aquel resultado de laboratorio para la muestra
y La diferencia D( = X - Y) tendr por tanto eliminado este error, de manera que el intervalo de los valores de D proporcionarn una estimacin de los errores aleatorios o de medida. Similarmente, X e Ypuedr;ln acumularse para dar T, cuya variabilidad proporciona una
estimacin de la variacin global de los resultados. La varianza se estima por:
(D,i=_i
r
y la varianza global,
;,1;\
lJ2
_
(4.15)
2(n-1)
(lj_7)2
S~=-'.i
(4.16)
2(n - 1)
Ntese que cada una de estas ecuaciones incluye un 2 en el denominador. Esto se justifica
porque Dy Tdan las estimaciones de los errores en dos series de resultados, que se restan
y suman a D y T respectivamente. Los resultados de este ensayo puede expresarse en una
tabla como sigue:
Y
D
35.1
33.0
2.1
68.1
23.0
23.2
-0.2
46.2
23.8
22.3
1.5
46.1
25.6
24.1
1.5
49.7
23.7
23.6
0.1
47.3
21.0
23.1
-2.1
44.1
23.0
21.0
2.0
44.0
26.5
25.6
0.9
52.1
21.4
25.0
-3.6
46.4
La tercera y cuarta filas de la tabla pueden utilizarse para demostrar que l) = 0.244 Y
T= 49.33. Las ecuaciones (4.15) y (4.16) muestran que la varianza global y la varinza de
las medidas son (5.296)2 y (1.383)2, respectivamente. Pueden ser comparadas corno de costumbre utilizando el contraste F, dando F = 14.67. El valor crtico, Fe.a, es 3.44(P = 0.05),
de manera que la variacin entre laboratorios no puede ser debida a errores aleatorios. El
componente debido al sesgo, SL' viene aqu dado por:
(4,17)
Ntese de nuevo la aparicin del 2 en la Ecuacin (4.17), porque se estudian dos muestras.
Es fcil calcular que la estimacin de .si es (3.615f. La media de todas las medidas es
49.33/2 = 24.665, de manera que la desviacin estndar relativa es (100 x 5.296)/
24.665 = 21.47%. ste parece ser un valor alto, pero la relacin de la trompeta de Horwitz
predecira un valor incluso ms alto de ca. 28% a este nivel de concentracin. Debera
hacerse constar que los posibles valores anmalos no se consideran en el procedimiento de
Youden, de manera que la posibilidad de rechazo de los resultados del laboratorio 1 no
prospera,
4.12.
Incertidumbre
En el Captulo 1 se aprendi que los procedimientos analticos se encontrarn afectados tanto por errores aleatorios como por sesgo. En los ltimos
aos UIl nmero cada vez mayor de qumicos analticos ha ido reconociendo
la importancia de proporcionar para cada anlisis un nico nmero que describa su efecto combinado. La incertidumbre de un resultado es un parmetro que describe un intervalo dentro del cual se espera que se encuentre
la cantidad medida, teniendo en cuenta todas las fuentes de error. El concepto se encuentra muy asentado en las medidas fsicas. Su valor en la qumica
analtica resulta tambin innegable, aunque ciertas preguntas y controversias
permanecen acerca de la facilidad de su interpretacin por parte de organismos pblicos, asociaciones profesionales y el pblico profano, as como sobre
los mejores mtodos para calcularlo. Para expresar la incertidumbre se emplean dos smbolos. La incertidumbre estndar (u) expresa el concepto como una desviacin estndar. La incertidumbre expandida (U) define un
intervalo que abarca una fraccin grande de valores dentro de los cuales caer la cantidad que se est midiendo y se obtiene multiplicando u por un factor de cobertura, k, elegido segn el grado de confianza exigido para el rango, es decir, U = u x k. Puesto que u es anloga a una desviacin estndar,
si le es 2 (ste es el valor por defecto generalmente tomado si no se da otra
informacin), entonces U proporciona aproximadamente una mitad del
intervalo de confianza del 9S %.
En principio, se encuentran disponibles dos aproximaciones bsicas para
estimar la incertidumbre. La aproximacin de abajo hacia arriba identifica
cada etapa separada de un anlisis, incluyendo siempre que sea posible fases
de muestreo, asigna errores aleatorios y sistemticos apropiados a cada una
de ellas, y luego combina estas componentes utilizando las reglas resumidas
en la Seccin 2.11 para proporcionar un valor de u global. Sin embargo, por
una serie de razones este proceso puede no ser tan simple como parece. El
primer problema es que incluso los procesos analticos simples pueden conllevar muchos pasos experimentales individuales y posibles fuentes de error.
Es fcil pasar por alto algunas de estas fuentes y, por tanto, llegar a un valor
de incertidumbre muy optimista. Si todas las fuentes de error se identifican
por completo, entonces el proceso del clculo global resultar bastante largo.
Ejemplos de fuentes de error que se deberan considerar pero que se omiten
con facilidad, incluyen sesgo del operador; sesgo del instrumento, incluyendo
el transporte de muestra; suposiciones relativas a la pureza del reactivo; uso
de aparatos volumtricos a una temperatura diferente de aquella a la que se
calibraron; cambios en la composicin de la muestra durante el anlisis, bien
debidos a la contaminacin o debidos a la inestabilidad inherente; uso de calculadoras o computadoras con prestaciones inadecuadas o con el modelo estadstico aplicado equivocado, etc. Todos estos factores puede que surjan
adems de los errores aleatorios que inevitablemente ocurren en las medidas
repetidas. Mientras que los ltimos se pueden estimar directamente mediante medidas repetidas, algunos de los sistemticos puede que no sean inherentes al experimento, y tengan que ser estimados empleando la experiencia, o
la informacin de los fabricantes del equipo tales como los certificados de
calibracin o las especificaciones del instrumento.
Otro problema es que, como se demostr en el Captulo 2, los errores sistemticos no se prestan inmediatamente por ellos mismos al tratamiento estadstico en la misma forma que los aleatorios. Entonces, cmo se pueden
combinar con los errores aleatorios para proporcionar un valor global u?
(Todava resulta una buena prctica minimizar los errores sistemticos me-
101
102
arriba, y hay un gran ahorro de esfuerzo, ya que los resultados del esquema
ES (pruebas de suficiencia) proporcionan directamente estimaciones de la
incertidumbre. Por otra parte, los esquemas ES emplean varios mtodos analticos, as que razonablemente se podra decir que la incertidumbre de los
resultados de un laboratorio que tiene dilatada experiencia en un nico mtodo podran ser mejores (ms pequeos) que los resultados ES sugeriran.
De nuevo, los esquemas ES utilizan materiales de una nica muestra preparados con gran cuidado. Por tanto, se podran pasar por alto algunos errores
de muestreo que ocurriran en un anlisis genuino.
Estos problemas han conducido a algunos organismos a proponer mtodos ms simples, explcitamente diseados para minimizar la carga de trabajo en laboratorios que emplean una serie de procedimientos analticos. En
una de esas aproximaciones los principios bsicos son: (1) Los errores sistemticos no se incluyen en las estimaciones de la incertidumbre, pero se
establecen empleando materiales de referencia como es habitual y as se corrigen o eliminan. (2) Se toman al menos 10 medidas replicadas sobre muestras autnticas estables y bien caracterizadas o sobre materiales de referencia.
(Esto implica nuevamente que las incertidumbres del muestreo no se incluyan en las estimaciones.) (3) Las incertidumbres se calculan de las
desviaciones estndar de las medIdas realizadas en condiciones de reproducibilidad internas, es decir, con analistas diferentes, utilizando concentraciones
diferentes (incluyendo cualquiera que sea relevante a los requerimientos legales), y en todas las matrices relevantes. Estas condiciones se supone que
reproducen mimticamente aquellas que se presentan en un laboratorio en
las operaciones diarias. Se realiza alguna provisin en aquellas circunstancias en que no se puedan lograr las condiciones de reproducibilidad (por
ejemplo, donde las muestras sean intrnsecamente inestables). Este mtodo
parece ser muy simple, pero puede ser adecuado: de hecho, puede ser el nico mtodo practicable en algunos casos.
Las estimaciones de la incertidumbre son importantes no slo para cualquiera que haya suministrado una muestra para su anlisis y que exija un
intervalo de valores donde debera caer la concentracin verdadera del analito. Tambin son valiosas para demostrar que un laboratorio tiene la capacidad para realizar anlisis de significacin legal o estatutaria. Una vez que
en un laboratorio dado se conoce un valor de incertidumbre para un anlisis
concreto, resulta simple interpretar los resultados con relacin a tal referencia o a otros lmites de especificacin. La Figura 4.11 muestra cuatro situaciones posibles, donde se supone que se ha utilizado un factor de cobertura
de 2 para determinar U al nivel del 95 % (el intervalo del 95 % se muestra
mediante las flechas dobles verticales), y donde se han especificado tanto el
lmite superior como el inferior para la concentracin del analito. Estos lmites se indican mediante lneas horizontales.
En el caso A, el intervalo de incertidumbre cae completamente entre los
lmites superior e inferior especificados, de manera que se ha logrado la conformidad con la especificacin. En el caso B, el intervalo al 95 % se extiende
ms all del lmite superior, de manera que aunque es ms verosmil que no
haya conformidad, no se puede verificar completamente al nivel del 95 %. En
el caso e la conformidad es muy improbable, aunque no imposible, y en el
caso D es claro que no 10 cumple.
103
104
t
t
Figura 4.11. El uso de la incertidumbre para contrastar conformidad con los lmites
de especificacin.
4.13.
Muestreo de aceptacin
x x
x,
(4.18)
El valor 1.64 se puede encontrar en la tabla A.2 (ver tambin la Seccin 2.2).
Supngase tambin que el cliente est preparado para aceptar un riesgo del
10 % de aceptar un lote con la impureza en el NCT. Entonces se puede escribir de manera similar:
(4.19)
Puesto que en la prctica los valores de Jlo Y II! se habrn acordado de antemano, las ecuaciones (4.18) y (4.19) proporcionan ecuaciones simultneas
que se pueden resolver para obtener n y ~xo'
EJEMPLO 4.13.1
. Determnese n y Xo para el caso donde el NCA y el NCT son 1.00g kg -1 Y 1.05 9 kg - 1
de impureza, respectivamente, los riesgos del fabricante y del cliente son del 5% y 10%,
respectivamente, y (J es 0.05 9 kg -- l.
.
La solucin a este problema conlleva el uso de las ecuaciones (7.10) Y (7.11) con Po Y
{11 tomando los valores de 1.00 y 1.05,' respectivamente. Mediante la transformacin de
estas ecuaciones se puede escribir:
n = [(1.64
Xo
+ 1.28)Q;05/(1.05 - 1.00)]2
[(1.64 x 1.05)
+ (1.28
1.00)/(1.64 + 1.28)
105
106
Bibliografa
Lawn, R. E., Thompson, M. and Walker, R. F. 1997. Proficiency Testing in
Analytical Chemistry, Royal Society of Chemistry, London. (Un claro y
actualizado tratado de esquemas ES.)
Massart, D. L., Vandeginste, B. G. M., Buydens, L. M. C., de long, S., Lewi,
P. J. and Smeyers-Verbeke, J. 1997. Handhook of Chemometrics and Qualimetrics, Part A. Elsevier, Amsterdam. (Extenso tratamiento de muchos
tpicos relacionados con la calidad.)
Montgomery, D. C.1985. Introduction to Statistical Quality Control. Wiley,
New York. (Un texto general clsico de la estadstica del control de calidad.)
Pritchard, E. 1995. Quality in the Analytical Chemistry Lahoratory, Wiley,
Chichester. (Introduccin clara de los aspectos generales de la calidad,
con discusin de la incertidumbre.)
Wernimont, G. T. and Spendley, W. 1985. Use of Statistics to Develop and
Evaluate Analytical Methods. AOAC, Arlington, USA. (Constituye la
continuacin de ms relevancia sobre la obra de Youden y Steiner.)
Youden, W. J. and Steiner, E.H. 1975. Statistical Manual of the Association
of Official Analytical Chemists. AOAC, Arlington, USA. (Texto clsico
con mucho nfasis sobre los ensayos de colaboracin.)
Ejercicios
1.
Oa
1
2
3
4
Concentraciones
63
57
50
57
Para estimar las varianzas de medidas y muestreos se determin la concentracin de halofuginona en hgado de pollo, se tomaron cuatro incrementos de muestra de diferentes partes del hgado y se tomaron medidas
por triplicado sobre cada una de ellas. Se obtuvieron los siguientes resultados (mg Kg- 1):
Muestra
Medidas repetidas
0.25
0.22
0.19
0.24
e
D
0.22
0.20
0.21
0.22
0.23
0.19
0.20
0.22
5.
48.8
48.6
48.2
54.8
49.6
54.8
Valores
50.8
50.6
51.0
54.6
54.2
54.8
51.3
49.3
49.3
50.7
48.3
52.3
47.9
49.7
50.3
53.9
50.5
52.5
107
108
Laboratorio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
8.8
3.8
10.1
8.0
5.0
5.2
6.7
9.3
6.9
3.2
9.7
7.2
6.5
9.7
5.0
10.0
4.7
12.1
11.0
4.7
6.4
8.7
9.6
7.5
2.8
10.4
8.3
6.8
7.2
6.0
Dibujar el diagrama de dos muestras con estos datos, y comentar la principal fuente de error en el ensayo de colaboracin. Estimar la varianza
global, la varianza de la medida y el componente de error sistemtico de
la varianza de los resultados.
6.
El valor objetivo para un anlisis particular es 120. Si los ensayos preliminares muestran que las muestras de tamao 5 dan un valor de 7, establecer los diagramas de Shewhart de la media y del rango para muestras del mismo tamao.
7.
1
2
3
4
5
6
7
8
9
10
11
12
13
79.8
80.2
79.4
80.3
80.4
80.1
80.4
80.2
80.0
79.9
79.7
79.6
79.5
Da
14
15
16
17
18
19
20
79.3
79.2
79.3
79.0
79.1
79.3
79.1
109
Mtodos de calibracin
en anlisis instrumental:
regresin y correlacin
5.1.
Las tcnicas de anlisis clsicas o qumica hmeda como volumetras y gravimetras continuan utilizndose en muchos laboratorios y an se ensean
ampliamente en cursos de Qumica Analtica. Dichas tcnicas suministran
excelentes introducciones a la manipulacin y otras prcticas requeridas en
el trabajo analtico, son ideales para anlisis de alta precisin, especialmente
cuando estn involucrados un pequeo nmero de muestras, y algunas veces
son necesarias para anlisis de materiales patrn. Sin embargo, no hay duda
que muchos anlisis se llevan a cabo en este momento por mtodos instrumentales. Tcnicas que utilizan espectroscopa de absorcin o emisin a varias longitudes de onda, diferentes mtodos electroqumicos, espectrometra
de masas, cromatografa gaseosa y lquida, mtodos radioqumicos y trmicos, probablemente suponen al menos el 90 % de todo el trabajo analtico
actual. Hay varias razones para esto.
En primer lugar, los mtodos instrumentales pueden realizar anlisis que
son difciles o imposibles por los mtodos clsicos. Mientras que los mtodos
clsicos pueden detectar raramente especies qumicas a niveles de sub-microgramos, muchos mtodos instrumentales son sorprendentemente sensibles.
Por ejemplo, en los ltimos aos se han utilizado mtodos de fluorescencia
para detectar molculas orgnicas en volmenes de disolucin muy pequeos. Normalmente slo es posible determinar un analito de una vez mediante mtodos por va hmeda, si bien la espectrometra de plasma puede
determinar diez o ms elementos simultneamente (y a muy baja concentracin). De forma similar, los mtodos que combinan la cromatografa lquida
de alta resolucin con un procedimiento de deteccin espectroscpica pueden identificar y determinar muchos componentes de mezclas orgnicas
complejas en pocos minutos. An ms, el intervalo de concentracin de un
mtodo de anlisis clsico concreto est usualmente limitado por consideraciones tericas y prcticas. As, valoraciones con AEDT pueden ser realiza-
112
das con xito con concentraciones de reactivo del orden de 10- 4 M, sin embargo un lmite superior (ca. 0.3 M) est restringido por la solubilidad del
AEDT en agua. El intervalo de concentracin til en anlisis clsico es generalmente de 2-3 rdenes de magnitud (es decir, potencias de 10). En contraposicin, algunos mtodos instrumentales son capaces de determinar concentraciones de analito en el intervalo de seis o ms rdenes de magnitud:
esta caracterstica tiene importantes repercusiones para el tratamiento estadstico de los resultados, como se ver en la prxima seccin.
En segundo lugar, para una gran variedad de muestras, el anlisis instrumental suele ser ms rpido y a menudo ms barato que la laboriosidad de
los mtodos manuales. En anlisis clnicos, por ejemplo, se presenta con frecuencia la necesidad de realizar el mismo anlisis en una veintena o aun
cientos de muestras de sangre o suero/plasma sanguneo cada da. A pesar
del alto coste inicial del equipo, tal trabajo se realiza generalmente usando
sistemas completamente automatizados. La automatizacin ha llegado a ser
de tal importancia en la qumica analtica, que la facilidad con que una tcnica particular pueda ser automatizada, es la que a menudo determina el que
sea o no usada del todo. Un mtodo automtico tpico ofrece la posibilidad
de procesar muestras a la velocidad de 100 por hora o ms. El equipo tomar
un volumen medido de muestra, la diluir adecuadament,e, provocar una o
ms reacciones con ella, y determinar y registrar la concentracin del analito o un derivado formado en las reacciones. Otras reas donde el uso de
equipamiento automtico es decisivo incluyen el control medioambiental y
el campo del anlisis de los procesos industriales cuyo crecimiento evoluciona con rapidez. En todas estas aplicaciones del anlisis automtico, surgirn
evidentemente problemas especiales de estimacin de errores: errores sistemticos, por ejemplo, deben ser identificados y corregidos tan rpidamente
como sea posible.
En ltimo lugar, los modernos instrumentos analticos estn casi siempre
interconectados con computadoras personales que proporcionan sofisticados
sistemas de control y de almacenamiento, tratamiento (por ejemplo, la prestacin de la transformada de Fourier o clculos de espectros de derivadas) e
informes de datos. Tales sistemas pueden tambin evaluar estadsticamente
los resultados, y para comparar espectros y otra informacin se tienen en
cuenta los resultados analticos y los que existen en libreras de datos. Todos
estos recursos se consiguen actualmente utilizando computadoras de bajo
coste que operan a grandes velocidades. Otra posibilidad importante es el desarrollo de instrumentos inteligentes los cuales incorporan configuraciones
automticas y diagnosis de fallos y pueden realizar procesos de optimizacin
(vase el Captulo 7).
Los procedimientos estadsticos utilizados en anlisis instrumental deben
proporcionar siempre informacin de la precisin y exactitud de las medidas. Deben reflejar adems las ventajas tcnicas de dichos mtodos, especialmente la posibilidad de cubrir un gran intervalo de concentraciones
(incluyendo concentraciones muy bajas), y manejar con rapidez muchas
muestras. (En este captulo no se abordarn mtodos que faciliten la determinacin de ms de un analito. Este tpico se comenta en el Captulo 8.) En
la prctica se calculan los resultados y se evalan los errores de manera que
difieran de los utilizados cuando una medida sencilla se repita varias veces.
5.2.
El procedimiento habitual es el siguiente. El analista toma una serie de materiales (normalmente al menos tres o cuatro, y posiblemente algunos ms)
de los que se conoce la concentracin de analito. Estos patrones de calibracin
se miden en el instrumento analtico bajo las mismas condiciones que las
utilizadas posteriormente para los materiales de ensayo (es decir, los desconocidos). Una vez establecida la grfica de calibrado, puede obtenerse la
concentracin de analito por interpolacin, como se muestra en la Figura
5.1, en cualquier material de ensayo. Este procedimiento general plantea varias cuestiones estadsticas importantes:
1.
2.
3.
4.
5.
ro
'e
Q)
(/)
Concentracin
113
114
5.3.
En esta seccin se analiza el primer problema planteado en la seccin anterior: es la representacin grfica del calibrado lineal? Para estimar la
bondad con que se ajustan los puntos experimentales a una lnea recta, se
calcula el coeficiente de correlacin momento-producto, r. Para simplificar, a este dato estadstico se le denomina coeficiente de correlacin debido
a que en las ciencias cuantitativas es con mucho el tipo de coeficiente de
correlacin ms usado. No obstante, en el Captulo 6 se encontrarn otros
tipos de coeficientes de correlacin. El valor de r viene dado por:
El coeficiente de correlacin momento-producto,
(=+1
o
Figura 5.2.
115
116
cin negativa perfecta, es decir, todos los puntos experimentales estn sobre
una recta de pendiente negativa. De manera similar, cuando r = + 1 se tiene
una correlacin positiva perfecta, es decir, todos los puntos estn exactamente sobre una lnea de pendiente positiva. Cuando no existe correlacin
entre x e Ji el valor de r es cero. En la prctica analtica, las grficas de calibrado proporcionan valores numricos de r mayores que 0.99, y valores de
r menores que aproximadamente 0.90 son relativamente poco comunes. Un
ejemplo tpico de un clculo de r aclara una serie de aspectos importantes.
EJEMPLO 5.3.1
Se han examinado una serie de soluciones patrn de fluoresceina en un espectrmetro de
fluorescencia, y han conducido a las siguientes intensidades de fluorescencia (en unidades
arbitrarias):
Intensidades de fluorescencia:
Concentracin, pg ml- 1
2.1
O
5.0
2
9.0
4
12.6
6
17.3
8
21.0
10
24.7
12
Sumas:
Xi-X
O
2
4
6
8
10
12
2.1
5.0
9.0
12.6
17.3
21.0
24.7
-6
-4
-2
O
2
4
6
42
91.7
(X- X2
36
16
4
O
4
16
36
112
Yi-
-11.0
-8.1
-4.1
-0.5
4.2
7.9
11.6
O
(Y_ y2
(x- X)(YI- y
121.00
65.61
16.81
0.25
17.64
62.41
134.56
66.0
32.4
8.2
O
8.4
31.6
69.6
418.28
216.2
Los nmeros por debajo de la lnea al pie de las columnas son en cada caso las sumas de
los nmeros de la tabla: ntese que I (XI - X y I (Yi - ..J1 son ambas cero. Usando estos
totales y la Ecuacin -(5.2), se tiene que:
r=
216.2
J112 x 418.28
216.2
= -- =
216.44
0.9989
25
117
20
Cll
'(3
15
Q)
<.>
en
~
:::J
u::
10
2. 4
10
Concentracin, pg ml-
Figura 5.3.
12
1
preciar los nmeros despus del punto decimal traera consigo un valor incorrecto de r de exactamente 1, y utilizando solamente una cifra decimal
supondra considerar para r el valor incorrecto de 0.9991. Este aspecto es
especialmente importante cuando se utiliza una calculadora o computadora
para determinar r; es necesario asegurar que tales herramientas proporcionen cifras suficientes.
Aunque los coeficientes de correlacin son simples de calcular, son con
facilidad mal interpretados. Debe tenerse siempre en cuenta que el uso de la
Ecuacin (5.2) generar un valor de r aun cuando los datos muestren de manera patente un carcter no lineal. La Figura 5.4 muestra dos ejemplos en
los que un clculo de r llevara a conclusiones errneas. En la Figura 5.4a,
los puntos del grfico de calibrado pertenecen claramente a una curva; esta
curva es suficientemente suave, sin embargo, se obtiene un alto coeficiente
de correlacin cuando se aplica la Ecuacin (5.2). La leccin que se extrae
de este ejemplo es que siempre se debe representar la curva de calibrado (en
papel milimetrado o en un monitor de computadora); si no es as, se puede
deducir errneamente del clculo de r una relacin de carcter lineal. La
Figura 5.4b pone de manifiesto que un coeficiente de correlacin cero no
significa exactamente que Jj y x no estn relacionadas; slo significa que no
estn linealmente relacionados.
Como se ha visto, los valores de r obtenidos en anlisis instrumental son
normalmente muy altos, de manera que un valor calculado, junto con la
propia grfica de calibrado, suele ser a menudo suficiente para asegurar al
analista que de hecho ha obtenido una relacin lineal til. Sin embargo, en
118
(a)
(b)
Figura 5.4.
algunas circunstancias, se obtienen valores de r mucho ms bajos; dichas situaciones se analizarn posteriormente en la Seccin 5.9. En estos casos ser
necesario emplear un contraste estadstico adecuado para ver si el coeficiente
de correlacin es realmente significativo, teniendo en cuenta el nmero de
puntos usados en su clculo. El mtodo ms simple de hacer esto es calcular
un valor de t (vase el Captulo 3 para un estudio ms completo del contraste t), usando la siguiente ecuacin:
Irl~
---===-
correlacin
(5.3)
El valor de t calculado se compara con el valor tabulado al nivel de significacin deseado, utilizando un contraste t de dos colas y (n - 2) grados de
libertad. La hiptesis nula en este caso es que no existe correlacin entre x
e y. Si el valor calculado de t es mayor que el valor tabulado, se rechaza la
hiptesis nula y se concluye en tal caso que existe una correlacin significativa. Como se esperaba, cuanto ms prximo est Ir I de 1, es decir,
cuanto ms acusada se haga la relacin lineal, se obtienen valores ms
grandes de t.
119
En esta seccin se supone que existe una relacin lineal entre la seal analtica (y) y la concentracin (x), y se muestra cmo calcular la mejor lnea
recta a travs de los puntos de la grfica de calibrado, cada uno de los cuales
est sujeto a un error experimental. Ya que se ha supuesto que todos los
errores se encuentran en y (vase la Seccin 5.2), ahora se trata de buscar
la recta que minimice las desviaciones en la direccin y, entre los puntos
experimentales y los calculados por la lnea. Ya que algunas de estas desviaciones sern positivas y algunas negativas (conocidas tcnicamente como los
residuos de y; ver ms adelante), es -razonable intentar minimizar la suma
de los cuadrados de los residuos, debido a que estos cuadrados sern todos
positivos. Esto explica el uso frecuente del trmino mtodo de los mnimos
cuadrados para este procedimiento. La lnea recta buscada se calcula basndose en este principio: como resultado se encuentra que la lnea debe pasar
por el centro de gravedad de los puntos c.x:, jj).
Se puede demostrar que la recta de mnimos cuadrados viene dada por:
Pendiente de la recta de mnimos cuadrados:
b=
..c.i
(5.4)
jj -
bx
(5.5)
120
2.:J.r,~(y- Yl =
,
216.2;
(x
W=
112;
x= 6; y=
13.1
a = 13.1 - (1.93
= 1.93
1.93x + 1.52.
Los resultados de la pendiente y ordenada en el origen se dibujan en la Figura 5.3. De nuevo es importante recalcar que las Ecuaciones (5.4) y (5.5)
no deben utilizarse mal: darn slo resultados tiles cuando un estudio previo (clculo de r y una inspeccin visual de los puntos) indique que una lnea
recta es coherente con el experimento que se trata.
Para calcular rectas de regresin pueden usarse tambin mtodos no paramtricos (es decir, mtodos que no hacen supuestos acerca de la naturaleza
de la distribucin de error), y este tema se tratar en el Captulo 6.
5.5.
La recta de regresin calculada en la seccin anterior se u tilizar en la prctica para estimar la concentracin de las muestras de ensayo por interpolacin, y quiz tambin para estimar el lmite de deteccin del procedimiento
analtico. Los errores aleatorios en los valores de la pendiente y ordenada en
el origen son importantes, considerndose ahora las ecuaciones utilizadas para calcularlos. En primer lugar se debe calcular el estadistico .~y/.\, que estima
los errores aleatorios en la direccin /jo
(5.6)
Se comprueba que esta ecuacin utiliza los residuos de g, g; - Yi' donde los
valores de Yi son los puntos sobre la recta de regresin calculada correspondientes a los valores individuales de x, es decir, los valores de y ajustados"
(Figura 5.5). El valor de Y, para un valor de .x dado se calcula rpidamente
a partir de la ecuacin de regresin. La Ecuacin (5.6) es claramente similar
a la forma de la ecuacin de la desviacin estndar de una serie de medidas
repetidas [Ecuacin (2.2)], pero difiere en que las desviaciones, (/ji - jj), se
sustituyen por los residuos, (y; - iJJ, conteniendo el denominador el trmino (n - 2) en vez de (n - 1). En un clculo de regresin lineal el nmero de
121
x
Figura 5.5.
5'
CJl
q-
grados de libertad (vase la Seccin 2.7) es (n - 2). Esto refleja el hecho obvio que de dos puntos slo puede obtenerse una lnea recta.
Una vez obtenido un valor de Sy/x, se puede calcular Sb Y Sm l~s desviaciones estndar de la pendiente (b) y ordenada en el origen (a). Estas vienen
dadas por:
(5.7)
(5.8)
(Xi -
Los valores de Sb Y Sa se pueden utilizar de la manera usual (vase el Captulo 2) para estimar los lmites de confianza de la pendiente y de la ordenada
en el origen. As pues los lmites de confianza de la pendiente vienen dados
por h ten _ 2)Sb! donde el valor de t se obtiene para un nivel de confianza
deseado y (n - 2) grados de libertad. Similarmente los lmites de confianza
para la ordenada en el origen vienen dados por a ten - 2)sa'
ro
::l
122
EJEMPLO 5.5.1
Calcular la desviacin estndar y los lmites de confianza para la pendiente y ordenada en
el origen de la recta de regresin calculada en la Seccin 5.4.
Este clculo puede que no sea realizable dirctamente en una calculadora simple, aunque se encuentran disponibles programas de computadora. Aqu se desarrolla el clculo
manualmente, utilizando una tabla estructurada.
Xi
x3
lf --
O
2
4
6
8
10
12
O
4
16
36
64
100
144
2.1
5.0
9.0
12.6
17.3
21.0
24.7
1.52
5.38
9.24
13.10
16.96
20.82
24.68
0.58
0.38
0.24
0.50
0.34
0.18
0.02
I x3 = 364
i
~,
(f- ~l
0.3364
0.1444
0.0576
0.2500
0.1156
0.0324
0.0004
(f - Ji)'2 = 0.9368
= )0.9368/5 =
(Xi - jf =
)0.18736
= 0.4329
(2.57
x 0.0409) = 1.93
i/.
0.11
= 0.4329
364
7 x 112 = 0.2950
a = 1.52 (2.57
x 0.2950)
= 1.52 0.76
5.6.
123
(5.9)
En esta ecuacin, Yo es el valor experimental de y a partir del cual se determina el valor de la concentracin x o, sXo es la desviacin estndar estimada
de x o, y los otros smbolos tienen su significado habitual. En algunos casos
un analista puede realizar varias lecturas para obtener el valor de Yo; si se
dispone de m lecturas, entonces la ecuacin para sXo se convierte en:
(5.10)
124
Para obtener los valores de s"! correspondientes a los valores de Xo utilzamos la Ecuacin
(5.9), recordando de las secciones precedentes que n= 7, b= 1.93, s)1x=0.4329,
y = 13.1, Y (x - ,1)2 = 112. Los valores de Yo 2.9, 13.5 Y23.0 proporcionan valores de
sxo de 0.26, 0.24 Y0.26, respectivamente. Los lmites de confianza correspondientes al nivel
del 95% (/5 = 2.57) son 0.72 0.68, 6.21 0.62, y 11.3 0.68 pg ml- 1, respectivamente.
Este ejemplo aclara un punto importante. Muestra que los lmites de confianza son bastante ms pequeos (es decir, mejores) para el resultado Yo = 13.5
que para los otros dos valores de Yo. El anlisis de la Ecuacin (5.9) confirma
que cuando Yo se aproxima a iJ, el tercer trmino dentro del parntesis se
aproxima a cero, y s'o entonces se aproxima a un valor mnimo. La forma
general de los lmites de confianza para una concentracin calculada se
muestra en la Figura 5.6. Entonces en la prctica, un experimento de calibracin de este tipo proporcionar los resultados ms precisos cuando la seal medida en el instrumento corresponda a un punto prximo al centro de
gravedad de la recta de regresin.
Si se desea mejorar (es decir, acercar) los lmites de confianza en este
experimento de calibracin, las Ecuaciones (5.9) y (5.10) muestran que se
pueden considerar al menos dos aproximaciones. Se puede aumentar n, el
nmero de puntos del calibrado de la recta de regresin, y/o se puede hacer
ms de una medida de Yo, usando el valor medio de m de dichas medidas en
el clculo de Xl). Los resultados de tales procedimientos pueden ser evaluados
considerando los tres trminos dentro del parntesis en las dos ecuaciones.
En el ejemplo anterior, el trmino predominante en los tres clculos es el
primero: la unidad. Se sigue que en este caso (yen muchos otros) puede llevarse a cabo una mejora en la precisin midiendo varias veces Yo Y usando
la Ecuacin (5.10) en lugar de la Ecuacin (5.9). Si, por ejemplo, el valor de
lJo de 13.5 hubiese sido calculado como la media de cuatro determinacio-
ro
'C
ID
(f)
Concentracin
Figura 5.6. Forma general de los lmites de confianza para una concentracin determinada
utilizando una recta de regresin no ponderada.
nes, entonces el valor de s'o y los lmites de confianza habran sido 0.14 y
6.21 0.36, respectivamente, indicando ambos resultados una sustancial
mejora en la precisin. Por supuesto, realizar muchas medidas repetidas (suponiendo que se dispone de suficiente muestra) genera mucho ms trabajo
obteniendo un beneficio adicional pequeo: el lector puede verificar que
ocho medidas de Yo producirn un valor de sxo de 0.12 y lmites de confianza
de 6.21 0.30.
El efecto de n, el nmero de puntos de calibrado, sobre los lmites de confianza en la determinacin de la concentracin es ms complejo. Esto se debe
a que se ha de tener en cuenta tambin los cambios que acompaan al valor
de t. El uso de un gran nmero de muestras de calibrado supone la tarea de
preparar muchos patrones exactos para slo incrementar marginalmente la
precisin (vanse los efectos de incrementar m, descritos en el prrafo anterior). Por otra parte, no es adecuado usar valores de n pequeos. En tales
casos, l/n ser ms grande, y el nmero de grados de libertad (n - 2) se har
muy pequeo, necesitndose valores muy grandes de t en el clculo de los
lmites de confianza. En muchos experimentos, como en el ejemplo dado,
aproximadamente seis puntos de calibrado sern suficientes; si es necesario
el analista ganar precisin extra repitiendo medidas de Jjo.
S'
(J)
2"
3ro
125
= YB
+ 3sB
(5.11 )
El significado de esta ltima definicin se aclara con ms detalle en la Figura 5.7. Un analista estudiando concentraciones traza se enfrenta con dos
problemas: es importante informar de la presencia de analito cuando de he-
::J
126
cho est ausente, pero es igualmente importante informar que est ausente
cuando de hecho est presente. (La situacin es anloga a la existencia de
errores Tipo 1 y II en los contrastes de significacin; vase en la Seccin
3.13.) La posibilidad de que ocurra cada uno de estos errores debe minimizarse bajo una definicin precisa de un limite de deteccin. En la figura, la
curva A representa la distribucin normal de valores medidos de la seal del
blanco. Sera posible identificar un punto, y = P, hacia el borde superior de
esta distribucin, y pretender que una seal ms grande que sta fuera improbable para que se debiese al blanco, mientras que una seal menor que P
supondria indicar una muestra del blanco. Sin embargo, para que una muestra d una seal promedio P, el 50 % de las seales observadas ser menor
que sta, ya que la seal tendr una distribucin normal (de la misma forma
que la del blanco; vase ms adelante) prolongando por debajo de P (curva
B). La probabilidad de concluir que esta muestra no difiera de la del blanco
cuando de hecho lo hace es, por tanto, del 50 %. El punto P, que se ha llamado
el lmite de decisin, es pues insatisfactorio como limite de deteccin, ya que
soluciona el primero de los problemas menconados antes pero no el segundo. Un punto ms adecuado est en l:J = Q de manera que Q est situado al
doble de la distancia que existe ente YB y P. Se puede demostrar que si
l:J13 - Q es 3.28 veces la desviacin estndar del blanco, SH; entonces la probabilidad de que ocurra cada uno de los dos tipos de error (indicados por las
reas sombreadas de la Figura 5.7) es slo deiS %. Si, como se sugiere en la
Ecuacin (5.11), la distancia l:JH - Q es slo 3s H, la probabilidad de cada
error es aproximadamente del 7 %: muchos analistas considerarian que sta
es una definicin razonable del lmite de deteccin.
Es preciso insistir de nuevo que esta definicin de limite de deteccin es
muy arbitraria, y est totalmente abierta a cualquier analista para que proponga una definicin alternativa para un propsito concreto. Por ejemplo,
existen ocasiones en que un analista est ansioso de evitar a toda costa la
posibilidad de dar la ausencia de analito cuando de hecho est presente,
pero no es relativamente preocupante el error contrario. Est claro que, aun
cuando se cite un lmite de deteccin en un trabajo o informe, debe proporcionarse la definicin utilizada para obtenerlo. Se han realizado algunos
intentos para definir con posterioridad otro limite, el limite de cuantifica-
ys
Limite de
decisin
Limite de
deteccin
3SB
Figura 5.7.
EJEMPLO 5.7.1
Estimar el lmite de deteccin para la determinacin de fluoresceina estudiada en las secciones previas.
Se usa la Ecuacin (5,11) con los valores de yti, = a) y ss( = 5;1 x) calculados previamente,
El valor de yen el lmite de deteccin viene dado por 1,52 + 3 x 0.4329, es decir, 2,82,
El uso de la ecuacin de regresin conduce a un lmite de deteccin de 0.67 pg mi 1, La
Figura 5.8 resume todos los clculos realizados a partir de los datos de la determinacin de
la fluoresceina,
5.8.
127
128
25
yo
= 23.0
a = 1.520.30
b = 1.930.04
20
r= 0.9989
Sy/x
= Sa= 0.433
15
'
e
Q)
u
(/J
t"l
'"":
10
ya + 3Sa
a=ya
LOD
o"""'-_L.-_'-----'L------'_-----'---'----'-_
O
10
Concentracin, pg ml-
Figura 5.8.
12
ro
129
le
Ql
en
Seal de la muestra"
.'
.' .'
.'
.'
.'.'
.'
.'.'
Cantidad
aadida~
Cantidad de analito en
la muestra de ensayo
Figura 5.9.
(5.12)
130
XL'
sr
EJEMPLO 5.8.1
La concentracin de plata en una muestra de deshechos fotogrficos fue determinada por
espectrometra de absorcin atmica con el mtodo de las adiciones estndar. Se obtuvieron los siguientes resultados,
Ag aadida: flg por mi de solucin
de muestra original O
5
Absorbancia
0.32
0.41
10
0,52
15
0.60
20
0.70
25
0.77
30
0.89
2,57
x 0,749, es decir,
5.9.
131
t
(f)
JI
..../1'
~.....{ .........
::_..!
__..
Mtodo B ---+
Figura 5.10. El uso de rectas de regresin para comparar dos mtodos analticos:
(a) muestra una concordancia perfecta entre los dos mtodos para todas las muestras;
(b) a (1) ilustran los resultados de varios tipos de errores sistemticos (vase el texto).
'"'l
ro
Cuando dos mtodos se comparan a diferentes concentraciones de analito, se adopta normalmente el procedimiento que ilustra la Figura 5.10. Uno
de los ejes del grfico de regresin se usa para los resultados obtenidos por
el nuevo mtodo, y el otro para los resultados obtenidos aplicando a las mismas muestras el de comparacin o referencia. (La razn por la que los ejes
deben asignarse a cada mtodo se discute posteriormente.) En estas circunstancias, cada punto del grfico representa una muestra nica analizada por
dos mtodos distintos. (A veces cada mtodo se aplica solamente una vez a
cada muestra problema, mientras que en otros casos se usan medidas repetidas en las comparaciones.) Los mtodos de las secciones precedentes se han
aplicado para calcular la pendiente (h), la ordenada en el origen (a) y el coeficiente de correlacin (r) de la recta de regresin. Queda claro que si cada
muestra conduce a un resultado idntico con ambos mtodos analticos, la
recta de regresin tendr una ordenada en el origen cero, y una pendiente y
un coeficiente de correlacin de 1 (Figura 5.10a). En la prctica, por supuesto, esto nunca ocurre: incluso estando completamente ausentes los errores
sistemticos, los errores aleatorios aseguran que los dos procedimientos analticos no darn resultados en exacta concordancia para todas las muestras.
Desviaciones de la situacin ideal (a = O, h = r = 1) pueden ocurrir en
una serie de situaciones diferentes. En primer lugar, es posible que la recta
de regresin tenga una pendiente de 1, pero no una ordenada en el origen
de O. Esto es, un mtodo de anlisis puede conducir a un resultado ms alto
o ms bajo que el otro en una cantidad fija. Tal error podra ocurrir si la
seal de fondo de uno de los mtodos se hubiera calculado errneamente
to
@
Vl
5:
='
'<:
(")
O
'"'l
'"'l
ro
OT
(")
5:
='
132
Nmero de muestra
Resultado CF
Resultado EF
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1.87
2.20
3.15
3.42
1.10
1.41
1.84
0.68
0.27
2.80
0.14
3.20
2.70
2.43
1.78
1.53
0.84
2.21
3.10
2.34
1.98
2.31
3.29
3.56
1.23
1.57
2.05
0.66
0.31
2.82
0.13
3.15
2.72
2.31
1.92
1.56
0.94
2.27
3.17
2.36
Esta serie de datos muestra el porqu es inadecuado utilizar el contraste I por parejas, que
evala en esos casos las diferencias entre pares de resultados (Seccin 3.4). El intervalo de
concentraciones de. cido ftico (ca. 0.14-3.50 mg 1- 1) en las muestras de orina es tan amplio que una discrepancia fijada entre los dos mtodos ser de variacin significativa a diferentes concentraciones. Entonces, una diferencia de 0.05 mg I . t entre las dos tcnicas,
no sera de gran inters al nivel de ca 3.50 mg I 1, pero sera ms molesto en el extremo
ms bajo del intervalo de concentracin.
La Tabla 5.1 muestra el resumen de los resultados de la hoja de clculo de Excel utilizada para calcular la lnea de regresin de los datos anteriores. Los datos CF se han
representado en el eje y, y los resultados EF en el x (vase ms adelante). Los resultados
muestran que el valor de r (llamado por este programa "R mltiple debido a su potencial
aplicacin a mtodos de regresin mltiple) es 0.9967. La ordenada en el origen es
-0.0456, con lmites de confianza superior e inferior de -0.1352 y +0.0440: este intervalo incluye el valor ideal de cero. La pendiente de la grfica, llamada "X variable 1 debido
a que b es el coeficiente del trmino en x en la Ecuacin (5.1), es 0.9879, con un intervalo
de confianza al 95% de 0.9480 a 1.0279: nuevamente este intervalo incluye el valor del
modelo, en este caso 1.0. (Los resultados restantes no se necesitan en este ejemplo, y se
discuten en la seccin 5.11). La Figura 5.11 muestra la lnea de regresin con las caractersticas anteriores resumidas.
Tabla 5.1.
Estadistica de la regresin
R mltiple
R cuadrado
R cuadrado ajustado
Error es tndar
Observaciones
0.9967
0.9934
0.9930
0.0825
20
ANOVA
Regresin
Residual
Total
Ordenada
en el origen
X Variable 1
Ordenada
en el origen
X Variable 1
gl
SC
CM
F Significativa
1
'18
19
18.342
0.122
18.465
18.342
0.007
2695.977
4.61926E-21
Coeficientes
Error
estndar
Estadistica t
Valor P
-0.0456
0.9879
0.0426
0.0190
-1.070
51.923
0.299
4.62E-21
Inferior
al 95%
Superior
al 95 %
-0.1352
0.9480
0.0440
1.0279
133
4.0
134
3.5
3.0
u.
'"o
.s
:;
'"
a:
"O
C])
2.5
2.0
1.5
1.0
0.5
O
O
0.5
Figura 5.11.
recta de regresin. Sin embargo, los mtodos de regresin se siguen utilizando ampliamente, ya que las grficas que resultan proporcionan informacin
valiosa sobre la naturaleza de cualquier diferencia entre los mtodos (Figura
5.10). Adems, las simulaciones muestran que la aproximacin conduce a
resultados sorprendentemente fiables, siempre que el mtodo ms preciso se
represente en el eje x (sta es la razn de realizar investigaciones sobre las
precisiones de los dos mtodos; vase lo expuesto anteriormente), y que se
usen un nmero razonable de puntos (ca. al menos 10) cubriendo uniformemente el intervalo de concentraciones de inters. Ya que los clculos de los
lmites de confianza se basan en n-2 grados de libertad, es de particular importancia evitar valores pequeos de n. Existen mtodos de representacin
de rectas de regresin en que x e Jj estn sujetos a error, sin embargo en la
prctica no se utilizan habitualmente en estudios de comparacin debido a
su complejidad.
Una segunda objecin al utilizar la recta de regresin de Jj sobre x en la
comparacin de dos mtodos analticos, como se calcul en las Secciones 5.4
y 5.5, supone tambin que los errores en los valores de Jj son constantes. Se
dice que tales datos son homocedsticos. Como se coment anteriormente,
esto significa que todos los puntos tienen igual ponderacin cuando se calculan la pendiente y la ordenada en el origen de la lnea. Este supuesto es
probable que carezca de validez en la prctica. En muchos anlisis, los datos
son heterocedsticos, es decir, la desviacin estndar de los valores de Jj
aumenta con la concentracin del analito, en vez de tener el mismo valor
para todas las concentraciones (vase ms adelante). Esta objecin al uso de
rectas de regresin no ponderadas se aplica tambin a las representaciones
de calibrado para un nico procedimiento analtico. En principio, las lneas
de regresin ponderadas deben ser utilizadas en su lugar, como se muestra
en la siguiente seccin.
135
:5"
Ul
r-+'"'l
ro
:1
i1"
'"'l
ro
{.Q
'"'l
ro
Ul
o:
:1
'<:
5.10.
()
o
'"'l
'"'l
En esta seccin se esbozan las aplicaciones de los mtodos de regresin ponderada. Se supone que la recta de regresin ponderada se utiliza para la determinacin de un nico analito y no para comparar dos mtodos distintos.
En cualquier anlisis de calibracin el error aleatorio global del resultado
surga de una combinacin de las contribuciones al error de varias etapas del
anlisis (vase la Seccin 2.11). En algunos casos este error global estar
controlado por una o ms etapas del anlisis donde el error aleatorio no es
dependiente de la concentracin. En algunos casos se esperar que los errores en la curva de calibrado en la direccin Jj sean aproximadamente igual
para todos los puntos (homocedasticidad), y un clculo de regresin no ponderada es legtimo. En otros casos, los errores sern aproximadamente proporcionales a la concentracin del analito (es decir, el error relativo ser
aproximadamente constante), y en algunos ms (quiz la situacin ms comn en la prctica) el error en la direccin de Jj aumentar cuando aumenta
x, pero con menos rapidez que la concentracin. Ambos tipos de datos heterocedsticos deberan ser tratados mediante mtodos de regresin ponderados. Habitualmente un analista slo puede aprender de la experiencia si son
ro
()
o::1
136
sr
Ponderaciones:
Wi =
S-2/ n
1.
(ti
le
al
(f)
Concentracin
Figura 5.12.
(5.13)
Se ver que las ponderaciones se han escalado de tal manera que su suma es
igual al nmero de puntos sobre la representacin grfica: esto simplifica los
subsiguientes clculos. La pendiente y la ordenada en el origen de la recta de
regresin vienen dadas por:
(5.14)
Pendiente ponderada:
y por
a".
= j" - b.Y".
(5.15)
En la Ecuacin (5.15), j". Y "Y". representan las coordenadas del centro de lJravedad ponderado, por el que debe pasar la recta de regresin ponderada.
wx/n y
Como se esperaba, estas coordenadas vienen dadas por .x" =
jI!' =
wJj/n.
EJEMPLO 5.10.1
Calcular las rectas de regresin ponderadas y no ponderadas para los siguientes datos de
calibracin. Calcular tambin para cada recta la concentracin de las muestras de ensayo
con absorbancias de 0,100 y 0.600.
Concentracin, ~g ml- 1
Desviacin estndar.
Absorbancia
0.001
0.009
2
0.004
0.158
4
0.Q10
0.301
6
0.013
0.472
8
0.017
0.577
10
0.022
0.739
Si
O
2
4
6
8
10
0.009
0.158
0.301
0.472
0.577
0.739
0.001
0.004
0.010
0.013
0.017
0.022
Sumas
wx
Wf
WXif
W~
62500
10000
5917
3460
2066
5.535
0.346
0.055
0.033
0.019
0.011
O
0.692
0.220
0.198
0.152
0.110
0.0498
0.0547
0.0166
0.0156
0.0110
0.0081
O
0.1093
0.0662
0.0935
0.0877
0.90813
O
1.384
0.880
1.188
1.216
1.100
1083943
5.999
1.372
0.1558
0.4380
5.768
1/57
106
137
138
Estos nmeros dan Yw = 0.1558/6 = 0.0260, Y Xw= 1.372/6 = 0.229. Mediante la Ecuacin (5.14), bwse calcula a partir de
b, =
...
= 0.0738
s.
w
XO
En esta ecuacin,
'(Yix)"
s0J/x)w
~+1+
Wo
"'"
2( 2 nxl{'-2)
b ~
(5.16)
WXi -
s0J/x )w =
L WiCJJi - iJY}1/2
{ n-2
_l
(5.17)
139
140
ro
le
al
en
Concentracin
Figura 5.13. Forma general de los lmites de confianza para una concentracin determinada
utilizando una recta de regresin ponderada.
5.11.
Punto de interseccin:
!:i.a
XI=-
!:i.b
(5.18)
(5.19)
(5.20)
{1
2_2
SClI/X)P ~
S/1IJ -
L.
i
XiI
Xl
)2
1}
+~
( _ X z)2
L. Xi2
(5.21)
(5.22)
(5.23)
sial
141
142
(5.25)
(5.26)
5.13.
143
144
0.1
O
8.0
2
15.7 24.2
4
6
31.5 33.0
8
10
El anlisis de los datos muestra que la parte del grfico cerca del origen se adapta bastante
bien a una lnea recta con una ordenada en el origen prxima a cero y una pendiente
prxima a cuatro. La fluorescencia de la solucin patrn de 10 I1g ml- 1 teniendo en cuenta
estas bases es claramente inferior a la esperada, y existe alguna posibilidad de que la desviacin de la linealidad afecte tambin al estndar de 8 I1g ml- 1. Primeramente se aplican
clculos de regresin lineal (no ponderada) a todos los datos. De la aplicacin de los mtodos de las Secciones 5.3 y 5.4 se obtienen los resultados a = 1.357, b = 3.479 Y
( = 0.9878. Tngase de nuevo en cuenta que el valor alto de (puede ser engaoso, aun
que se use en sentido comparativo (vase mas adelante). Los residuos de yen este caso
son -1.257, - 0.314, + 0.429, + 1.971, + 2.314 y - 3.143, con la suma de los cuadra
dos de los residuos igual a 20.981. La tendencia en los valores de los residuos sugiere que
el ltimo valor de la tabla est probablemente fuera del intervalo lineal.
35
j
30
25
Cll
'
e
Ql
20
(/)
Ql
(5
::J
"
.1
.1
.1
15
Concentracin, Ig ml- 1
Figura 5.14. Regresin no lineal: identificacin del intervalo de linealidad. Se usan los datos
del Ejemplo 5.13.1; se muestran las lneas de regresin lineal no ponderadas a travs de todos
los puntos (
). a travs de slo los cinco primeros puntos (- - - - -), y a travs de slo
los cuatro primeros puntos (.....).
145
146
Una vez que se ha tomado la decisin de que una serie de puntos de calibrado no se ajustan satisfactoriamente a una lnea recta, el analista puede jugar
otra carta antes de resignarse a los complejos clculos de regresin no lineal.
Se pueden transformar los datos de manera que una relacin no lineal cambie a otra lineal. Tales transformaciones se aplican regularmente a los resultados de ciertos mtodos analticos. Por ejemplo, los paquetes informticos
modernos para la interpretacin de datos de inmunoensayos ofrecen frecuentemente una opcin de transformaciones: mtodos comnmente utilizados incluyen representar log y y/o log x en vez de y y x, o el uso de funciones
logit (logitx = ln[x/(l - x)]). Es importante sealar que las transformaciones pueden afectar tambin a la naturaleza de los errores en diferentes puntos de las representaciones del calibrado. Supngase, por ejemplo, que en un
conjunto de datos de la forma y = px q , las magnitudes de los errores aleatorios en y son independientes de x. Cualquier transformacin de los datos en
forma lineal al tomar logaritmos generar datos cuyos errores en log y no son
independientes de log x. En este y en cualquier otro caso donde sea conocida
la forma esperada de la ecuacin a partir de consideraciones tericas o de
experiencia de mucho tiempo, es posible aplicar ecuaciones de regresin ponderadas (Seccin 5.10) a los datos transformados. Se puede demostrar que,
si los datos de la forma general y = f(x) se transforman en 'la ecuacin lineal
y = EX + A, el factor de ponderacin, W, utilizado en las Ecuaciones (5.14)(5.17) se obtiene de la relacin:
Wi LYi~dYir
=
(5.27)
5.14.
El ajuste de curvas
va) debida a: (a) el tipo de ptica utilizada (efectos de filtro interno), (b)
interacciones moleculares (por ejemplo, atenuacin, formacin de escimeros), y (c) a la carencia de supuestos algebraicos sobre los que se pronostique
una representacin lineal. Los efectos (a)-(c) son independientes entre si, de
manera que en la prctica pueden aparecer curvas de diferente forma. Este
ejemplo muestra porqu las curvas de calibrado con forma conocida y pronosticable se encuentran rara vez en el trabajo analtico (vase lo anterior).
As pues, el analista a priori tiene escasa nocin sobre cul de los muchos
tipos de ecuaciones que generan representaciones en forma de curva debera
utilizarse para ajustar en un caso particular los datos de calibracin. En la
prctica, mucha de la estrategia ms comn consiste en ajustar una curva
que sea un poEnomio en x, es decir, lf = a + bx + cx 2 + dx 3 + ... Entonces
los problemas matemticos a resolver son: (i) cuntos trminos deben incluirse en el polinomio?, y (ii) qu valores deben asignarse a los coeficientes
a, b, etc.? Los paquetes de software informtico que abordan estos problemas
son normalmente iterativos: en primer lugar ajustan una lnea recta a los
datos, luego una curva cuadrtica, despus una curva cbica, y as sucesivamente, presentando al usuario la informacin necesaria para decidir cual de
estas ecuaciones es la ms adecuada. En la prctica, las ecuaciones cuadrticas o cbicas se ajustan a menudo satisfactoriamente a los datos: polinomios
con muchos trminos carecen casi siempre de significado fsico y no mejoran
significativamente los resultados analticos. En cualquier caso, si una representacin tiene n puntos de calibrado, el polinomio mayor permitido es el de
orden n - 1.
Para decidir si (por ejemplo) una curva cuadrtica o cbica es la que mejor se ajusta a un conjunto de puntos de calibracin, se pueden utilizar los
mtodos ANOVA, introducidos en la Seccin 5.12. Los programas de
ANOVA generan valores de R 2 , el coeficiente de determinacin. La Ecuacin (5.25) muestra que, cuando se mejora el ajuste de mnimos cuadrados
de una curva (o linea recta) a los puntos de los datos, el valor de R 2 se aproximar a 1 (o el 100%). Podra parecer que bastara con solo calcular los
valores de R 2 para ecuaciones lineales, cuadrticas, cbicas, etc., finalizando
la bsqueda cuando no se aumente el valor de R 2 . Desgraciadamente, la incorporacin de otro trmino al polinomio hace que aumente siempre el valor
de R 2 , aunque slo sea en cantidad pequea. Entonces los programas de
ANOVA proporcionan valores de R'2 (<<R 2 ajustado) (Ecuacin 5.26) la cual
utiliza cuadrados medios (CM) en lugar de sumas de cuadrados. El uso de
R'2 tiene en cuenta que el nmero de grados de libertad de los residuos en
la regresin polinmica (dado por [n - k - 1] donde le es el nmero de trminos de la ecuacin de regresin que contiene una funcin de x) cambia
cuando cambia el orden del polinmio. Como se muestra en el siguiente
ejemplo, R'z es siempre ms pequeo que R 2 .
EJEMPLO 5.14.1
En un anlisis instrumental se obtuvieron los siguientes datos (unidades arbitrarias).
Concentracin
Seal
O
0.2
1
3.6
2
7.5
3
4
5
6
7
11.5 15.0 17.0 20.4 22.7
8
9
10
25.9 27.6 30.2
147
148
Ajustar un polinomio adecuado a estos resultados, y utilizarlo para estimar las concentraciones correspondientes a una seal de 5, 16 Y 27 unidades.
Hasta un anlisis superficial de los datos sugiere que el grfico de calibrado debera ser
una curva, pero resulta instructivo no obstante calcular la lnea recta de mnimos cuadrados
a travs de los puntos utilizando el mtodo descrito en la Seccin 5.4. Esta lnea responde
a la ecuacin y = 2.991 x + 1.555. La tabla ANOVA para los datos tiene la forma siguiente:
Fuente de variaci6n
Suma de cuadrados
g.1.
Regresin
Residual
Total
984.009
9.500
993.509
9
10
Cuadrado medio
984.009
1.056
99.351
Xi
Yi
ReSiduo y
O
1
2
3
4
5
6
7
8
9
10
0.2
3.6
7.5
11.5
15.0
17.0
20.4
22.7
25.9
27.6
30.2
1.0
4.5
7.5
10.5
13.5
16.5
19.5
22.5
25.5
28.5
31.5
-1.4
-0.9
O
1.0
1.5
0.5
0.9
0.2
0.4
-0.9
-1.3
En esta tabla, por simplicidad se han redondeado a un decimal los nmeros en las dos
columnas de la derecha. La tendencia en los signos y magnitudes de los residuos, que son
negativos a valores bajos de X. pasan a un mximo positivo, y luego vuelven a valores
negativos, seal de que una lnea recta no es un ajuste adecuado para los datos.
Cuando los datos se ajustan mediante una curva de forma cuadrtica la ecuacin resulta
ser y = 0.086 + 3.970x - 0.098r, y la tabla ANOVA toma la forma:
Fuente de variacin
Suma de cUE/drados
g.l.
Cuadrado medio
Regresin
Residual
Total
992.233
1.276
993.509
2
8
10
494.116
0.160
99.351
Ntese que el nmero de grados de libertad para las fuentes de variacin de la regresin
y residual han cambiado ahora de acuerdo con las reglas descritas anteriormente, pero que
la variacin total es naturalmente la misma como en la primera tabla ANOVA. Aqu Ff2 es
992.233/993.509 = 0,99872, es decir, 99,872%. Esta cifra es considerablemente ms grande que el valor de 99.044% obtenido dl grfico lineal, y el valor R 2 es tambin ms grande
en (1 - [0.160/99.3511]) = 0.99839, es decir, 99,839%, Cuando se calculan los residuos y,
sus signos (en orden creciente de valores X) son + - - + + - + - + - +. No hay ninguna tendencia obvia aqu, as que por encima de cualquier consideracin se debe preferir
el ajuste cuadrtico al lineal.
Por ltimo se repiten los clculos para un ajuste cbico, Aqu la ecuacin que mejor se
ajusta es y = - 0.040 + 4.170x -- 0.150r + 0,0035x3, El coeficiente cbico es muy pequeo, de manera que resulta cuestionable si esta ecuacin es un ajuste significativamente
mejor que el cuadrtico. El valor Ff2 es, inevitablemente, ligeramente ms grande que el de
la curva cuadrtica (99.879% en comparacin con 99.872%), pero el valor de R 2 es ligeramente inferior que el valor cuadrtico en 99.827%. El orden de los signos de los residuos
es el mismo como en el ajuste cuadrtico. Ya que no hay ninguna ventaja en incluir trminos
innecesarios, se puede aceptar que un ajuste cuadrtico e~ satisfactorio en este caso.
Cuando las ecuaciones anteriores se utilizan para estimar las concentraciones correspondientes a sealeS del instrumento de 5, 16 Y 27 unidades, los resultados (valores x en
unidades arbitrarias) son:
.
y=5
y= 16
y= 27
Lineal
Cuadrtico
Cbico
1.15
4.83
8.51
1.28
4.51
8.61
1.27
4.50
8.62
Como se esperaba, las diferencias entre las concentraciones calculadas de las ecuaciones
cuadrticas y cbicas son insignificantes, de manera que se utiliza la ecuacin cuadrtica
por simplicidad.
149
150
5.15.
En esta seccin se retoma un problema ya analizado en el Captulo 3, la aparicin de datos anmalos entre nuestras observaciones. Este tipo de resultados surgen inevitablemente en los experimentos de calibracin, exactamente
como aparecen en las medidas replicadas, pero resulta ms complicado tratar
con ellos en la estadstica de la regresin. Una dificultad es que, aunque en
un experimento de calibracin se supone que los valores Yi individuales son
independientes unos de otros, los residuos (Yi - ya no son independientes
unos de otros ya que su suma es siempre cero. Por tanto, no resulta habitualmente aceptable tomar los residuos como si fueran un conjunto convencional
de medidas repetidas, y aplicar (por ejemplo) un contraste Q para identificar
cualquier observacin anmala. (Si el nmero de valores de y,: es grande, una
condicin que no se encuentra por lo general en el trabajo analtico, esta
prohibicin se puede flexibilizar.)
Entonces, cmo se identifican las observaciones anmalas en un experimento de calibracin tpico? En primer lugar, se observa que, en los casos
donde haya ocurrido un error obvio como un error de transcripcin o un
funcionamiento deficiente del instrumento, resulta natural y permitido rechazar la medida resultante (y, si es posible, repetirla). Si hay medidas sospechosas para las que no hay ninguna fuente de error obvia, se debe volver
a un estudio de los residuos. Muchos programas de computadora que manejan datos de regresin proporcionan rutinas de diagnstico de los residuos
(vase lo anterior). Algunas de stas son simples, incluyendo grficos de los
residuos frente a los valores Yi individuales (Figura 5.15). Dichos grficos se
esperara que mostraran que, si se utilizase el modelo correcto de calibracin,
los residuos permaneceran aproximadamente uniformes en el tamao a medida que crece Yi, distribuyndose normalmente alrededor de cero. La figura
tambin ilustra casos donde los errores en la direccin de y crecen con Yi
(Seccin 5.10), y donde se ha utilizado la ecuacin de regresin equivocada
(Secciones 5.11 y 5.12). De manera similar, se pueden representar los residuos de y frente al tiempo si se sospecha una deriva del instrumento o cual-
151
(a)
0-
-.
(b)
O.
<~
Yi
Yi
:>;,
(e)
(d)
Yi
Yi
quier otro efecto dependiente del tiempo. Estos grficos revelan de manera
muy clara valores sospechosos, pero no proporcionan criterios que se puedan
utilizar inmediatamente para rechazarlos o aceptarlos. Adems, resultan de
un valor limitado en muchos experimentos de qumica analtica, donde el
nmero de puntos de calibrado es a menudo pequeo.
Para identificar posibles datos anmalos mediante programas de computadora se han utilizado algunos criterios numricos simples. Algunos
paquetes resaltan los puntos de calibrado donde el residuo de Jj es ms de
dos veces (o algn otro mltiplo) el valor de 511 /\, Se han desarrollado varios
mtodos ms avanzados, de los cuales el mejor conocido es la estimacin para cada punto de la distancia de Cook, que se propuso por primera
vez en 1977. Este estadstico se proporciona en diferentes programas estadsticos avanzados, aunque una comprensin completa de su significado
exige un conocimiento del lgebra matricial. La distancia de Cook es un
ejemplo de una funcin de influencia, es decir, mide el efecto que tendra
sobre los coeficientes de regresin a y b el rechazar el citado punto de calibracin.
Por ltimo, se observa que, exactamente como ocurra en el tratamiento
de los datos anmalos en las medidas replicadas, los mtodos robustos y no
paramtricos pueden resultar muy efectivos al manejar datos anmalos en la
regresin: los mtodos robustos de regresin se han hecho muy populares en
los ltimos aos. Estos tpicos se abordarn en el prximo captulo.
152
Bibliografa
Draper, N. R. and Smith, H. 1998. AppIied Regression AnaIysis. 3rd Edn.
Wiley, New York. (Un trabajo clsico con extensa cobertura de muchos
aspectos de los problemas de la regresin y correlacin.)
Edwards, A. L. 1984. An Introduction to Linear Regression and Correlation.
2nd Edn. W. H. Freeman, New York. (Tratado escrito con claridad, con
una buena introduccin al lgebra matricial.)
Kleinbaum, D. G., Kupper, L. L. and Muller, K. E. 1988. AppIied Regression
AnaIysis and Other MuItivariate Methods. 2nd Edn. PSW-Kent, Boston.
(Otro clsico en su campo con un buen tratamiento de la diagnosis de la
regresin.)
Mark, H. 1991. PrincipIes and Practice of Spectroscopic Calibration. Wiley,
New York. (Una explicacin clara de los principios. El fuerte nfasis sobre datos espectroscpicos del IR-cercano no es una desventaja significativa.)
Noggle, ]. H. 1993. Practical Curve-Fitting and Data AnaIysis. Ellis Horwood-PTR Prentice Hall, New Jersey. (Se proporcionan con este libro
programas y ficheros de datos, y todos los ejemplos son de qumica.)
Orvis, W.]. 1996. Excel far Scientists and Engineers. 2nd Edn. Sybex, Alameda, California. (Uno de los numerosos libros que dan guas claras sobre el uso de Excel en clculos estadsticos.)
Snedecor, G. W. and Cochran, W. G. 1989. Statistical Methods. 8th Edn.
Iowa State University, USA. (Aporta una excelente cantidad de procedimientos de regresin y correlacin.)
Ejercicios
1.
o
0.002
2
0.150
4
0.294
0.434
0.570
10
0.704
3.
Se obtuvieron los siguientes resultados al analizar un conjunto de soluciones patrn de plata por espectrometra de absorcin atmica.
Concentracin,
ng ml- 1
O
Absorbancia 0.003
5
0.127
10
0.251
15
0.390
20
0.498
25
0.625
30
0.763
Utilizando los datos del ejercicio 3, estimar los lmites de confianza para
las concentraciones de plata en: (a) una muestra que proporciona una
absorbancia de 0.456 en una nica determinacin, y (b) una muestra
dando valores de absorbancia de 0.308, 0.314, 0.347 Y 0.312 en cuatro
anlisis distintos.
5.
Estimar el lmite de deteccin del anlisis de plata de los datos del ejercicio 3.
6.
7.
La fluorescencia de un conjunto de soluciones cidas de quinina fue determinada cinco veces. Los resultados se exponen a continuacin:
Concentracin, ng mI 1
Intensidad de fluorescencia
(unidades arbitarias)
o
4
3
5
4
10
22
20
21
22
21
20
44
46
45
44
44
30
60
63
60
63
63
40
75
81
79
7R
77
50
104
109
107
101
105
Determinar las pendientes y ordenadas en el origen de las rectas de regresin no ponderada y ponderada. Calcular, utilizando ambas rectas de
regresin, los lmites de confianza para la concentracin de las disoluciones con intensidades de fluorescencia de 15 y 90 unidades.
8.
Una determinacin de sulfuro procedente de sulfato reducido por bacterias con un electrodo selectivo de iones (ES!) fue comparada con una
determinacin gravimtrica. Los resultados obtenidos se expresaron en
miligramos de sulfuro.
153
1 2
3 4
5 6
7 8
9 10
108 12 152 3 106 11 128 12 160 128
105 16 113 O 108 11 141 11 182 118
Muestra:
Sulfuro (Mtodo ESI):
Sulfuro (Gravimetra):
154
10.
En un estudio del complejo formado entre los iones del europio (HI) y
el cido piridin-2.6-dicarboxlico (APDC), se determinaron los valores
de absorbancia de disoluciones conteniendo diferentes concentraciones
de APDC-Eu, con los resultados siguientes:
Absorbancia
APDC: Eu
Absorbancia
APDC: Eu
En un experimento para determinar taninos hidrolizables en plantas mediante espectroscopa de absorcin se obtuvieron los datos siguientes:
Absorbancia
Concentracin, mg ml-
0.084
0.123
0.183
0.288
0.326
0.562
0.464
0.921
0.643
1.420
12.
Se obtuvieron los resultados siguientes en un experimento para determinar espermina mediante cromatografa de capa fina de alta resolucin de uno de sus derivados fluorescentes.
Intensidad de fluorescencia
Espermina, ng
36
6
69
18
184
30
235
45
269
60
301
70
327
90
155
Mtodos
no paramtricos
y robustos
6.1.
Introduccin
Todos los contrastes estadsticos desarrollados en los captulos anteriores suponen que los datos que se examinan siguen la distribucin normal (Gaussiana). Algn apoyo a este supuesto lo proporciona el teorema del lmite
central, que demuestra que la distribucin en el muestreo de la media puede
ser aproximadamente normal incluso si la poblacin de partida tiene una distribucin muy diferente. Sin embargo, el teorema en realidad no es vlido
para conjuntos de datos muy pequeos (a menudo slo tres o cuatro lecturas) utilizados frecuentemente en el trabajo analtico.
Existen otras razones de inters en mtodos que no requieren suponer
datos distribuidos segn una ley normal. Algunos conjuntos de datos de
inters para los qumicos analticos ciertamente presentan distribuciones
diferentes. Por ejemplo (vase el Captulo 2), las concentraciones de anticuerpos en el suero sanguneo de un grupo de personas diferentes puede expresarse aproximadamente como una distribucin lag-normal: dichos resultados se obtienen con frecuencia cuando se realiza una medida concreta
sobre cada elemento de un grupo humano o de animales. An ms intereseante resulta el comprobar que hay una evidencia creciente de que, incluso
cuando se toman medidas repetidas sobre un nico material de ensayo, la
distribucin de los resultados puede a veces ser simtrica pero no normal:
los datos incluyen ms resultados alejados de la media de los esperados. Tales distribuciones con colas acusadas se pueden considerar como distribuciones normales con la inclusin de resultados anmalos (vase el Captulo
3) que proceden de errores crasos. Alternativamente, los datos con colas acusadas pueden proceder de la superposicin de dos distribuciones normales
con el mismo valor medio, pero con una distribucin que tiene una desviacin estndar significativamente ms grande que la otra. Esto podra surgir
158
6.2.
Algunas tcnicas sencillas de presentacin grfica simples son de ayuda inmediata. Ya se ha comentado (vanse los Captulos 1 y 3) el uso de grficas
de punto para ilustrar conjuntos pequeos de datos. Estas representaciones
ayudan en la identificacin visual de resultados anmalos y otras caractersticas poco usuales de los datos. El siguiente ejemplo ilustra mejor su valor.
159
""\
rr
(f)
~
O
(f)
160
EJEMPLO 6.2.2
En un experimento para determinar si los iones Pb2 + interfieren con la determinacin enzimtica de glucosa en varios alimentos, se trataron nueve alimentos con una solucin de
Pb(lI) 0.1 mM, mientras que otros cuatro (grupo de control) no se trataron. Se midieron para
cada alimento las velocidades (en unidades arbitrarias) de reaccin catalizada por enzimas
y se corrigieron para las diferentes cantidades de glucosa que se sabe estn presentes. Los
resultados fueron:
Alimentos tratados
Controles
21
22
1
22
26
23
4
32
27
11
24
21
Otra tcnica sencilla de representacin de datos, de gran valor cuando se estudian muestras ms grandes, es el grfico de cajas y bigotes. En su versin
normal dicho grfico consta de un rectngulo (la caja) con dos lneas (los
bigotes) que se extienden desde los bordes opuestos de la caja, y otra lnea
adicional dentro de la caja, cruzndola en paralelo a los mismos bordes. Los
extremos de los bigotes indican el recorrido de los datos, los bordes de
Alimentos tratados
16
Controles
Figura 6.1.
16
32
24
24
32
161
Valor
ms bajo
Figura 6.2.
Cuartil
inferior
Mediana
Cuartil
superior
Valor
ms alto
la caja a partir de los cuales salen fuera los trazos representan las cuartilas
superior e inferior, y la lnea que cruza la caja representa la mediana de los
datos (Figura 6.2).
El grfico de cajas y bigotes, acompaado de una escala numrica, es
una representacin grfica del resumen de los cinco nmeros, es
decir, el conjunto de datos se describe por sus extremos, su cuartila
inferior, la superior y su mediana. El grfico muestra de un vistazo la
variabilidad y la simetria de los datos.
Algunos programas de computadora resaltan la presentacin de los datos
identificando separadamente posibles valores anmalos. En dichos casos los
datos anmalos se definen a menudo como los datos puntuales que son ms
bajos que la cuartila inferior, o que son ms altos que la cuartila superior, en
ms de 1.5 veces el recorrido intercuartlico. Los bigotes entonces slo se extienden a los lmites superior e inferior o vallas y los datos anmalos se
muestran como puntos por separado. (Estos refinamientos no se muestran
en la Figura 6.2.)
EJEMPLO 6.2.3
Se encontr que los niveles de una protena del plasma sanguneo en 20 hombres y 20
mujeres (mg 100 ml- 1) eran:
Hombres
Mujeres
18
6
2
2
5
3
1
4
4
6
2
11
1
3
3
2
7
2
2
1
2
9
8
2
2
13
5
11
1
11
1
2
3
14
1
Qu informacin puede obtenerse sobre las diferencias entre los niveles de esta protena
en hombres y mujeres?
Como en el ejemplo anterior, los datos presentados aportan muy poco, pero el uso de dos
grficos de cajas o del resumen de los cinco datos resulta muy reveladora. Los cinco datos
resumidos son:
Min.
Hombres
Mujeres
Cuartil inferior
Mediana
Cuartil superior
Mx.
2
2
3.5
2.5
8.5
5.5
18
11
Se deja que el lector demuestre como simple ejercicio de dibujo que (a) las dstribuciones
resultan muy asimtricas tanto para hombres como para mujeres, de manera que los mtodos estadsticos que suponen una distribucin normal no son apropiados (como se ha
- visto esto es a menudo cierto cuando se realiza una nica medida sobre un determinado
nmero de sujetos distintos, en particular cuando son organismos vivos); (b) las concentra-
162
ciones de la mediana para hombres y mujeres son similares: y (e) el recorrido de valores
es considerablemente ms grande para los hombres que para las mujeres. Las conclusiones
sugieren que se podra aplicar el contraste de SiegelTukey (vase la Seccin 6.6) para ver
si la mayor variacin de los niveles de protena entre hombres es significativa.
Tabla 6.1.
0.03
0.22
0.55
0.05
0.22
0.56
0.08
0.23
0.58
0.08
0.29
0.64
0.10
030
0.66
0.11
0.32
0.78
0.18
0.34
0.78
0.19
0.40
0.86
0.20
0.47
0.89
0.20
0.48
0.96
Aunque es habitual para los analistas manejar conjuntos de datos relativamente pequeos, existen ocasiones en que tienen que examinarse grandes
conjuntos de medidas. Ejemplos de ello tienen lugar en reas del anlisis clnico y medioambiental, donde en muchos casos se producen grandes variaciones naturales en los niveles de analito. La Tabla 6.1 muestra, en orden
numrico, los niveles de un pesticida en 30 muestras de judas blancas. Los
valores individuales cubren el intervalo de 0.03 a 0.96 mg Kg '. I Y podran
expresarse en forma de histograma. Esto mostrara que, por ejemplo, hay
cuatro valores en el intervalo 0-0.095 mg Kg' 1, cuatro en el intervalo 0.0950.195 mg Kg - 1, Y as sucesivamente. Sin embargo, un mtodo AID mejor
utiliza un diagrama de tallo-hojas, como se muestra en la Figura 6.3.
La columna de nmeros que aparece a la izquierda (el tallo) muestra el
primer dgito significativo de cada medida, mientras que los nmeros restantes
en cada fila (las hojas) proporcionan el segundo dgito significativo. La longitud de las filas corresponde entonces a las longitudes de las barras del histograma correspondiente, pero la ventaja del diagrama tallo-hojas es que mantiene el valor de cada medida. Las hojas utilizan slo nmeros enteros, de
manera que siempre debe darse alguna indicacin de la escala utilizada. En
este caso para proporcionar esta informacin se utiliza una clave. As lo hace
el paquete de software Minitab con los diagramas tallo-hojas.
En resumen, los mtodos AID son sencillos, manejados con gran rapidez por las computadoras personales, y muy valiosos al indi.car caractersticas de los datos que no son claras en la inspeccin inicial. Son de
ayuda al decidir los contrastes de significacin ms adecuados u otros
procedimientos estadsticos que se adoptan en tareas posteriores, sugiriendo incluso otras veces que la estadstica no tiene otro papel que desempear hasta que no se obtengan ms datos.
1
2
3
4
5
6
7
8
1
O
2
7
6
6
8
9
Figura 6.3.
O
O
O
5
4
8
6
8
8
2
4
8
8
8
9
2
6.3.
163
EJEMPLO 6.3.1
.,
En el Captulo 3 (Seccin 3.2) se demostr que tales problemas se podran abordar utilizando el contraste t despus de calcular la media y la desviacin estndar de los datos
experimentales. Sin embargo, el contraste t supone que los datos se distribuyen normal
mente. El contraste de signos prescinde de tal hiptesis y es mucho ms fcil de realizar. Los
principios bsicos son los mismos que los utilizados en otros contrastes de significacin: se
establece una hiptesis nula, se determina la probabilidad de obtener los resultados experimentales, y se rechaza la hiptesis nula si esta probabilidad es menor que un cierto nivel
crtico. Aqu la hiptesis nula consiste en que los datos procedan de una poblacin con un
valor de la mediana del constituyente del 8.0%. A cada valor experimental se le resta a su
vez la mediana postulada, y se considera el signo de cada resultado. Se ignoran por como
pleto aquellos valores que son iguales a la mediana postulada. En este caso, por tanto, se
dispone de siete valores experimentales, seis de ellos son inferiores a la mediana y como
resultado se les asigna individualmente el signo menos, y uno ms grande que la mediana
al que se le asigna el signo ms. Para contrastar si esta preponderancia de signos menos
es significativa se utiliza la ley binomial. Esta ley establece que la probabilidad de que aparezcan rsignos menos entre nsignos viene dada por
(f)
(6.1)
donde nC,indica el nmero de combinaciones de relementos de un total de n elementos, p
es la probabilidad de que aparezca un signo menos en uno de los resultados y q la proba
bilidad de que no aparezca un signo menos en uno de los resultados individuales, es decir,
q = 1 - P. Puesto ql.le la mediana se define de manera que la mitad de los resultados
experimentales se sita por encima de ella, y la otra mitad por debajo, queda claro que si
la mediana es 8.0 en este caso, entonces tanto p como q deberan ser 1/2. Utlizando la
Ecuacin (6.1) se obtiene que R6) = 7C 6 x (1/2)6 x (1/2) = 71128. De manera similar se
puede calcular que la probabilidad de obtener siete signos negativos, R7), es 1/128. En
conjunto. por tanto, la probabilidad de obtener 6 o ms signos negativos en nuestro experimento es 8/128. La cuestin slo consiste en saber si los datos difieren significativamente
de la mediana postulada. Por consiguiente, se debe realizar un contraste de dos colas
(vase el Captulo 3), es decir, se debe calcular la probabilidad de obtener seis o ms
signos idnticos (es decir, ~ 6 signos ms o ~ 6 signos menos), cuando se toman al azar
siete resultados. Esto es claramente 16/128 = 0.125. Ya que este valor es >0.05, el nivel
ae
(f)
r+
164
de probabilidad crtico normalmente utilizado, la hiptesis nula, es decir, que los datos proceden de una poblacin de mediana 8.0, no se puede rechazar. Igual que en el Captulo 3,
es importante observar que no se ha probado que los datos procedan de tal poblacin; slo
se ha concluido que tal hiptesis no se puede rechazar.
Queda claro a partir de este ejemplo que el contraste de los signos conllevar
el uso frecuente de la distribucin binomial con p = q = 1/2. Esta aproximacin es tan comn en la estadstica no paramtrica que la mayora de las
tablas estadsticas incluyen los datos necesarios, permitiendo que tales clculos se realicen instantneamente (vase Tabla A.9). Adems, en muchas situaciones prcticas, un analista tomar siempre el mismo nmero de lecturas
o muestras y podr memorizar con facilidad las probabilidades correspondientes a los diversos signos + o -.
El contraste de los signos puede utilizarse tambin como alternativa no
paramtrica al contraste t por parejas (Seccin 3.4) para comparar dos grupos de resultados de las mismas muestras. As, si se examinan diez muestras
mediante cada uno de los dos mtodos, A y B, se puede contrastar si los dos
mtodos proporcionan lecturas significativamente diferentes, calculando para cada muestra [(resultado obtenido por el mtodo A) - (resultado obtenido
por el mtodo B) l. La hiptesis nula ser que los dos mtodos no proporcionan resultados significativamente diferentes; en la prctica esto significar
de nuevo que la probabilidad de obtener un signo ms (o un signo menos)
para cada diferencia es 0.5. Ahora se puede comparar el nmero de signos
ms o menos realmente obtenidos con la probabilidad que se deriva de la
Ecuacin (6.1). En los ejercicios del final de este captulo aparece un ejemplo
de esta aplicacin del contraste de signos.
Otro uso adicional del contraste de signos es indicar una tendencia. Esta
aplicacin se ilustra mediante el siguiente ejemplo.
EJEMPLO 6.3.2
El nivel de una hormona en el plasma sanguneo de un paciente se mide durante diez das
a la misma hora cada da. Los datos resultantes son:
Da
Nivel, ng mi
5.8
7.3
3
4.9
5
5.5
6.1
6
5.5
789
6.0
4.9
6.0
10
5.0
7.3
6.0
4.9
4.9
6.1
6.0
5.5
5.0
(Si hay un nmero impar de medidas, se ignora la medida que ocupa la posicin central en
la secuencia del tiempo.) Al resultado del primer da se le resta el del sexto da, al del
-segundo da el del sptimo, etc. LoS signos de las diferencias entre los pares de valores en
las cinco columnas se determinan de esta manera y resultan ser +, +, O, +, +. Como
es habitual, el valor O se ignora, y quedan cuatro resultados, todos ellos positivos. La probabilidad de obtener cuatro signos idnticos en cuatro intentos es claramente 2 x (1/
/16) = 0.125. (Obsrvese que de nuevo se utiliza un contraste de dos colas, ya que la
tendencia en el nivel de hormona podra ser ascendente o descendente.) La hiptesis nula,
que no exista ninguna tendencia en los resultados, no se puede rechazar de esta forma al
nivel de probabilidad P = 0.05.
El precio que se paga por la extrema sencillez del contraste de los signos es
la prdida de cierta potencia estadstica. El contraste no utiliza toda la informacin ofrecida por los datos, por esa razn no es nada sorprendente encontrar que proporcione tambin menos informacin discriminante. En secciones
posteriores se discutirn mtodos no para mtricos que utilizan tanto las
magnitudes de los resultados individuales como sus signos.
165
O
U
c:
(f)
r-t-
6.4.
El mtodo de Wald-Wolfowitz contrasta si el nmero de rachas es suficientemente pequei10 para que se rechace la hiptesis nula de una distribucin aleatoria de los signos.
El nmero de rachas en los datos experimentales se compara con los mmeros de la Tabla A.lO, que se refieren al nivel de probabilidad P = O.OS.
En esta tabla se entra utilizando valores apropiados de N, el nmero de
signos +, y IVI, el nmero de signos -. Si el nmero de rachas experimental es ms pequeo que el valor tabulado, entonces se puede rechazar la
hiptesis nula.
(f)
166
EJEMPLO 6.4.1
Para ajustar una recta a un conjunto de 12 puntos de calibracin se proponen ecuaciones
de regresin lineal. Los signos de los residuos resultantes ordenados por valores de x creo
cientes son: + + + + - - - - - - + +. Comente si sera mejor intentar ajustar una
curva a los puntos.
,
Aqu M= N= 6, Yel nmero de rachas es tres. La Tabla A.1D muestra que, al nivel
P = 0.05, el nmero de rachas si se rechaza la hiptesis nula debe ser < 4. As, en este
caso se puede rechazar la hiptesis nula, y concluir que la sucesin de signos + y - no
es aleatoria. Por tanto, resulta poco satisfactorio intentar ajustar una lnea recta a los puntos
experimentales, y en su lugar se recomienda una grfica de regresin no lineal.
El contraste de Wald-Wolfowitz se puede utilizar con resultados cualesquiera que se puedan dividir o convertir en slo dos categoras. Supngase, por
ejemplo, que se dispone de los tiempos de funcionamiento de 12 lmparas
que se han ido colocando sucesivamente en un espectrmetro como fuentes
de luz y que son 450,420, 500,405, 390, 370, 380, 395, 370, 370, 420 Y 430
horas. El tiempo de vida mediano, en este caso el promedio de los tiempos
de funcionamiento de las lmparas sexta y sptima cuando los datos estn
dispuestos en orden creciente, es de 400 horas. Si a todas aquellas lmparas con tiempos de funcionamiento menor que el mediano se les asigna un
signo -, y a todas aquellas con tiempos de vida superior un signo +, entonces resulta la siguiente secuencia: + + + + ~ - - - - - + +. sta es la misma secuencia que la del ejemplo anterior de regresin, donde se demostr
que era significativamente no aleatoria. En este caso, las variaciones relevantes que se producen en los tiempos de funcionamiento se pueden explicar en
virtud de la procedencia de las lmparas de diferentes fabricantes o de diferentes lotes.
Se puede estar interesado en nmeros inusualmente grandes de rachas
cortas, as como en nmeros inusualmente pequeos de rachas grandes. Si
se presentan seis signos + y seis signos - en el orden: + - + - + ~ +
- + - + -, se podra sospechar muy claramente que existe una secuencia
no aleatoria. La Tabla A.10 muestra que, con N = Ni = 6, un total de 11 o
12 rachas indica que se debera de rechazar la hiptesis nula de orden aleatorio, y sospechar una cierta periodicidad en los datos.
6.5.
La Seccin 6.3 estudiaba el uso del contraste de los signos. Su inters reside
en los supuestos mnimos que se hacen sobre los datos experimentales. La
poblacin de la que se toma la muestra no se supone que sea normal, ni incluso que sea simtrica. Por otra parte, una cierta desventaja del contraste
de signos es que no utiliza toda la informacin disponible. Slo es necesario
saber si una medida individual es ms grande o ms pequea que la mediana:
la magnitud de esta desviacin no se utiliza con ningn otro objetivo.
En muchos casos un analista tendr razones para creer que sus medidas
se distribuyen simtricamente pero no las suficientes para suponer una dis-
167
EJEMPLO 6.5.1
Se encontr que los niveles de plomo en sangre (en pg ml- 1) de siete nios eran 104, 79,
98, 150, 87, 136 Y 101. Podran proceder estos datos de una poblacin que se supone
simtrica, con una mediana/media de 95 pg ml- 1?
La concentracin de referencia (95) se resta de los valores de los datos dados
9,
- 16,
3,
55,
- 8,
41,
6
~
En primer lugar y prescindiendo del signo se ordenan estos valores de menor a mayor,
resultando:
3,
6,
8"
6,
-8,
9,
16,
41,
2,
-3,
c:
,...,..
Ul
55
-16,
9,
41,
55
Los nmeros entonces se jerarquizan; en este proceso los nmeros mantienen sus signos
pero se les asignan nmeros que indican su orden (o rango), as:
1,
O-
Ul
A continuacin se incorporan sus signos (en la prctica estos dos pasos se haran de una
vez):
3,
4,
-5,
6,
Los rangos positivos suman 20 y los negativos 8. La menor de estas cifras (8) se toma
como el estadstico del contraste. Si los datos proceden de una poblacin con una mediana
de 95 las sumas de los rangos positivos y negativos se esperara que fuesen aproximadamente iguales; si la mediana de la poblacin fuese muy diferente de 95, la suma de los
rangos positivos y negativos sera diferente. La probabilidad de que aparezca una suma
concreta en la prctica viene dada por una serie de tablas (vase Tabla A.11). En este
contraste se rechaza la hiptesis nula si el valor experimental es menor o igual que el valor
tabulado, es decir, la situacin opuesta de la observada en la mayora de los contrastes de
significacin. En este ejemplo, el examen de la Tabla A.11 muestra que, para n = 7, el
estadstico del contraste debe ser menor o igual que 2 para que la hiptesis nula -que los
datos procedan de una poblacin con una mediana (media) de 95- se pueda rechazar a
un nivel de significacin de P = 0.05. En este ejemplo, se debe aceptar la hiptesis nula.
Como es habitual, se utiliza un contraste de dos colas, aunque quiz haya ocasiones en las
que sea ms adecuado un contraste de una cola.
Una ventaja importante del contraste de rangos y signos reside en que tambin se puede utilizar para datos por parejas, ya que se pueden transformar
en el tipo de datos dados en el ejemplo anterior. De esta forma se puede utilizar el mtodo de rangos y signos como una alternativa no paramtrica al
contraste t por parejas (Seccin 3.4),
168
EJEMPLO 6.5.2
La siguiente tabla proporciona el contenido de cinc determinado por dos mtodos diferentes,
para ocho muestras de alimentos.
Muestra
Espectrometra atmica
1
2
7.2
5.2
5.9
9.0
8.5
6.6
4.4
7.6
6.8
4.6
5.7
9.7
8.7
7.0
4.7
6.1
5
6
7
8
Hay evidencia de diferencia sistemtica entre los resultados de los dos mtodos? La aproximacin a este tipo de problemas es muy simple. Si no hay diferencia sistemtica entre los
dos mtodos, entonces es de esperar que las diferencias entre los resultados para cada
muestra, es decir, [(resultado de la valoracin - resultado de la espectrometra)], se distribuirn simtricamente en torno a cero. Las diferencias con signo son:
- 0.4,
- 0.7,
0.6,
0.2,
- 0.7,
- 0.2,
_. 0.4, . - 0.3
0.2,
0.2,
- 0.3,
- 0.4,
0.4,
0.6,
- 0.7,
- 0.7
1.5,
- 3,
- 4.5,
- 4.5,
6,
- 7.5,
- 7.5
En estos casos, merece la pena verificar si se ha hecho correctamente la ordenacin calculando la suma de todos los valores sin tener en cuenta el signo. La suma de los nmeros
anteriores es 36, que es la misma que la suma de los ocho primeros nmeros enteros y,
por tanto la ordenacin es correcta. La suma de los valores positivos es 7.5, y la de los
negativos 28.5. Por tanto, el estadstico del contraste toma el valor 7.5. Al mirar la Tabla
A.11 se observa que, para n = 8, el estadstico del contraste tiene que ser ~ 3 para que
se pueda rechazar la hiptesis nula al nivel de significacin P = 0.05. En este caso, tiene
que aceptarse la hiptesis nula: no hay evidencia de que la mediana (media) de la diferencia
sea distinta de cero, y por tanto no hay ninguna evidencia sobre la existencia de diferencia
sistemtica entre los dos mtodos analticos.
6.6.
parejas que se puedan reducir con facilidad a conjuntos individuales. Sin embargo, en muchos casos es necesario comparar dos muestras independientes
que no se puedan reducir a un conjunto nico de datos. Dichas muestras
pueden contener diferentes nmeros de medidas. Para abordar estos problemas se han propuesto varios contrastes no paramtricos. El ms sencillo de
comprender y realizar es el contraste U de Mann- Whitney, cuya ejecucin
se entiende mejor con un ejemplo.
169
EJEMPLO 6.6.1
Se analiz una muestra de material fotogrfico de desecho mediante espectrometra de absorcin atmica para conocer el nivel de plata, proporcionando para cinco determinaciones
sucesivas los valores 9.8, 10.2, 10.7, 9.5 Y10.5 pg mI"- 1. Despus de recibir un tratamiento
qumico, se volvieron a analizar por el mismo procedimiento. Los resultados obtenidos para
las cinco determinaciones sucesivas fueron los siguientes: 7.7, 9.7, 8.0, 9.9 Y9.0 ~lg mi 1.
Hay alguna evidencia de que el tratamiento traiga consigo una reduccin significativa en
los niveles de plata?
El procedimiento de Mann-Whitney implica encontrar el nmero de resultados en una muestra que supera a cada uno de los valores en la otra muestra.
En este ejemplo, se tiene la impresin de que la concentracin de plata de la solucin
tratada debera ser, si acaso, menor que la de la solucin no tratada (es decir, un contraste
de una cola es adecuado). De esta forma se espera encontrar que el nmero de casos en
los que una muestra tratada tiene un valor ms alto que una muestra no tratada debera
ser pequeo. A continuacin se lista cada uno de los valores de la muestra no tratada, y
se anota en cada caso el nmero de casos en que los valores para la muestra tratada son
mayores.
Muestra no
tratada
Va/ores ms grandes
en /a muestra tratada
Nmero de va/ores
ms grandes
9.8
10.2
10.7
9.5
10.5
9.9
1
O
O
2
O
9.7,9.9
Cuando, como en este ejemplo, los nmeros de medidas son pequeos, el clculo se puede hacer mentalmente, lo que es una gran ventaja. Si se presentan
empates (valores idnticos) en el contraste U, a cada empate se le asigna un
valor de 0.5 en el clculo de U.
Otro mtodo conveniente que tiene algunas caractersticas interesantes es
el contraste rpido de Tukey. Su uso puede mostrarse utilizando el mismo
ejemplo.
""'\
cT
(f)
,-r
O
(f)
170
El contraste rpido de Tukey incluye calcular el nmero total de medidas en las dos muestras independientes que no se incluyen en la regin
de solapamiento de los dos conjuntos de datos.
EJEMPLO 6.6.2
Aplicar el contraste rpido de Tukey a los datos del ejemplo anterior.
Se puede considerar que el contraste consta de dos pasos, aun cuando slo se disponga
de pocos resultados; esos dos pasos se agrupan sin lugar a duda en un nico clculo
mental rpido. En el primer paso, se cuenta el nmero de resultados en el segundo conjunto
de datos que son inferiores a todos los valores delprimer conjunto. Si no existe ningn valor
con esa condicin el contraste se da por terminado, y se acepta la hiptesis nula de medianas iguales. En el ejemplo que se est analizando, hay tres de esos valores, las lecturas
7.7, 8.0 Y9.0, inferiores al menor valor del primer conjunto (9.5). El contraste contina con
el segundo paso, en el que se cuentan todos los valores del primer conjunto de datos que
son superiores a todos los valores del segundo grupo. De nuevo, si no existen esos valores
el contraste se termina y se acepta la hiptesis nula. Aqu, hay de nuevo tres valores, 10.2,
10.5 Y 10.7, que superan al mayor valor del segundo conjunto de datos (9.7). (Esta aproximacin contrasta con la del contraste U de Mann-Whitney que identifica los valores grandes
en la muestra que se esperaran tener la mediana ms pequea.) Globalmente, por tanto,
hay seis valores que no estn dentro del intervalo donde se solapan las dos muestras. Este
total (a menudo designado por 7J es el estadstico del contraste. El aspecto ms interesante
y destacado del contraste rpido de Tukey es que normalmente no son necesarias tablas
estadsticas para interpretar este resultado. Con tal que en cada muestra el nmero de
lecturas no exceda de 20, y que los dos tamaos muestrales no difieran mucho (condiciones
que probablemente sern vlidas en muchos experimentos realizados en laboratorios analticos), los valores crticos de Tpara un nivel de significacin concreto son independientes
del tamao muestra! Para un contraste de una cola se puede rechazar la hiptesis nula si
T~ 6 (para p= 0.05), ~7 (P= 0.025), ?-,10 (P= 0.005) Y ?-'14 (P= 0.0005). (Para un
contraste de dos colas los valores crticos Tpara P= 0.05, 0.025, 0.005 Y 0.0005 son 7,
8, 11 Y 15, respectivamente.) En el ejemplo que estamos analizando, el valor de Tes suficientemente grande para ser significativo a un P = 0.05 en un contraste de una cola. Se
puede por tanto rechazar la hiptesis nula y concluir que el tratamiento reduce significativamente el contenido de plata del material fotogrfico de desecho, lo que concuerda con el
contraste U de Mann-Whitney.
171
Datos
'<
3:
ro,
O
o..
O
(Jl
::l
O
"O
p
3
ro,
q-
_.
(')
(Jl
Posiciones
7.7
8.0
9.0
9.5
9.7
9.8
9.9
10.2
10.5
10.7
10
Ahora se calculan dos sumas de rangos. La suma de las posiciones correspondientes a valores subrayados (muestras tratadas que contienen plata) es 26
y la suma de rangos de las muestras no tratadas es de 29. En este ejemplo
los tamaos muestrales para los dos conjuntos de mediciones son iguales,
aunque ste no ser siempre el caso. Esto se puede permitir mediante la resta
del nmero n/ni + 1)/2 de la suma de rangos, donde los valores de ni son los
tamaos muestrales. En nuestro ejemplo, ni = 5 en cada caso, de manera que
debe restarse 15 de cada suma de rangos. El valor menor de los dos resultados es el utilizado en el contraste, y los valores crticos son los mismos que
los utilizados en el contraste de Mann-Whitney (Tabla A.12). El estadstico
del contraste obtenido en este ejemplo es (26 - 15) = 11, mucho mayor que
el valor crtico de 2 (para un contraste de dos colas a un nivel de P = 0.05).
Se acepta la hiptesis nula, en este caso que la variabilidad de los resultados
sea similar para los dos conjuntos de datos.
El contraste de Siegel-Tukey junta los datos de las dos muestras con
identificacin de cada uno, los ordena, aplica la ordenacin alterna por
pares para generar suma de rangos y teniendo en cuenta los tamaos
muestrales, proporciona un estadstico del contraste que puede ser evaluado utilizando las mismas tablas que para el contraste U de MannWhitney.
Si se analiza un poco este contraste til se ver que su validez queda reducida cuando los valores promedios de los dos conjuntos de datos son sustancialmente diferentes. En el caso extremo en que todas las medidas en una
muestra sean inferiores a todas las medidas en la otra muestra, las sumas de
rangos sern siempre muy parecidas, cualquiera que sea la variabilidad de las
dos muestras. Si se teme que este efecto es apreciable, se pueden estimar las
medias de las dos muestras, y aadir la diferencia entre las medias a cada
una de las medidas del conjunto inferior. Esto eliminar cualquier efecto de-
a
CT
O
(Jl
172
6.7.
Se puede determinar la probabilidad de obtener cualquier suma de cuadrados utilizando el estadstico chi-cuadrado (vase el Captulo 3). Si uno
se refiere a las muestras por A, B, e, etc. (k muestras en total), con un nmero de medidas nA' n/), ne, etc., y la suma de las posiciones por R A , R u , Re,
etc., entonces el valor de -/- viene dado por:
)
"[ =
,
R A2
12
N
+N
nA
2
RR
+-
n13
Re2.
+-
ne
+ ... - 3(N + 1)
(6.2)
donde N = nA + nI) + ne, etc. Este valor "/ se compara como de costumbre
con los valores tabulados. Estos ltimos son idnticos a los valores usuales
cuando el nmero total de medidas es mayor que ca. 15, no obstante se utilizan tablas especiales para nmeros de medidas ms pequeos. El nmero
de grados de libertad es k-l. Los valores experimentales de "/ que superen
los valores tabulados permi ten rechazar la hiptesis nula (que las medianas
de las muestras no sean significativamente diferentes). Como ya se ha indicado, en esta ltima situacin se pueden realizar otros contrastes sobre pares
individuales de muestras: de nuevo, los textos que se citan en la bibliografa
aportan ms detalles.
Ya se ha visto (Secciones 3.4 y 6.3) que cuando se comparan resultados
por parejas, se pueden utilizar contrastes estadsticos especiales. Estos contrastes se basan en el principio de que cuando dos mtodos experimentales
que no difieren significativamente se aplican a las mismas muestras qumicas, las diferencias entre pares de resultados emparejados similares deberan
estar cerca de cero. Este principio se puede extender a tres o ms conjuntos
de resultados emparejados similares utilizando un contraste no paramtrico
ideado en 1937 por Friedman. En qumica analtica, la principal aplicacin
del contraste de Friedman es la comparacin de tres (o ms) mtodos experimentales aplicados a las mismas muestras qumicas. El contraste utiliza
de nuevo el estadstico ,,/, en este caso para calcular las diferencias que aparecen entre los valores de la suma total de posiciones por distintos mtodos.
El siguiente ejemplo aclara la simplicidad de la aproximacin.
EJEMPLO 6.7.1
Se determinaron los niveles de un pesticida en cuatro extractos de planta por (A) cromatografa lquida de alta resolucin, (B) cromatografa gas-lquido, y (e) radionmunoensayo. Se
obtuvieron los siguientes resultados (todos en ng ml- 1):
Muestra
1
2
3
4
A
4.7
7.7
9.0
2.3
Mtodo
8
5.8
7.7
9.9
2.0
e
5.7
8.5
9.5
2.9
173
174
Este problema se resuelve sustituyendo los valores de la tabla por sus rangos. En cada fila
se asigna la posicin 1 al mtodo que da el resultado menor, y la posicin 3 a la que da
el resultado mayor:
Muestra
1
2
3
4
Mtodo
B
1
1.5
1
2
3
1.5
3
1
2
3
2
3
Es necesario el uso de un valor promedio en el caso de posiciones empatadas en la muestra 2 (vase la Seccin 6.5). Las sumas de los rangos para los tres mtodos A, B y e son
5.5, 8.5y 10, respectivamente. Estas sumas totalizaran nA(k + 1)/2 donde k es el nmero
de mtodos (aqu tres) y n el nmero de muestras (aqu cuatro). Se elevan al cuadrado las
sumas de los rangos dando 30.25. 72.25 Y 100, respectivamente, y estos cuadrados se
suman para dar el estadstico R que en este caso es 202.5. El valor experimental de l se
calcula entonces a partir de:
12R
l" = nA(k + 1) -
3~k+ 1)
(6.3)
que resulta en este caso 2.625. Al nivel P = 0.05, Y con k = 3, los valores crticos de l
son 6.0, 6.5, 6.4, 7.0, 7.1 Y 6.2 para n = 3, 4, 5, 6, 7 Y 8, respectivamente. (Muchos conjuntos de tablas estadsticas proporcionan ms datos, y cuando k> 7, se pueden utilizar
las tablas usuales de l con k-1 grados de libertad.) En este caso. el valor experimental de
l es mucho menor que el valor crtico, y se debe aceptar la hiptesis nula: los tres mtodos
dan resultados que no difieren significativamente.
El contraste de Friedman podra utilizarse alternativamente en forma inversa: suponiendo que los tres mtodos analticos dan resultados indistinguibles,
se podra utilizar el mismo procedimiento para contrastar diferencias entre
los cuatro extractos de plantas. En este caso h y n son 4 y 3, respectivamente,
pudiendo verificar el lector que R es 270 y que el valor resultante de / es
9.0. Este valor es mayor que el crtico para P = 0.05, n = 3, h = 4, que es
7.4. As en esta segunda aplicacin del contraste se puede rechazar la hiptesis nula, y afirmar que las cuatro muestras difieren en sus niveles de pesticida. Existen otros contrastes que permiten comparaciones entre pares de
muestras seleccionados.
El contraste de Friedman es evidentemente mucho ms simple de realizar
en la prctica que el mtodo ANOVA (Secciones 3.8-3.10), aunque no tiene
la capacidad de este ltimo de estudiar los efectos de interaccin (vase el
Capitulo 7).
6.8.
Correlacin ordinal
de ordenacin, es especialmente ventajoso cuando alguno de los dos conjuntos de observaciones en estudio se puede expresar slo en trminos de un
orden de posicin en lugar de expresarse en unidades cuantitativas. As, en
el siguiente ejemplo, se investiga la posible correlacin entre las concentraciones de dixido de azufre en un conjunto de vinos de mesa y la calidad de
su sabor. La calidad del sabor de un vino no se expresa fcilmente en trminos cuantitativos, pero es re13tivamente sencillo ordenarlos mediante un panel de catadores de vino segn sus preferencias. Ejemplos de otros atributos
que se ordenan con facilidad pero que no se cuantifican fcilmente, incluyen
la condicin de animales experimentales, la calidad del espacio dedicado al
laboratorio, y la eficiencia del personal del laboratorio. Se debera tambin
recordar que si uno o los dos conjuntos de datos bajo estudio fueran cuantitativos, entonces (en contraste con los mtodos descritos en el Captulo 5)
no es necesario que se distribuyan normalmente. Como otros estadsticos no
paramtricos, el coeficiente de correlacin ordinal de Spearman, r" es fcil
de determinar e interpretar. Esto se muestra en el siguiente ejemplo.
EJEMPLO 6.8.1
Un panel de expertos ordena segn sus preferencias siete vinos de mesa diferentes. Al
mejor se le asigna la posicin 1, al siguiente la 2, y as sucesivamente. El contenido de
dixido de azufre de cada vino (en partes por milln) se determina mediante anlisis por
inyeccin en flujo con deteccin colorimtrica. Utilizar los resultados siguientes para determinar si hay relacin entre la calidad percibida en el vino y el contenido de dixido de azufre.
Vino
Rango segn sabor
Contenido de 802
A
1
0.9
2
1.8
1.7
2.9
5
3.5
3.3
4.7
El primer paso en los clculos es convertir los valores absolutos de las concentraciones de
802 en rangos (si aparecen posiciones empatadas se promedian como se describi en las
secciones anteriores):
Vino
Rango segn sabor
Contenido de 802
A
1
1
B
2
3
3
2
E
5
6
F
6
5
G
7
7
A continuacin, se calculan las diferencias, d, entre las dos ordenaciones. stas son O, - 1,
1, O, - 1, 1, O. El coeficiente de correlacin, (" viene dado por:
(6.4)
175
176
6.9.
b
u
Cld j
y;)
(xi - xa
(6.5)
Se calculan las pendientes bij para el par de puntos (Xl' YI) Y el punto inmediatamente posterior al valor mediano de la x, para (Xz, yz) y el segundo punto posterior al valor mediano de la x, y as sucesivamente hasta que se calcule
la pendiente para la lnea que une el punto inmediatamente anterior a la mediana de X con el ltimo punto. De esta forma, si los datos originales contenan 11 puntos, se estimaran S pendientes (el punto mediano se ha omitido).
Para ocho puntos originales existiran cuatro estimaciones de la pendiente,
y as sucesivamente. Estas estimaciones de la pendiente se disponen en orden ascendente y su mediana es la pendiente estimada de la lnea recta. Con
este valor de b, los valores ai de la ordenada en el origen se estiman para cada
punto con la ayuda de la ecuacin y = a + bx. De nuevo las estimaciones de
a se disponen en orden ascendente y el valor mediano se elige como la mejor
177
EJEMPLO 6.9.1
Se han obtenido los resultados siguientes en un experimento de calibracin para la determinacin absorciomtrica de un complejo metlico tipo quelato:
Concentracin, pg ml- 1
Absorbancia
O
0.04
10
0.23
20
0.39
30
0.59
40
0.84
50
0.86
60
1.24
70
1.42
a, = 0.04 - (0.0204
x O) =
0.23
<% = 0.39
84 = 0.59
85 = 0.84
86 = 0.86
a7 = 1.24
8 8 = 1.42
=
(0.0204
(0.0204
(0.0204
(0.0204
(0.0204
(0.0204
(0.0204
x
x
x
x
x
x
+ 0.040
+ 0.026
10) =
20) =
30) =
40) =
50) =
60) =
70) =
0.018
- 0.022
+ 0.024
-0.160
+ 0.016
- 0.008
-
cr-
Ul
.-+
Ul
178
10
20
30
40
50
60
70
80
Concentracin, ;9 ml- 1
Figura 6.4. Grfico de la recta de calibrado, calculada por el mtodo de Theil ( - ) y por
el mtodo de mnimos cuadrados del Captulo 5 (- - -l.
6.10.
Mtodos robustos
uno o ms criterios sobre los que basar dichas decisiones, pero no se pueden
utilizar dichos criterios a menos que inicialmente se consideren todos los datos. Este problema se resuelve utilizando mtodos iterativos: se estima o adivina un valor o valores de inicio para alguna propiedad de nuestros datos, se
utilizan dichas estimaciones iniciales con nuestro criterio de ponderacin para llegar a una segunda estimacin, entonces se vuelven a aplicar nuestros
criterios, etc. Dichos mtodos son slo practicables si se dispone de una computadora, aunque debe ponerse de manifiesto que muchos programas estadsticos para computadoras no incluyen procedimientos para mtodos robustos.
Hay algunos mtodos robustos muy simples que no exigen dichas iteraciones, porque eliminan arbitrariamente, en lugar de ponderar por defecto,
una proporcin de los datos. Por ejemplo, la media recortada para cualquier conjunto de datos se encuentra omitiendo r observaciones de la parte
superior e inferior del recorrido de los datos. Este principio se puede aplicar
al conjunto de datos de alguno de los ejemplos de la Seccin 3.7. Este ejemplo consider siete medidas replicadas de ion nitrito en agua de ro (mgl- 1):
179
c:r
e
(J)
r-I-
0.380,
0.400,
0.401,
0.403,
0.410,
0.411,
0.413
O
(J)
180
cualquier valor que tomen la medida ms grande o ms pequea. Desgraciadamente, el RI no es un concepto muy significativo para conjuntos de datos
muy pequeos. Adems, y algo sorprendente, hay varias convenciones diferentes para su clculo. Para muestras grandes el convenio elegido produce
pocas diferencias, pero para muestras pequeas las diferencias en los valores
de RI calculados son grandes, de manera que el RI tiene poca aplicacin en
qumica analtica.
Una aproximacin ms lgica a la estimacin robusta se puede basar en
el concepto de una funcin de distancia. Supngase que se tiene una serie
de n resultados x" ... , XII Y se desea estimar JL, la media de los resultados
"fiables". Normalmente nuestra estimacin de ,LI, indicada por el smbolo ,LI,
se obtiene minimizando la suma de cuadrados (Se) L (XI - 11)2. (Esta suma
1
de trminos cuadrticos es la fuente de la sensibilidad de la media a los errores grandes.) La expresin (x - IL)2 se considera como una funcin de distancia, ya que mide la distancia de un punto a ,LI. Una funcin de distancia
ms til en el presente contexto es Ix - rLI. Un mtodo ampliamente utilizado para contrastar medidas para datos con ponderaciones por defecto es
comparar Ix - JI I con ca donde c se suele tomar como 1.5 y e/' es una estimacin robusta de la varianza. Primero se considera la estimacin de (i2, y
luego se analiza el procedimiento de ponderaciones por defecto.
La estimacin robusta de la varianza se puede deducir de un estadstico
relacionado con la desviacin absoluta respecto a la mediana (DAM),
que se calcula a partir de
DAM = mediana [Ixi - mediana(xal]
(6.6)
EJEMPLO 6.10.1
Estas tcnicas se pueden aplicar a las medidas analizadas antes (0.380, 00400, 0.401,
0.403, 0.410, 0.411, 0.413). Primero es necesario calcular el DAM. La mediana de estos
nmeros es 0.403 (es decir, el cuarto de los siete valores ordenados), de manera que las
desviaciones individuales (sin tener en cuenta los signos) son 0.023; 0.003. 0.002, O, 0.007,
O.OOS, 0.010, y 0.023. El DAM es la mediana de estos siete nmeros, es decir, 0.007, as
( = DAM/0.6745 = 0.007/0.6745 = 0.0104 Y 1.50- es 0.0156.
Ahora estamos en posicin para empezar las estimaciones iterativas de ./1. Este proceso
comienza tomando cualquier estimacin razonable para y calculando los valores Ix - rtl
para cada medida. En este ejemplo, supngase que el valor inicial de ji es la mediana,
0.403. Como se ha visto, las desviaciones individuales de este valor son (en orden numrico, pero despreciando sus signos) 0, 0.002, 0.003, 0.007, 0.008, 0.010 Y 0,023. En la
primera iteracin para ji las medidas originales son retenidas si estas desviaciones a la
mediana son .:;; 0.0156. Esto se aplica a todas las desviaciones listadas excepto a la ltima. En el caso de que la desviacin sea > 0.0156, el valor original en cuestin se cambia
para llegar a ser ji o ji +
dependiendo de si originalmente estaba por debajo o
ca
ca,
ca,
Este clculo merece varios comentarios. El primero es que, como tantos procedimientos iterativos, es mucho ms tedioso de describir y explicar que de
realizar! El segundo punto a observar es que en este ejemplo se ha estimado
p haciendo algunas hiptesis (robustas y razonables) sobre &. Hay tambin
mtodos donde lo opuesto es verdadero, es decir, se obtiene una estimacin
robusta de la precisin si se conoce un valor medio, e incluso ms mtodos
en los que ambas estimaciones robustas se calculan iterativamente cada una
por su lado. Por ltimo conviene recalcar de nuevo que estos mtodos robustos no tienen las preocupaciones y ambigedades de los contrastes de observaciones anmalas. En el ejemplo que se acaba de examinar, el contraste de
Dixon (Seccin 3.7) sugiri que el valor 0.380 podra ser rechazado como
una observacin anmala (P = 0.05), pero el simple contraste basado en
DAM (ver lo anterior) sugiri que no sera as, ya que [Ix o - mediana(x,)lJ!
DAM = [10.380 - 0.4031J!0.007 = 3.3 se encuentra muy por debajo del valor
crtico aproximado de 5. Tales cuestiones y contradicciones desaparecen en
la estadstica robusta, donde las obsenraciones anmalas ni son completamente rechazadas ni aceptadas sin cambios, sino que son aceptadas en una
forma modificada o con una ponderacin por defecto.
Otra aproximacin robusta a los estadsticos de medidas repetidas (y a la
regresin) viene proporcionada por la Winsorizacin. Esto se puede considerar como una variante del mtodo descrito antes. Las medidas que dan las
desviaciones ms grande y ms pequea de la mediana (o, en regresin, los
residuos ms grandes) se reducen en importancia movindolos de manera
que sus desviaciones/residuos sean iguales al siguiente valor ms grande
(o quiz el tercero ms grande) positivo o negativo, respectivamente. La
arbitrariedad del procedimiento resulta inferior que en los mtodos de recorte, ya que el cambio en el valor de desviacin/residuo para cualquier
punto sensible es pequeo. Dada la disponibilidad de los programas requeridos, stas y otras tcnicas robustas de regresin es seguro que encon-
181
182
6.11.
En las Secciones 5.13 y 6.19 se han expuesto los problemas causados por las
posibles observaciones anmalas en los clculos de regresin, y se ha analizado la problemtica del rechazo utilizando un criterio especificado y aproximaciones no paramtricas. Queda claro que las aproximaciones robustas
sern valiosas en la estadstica de la regresin as como en la estadstica de
las medidas repetidas, y de hecho, entre los cientficos analticos se ha incrementado el inters por los mtodos de regresin robustos. Un resumen de
dos de las muchas aproximaciones desarrolladas tiene que ser suficiente.
En la Seccin 6.9 se observ que una nica medida sospechosa tiene un
efecto considerable sobre los valores a y b calculados para una lnea recta
mediante el mtodo de mnimos cuadrados normal, que busca minimizar
la suma de los cuadrados de los residuos de y. Esto es debido a que, como en
el ejemplo de la determinacin de nitrito expuesto anteriormente, el uso de
los trminos cuadrticos da lugar a que dichos datos sospechosos tengan una
gran influencia sobre la suma de cuadrados. Una alternativa clara y obvia
consiste en minimizar la media de los residuos cuadrticos, que se encontrar afectada en menor extensin por los residuos grandes. Este mtodo de la
mnima mediana de cuadrados (MMC) es muy robusto: su punto de ruptura, es decir, la proporcin de observaciones extremas entre los datos que
se pueden tolerar es el 50 %, el valor mximo terico. (Si la proporcin de
resultados sospechosos supera al 50 % claramente llega a ser imposible distinguirlos de los resultados fiables.) Las simulaciones utilizando conjuntos de datos, con observaciones extremas incluidas de forma deliberada,
muestran un mejor funcionamiento que el obtenido con el mtodo de
Theil. El mtodo MMC tambin funciona bien en casos como el analizado
en la Seccin 5.11, donde se desea caracterizar la parte de una lnea recta
de un conjunto de datos que es lineal cerca del origen, pero no lineal a valores ms grandes de x e y. Su desventaja es que conlleva un clculo iterativo
que converge bastante lentamente: esto es, se exige a menudo muchas iteraciones antes de que los valores a y b estimados lleguen a ser ms o menos
constantes.
Otros mtodos de regresin robustos se estn utilizando crecientemente.
El mtodo de mnimos cuadrados iterativamente reponderados empieza
con una estimacin directa por mnimos cuadrados de los parmetros de una
recta. Entonces se asignan diferentes pesos a los residuos resultantes, usualmente a travs de una aproximacin de doble peso. Los puntos con residuos
muy grandes (por ejemplo, al menos seis veces ms grandes que el valor residual mediano) son rechazados, es decir, se le asigna peso cero, mientras
que a los puntos con los residuos ms pequeos se les asignan pesos que
crecen a medida que los residuos se hacen cada vez ms pequeos. Se aplica
entonces al nuevo conjunto de datos un clculo de mnimos cuadrados pon-
derados (Seccin 5.10); y estos pasos se repiten hasta que los valores para a
y h convergen a niveles estables. En este mtodo la convergencia suele ser
usualmente rpida.
6.12.
z=--
(6.7)
(J
en la que cada trmino tiene su significado habitual. La funcin de distribucin acumulada se proporciona en la Tabla A.1. La Ecuacin (6.7) se puede
utilizar de dos formas. En algunos casos es necesario contrastar la proceden-
183
184
EJEMPLO 6.12.1
Se realizaron ocho valoraciones, con los resultados 25.13,25.02,25.11,25.07,25.03,24.97,
25.14 Y 25.09 mI. Podran dichos resultados proceder de (a) na poblacin normal con
media 25.00 mi y desviacin estndar 0.05 mi, y (b) de cualquier otra poblacin normal?
(a) En este caso, el primer paso es transformar los valores de x en valores z utilizando la
relacin z = (x -. 25.00)/0.05, obtenida de ia Ecuacin (6.7). Los ocho resultados se transforman en 2.6, 0.4, 2.2, 1.4, 0.6, - 0.5, 2.8 Y1.8. Estos valores z se ordenan y representan
grficamente como una funcin de distribucin con un salto de 0.125 (es decir, 1/8) en cada
paso. (Obsrvese que ste no es el mismo clculo que se ilustr en la Seccin 3.12). La
comparacin con la funcin hipottica de z (Tabla A.l) indica (Figura 6.5) que la diferencia
mxima es 0.545 en un valor de z ligeramente inferior a 1.4. Para contrastar este valor se
utiliza la Tabla A.14. La tabla muestra que, para n = 8 Y P = 0.05, el valor crtico es 0.288,
de modo que se puede rechazar la hiptesis nula: los resultados de las valoraciones probablemente no proceden de una poblacin normal con media 25.00 y desviacin estndar
0.05 mI.
(b) En este caso, se estiman la media y la desviacin estndar [utilizando las Ecuaciones
(2.1) Y (2.2)] para 25.07 y 0.059 mi, respectivamente, y el ltimo resultado tiene dos cifras
significativas correctas. Los valores de zvienen ahora dados por Z= (x -- 25.07)/0.059, es
decir, por 1.02, - 0.85, 0.68, O, - 0.68, - 1.69, 1.19, 0.34. El diagrama de frecuencias
acumuladas difiere de la curva hipottica a lo sumo en 0.125 (en varios puntos). Esta diferencia es mucho ms pequea que el valor crtico de 0.288. Entonces se puede aceptar la
hiptesis nula de que los datos proceden de una poblacin normal con media 25.07 y desviacin estndar 0.059.
6.13.
Conclusiones
1.0
185
ro
ro
"O
"S
E
::J
U
ro
e
'
'0
::J
.o
";:
t
'5
0.5
al
"O
e
'o
"o
e
::J
u..
-4
-3
-2
-1
Figura 6.5. El empleo del mtodo de Kolmogorov para contrastar la distribucin normal. Las
diferencias mximas entre la curva de frecuencias acumuladas terica y las dos distribuciones
contrastadas vienen reflejadas por las flechas (<-.
ser menor que la del correspondiente contraste paramtrico, pero la diferencia es realmente de escasa importancia. Por ejemplo, se han hecho muchas
comparaciones de la potencialidad en condiciones diferentes (es decir, distribuciones poblacionales y tamaos muestrales diferentes) del contraste U de
Mann-Whitney y del contraste t. El primero opera muy bien en casi todas
las circunstancias y es slo marginalmente menos potente que el contraste t
aun cuando los datos procedan de una poblacin normalmente distribuida.
Muchos programas para computadoras personales incluyen en la actualidad
varios contrastes no paramtricos. Dichos programas permiten evaluar un
conjunto concreto de datos con rapidez por dos o ms mtodos, y parece claro que el inters por estos mtodos aumenta en vez de disminuir.
Los mtodos robustos normalmente no son tan fciles de usar, a la vista
de la necesidad de clculos iterativos, pero representan la mejor manera de
abordar uno de los problemas ms difciles y comunes de los analistas prcticos, la existencia de resultados sospechosos y anmalos.
Exite una amplia variedad de contrastes de significacin (paramtricos,
no paramtricos y robustos), y a menudo en la prctica la tarea ms difcil
es decidir qu mtodo es el ms adecuado para un problema concreto. El
diagrama del Apndice 1 est diseado para tomar tales decisiones con ms
facilidad, aunque inevitablemente no puedan cubrir todas las posibles situaciones prcticas.
Bibliografa
Chatfield, C. 1988. Problem Solving: A Statistician's Guide. Chapman and Hall,
London. (Un libro eminentemente prctico y til que contiene muchos
consejos valiosos: extensos apndices resumen el conocimiento terico.)
Conover, W. J 1971. Practical Non-parametric Statistics. Wiley, New York.
(Probablemente el mejor texto general de mtodos no paramtricos.)
186
Daniel, W. 1978. Appled Non-parametric Statistics. Houghton Mifflin, Boston. (Un texto extenso que abarca un amplio rango de mtodos no paramtricos con bastante profundidad. Contiene muchos ejemplos.)
Rousseuw, P.]. and Leroy, A. M. 1987. Robust Regresion and Outlier Detection. John Wiley, New York. (Un libro excelente y de fcil lectura con
muchos ejemplos ilustrativos.)
Sprent, P. 1981. Quick Statistics. Penguin Books, London. (Una introduccin
excelente a los mtodos no paramtricos, con explicaciones claras y sin
matemticas, con muchos ejemplos y ejercicios.)
Sprent, P. 1989. Applied Non-parametric Statistical Methods. Chapman and
Hall, London. (Cubre a nivel prctico un amplio nmero de contrastes de
significacin, con una buena discusin de las tcnicas robustas.)
Velleman, P. F. and Hoaling, D. C. 1991. Applcations, Basics and Computing
ofExploratory Data Analysis. Duxbury Press, Boston. (Una introduccin
excelente a AID/AED: se incluyen programas de computadora en BASIC
y FORTRAN.)
Ejercicios
1.
Se realiz una valoracin cuatro veces, con los resultados: 9.84, 9.91,
9.89, 10.20 mI. Calcular y comentar la mediana y la media de estos resultados.
2.
3.
Las concentraciones (g 100 ml- l) de inmunoglobulina G en suero sanguneo de diez donantes se miden por inmunodifusin radial (IDR) y
por electroinmunodifusin (EID), con los siguientes resultados:
Donante
Resultados IDR
Resultados EID
1
1.3
1.1
2
1.5
1.6
3
0.7
0.5
4
0.9
0.8
5
1.0
0.8
6
1.1
1.0
7
0.8
0.7
8
1.8
1.4
9
0.4
0.4
10
1.3
0.9
4.
cerveza rubia cada uno, y se encontr que los niveles de alcohol en sangre
eran de 68, 86, 71, 79, 91 Y 66 mg 100 mI-l. Usar el contraste rpido de
Tukeyo el contraste U de Mann-Whitney para investigar si al beber cerveza
rubia se produce un nivel de alcohol en la sangre inferior que al beber la
misma cantidad de otro tipo de cerveza. Utilizar el mtodo de Siegel-Tukey
para verificar si las variabilidades en estos dos conjuntos de resultados difieren significativamente.
6.
7.
Use el mtodo de Theil para calcular la lnea de regresin para los datos
del Ejercicio 1 del Captulo 5.
187
8.
9.
Muestra
1
2
3
14.2
14.5
18.3
16.0
16.1
19.3
CJ
~
O
(Jl
Diseo
de experimentos
y optimizacin
7.1.
Introduccin
190
factores que afectasen a los resultados, de manera que no pudieran considerarse otros diseos experimentales. En realidad el experimento de fluorescencia puede modificarse por otros factores tales como la temperatura
ambiente, el uso del mismo u otro fluormetro para cada medida, y las fechas,
horarios y personal encargado de realizar las medidas. Cualesquiera de estos
factores podra haber influido en los resultados que muestra el comportamiento observado e invalidar la conclusin extrada sobre el efecto de las
condiciones de almacenamiento. Queda claro que si se quiere que las conclusiones extradas de un experimento sean las correctas hay que identificar de
antemano los diferentes factores que influyen en el resultado y, si es posible,
controlarlos.
El trmino diseo experimental se utiliza habitualmente para describir las etapas de:
1.
2.
3.
Puesto que son muchos los factores que afectan a los resultados experimentales, pueden necesitarse diseos experimentales ciertamente complejos. La
eleccin de los mejores niveles prcticos de estos factores, es decir, la optimizacin de las condiciones experimentales, requerir un estudio detallado.
Estos mtodos, junto con otros mtodos multivariantes que se estudian en el
prximo captulo, se encuadran bajo el trmino general de quimiomtricos.
7.2.
1
2
3
4
0.1
0.1
1
0.5
M,
M,
M,
M,
1
1
0.5
1
M,
M,
M,
M,
0.1
0.1
0.5
0.5
M
M
M
M
Con este diseo las medidas que utilizan cido perclrico 0.1 M, como disolvente de la quinina se llevan a cabo (por azar) los dos primeros das, mientras que las que utilizan perclrico 0.5 M, se realizan los ltimos dos das. Si
se tuviese la impresin que existe diferencia entre los niveles de estos dos
cidos, no sera posible decir si esta diferencia es autntica o si est provocada por el efecto de utilizar los dos tratamientos en pares de das diferentes.
Un diseo mejor es aquel en el que cada tratamiento se utiliza una vez al
da, y el orden de los tratamientos se aleatoriza cada da. Por ejemplo:
Da
Da
Da
Da
1
2
3
4
0.1
0.1
1
1
M,
M,
M,
M,
1
0.5
0.5
0.1
M,
M,
M,
M,
0.5 M
1M
0.1 M
0.5 M
7.3.
191
192
Tabla 7.1.
Tratamiento
1
Bloque 1
Bloque 2
Xi1
X21
Xi2
..122
Xij
X2j
A2c
Bloque i
x~
Xij
Xc
Bloque r
Totales de columna
xt1
T1
xl2
T2
Xrj
xrc
Te
Ti
li.
12.
Xic
0T = gran total
efectos. En la Tabla 7.1 se muestra la forma del esquema general de este mtodo.
Cada una de las N medidas, xij, se clasifica bajo los trminos niveles de
los tratamientos y bloques: el ltimo trmino se introdujo en la seccin
anterior. (Estos trminos han derivado del uso original del ANOVA por
R. A. Fisher en experimentos agricolas, sin embargo son generalmente adoptados.) Utilizando los smbolos convencionales existen e niveles de tratamientos y r bloques, por tanto, N = er. Tambin aparecen los totales por fila
(T], T 2 , etc.) y por columna (T], T 2 , etc.) y el total global, T, que se necesitan en los clculos. (Los puntos en los totales de columnas y filas recuerdan
que en cada caso slo se estudia uno de los dos factores.) En la Tabla 7.2 se
proporcionan las frmulas para calcular la variacin de las tres fuentes diferentes, o sea, entre tratamientos, entre bloques, y los errores experimentales.
Su obtencin no se expondr aqu con detalle: los principios del mtodo son
similares a los descritos para el ANOVA de un factor (Seccin 3.9) y en la
Bibliografa se encuentran textos que proporcionan detalles adicionales.
Como en el ANOVA de un factor, los clculos se simplifican debido a la
aparicin repetida del trmino y2 IN, y por el hecho de obtenerse por diferencia el error residual (experimental aleatorio). Es de resaltar que puede
obtenerse una estimacin de este error experimental, aun cuando slo se haga una medida para cada combinacin del nivel de tratamiento y bloques
(por ejemplo, cada agente quelatante se ensaya slo una vez cada da en el
ejemplo siguiente).
Tabla 7.2.
Fuente de variacin
Suma de cuadrados
Grados de libertad
Entre tratamientos
"!Jr- QIN
c-1
Entre bloques
I77lc-QIN
r- 1
Residual
por diferencia
por diferencia
Total
IIx7j- fIN
N-1
193
EJEMPLO 7.3.1
En un experimento para comparar la eficiencia porcentual de diferentes agentes quelatantes
en la extraccin de iones metlicos en solucin acuosa. se obtuvieron los siguientes resultados:
Agente queJatante
B
A
C
Ola
1
2
3
84
79
83
80
83
80
80
77
78
O
79
79
78
Cada da se prepara una disolucin reciente del ion metlico (con una concentracin especificada) y se realiza la extraccin con cada uno de los agentes quelatantes, tomados en
orden aleatorio.
En este experimento el uso de diferentes agentes quelatantes resulta un factor controlado ya que el experimentador elige los agentes quelatantes. El da de la realizacin del
experimento supone un factor incontrolado ya que intrGduce una variacin incontrolada causada por los cambios de la temperatura del laboratorio, presin, etc. y por ligeras diferencias
en la concentracin de la solucin del ion metlico, es decir, el da es un factor aleatorio.
En los captulos anteriores se explic la manera de utilizar el ANOVA para contrastar el
efecto significativo debido a un factor incontrolado o para estimar la varianza de un factor
aleatorio. En este experimento. donde se presentan los dos tipos de factores, el ANOVA de
dos factores se puede utilizar de las dos maneras: (i) para contrastar si los diferentes agentes quelatantes tienen eficiencias significativamente diferentes, y (ii) para contrastar si la
variacin da a da es significativamente ms grande que la variacin debida al error aleatorio de la medida y, si es as, estimar la varianza de esta variacin da a da. Como en el
ANOVA de dos factores. los clculos se pueden simplificar restando a cada medida un nmero arbitrario. La siguiente tabla muestra las medidas una vez que se les ha restado 80
a cada una de ellas.
Bloques'
Da 1
Da 2
Da 3
Totales por olumna, T.
f= 86
Tratamientos
B
C
-5
3
O
O
3
36
25
-1
3
O
-3
-2
Se tiene: r= 3, c= 4, N= 12 Y I
-1
-1
-2
16
-4
T7
6
-5
36
25
1I
-1
T7
62
O = Gran total, T
~i= 54.
Entre tratamientos
Entre bloques
Residual
Total
Suma de cuadrados .
2
g./.
Cuadrado medio
3
2
6
11
28.6667/3
15.5/2
9.8333/6
=
=
=
9.5556
7.75
1.6389
Es importante resaltar que, debido a que el cuadrado medio residual se obtiene por diferencia, se deben de tomar inicialmente en la tabla muchas cifras significativas para evitar erro. res significativos en los casos donde sea pequea esta diferencia calculada.
194
Es formativo verificar que este clculo separa de hecho los efectos entre tratamientos
y entre bloques. Por ejemplo, si se incrementan todos los valores de un bloque en una
cantidad fija y se vuelven a calcular las sumas de cuadrados, se llega a que, mientras se
modifica la suma de cuadrados total y entre bloques, la suma de cuadrados residual y entre
tratamientos no lo hace.
Si no hay ninguna diferencia entre las eficiencias de los quelatantes ni tampoco da a
da, entonces los tres cuadrados medios proporcionan una estimacin de a~, la varianza de
la variacin aleatoria debida al error experimental (vase la Seccin 3;9). Como en el
ANOVA de un factor, el contraste F se utiliza para ver si las estimaciones de la varianza
difieren significativamente. Comparando el cuadrado medio entre tratamientos con el cuadrado medio residual resulta:
Aqu el valor crtico es 5.14, de manera que no hay diferencia significativa entre das. A
pesar de ello, el cuadrado medio entre bloques es considerablemente mayor que el cuadrado medio residual y hace que el experimento sea no bloqueado, de manera que estos
dos efectos se combinen en la estimacin del error experimental, el experimento no podra
probablemente haber sido posible de detectarse si diferentes tratamientos dan resultados
significativamente diferentes. Si la diferencia entre das hubiera sido significativa, indicara
que otros factores tales como la temperatura, presin, preparacin de la solucin, etc., hubieran tenido un cierto efecto. Puede demostrarse que los cuadrados medios entre bloques
proporcionan una estimacin de ~ +
donde
es la varianza de la variacin aleatoria
da a da. Puesto que el cuadrado medio residual proporciona una estimacin de a~, se
puede deducir una estimacin de ~.
cut
oi
7.4.
A B e
e A B
Da 1
Da 2
Da 3
195
o
(ji'
(\)
:JI
P-
ro
(\)
><
'
(\)
::1-
(\)
:J
.....
CJl
Este diseo de bloques, en el que cada tratamiento aparece una vez en cada
fila y una vez en cada columna, recibe el nombre de cuadrado latino. ste
permite separar la variacin entre tratamientos, entre bloques, entre los momentos del da y los componentes del error experimental aleatorio. Es posible considerar diseos ms complejos que eliminen esta restriccin de igual
nmero de bloques y tratamientos. Si existen ms de tres bloques y tratamientos son obviamente posibles ins de un diseo de cuadrados latinos
(uno puede elegirse al azar). Los tipos de diseo experimental discutidos hasta aqu se denominan de clasificacin cruzada, ya que proporcionan las
medidas para cada combinacin posible de los factores. Sin embargo, en
otros casos (por ejemplo, cuando se envan muestras a diferentes laboratorios, y se analizan por dos o ms experimentadores en cada laboratorio) los
diseos se denominan anidados o jerrquicos, debido a que los experimentadores no realizan medidas en otros laboratorios que no sean las realizadas
en el suyo propio. Tambin son posibles mezclas entre diseos anidados y
de clasificacin cruzada.
7.5.
Interacciones
En el ejemplo de la Seccin 7.3 se vio que los clculos ANOVA de dos factores utilizados suponan que los efectos de los dos factores (agentes quelatantes y das) eran aditivos. Esto significa que si, por ejemplo, slo se dispone
de dos agentes quelatantes, A y B, Y se estudian los dos das, los resultados
podran haber sido algo as:
Agentes quelatantes
Da 1
Da 2
80
82
77
79
'<:
O
'
.....
3'
~.
()
5:
:J
196
cuarta se puede deducir fcilmente. Supngase, sin embargo, que la eficiencia de extraccin del agente quelatante B el segundo da hubiera sido del
83 % en vez del 79 %. Entonces se concluira que la diferencia entre los dos
agentes depende del da que se realicen las medidas, o que la diferencia entre
los resultados de los dos das depende del agente que se use. Esto es, existira
una interaccin entre los dos factores que afectan a los resultados. Tales
interacciones son extremadamente importantes en la prctica: una estimacin reciente sugiere que al menos dos tercios de los procesos en la industria qumica estn afectados por interacciones, factores muy opuestos a los
aditivos.
Desafortunadamente, cuando la situacin se confunde por la presencia
de errores aleatorios, la deteccin de interacciones no es del todo tan sencilla
como implican los anteriores ejemplos,. Si se aplica un clculo de un
ANOVA de dos factores a la sencillsima tabla anterior, la suma de cuadrados residual da cero, pero si uno de los valores se modifica esto ya no es as.
Con este diseo del experimento no se puede decir si una suma de cuadrados
residual distinta de cero es debida a errores aleatorios, a una interaccin entre los factores, o a ambos efectos. Para resolver este problema deben repetirse las medidas de cada casilla. La manera de hacer esto es importante: las
medidas deben repetirse de manera que todas las fuentes de error aleatorio
estn presentes en cada caso. As pues, si en nuestro ejemplo se ha utilizado
material de vidrio diferente u otras partes de equipos en los experimentos
con diferentes agentes quelatantes, entonces las medidas repetidas aplicadas
a cada agente quelatante cada da deben utilizar tambin aparatos diferentes.
Si se utiliza el mismo equipo para estas repeticiones, se desestimar claramente el error aleatorio de las medidas. Si las repeticiones se realizan adecuadamente, el mtodo que permite separar la suma de los cuadrados de la
interaccin y el error aleatorio se ilustra mediante el siguiente ejemplo.
EJEMPLO 7.5.1
En un experimento para investigar la validez de una solucin como patrn de absorbancia
lquido, se calcul el valor de la absortividad molar, D, de soluciones con tres concentraciones diferentes a cuatro longitudes de onda diferentes. Se realizaron dos medidas repetidas
por cada combinacin de concentracin y longitud de onda y se aleatoriz el orden en que
se hicieron las medidas. Los resultados se muestran en la Tabla 7.3: para simplificar los
clculos, los valores de /: calculados se han dividido por 100.
Tabla 7.3.
Concentracin, g/
0.02
0.04
0.06
240
270
300
350
94,96
93,93
93,94
106,108
106,105
106,107
48,51
47,48
49,50
78,81
78,78
78,79
La Tabla 7.4 muestra el resultado de los clculos con Minitab para estos resultados.
(NB. Al utilizar este programa para los clculos de ANOVA de dos factores con interaccin,
es esencial evitar la opcin de un modelo aditivo, ya que ste excluira el efecto deseado
de interaccin. Excel proporciona tambin opciones para incluir efectos de interaccin en el
ANOVA de los factores.) Aqu se explica con ms detalle como se obtiene esta tabla ANOVA.
Tabla 7.4.
El primer paso en los clculos es encontrar los totales de celda. Esto se hace en la Tabla
7.5, que tambin incluye otras cantidades necesarias en los clculos. Como antes, T denota
el total de la fila ,isima, T el total de la columna fsima y T el gran total.
Tabla 7,5.
270nm
300nm
0.02 gl-l
0.06 gl 1
0.10 gl-l
190
186
187
214
211
213
99
95
99
T./
563
638
293
1"/
316969
407044
85849
L 1" = 1032646
T,
t:
159
156
157
662
648
656
438244
419904
430336
472
T= 1966
350nm
/.
222784
L T7 = 1288484
Se calculan como antes las sumas de cuadrados entre filas, entre columnas y el total. Cada
clculo, exige el trmino 1"/nrc (donde n es el nmero de medidas repetidas en cada celda,
en este caso 2, r el nmero de filas y e el nmero de columnas). A este trmino se le
denomina a veces trmino de correccin,
Aqu se tiene:
T7I nc -
1288484/(2 x 4) - 161048.17
12.33
L 1"/nr -
1032646/(2 x 3) - 161048.17
11059.50
197
198
L ijk - e
donde X/k es la k-sima rplica en la ,Lsima fila y jsima columna, es decir, I xik es la
suma de los cuadrados de las medidas individuales que aparecen en la Tabla 7.3.
Suma de cuadrados total = 172138 - 161048.17
= 11089.83
con ncr - 1 = 23 grados de libertad.
La variacin debida al error aleatorio (normalmente llamada variacin residual) se estima a partir de la variacin dentro de casillas, es decir, la variacin entre repeticiones.
La suma de cuadrados residual = I x7"k T1J n, donde 0; es el total para la casilla
de la ,Lsima fila y jsima columna, es decir, la suma de las medidas replicadas en la
,Lsima fila y la jsima columna.
= x1/k -
fl;/n
= 172138 - 344244/2'
= 16
Interaccin. sta es obviamente no significativa ya que el cuadrado medio de la interaccin es menor que el cuadrado medio residual.
Entre columnas (es decir, entre longitudes de onda). sta es claramente significativa
ya que se tiene:
F = 3686.502/1.3333
= 2765
El valor crtico de F3.12 es 3.49 (P = 0.05). En este caso se esperara un resultado significativo ya que la absorbancia depende de la longitud de onda.
3.
F= 6.17/1.3333
= 4.63
El valor crtico de F.12 es 3.885 (P = 0.05), indicando que la variacin entre filas es demasiado grande para que se cuente como variacin aleatoria. Por tanto, la solucin no es
adecuada como patrn de absorbancia. La Figura 7.1 muestra el grfico de la absortividad
molar frente a la longitud de onda, en la que los valores con la misma concentracin estn
unidos por lneas rectas. Esto aclara los resultados del anlisis anterior de la siguiente
forma:
1.
2.
3.
-.e-----_e
.e-----
100
50
270nm
240nm
-----_e-----_I
350nm
.e-----_e-----_e
300nm
0.02
Concentracin, gl-1
Figura 7.1.
Fuente de variacin
Suma de cuadrados
Entre filas
I
I
t;/nc-
Entre columnas
"f/nr-
e
e
Grados de libertad
r- 1
c- 1
Interaccin
por diferencia
Residual
I
I
Total
~jk-
~jk-
J7Jn
por diferencia
rd..,n - 1)
rcn- 1
199
200
ratorios. Si existiesen, entonces se podra estimar la varianza entre laboratorios. Sin embargo, si hay alguna interaccin significativa, el contraste sobre
diferencias significativas entre laboratorios tiene poca relevancia.
Para que un ANOVA de dos factores sea vlido se deben satisfacer las
siguientes condiciones (vase tambin la Seccin 3.10):
1.
2.
El error aleatorio es el mismo para todas las combinaciones de los niveles de los factores.
Los errores aleatorios siguen distribuciones (aproximadamente) normales.
7.6.
2.
7.7.
reaccin sea tan alta como sea posible. El proceso de bsqueda de estos niveles ptimos del factor se conoce como optimizacin. En las siguientes secciones se discuten con detalle varios mtodos de optimizacin. No obstante,
antes de comenzar con un proceso de optimizacin se determinan los factores y las interacciones que afectan de manera importante a la respuesta: es
tambin valioso conocer qu factores tienen escaso o ningn efecto, de manera que no se desperdicien ni tiempo ni otros recursos en experimentos innecesanos.
Tales estudios utilizan un experimento factorial en el que cada factor tenga dos niveles, conocidos habitualmente por alto y bajo. En el caso de
una variable cuantitativa los trminos alto y bajo tienen el significado
usual. La eleccin exacta de los niveles se determina principalmente por la
experiencia y conocimiento del experimentador y las restricciones fsicas del
sistema, por ejemplo, en disolucin acuosa slo son practicables temperaturas en el intervalo 0-100 oC. Algunos problemas relacionados con la eleccin
de los niveles se discuten ms adelante. Para una variable cualitativa, alto
y bajo se refieren a condiciones diferentes, por ejemplo, la presencia o
ausencia de un catalizador, agitacin mecnica o magntica, muestras de forma granular o en polvo, etc. Como ya se han considerado experimentos con
dos factores con cierto detalle, nos centraremos en uno con tres factores: A,
B Y C. Esto significa que hay 2 x 2 x 2 = 8 combinaciones posibles de niveles de factores, como se muestra en la tabla siguiente. Un signo ms indica
que el factor est en el nivel alto y un signo menos que est en el nivel bajo.
La primera columna proporciona una notacin utilizada a menudo para describir las combinaciones, donde la presencia de la correspondiente letra en
minscula indica que el factor est en el nivel alto y su ausencia que el factor
est en el nivel bajo. El nmero 1 se u tiliza para indicar que todos los factores estn en el nivel bajo.
Combinacin
a
b
e
be
ac
ab
abe
11
Y2
+
+
+
+
+
Respuesta
+
+
+
+
+
+
Y3
Y4
Y5
Y6
Y7
Y8
El mtodo por el cual se estiman los efectos de los factores y sus interacciones se ilustra mediante el ejemplo siguiente.
EJEMPLO 7.7.1
En un experimento de cromatografa lquida de alta resolucin, se investig la dependencia
del parmetro de retencin, k, sobre tres factores. Los factores fueron pH (factor P), la
concentracin de un contran (factor T) y la concentracin de disolvente orgnico en la fase
mvil (factor e). Se utilizaron dos niveles para cada factor y se realizaron dos medidas, una
201
202
rplica de la otra, para cada combinacin. Las medidas se aleatorizaron. La tabla que se
expone a continuacin da el valor medio para cada par de rplcas.
/(
1
P
pt
pc
4.7
9.9
7.0
2.7
15.0
5.3
12
pIe
6.0
Nivel de C
Nivel de T
Nivel de P
Diferencia
+
+
+
+
9.9
5.3
15.0
6.0
4.7
2.7
7.0
3.2
Total
5.2
2.6
8.0
2.8
18.6
0.75
Es importante darse cuenta que esta cantidad estima el grado en que los efectos de P y T
no son aditivos. Igualmente, se podra haber calculado considerando que el cambio en respuesta para los dos niveles de T es independiente del nivel de P.
Las otras interacciones se calculan de manera simlar.
Efecto de interaccin CP = -1.95
Efecto de interaccin CT = - 1.55
203
La interaccin PT calculada anteriormente se puede dividir en dos partes con relacin al nivel
de C. Con C en el nivel bajo, laeslimacin de la interaccin sera (80 - 5.2)/2 = 1.4, Ycon
C en el nivel alto sera (2.8 - 2.6)/2 = 0.1. Si no hubiera interaccin entre los tres factores
ni error aleatorio, estas estimaciones de la interaccin PT deberan ser iguales. La interaccin
de los tres factores se estima por la mitad de su diferencia [= (0.1 - 1.4)/2 = - 0.65]. La
interaccin de los tres factores mide hasta que punto el efecto de la interaccin PT y el
efecto de C no son aditivos: igualmente se podra calcular considerando la diferencia entre
las estimaciones de la interaccin TC para los niveles bajo y alto de P.
Estos resultados se resumen en la siguiente tabla.
Efecto
4.65
2.15
-4.85
0.75
-1.55
-1.95
--0.65
PTC
Los clculos se han presentado con cierto detalle de cara a mostrar con ms claridad los
principios. Un algoritmo debido a Yates (vase la Bibliografa) simplifica el clculo.
Para contrastar qu efectos, si existen, son significativos, se puede utilizar el ANOVA
(suponiendo que existe homogeneidad de varianzas). Se puede demostrar que en un expe
rimento de dos niveles, como ste, las sumas de cuadrados necesarios se pueden calcular
de los efectos estimados utilizando
Suma de cuadrados
=Nx
(efecto estimado)2/4
Suma de cuadrados
86.49
18.49
94.09
2.25
9.61
15.21
1.69
T
C
PT
TC
PC
PCT
Se puede demostrar que' Cada suma de cuadrados tiene un grado de libertad y puesto que
el cuadrado medio viene dado por
Cuadrado medio = suma de cuadrados/nmero de grados de libertad
cada cuadrado medio es simplemente la correspondiente suma de cuadrados. Para contrastar si un efecto es significativo, se compara el cuadrado medio con el cuadrado medio del
error (residual). ste se calcula de las medidas individuales utilizando el mtodo descrito en
el ejemplo de absortividad molar de la Seccin 7.5. En este experimento el cuadrado medio
204
residual obtenido fue 0.012 con ocho grados de libertad. El contraste de significacin, empezando con la interaccin de orden ms grande, proporciona para la interaccin PTC:
F= 1.69/0.012
= 141
que es obviamente significativa. Si existe interaccin entre los tres factores no hay ninguna
razn para contrastar si los factores tomados por pares o individualmente son significativos,
ya que se tienen que considerar todos los factores en cualquier proceso de optimizacin.
Slo se debera contrastar la significacin de un nico factor si no hubiera interaccin con
otros factores.
7.8.
Cuando se han identificado los diferentes factores e interacciones que afectan a los resultados de un experimento, se necesitan mtodos separados para
determinar la combinacin de los niveles del factor que proporcionarn la
respuesta ptima. En primer lugar ha de definirse cuidadosamente lo que se
entiende por respuesta ptima en un procedimiento analtico dado. En algunos casos el objetivo ser asegurar que el instrumento de medida proporciona una seal de respuesta mxima, por ejemplo, la mayor absorbancia,
corriente, intensidad de emisin, etc., posible. Sin embargo, en otros muchos
casos el resultado ptimo de un experimento puede que sea la mxima relacin seal-ruido o seal fondo, la mejor resolucin (en mtodos de separacin) , o incluso una respuesta mnima (por ejemplo, cuando una seal de
interferencia se encuentra bajo estudio). En trminos matemticos, encontrar los mximos y los mnimos son procesos virtualmente idnticos, de manera que el ltimo ejemplo no causa ningn problema adicional. Hay que
poner el nfasis en algo obvio como es que el objetivo exacto de un experimento de optimizacin debe ser definido cuidadosamente de antemano, ya
que en la prctica muchos procesos de optimizacin han fallado simplemente
porque el objetivo no se defini con suficiente claridad.
Un buen mtodo de optimizacin tiene dos cualidades. Produce un conjunto de condiciones experimentales que proporcionan la respuesta mxima,
o al menos una respuesta que sea prxima al ptimo: y lo hace as con el
nmero ms pequeo posible de etapas experimentales de ensayo. En la
prctica la velocidad y la conveniencia del procedimiento de optimizacin
resulta extremadamente importante, pudiendo ser suficiente en algunos casos utilizar un mtodo que alcance de manera razonable un valor prximo
al ptimo verdadero en un nmero pequeo de pasos.
En este contexto se debe observar que incluso la optimizacin de un nico factor presenta algunos problemas interesantes. Supngase que se desea
encontrar el pH ptimo de una reaccin catalizada por enzimas dentro de un
rango de pH 2-12, siendo el mejor pH aquel cuya velocidad de reaccin sea
mxima. Cada medida de la velocidad de reaccin constituir un experimento separado, asumiendo en cada caso un tiempo y un esfuerzo significativos
y una solucin amortiguadora diferente, de manera que resulta especialmente importante conseguir tanta informacin como sea posible a partir del
mnimo nmero de experimentos. Se sugieren dos aproximaciones. Una es
realizar un nmero fijo de medidas de la velocidad de reaccin, por ejemplo,
dividiendo el intervalo de pH de inters en una serie de regiones iguales. El
segundo mtodo y ms lgico es realizar las medidas secuencialmente, de manera que el pH para cada experimento depende de los resultados de los experimentos anteriores.
La Figura 7.2 muestra el resultado de realizar cuatro medidas de la velocidad a valores del pH de 4, 6, 8 Y 10. Al considerar estos cuatro resultados
se har una suposicin que se mantendr en buena parte de la discusin de
la optimizacin, es decir, que hay slo un mximo dentro del rango de los
pH
Figura 7.2.
205
206
10
6
pH
Figura 7.3.
12
En una aproximacin las distancias entre los pares de medidas y los extremos de los rangos correspondientes se relacionan con la serie de Fibonacci.
Esta serie de nmeros, conocida desde el siglo XIII, empieza con 1 y 1 (estos
trminos se llaman Fa Y F 1), de manera que cada siguiente trmino es la suma de los dos previos. As, F 2 , F 3 , etc., son 2, 3, S, 8, 13, 21, 34, SS, 89, ...
Para utilizar esta serie con el objeto de optimizar un nico factor en un rango definido, se empieza por decidir bien el grado de optimizacin exigido (lo
que automticamente determina el nmero de experimentos necesario), o
bien el nmero de experimentos que se pueden realizar (lo que directamente
proporciona el grado de optimizacin obtenido). Supngase que, como antes,
se exige que el pH ptimo se conozca dentro de 0.2 unidades, con una reduccin de SO veces el intervalo de pH original de 10 unidades. Entonces se
debe tomar el primer nmero de Fibonacci por encima de SO: ste es SS, F g
El subndice nos indica que sern necesarios nueve experimentos para lograr
el resultado deseado. El espacio de los primeros dos puntos, A y B, dentro
del intervalo, tambin viene dado por la serie. Se utiliza Fg y el elemento de
la serie dos por debajo de l, F7 , para formar la fraccin F7 /F g , es decir, 21/55.
El punto A resulta entonces a pH (2 + [10 x 21/55]), y el punto B a pH
(12 - [10 x 21/55]), es decir, 5.8 y 8.2, respectivamente. (El nmero 10 aparece en estas expresiones porque el rango de pH de inters tiene 10 unidades
de ancho.) Una vez que se establecen estos primeros puntos, las posiciones
de C, D, etc., se siguen automticamente por simetra. Es impresionante que
el mtodo de bsqueda de Fibonacci logre en slo nueve experimentos un
grado de optimizacin que exige 99 experimentos utilizando el mtodo de los
intervalos iguales. Se puede demostrar que el mtodo es de hecho el procedimiento de bsqueda univariante ms eficiente para un rango dado cuando
el grado de optimizacin se conoce o decide de antemano.
En otros mtodos de optimizacin, no es necesario decidir de antemano
el nmero de experimentos o el grado de optimizacin necesario. El mtodo
de la Razn aurea o Cociente de Oro es un ejemplo de esta aproximacin.
El Cociente de Oro es (1 + )5)/2 = 1.618. Este nmero tiene la propiedad
de que 1.618 = 1 + (1/1.618). Los dos primeros puntos en la bsqueda se
posicionan dividiendo el rango total (por ejemplo 10 unidades de pH) por
1.618, y en nuestro ejemplo el resultado es que los puntos se colocan a 10/
1.618 = 6.18 unidades de pH de pH 2 Y pH 12, es decir, a pH 5.82 Y 8.18.
Si el ltimo punto proporciona la respuesta podemos estar seguros que
el pH ptimo cae entre 5.82 y 12, un intervalo que ya contiene un resultado a pH 8.18. Como en el mtodo de Fibonacci el tercer experimento
se realiza entonces a un pH colocado simtricamente, es decir, a un pH
(12 ~ [8.18 - 5.82]) = 9.64. (Ntese que, una vez que se establece este tercer pH, (12 - 8.18)/(12 - 9.64) = 1.618, se obtiene de nuevo el cociente de
oro.) Si este tercer experimento proporciona una respuesta ms grande que el
experimento al pH de 8.18, entonces resulta aparente que el ptimo no se encuentra en el intervalo de pH 5.82-8.18, de manera que el cuarto experimento
se puede realizar a pH 10.54 (porque [12 - 10.54] = [9.64 - 8.18]), Y as sucesivamente. De nuevo se ve que este mtodo es ms eficiente que la aproximacin de los intervalos iguales, despus de este cuarto experimento el pH
ptimo se situar en un intervalo de 2.36 unidades, es decir, bien entre pH
207
208
7.9.
.l9
Vi
Q)
::::l
Q.
Vi
Q)
a:
Figura 7.4.
Diagrama de las curvas de nivel para una superficie de respuesta con dos factores.
209
Figura 7.5.
Diagrama de las curvas de nivel para una superficie de respuesta con dos factores.
de bsqueda, utilizando el enfoque de un factor cada.vez, establecera el nivel inicial de X a un valor fijo de Xl' por ejemplo, y se variara el nivel de Y,
resultando una respuesta mxima en el punto A donde el nivel de Y fuese
111. A continuacin, manteniendo el nivel de Yen Yl' y variando el nivel de
X resultara un mximo en B. Obviamente ste no es el verdadero mximo,
ya que la posicin obtenida depende del nivel inicial elegido para X l' Se puede obtener una respuesta mejor repitiendo el proceso, variando los niveles
de X e Y alternativamente. Este mtodo se conoce como el mtodo de bsqueda de la variable alterna (BVA) o mtodo univariante iterativo. Este mtodo es extremadamente eficiente cuando no existe interaccin entre
dos factores. En tal caso la superficie de respuesta tiene la forma de la Figura
7.6(a) o (b) y variando X y luego Y slo una vez conducir a la mxima
respuesta. Sin embargo, si existe interaccin entre las dos variables entonces
la superficie de respuesta tiene la forma de la Figura 7.6(c) y X e Y deben
variarse en vez de una ms veces. En algunos casos, no conducira al mximo verdadero: esto se ilustra en la Figura 7.7 donde, aunque e no es el mximo verdadero, el valor de respuesta disminuye a ambos lados del mximo
en las dos direcciones X e Y. Llegando a este punto, con el mtodo de un
factor cada vez, se concluira equivocadamente, por tanto, que representaba
la respuesta mxima.
El mtodo BV A se ha utilizado con xito en algunas reas de la qumica
analtica. No obstante, se puede aplicar slo si la respuesta se obtiene continuamente cuando el nivel del factor se altera con facilidad, por ejemplo, en
espectrometra cuando se cambian rpidamente la longitud de onda del
monocromador o la anchura de la rendija. Si tal seguimiento no es posible
entonces se tiene que elegir un tamao de la variacin para el cambio en
cada uno de los factores. Un mtodo ms sofisticado permitira cambios en
dichos tamaos dependiendo del cambio observado en la respuesta, pero en
la prctica se usaran otros mtodos de optimizacin que incluyen pocos experimentos separados.
~.
210
>-
Ul
r-l-
O!
o..
(ji'
r-l-
(=j'
es
t5
.l!!
Qi
"O
Qi
>
O!
'<
..o
3'
o'
>-
r-l-
t5
.l!!
3ro
~
0;'
"O
O!
~
O!
(b)
es
Qi
"O
Qi
>
..o
3'
(=j'
O!
O!
>-
~
r-l-
.l!!
::l
(=j'
O!
Qi
"O
Qi
>
Figura 7.6. . Diagrama de las curvas de nivel simplificadas. (a) y (b) no muestran ninguna
interaccin x- ~ (e) muestra interaccin X- y significativa.
Figura 7.7. Diagrama de curvas de nivel: un caso en el que el mtodo de un factor cada vez
no sirve para localizar el mximo.
7.10.
Temperatura, oC (Y)
(a)
20
25
30
35
34
39
(b)
Figura 7.8. Diagrama de curvas de nivel: la flecha en cada diagrama indica el camino
de la mxima pendiente. En (a) se dirige aproximadamente al mximo, pero en (b) no.
211
212
.K
2
.'
[?f
, /
... e
tan
0=
4/5
x
y
xy
VelocIdad de reaccin
30
35
34
39
50
\\\~
50
55
213
60
20
6.6
6.8
7.0
7.2
7.4
7.6
7.8
8.0
pH
Figura 7.10. Diagrama de curvas de nivel: la direccin inicial de la mxima pendiente se muestra
mediante la lnea de trazo discontinuo. En los puntos 5, 6 Y7 se realizan nuevos experimentos.
7.11.
214
>-
t5
Qj
"O
Qj
>
Figura 7.11.
Factores
A
Vrtice
Vrtice
Vrtice
Vrtice
Vrtice
Vrtice
1
2
3
4 (rechazado)
5
6
Respuesta
1.0
6.0
2.5
2.5
2.5
2.5
3.0
4.3
11.5
4.3
4.3
4.3
2.0
9.5
9.5
3.5
9.5
9.5
6.0
6.9
6.9
6.9
9.7
6.9
5.0
6.0
6.0
6.0
6.0
9.6
14.50
2.90
2.50
0.40
3.30
27.40
5.48
4.30
1.18
6.66
40.00
8.00
3.50
4.50
12.50
36.40
7.28
6.90
0.38
7.66
32.60
6.52
6.00
0.52
7.04
7
8
10
6
11
9
215
216
de los vrtices: normalmente se coloca un vrtice en los niveles de los factores actualmente aceptados. Este ltimo punto es un recordatorio para el analista que rara vez anda a tientas al comienzo de un proceso de optimizacin.
La experiencia previa le aportar una gua de los valores factibles para los
vrtices del simplex de partida.
Se puede ver que, en contraste con un diseo factorial, el nmero de
experimentos exigidos en el mtodo simplex no crece rpidamente con el nmero de factores. Por esta razn, todos los factores que razonablemente pudieran pensarse que tienen relacin con la respuesta deberan ser incluidos
en la optimizacin.
Una vez que se ha encontrado un ptimo, el efecto sobre la respuesta
cuando un factor se vara mientras los otros se mantienen a sus niveles ptimos se puede a su vez analizar para cada factor (por turnos). Este procedimiento se puede utilizar para verificar la optimizacin. Tambin indica a qu
nivel son importantes para cada factor las desviaciones respecto del nivel ptimo: cuanto ms acusado es el pico de respuesta en la regin del ptimo,
ms crtica es la variacin en el nivel del factor.
La optimizacin simplex se ha utilizado con xito en muchas reas de la
qumica analtica, por ejemplo, espectrometra de absorcin atmica, cromatografa de gases, mtodos de anlisis colorimtrico, espectrometra de plasma y
tambin con analizadores centrfugos en qumica clnica. Cuando un instrumento se conecta a una microcomputadora, se pueden utilizar los resultados de
la optimizacin simplex para procurar mejoras en las variables instrumentales.
Ocasionalmente aparecen superficies de respuesta con ms de un mximo, como la expuesta en la Figura 7.12. Los mtodos de optimizacin de la
variable alterna y simplex pueden entonces localizar un ptimo local tal como el A en lugar del ptimo verdadero B. Una forma de comprobar este punto es empezar el proceso de optimizacin en una segunda regin del espacio
del factor y verificar que se obtienen las mismas condiciones ptimas. Otra
vez el mtodo simplex es valioso aqu, ya que se minimiza el trabajo extra
requerido.
>(;
13
.l!1
Ql
""C
Qi
>
Nivel de factor X
7.12.
El revenido simulado
Bibliografa
Gardner, W. P. 1997. Statistical Anal;ysis Methods for Chemists; A Software
Based Approach. Royal Society of Chemistry, Cambridge. (Tratamiento
extenso de los diseos experimentales en muchas ramas de la qumica.).
Massart, D. L., Vandeginste, B. G. M., Buydens, 1. M. C., De long, S., Lewi,
P. J. and Smeyers-Verbeke, M. 1997. Handbook of Chemometrics and
Qualimetrics, Part A. Elsevier, Amsterdam. (Buena cobertura general de
la optimizacin y el diseo experimental.)
217
218
Ejercicios
1.
Mtodo
8
1
2
3
4
16.03
16.05
16.02
16.12
16.13
16.13
15.94
15.97
16.09
16.15
16.12
16.10
Comprobar si existen diferencias significativas entre (a) la concentracin de cloruro en las diferentes solucione~ y (b) los resultados obtenidos por los diferentes mtodos.
2.
Da
2
1
2
3
4
5
67
78
78
70
69
69
66
73
69
71
3
82
76
75
87
80
Determinar si existen diferencias significativas en el porcentaje de recuperacin (a) entre suelos, y/o entre das.
(Datos adaptados de Egizabal, A., Zuloaga. O., Etxebarria, N., Fernndez, 1. A. Madariaga,]. M. 1988. Analyst 123:1679)
3.
En estudios con un mtodo fluorimtrico para la determinacin del surfactante aninico dodecil sulfato sdico (SDS) se estudiaron los efectos
de interferencia de cuatro compuestos orgnicos para tres relaciones molares diferentes SDS: compuesto. Los porcentajes de recuperacin de
SDS encontrados fueron:
Compuesto Orgnico
1:1
91
103
95
119
Relaciones molares
1:2
1:3
84
104
90
162
83
104
94
222
Bajo
Alto
Ausente
Una vez
1 hora
Presente
Dos veces
18 horas
T- Tiempo de permanencia
Absorbancia
1
a
0.099
0.084
0.097
0.076
0.082
0.049
0.080
0.051
c
t
ac
ta
tc
atc
5.
En un experimento de colaboracin entre laboratorios para la determinacin de arsnico en carbn, se enviaron muestras de carbn de tres
regiones diferentes a tres laboratorios. Cada laboratorio realiz un anlisis por duplicado de cada muestra obtenindose los resultados que se
muestran a continuacin (medidos en ~gg-l).
Muestra
A
B
Laboratorio
2
5.1, 5.1
5.8, 5.4
6.5, 6.1
5.3, 5.4
5.4, 5.9
6.6,6.7
5.3, 5.1
5.2,5.5
6.5, 6.4
219
220
7.
Si se encuentra que la respuesta en el vrtice 7 en el ejemplo de la optimizacin simplex (pgs. 213-216) es 12, qu vrtice debera rechazarse
al formular el nuevo simplex y cules son las coordenadas del nuevo vrtice?
Anlisis
multivariante
8.1.
Introduccin
Los mtodos modernos de anlisis automtico facilitan la recogida de grandes cantidades de datos. Por ejemplo, en qumica clnica es una tarea cotidiana la determinacin de muchos analitos en cada muestra de sangre, orina,
etc. Una serie de mtodos espectroscpicos y cromatogrficos' pueden proporcionar datos analticos sobre muchos componentes de una nica muestra.
Situaciones como stas, en que se miden varias variables para cada muestra,
proporcionan datos multivariantes. En qumica analtica estos datos se emplean, entre otras cosas, para la discriminacin, por ejemplo, para determinar si un vertido de aceite procede de una fuente concreta mediante el anlisis del espectro de fluorescencia. Otro uso es la clasificacin, por ejemplo,
dividiendo en grupos las fases estacionarias con propiedades similares empleadas en cromatografa gas-lquido estudiando el comportamiento respecto
a la retencin de una variedad de solutos con propiedades qumicas diferentes. En cada caso, sera posible comparar muestras considerando cada
variable cada vez, pero las computadoras modernas permiten mtodos de
procesado ms sofisticados en los que todas las variables se consideran simultneamente.
Cada muestra, o para generalizar, cada objeto se caracteriza por un conjunto de medidas. Cuando slo se miden dos variables esta informacin se
puede representar grficamente, como se muestra en la Figura 8.1, donde las
coordenadas del punto dan los valores que toman las dos variables. El punto
tambin se puede definir mediante un vector, llamado vector de datos,
uniendo el origen con el punto. Los objetos que tengan propiedades similares
tendrn vectores de datos similares, es decir, caern unos cerca de otros en
el espacio definido por las variables. Cada uno de esos grupos se llama un
conglomerado (<<cluster).
222
Y -----------------
(Xi' y)
>al
:oca
.~
>
Xi
Variable X
Figura 8.1. Diagrama para ilustrar un vector de datos, f. Los valores que toman las variables
X e Y son Xi e Y. respectivamente.
-
8.2.
Anlisis inicial
La Tabla 8.1 muestra un ejemplo de algunos datos multivariantes. Proporciona las intensidades relativas de emisin de fluorescencia a.cuatro longitudes de onda diferentes (300, 350,400,450 nm) para 12 compuestos, A-L. La
intensidad de emisin a la longitud de onda de mxima fluorescencia sera
100, en cada uno de los casos. Como un primer paso, puede resultar til calcular la media y la desviacin tpica para cada variable. Estas medidas tambin aparecen en la tabla.
Adems, puesto que tenemos ms de una variable, es posible calcular un
coeficiente de correlacin momento-producto (Pearson) para cada par de variables. Estos coeficientes aparecen resumidos en la matriz de correlacin
de la Tabla 8.2, obtenida con Minitab.
Esto muestra que, por ejemplo, el coeficiente de correlacin para las intensidades a 300 y 350 nm es 0.914. Las relaciones entre pares de variables
se puede ilustrar mediante un grfico draftsman como se muestra en la
Figura 8.2. Se trata de una representacin que proporciona diagramas de dispersin para cada par de variables. Tanto la matriz de correlacin como los
diagramas de dispersin indican que existe correlacin entre algunos pares
de variables.
et
Compuesto
300
350
400
450
Vi'
Vi'
16
15
14
15
14
14
17
16
15
17
18
18
15.75
1.485
62
60
59
61
60
59
63
62
60
63
62
64
61.25
1.658
67
69
68
71
70
69
68
69
72
69
68
67
68.92
1.505
27
31
31
31
30
30
29
28
30
27
28
29
29.25
1.485
e
D
E
F
G
H
I
J
K
L
Media
Desviacin estndar
Tabla 8.2.
Correlaciones (Pearson)
300
0.914
~ 0.498
-0.670
350
400
450
350
350
450
-0.464
- 0.692
0.458
63C
J
60
68 -.
71 f-
400
30
LJCJ
450
28
15
300
Figura 8.2.
223
17
60
63
350
68
400
71
3
~
:;::.
OJ
5)'
~
......
ro
224
8.3.
Un problema que aparece en el anlisis multivariante es que el volumen bruto de los datos puede dificultar el reconocimiento de pautas (<<pattern recognition) y relaciones. Por ejemplo, un espectro se caracteriza habitualmente
por varios cientos de medidas de intensidad en lugar de slo por cuatro como
en la Tabla 8.1, conteniendo en este caso la matriz de correlacin cientos de
valores. Por tanto, el objetivo de muchos mtodos del anlisis multivariante
es la reduccin de los datos. Con mucha frecuencia se presenta cierta correlacin entre las variables, como ocurre con los datos de la Tabla 8.1, de manera que algo de la informacin resulta redundante. El anlisis de componentes principales (ACP) es una tcnica para reducir la cantidad de datos
cuando est presente la correlacin. Resulta obvio afirmar que no es una tcnica til cuando las variables no estn correlacionadas.
La idea que se encuentra detrs del ACP es encontrar componentes
principales Zl, Zz, ..., Zn que sean combinaciones lineales de las variables
originales Xl' X z , ..., X", que describen cada muestra, es decir,
Zl
all Xl
+ alZX Z + a 13X 3 +
+ alnXn
Zz
+ aZnXn
etc.
Por ejemplo, para los datos de la Tabla 8.1 habra cuatro componentes principales Zl, Zz, Z3 y Z4, cada une: de las cuales sera una combinacin lineal
de Xl' X z , X 3 y X 4 , las intensidades de fluorescencia a las longitudes de onda
proporcionadas. Los coeficientes all, alZ, etc., se eligen de manera que las
nuevas variables, a diferencia de las variables originales, no se encuentren
correlacionadas unas con otras. La generacin de un nuevo conjunto de variables de esta forma puede parecer un ejercicio con poco sentido puesto que
se obtienen n nuevas variables en lugar de las n originales, y en consecuencia
no hay ninguna reduccin en el conjunto de datos. Sin embargo, las componentes principales tambin se eligen de manera que la primera componente
principal (CPl), Zl' recoge la mayor parte de la variacin que hay en el conjunto de datos, la segunda (CP2), Zz, recoge la siguiente mayor parte de la
variacin y as sucesivamente. Por consiguiente, cuando haya correlacin
significativa el nmero de CPs tiles ser mucho menor que el nmero de
variables originales.
La Figura 8.3 aclara el mtodo cuando slo hay dos variables y, por tanto,
slo dos componentes principales. En la Figura 8.3a las componentes principales se muestran mediante lneas de trazos suspensivos. Las componentes
principales forman ngulos rectos unas con otras, propiedad conocida como
ortogonalidad. La Figura 8.3b muestra los puntos referidos a estos dos nuevos ejes y tambin la proyeccin de los puntos sobre CPl y CP2. Se puede
ver que en este ejemplo Zl recoge la mayor parte de la variacin y as sera
posible reducir la cantidad de datos a manejar trabajando con Zl en una dimensin en lugar de trabajar en dos dimensiones con Xl y X z. (En la prctica, no sera necesario utilizar ACP cuando haya slo dos variables, ya que
tales datos son relativamente fciles de manejar.)
225
CP1
(a)
X1
(b)
CP2
Figura 8.3. (a) Diagrama que ilustra las dos componentes principales, CP1 y CP2, para las dos
variables, X; y X;,. (b) Puntos referidos a los ejes de las componentes principales. e indica puntos
de datos, o su proyeccin sobre los ejes.
226
EJEMPLO 8.3.1
Realcese un anlisis de componentes principales de los datos de la Tabla 8.1.
Esto se puede hacer utilizando una variedad de paquetes informticos (por ejemplo, Minitab,
SAS, The Unscrambler, ...). La salida impresa que aparece a continuacin se obtuvo con
Minitab.
Principal Component Analysis
2.8807
0.720
0.720
PC1
0.547
0.546
- 0.400
- 0.493
0.6453
0.161
0.881
PC2
-0.238
-0.299
- 0.913
0.145
0.3897
0.097
0.979
PC3
-0.395
-0.324
0.073
-0.856
0.0844
0.021
1.000
PC4
0.699
- 0.712
0.043
- 0.049
En este ejemplo hay cuatro variables y as la suma de las varianzas para los datos (ahora
estandarizados) es 4. La primera lnea etiquetada '<eigenvalue (<<autovalor) muestra cmo
esta varianza se comparte entre las cuatro componentesprincipals, teniendo PC1 una varianza de 2,8807, PC2 de 0,6453, y as sucesivamente. Ntese que, como se esperara,
PC1 tiene la varianza ms grande, PC2 la siguiente ms alta, y as sucesivamente. Las
componentes principales con un autovalor mayor que 1 contribuyen ms a la varianza que
las variables originales. La suma de las varianzas de las cuatro componentes principales es
4 (descartando los errores de redondeo). De nuevo esto eslo que se esperara puesto que
entre todas las componentes principales deben explicar toda la variacin en el conjunto de
datos. La segunda linea de la tabla (etiquetada "proportion) da la proporcin de la varianza
explicada por cada componente principal. La lnea siguiente muestra la proporcin acumulada. Informa, por ejemplo, de que entre PC1 y PC2 recogen el 88,1% de la variacin.
La mitad inferior de la tabla proporciona los coeficientes de las componentes principales.
(Los coeficientes se encuentran en una escala de modo que la longitud de un vector de
datos no se vea alterada por el cambio en las variables. El signo del primer coeficiente de
la primera componente principal se elige, arbitrariamente, para que sea positivo.) Por ejemplo, la primera componente principal es Z; = 0.547 ~ + 0.546X2 - OAOOX3 - 0.493X
donde ~, ~, X:! y X son las intensidades relativas estandarizadas a 300, 350, 400 Y450
nm, respectivamente. Cada variable original se estandariza restando la media a esa variable
y luego dividiendo por la correspondiente desviacin estndar (obtenida de la Tabla 8.1).
As, para el compuesto A,
Z;
0.547 x
(16 - 15.75)
1.485
+ 0.546 x
(62 - 61.25)
1.658
(67 - 68.92)
- 0.400 x .
1.505
(27 - 29.25)
- 0.493 x - - - 1.485
= 1.60
A veces este valor se conoce como una "puntuacin para PC1. La Figura 8.4 representa
las puntuaciones de las dos primeras componentes principales, calculadas de. esta manera,
para los compuestos A-L. Este diagrama revela que los compuestos caen' en dos grupos
distintos, un hecho que no resulta nada claro en los datos originales.
.
1.5
c...
c:
a.
eA
.:
0.5
al
.gc:
i
.i,
1.0
ic:
227
-'G---.---------
eH
-0.5
O>
al
(fJ
-1.0
eJ
eD
-1 .5 .........
-2.0 -1.5 -1.0 -0.5
'-------'_------'_---L_----L._-J..-~___'_
0.5
1.0
__'__
___'_______'
1.5
2.0
2.5
Figura 8.4. Las puntuaciones de las dos primeras componentes principales para los datos
de la Tabla 8.1.
La Tabla 8.3 muestra los datos originales reordenados de manera que compuestos con espectros similares se. agrupan juntos. Las diferencias entre los
dos grupos son ahora aparentes. Hay una diferencia a las cuatro longitudes
de onda, y las magnitudes de estas diferencias son similares. Esto ;orresponde al hecho de que los coeficientes para la primera componente principal son
similares en tamao. El grupo superior en la Tabla 8.3 tiene intensidades
ms altas que el grupo inferior a 300 y 350 nm y lo opuesto es verdadero a
400 y 450 nm. Esto corresponde al hecho de que los primeros dos coeficientes de Z tienen el signo opuesto a los dos segundos. Una vez que se han
identificado dos o ms grupos utilizando ACP, resulta posible explicar las
diferencias entre ellos en trminos de estructura qumica. A veces puede ser
posible proporcionar una interpretacin fsica a las componentes principales.
Tabla 8.3. Los datos de la Tabla 8.1 ordenados de nuevo, de manera
que los compuestos con espectros similares se agrupan juntos.
Longitud de onda (nm)
Compuesto
300
350
400
450
A
G
H
16
17
16
62
63
62
63
62
64
67
68
69
69
68
67
60
59
61
60
59
60
69
68
71
70
69
72
27
29
28
27
28
29
31
31
31
30
30
30
17
K
L
18
18
15
14
15
14
14
15
D
E
F
I
228
Por esta razn, a veces las componentes prlcipales son denominadas como
variables latentes (es decir, ocultas).
En este ejemplo los valores de los coeficientes muestran que cada una de
las variables contribuye a CPl y al menos tres de ellas contribuyen a CP2.
En otros casos, se encuentra que algunas variables no contribuyen significativamente incluso l CPI. Un beneficio importante del ACP es que entonces
dichas variables se pueden rechazar.
El ACP es en primer lugar un mtodo matemtico para la reduccin de
datos y no supone que los datos tengan ninguna distribucin concreta. Se ha
visto como el ACP se puede utilizar para reducir la dimensionalidad de un
conjunto de datos y cmo puede, por tanto, revelar conglomerados. Se ha
utilizado, por ejemplo, sobre los resultados de espectroscopia de transformadas de Fourier a fin de revelar diferencias entre cabello de diferentes grupos
raciales y para clasificar diferentes tipos de fibra de algodn. En otro ejemplo
se midieron las concentraciones de una serie de clorobifenilos en muestras
de una variedad de mamiferos marinos. Un ACP de los resultados revel diferencias entre las especies, diferencias entre hombres y mujeres, y diferencias
entre individuos jvenes y adultos. Tambin encuentra el ACP aplicacin en
la regresin mltiple (vase la Seccin 8.8).
8.4.
Anlisis de conglomerados
CP1
x,
Figura 8.5. Una situacin en la que la primera componente principal no proporciona una
buena separacin entre dos grupos.
bIes. La distancia, d, entre dos puntos en un espacio n-dimensional con coordenadas (XI' Xz, ... , X r,) y (gl' Y2, ... , y,,) se calcula habitualmente a travs de
la distancia Eucldea definida por:
J2
6
5
...."2.
. e :
..<3.
e :
.....1'...: .....
1 \. e .:
....."
oL---'-----'-_-'--------'--------'_-'----'
023
7
(b)
(e)
Y 3
2
1
OL--.---'------L-----.J_-'------L---l---J
O
2 3 456 7
,-.e '.
7
(d)
7
(e)
.. ..
" 4 "'\
456
\.
5',
'
,,<*.........'"
3 ," 2. "
/
3
2 '
:
..'. ..:
,
4
3
/'
...
.........,,'
0'-------'-----'---'--------'--------'--'----'
4
X
O'--------'-----'-_-L----'----I_--'----'
O
2 3 4 5 6 7
X
229
230
30.16
53.44
E
(jj
76.72
Hay una serie de mtodos para la bsqueda de clusters. U n mtodo empieza considerando que cada objeto forma un conglomerado de tamao
uno y compara las distancias entre stos. Los dos puntos que se encuentren
ms prximos se unen para formar uno nuevo. Las distancias entre los conglomerados se comparan de nuevo y se combinan los dos conglomerados
que se encuentren ms prximos. Este procedimiento se repite y, si se continuara indefinidamente, agrupara todos los puntos juntos. Existe una amplia gama de formas de calcular la distancia entre dos conglomerados que
contengan ms de un miembro. El ms simple conceptualmente consiste en
tomar la distancia entre dos conglomerados como la distancia entre los elementos o puntos ms prximos de los mismos. Esto se conoce como el mtodo de vinculacin simple o del vecino ms prximo, ilustrndose
en la Figura 8.6. Las sucesivas etapas de la agrupacin se pueden mostrar
sobre un dendrograma como el de la Figura 8.7. El eje vertical puede mostrar o la distancia, d)' entre dos puntos i y j cuando se unen o alternativamente la similitud, Sj,
definida por Sij. = 100(1 - di/dm,iJ
donde dI,,,;'. es la
.
.
mxima separacin entre cualquier par de puntos. La etapa en la que se detiene la formacin de los grupos, que determina el nmero de conglomerados
en la clasificacin final, es una cuestin que queda al juicio de la persona que
realiza el anlisis.
EJEMPLO 8.4.1
Aplquese el mtodo de vinculacin simple a los datos (no estandarizados) de la Tabla 8.1.
Utilizando Minitab se obtuvo la salida siguiente. Con dicho programa de computadora las
vinculaciones continan hasta que slo haya un conglomerado, a menos que el usuario
especifique otra cosa.
El dendrograma de la Figura 8.8 ilustra las fases de la vinculacin. La escala vertical proporciona la distancia entre los dos grupos en el momento en que se combinaron. La tabla
anterior muestra que los dos primeros puntos que se unieron fueron 5 (compuesto E) y 6
231
>-
Amalgamation Steps
2!..:
Step Number of
clusters
1
11
10
9
8
7
6
5
4
3
2
1
3
4
5
6
7
8
9
10
11
Sirnilarity
level
Distance
level
Clusters
joined
80.20
80.20
75.75
75.75
75.75
75.75
75.75
71.99
71.99
68.69
49.51
1. 414
1.414
1.732
1.732
1.732
1.732
1. 732
2.000
2.000
2.236
3.606
5
3
7
7
8
2
7
6
5
12
11
10
9
3
8
New
cluster
5
Nwnber of
Obs in new
cluster
2
3
2
3
2
2
7
7
8
4
2
7
2
1
1
5
6
6
12
,/2
3.61 1m
.~
240 r-
(5
..L
r-'-
1.20 r-
0.00 '-L_'-------'-----'---l_L---'---'-----''------'-----L--l_
D
B e E F A G L K H J
Observaciones
Figura 8.8.
El mtodo de anlisis de conglomerados que se acaba de describir es jerrquico, lo que significa que una vez que se ha asignado un objeto a un grupo
el proceso no se puede invertir. En los mtodos no jerrquicos se tiene justamente lo contrario. Uno de dichos mtodos es el mtodo de k-medias que
se encuentra disponible, por ejemplo, en Minitab. Empieza por dividir los
(Ji'
(Ji'
:3
e;:+
;:::.
OJ
~
0)'
~
-+
ro
232
puntos en k conglomerados o alternativamente por elegir k puntos de semilla. Entonces cada individuo se asigna al conglomerado (o punto de semilla)
cuyo centroide se encuentre ms prximo. Cuando un conglomerado pierde
o gana un punto se vuelve a calcular la posicin del centroide. El proceso
contina hasta que cada punto se encuentre en el conglomerado cuyo centro
sea el ms prximo.
Este mtodo tiene la desventaja de que el agrupamiento final refleja la
eleccin de los conglomerados o puntos de semilla. Otra desventaja es que el
valor de k se tiene que elegir de antemano. Se han sugerido muchos mtodos
para decidir el mejor valor de k, pero ninguno de ellos resulta realmente satisfactorio.
El anlisis de conglomerados se ha utilizado para clasificar la multitud de
fases empleadas en cromatografa gas-lquido. Se puede entonces seleccionar
un conjunto ms pequeo tomando una fase de cada conglomerado: esto proporciona un rango de fases estacionarias, cada una con caractersticas de separacin distintivas. Otra aplicacin es la clasificacin de antibiticos en trminos de su actividad frente a diferentes tipos de bacterias a fin de aclarar
la relacin entre actividad biolgica y estructura molecular. Otra aplicacin
reciente del anlisis de conglomerados es la clasificacin de vinagres de vino
sobre la base de una variedad de constituyentes orgnicos e inorgnicos.
8.5.
El anlisis discriminante
Los mtodos descritos hasta el momento en este captulo nos han ayudado a
ver si los objetos forman grupos cuando no se espera ningn conocimiento
a priori de los grupos. Dichos mtodos se llaman a veces reconocimiento de
pautas no supervisado. Ahora nos detendremos en el reconocimiento de
pautas supervisado. Aqu se empieza con una serie de objetos cuya pertenencia al grupo es conocida, por ejemplo, jugos de manzana extrados de diferentes variedades de fruta. Estos objetos se llaman a veces objetos de entrenamiento o aprendizaje. El objetivo de los mtodos de reconocimiento
de pautas supervisado es utilizar estos objetos para encontrar una regla para
asignar un nuevo objeto de grupo desconocido al grupo correcto.
El punto de partida del anlisis discriminante lineal (ADL) es encontrar una funcin discriminante lineal (FDL), Y, que sea una combinacin
lineal de las variables originales Xl' X 2 , etc.:
233
(a)
(b)
25
~~CD
o os:'
20
15
X2
00'dJ
10
o:...
15
..
,.~
X2
<o
10
.~
oL----'--_L....::---'------J'------J
O
10
15
20
~.
25
20
Xl
25
O '------'-----'_--'-----'_--J
O 5 10 15 20 25
Xl
rnrrLo
___---'. ...a..
Figura 8.9. (a) Dos grupos y la distribucin de cada variable para cada grupo.
(b) La distribucin de la funcin discriminante lineal para cada grupo.
La situacin ms simple es aquella en la que hay dos clases y dos variables, Xl y X 2 , como se ilustra en la Figura 8.9a. Este diagrama tambin muestra la distribucin de las variables individuales para cada grupo en forma de
diagramas de puntos. Para ambas variables, hay un considerable solapamiento en las distribuciones para los dos grupos. Se puede demostrar que la FDL
para estos datos resulta ser Y = 0.91X j + 0.42X2 . Esta FDL se muestra en la
Figura 8.9b por la lnea etiquetada Y y el valor que la funcin toma para
un punto dado viene dado por la proyeccin del punto sobre esta lnea. La
Figura 8.9b muestra los grficos de punto de la FDL, Y, para cada grupo. Se
puede ver que no hay ningn solapamiento entre la distribucin de Y para
los dos grupos. Esto significa que Y es mejor al discriminar entre los grupos
que las variables originales.
Un objeto desconocido ser clasificado de acuerdo a su valor de Y.
Una aproximacin inicial basada en el sentido comn sera comparar Y
con Yj e Y2 , los valores para la media de Yen los dos grupos. Si Y est ms
prximo a Yj que a Y2 , entonces el objeto pertenece al grupo 1, en otro
caso pertenece al grupo 2. Para estos datos, Yj = 3.15 e Y2 = 10.85. As, si
Y - 3.15 < 10.85 - Y, esto es Y < 7.0, se clasificar al objeto en el grupo 1,
en otro caso se clasificar en el grupo 2. Este mtodo resulta slo satisfactorio si los dos grupos tienen distribuciones cuya forma sea similar. Tambin,
si la experiencia demuestra que un objeto es ms verosmil que pertenezca a
uno de los grupos que al otro, entonces la regla de decisin tendr que ser
modificada. Algunos programas de computadora como Minitab permiten dicha modificacin.
El xito del ADL al distribuir o asignar un objeto correctamente se puede
verificar de varias formas. La ms simple es utilizar la regla de clasificacin
para clasificar cada objeto en el grupo y registrar si la clasificacin resultante
es correcta. La tabla resumiendo los resultados de este procedimiento a veces
se llama matriz de confusin (siempre mostrada en Minitab). Este mtodo
234
suele tender a ser muy optimista ya que el objeto que se clasifica era parte
del conjunto que se utiliz para construir la regla. Un mtodo mejor divide
los datos originales en dos grupos elegidos al azar. El primer grupo, conocido
como el conjunto de aprendizaje, se utiliza para encontrar la FDL. Entonces los objetos en el segundo grupo (el conjunto de contraste) son asignados utilizando esta funcin y se obtiene una tasa de xito. Un tercer mtodo,
que utiliza los datos de manera ms econmica, es una validacin cruzada,
a veces llamada el mtodo de dejar uno fuera". Como sugiere el ltimo nombre, ste encuentra la FDL con un objeto omitido y verifica si la FDL entonces asigna correctamente al objeto omitido. Entonces el procedimiento se
repite una vez para cada objeto y se encuentra nuevamente una tasa de xito.
Este mtodo es una opcin de Minitab.
Si la distribucin no tiene formas similares, entonces se puede utilizar
una modificacin del ADL, conocida como anlisis discriminante cuadrtico (ADQ). Este mtodo supone que los dos grupos tienen distribuciones
normales multivariantes pero con varianzas diferentes.
Tanto el ADL como el ADQ se pueden extender a la situacin donde hay
ms de dos grupos de objetos. Para evitar reglas de decisin complejas del
tipo dado antes (si /J - 3.15 < 10.85 - y, etc.) muchos programas suponen
una distribucin normal multivariante y encuentran una nueva funcin para
cada grupo, que incluye un trmino constante. A partir de estas funciones se
calcula una puntuacin para cada nuevo objeto y el objeto se asigna al grupo
cuya puntuacin sea la ms alta. Esto se ilustra en el siguiente ejemplo.
EJEMPLO 8.5.1
La tabla siguiente proporciona la concentracin en g1- 1 de suerosa, glucosa, fructosa y
sorbitol en zumo de manzana a partir de tres fuentes diferentes: A, B Y C. Llevar a cabo
un ADL y evaluar el mtodo utilizando validacin cruzada.
Variedad
Suerosa
Glucosa
20
27
A
A
A
34
29
6
11
10
5
16
47
47
40
26
22
47
26
Fructosa
Sorbllol
40
4.3
2.9
2.5
2.9
7.2
3.8
3.5
6.3
3.2
3.5
5.3
3.3
4.9
5.6
49
B
B
10
14
21
51
B
B
C
10
8
20
20
15
14
49
49
55
59
68
15
19
17
21
19
49
74
57
5.4
Clasifquese un zumo de manzana con 11, 23, 50 Y3.9 g1'-1 de suerosa, glucosa, fructosa
y sorbitol, respectivamente.
235
Sumrnary of Classification
Put into
Group
A
B
5
O
O
5
5
Total N
N Correct
Proportion
N = 15
1.000
N Correct
O
5
O
5
5
1. 000
O
O
5
5
5
1. 000
= 15
Proportion Correct
= 1.000
Group
A
B
5
O
Total N
N Correct
Proportion
N
= 15
5
5
1.000
B
O
5
O
5
5
1.000
N Correct = 15
O
O
5
5
5
1. 000
Proportion Correct
= 1.000
Constant
Sucrose
Glucose
Fructose
Sorbitol
-44.19
0.39
0.42
1. 46
2.19
-74.24
-1.66
1. 21
2.53
3.59
-114.01
-2.50
.0.54
3.48
5.48
La parte correspondiente a summary of classification (resumen de la clasificacin) proporciona la matriz de confusin y muestra una tasa de xito del 100%. La correspondiente a
"summary of classification with cross-validation (resumen de la clasificacin con validacin
cruzada) tambin muestra una tasa de xito del 100%.
Para el nuevo zumo de manzana las puntuaciones discriminantes lineales para cada
grupo tienen valores:
Grupo A: -44.19+ 0.39 x 11
Grupo B: -74.24 - 1.66 x 11
Grupo C: -114.01 - 2.5 x 11
La puntuacin para el grupo B es la ms alta, de manera que -el zumo de manzana desconocido se presupone que procede de la fuente B.
236
A diferencia de los otros procedimientos descritos en este captulo, la estandarizacin de las variables no tiene ningn efecto sobre el resultado del anlisis discriminante lineal: meramente vuelve a escalar los ejes. No obstante,
puede ser til trabajar con las variables estandarizadas a fin de decidir las
variables que son importantes al proporcionar la discriminacin entre los
grupos. Como una gua general sern aquellas variables que tengan los coeficientes ms grandes en las funciones discriminantes lineales. Una vez que
estas variables se hayan identificado, se pueden investigar las prestaciones
del mtodo con menos variables para ver si an se puede lograr una discriminacin satisfactoria entre los grupos (ver el Ejercicio 1 al final de este captulo).
Algunas aplicaciones recientes del ADL incluyen la clasificacin de aceites vegetales utilizando los datos obtenidos de una lista de sensores de gases
y el uso de espectros de resonancia magntica protnica para discriminar entre el tejido ovrico cancergeno y normal.
Aunque parece que el mtodo anterior analiza todos los grupos simultneamente, el mtodo es en realidad equivalente a analizar los grupos por
parejas. Un mtodo alternativo para ms de dos grupos es el anlisis de variables cannicas (AVC), analizndolos simultneamente de manera genuina. ste resulta ser una extensin del ADL que encuentra una serie de variables cannicas Y, Y z, etc. (que son de nuevo combinaciones lineales de
las variables originales). Como con el ADL, Y se elige de tal forma que refleje la diferencia entre los grupos tanto como sea posible. Entonces Yz se
elige de manera que refleje tanto como sea posible la diferencia restante entre los subgrupos, sujeto a la restriccin de que no hay ninguna correlacin
entre Y e Yz,y as sucesivamente. Se podra pensar en el AVC como en un
ACP para grupos pero en el que, a diferencia del ACP, los resultados no dependen de la escala, de manera que no es necesario ningn tratamiento previo de los datos.
La siguiente seccin describe un mtodo alternativo que se puede utilizar
cuando hay dos o ms grupos.
8.6.
237
o
Grupo 1
8.7.
o o
o
Figura 8.10.
o
o
Grupo 2
o o
8.8.
Regresin mltiple
238
8.9.
Un problema con la regresin mltiple es que las correlaciones entre las variables predictoras pueden conducir a complicaciones matemticas, que resulten en predicciones no fiables de y. Una forma de sortear esto es realizar
un ACP sobre las variables x y luego realizar una regresin de y sobre las
componentes principales. Esto se conoce como regresin sobre componentes principales (RCP). Puesto que las componentes principales no se encuentran correlacionadas (ver Seccin 8.3), el problema de la correlacin entre las variables predictoras resulta superado.
RCP resulta tambin una tcnica valiosa cuando el nmero de variables
predictoras originales supera al nmero de muestras de calibracin disponibles. El nmero de variables predictoras se puede reducir utilizando las primeras componentes principales en lugar de las variables originales. Este mtodo proporcionar resultados satisfactorios con tal que las componentes
principales utilizadas recojan entre ellas la mayor parte de la variacin en las
variables predictoras. Esta tcnica se utiliza a menudo en la calibracin multivariante (ver Seccin 8.12).
8.10.
Regresin multivariante
un posible mtodo de anlisis sera encontrar una ecuacin de regresin relacionando cada una de las variables respuesta, lJi' con la variable predictora.
Si existiera ms de una variable predictora se realizara una regresin mltiple de cada lJi sobre las variables predictoras. Alternativamente, se podra
realizar primero un ACP sobre las variables predictoras para producir nuevas variables no correlacionadas y luego realizar una regresin mltiple de
cada lJi sobre estas componentes principales. Otra posibilidad sera obtener
las componentes principales de las variables respuesta y establecer una regresin de stas sobre las componentes principales de las variables predictoras.
La siguiente seccin describe un mtodo que utiliza las correlaciones entre las variables respuesta y predictoras en lugar de aplicar las aproximaciones del ACP a los dos grupos de variables separadamente.
8.11.
8.12.
Calibracin multivariante
Como se ha notado antes, un ejemplo de la aplicacin de la regresin multivariante se encuentra en la determinacin de la concentracin de los
constituyentes de una mezcla de analitos mediante anlisis espectral. En la
aproximacin clsica la intensidad, lJi' a cada una de una serie de longitudes
de onda estara relacionada con las concentraciones de los constituyentes
mediante una ecuacin de la forma lJi = b Oi + bliXi + b2iX2 + ... donde los
coeficientes para cada constituyente dependen de la longitud de onda. Entonces, a partir del espectro medido de un espcimen con composicin desconocida (es decir, un ejemplar de ensayo), se podran estimar las concentraciones de los analitos en este ejemplar. Este mtodo es el anlogo
multivariante del mtodo univariante descrito en la Seccin 5.4. El mtodo
requiere conocimiento del espectro de los constituyentes puros y ejemplares
de calibracin de composicin conocida. Supone que no hay otros componentes en los ejemplares que interfieran a los componentes de inters, en el
239
240
EJEMPLO 8.12.1
La tabla siguiente proporciona la absorbancia UV (x 100) registrada a tres longitudes de
onda diferentes, A" Az YAs, de 10 especfmenes (A-J) y las concentraciones medidas (mM),
c" cz, C3 Y C4, de cuatro constituyentes de inters.
Espcimen
C,
c4
A,
Az
A3
0.888
0.461
0.453
0.560
0.414
0.438
0.342
0.743
0.751
0.477
0.016
0.091
0.159
0.093
0.019
0.169
0.228
0.109
0.011
0.146
0.014
0.243
0.233
0.085
0.279
0.137
0.196
0.006
0.148
0.063
0.082
0.205
0.156
0.263
0.289
0.256
0.233
0.142
0.090
0.314
91.5
93.8
93.4
92.5
94.8
93.2
93.7
91.5 .
92.7
92.7
56.1
56.3
56,4
56.7
56.5
56.8
57.0
56.8
55.7
57.7
73.6
74.1
74.5
73.7
73.6
73.9
74.4
73.9
73.9
73.8
D
E
F
G
H
I
J
Cl>
La salida que se muestra a continuacin se obtuvo utilizando Minitab y proporciona la ecuacin de regresin para cl .
RegressionAnalysis
The regression equation is
el = 31.7 - 0.129 A1- 0.153A2 - 0.142 A3
Predictor
Constant
Al
A2
A3
S = 0.04664
Coef
31.688
-0.12893
-0.15260
-0.14214
R-Sq
95.5%
StDev
3.999
0.01576
0.02863
0.05228
T
7.92
-8.18
-5.33
-2.72
.R-Sq(adj) = 93.2%
P
0.000
0.000
0.002
0.035
241
Analysis of Variance
Source
Regression
Error
Total
DF
3
3
9
SS
0.275833
0.013051
0.288884
MS
0.091944
0.002175
42.27
0.000
A3
0.04
0.02
(()
0.00
::::J
TI
Q)
a:
A2 - 0.0834 A3
....................
_t!.
__
-0.02
-0.04
-0.06
-0.08 '-------'---'-------'---'-------'----'
0.3
004
0.5
0.6
0.7
0.8
0.9
Valor ajustado
Figura 8.11.
Un grfico de los residuos frente a los valores ajustados para el Ejemplo 8.12.1 .
08
({)
ro
ro
TI
0.7
0.6
eo..
0.5
.~
004
03
0.3
004
0.5
0.6
0.7
0.8
0.9
e, medidas
Figura 8.12. Un grfico de los valores pronosticados frente a los valores medidos para
el Ejemplo 8.12.1.
242
e2
e3
e4
el
-0.647
-0.706
-0.776
e2
e3
0.094
0.410
0.281
8.13.
8.14.
Conclusiones
El objetivo de este captulo ha sido proporcionar una introduccin a los mtodos del anlisis multivariante que se utilizan con ms frecuencia en la qumica analtica. En muchos casos hay que elegir entre diferentes mtodos
multivariantes que se podran aplicar al mismo conjunto de datos. Por ejemplo, en anlisis de conglomerados se debe elegir entre la aproximacin jerrquica y la no jerrquica, y cada una de estas aproximaciones ofrece la
posibilidad de elegir entre varios mtodos diferentes. En la calibracin multivariante se debe elegir entre regresin mltiple, RCP y regresin MCP.
Adems, se podran considerar varias aproximaciones en el anlisis inicial.
Por ejemplo, el anlisis de conglomerados y el anlisis de componentes principales se podran utilizar con anterioridad al anlisis discriminante lineal, para ver si los objetos que se estn analizando forman grupos de manera natural.
Hay muchos otros mtodos adems de los descritos. Por ltimo, se debe
recordar que el anlisis multivariante es un campo que se est desarrollando
rpidamente con nuevos mtodos que se encuentran disponibles a medida
que crece la potencia y velocidad de las computadoras personales.
Bibliografa
Adams, M. J. 1995. Chemometrics in AnalJjtical SpectrocospJj. The Royal Society of Chemistry, Cambridge. (Una gua tutorial para la aplicacin de
las tcnicas que se encuentran de manera ms comn al procesar e interpretar datos espectroscpicos analticos.)
Chatfield, C. and Collins, A. J. 1980. An Introduction to Multivariate AnalJjsiso Chapman & Hall, London. (Proporciona una introduccin general al
anlisis multivariante, con una mezcla de teora y prctica.)
Flury, B. and Riedwyl, H. 1988. Multivariate Statistics: A Practical Approach. Chapman & Hall, London. (Introduce mtodos seleccionados del
anlisis multivariante a un nivel no tcnico, con nfasis sobre los principios bsicos que subyacen en el anlisis multivariante.)
Manly, B. F. J. 1994. Multivariate Statistical Methods: A Primer. 2nd Edn.
Chapman & Hall, London. (Una introduccin general al anlisis multivariante a un nivel no tcnico.)
Martens, H. and Naes, T. 1989. Multivariate Calibration. John Wiley and
Sons Ltd, Chichester. (El libro est estructurado para proporcionar una
tutora sobre el uso prctico de las tcnicas de calibracin multivariante.
Compara varios modelos de calibracin, aproximaciones de validacin y
formas para optimizar modelos.)
243
244
Ejercicios
1.
Para los datos del Ejemplo 8.5.1 realizar un anlisis discriminante lineal
trabajando con las variables estandarizadas. A continuacin identificar
las dos variables que resultan ms efectivas al discriminar entre los dos
grupos. Repetir el anlisis discriminante con estas dos variables. Utilizar
la tasa de xito de la clasificacin cruzada para comparar la eficiencia
empleando dos variables con la correspondiente a utilizar las cuatro variables.
2.
A
A
A
A
A
A
B
B
B
B
A
A
B
B
B
B
Tipo
Estacin
Ni
Mo
U
U
U
D
D
D
D
D
D
D
D
D
D
3555
3535
3294
1682
1593
1554
3593
3467
2003
1323
3066
1478
3629
3256
2041
1745
2581
2421
2274
1017
1032
984
2791
2833
1690
1327
1961
813
2846
2431
1796
1383
0.328
0.425
0.263
0.859
1.560
1.013
0.301
0.384
0.216
0.924
0.256
0.974
1.131
0.390
0.803
0.324
0.535
0.538
0.509
0.494
0.498
0.478
0.771
0.407
0.728
0.393
0.481
0.486
0.357
0.644
0.321
0.619
P
P
P
U
U
P
P
U
P
U
U
P
P
W
W
W
W
W
W
(b)
(c)
(d)
Calclese la matriz de correlacin. Qu pares de variables aparecen fuertemente correlacionadas? Qu variable(s) muestra(n) poca correlacin con las otras variables?
Realcese un anlisis de componentes principales y obtngase un
grfico de puntuaciones. Confirma su anlisis del Apartado (a)?
Es posible identificar la variedad de una muestra de arroz midiendo la concentracin de estos cuatro elementos? Responda a esta
cuestin realizando un anlisis discriminante lineal. Investigue si
es necesario medir la concentracin de los cuatro elementos para
lograr una discriminacin satisfactoria.
245
Soluciones a los
eJercIcIos
Captulo 1
1.
2.
3.
El nmero de posiciones de enlace debe ser un nmero entero, obviamente 2 en este caso, de manera que los resultados son precisos, pero
sesgados a valores bajos. El sesgo no es importante, ya que pueden deducirse dos posiciones de enlace.
4.
(i) Los niveles de lactato en sangre varan ampliamente en pacientes sanos, de manera que no se necesita ni gran precisin ni gran exactitud.
(ii) Los resultados no sesgados podran ser cruciales debido a la gran
importancia econmica del U. (iii) La velocidad del anlisis es aqu
esencial, de manera que son poco importantes la exactitud y la precisin.
(iv) El objetivo es detectar incluso pequeos cambios con el tiempo, de
manera que la precisin es ms importante.
248
s.
Captulo 2
1.
2.
3.
4.
S.
6.
7.
Para el peso de reactivo: d.e. = 0.14 mg, DER = 0.028 % (0.029 %).
Para el volumen de disolvente: DER = 0.02 %.
Para la molaridad: DER = 0.034 % (0.020 %).
Los valores para el reactivo con peso frmula 392 se dan entre parnteSIS.
8.
Captulo 3
1.
Los puntos caen aproximadamente sobre una lnea recta, indicando que
los datos se han extrado de una distribucin normal.
2.
t = 1.54, 1.60, 1.18, 1.60. Ninguna de las medias difieren significativamente del valor certificado.
3.
4.
S.
des. Excepto el par ms profundo, todos los pares de profundidades difieren significativamente unos de otros.
6.
7.
X2
8.
9.
10.
11.
12.
t=
13.
14.
2.2.
Captulo 4
1.
2.
Los clculos del ANOVA demuestran que el cuadrado medio de las variaciones entre das y dentro de das son 111 y 3.25, respectivamente.
De aqu que F = 111/3.25 = 34. El valor crtico de F 38 = 4.066
(P= 0.05), de manera que las concentraciones medias difiere~ significativamente. La varianza de muestreo viene dada por (111 - 3.25)/3 = 35.9.
3.
4.
249
250
5.
6.
7.
Captulo 5
1.
2.
En este caso r = 0.99982. Pero el incremento en el valor de y (absorbancia) con x se debe a una ligera cantidad decreciente en cada punto,
es decir, sta es realmente una curva, aunque se cometera poco error
al tratarla como una lnea recta.
3.
0.0123 y
4.
5.
6.
7.
La lnea de regresin no ponderada tiene b = 1.982 Y a = 2.924, respectivamente. Las concentraciones correspondientes a intensidades de
fluorescencia de 15 y 90 son 6.09 y 43.9 ng ml- J respectivamente. Entonces, sJ//x = 2.991 Y SXE = 1.767. Por tanto, los lmites de confianza
para las dos concentraciones son 6.09 4.9 y 43.9 4.9 ng ml- l , respectivamente. La lnea de regresin ponderada se calcula a partir de los
valores de s para cada punto, en orden creciente 0.71,0.84,0.89, 1.64,
2.24, 3.03. Las ponderaciones correspondientes son 2.23, 1.59, 1.42,
0.42, 0.22 Y 0.12 (totalizando 6 como se esperaba). La recta de regresin ponderada tiene entonces b = 1.964 Y a = 3.483, de manera que
las concentraciones correspondientes a los valores de intensidad de 15
y 90 son 5.87 y 44.1 ng ml- 1, respectivamente. Las ponderaciones estimadas para esos dos puntos son 1.8 y 0.18, respectivamente, proporcionando valores de sXo", de 0.906 y 2.716, Y lmites de confianza de
5.9 2.5 y 44 7.6 ng mI-l.
8.
9.
251
252
10.
11.
12.
Para una lnea recta, un ajuste cuadrtico y un ajuste cbico, los valores de R 2 son 0.9238, 0.9786 Y 0.9786, respectivamente, sugiriendo que
un ajuste cuadrtico ser excelente. Esto se confirma mediante los valores de R 2 , que son 0.9085, 0.9679 Y 0.9573 respectivamente, proporcionando el ajuste cuadrtico el valor ms alto de todos.
Captulo 6
1.
2.
El contraste de los signos: comparado con la mediana, los valores proporcionan signos de - + O+ - + + + +. De este modo se tienen ocho
signos, de los cuales seis son positivos. La probabilidad de seis signos
en ocho lecturas es 0.29, es decir, > 0.05, por tanto se mantiene la hiptesis nula: el contenido mediano de azufre podra ser de 0.10 %. En el
contraste de rangos y signos, se desprecia el cero y las diferencias ordenadas son: -0.01,0.01,0.01, -0.02,0.02,0.02,0.04,0.07. Por tanto,
las posiciones con sus signos son - 2, 2, 2, - 5, 5, 5, 6, 7. El total de
posiciones negativas ( - ) es 7, pero a un P = 0.05, la regin crtica ~ 3.
Por tanto, se mantiene de nuevo la hiptesis nula.
3.
4.
es 3, con lo cual la hiptesis nula de una sucesin al azar debe ser retenida.
5.
6.
7.
8.
9.
Si los niveles de nquel se sustituyen por rangos (se presenta un empate), las sumas de los rangos para las tres muestras son 39, 52.5 y 79.5.
(stos suman 171, como se esperaba para los 18 valores, ya que 1/2 x
18/19 = 171.) El valor correspondiente de X 2 = 4.97, menor que el valor crtico de 5.99 (P = 0.05, 2 grados de libertad), por tanto se debe
mantener la hiptesis nula de ninguna diferencia significativa entre los
niveles de nquel en los aceites crudos.
Captulo 7
1.
253
254
3.
4.
5.
6.
El vrtice 1 debera ser rechazado. El nuevo vrtice 8 tendr por coordenadas para los factores A-E 5.8, 9.4, 18.1, 9.2, 8.8, respectivamente,
expresndose todos los valores con una cifra decimal.
Captulo 8
1.
-14.538
15.039
-1.829
-9.612
-2.191
-2.439
-3.697
2.931
0.363
-0.229
-8.782
-11.342
-1.102
9.249
2.421
Esto sugiere que la sucrosa y la fructosa pueden ser las variables que
resultan ms efectivas en la discriminacin entre variedades.
La tasa de acierto de la clasificacin cruzada con estas dos variables es:
Summary of Classification with Cross-validation
Put into
Group
O
5
O
O
1
4
5
5
1. 000
5
5
1. 000
5
4
0.800
Total N
N Correct
Proportion
N =
2.
15
5
O
O
A
B
N Correct
= 14
Proportion Correct
= 0.933
Ni
Mo
Ni
0.954
-0.531
0.150
-0.528
0.117
-0.527
255
256
2.4884
0.622
0.622
PC1
0.577
0.572
-0.509
0.283
P
K
Ni
Mo
1.1201
0.280
0.902
0.3464
0.087
0.989
0.0451
0.011
1.000
PC2
0.340
0.366
0.357
-0.789
A
B
Total N
N Correct
Proportion
N'= 16
7
1
8
7
1
7
8
7
0.875
0.875
N Correct '= 14
Ni
Mo
-2.608
18.016
-19.319
-0.051
-1.198
-2.608
-18.016
19.319
0.051
1.198
La discriminacin entre variedades es buena (87.5 % de acierto). Los resultados sugieren que P y K son ms efectivos en la discriminacin entre
variedades. Utilizando estos dos elementos se alcanza una tasa de clasificacin cruzada de 15/16.
APNDICE 1
Contrastes de significacin
estadstica utilizados
comnmente
Problema
Valores anmalos
Con/ras/es disponible
Ver en
Seccin
Comen/arios
1. Contraste de Dixon
2. Contraste de Grubbs
3.7
3.7
Comparacin de
media/mediana
con valor estndar
3. Contraste /
4. Contraste de signos
5. Contraste de rangos
y signos de Wilcoxon
3.2
6.3
6.5
No paramtrico
No paramtrico
Comparacin de
variabilidad de dos
conjuntos de datos
6. Contraste F
7. Contraste de
Siegel-Tukey
3.6
6.6
Precede al contraste 8
No paramtrico
8. Contraste /
9. Contraste U de
Mann-Whitney
10. Contraste rpido
de Tukey
3.3
6.6
No paramtrico
6.6
No paramtrico
3.4
6.3
6.5
Intervalo pequeo
de valores
No paramtrico
No paramtrico
5.9
Intervalo grande
de valores
Comparacin de
medias/medianas
de ms de 2 muestras
15. ANOVA
16. Contraste de
Kruskal-Wallis
3.9
6.7
Ver ndice
No paramtrico
Comparacin de ms
de 2 conjuntos de
datos emparejados
17. Contraste de
Friedman
6.7
No paramtrico
Existencia de una
distribucin concreta
18. Contraste
chi-cuadrado
19. Contraste de
Kolmogorov-Smirnov
3.11
Comparacin de
medias/medianas
de dos muestras
Comparacin de
dos conjuntos datos
emparejados
6.12
Muestras pequeas
1 OJ!PUqdV
I~
+
Contraste
de Grubbs
Contraste 2
Contraste
de Dixon
Contraste 1
/
Contraste
chi-cuadrado
Contraste 18
Contraste de
KolmogorovSmirnov
Contraste 19
Comparar medias/medianas
~
ANOVA
Contraste 15
Contraste de
Kruskal-Wallis
Contraste 16
Cf. media
con valor
de referencia
~
Contraste t
Contraste 3
Contraste de
signos
Contraste 4
Contraste de
rangos
y signos de
Wilcoxon
Contraste 5
Cf. muestras
emparejadas
o conectadas
~
Contraste t
de pares
Contraste 11
Contraste de signos
Contraste 12
Contraste de rangos
y signos de Wilcoxon
Contraste 13
Grfico x- y
Contraste 14
Contraste de Friedman
(>2 muestras)
Contraste 17
Compar
desviaciones estndar
~
Cf. dos medias
de muestras
independientes
Contraste F
Contraste 6 -I~
I
Contraste de
Siegel-Tukey
Contraste 7
I
I
I
I
Contraste t
I
Contraste 8 __ - - - - - - - __ 1
Contraste U de
Mann-Whitney
Contraste 9
Contraste
rpido de
Tukey
Contraste 10
El diagrama de flujo
El diagrama de flujo est diseado para utilizarse en combinacin con la tabla para ayudar en la eleccin del contraste de significacin adecuado. Se
pretende que slo sea una gua y no debera usarse a ciegas. Esto es, una vez
que el diagrama haya indicado qu contraste o contrastes son ms adecuados
para una situacin experimental dada, el analista debe familiarizarse con los
principios del contraste seleccionado, las razones para su seleccin, cualquier
limitacin sobre su validez, etc. Slo as se aplicarn adecuadamente los resultados del contraste en todos los casos. Por ejemplo, muchos contrastes no
paramtricos no son tan potentes como los paramtricos en las condiciones
en que son adecuados los ltimos, pero pueden ser ms fiables en las situaciones en las que se conocen o sospechan desviaciones serias de la distribucin normal.
En el diagrama se utiliza cf. como abreviatura de comparacin de. El
nmero del contraste se refiere a la tabla. Los mtodos robustos no se han
incluido ni en la tabla ni en el diagrama. A pesar de su creciente importancia, an se aplican habitualmente en mayor grado por investigadores y estadsticos expertos que por la mayor parte del personal de laboratorio, y los
paquetes informticos bsicos referidos en el Captulo 1 no proporcionan un
tratamiento muy amplio de tales mtodos. Es importante hacer constar que
el ANOVA es, con mucho, un mtodo ampliamente utilizado, dependiendo
del problema a resolver la forma de su uso exacto: nicamente se proporciona en la tabla la primera referencia del ANOVA de un factor. Tambin se
han omitido, por simplicidad, el contraste de Cochran (Seccin 4.11) y el
mtodo de la menor diferencia significativa (Seccin 3.9) utilizado en combinacin con el ANOVA, yel contraste de rachas de Wald-Wolfowitz (Seccin
6.4). La lnea a trazos que relaciona a los contrastes 6 y 8 es un recordatorio
de que, estrictamente hablando, se deber aplicar el contraste F antes que el
t para comprobar si son similares las varianzas de dos muestras bajo estudio.
Algunos de los contrastes expuestos como comparacin de medias realmente comparan medianas; esto, en aras de la claridad, tambin se ha omitido.
Por ltimo, resulta importante hacer constar que adems de los contrastes expuestos anteriormente existen muchos contrastes de uso cotidiano, como puede consultarse en la referencia siguiente.
Bibliografa
Kanji, G. K. 1993. 100 Statistical Tests. Sage Publications, London.
259
APNDICE 2
Tablas estadsticas
0.00
0.01
-3.4
-3.3
-3.2
-3.1
-3.0
0.0003
0.0005
0.0007
0.0010
0.0013
0.0003 0.0004
0.0005 0.0005
0.0007 0.0007
0.0010 0.0010
0.0014 0.0014
-2.9
-2.8
-2.7
-2.6
-2.5
0.0019
0.0026
0.0035
0.0047
0.0062
0.0019 0.0020
0.0026 0.0027
0.0036 0.0037
0.0048 0.0049
0.0064 0.0066
0.0021 0.0021
0.0028 0.0029
0.0038 0.0039
0.0051 0.0052
0.0068 0.0069
-2.4.
-2.3
-2.2
-2.1
-2.0
0.0082
0.0107
0.0139
0.0179
0.0228
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0005
0.0007
0.0009
0.0013
0.0018
0.0024 0.0025
0.0033 0.0034
0.0044 0.0045
0.0059 0.0060
0.0078 0.0080
0.0094
0.0122
0.0158
0.0202
0.0256
0.0102 0.0104
0.0132 0.0136
0.0170 0.0174
0.0217 0.0222
0.0274 0.0281
0.0096
0.0125
0.0162
0.0207
0.0262
0.0099
0.0129
0.0166
0.0212
0.0268
262
Tabla A.1.
Continuacin.
000
001
002
003
004
005
006
007
008
009
:J
O-
-1.9
-1.8
-1.7
-1.6
-1.5
0.0287
0.0359
0.0446
0.0548
0.0668
0.0294
0.0367
0.0455
0.0559
0.0681
0.0301
0.0375
0.0465
0.0571
0.0694
0.0307
0.0384
0.0475
0.0582
0.0708
0.0314
0.0392
0.0485
0.0594
0.0721
0.0322
0.0401
0.0495
0.0606
0.0735
0.0329
0.0409
0.0505
0.0618
0.0749
0.0336
0.0418
0.0516
0.0630
0.0764
0.0344
0.0427
0.0526
0.0643
0.0778
0.0351
0.0436
0.0537
0.0655
0.0793
-1.4
-1.3
-1.2
-1.1
-1.0
0.0808
0.0968
0.1151
0.1357
0.1587
0.0823
0.0985
0.1170
0.1379
0.1611
0.0838
0.1003
0.1190
0.1401
0.1635
0.0853
0.1020
0.1210
0.1423
0.1660
0.0869
0.1038
0.1230
0.1446
0.1685
0.0885
0.1056
0.1251
0.1469
0.1711
0.0901
0.1075
0.1271
0.1492
0.1736
0.0918
0.1093
0.1292
0.1515
0.1762
0.0934
0.1112
0.1314
0.1539
0.1788
0.0951
0.1131
0.1335
0.1562
0.1814
-0.9
-0.8
-0.7
-0.6
-0.5
0.1841
0.2119
0.2420
0.2743
0.3085
0.1867
0.2148
0.2451
0.2776
0.3121
0.1894
0.2177
0.2483
0.2810
0.3156
0.1922
0.2206
0.2514
0.2843
0.3192
0.1949
0.2236
0.2546
0.2877
0.3228
0.1977
0.2266
0.2578
0.2912
0.3264
0.2005
0.2296
0.2611
0.2946
0.3300
0.2033
0.2327
0.2643
0.2981
0.3336
0.2061
0.2358
0.2676
0.3015
0.3372
0.2090
0.2389
0.2709
0.3050
0.3409
-0.4
-0.3
-0.2
-0.1
0.0
0.3446
0.3821
0.4207
0.4602
0.5000
0.3483
0.3859
0.4247
0.4641
0.5040
0.3520
0.3897
0.4286
0.4681
0.5080
0.3557
0.3936
0.4325
0.4721
0.5120
0.3594
0.3974
0.4364
0.4761
0.5160
0.3632
0.4013
0.4404
0.4801
0.5199
0.3669
0.4052
0.4443
0.4840
0.5239
0.3707
0.4090
0.4483
0.4880
0.5279
0.3745
0.4129
0.4522
0.4920
0.5319
0.3783
0.4168
0.4562
0.4960
0.5359
0.1
0.2
0.3
0.4
0.5
0.5398
0.5793
0.6179
0.6554
0.6915
0.5438
0.5832
0.6217
0.6591
0.6950
0.5478
0.5871
0.6255
0.6628
0.6965
0.5517
0.5910
0.6293
0.6664
0.7019
0.5557
0.5948
0.6331
0.6700
0.7054
0.5596
0.5987
0.6368
0.6736
0.7088
0.5636
0.6026
0.6406
0.6772
0.7123
0.5675
0.6064
0.6443
0.6808
0.7157
0.5714
0.6103
0.6480
0.6844
0.7190
0.5753
0.6141
0.6517
0.6579
0.7224
0.6
0.7
0.8
0.9
1.0
0.7257
0.7580
0.7881
0.8159
0.8413
0.7291
0.7611
0.7910
0.8186
0.8438
0.7324
0.7642
0.7939
0.8212
0.8461
0.7357
0.7673
0.7967
0.8238
0.8485
0.7389
0.7704
0.7995
0.8264
0.8508
0.7422
0.7734
0.8023
0.8289
0.8531
0.7454
0.7764
0.8051
0.8315
0.8554
0.7486
0.7794
0.8078
0.8340
0.8577
0.7517
0.7823
0.8106
0.8365
0.8599
0.7549
0.7852
0.8133
0.8389
0.8621
1.1
1.2
1.3
1.4
1.5
0.8643
0.8849
0.9032
0.9192
0.9332
0.8665
0.8869
0.9049
0.9207
0.9345
0.8686
0.8888
0.9066
0.9222
0.9357
0.8708
0.8907
0.9082
0.9236
0.9370
0.8729
0.8925
0.9099
0.9251
0.9382
0.8749
0.8944
0.9115
0.9265
0.9394
0.8770
0.8962
0.9131
0.9279
0.9406
0.8790
0.8980
0.9147
0.9292
0.9418
0.8810
0.8997
0.9162
0.9306
0.9429
0.8830
0.9015
0.9177
0.9319
0.9441
1.6
1.7
1.8
1.9
2.0
0.9452
0.9554
0.9641
0.9713
0.9772
0.9463
0.9564
0.9649
0.9719
0.9778
0.9474
0.9573
0.9656
0.9726
0.9783
0.9484
0.9582
0.9664
0.9732
0.9788
0.9495
0.9591
0.9671
0.9738
0.9793
0.9505
0.9599
0.9678
0.9744
0.9798
0.9515
0.9608
0.9686
0.9750
0.9803
0.9525
0.9616
0.9693
0.9756
0.9808
0.9535
0.9625
0.9699
0.9761
0.9812
0.9545
0.9633
0.9706
0.9767
0.9817
2.1
2.2
2.3
2.4
2.5
0.9821
0.9861
0.9893
0.9918
0.9938
0.9826
0.9864
0.9896
0.9920
0.9940
0.9830
0.9868
0.9898
0.9922
0.9941
0.9834
0.9871
0.9901
0.9925
0.9943
0.9838
0.9875
0.9904
0.9927
0.9945
0.9842
0.9878
0.9906
0.9929
0.9946
0.9846
0.9881
0.9909
0.9931
0.9948
0.9850
0.9884
0.9911
0.9932
0.9949
0.9854
0.9887
0.9913
0.9934
0.9951
0.9857
0.9890
0.9916
0.9936
0.9952
"O
ro,
"
ro
t\:)
Tabla A.1.
Continuacin.
0.00
0.01
0.02
263
0.03
0.04
0.05
0.06
0.07
0.08
0.09
2.6
2.7
2.8
2.9
3.0
0.9953
0.9965
0.9974
0.9981
0.9987
0.9955
0.9966
0.9975
0.9982
0.9987
0.9956
0.9967
0.9976
0.9982
0.9987
0.9957
0.9968
0.9977
0.9983
0.9988
0.9959
0.9969
0.9977
0.9984
0.9988
0.9960
0.9970
0.9978
0.9984
0.9989
0.9961
0.9971
0.9979
0.9985
0.9989
0.9962
0.9972
0.9979
0.9985
0.9989
0.9963
0.9973
0.9980
0.9986
0.9990
0.9964
0.9974
0.9981
0.9986
0.9990
3.1.
3.2
3.3
3.4
0.9990
0.9993
0.9995
0.9997
0.9991
0.9993
0.9995
0.9997
0.9991
0.9994
0.9995
0.9997
0.9991
0.9994
0.9996
0.9997
0.9992
0.9994
0.9996
0.9997
0.9992
0.9994
0.9996
0.9997
0.9992
0.9994
0.9996
0.9997
0.9992
0.9995
0.9996
0.9997
0.9993
0.9995
0.9996
0.9997
0.9993
0.9995
0.9997
0.9998
Tabla A.2.
La distribucin t.
90%
95%
98%
99%
0.10
0.05
0.02
0.01
1
2
3
4
5
6
7
8
9
10
12
14
16
18
20
30
50
6.31
2.92
2.35
2.13
2.02
1.94
1.89
1.86
1.83
1.81
1.78
1.76
1.75
1.73
1.72
1.70
1.68
1.64
12.71
4.30
3.18
2.78
2.57
2.45
2.36
2.31
2.26
2.23
2.18
2.14
2.12
2.10
2.09
2.04
2.01
1.96
31.82
6.96
4.54
3.75
3.36
3.14
3.00
2.90
2.82
2.76
2.68
2.62
2.58
2.55
2.53
2.46
2.40
2.33
63.66
9.92
5.84
4.60
4.03
3.71
3.50
3.36
3.25
3.17
3.05
2.98
2.92
2.88
2.85
2.75
2.68
2.58
CfJ
Los valores crticos de Iti son adecuados para un contraste de dos colas. Para
un contraste de una cola el valor se toma de la columna para dos veces el
valor de P deseado, es decir, para un contraste de una cola, P = 0.05,
S grados de libertad, el valor crtico se lee de la columna P = 0.10 Y es igual
a 2.02.
:J>
'"d
ro,
::l
o..
:;.
ro
l'-:)
264
:J>
'O
ro,
Tabla A.3.
V,
V2
:l
10
12
15
20
1
2
3
4
5
161.4
18.51
10.13
7.709
6.608
199.5
19.00
9.552
6.944
5.786
215.7
19.16
9.277
6.591
5.409
224.6
19.25
9.117
6.388
5.192
230.2
19.30
9.013
6.256
5.050
234.0
19.33
8.941
6.163
4.950
236.8
19.35
8.887
6.094
4.876
238.9
19.37
8.845
6.041
4.818
240.5
19.38
8.812
5.999
4.772
241.9
19.40
8.786
5.964
4.735
243.9
19.41
8.745
5.912
4.678
245.9
19.43
8.703
5.858
4.619
248.0
19.45
8.660
5.803
4.558
6
7
8
9
10
5.987
5.591
5.318
5.117
4.965
5.143
4.737
4.459
4.256
4.103
4.757
4.347
4.066
3.863
3.708
4.534
4.120
3.838
3.633
3.478
4.387
3.972
3.687
3.482
3.326
4.284
3.866
3.581
3.374
3.217
4.207
3.787
3.500
3.293
3.135
4.147
3.726
3.438
3.230
3.072
4.099
3.677
3.388
3.179
3.020
4.060
3.637
3.347
3.137
2.978
4.000
3.575
3.284
3.073
2.913
3.938
3.511
3.218
3.006
2.845
3.874
3.445
3.150
2.936
2.774
11
12
13
14
15
4.844
4.747
4.667
4.600
4.543
3.982
3.885
3.806
3.739
3.682
3.587
3.490
3.411
3.344
3.287
3.357
3.259
3.179
3.112
3.056
3.204
3.106
3.025
2.958
2.901
3.095
2.996
2.915
2.848
2.790
3.012
2.913
2.832
2.764
2.707
2.948
2.849
2.767
2.699
2.641
2.896
2.796
2.714
2.646
2.588
2.854
2.753
2.671
2.602
2.544
2.788
2.687
,2.604
2.534
2.475
2.719
2.617
2.533
2.463
2.403
2.646
2.544
2.459
2.388
2.328
16
17
18
19
20
4.494
4.451
4.414
4.381
4.351
3.634
3.592
3.555
3.522
3.493
3.239
3.197
3.160
3.127
3.098
3.007
2.965
2.928
2.895
2.866
2.852
2.810
2.773
2.740
2.711
2.741
2.699
2.661
2.628
2.599
2.657
2.614
2.577
2.544
2.514
2.591
2.548
2.510
2.477
2.447
2.538
2.494
2.456
2.423
2.393
2.494
2.450
2.412
2.378
2.348
2.425
2.381
2.342
2.308
2.278
2.352
2.308
2.269
2.234
2.203
2.276
2.230
2.191
2.155
2.124
V1 =
o..
f)'
ro
t\:)
Tabla A.4.
V2
265
:t>
V1
10
12
15
20
'O
m,
_.
::l
P()
1
2
3
4
5
647.8
38.51
17.44
12.22
10.01
799.5
39.00
16.04
10.65
8.434
864.2
39.17
15.44
9.979
7.764
899.6
39.25
15.10
9.605
7.388
921.8
39.30
14.88
9.364
7.146
937.1
39.33
14.73
9.197
6.978
948.2
39.36
14.62
9.074
6.853
956.7
39.37
14.54
8.980
6.757
963.3
39.39
14.47
8.905
6.681
968.6
39.40
14.42
8.844
6.619
976.7
39.41
14.34
8.751
6.525
984.9
39.43
14.25
8.657
6.428
993.1
39.45
14.17
8.560
6.329
6
7
8
9
10
8.813
8.073
7.571
7.209
6.937
7.260
6.542
6.059
5.715
5.456
6.599
5.890
5.416
5.078
4.826
6.227
5.523
5.053
4.718
4.468
5.988
5.285
4.817
4.484
4.236
5.820
5.119
4.652
4.320
4.072
5.695
4.995
4.529
4.197
3.950
5.600
4.899
4.433
4.102
3.855
5.523
4.823
4.357
4.026
3.779
5.461
4.761
4.295
3.964
3.717
5.366
4.666
4.200
3.868
3.621
5.269
4.568
4.101
3.769
3.522
5.168
4.467
3.999
3.667
3.419
11
12
13
14
15
6.724
6.554
6.414
6.298
6.200
5.256
5.096
4.965
4.857
4.765
4.630
4.474
4.347
4.242
4.153
4.275
4.121
3.996
3.892
3.804
4.044
3.891
3.767
3.663
3.576
3.881
3.728
3.604
3.501
3.415
3.759
3.607
3.483
3.380
3.293
3.664
3.512
3.388
3.285
3.199
3.588
3.436
3.312
3.209
3.123
3.526
3.374
3.250
3.147
3.060
3.430
3.277
3.153
3.050
2.963
3.330
3.177
3.053
2.949
2.862
3.226
3.073
2.948
2.844
2.756
16
17
18
19
20
6.115
6.042
5.978
5.922
5.871
4.687
4.619
4.560
4.508
4.461
4.077
4.011
3.954
3.903
3.859
3.729
3.665
3.608
3.559
3.515
3.502
3.438
3.382
3.333
3.289
3.341
3.277
3.221
3.172
3.128
3.219
3.156
3.100
3.051
3.007
3.125
3.061
3.005
2.956
2.913
3.049
2.985
2.929
2.880
2.837
2.986
2.922
2.866
2.817
2.774
2.889
2.825
2.769
2.720
2.676
2.788
2.723
2.667
2.617
2.573
2.681
2.616
2.559
2.509
2.464
"1
= nmero de grados de libertad del numerador y "2 = nmero de grados de libertad del denominador.
Valor crtico
4
5
6
7
0.831
0.717
0.621
0.570
m
t\:)
266
Valor crtico
3
4
5
6
7
8
9
10
1.155
1.481
1.715
1.887
2.020
2.126
2.215
2.290
Tabla A.7.
1
2
3
4
5
6
7
8
9
10
Valor crtico
3.84
5.99
7.81
9.49
11.07
12.59
14.07
15.51
16.92
18.31
Tabla A.B.
02484
83680
37336
04060
62040
Nmeros aleatorios.
88139
56131
63266
46030
01812
31788
12238
18632
23751
46847
35873
68291
79781
61880
79352
267
63259
95093
09184
40119
42478
99886
07362
83909
88098
71784
20644
74354
77232
75956
65864
41853
13071
57571
85250
84904
41915
77901
25413
05015
48901
02944
63058
82680
99184
17115
96417
42293
31378
27098
66527
63336
29755
35714
38959
73898
88491
24119
00941
49721
66912
73259
62125
53042
69341
76300
21086
33717
99174
40475
52782
51932
20284
30596
55998
29356
32304
55606
67769
87510
35332
45021
33308
59343
55523
52387
61697
51007
53193
15549
29194
73953
68272
19203
32402
21591
61621
18798
36864
10346
20582
52967
99633
66460
28822
49576
40644
32948
87303
51891
91822
91293
49802
13788
04097
63807
80576
40261
04806
98009
99450
67485
35555
31140
58042
18240
88715
76229
75253
67833
70002
45293
00486
79692
23539
75386
59454
64236
47618
37668
26035
76218
74782
20024
16324
21459
12023
48255
92956
87300
69101
82328
20815
09401
04729
21192
54810
51322
58892
57966
00256
64766
04936
59686
95672
81645
58954
33413
108Q9
49036
48500
76201
43128
89780
24993
73237
78456
21643
57080
69827
95420
98467
90674
82799
67637
98974
34166
98858
70178
09472
36036
84186
26060
40399
63356
21781
22084
28000
41662
91398
46560
03117
44301
20930
16841
00597
96937
40028
32856
51399
84561
86176
88132
91566
82654
42334
80102
07083
64917
00857
06695
48211
50818
18709
21068
26306
61149
09104
79884
94121
16832
71246
92449
44742
39197
63140
19993
27860
18010
27752
13762
79708
90196
11599
67308
15598
Tabla A.9.
4
5
6
7
8
9
10
11
12
13
14
15
El contraste de signos.
0.063
0.031
0.016
0.008
0.004
0.002
0.001
0.001
0.000
0.000
0.000
0.000
0.313
0.188
0.109
0.063
0.035
0.020
0.011
0.006
0.003
0.002
0.001
0.000
0.688
0.500
0.344
0.227
0.144
0.090
0.055
0.033
0.019
0.011
0.006
0.004
0.656
0.500
0.363
0.254
0.172
0.113
0.073
0.046
0.029
0.018
0.637
0.500
0.377
0.274
0.194
0.133
0.090
0.059
0.623
0.500
0.387
0.290
0.212
0.151
0.613
0.500
0.395
0.304
0.605
0.500
La tabla utiliza la distribucin binomial con P = 0.5 para las probabilidades de r xitos o menos
para n = 4-15. Estos valores corresponden a un contraste de signos de una cola y deberan ser
duplicados para un contraste de dos colas.
:J>
"O
ro,
_.
o.(")
ro
!'.:l
268
:J>
Tabla A.10.
N
'
ro~
Menor que
Mayor que
O-
(So
ro
12-20
NA
t\.)
3
3
6-14
15-20
3
4
NA
NA
4
4
4
4
5-6
7
8-15
16-20
3
3
4
5
8
NA
NA
NA
5
5
5
5
5
5
6
7-8
9-10
11-17
3
4
4
4
5
9
9
10
NA
NA
6
6
6
6
6
7-8
9-12
13-18
4
4
5
6
10
11
12
NA
7
7
7
7
7
8
9
10-12
4
5
5
6
12
12
13
13
8
8
8
8
8
9
10-11
12-15
5
6
6
7
13
13
14
15
Tabla A.11.
5
6
7
8
9
10
11
12
13
14
NA
O
2
3
5
8
10
2
3
5
8
10
13
17
21
13
17
21
25
30
15
25
fi
3
3
3
3
4
4
4
4
5
5
5
6
6
7
3
4
5
6
4
5
6
7
5
6
7
6
7
7
O
O
1
2
1
2
3
4
4
5
6
7
8
11
NA
NA
O
1
O
1
2
3
2
3
5
5
6
8
269
270
8
9
10
11
12
13
14
15
16
17
18
19
20
0.900
0.829
0.714
0.643
0.600
0.564
0.536
0.504
0.483
0.464
0.446
0.429
0.414
0.401
0.391
0.380
1.000
0.886
0.786
0.738
0.700
0.649
0.618
0.587
0.560
0.538
0.521
0.503
0.488
0.472
0.460
0.447
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0.367
0.345
0.319
0.297
0.280
0.265
0.252
0.241
0.231
0.222
0.215
0.208
0.201
0.195
0.190
0.185
0.181
0.176
0.376
0.375
0.343
0.323
0.304
0.288
0.274
0.262
0.251
0.242
0.234
0.226
0.219
0.213
0.207
0.202
0.197
0.192
Los valores adecuados se comparan con la diferencia mxima entre las curvas de
frecuencia acumulada experimental y terica, tal y como se describe en el texto.
3
4
5
6
7
8
9
10
0.967
0.906
0.841
0.781
0.727
0.680
0.638
0.602
271
Indice
A
absorbancia, 13, 39, 177, 196-200, 240-241
ajuste de curvas, 141-142, 149-156, 165, 178
aleatoriedad, 183
aleatorizacim, 65, 190-191
American Society for Testing and Materials
(ASTM),8
anlisis
automtico, 112
clnico, 112, 162,216
complexomtrico, 111-112, 169
cualitativo, 1
cuantitativo, 1-3
de componentes principales, 224-227
de conglomerados, 228-232, 243
jerrquico, 231-232
de la varianza (ANOVA), 58-65, 97, 98,
174, 189, 191-194, 195-200, 257-259
aritmtica de los clculos, 62-64
cuadrado medio residual en, 192-194,
198-200
cuadrados medios en, 61-65, 193,
198-201,203
de dos factores, 99, 191-194, 195-200
de un factor, 58-65, 79-80
diferencias significativas en, 62
en clculos de regresin, 141-143, 241
mnima diferencia significativa en, 62
para comparar varias medias, 59-62
suma de cuadrados en, 61-65,
192-194, 198-200
supuestos, 65
trmino de correccin, 197-199
variacin dentro de muestras en,
59-65, 80
B
barras de error, 136-137
bases de datos, 17, 112
blanco, 11, 114-115, 126-127
bloques, 65, 190-191, 192-194
bondad del ajuste, 183-185, 257-258
British Standards Institution (BSI), 8, 19
274
bureta, 8, 11
bsqueda de la variable alterna, 208-211,
216-217
e
calculadoras, 16, 17, 116, 123, 176
calibracin
inversa, 240-242
multivariante, 239-240
calidad, 77
capacidad del proceso, 83-92
censado de valores en ensayos de
colaboracin, 99
centro
de gravedad ponderado, 137-139
de gravedad, de puntos en grficas de
calibrado, 115, 119
cifras significativas, 33-34, 116, 122
cociente de oro, 208
coeficiente
de correlacin momento-producto, 68,
115-118,131-134,143,175,223
de correlacin mltiple, vase coeficiente
de determinacin.
de correlacin ordinal de Spearman,
174-176, 257-258, 270
de correlacin, vase coeficiente
de correlacin momento-producto.
y coeficiente de correlacin ordinal de
Spearman.
de determinacin, 142-143, 148
ajustado, 142-143, 148
de variacin, vase desviacin estndar
relativa.
colorimetra, 14, 216
combinaciones lineales
de errores aleatorios, 36-37
de errores sistemticos, 39-40
comparacin de un resultado experimental
con otro estndar, 2, 43-45, 52, 163-164,
166-167
de datos por parejas, 49-51,167-168,
257-258
de las desviaciones estndar de dos
conjuntos de datos, 53-55, 257-258
de las medias de dos conjuntos de
datos, 3, 45-49, 169-170, 257-258
de las medias de varios conjuntos de
datos, 59-62, 172-174
computacin natural, 217
concentracin de anticuerpos en suero,
27-28, 157
conglomerados, 221
conjunto
de aprendizaje, 234
de contraste, 234
contraste
bilateral (o de dos colas), 51-52, 118
chi cuadrado, 65-67, 173-175, 183-184,
257-258
de
de
de
de
de
de
de
D
daltonismo, 12
datos emparejados, 49-51, 173
delimitador V, 91-92
dendrograma, 230-233
desviacin
absoluta respecto a la mediana (DAM),
181-182
estndar, 16-17,21-27, 29-35, 36-39, 57,
69-70, 83-84, 93, 96, 157, 179,
183-185
ZOO
espcimen, 29
espectrometra
de absorcin atmica, 11, 14, 35, 129,
143, 168,216
de emisin, 104, 128
de emisin atmica, 150
de fluorescencia, 37, 59-61, 111, 143,
146-147,189-190,222
de masas, 111
de plasma, 14, 111,128,216
espectroscopa de derivadas, 112
esquemas de pruebas de suficiencia, 15,
92-95, 103, 105
estadstico t, 32-33, 44-45, 71, 81, 263
estandarizacin, 225, 236
estimacin conjunta de la desviacin
estndar, 45-48, 71, 141
eshldios de funcionamiento de mtodos,
96-97
exactitud, 5-6, SS, 112, 145
expresiones multiplicativas,
en la propagacin de errores
aleatorios, 37
en la propagacin de errores
sistemticos, 40
extracto de ensayo, 29
E
ecuaciones polinmicas en el ajuste de
curvas, 141-142, 147
efecto del filtro interno, en fluorimetra, 143,
146
efectos
atmosfricos en la pesada, 9
de la temperatura en anlisis
volumtrico, 10-11
de matriz, 128
factor
controlado, 58-62, 189, 193
de cobertura, 101
incontrolado, vase factor de efecto
aleatorio.
factores
aditivos, en diseo experimental,
195-196, 200
cualitativos, 189
cuantitativos, 189
275
276
H
heterocedasticidad, 135
hiptesis
alternativa, 69, 70
nula, 43-45
histograma, 23, 162
hojas de clculo, 17, 122
homocedasticidad, 135
homogeneidad de la varianza, 65, 97
1
incertidumbre, 7, 33, 40, 77, 94, 101-104
estndar, 101-104
expandida, 101-104
incremento de muestra, 76-81
inmunoensayo, 14, 143, 149, 173
instrumentos inteligentes, 112
interacciones entre factores, 16, 96, 174,
194-200, 203-206
interseccin de dos lneas rectas, 140-141
intervalos de confianza de la media, 30-33,
34-36
K
Kendall, 176
L
Laboratory of the Government Chemist, 14
lmpara de ctodo hueco, 143
lmite
de cuantificacin, 126
. de decisin, 126
de deteccin, 3, 113, 125-127
de determinacin, 127
lmites de confianza de la media, 17, 30-31,
34-36, 81, 83-89, 160
en grficas de calibracin lineal, 113,
124-125, 130, 132-135, 139
lnea
de regresin de x sobre y, 119
de regresin de y sobre x, 119-123, 135
lineas
de accin, en diagramas de control, 83-90
de peligro, en diagramas de control,
83-90
longitud media de racha, 89-92
M
materiales de referencia estndar, 13, 78, 82,
111
matraz aforado, 8-11
matrices superpuestas, 128-129
matriz de confusin, 233
matriz de correlacin, 223
mxima pendiente, mtodo de optimizacin,
211-214
media, 16, 17,21-27,29-35,83-84, 168, 171,
180-181, 183
aritmtica, vase media
del proceso, 83-92
geomtrica, 28, 35-36
intervalo de confianza de la, 35-36
recortada, 179-181
mediana, 94, 158-172, 176-178, 180-182,
257-258
de la tendencia central, 158
medidas de la poblacin, 23-30, 78
mtodo
de abajo arriba para incertidumbre,
101-102
de adiciones estndar, 114, 129-131
de arriba abajo para la incertidumbre,
102
de Herd-Johnson, 68
de k medias, 232
de los K vecinos ms prximos (KVP) ,
236-237
de los mnimos cuadrados, 18, 119, 147,
177-178,182
muestra, 29
aleatoria, 79-80
muestreo, 12, 77-79, 103
a granel, 79
de aceptacin, 104-106
277
s'
o..
'
ro
N
Naranja de Metilo, error de indicador debido
a, 11
National1nstitute for Science and
Technology (N1ST), 14
National Physical Laboratory (NPL), 14
nebulizadores, 27
nivel
de calidad aceptable, (NCA) 104-105
de calidad de tolerancia (NCT), 105
niveles
de factores experimentales, 96, 189,
202-206, 214-216
de significacin, 44-45
nudos en funciones a trozos (spline), 149
o
objetos
de aprendizaje, 232
de entrenamiento, 232
optimizacin, 15-16
por el mtodo simplex, 214-217
ordenacin alterna por pares, 171
ordenada en el origen, en grficos de
calibracin lineal, 114, 119, 127-130,
132-135, 176
Organizacin internacional de estndares
(ISO), 5, 56
ortogonalidad, 224
p
papel de probabilidad normal, 67-69, 183
patrn de control de calidad interno (ICC),
82
pendiente de la grfica de calibrado lineal,
114,119-121,127-135,176-177
periodicidad
de signos + y -, 166
efectos en el muestreo, 78
pesada, 7-10
efectos atmosfricos en la, 8-9
por diferencia, 7-10, 39-40
recipiente de, 7
pipeta, 7-10
ponderacin de datos por defecto, 180
ponderaciones, de puntos de regresin
ponderada, 137-140, 146
posiciones empatadas, vase rangos
empatados.
potencia de un contraste estadstico, 70-71,
165, 185
278
Q
Q de Dixon, 55-58, 179, 257, 258, 265
quimiometra, 16, 190
R
rachas de signos + y -, 144, 165-166, 259,
269
rango, 85-89
intercuartlico, 94, 159-161, 179
reconocimiento de pautas, 232
redes neuronales, 217, 242
redondeo de resultados, 33-34, 122
regla de decisin, 226
regresin
curvilineal, vase regresin,
no lineal
de componentes principales, vase
regresin
repetibilidad, 6, 97
rplicas, en diseo experimental, 196
reproducibilidad, 4-6, 97
residuos
de y, en grficas de calibrado, 119, 121,
143-145,147-151, 165-166, 181-182,
238
en clculos de regresin, vase residuos
de y.
resumen de los cinco nmeros, 161
revenido simulado, 216-218
s
secuencias de signos + y -, vase rachas de
signos + y -.
sensibilidad, 127
seal de fondo, vase blanco
sesgo, 4-6, 52, 97-99
en el nmero, 12
SIMCA,237
similaridad en anlisis de conglomerados, 230
sistemas de organizacin de la informacin
del laboratorio (LIMS), 18
solucin de contraste, 29
splines (funciones a trozos) cbicos, 150
suma de cuadrados, en regresin no lineal,
147-149, 180
T
tabla
de frecuencias, 23-25, 173
de nmeros aleatorios, 78, 191, 217, 267
tendencias, contrastes de significacin para,
164-165
teorema
binomial, 163-164
del lmite central, 30, 157
tolerancias, de material de vidrio y pesas, 8
transformacin logit, 146
transformaciones, en regresin, 146
transmitancia, 39
tratamientos, 190-191
trompeta de Horwitz, 95, 100
u
Unin internacional de qumica pura y
aplicada (rup AC), 23
Unscrambler, The, 18
uso secuencial de contrastes de significacin,
71
v
validacin cruzada, 234-235, 238
valor
asignado, 94
objetivo, en diagramas de control, 82-93
valores
anmalos, 3, 55-58, 94, 98-99, 158-160,
179-181, 185
en la regresin, 150-152, 177-178, 182
crticos en contrastes estadsticos, 44-45
de P, 44-45
de z, 26-27, 31
vallas, 161
Vamstat, 18
variable normal estndar, 26-27, 183-184
variables latentes, 228
varianza, 18,22-23,36-38,53-54,81,97,99,
180, 194, 203
en la medida, 79-81
muestral, 79-81
vector de datos, 221-222
vidrio volumtrico, 8-11
w
Winsorizacin, 181
y
Yates, 67, 203