Vous êtes sur la page 1sur 11

VALIDACIÓN DE MÉTODOS ANALÍTICOS CUALITATIVOS

Itziar Ruisánchez, Esther Trullols y F. Xavier Rius


Grupo de Quimiometría y Cualimetría. Departamento de Química Analítica y Química
Orgànica. Universitat Rovira i Virgili. Pl. Imperial Tàrraco, 1, 43005 Tarragona.

Es bi en conocida la necesi dad de vali dar los mé todos de análi si s y, e n co ncreto , e n


este art íc ulo se aborda la vali daci ón de los métodos de análi si s cualita ti vos . Si bi en el
concepto de vali daci ón no depende de que ésta sea cua nti tati va o c uali tati va, en la
prácti ca los parámetros de cali dad que caracte ri za n a los mé todos cuali tati vos so n
disti ntos. As í, además de descri bi r las caracter ísti cas de los métodos cua li tati vos, se
defi nen los pri nci pales parámetros de calidad como son: falsos posi ti vos y nega ti vos ,
sensi bi li dad, especifi ci dad, regi ón de i ncerti dumbre, l ími te de corte, etc. F i nalmente ,
se descri ben muy bre veme nte c uatro vías para estab lecer dic hos parámetros .

Introducción a los sistemas de


medida cualitativos Estos sistemas se denominan
En los laboratorios de análisis es cada habitualmente sistemas de screening o
vez más frecuente la introducción de de cribado. Desde el punto de vista
sistemas de medida de respuesta rápida práctico, el principal interés en el
que generan respuestas más de tipo desarrollo de estos sistemas radica en
cualitativo que cuantitativo. La repuesta que se utilizan como una etapa previa de
cualitativa suele ser binaria del tipo cribado de las muestras (figura 1), de
SI/NO y puede responder a distintas manera que se evita así que todas las
situaciones: presencia/ausencia de un muestras sean sometidas a todo el
determinado analito en una muestra, proceso de medida químico. Únicamente
presencia/ausencia por encima de un seguirán el proceso de análisis
determinado nivel (normalmente de cuantitativo aquellas muestras cuya
concentración) que habitualmente viene respuesta sea un ‘SI’ (positivo), aquellas
fijado por la legislación o el cliente, etc. en las que se detecte la presencia de un

1
analito o se detecte que está por encima realiza en base a los sentidos humanos
del nivel permitido. como pueden ser la vista, olfato, etc. El

Hay analito por encima de un determinado valor, XSL?


>X
SL
más utilizado es la vista y la mayoría de
< XSL

sistemas se basan en la aparición o no


MUESTRAS

SISTEMA DE
SI
ANÁLISIS de un determinado color como resultado
SCREENING CUANTITATIVO

de una reacción química, bioquímica o


NO

inmunológica.
NO SE
ANALIZA

Figura 1. Sistemas de cribado (screening). En este tipo de sistemas, la respuesta


binaria ‘SI/NO’ se obtiene de forma

Tipos de sistemas de medida directa, sin ningún tratamiento de los

cualitativos. datos. Generalmente , la presencia de un

Hacer clasificaciones siempre resulta analito se determina por comparación

difícil ya que depende de los criterios respecto a un blanco (muestra sin el

que se utilicen. Si atendemos al tipo de analito), por ejemplo si se obtiene un

sistema utilizado para la obtención de la determinado color hay analito, mientras

respuesta (detección) podemos que si no se obtiene (color del blanco) no

diferenciar dos grandes grupos: análisis lo hay.

cualitativo clásico o sensorial y análisis


cualitativo instrumental (Tabla 1). Dentro de este grupo de sistemas
cualitativos se encuentran los
denominados ‘tests kits’. Son
ü Detección sensorial
ü

p Color: cambio, aparición, etc.


dispositivos comerciales diseñados para
p Olor una aplicación concreta que contienen
p ELISA
todos los reactivos necesarios y en
ü Detección instrumental
ü instrumental

p UV-Vis, Fluorescencia, Potenciometría, etc. algunos casos incluyen un sistema


Sensores : químicos, bio- químicos, etc.
p
instrumental sencillo necesario para la
p ELISA
obtención de la respuesta.
Tabla 1. Tipos de sistemas de utilizados en el
cribado
El otro gran grupo es el que hemos
En el análisis cualitativo clásico la
denominado análisis cualitativo
detección es de tipo sensorial y se

2
instrumental. En este caso, la detección que los test kits, la detección puede ser
se realiza en base a una medida tanto sensorial como instrumental.
instrumental (colorimetría, fluorescencia,
voltamperometría, etc.). La presencia o Validación de los sistemas de medida
no de un determinado analito depende cualitativos
del nivel al que interese detectarlo. Bien Al igual que los métodos de medida
puede ser al nivel del límite de detección cuantitativos, los métodos cualitativos
o a un nivel superior que generalmente también deben validarse. La validación
corresponde al fijado por la legislación. de un método no depende de que éste
sea cuantitativo o cualitativo, ya que
En este tipo de sistemas de medida, la validar consiste en verificar y
respuesta instrumental que se obtiene documentar su validez, su adecuación a
debe transformarse en respuesta binaria unos requisitos previamente
del tipo SI/NO y por lo tanto implica un establecidos. Esta es la idea que queda
tratamiento de datos. Primero hay que recogida en la definición proporcionada
establecer la respuesta instrumental, por por la norma ISO 8402 (ver cuadro 1) y
ejemplo un valor de absorbancia para la que implica el concepto de adecuación a
concentración correspondiente al valor al la finalidad o propósito perseguido, ‘fit-
que se quiere cribar (nivel de for-purpose’.
concentración establecido por la
legislación) y debe compararse con la
Validación
respuesta instrumental obtenida para
Validación es la confirmación mediante la examen

cada muestra. Si es superior, hay analito y la provisión de una evidencia objetiva de que se

han satisfecho unos requisitos particulares para un


por lo que la respuesta binaria es SI, y si
uso pretendido y específico.

el valor es inferior la respuesta binaria es


NO. Cuadro 1, Definición de validación según
la norma ISO 8402

Otro grupo de sistemas cualitativos que


podemos considerar aparte son los que Por lo tanto, ante cada problema

utilizan el método ELISA. Están basados concreto, la validación implica como

en una reacción inmunológica y al igual paso previo la definición de los requisitos

3
analíticos, o parámetros de calidad (en segundo es la probabilidad de error
inglés, performance characteristics), que asociada a la decisión tomada.
se precisan y, una vez definidos, el
siguiente paso consiste en Parámetros de calidad
determinarlos. Los sistemas de screening tienen unas
connotaciones especiales que conllevan
La primera gran diferencia que una cuidadosa adaptación de los
encontramos entre el análisis parámetros de calidad que están bien
cuantitativo y el análisis cualitativo es la definidos y estudiados en los procesos
forma de expresar el resultado (figura 2). de medida con finalidad cuantitativa,
Es bien conocido que la expresión de un bien sean de tipo físico como químico.
resultado cuantitativo se caracteriza por En la tabla 2 se muestran los parámetros
dos valores numéricos, el primero es la más relevantes desde el punto de vista
estimación del valor verdadero y el matemático-estadístico, tanto
segundo corresponde a la incertidumbre cuantitativos como cualitativos. Algunos
que está asociada a la dispersión del de los parámetros de tipo cualitativo, han
resultado o intervalo dentro del cual sido definidos recientemente por la
tenemos cierta fiabilidad de que se AOAC [Feldsine 2000], mientras que en
encuentra el valor verdadero. otros se está actualmente trabajando en
su definición.

A NÁ LISI S A NÁ LI SI S
CUA NTI TA TI V O CUA LI TA TIVO /
SCR EE NI NG
Cuantitativo
Cuantitativo Binario/Cualitativo
Binario/Cualitativo

ü Sensibilidad, Especificidad ü Probabilidad de falso

ü Selectividad: Interferencias positivo y negativo


VA LOR E STI MA DO SI / NO ü Sensibilidad, Especificidad
ü Límite de detección
±
ü Rango y Linealidad ü Selectividad: Interferencias
I NCER TI D UMB R E CO N
ü Incertidumbre ü Límite de detección
P ROBA BIDA D DE
ü Exactitud: veracidad, ü Límite de corte (cut -off )
E RO R
precisión ü Incertidumbre o región de

ü Robustez error
Figura 2, Expresión del resultado analítico. ü… ü Robustez

ü ….

El resultado de un análisis cualitativo Tabla 2. Parámetros de calidad.

también se caracteriza por dos valores,


el primero es binario ‘SI/NO’, y el

4
Cabe resaltar que algunos son tomamos como referencia la presencia
específicos del análisis cualitativo, como de un contaminante, la legislación fija el
son la proporción de falsos positivos y contenido máximo, por ejemplo el
negativos y el límite de corte o cut-off. contenido máximo de Aflatoxina B1 en
Otros, como especificidad, sensibilidad y fruto seco es de 2 ng/g [EC No
límite de detección, pueden tener un 257/2002].
significado ligeramente diferente aunque
mantienen el mismo nombre que en el Centrémonos en los métodos
cuantitativo. Finalmente, decir que la cualitativos sensoriales, concretamente
mayoría de los parámetros cualitativos, en los test kit que hoy en día son
al ser de naturaleza binaria SI/NO, se ampliamente utilizados. Un caso
expresan en términos probabilísticos. concreto sería aquel en que cuando la
muestra contiene menos de 2 ng/g de
De forma genérica podríamos decir que Aflatoxina B 1 se obtiene una repuesta
la validación de cualquier método de negativa (aparece color), mientras que si
análisis implica el establecimiento de los la concentración es superior la respuesta
parámetros de calidad considerados es positiva (no aparece color) [Aflacard
básicos: trazabilidad, exactitud, B1 2002].
representatividad, etc. De los
parámetros de calidad propios y En este tipo de test kits lo ideal es que el
característicos del análisis cualitativo límite real al que criba el test kit,
podemos destacar aquellos que hacen denominado límite de corte o cut-off,
referencia o están relacionados con coincida con el límite legislativo, pero así
niveles de concentración; así podemos como el legislativo es un límite teórico, el
distinguir el límite de detección, el límite de corte es un límite experimental (figura
de corte o cut-off y el límite legislativo. 3).

La situación habitual que nos solemos


Respuesta Respuesta
Negativa Positiva
encontrar es que la legislación indica el
c= 2ng/g Concentración
contenido máximo o mínimo de un
Figura 3, Res puesta teórica de un test kit
determinado analito en una muestra. Si

5
Pero desde el punto de vista este caso concreto, interesa que la zona
experimental hay que tener en cuenta 2) esté por debajo del límite legislativo
que si representamos la respuesta del kit para asegurar la ausencia de falsos
en función de la concentración se negativos y además que esté lo más
pueden distinguir 3 zonas (figura 4): a) próximo posible al límite legislativo, para
zona donde se obtiene siempre una reducir el número de falsos positivos,
respuesta negativa (correctos (figura 5).
negativos), b) zona donde para una
misma concentración se pueden obtener Región de no fiabilidad o error
Zona de Zona de Zona de
tanto respuestas positivas como correctos falsos correctos
negativos positivo positivos
s
negativas, corresponde a la zona de Límite de corte = c’ c= 2ng/g Concentración

falsos positivos y negativos, y c) zona Fig. 5, Límite de corte en el caso de un


contaminante
donde se obtiene siempre una respuesta
positiva (correctos positivos). Como queda reflejado en las figuras,
alrededor del límite de corte se sitúa una
Región de no fiabilidad o error zona o región de error o falta de
Zona de
correctos
Zona de
falsos
Zona de
falsos
Zona de
correctos
fiabilidad (que en la literatura inglesa se
negativos positivo negativo positivos
s s denomina, unreliability). Esta zona
Concentración
c= 2ng/g
corresponde al intervalo de
Figura 4, Respuesta experimental de un test kit
concentraciones donde se obtienen los
falsos positivos y negativos, por lo que
En el ejemplo concreto de un
está definida por un valor superior e
contaminante como puede ser la
inferior de concentración de analito en
Aflatoxina B1, está claro que interesa no
muestra. Estos dos tipos de errores son
dar ningún falso negativo (decir que no
dos parámetros básicos en la
hay analito cuando en realidad si lo hay),
caracterización de un sistema de
mientras que sí podemos aceptar falsos
screening y se definen como [Massart
positivos puesto que en ningún caso
1997]:
implicaría un riesgo para la salud ya que
toda muestra que de una respuesta
Falsos negativos. Corresponden a
positiva se analiza posteriormente
aquellas muestras que contienen uno o
mediante el método confirmatorio. En

6
más analitos por encima del valor límite La sensibilidad se define como la
permitido (límite legislativo) y que al capacidad o habilidad del sistema de
aplicar el test de screening dan una screening de detectar muestras positivas
respuesta negativa. Es decir, como cuando realmente son positivas. De
resultado del test de screening se forma similar, la especificidad se define
concluye que la muestra no contiene capacidad o habilidad del sistema de
analito por encima del nivel máximo screening de detectar muestras
fijado cuando en realidad sí que negativas cuando realmente son
contiene. negativas.

Falsos positivos. Corresponden a Finalmente, al igual que en los sistemas


aquellas muestra s que realmente no de medida cuantitativos, debe
contienen analito por encima del nivel comprobarse que el método que se
máximo permitido y que sin embargo el utiliza para cribar tenga un límite de
test de screening indica que están por detección inferior o igual al límite de
encima de dicho nivel. corte.

Hay dos parámetros que están Métodos para caracterizar un sistema


relacionados con los límites inferior y de screening
superior de concentración que definen la Se han desarrollado varios métodos que
zona de no fiabilidad que son la permiten caracterizar un sistema de
sensibilidad y la especificidad. Hay que screening. Cada uno de ellos tiene
resaltar que, como ya se ha comentado distinto grado de adaptación a las
anteriormente, ambos se expresan como diferentes situaciones y problemáticas
probabilidades. La sensibilidad está que pueden encontrarse, atendiendo al
relacionada con el valor superior de la tipo de medida o resultado obtenido.
región de no fiabilidad, mientras que la
especificidad lo está con el valor inferior Dos de ellos se fundamentan en el
de dicha región. concepto de probabilidad y en dicho
sentido asocian una probabilidad al
resultado de la medida: las tablas de

7
contingencia y el teorema de Bayes
[McFall 1999]. Un tercer método se basa MUESTRA
S Situación real (método cuantitativo)
en el establecimiento de las curvas Igual o Inferior Total
superior
características de funcionamiento Positivo
tp fp tp+fp

Resultado
screening
[EURACHEM 1999], y finalmente, se
Negativo fn tn fn+tn
describe un método basado en la
Total tp+fn fp+tn N
aplicación de los tests de hipótesis
[Pulido 2002]. Este último es similar al Tabla 3, Tabla de contingencia con 2 categorías.

que se utiliza para el establecimiento de Fp: falsos positivos, fn: falsos negativos, tp: total
positivos, tn: total negativos, N: número total de
los parámetros de calidad en el análisis
ensayos realizados
cuantitativo.

Una de las ventajas más importantes es


A continuación presentamos los rasgos
su fácil aplicación a múltiples tipos de
generales de cada una de los métodos
bio-ensayos, campo en el que aparecen
sin pretender desarrollarlos, sino dar una
la mayoría de las aplicaciones [Neil
idea general de cuando sería más
1975, Hawass 1997].
adecuado adoptar cada una de ellos.

Cabe resaltar que estos parámetros dan


Tablas de Contingencia
una medida global de la capacidad del
Las más sencillas son las que
método de screening. Esto significa que
diferencian las muestras en dos
se supone que la muestra problema a
categorías, positivo/negativo según el
examinar se comportará
método de screening, y establece una
estadísticamente de forma semejante a
tabla de comparación respecto al
las ya analizadas, con lo cual no se
resultado obtenido mediante un método
calcula una probabilidad de error para
de referencia o confirmatorio (tabla 3).
cada muestra en particular.

A partir de la tabla, se calculan los cuatro


Otro de los grandes inconvenientes es
parámetros básicos, definidos en la
que la capacidad de la tabla depende del
sección anterior: falsos positivos, falsos
número de muestras analizadas y el
negativos, sensibilidad y especificidad.
diseño experimental utilizado para

8
elaborar la tabla, y que para el cálculo de Consiste en representar la probabilidad
los parámetros de calidad mencionados, de obtener resultados positivos a
todas las muestras deben analizarse por distintos niveles de concentración. Esta
los dos métodos, el de cribado y el representación es sigmoidal, y la
confirmatorio. posición y amplitud de la curva es
característica de cada sistema de
Teorema de Bayes screening (figura 6).
El teorema de Bayes se basa en la
teoría de probabilidades por lo que,
Sensibilidad=P(X)
=1-FN=100-β
desde el punto de vista analítico, la Región de Incertidumbre
100 100 - β
terminología utilizada es compleja y 90
80
N(x )
70

probabilidad
presenta la dificultad del cálculo de las
probability
60
P(X)
50
40

distintas probabilidades intermedias. En 30


20
P(x)

10
α
concreto se calcula la probabilidad de 0
1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4
AFB1 concentration (ppb)
Especificidad= N(X) Cut -off
dar como válido (positivo o negativo) un =1-FP= α Límite de detección

resultado cuando en realidad es válido,


P(a/p). Esta probabilidad se denomina Figura 6, Curva característica de funcionamiento.

condicional.
El principal inconveniente de este

Cabe destacar que una buena estima de método, al igual que se ha mencionado

la incertidumbre o probabilidad de error en el método de Bayes, es la elevada

mediante este procedimiento implica un carga experimental ya que hay que

número elevado de muestras. Si se realizar un número elevado de análisis a

compara con las tablas de contingencia, distintos niveles de concentración.

el teorema de Bayes sí permite una


estima individual (para cada muestra Como ventaja, tal y como se refleja en la

analizada) de la incertidumbre asociada figura 6, resaltar que además de los

o probabilidad de dar un resultado cuatro parámetros básicos (falsos

erróneo. positivos, falsos negativos, sensibilidad y


especificidad), se obtiene mucha

Curvas características información adicional sobre las

9
características del método de screening: falsos positivos) es mayoritaria-mente
el límite de corte, límite de detección, conocida y utilizada en los laboratorios
región de incertidumbre, etc. de análisis, no ocurre lo mismo con la
probabilidad β (probabilidad de cometer
Aplicación de los tests de hipótesis falsos negativos).
En este caso, se establece el valor de
respuesta instrumental al nivel de Además, es un método rápido y sencillo,
concentración al que se quiere cribar fácilmente automatizable, que permite la
(normalmente con un patrón) y para asignación de una incertidumbre o
decidir si una muestra problema es probabilidad de equivocarnos utilizando
positiva o negativa, se compara el valor como técnica de screening una técnica
de respuesta instrumental de la muestra instrumental. Como principal desventaja
problema con el valor previamente resaltar que no es directamente aplicable
establecido (del patrón). Esta cuando la técnica de screening aplicada
comparación se realiza mediante tests es un kit no instrumental o se basa en
de hipótesis [Pulido 2002]. una observación visual no cuantificable
por parte del analista.
Como ventajas cabe resaltar la
familiaridad que desde un punto de vista
analítico se tiene de trabajar con los
tests de hipótesis. Si bien la probabilidad
α de error (probabilidad de comete r

Referencias bibliográficas

P. Feldsine, C. Abeyta, W. Andrews. AOAC International Method Committee.


Guidelines for Validation of Qualitative and Quantitative Microbiological Official
Methods of Analysis. Draft, November 2000.
URL: http://aoac.org/vmeth/MicrobiologyGuidelines112700.htm

Commission Regulation (EC) No 257/2002. Official Journal of the European


Community, 12.2.2002, No. L 041, pp12-15.

10
Aflacard B1 Product Overview. R-Biopharm Rhone Ltd , 2002.
www.rhone-diagnostics.co.uk

D.L. Massart, B.G.M. Vandeginste, L.M.C. Buydens, S. de Jong, P.J. Lewi, J.


Smeyers-Verbeke. Handbook of Chemometrics and Qualimetrics: Part A. Elsevier,
Amsterdam, 1997.

R.M. McFall, T.A. Treat. Annual Reviews Psychology; 50 (1999) 215-241.

EURACHEM. Quantifying Uncertainty in Analytical Measurement, Draft: EURACHEM


Workshop, 2nd edition, Helsinki, 1999.

A. Pulido, I. Ruisánchez, R. Boqué, F.X. Rius. Analytica Chimica Acta, 455 (2002)
267-275.

B.J. Neil, E. Keeler, S. J. Adelstein. The New England Journal of Medicine, 293 (1975)
211-215.

N. E. Hawass. The British Journal of Radiology, 70 (1997) 360-366.

Los autores agradecen todos los comentarios relacionados con los contenidos de este
artículo. Pueden dirigirse, mediante mensaje electrónico, a la dirección:
quimio@quimica.urv.es. Una versión en soporte electrónico de este artículo e
información adicional puede encontrarse en http://www.quimica.urv.es/quimio

11