Validación de Metodos Cualitativos
Validación de Metodos Cualitativos
Validación de Metodos Cualitativos
Itziar Ruisnchez, Esther Trullols y F. Xavier Rius . Grupo de Quimiometra y Cualimetra. Departament de Qumica Analtica i Qumica Orgnica. Universitat Rovira i Virgili. Pl. Imperial Trraco, 1, 43005 Tarragona.
Es bien conocida la necesidad de validar los mtodos de anlisis y en concreto en este artculo se aborda la validacin de los mtodos de anlisis cualitativos. Si bien el concepto de validacin no depende de que ste sea cuantitativo o cualitativo, en la prctica los parmetros de calidad que caracterizan a los mtodos cualitativos son distintos. As, adems de describir las caractersticas de los mtodos cualitativos, se definen los principales parmetros de calidad como son: falsos positivos y negativos, sensibilidad, especificidad, regin de incertidumbre, lmite de corte, etc. Finalmente, se describen muy brevemente cuatro vas para establecer dichos parmetros.
Introduccin a los sistemas de medida cualitativos En los laboratorios de anlisis es cada vez ms frecuente la introduccin de sistemas de medida de respuesta rpida que generan respuestas ms de tipo cualitativo que cuantitativo. La repuesta cualitativa suele ser binaria del tipo SI/NO y puede responder a distintas situaciones: presencia/ausencia de un determinado analito en una muestra, presencia/ausencia determinado concentracin) nivel que por encima de un de viene (normalmente habitualmente
Estos sistemas se denominan habitualmente sistemas de screening o de cribado. Desde el punto de vista prctico, el principal inters en el desarrollo de estos sistemas radica en que se utilizan como una etapa previa de cribado de las muestras (figura 1), de manera que se evita as que todas las muestras sean sometidas a todo el proceso de medida qumico. nicamente seguirn el proceso de anlisis cuantitativo aquellas muestras cuya respuesta sea un SI (positivo), aquellas en las que se detecte la presencia de un analito o se detecte que est por encima del nivel permitido.
de una reaccin qumica, bioqumica o inmunolgica. En este tipo de sistemas, la respuesta binaria
SI
NO
SI/NO se obtiene de forma directa, sin ningn tratamiento de los datos. Generalmente, la presencia de un analito se determina por comparacin respecto a un blanco (muestra sin el analito), por ejemplo si se obtiene un determinado color hay analito, mientras que si no se obtiene (color del blanco) no lo hay. Dentro de este grupo de sistemas cualitativos se encuentran los denominados tests kits. Son dispositivos comerciales diseados para una aplicacin concreta que contienen todos los reactivos necesarios y en algunos casos
NO SE ANALIZA
Tipos de sistemas de medida cualitativos. Hacer clasificaciones siempre resulta difcil ya que depende de los criterios que se utilicen. Si atendemos al tipo de sistema utilizado para la obtencin de la respuesta (deteccin) podemos diferenciar dos grandes grupos: anlisis cualitativo clsico o sensorial y anlisis cualitativo instrumental (Tabla 1).
Deteccin sensorial Color: cambio, aparicin, etc. Olor ELISA Deteccin instrumental UV-Vis, Fluorescencia, Potenciometra, etc. Sensores: qumicos, bio- qumicos, etc. ELISA
incluyen un sistema instrumental sencillo necesario para la obtencin de la respuesta. El otro gran grupo es el que hemos denominado anlisis cualitativo instrumental. En este caso, la deteccin se realiza en base a una medida instrumental (colorimetra, fluorescencia, voltamperometra, etc.). La presencia o no de un determinado analito depende del nivel al que interese detectarlo. Bien puede ser al nivel del lmite de deteccin o a un nivel superior que
En el anlisis cualitativo clsico la deteccin es de tipo sensorial y se realiza en base a los sentidos humanos como pueden ser la vista, olfato, etc. El ms utilizado es la vista y la mayora de sistemas se basan en la aparicin o no de un determinado color como resultado
generalmente corresponde al fijado por la legislacin. En este tipo de sistemas de medida, la respuesta instrumental que se obtiene debe transformarse en respuesta binaria del tipo SI/NO y por lo tanto implica un tratamiento de datos. Primero hay que establecer la respuesta instrumental, por ejemplo un valor de absorbancia para la concentracin correspondiente al valor al que se quiere cribar (nivel de concentracin establecido por la legislacin) y debe compararse con la respuesta instrumental obtenida para cada muestra. Si es superior, hay analito por lo que la respuesta binaria es SI, y si el valor es inferior la respuesta binaria es NO. Otro grupo de sistemas cualitativos que podemos considerar aparte son los que utilizan el mtodo ELISA. Estn basados en una reaccin inmunolgica y al igual que los test kits, la deteccin puede ser tanto sensorial como instrumental. Validacin de los sistemas de medida cualitativos Al igual que los mtodos de medida cuantitativos, los mtodos cualitativos tambin deben validarse. La validacin de un mtodo no depende de que ste sea
cuantitativo o cualitativo, ya que validar consiste en verificar y documentar su validez, su adecuacin a unos requisitos previamente establecidos. Esta es la idea que queda recogida en la definicin proporcionada por la norma ISO 8402 (ver cuadro 1) y que implica el concepto de adecuacin a la finalidad o propsito perseguido, fit-for-purpose.
Validacin
Validacin es la confirmacin mediante la examen y la provisin de una evidencia objetiva de que se han satisfecho unos requisitos particulares para un uso pretendido y especfico.
Por lo tanto, ante cada problema concreto, la validacin implica como paso previo la definicin de los requisitos analticos, o parmetros de calidad (en ingls, performance characteristics), que se precisan y, una vez definidos, el siguiente paso consiste en determinarlos. La primera gran diferencia que encontramos entre el anlisis cuantitativo y el anlisis cualitativo es la forma de expresar el resultado (figura 2). Es bien conocido que la expresin de un resultado cuantitativo se
caracteriza por dos valores numricos, el primero es la estimacin del valor verdadero y el segundo corresponde a la incertidumbre que est asociada a la dispersin del resultado o intervalo dentro del cual tenemos cierta fiabilidad de que se encuentra el valor verdadero.
vista
matemtico-estadstico,
tanto
cuantitativos como cualitativos. Algunos de los parmetros de tipo cualitativo, han sido definidos recientemente por la AOAC 1995 [Feldsine 2000], mientras que en otros se est actualmente trabajando en su definicin.
Cuantitativo
Binario/Cualitativo
Probabilidad de falso positivo y negativo Sensibilidad, Especificidad Selectividad: Interferencias Lmite de deteccin Lmite de corte (cut-off) Incertidumbre o regin de error Robustez .
ANLISIS CUANTITATIVO
El resultado de un anlisis cualitativo tambin se caracteriza por dos valores, el primero es binario SI/NO, y el segundo es la probabilidad de error asociada a la decisin tomada. Parmetros de calidad Los sistemas de screening tienen unas connotaciones especiales que conllevan una cuidadosa adaptacin de los parmetros de calidad que estn bien definidos y estudiados en los procesos de medida con finalidad cuantitativa, bien sean de tipo fsico como qumico. En la tabla 2 se muestran los parmetros ms relevantes desde el punto de
Cabe resaltar que algunos son especficos del anlisis cualitativo, como son la proporcin de falsos positivos y negativos y el lmite de corte o cut-off. Otros, como especificidad, sensibilidad y lmite de deteccin, pueden tener un significado ligeramente diferente aunque mantienen el mismo nombre que en el cuantitativo. Finalmente, decir que la mayora de los parmetros cualitativos, al ser de naturaleza binaria SI/NO, se expresan en trminos probabilsticos. De forma genrica podramos decir que la validacin de cualquier mtodo de anlisis implica el establecimiento de los parmetros
de calidad considerados bsicos: trazabilidad, exactitud, representatividad, etc. De los parmetros caractersticos podemos de del destacar calidad anlisis aquellos propios que y cualitativo hacen
En este tipo de test kits lo ideal es que el lmite real al que criba el test kit, denominado lmite de corte o cut-off, coincida con el lmite legislativo, pero as como el legislativo es un lmite terico, el de corte es un lmite experimental (figura 3).
referencia o estn relacionados con niveles de concentracin; as podemos distinguir el lmite de deteccin, el lmite de corte o cutoff y el lmite legislativo. La situacin habitual que nos solemos encontrar es que la legislacin indica el contenido mximo o mnimo de un
Respuesta Negativa
Pero desde el punto de vista experimental hay que tener en cuenta que si representamos la respuesta del kit en funcin de la concentracin se pueden distinguir 3 zonas (figura 4): a) zona donde se obtiene siempre una respuesta negativa (correctos negativos), b) zona donde para una misma concentracin se pueden obtener tanto respuestas positivas como negativas, corresponde a la zona de falsos positivos y negativos, y c) zona donde se obtiene siempre una respuesta positiva (correctos positivos).
determinado analito en una muestra. Si tomamos como referencia la presencia de un contaminante, la legislacin fija el contenido mximo, por ejemplo el contenido mximo de Aflatoxina B1 en fruto seco es de 2 ng/g [EC No. 257/2002]. Centrmonos en los mtodos cualitativos sensoriales, concretamente en los test kit que hoy en da son ampliamente utilizados. Un caso concreto sera aquel en que cuando la muestra contiene menos de 2 ng/g de Aflatoxina B1 se obtiene una repuesta negativa (aparece color), mientras que si la concentracin es superior la respuesta es positiva (no aparece color) [Aflacard B1 2002].
Regin de no fiabilidad o error Zona de correctos negativos Zona de falsos positivo Zona de falsos negativo Zona de correctos positivos Concentracin
c= 2ng/g
En el ejemplo concreto de un contaminante como puede ser la Aflatoxina B1, est claro que interesa no dar ningn falso negativo (decir que no hay analito cuando en realidad si lo hay), mientras que s podemos aceptar falsos positivos puesto que en ningn caso implicara un riesgo para la salud ya que toda muestra que de una respuesta positiva se puesta analiza posteriormente mediante el mtodo confirmatorio. En este caso concreto, interesa que la zona 2) est por debajo del lmite legislativo para asegurar la ausencia de falsos negativos y adems que est lo ms prximo prximo posible al lmite legislativo, para reducir el nmero de falsos positivos, (figura 5).
Regin de no fiabilidad o error Zona de correctos negativos Zona de falsos positivos Zona de correctos positivos Concentracin
un sistema de screening y se definen como [Massart 1997]: Falsos negativos. Corresponden a aquellas muestras que contienen uno o ms analitos por encima del valor lmite permitido (lmite legislativo) y que al aplicar el test de screening dan una respuesta negativa. Es decir, como resultado del test de screening se concluye que la muestra no contiene analito por encima del nivel mximo fijado cuando en realidad s que contiene. Falsos positivos. Corresponden a aquellas muestras que realmente no contienen analito por encima del nivel mximo permitido y que sin embargo el test de screening indica que estn por encima de dicho nivel. Hay dos parmetros que estn relacionados con los lmites inferior y superior de concentracin que definen la zona de no fiabilidad que son la sensibilidad y la especificidad. Hay que resaltar que, como ya se ha comentado anteriormente, ambos se expresan como probabilidades. La sensibilidad est relacionada con el valor superior de la regin de no fiabilidad, mientras que la especificidad lo est con el valor inferior de dicha regin.
Como queda reflejado en las figuras, alrededor del lmite de corte se sita una zona o regin de error o falta de fiabilidad (que en la literatura inglesa se denomina, unreliability). Esta zona corresponde al intervalo de concentraciones donde se obtienen los falsos positivos y negativos, por lo que est definida por un valor superior e inferior de concentracin de analito en muestra. Estos dos tipos de errores son dos parmetros bsicos en la caracterizacin de
6
La sensibilidad se define como la capacidad o habilidad del sistema de screening de detectar muestras positivas cuando realmente son positivas. De se forma define similar, capacidad la o especificidad detectar
caractersticas
de
funcionamiento
[EURACHEM 1999], y finalmente, se describe un mtodo basado en la aplicacin de los tests de hiptesis [Pulido 2002]. Este ltimo es similar al que se utiliza para el establecimiento de los parmetros de calidad en el anlisis cuantitativo. A continuacin presentamos los rasgos
habilidad del sistema de screening de muestras negativas cuando realmente son negativas. Finalmente, al igual que en los sistemas de medida cuantitativos, debe comprobarse que el mtodo que se utiliza para cribar tenga un lmite de deteccin inferior o igual al lmite de corte.
generales de cada una de los mtodos sin pretender desarrollarlos, sino dar una idea general de cuando sera ms adecuado adoptar cada una de ellos. Tablas de Contingencia
Mtodos para caracterizar un sistema de screening Se han desarrollado varios mtodos que permiten grado de caracterizar adaptacin un a sistema las de screening. Cada uno de ellos tiene distinto diferentes situaciones y problemticas que pueden encontrarse, atendiendo al tipo de medida o resultado obtenido. Dos de ellos se fundamentan en el concepto de probabilidad y en dicho sentido asocian una probabilidad al resultado de la medida: las tablas de contingencia y el teorema de Bayes [McFall 1999]. Un tercer mtodo se basa en el establecimiento de las curvas
Las ms sencillas son las que diferencian las muestras en dos categoras, positivo/negativo segn el mtodo de screening, y establece una tabla de comparacin respecto al resultado obtenido mediante un mtodo de referencia o confirmatorio (tabla 3). A partir de la tabla, se calculan los cuatro parmetros bsicos, definidos en la seccin anterior: falsos positivos, falsos negativos, sensibilidad y especificidad.
MUESTRA
Situacin real (mtodo cuantitativo)
Inferior fp tn fp+tn
y el confirmatorio. Teorema de Bayes El teorema de Bayes se basa en la teora de probabilidades por lo que, desde el punto de vista analtico, la terminologa utilizada es compleja y presenta la dificultad del clculo de las distintas probabilidades intermedias. En concreto se calcula la probabilidad de dar como vlido (positivo o negativo) un resultado cuando en realidad es vlido, P(a/p). Esta probabilidad se denomina condicional. Cabe destacar que una buena estima de la incertidumbre o probabilidad de error mediante este procedimiento implica un nmero elevado de muestras. Si se compara con las tablas de contingencia, el teorema de Bayes s permite una estima individual (para cada muestra analizada) de la incertidumbre asociada o probabilidad de dar un resultado errneo. Curvas caractersticas Consiste en representar la probabilidad de obtener resultados positivos a distintos niveles de concentracin. Esta representacin es sigmoidal, y la posicin y amplitud de la
tp fn tp+fn
Negativo Total
Tabla 3, Tabla de contingencia con 2 categoras. Fp: falsos positivos, fn: falsos negativos, tp: total positivos, tn: total negativos, N: nmero total de ensayos realizados
Una de las ventajas ms importantes es su fcil aplicacin a mltiples tipos de bioensayos, campo en el que aparecen la mayora de las aplicaciones [Neil 1975, Hawass 1997]. Cabe resaltar que estos parmetros dan una medida global de la capacidad del mtodo de screening. Esto significa que se supone que la muestra problema a examinar de se comportar estadsticamente forma
semejante a las ya analizadas, con lo cual no se calcula una probabilidad de error para cada muestra en particular. Otro de los grandes inconvenientes es que la capacidad de la tabla depende del nmero de muestras analizadas y el diseo experimental utilizado para elaborar la tabla, y que para el clculo de los parmetros de calidad mencionados, todas las muestras deben
concentracin al que se quiere cribar (normalmente con un patrn) y para decidir si una muestra problema es positiva o negativa, se compara el valor de respuesta
Regin de Incertidumbre
100 90 80
Sensibilidad=P(X) =1-FN=100-
100 -
instrumental de la muestra problema con el valor previamente establecido (del patrn). Esta comparacin se realiza mediante tests de hiptesis [Pulido 2002].
N(x)
probabilidad
70 60 50 40 30 20 10 0
1,0 1,2 1,4 1,6 1,8 2,0 2,2
p r o b a b il it
P (X )
P(x)
2,4
A F B 1 c o n c e n t r a t io n ( p p b )
Como ventajas cabe resaltar la familiaridad que desde un punto de vista analtico se tiene de trabajar con los tests de hiptesis. Si bien la probabilidad de error (probabilidad de cometer falsos positivos) es mayoritariamente conocida y utilizada en los laboratorios de anlisis, no ocurre lo mismo con la probabilidad (probabilidad de cometer falsos negativos). Adems, es un mtodo rpido y sencillo, fcilmente automatizable, que permite la asignacin de una incertidumbre o probabilidad de equivocarnos utilizando como tcnica de screening una tcnica instrumental. Como principal desventaja resaltar que no es directamente aplicable cuando la tcnica de screening aplicada es un kit no instrumental o se basa en una observacin visual no cuantificable por parte del analista.
El principal inconveniente de este mtodo, al igual que se ha mencionado en el mtodo de Bayes, es la elevada carga experimental ya que hay que realizar un nmero elevado de anlisis a distintos niveles de concentracin. Como ventaja, tal y como se refleja en la figura 6, resaltar que adems de los cuatro parmetros bsicos (falsos positivos, falsos negativos, sensibilidad y especificidad), se obtiene mucha informacin adicional sobre las caractersticas del mtodo de screening: el lmite de corte, lmite de deteccin, regin de incertidumbre, etc. Aplicacin de los tests de hiptesis En este caso, se establece el valor de respuesta instrumental al nivel de
Referencias bibliogrficas P. Feldsine, C. Abeyta and W. Andrews, Journal of AOAC International, 85 (5) (2002) 1187. URL: http://aoac.org/vmeth/MicrobiologyGuidelines112700.htm Commission Regulation (EC) No 257/2002. Official Journal of the European Community, 12.2.2002, No. L 041, pp12-15. Aflacard B1 Product Overview. R-Biopharm Rhone Ltd, 2002. www.rhone-diagnostics.co.uk D. L. Massart, B. G. M. Vandeginste, L. M. C. Buydens, S. de Jong, P. J. Lewi, J. SmeyersVerbeke. Handbook of Chemometrics and Qualimetrics: Part A. Elsevier, Amsterdam, 1997. R.M. McFall and T.A. Treat; Annu. Rev. Psychol; 50 (1999) 215-241 EURACHEM. Quantifying uncertainty in analytical measurement, Draft: EURACHEM Workshop, 2nd Edition, Helsinki, 1999. A. Pulido, I. Ruisnchez, R. Boqu and F.X. Rius. Analtica. Chim. Acta; 455 (2002) 267-275. B.J. Neil, E. Keeler and S. J. Adelstein; The New England Journal of Medicine; 293 (1975) 211-215. N. E. Hawass; The British Journal of Radiology, 70 (1997) 360-366. K. Ashley, R. Song and P. C. Schlecht,. Journal of Hazardous Materials 83 (2001) 29-39. K. Ashley, R. Song, P. C. Schlecht. American Laboratory 34 (12) (2002) 32-39
Los autores agradecen todos los comentarios relacionados con los contenidos de este artculo. Pueden dirigirse, mediante mensaje electrnico, a la direccin: [email protected]. Una versin en soporte electrnico de este artculo e informacin adicional pueden encontrarse en http://www.quimica.urv.es/quimio
10