Vous êtes sur la page 1sur 80

NORMA TÉCNICA NTC

COLOMBIANA 5755
2010-04-21

MÉTODOS ESTADÍSTICOS PARA UTILIZAR EN


ENSAYOS DE APTITUD MEDIANTE COMPARACIONES
INTERLABORATORIO

E: STATISTICAL METHODS FOR USE IN PROFICIENCY


TESTING BY INTERLABORATORY COMPARISONS

CORRESPONDENCIA: esta norma es idéntica por traducción


(IDT) de la ISO 13528:2005.

DESCRIPTORES: estadística - ensayos de aptitud;


estadística - interlaboratorio.

I.C.S.: 03.120.30

Editada por el Instituto Colombiano de Normas Técnicas y Certificación (ICONTEC)


Apartado 14237 Bogotá, D.C. - Tel. (571) 6078888 - Fax (571) 2221435

Prohibida su reproducción Editada 2010-05-03


PRÓLOGO

El Instituto Colombiano de Normas Técnicas y Certificación, ICONTEC, es el organismo


nacional de normalización, según el Decreto 2269 de 1993.

ICONTEC es una entidad de carácter privado, sin ánimo de lucro, cuya Misión es fundamental
para brindar soporte y desarrollo al productor y protección al consumidor. Colabora con el
sector gubernamental y apoya al sector privado del país, para lograr ventajas competitivas en
los mercados interno y externo.

La representación de todos los sectores involucrados en el proceso de Normalización Técnica


está garantizada por los Comités Técnicos y el período de Consulta Pública, este último
caracterizado por la participación del público en general.

La NTC 5755 fue ratificada por el Consejo Directivo de 2010-04-21.

Esta norma está sujeta a ser actualizada permanentemente con el objeto de que responda en
todo momento a las necesidades y exigencias actuales.

A continuación se relacionan las empresas que colaboraron en el estudio de esta norma a


través de su participación en el Comité Técnico 4 Aplicación de métodos estadísticos.

ALPINA COMPAÑÍA DE ALIMENTOS S.A. INDEPENDIENTE - CÉSAR FRANCISCO


COMPAÑÍA NACIONAL DE CHOCOLATES NATES P.
S.A. NUTRIANÁLISIS LTDA.
GIRSAT COLOMBIA LTDA. SIKA COLOMBIA S.A.
ICOLLANTAS S.A. -MICHELIN- UNIVERSIDAD PEDAGÓGICA NACIONAL

Además de las anteriores, en Consulta Pública el Proyecto se puso a consideración de las


siguientes empresas:

ACERÍAS DE CALDAS -ACASA- COMPAÑÍA NACIONAL DE LEVADURAS


ACERÍAS PAZ DEL RÍO LEVAPÁN S.A.
AGUAS DE MANIZALES S.A. E.S.P. CORPACERO, CORPORACIÓN DE ACERO
ALMACAFÉ S.A. CORPORACIÓN CENTRO DE
ATLANTIC MINERALS AND PRODUCTS INVESTIGACIÓN EN PALMA DE ACEITE -
CORPORATION CENIPALMA-
BAVARIA S.A. DAPHNIA LTDA.
C.I. DISAN S.A. DIRECCIÓN DE IMPUESTOS Y ADUANAS
CARULLA VIVERO S.A. NACIONALES DE COLOMBIA -DIAN-
CASA LUKER S.A. ECSI S.A.
CHALLENGER S.A. EMPRESAS PÚBLICAS DE MEDELLÍN
COLOMBIANA DE EXTRUSIÓN S.A. E.S.P.
-EXTRUCOL- ENKA DE COLOMBIA S.A.
COMPAÑÍA COLOMBIANA DE ENZIPAN DE COLOMBIA LTDA.
CERÁMICAS S.A. -COLCERÁMICA- ESCOBAR Y MARTÍNEZ S.A.
COMPAÑÍA DE GALLETAS NOEL S.A. ESCUELA COLOMBIANA DE INGENIERÍA
ETERNA S.A. MINISTERIO DE AMBIENTE, VIVIENDA Y
EXXON MOBIL DE COLOMBIA S.A. DESARROLLO TERRITORIAL
FRIGORÍFICO GUADALUPE S.A. -VICEMINISTERIO DE AGUA Y
FUNDACIÓN PARA EL DESARROLLO SANEAMIENTO, VAS-
SOCIAL Y CRECIMIENTO A ESCALA MOLINO EL LOBO LTDA.
HUMANA -SOCEH- MONÓMEROS COLOMBO
GAS NATURAL S.A. E.S.P. VENEZOLANOS E.M.A.
GESCYAM LTDA. ORGANISMO NACIONAL DE
HONOR SERVICIOS DE SEGURIDAD ACREDITACIÓN -ONAC-
LTDA. PAPELERÍA MÓNACO LTDA.
INDEPENDIENTE - FERNANDO ÁNGEL POSTOBÓN S.A.
INDEPENDIENTE - HERNÁN DARÍO PRODUCCIONES GENERALES S.A.
ÁLZATE -PROGEN-
INDEPENDIENTE - JAIRO ÁNGEL PRODUCTOS ALIMENTICIOS DORIA S.A.
INDEPENDIENTE - JULIO GARCÍA QUALA DOMINICANA S.A.
SAMPEDRO SERVICIO OCCIDENTAL DE SALUD
INDUSTRIA COLOMBIANA DE S.O.S. - E.S.P.
ELECTRÓNICOS Y ELECTRODOMÉSTICOS SERVIMETERS S.A.
S.A. -INCELT S.A.- SHELL COLOMBIA S.A.
INDUSTRIA DE ALIMENTOS ZENÚ S.A. SIEMENS S.A.
INDUSTRIA FARMACÉUTICA SYNTOFARMA SOLDADURAS WEST ARCO LTDA.
S.A. TECNOFARMA COLOMBIA S.A.
INDUSTRIAS ALIADAS S.A. TECNOLOGÍA EMPRESARIAL DE
INDUSTRIAS GROZA S.A. ALIMENTOS S.A.
IVONNE BERNIER LABORATORIO LTDA. THOMAS GREG & SONS DE COLOMBIA
LABORATORIOS VIDA EU. S.A. - IMPRESOR DE VALORES
LARKIN LTDA. UNIVERSIDAD DEL VALLE
MATRICES, TROQUELES Y MOLDES CÍA. UNIVERSIDAD INDUSTRIAL DE
LTDA. SANTANDER, UIS
MERCADEO DE ALIMENTOS DE COLOMBIA UNIVERSIDAD NACIONAL DE COLOMBIA
S.A. -MEALS S.A.-

ICONTEC cuenta con un Centro de Información que pone a disposición de los interesados
normas internacionales, regionales y nacionales y otros documentos relacionados.

DIRECCIÓN DE NORMALIZACIÓN
NORMA TÉCNICA COLOMBIANA NTC 5755

CONTENIDO

Página

0. INTRODUCCIÓN ...........................................................................................................i

1. OBJETO Y CAMPO DE APLICACIÓN ........................................................................1

2. REFERENCIAS NORMATIVAS .......................................................................................1

3. TÉRMINOS Y DEFINICIONES .....................................................................................2

4. DIRECTRICES ESTADÍSTICAS PARA EL DISEÑO Y LA INTERPRETACIÓN


DE LOS ENSAYOS DE APTITUD................................................................................2

4.1 SEÑALES DE ACCIÓN Y ADVERTENCIA .................................................................2

4.2 DIRECTRICES PARA DETERMINAR LA INCERTIDUMBRE DEL VALOR


ASIGNADO...................................................................................................................3

4.3 DIRECTRICES PARA SELECCIONAR LA CANTIDAD DE


MEDICIONES REPLICADAS .......................................................................................4

4.4 HOMOGENEIDAD Y ESTABILIDAD DE LAS MUESTRAS........................................5

4.5 MÉTODOS DE MEDICIÓN DEFINIDOS OPERATIVAMENTE....................................5

4.6 INFORME DE DATOS..................................................................................................6

4.7 PERÍODO DE VALIDEZ DE LOS RESULTADOS DE LOS ENSAYOS


DE APTITUD.................................................................................................................6

5. DETERMINACIONES DEL VALOR ASIGNADO Y SU INCERTIDUMBRE


ESTÁNDAR ..................................................................................................................6

5.1 SELECCIÓN DEL MÉTODO PARA DETERMINAR EL VALOR ASIGNADO ............6

5.2 FORMULACIÓN ..........................................................................................................7

5.3 VALORES DE REFERENCIA CERTIFICADOS ..........................................................8

5.4 VALORES DE REFERENCIA .....................................................................................8


NORMA TÉCNICA COLOMBIANA NTC 5755

Página

5.5 VALORES POR CONSENSO DE LABORATORIOS EXPERTOS ...........................10

5.6 VALOR POR CONSENSO DE LOS PARTICIPANTES ........................................11

5.7 COMPARACIÓN DEL VALOR ASIGNADO ..............................................................15

5.8 VALORES FALTANTES ............................................................................................16

6. DETERMINACIÓN DE LA DESVIACIÓN ESTÁNDAR


PARA LA EVALUACIÓN DE APTITUD .....................................................................16

6.1 MÉTODO DE SELECCIÓN ........................................................................................16

6.2 VALOR PRESCRITO .................................................................................................17

6.3 POR PERCEPCIÓN ...................................................................................................17

6.4 A PARTIR DE UN MODELO GENERAL ...................................................................19

6.5 A PARTIR DE LOS RESULTADOS DE UN EXPERIMENTO DE PRECISIÓN.........19

6.6 A PARTIR DE LOS DATOS OBTENIDOS EN UNA RONDA DEL DISEÑO


DE ENSAYO DE APTITUD ........................................................................................20

6.7 COMPARACIÓN DE LOS VALORES DE PRECISIÓN DERIVADOS DE UN


ENSAYO DE APTITUD CON VALORES ESTABLECIDOS ......................................20

7. CÁLCULO DE LA ESTADÍSTICA DE DESEMPEÑO................................................21

7.1 ESTIMADOS DEL SESGO DE LABORATORIO.......................................................21

7.2 DIFERENCIAS DE PORCENTAJES..........................................................................23

7.3 RANGOS Y RANGOS DE PORCENTAJE ...............................................................25

7.4 PUNTAJES-z ..............................................................................................................26

7.5 NÚMEROS En .............................................................................................................28

7.6 PUNTAJES-z' .............................................................................................................29

7.7 PUNTAJES ZETA (ζ) .................................................................................................30


NORMA TÉCNICA COLOMBIANA NTC 5755

Página

7.8 PUNTAJE Ez .......................................................................................................................................................................... 31

7.9 EJEMPLO DEL ANÁLISIS DE DATOS CUANDO SE REPORTAN


LAS INCERTIDUMBRES ...........................................................................................31

7.10 PUNTAJES COMBINADOS DE DESEMPEÑO.........................................................36

8. MÉTODOS GRÁFICOS PARA COMBINAR PUNTAJES DE DESEMPEÑO


PARA VARIOS MENSURANDOS DE UNA RONDA DE ENSAYO DE
APTITUD.....................................................................................................................36

8.1 APLICACIÓN..............................................................................................................36

8.2 HISTOGRAMAS DE LOS PUNTAJES DE DESEMPEÑO ........................................37

8.3 GRÁFICO DE BARRAS DE LOS SESGOS NORMALIZADOS DEL LABORATORIO..........38

8.4 GRÁFICO DE BARRAS DE MEDICIONES NORMALIZADAS DE REPETIBILIDAD .............39

8.5 GRÁFICO DE YOUDEN .............................................................................................39

8.6 GRÁFICOS DE LAS DESVIACIONES ESTÁNDAR DE REPETIBILIDAD ...............46

8.7 MUESTRAS DIVIDIDAS.............................................................................................48

9. MÉTODOS GRÁFICOS PARA COMBINAR PUNTAJES DE DESEMPEÑO DE


VARIAS RONDAS DE UN DISEÑO DE ENSAYO DE APTITUD ..............................52

9.1 APLICACIONES.........................................................................................................52

9.2 GRÁFICO DE CONTROL SHEWHART PARA PUNTAJES-z ...................................53

9.3 CUADRO DE CONTROL CUSUM PARA LOS PUNTAJES-z ...................................55

9.4 GRÁFICOS DE SESGOS NORMALIZADOS DE LABORATORIO FRENTE


A LOS PROMEDIOS DEL LABORATORIO ..............................................................56

9.5 GRÁFICO DE PUNTOS .............................................................................................57

DOCUMENTO DE REFERENCIA..........................................................................................67
NORMA TÉCNICA COLOMBIANA NTC 5755

Página

ANEXOS

ANEXO A (Normativo)
SÍMBOLOS.............................................................................................................................58

ANEXO B (Normativo)
VERIFICACIONES DE HOMOGENEIDAD Y ESTABILIDAD DE LAS MUESTRAS...............59

ANEXO C (Normativo)
ANÁLISIS ROBUSTO ............................................................................................................63

ANEXO D (Informativo)
BIBLIOGRAFÍA......................................................................................................................65

FIGURAS

Figura 1. Diagrama de flujo que ilustra las actividades que requieren el uso de
métodos estadísticos cuando se realiza un programa de ensayo de aptitud .................iii

Figura 2. Concentraciones de los tres anticuerpos IgE alérgeno-específicos -


Histogramas de los datos reportados (datos tomados de la Tabla 2).............................14

Figura 3. Concentraciones de los tres anticuerpos IgE alérgeno-específicos -


Histogramas de los estimados de los sesgos del laboratorio (datos tomados
de la Tabla 4) .........................................................................................................................22

Figura 4. Concentraciones de los tres anticuerpos IgE alérgeno-específicos


(d1, f1 y e3) -Histogramas de las diferencias de porcentaje
(datos tomados de la Tabla 5 ..............................................................................................24

Figura 5. Concentraciones de los tres anticuerpos IgE alérgeno-específicos -


Histogramas de los puntajes-z (datos tomados de la Tabla 7)........................................27

Figura 6. Gráfico de probabilidad normal de los resultados de las determinaciones


del contenido de plomo en el agua por 162 laboratorios .................................................35

Figura 7. Gráfico de probabilidad normal de las incertidumbres expandidas para


las determinaciones del contenido de plomo en el agua por 156 laboratorios..............35

Figura 8. Histograma de los puntajes-z para una ronda de un ensayo de


aptitud (datos para el alérgeno d1 tomados de la Tabla 7) ..............................................38

Figura 9. Gráfico de barras de los puntajes-z (4,0 a -4,0) para una ronda de un ensayo
de aptitud en la cual los participantes determinaron las concentraciones de
tres anticuerpos IgE alérgeno-específicos (datos tomados de la Tabla 7).....................39

Figura 10. Gráfico de Youden de los puntajes-z tomados de la Tabla 10...........................43


NORMA TÉCNICA COLOMBIANA NTC 5755

Página

Figura 11. Gráfico de las desviaciones estándar frente a los promedios


para 25 laboratorios (datos tomados de la Tabla 13)........................................................48

Figura 12. Rangos de las determinaciones replicadas para el laboratorio X


(con los rangos calculados a partir de In concentraciones) ............................................51

Figura 13. Rangos de las determinaciones replicadas para el laboratorio Y


(con los rangos calculados a partir de In concentraciones) ............................................52

Figura 14. Diferencias entre los promedios del laboratorio Y - X


(con las diferencias calculadas a partir de In concentraciones) .....................................52

Figura 15. Gráficos de control Shewhart para los datos de un laboratorio para 20
rondas de un programa de ensayo de aptitud (datos tomados de la Tabla 16)..............................54

Figura 16. Cuadros de control Cusum de los datos de un laboratorio para 20 rondas
de un programa de ensayo de aptitud (datos tomados de la Tabla 16) ..........................55

Figura 17. Relación entre el puntaje-z y el nivel de concentración


para las determinaciones del alérgeno d1 en un laboratorio...........................................56

Figura 18. Puntajes-z de la glucosa en cuatro eventos de ensayo de aptitud ...................57

TABLAS

Tabla 1. Cálculo de la diferencia promedio entre un MRC y un MR y de la


incertidumbre estándar de esta diferencia ........................................................................10

Tabla 2. Concentraciones de los tres anticuerpos IgE alérgeno-específicos


(d1, f1 y e3) -Datos reportados por p = 27 laboratorios.....................................................13

Tabla 3. Concentraciones de los tres anticuerpos IgE alérgeno-específicos -


Cálculo del promedio y la desviación estándar robustos para el anticuerpo d1 ...........14

Tabla 4. Concentraciones de los tres anticuerpos IgE alérgeno-específicos


(d1, f1 y e3) - Estimados de los sesgos de laboratorio.....................................................23

Tabla 5. Concentraciones de los tres anticuerpos IgE alérgeno-específicos


(d1, f1 y e3) - Diferencias de porcentaje .............................................................................25

Tabla 6. Concentraciones de los tres anticuerpos IgE alérgeno-específicos


(d1, f1 y e3) - Rangos y rangos de porcentaje ...................................................................26
NORMA TÉCNICA COLOMBIANA NTC 5755

Página

Tabla 7. Concentraciones de los tres anticuerpos IgE alérgeno-específicos -


Puntajes-z ............................................................................................................................................ 28

Tabla 8. Determinaciones del contenido de plomo en el agua (mol/l x 1010)


para 181 laboratorios, junto con los valores para las incertidumbres
expandidas (U) de los resultados tal como estos laboratorios los reportaron ..............34

Tabla 9. Límites de acción y advertencia para los puntajes de desempeño......................37

Tabla 10. Datos y cálculos de las concentraciones de anticuerpos para dos


alérgenos similares ..............................................................................................................42

Tabla 11. Valores críticos para el coeficiente de correlación de rango..............................44

Tabla 12. Cálculo del coeficiente de correlación de rango para los datos tomados
de la Tabla 10..............................................................................................................................45

Tabla 13. Concentraciones de algunos anticuerpos en muestras de suero


(cuatro determinaciones replicadas en una muestra en cada laboratorio) ....................47

Tabla 14. Concentraciones de algunos anticuerpos en 21 muestras de suero.................50

Tabla 15. Concentraciones y estadísticas para los datos de la Tabla 14........................51

Tabla 16. Datos para 20 rondas de un programa de ensayo de aptitud que


involucra la determinación de la concentración de tres alérgenos (d1, f1 y e3) ............53

Tabla 17. Determinaciones de la concentración del alérgeno d1 en un laboratorio.........56


NORMA TÉCNICA COLOMBIANA NTC 5755

0. INTRODUCCIÓN

0.1 PROPÓSITOS DEL ENSAYO DE APTITUD

Este tipo de ensayo mediante comparaciones interlaboratorio se utiliza para determinar el


desempeño de laboratorios individuales en ensayos o mediciones específicas y para
monitorear el desempeño continuo de los laboratorios. Se recomienda consultar la introducción
de la guía GTC 55-1 (ISO/IEC GUÍA 43-1) para una explicación completa del propósito de los
ensayos de aptitud. En lenguaje estadístico, el desempeño de los laboratorios se puede
describir mediante tres propiedades: sesgo de laboratorio, estabilidad y repetibilidad. El sesgo y
la repetibilidad de laboratorio se definen en las normas NTC 2062-1 (ISO 3534-1), NTC 2062-2
(ISO 3534-2) y en la NTC 3529-1 (ISO 5725-1). La estabilidad de los resultados del laboratorio
se mide mediante la precisión intermedia definida en la NTC 3529-3 (ISO 5725-3).

El sesgo del laboratorio se puede evaluar mediante ensayos con materiales de referencia,
cuando éstos están disponibles, utilizando el procedimiento descrito en la NTC 3529-4 (ISO 5725-4).
De otro modo, el ensayo de aptitud mediante comparaciones interlaboratorio proporciona
medios generales disponibles para obtener información acerca del sesgo de laboratorio, y el
uso de los datos provenientes de los ensayos de aptitud para obtener estimaciones del sesgo
de laboratorio es un aspecto importante del análisis de tales datos. Sin embargo, la estabilidad
y la repetibilidad afectarán los datos que se obtienen en los ensayos de aptitud, de modo que
es posible que el laboratorio obtenga datos en una ronda de ensayos de aptitud que indiquen
sesgo causado en realidad por estabilidad o repetibilidad deficientes. Por lo tanto, es
importante evaluar con regularidad estos aspectos del desempeño de laboratorio.

La estabilidad se puede evaluar repitiendo el ensayo y conservando las muestras, o realizando


mediciones regulares en materiales de referencia o en materiales de referencia internos (una
reserva de material establecida por el laboratorio para ser utilizada como material de referencia
privado). Estas técnicas se describen en la NTC 3529-3 (ISO 5725-3). La estabilidad también
se puede evaluar trazando las estimaciones del sesgo de laboratorio derivadas de los ensayos
de aptitud en los gráficos de control. Esto puede brindar información sobre el desempeño de
laboratorio que no es aparente en el examen de los resultados de las rondas individuales de
diseños de ensayo de aptitud, y es otro aspecto importante del análisis de dichos datos.

Los datos adecuados para la evaluación de la repetibilidad se pueden generar mediante


ensayos que se realizan en el transcurso normal del trabajo de un laboratorio o mediante
ensayos adicionales realizados dentro del laboratorio específicamente para evaluar la
repetibilidad. En consecuencia, la evaluación de la repetibilidad no necesariamente es un
aspecto importante del ensayo de aptitud, aunque es importante que los laboratorios
controlen su repetibilidad de algún modo. La repetibilidad se puede evaluar trazando los
rangos de las mediciones por duplicado en un gráfico de control, como se describe en la
NTC 3529-6 (ISO 5725-6).

El diagrama de flujo (véase la Figura 1) ilustra la forma en que se deben aplicar las técnicas
descritas en esta norma.

i
NORMA TÉCNICA COLOMBIANA NTC 5755

0.2 GUÍA GTC 55 (PARTES 1 Y 2) (ISO/IEC GUIDE 43, ALL PARTS)

La GTC 55-1 (ISO/IEC GUIDE 43-1) describe diferentes tipos de diseños de ensayo de aptitud
y proporciona directrices sobre la organización y el diseño de tales diseños. La GTC 55-2
(ISO/IEC GUIDE 43-2) brinda directrices sobre la selección y el uso de los diseños de ensayo
de aptitud por parte de los organismos de acreditación de laboratorios. Estos documentos se
deberían consultar para obtener información detallada en estas áreas (esta información no se
duplica aquí). La GTC 55-1 (ISO/IEC GUIDE 43-1) contiene un anexo que describe brevemente
los métodos estadísticos que se utilizan en los diseños de ensayo de aptitud.

Esta norma es complementaria de la GTC 55 (Partes 1 y 2 - ISO/IEC 43 (All Parts)) y brinda


directrices detalladas que no están en dicho documento sobre el uso de los métodos
estadísticos en los ensayos de aptitud. Esta norma se basa en gran medida en un protocolo
armonizado para los ensayos de aptitud de los laboratorios analíticos, pero está prevista para
uso con todos los métodos de medición.

ii
NORMA TÉCNICA COLOMBIANA NTC 5755

Inicio

¿Se debe
determinar el valor
Verifique el método de NO
asignado y su
preparación de la muestra incertidumbre antes
utilizando el Anexo B del ensayo de
competencia?

SI

Aplique uno de: Aplique uno de:


5.2 Formulación 5.5 Valores por consenso de
5.3 Valores de referencia laboratorios expertos
certificados 5.6 Valor por consenso de los
5.4 Valores de referencia participantes

Determine la
desviación estándar
para la evaluación de
NO
competencia antes de
realizar el ensayo de
competencia

SI

Aplique uno de:


Verifique el método para determinar Aplique:
6.2 Valores prescritos
el valor asignado utilizando: 6.6 Apartir de los datos
6.3 Por percepción
4.2 Directrices para determinar la obtenidos en una ronda de un
6.4 A partir de un modelo general
incertidumbre de los valores programa de ensayo de
6.5 A partir de los resultados de
asignados competencia
un experimento de precisión

Verifique la cantidad de mediciones


replicadas que se van a utilizar Realice una ronda de
usando: programas de ensayos de
4.3 Directrices para la selección de competencia
la cantidad de mediciones replicadas

Calcule las estadísticas de


desempeño para la ronda
utilizando uno de:
7.1 Estimados del sesgo de
laboratorio
7.2 Diferencias de porcentaje
7.3 Rangos y rangos de
porcentaje
7.4 Puntajes - z
7.5 Números E n
7.6 Puntajes - z¹
7.7 Puntajes ζ
7.8 Puntajes E z

Cuando sea adecuado aplique: Presente de manera gráfica las Combine las estadísticas de
5.7 Comparación de los valores estadísticas de desempeño para la desempeño de varias rondas
asignados ronda utilizando uno o más de: utilizando uno de:
6.7 Comparación de los valores de 8.2 Histograma de los puntajes de 9.2 Gráfico de control Shewart
precisión derivados de un ensayo de desempeño para puntajes - z
competencia con los valores 8.3 Gráfico de barras de los 9.3 Gráfico de control Cusum para
establecidos sesgos normalizados de puntajes - z
laboratorio 9.4 Gráfico de los sesgos
8.4 Gráfico de barras de las normalizados de laboratorio frente
mediciones normalizadas de a los promedios del laboratorio
repetibilidad
8.5 Gráfico de Youden
8.6 Gráfico de las desviaciones
estándar de repetibilidad Informe los resultados a los
8.7 Muestras divididas participantes

Vuelva
al inicio

Figura 1. Diagrama de flujo que ilustra las actividades que requieren el uso de métodos estadísticos cuando
se realiza un programa de ensayo de aptitud

iii
NORMA TÉCNICA COLOMBIANA NTC 5755

MÉTODOS ESTADÍSTICOS PARA UTILIZAR EN ENSAYOS DE APTITUD


MEDIANTE COMPARACIONES INTERLABORATORIO

1. OBJETO Y CAMPO DE APLICACIÓN

Esta norma complementa a la GTC 55 (Partes 1 y 2), (ISO/IEC GUIDE 43 (todas las partes)) al
brindar descripciones detalladas de métodos estadísticos consistentes para que los
organizadores los utilicen en el análisis de los datos que se obtienen de diseños de ensayo de
aptitud, y proporciona recomendaciones sobre su utilización en la práctica por parte de los
participantes en tales diseños y por parte de los organismos de acreditación.

Esta norma se puede aplicar para demostrar que los resultados de las mediciones que se
obtienen en los laboratorios no presentan evidencia de un nivel inaceptable del sesgo.

Se aplica a datos cuantitativos pero no a datos cualitativos.

2. REFERENCIAS NORMATIVAS

Los siguientes documentos normativos referenciados son indispensables para la aplicación de


este documento normativo. Para referencias fechadas, se aplica únicamente la edición citada.
Para referencias no fechadas, se aplica la última edición del documento normativo referenciado
(incluida cualquier corrección).

NTC 2062-1, Estadística. Vocabulario y símbolos. Parte 1. Términos estadísticos generales y


términos utilizados en el cálculo de probabilidades. (ISO 3534-1 Statistics. Vocabulary and
Symbols. Part 1. General Statistic Terms and Terms Used in Probability).

NTC 2062-2, Estadística. Vocabulario y símbolos. Parte 2. Estadística aplicada. (ISO 3534-2
Statistics. Vocabulary and Symbols. Part 2. Applied Statistics).

NTC 3529-1, Exactitud -veracidad y precisión- de los métodos de medición y de los resultados.
Parte 1: Principios generales y definiciones. (ISO 5725-1, Accuracy (Trueness and Precision) of
Measurement Methods and Results. Part 1: General Principles and Definitions).

GTC 55-1, Ensayos de aptitud por comparaciones entre los laboratorios. Parte 1: Desarrollo y
funcionamiento de programas de ensayo de aptitud. (ISO/IEC Guide 43-1:1997, Proficiency
Testing by Interlaboratory Comparisons. Part 1: Development and Operation of Proficiency
Testing Schemes).

1 de 67
NORMA TÉCNICA COLOMBIANA NTC 5755

GTC 55-2, Ensayos de aptitud por comparaciones entre los laboratorios. Parte 2: Selección y
uso de programas de ensayo de aptitud por organismos de acreditación de laboratorios.

(ISO/IEC Guide 43-2, Proficiency Testing by Interlaboratory Comparisons. Part 2: Selection and
Use of Proficiency Testing Schemes by Laboratory Accreditation Bodies).

3. TÉRMINOS Y DEFINICIONES

Para los propósitos de este documento, se aplican los siguientes términos y definiciones y
aquellos que se encuentran en las NTC 2062-1 (ISO 3534-1), NTC 2062-2 (ISO 3534-2) e
NTC 3529-1 (ISO 5725-1).

3.1 Comparación interlaboratorio. Organización, ejecución y evaluación de ensayos o de


mediciones de elementos de ensayo iguales o similares por parte de dos o más laboratorios, de
acuerdo con condiciones predeterminadas.

NOTA Adoptada de la GTC 55-1 (ISO/IEC GUIDE 43-1).

3.2 Ensayo de aptitud. Determinación del desempeño del laboratorio de ensayo por medio de
comparaciones interlaboratorio.

3.3 Valor asignado. Valor que se atribuye a una cantidad particular y se acepta, algunas veces
por convención, que tiene una incertidumbre adecuada para un propósito determinado.

3.4 Desviación estándar para la evaluación de aptitud. Medida de la dispersión utilizada en


la evaluación de aptitud con base en la información disponible.

3.5 Puntaje-z. Medida normalizada del sesgo del laboratorio, calculada utilizando el valor
asignado y la desviación estándar para la evaluación de aptitud.

3.6 Coordinador. Organización (o persona) con responsabilidad de coordinar todas las


actividades implicadas en la operación de un diseño de ensayo de aptitud.

4. DIRECTRICES ESTADÍSTICAS PARA EL DISEÑO Y LA INTERPRETACIÓN DE LOS


ENSAYOS DE APTITUD

(Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), numeral 5.4.2)

4.1 SEÑALES DE ACCIÓN Y ADVERTENCIA

4.1.1 Esta norma describe algunos criterios numéricos o gráficos sencillos que se deberían
aplicar a los datos que se obtienen de los ensayos de aptitud para determinar si ellos originan
señales de acción o de advertencia. Incluso en un laboratorio que funciona correctamente, con
personal experimentado, en ocasiones se pueden obtener resultados anómalos. De igual
modo, es posible que un método normalizado de medición, aunque haya sido validado por un
experimento de precisión, pueda contener fallas que sean aparentes únicamente después de
varias rondas de un diseño de ensayos de aptitud. El diseño del ensayo de aptitud en sí puede
contener fallas. Por estos motivos, los criterios que se brindan aquí no se deben utilizar para
reprobar a los laboratorios considerando que no son adecuados para ejecutar el método de
medición que se somete a examen. Si el ensayo de aptitud se emplea para reprobar a los
laboratorios, entonces debe ser necesario implementar criterios adecuados para tal propósito.

2
NORMA TÉCNICA COLOMBIANA NTC 5755

4.1.2 Los criterios que se presentan aquí están diseñados de modo que, cuando la desviación
estándar para la evaluación de aptitud se basa en el desempeño observado (usando uno de los
métodos descritos en los numerales del 6.4 al 6.6), tales criterios brindan señales de acción
cuando los resultados son tan inusuales que ameritan investigación y acción correctiva.

4.1.3 El coordinador debería comprender las fuentes principales de variabilidad que se


pueden anticipar en los datos de ensayo de aptitud para la medición en cuestión. El primer
paso en cualquier análisis debería ser examinar la distribución de los resultados para
evidenciar las fuentes no anticipadas de variabilidad. Por ejemplo, una distribución bimodal
puede ser evidencia de una población combinada de resultados causada por métodos
diferentes, muestras contaminadas o instrucciones con redacción deficiente. En esta situación,
el problema se debería resolver antes de proseguir con el análisis o la evaluación. Los
organismos de acreditación deben tener políticas para responder ante el desempeño
inaceptable en los ensayos de aptitud. Las acciones de seguimiento están determinadas por
esa política o por los procedimientos de calidad del laboratorio. Sin embargo, existen acciones
que por lo común se recomiendan cuando un laboratorio produce un resultado inaceptable en
un ensayo de aptitud. Las directrices para las acciones por parte de los laboratorios en
respuesta a un desempeño fallido en un ensayo de aptitud se presentan en el numeral 4.1.4.

4.1.4 En diseños en los cuales la desviación estándar para la evaluación de aptitud se basa
en el desempeño observado, cuando un resultado proporciona una señal de acción, el
laboratorio debe decidir las investigaciones y las acciones correctivas que son correctas,
consultando al coordinador o al organismo de acreditación, si es necesario. A menos que exista
una razón válida para no hacerlo, el laboratorio debe examinar sus procedimientos e identificar
una o más acciones correctivas que, de acuerdo con el personal del laboratorio, probablemente
evite que se vuelva a presentar tal resultado. El laboratorio puede solicitar asesoría al
coordinador sobre las causas posibles de este problema o puede solicitarle al coordinador que
consulte a otros expertos. El laboratorio debe participar en nuevas rondas de ensayos de
aptitud para evaluar la eficacia de las acciones correctivas. Las acciones correctivas
adecuadas pueden ser las siguientes:

a) verificar que el personal entiende y cumple los procedimientos de medición;

b) verificar que todos los detalles del procedimiento de medición son correctos;

c) verificar la calibración del equipo y la composición de los reactivos;

d) reemplazar el equipo o los reactivos sospechosos de falla;

e) realizar ensayos comparativos de personal, el equipo y/o los reactivos con otro
laboratorio.

La utilización de los resultados de los ensayos de aptitud por parte de los organismos de
acreditación de laboratorios se describe en la GTC 55-2 (ISO/IEC GUIDE 43-2):1997, numeral 6.

4.2 DIRECTRICES PARA DETERMINAR LA INCERTIDUMBRE DEL VALOR ASIGNADO

El valor asignado X tiene una incertidumbre estándar uX que depende del método que se utilice
para derivarlo y también, cuando se deriva de ensayos en varios laboratorios, depende del
número de laboratorios y, tal vez de otros factores. Los métodos para calcular la incertidumbre
estándar del valor asignado se presentan en el numeral 5.

La desviación estándar para el ensayo de aptitud σˆ , se utiliza para evaluar el tamaño de los
estimados del sesgo del laboratorio hallados en un ensayo de aptitud. Los métodos para
3
NORMA TÉCNICA COLOMBIANA NTC 5755

obtener la desviación estándar para el ensayo de aptitud se presentan en el numeral 6 y los


criterios para compararlo con los estimados del sesgo del laboratorio en el numeral 7.

Si la incertidumbre estándar del valor asignado uX es demasiado grande en comparación con la


desviación estándar para el ensayo de aptitud σˆ , entonces existe el riesgo de que algunos
laboratorios reciban señales de acción y advertencia debido a la inexactitud en la
determinación del valor asignado, y no por alguna causa dentro del laboratorio. Por esta razón,
la incertidumbre estándar del valor asignado se debe establecer e informar a los laboratorios
que participan en los diseños de ensayos de aptitud (véase GTC 55-1 (ISO/IEC GUIDE 43-1),
A.1.4 y A.1.6).

Si

u X ≤ 0,3 σˆ (1)

Entonces la incertidumbre del valor asignado es insignificante y no es necesario incluirla en la


interpretación de los resultados del ensayo de aptitud.

Si no se cumplen estas directrices, entonces el coordinador debe considerar los siguientes


aspectos:

a) buscar un método para determinar el valor asignado cuya incertidumbre cumpla las
directrices anteriores;

b) usar la incertidumbre del valor asignado en la interpretación de los resultados del


ensayo de aptitud (véase el numeral 7.5 sobre los números En o el numeral 7.6 sobre el
puntaje-z');

c) informar a los participantes en el ensayo de aptitud que la incertidumbre del valor


asignado no es insignificante.

EJEMPLO Suponga que el valor asignado X se determina como el promedio x de los resultados de los
ensayos en 11 laboratorios y que la desviación estándar para el ensayo de aptitud se determina como la desviación
estándar s de estos mismos 11 resultados, de modo que σ̂ = s . Como primera aproximación, la incertidumbre
estándar del valor asignado en esta situación se puede estimar mediante u X = S / 11 = 0,3 s , de modo que
aparentemente se cumple el requisito. Sin embargo, el requisito no se puede cumplir en esta situación con menos de
11 laboratorios. Además, la incertidumbre del valor asignado será superior a s / 11 si las muestras carecen de
homogeneidad o estabilidad, o si existe un factor que produzca un sesgo común en los resultados de los laboratorios
(por ejemplo, si todos ellos utilizan la misma norma de referencia).

4.3 DIRECTRICES PARA SELECCIONAR LA CANTIDAD DE MEDICIONES


REPLICADAS

La variación de la repetibilidad contribuye a la variación entre los sesgos de laboratorio en un


ensayo de aptitud. Si la variación de la repetibilidad es demasiado grande en comparación con
la desviación estándar para el ensayo de aptitud, entonces existe el riesgo de que la variación
de la repetibilidad produzca resultados erráticos del ensayo de aptitud. En esta situación, un
laboratorio podría tener un sesgo grande en una ronda, pero no en la siguiente, y tendrá
dificultad para identificar la causa.

Por este motivo, cuando se considera deseable limitar la influencia de la variación de la


repetibilidad, la cantidad de mediciones replicadas n hechas por el laboratorio en el ensayo de
aptitud se debe elegir de manera tal que:

4
NORMA TÉCNICA COLOMBIANA NTC 5755

σ r / n ≤ 0,3 σˆ (2)

en donde

σr es la desviación estándar de la repetibilidad que se ha establecido en un experimento


interlaboratorio previo.

La justificación para el factor de 0,3 es que cuando se cumple este criterio, la desviación
estándar de la repetibilidad contribuye en menos de 10 % de la desviación estándar para el
ensayo de aptitud.

De igual modo, todos los laboratorios deben llevar a cabo la misma cantidad de mediciones
replicadas. (Los métodos de análisis que se indican posteriormente en esta norma asumen que
se cumple este requisito). Si no se cumple la desigualdad del requisito de la ecuación (2),
entonces la cantidad de mediciones replicadas se debe incrementar, o los resultados del
ensayo de aptitud se deben interpretar con precaución.

Este enfoque asume que los laboratorios generalmente tienen repetibilidad similar. Se pueden
presentar casos en que esto no sea así. En tales eventos, para los métodos descritos en ésta
norma que se han de aplicar, se puede utilizar el siguiente recurso. El coordinador debería fijar
la cantidad de mediciones replicadas n, usando un valor típico para la desviación estándar de la
repetibilidad. Después, cada laboratorio debería verificar que se cumple la desigualdad de la
ecuación (2) con su propia desviación estándar de la repetibilidad. Si no es así, entonces el
laboratorio debería modificar su procedimiento de medición de manera que obtenga un
resultado de ensayo como el promedio de una cantidad de determinaciones seleccionadas
para cumplir la desigualdad de la ecuación (2).

4.4 HOMOGENEIDAD Y ESTABILIDAD DE LAS MUESTRAS (Véase la GTC 55-1


(ISO/IEC GUIDE 43-1), 5.6.2 y 5.6.3)

En el Anexo B se proporcionan los métodos para verificar que las muestras que se van a
utilizar en un ensayo de aptitud tienen la homogeneidad y estabilidad adecuadas.

Cuando se utiliza un método de separación de la muestra de modo tal que no se cumple el


criterio de homogeneidad del Anexo B, entonces los participantes deben someter a ensayo las
muestras replicadas, o la desviación estándar para el ensayo de aptitud debe incluir una
tolerancia para la heterogeneidad de las muestras, tal como se describe en el Anexo B.

4.5 MÉTODOS DE MEDICIÓN DEFINIDOS OPERATIVAMENTE

Con un método de medición definido operativamente, el resultado de la medición está definido


por el procedimiento de medición. Por ejemplo, la distribución del tamaño de un material en
particular se puede determinar utilizando tamices con orificios cuadrados o redondos. Puede no
existir una buena razón de porqué se debería preferir un tipo de tamiz, pero a menos que se
especifique el tipo de tamiz, los laboratorios que utilicen diferentes tamices pueden obtener
resultados diferentes. Si un participante utiliza un método diferente de aquél utilizado para
establecer el valor asignado, entonces sus resultados pueden presentar sesgo cuando no se
presenta falla en la ejecución.

Si los participantes tienen la libertad de elegir entre los métodos definidos operativamente,
ningún consenso válido puede ser evidente entre ellos. Dos recursos están disponibles para
resolver este problema:

5
NORMA TÉCNICA COLOMBIANA NTC 5755

a) cuando los participantes utilizan un método normalizado de manera rutinaria, éste se


utiliza para establecer el valor asignado y se instruye a los participantes para que lo
utilicen en el ensayo de aptitud;

b) se produce un valor separado del valor asignado para cada método que se utiliza.

Una situación similar se presenta cuando se especifica el mensurando, pero no el


procedimiento, y se debe hacer la misma elección.

4.6 INFORME DE DATOS (Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), Numeral 6.2.3)

Para los propósitos de los cálculos que se requieren en el ensayo de aptitud, se recomienda
que los resultados de mediciones individuales no se aproximen (redondeen) en más de σr/2.

Se debe solicitar a los participantes que informen los valores reales de sus resultados de
medición. Los resultados de medición no se deben truncar (es decir, los resultados no se debe
reportar en forma de "<0,1" o "menor que el límite de detección"). De igual modo, cuando se
observa un resultado negativo, se debe reportar el valor negativo real (es decir, los resultados
no se deben reportar como cero aunque lógicamente el resultado de la medición no puede ser
negativo). Se debe informar a los participantes que si ellos reportan resultados truncados sobre
una muestra, o ceros, cuando los resultados son negativos entonces todos los datos para esa
muestra se excluirán del análisis. Si es necesario, el formulario utilizado para informar los
resultados puede contener un cuadro que permita al participante indicar que un resultado está
por debajo del límite de detección.

4.7 PERÍODO DE VALIDEZ DE LOS RESULTADOS DE LOS ENSAYOS DE APTITUD

El periodo de validez del resultado obtenido por un laboratorio en una sola ronda de un diseño
de ensayos de aptitud se limita al tiempo en que el laboratorio llevó a cabo el ensayo. De este
modo, si un laboratorio logra un resultado satisfactorio en una sola ronda, el resultado no se
debe utilizar para sustentar una declaración de que el laboratorio obtuvo datos confiables en
ninguna otra ocasión.

Un laboratorio que opera un sistema de calidad y logra una historia de resultados satisfactorios
en muchas rondas de un diseño de ensayo de aptitud se debe autorizar para utilizar los
resultados como evidencia de que puede obtener datos consistentemente confiables.

5. DETERMINACIONES DEL VALOR ASIGNADO Y SU INCERTIDUMBRE ESTÁNDAR

5.1 SELECCIÓN DEL MÉTODO PARA DETERMINAR EL VALOR ASIGNADO

En los numerales 5.2 a 5.6 se describen cinco maneras de determinar el valor asignado X. La
selección entre estos métodos debe ser responsabilidad del coordinador, según la consulta con
expertos técnicos tal como se describe en la GTC 55-1 (ISO/IEC GUIDE 43-1). No es probable
que los métodos descritos en estos párrafos sean aplicables cuando la cantidad de laboratorios
participantes en el diseño es pequeña. Los métodos para calcular la incertidumbre estándar, uX,
del valor asignado suministrados en ésta sección comúnmente serán adecuados para las
aplicaciones para las cuales se utilizan en esta norma. Se pueden utilizar métodos alternos
siempre que tengan una base estadística sólida y que el método utilizado este descrito en un
plan documentado para el diseño.

La determinación del valor asignado debe ser responsabilidad del coordinador. El valor
asignado no se debe divulgar a los participantes hasta que ellos hayan reportado sus

6
NORMA TÉCNICA COLOMBIANA NTC 5755

resultados al coordinador. El coordinador debe preparar un informe que presente detalles de la


manera como se obtuvo el valor asignado, las identidades de los laboratorios implicados en
esta determinación y las declaraciones de trazabilidad e incertidumbre de la medición del valor
asignado.

El documento GTC 51 (Guide to the expression of uncertainty in measurement) suministra


directrices sobre la evaluación de la incertidumbres de medición.

Esta norma recomienda el uso de métodos estadísticos robustos cuando se considera que su
uso es más adecuado (por ejemplo, como se indica en los numerales 5.5 y 5.6). Como
alternativa, se pueden utilizar procedimientos que implican la detección y eliminación de datos
atípicos siempre que tengan una base estadística sólida y que el método utilizado sea
reportado. La NTC 3529-2 (ISO 5725-2) presenta directrices sobre el uso de ensayos para
estos datos atípicos.

5.2 FORMULACIÓN [Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), A.1.1, ítem a)]

5.2.1 Generalidades

El material de ensayo se puede preparar mediante la mezcla de constituyentes en proporciones


específicas o con la adición de unas proporciones específicas de un constituyente a un material
base. En este caso, el valor asignado X se deriva mediante cálculo a partir de las masas
utilizadas.

El enfoque es especialmente útil cuando las muestras individuales se pueden preparar de este
modo y es la proporción de constituyentes o de la adición lo que se debe determinar: no es
necesario entonces preparar una cantidad de gran volumen ni garantizar que es homogénea.
Sin embargo cuando la formulación suministra muestras en que la adición se mezcla con más
deficiencia que los materiales típicos, o de una manera diferente, puede ser preferible utilizar
otro enfoque.

5.2.2 Incertidumbre estándar uX del valor asignado

Cuando el valor asignado se calcula a partir de la formulación del material de ensayo, la


incertidumbre estándar se determina mediante la combinación de las incertidumbres utilizando
el enfoque descrito en el documento GTC 51 (Guide to the expression of uncertainty in
measurement). Por ejemplo, en el análisis químico las incertidumbres usualmente serán
aquellas asociadas con las mediciones volumétricas y gravimétricas.

La limitación de este método (en el análisis químico) es que es necesario tener cuidado de
garantizar que:

a) el material base efectivamente está libre de constituyentes adicionados, o que se


conoce con exactitud la proporción del constituyente adicionado en el material base;

b) los constituyentes se mezclan juntos de manera homogénea (cuando esto se requiere);

c) todas las fuentes de error están identificadas (por ejemplo, no siempre se tiene en
cuenta que el vidrio absorbe los componentes de mercurio, de modo que la
concentración de una solución acuosa de mercurio se puede ver alterada por su
recipiente);

d) no hay interacción entre los constituyentes y la matriz.

7
NORMA TÉCNICA COLOMBIANA NTC 5755

5.2.3 Ejemplo: determinación del contenido de cemento del concreto endurecido

En este caso, las muestras de concreto se pueden preparar mediante pesaje de las cantidades
de los constituyentes (cemento, agregados y agua) y mezclándolos para formar cada muestra
de concreto. El enfoque es satisfactorio por la exactitud con la que se pueden preparar los
especímenes, la cual es muy superior a aquella del método analítico utilizado para determinar
el contenido de cemento.

5.3 VALORES DE REFERENCIA CERTIFICADOS [Véase la GTC 55-1 (ISO/IEC GUIDE


43-1), A.1.1, ítem b)]

5.3.1 Generalidades

Cuando el material utilizado en un ensayo de aptitud es un material de referencia certificado


(MRC), su valor de referencia certificado se utiliza como el valor asignado X.

5.3.2 Incertidumbre estándar uX del valor asignado

Cuando se utiliza un material de referencia certificado como material de ensayo, la


incertidumbre estándar del valor asignado se deriva de la información sobre la incertidumbre
suministrada en el certificado.

La limitación de este enfoque es que puede ser costoso proporcionar a cada participante en el
ensayo de aptitud una muestra de material de referencia certificado.

5.3.3 Ejemplo: “valor Los Ángeles” de los agregados

El "valor Los Ángeles" es una medición de la resistencia mecánica de los agregados que se
utilizan para la construcción de vías, y los resultados del ensayo se miden en "unidades LA". En
un ejercicio para certificar un material de referencia, se preparó una gran cantidad de muestras
de un agregado particular y algunas de estas muestras se utilizaron en un experimento
interlaboratorio que involucró a 28 laboratorios, permitiendo establecer un valor asignado de
XMRC = 21,62 unidades LA con una incertidumbre estándar de uX;MRC = 0,26 unidades LA. Las
muestras restantes de este agregado se podrían utilizar en ensayos de aptitud.

5.4 VALORES DE REFERENCIA [Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), A.1.1, ítem c)]

5.4.1 Generalidades

En este enfoque, las muestras del material de ensayo que van servir de material de referencia
(MR) se preparan primero, se alistan para distribuir a los participantes. Luego, se selecciona
una cantidad de muestras aleatoriamente y se someten a ensayo junto con los materiales de
referencia certificados, en un laboratorio, utilizando un método de medición adecuado y en
condiciones de repetibilidad (como se definen en la NTC 2062-2 (ISO 3534-2)). El valor
asignado XMR del material de ensayo se deriva luego a partir de la calibración con respecto a
los valores de referencia certificados de los MRC.

5.4.2 Incertidumbre estándar uX del valor asignado

Cuando el valor asignado de un material de ensayo se deriva de los resultados de una serie de
ensayos en dicho material y en el MRC, la incertidumbre estándar del valor asignado se deriva
de estos resultados y las incertidumbres de los valores de referencia certificados de los MRC.
Si el material de ensayo y el MRC no son similares (en matriz, composición, y nivel de
resultados), entonces también se debe incluir la incertidumbre que se origina por ello.
8
NORMA TÉCNICA COLOMBIANA NTC 5755

Este método permite establecer el valor asignado de forma tal que pueda ser fácil de trazar a
los valores certificados del MRC, con una incertidumbre estándar que se puede calcular, y evita
el costo de distribuir el MRC a todos los participantes. Estos son buenos motivos para preferirlo
a otros métodos. Sin embargo, el método asume que no existe interacción entre los materiales
utilizados y las condiciones de ensayo.

El ejemplo que se indica en el numeral 5.4.3 ilustra la forma en que se puede calcular la
incertidumbre requerida en el caso sencillo en que el valor asignado de un material de ensayo
se establece mediante comparación directa con un solo MRC.

5.4.3 Ejemplo: valores Los Ángeles de agregados

El material de referencia certificado descrito en el ejemplo de 5.3 se puede usar para


determinar el valor asignado para un MR que es otro agregado similar. Esta determinación
requiere una serie de ensayos, en un laboratorio, en muestras de dos agregados, utilizando el
mismo método de medición y en condiciones de repetibilidad.

Si
XMRC es el valor asignado para el MRC

XMR es el valor asignado para el MR

Di es la diferencia (MR - MRC) entre los resultados promedio para el MR y el MRC en la i-ésima muestra

D es el promedio de las diferencias Di

Entonces

X MR = X MRC + D (3)

La incertidumbre estándar del valor asignado del MR se puede calcular como:

u X ;MR = u X ; MRC 2 + u D
2
(4)

La Tabla 1 brinda un ejemplo de datos que se podrían obtener en tal serie de ensayos y
presenta la forma en que se calcula la incertidumbre estándar uD de la diferencia.

Con estos resultados,

XMR = 21,62 + 1,73 = 23,35 unidades LA (5)


y

u X ; RM = 0,26 2 + 0,24 2 = 0,35 unidades LA (6)

Donde 0,26 es la incertidumbre estándar del valor asignado para MRC (dado en el ejemplo del
numeral 5.3) y 0,24 es la incertidumbre estándar de D .

9
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 1. Cálculo de la diferencia promedio entre un MRC y un MR y de la incertidumbre


estándar de esta diferencia

MR MRC Diferencia en los


Muestra valores promedio
Ensayo 1 Ensayo 2 Ensayo 1 Ensayo 2
MR - MRC
Unidades LA Unidades LA Unidades LA Unidades LA
Unidades LA
1 20,5 20,5 19,0 18,0 2,00
2 21,1 20,7 19,8 19,9 1,05
3 21,5 21,5 21,0 21,0 0,50
4 22,3 21,7 21,0 20,8 1,10
5 22,7 22,3 20,5 21,0 1,75
6 23,6 22,4 20,3 20,3 2,70
7 20,9 21,2 21,5 21,8 -0,60
8 21,4 21,5 21,9 21,7 -0,35
9 23,5 23,5 21,0 21,0 2,50
10 22,3 22,9 22,0 21,3 0,95
11 23,5 24,1 20,8 20,6 3,10
12 22,5 23,5 21,0 22,0 1,50
13 22,5 23,5 21,0 21,0 2,00
14 23,4 22,7 22,0 22,0 1,05
15 24,0 24,2 22,1 21,5 2,30
16 24,5 24,4 22,3 22,5 2,05
17 24,8 24,7 22,0 21,9 2,80
18 24,7 25,1 21,9 21,9 3,00
19 24,9 24,4 22,4 22,6 2,15
20 27,2 27,0 24,5 23,7 3,00
1,73
Diferencia promedio, D 1,07
Desviación estándar
Incertidumbre estándar de D (desviaciones estándar / √20) 0,24
NOTA Los datos son mediciones de la resistencia mecánica del agregado, obtenidos a partir del ensayo Los
Ángeles (LA).

5.5 VALORES POR CONSENSO DE LABORATORIOS EXPERTOS [Véase la GTC 55-1


(ISO/IEC GUIDE 43-1), A.1.1, ítem d)]

5.5.1 Generalidades

Al igual que en el enfoque para los valores de referencia (véase el numeral 5.4), las muestras
del material de ensayo se preparan primero, listas para distribución a los participantes. Algunas
de estas muestras se seleccionan después aleatoriamente y se analizan por parte de un grupo
de laboratorios expertos. Como alternativa, el grupo de laboratorios expertos puede participar
en una ronda de un diseño de ensayo de aptitud, cuando el valor asignado y su incertidumbre
se van a derivar después de terminar la ronda. El valor asignado X se calcula como el promedio
robusto de los resultados reportados por el grupo de laboratorios expertos, calculado utilizando
el algoritmo A del Anexo C.

Se pueden utilizar otros métodos de cálculo en lugar del algoritmo A, siempre que tengan una
base estadística probada y que el informe describa el método que se utiliza.

5.5.2 Incertidumbre estándar del valor asignado uX

Cuando cada uno de los laboratorios expertos p reportan una medición xi en el material de
ensayo junto con un estimado ui de la incertidumbre estándar de la medición, y el valor
asignado X se calcula como un promedio robusto utilizando el algoritmo A, la incertidumbre
estándar del valor asignado X se estima como:

10
NORMA TÉCNICA COLOMBIANA NTC 5755

∑u
1,25 2
uX = x i
p
i =1

Cuando los laboratorios expertos no reportan incertidumbres estándar, o cuando estas


incertidumbres no se validan de manera independiente (por ejemplo por un organismo de
acreditación de laboratorios) la incertidumbre estándar del valor asignado se debe estimar
como se describe en el numeral 5.6.

NOTA El factor de 1,25 representa la relación entre la desviación estándar de la mediana y la desviación estándar
de la media aritmética, para muestras grandes (p >10) a partir de una distribución normal. Para datos con
distribución normal, la desviación estándar de un promedio robusto calculado utilizando el algoritmo del Anexo C no
se conoce, pero estará en algún sitio entre la desviación estándar de la media aritmética y la desviación estándar de
la mediana, de modo tal que la fórmula proporciona un estimado conservador de la incertidumbre estándar uX.
Para p < 10, el factor adecuado es inferior a 1,25 de manera que la fórmula es doblemente conservadora.

Las limitaciones de este enfoque son que puede existir un sesgo desconocido en los resultados
del grupo de laboratorios expertos y que las incertidumbres declaradas pueden no ser
confiables.

5.5.3 Ejemplo: análisis petrográfico de los agregados

Este enfoque se puede utilizar cuando las muestras de agregados se deben distribuir y los
participantes deben determinar la composición petrográfica de las muestras. La clasificación de
los agregados exige habilidad y experiencia y no hay materiales de referencia disponibles, de
modo que, en este caso, el consenso de un grupo pequeño de expertos puede ser la mejor
forma de establecer los valores asignados.

5.6 VALOR POR CONSENSO DE LOS PARTICIPANTES [Véase la GTC 55-1


(ISO/IEC GUIDE 43-1), A.1.1, ítem e)]

5.6.1 Generalidades

Con este enfoque, el valor asignado X para el material de ensayo utilizado en una ronda del
diseño de ensayo de aptitud es el promedio robusto de los resultados reportados por todos los
participantes en la ronda, calculados utilizando el algoritmo A del Anexo C.

Se pueden usar otros métodos de cálculo en lugar del algoritmo A, siempre y cuando tengan
una base estadística probada y el informe describa el método que se utiliza. Por ejemplo, el
cálculo en C.1 se puede detener en la ecuación (53) cuando se obtiene la mediana, y la
desviación absoluta de la mediana se puede utilizar en lugar de C.2.

Este enfoque puede ser particularmente útil con un método de medición definido
operativamente, siempre que este método esté normalizado.

5.6.2 Incertidumbre estándar del valor asignado uX

Cuando el valor asignado se deriva como un promedio robusto calculado utilizando el algoritmo A,
la incertidumbre estándar del valor asignado X se estima como:

u X = 1,25 × s * / p (8)

En donde s* es la desviación estándar robusta de los resultados calculados utilizando el


algoritmo A del Anexo C. (Aquí un "resultado" para un participante es el promedio de todas sus
mediciones en el material de ensayo).
11
NORMA TÉCNICA COLOMBIANA NTC 5755

Las limitaciones de éste enfoque son:

a) puede no existir consenso real entre los participantes;

b) el consenso puede estar sesgado por el uso general de la metodología fallida y éste
sesgo no se reflejará en la incertidumbre estándar del valor asignado calculado como se
describió anteriormente.

Ninguna de estas condiciones es rara en la determinación de constituyentes traza.

5.6.3 Ejemplo: concentraciones de anticuerpos

La Tabla 2 suministra datos de una ronda de un ensayo de aptitud en la cual se determinaron


las concentraciones de tres anticuerpos IgE (inmunoglobulina E) para alérgeno-específicos. La
Figura 2 ilustra estos mismos datos en histogramas.

Para aplicar el algoritmo A, primero los datos se clasifican en orden ascendente, se calculan los
estimados robustos iniciales del promedio y la desviación estándar y luego se aplica el método
iterativo del algoritmo. La Tabla 3 suministra estos cálculos para los resultados del anticuerpo
IgE (inmunoglobulina E) alérgeno-específico d1 a partir de la Tabla 2.

Los cálculos que se requiere en el algoritmo A se pueden llevar a cabo en una hoja de cálculo
de la siguiente manera:

a) Paso 1: ingrese los datos en una columna, en orden ascendente, como se ilustra en la
Tabla 3 para la repetición 0. Calcule su promedio y desviación estándar (10,91 y 3,13 en
la Tabla 3). Calcule los valores iniciales para el promedio robusto y la desviación
estándar robusta (10,85 y 3,53 en la Tabla 3) utilizando la fórmula que se indica en el
literal C.1.

b) Paso 2: copie los datos en la columna siguiente, como se ilustra en la Tabla 3 para la
repetición 1. Utilice los valores iniciales para el promedio robusto y la desviación estándar
robusta para calcular los valores de interrupción (5,56 y 16,15 en la Tabla 3) utilizando la
fórmula que se indica en el literal C.1. Reemplace los datos que están por fuera de los
valores de interrupción por los valores de interrupción (2,18 se reemplaza por 5,56 y 16,30
se reemplaza con 16,15). Calcule el nuevo promedio y la nueva desviación estándar de
los datos alterados (11,03 y 2,81 en la Tabla 3). De acuerdo con la fórmula que se indica
en el Anexo C, el promedio robusto es igual a este promedio (11,03) y la desviación
estándar robusta (3,19) se obtiene multiplicando la desviación estándar por 1,134.

c) Paso 3: con una hoja de cálculo, no es necesario crear columnas adicionales de datos.
En lugar de ello, cambie el cálculo de los valores de interrupción en la parte superior de
la segunda columna de datos de tal forma que utilicen el promedio robusto y la
desviación estándar robusta tomados del fondo de la misma columna. Esto suministrará
los valores de interrupción (6,24 y 15,82) que se ilustra en la Tabla 3 bajo la repetición 2.
El cálculo se puede terminar entonces continuando el reemplazo de los datos que están
por fuera de los valores de interrupción con los valores de interrupción hasta que las
repeticiones converjan. Cuando los datos se han reemplazado, la hoja de cálculo
actualizará automáticamente los promedios, las desviaciones estándar y los valores de
interrupción, pero los cambios en estos valores se volverán cada vez más pequeños
hasta que ya no sean significativos.

Los promedios robustos y desviaciones estándar robustas para los otros dos anticuerpos IgE
alérgeno-específicos se calculan de manera similar.

12
NORMA TÉCNICA COLOMBIANA NTC 5755

Es interesante observar que el resultado del laboratorio P para d1 no se clasifica como dato atípico
o rezagado en la prueba de Grubbs. De este modo, si uno confía en el uso de las pruebas atípicas
que se describen en la NTC 3529-2 (ISO 5725-2) en este ejemplo, el promedio y la desviación
estándar se calculan a partir de todos los datos, produciendo los valores que se indican para la
repetición 0 en la Tabla 3. Con el método robusto, el resultado bajo para el laboratorio P y los
resultados altos para los laboratorios D, U y Z no tienen influencia en los valores de los estimados
robustos. Los gráficos de barras (véase la Figura 9 en el numeral 8.3) identifican los resultados de
algunos laboratorios que ameritan investigación. Por ejemplo, en la Figura 9, se puede ver que el
laboratorio Z proporciona puntajes-z positivos grandes en todos los tres niveles.

Tabla 2. Concentraciones de los tres anticuerpos IgE alérgeno-específicos (d1, f1 y e3) -


Datos reportados por p = 27 laboratorios

Concentraciones
Laboratorio d1 f1 e3
kU/l kU/l kU/l
A 11,30 1,69 5,02
B 8,29 0,74 2,52
C 11,90 2,23 5,15
D 15,60 1,76 5,15
E 13,40 1,91 4,84
F 12,50 1,71 4,54
G 10,40 1,88 5,94
H 9,38 1,14 3,50
I 14,20 1,74 4,48
J 12,10 2,39 4,75
K 8,10 3,10 3,70
L 10,80 1,39 4,70
M 13,80 1,52 5,59
N 7,00 1,50 3,40
O 10,85 1,80 2,80
P 2,18 2,52 1,88
Q 8,39 1,83 3,80
R 6,95 1,92 3,52
S 11,80 1,58 4,86
T 10,90 0,80 2,80
U 16,30 2,39 5,60
V 9,71 1,21 3,33
W 10,50 1,93 5,35
X 13,60 2,23 5,53
Y 10,10 1,63 3,18
Z 16,07 2,69 8,22
a 8,47 2,16 4,64
p 27 27 27
Promedio robusto x* 11,03 1,83 4,35
Desviación estándar
3,04 0,50 1,25
robusta s*
NOTA Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad
está definida por la concentración de un material de referencia internacional.

13
NORMA TÉCNICA COLOMBIANA NTC 5755

20,0 4,0 10,0

DUZ Z
15,0 3,0 K 7,5
IMX
EF PZ
CJS JU G
ALOTW CXa MUWX
10,0 GVY 2,0 ERW 5,0 ACDES
H DFGIOQ FIJLa
BKQa AMSY Q
NR LN HKNRV
HV OTY
5,0 1,0 2,5 B
BT P

0,0 0,0 0,0


Alérgeno d1 Alérgeno f1 Alérgeno e3

NOTA 1 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está
definida por la concentración de un material de referencia internacional.

NOTA 2 Los valores numéricos de la Tabla 2 son aquellos que se obtendrán cuando el cálculo se realiza
manualmente trabajando hasta dos cifras decimales.

Figura 2. Concentraciones de los tres anticuerpos IgE alérgeno-específicos - Histogramas de los datos
reportados (datos tomados de la Tabla 2)

Tabla 3. Concentraciones de los tres anticuerpos IgE alérgeno-específicos - Cálculo del promedio y la
desviación estándar, robustos para el anticuerpo d1

Repetición 0 1 2 3 4 5
δ = 1,5 s * - 5,30 4,79 4,62 4,58 4,56
x * −δ - 5,56 6,24 6,41 6,45 6,47
x *+δ - 16,15 15,82 15,65 15,61 15,59
P 2,18 5,56 6,24 6,41 6,45 6,47
R 6,95 6,95 6,95 6,95 6,95 6,95
N 7,00 7,00 7,00 7,00 7,00 7,00
K 8,10 8,10 8,10 8,10 8,10 8,10
B 8,29 8,29 8,29 8,29 8,29 8,29
Q 8,39 8,39 8,39 8,39 8,39 8,39
a 8,47 8,47 8,47 8,47 8,47 8,47
H 9,38 9,38 9,38 9,38 9,38 9,38
V 9,71 9,71 9,71 9,71 9,71 9,71
Y 10,10 10,10 10,10 10,10 10,10 10,10
G 10,40 10,40 10,40 10,40 10,40 10,40
W 10,50 10,50 10,50 10,50 10,50 10,50
L 10,80 10,80 10,80 10,80 10,80 10,80
O 10,85 10,85 10,85 10,85 10,85 10,85
T 10,90 10,90 10,90 10,90 10,90 10,90
A 11,30 11,30 11,30 11,30 11,30 11,30
S 11,80 11,80 11,80 11,80 11,80 11,80
C 11,90 11,90 11,90 11,90 11,90 11,90
J 12,10 12,10 12,10 12,10 12,10 12,10
F 12,50 12,50 12,50 12,50 12,50 12,50
Continúa . . .

14
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 3. (Final)
1
Repetición 0 1 2 3 4 5
E 13,40 13,40 13,40 13,40 13,40 13,40
X 13,60 13,60 13,60 13,60 13,60 13,60
M 13,80 13,80 13,80 13,80 13,80 13,80
I 14,20 14,20 14,20 14,20 14,20 14,20
D 15,60 15,60 15,60 15,60 15,60 15,59
Z 16,07 16,07 15,82 15,65 15,61 15,59
U 16,30 16,15 15,82 15,65 15,61 15,59
Promedio 10,91 11,03 11,03 11,03 11,03 11,03
Desviación
3,13 2,81 2,72 2,69 2,68 2,68
estándar
Nuevo valor de x* 10,85 11,03 11,03 11,03 11,03 11,03
Nuevo valor de s* 3,53 3,19 3,08 3,05 3,04 3,04
NOTA Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está
definida por la concentración de un material de referencia internacional.

5.7 COMPARACIÓN DEL VALOR ASIGNADO

Cuando se utilizan los métodos descritos en los numerales 5.2 a 5.4 para establecer el valor
asignado X, después de cada ronda de un diseño de ensayo de aptitud, el promedio robusto x*
derivado de los resultados de la ronda se debe comparar con el valor asignado. Cuando se
utilizan los métodos descritos en los numerales 5.5 y 5.6 para establecer el valor asignado, el
valor se debe comparar, cuando sea posible, con un valor de referencia obtenido por un
laboratorio competente. La incertidumbre estándar de la diferencia x* - X se debe estimar como:

(1,25 s *)2 + uX 2
p

en donde

s* es la desviación estándar robusta;

p es la cantidad de laboratorios.

Si la diferencia es más del doble de esta incertidumbre, se debe buscar la razón. Algunas
razones posibles son:

- sesgo en el método de medición;

- sesgo común en los resultados de los laboratorios;

- falla al apreciar las limitaciones del método cuando se utiliza el método de formulación
descrito en el enfoque numeral 5.2;

- sesgo en los resultados de los "laboratorios expertos" cuando se utiliza el enfoque del
"valor por consenso de los laboratorios expertos", y

- método(s) sesgados del participante o varios laboratorios sesgados cuando se utiliza la


media robusta por consenso como valor asignado.

15
NORMA TÉCNICA COLOMBIANA NTC 5755

5.8 VALORES FALTANTES

Cuando la cantidad de mediciones replicadas n en un ensayo de aptitud es de dos o más, el


primer paso en el análisis de los resultados será calcular el promedio y la desviación estándar
de los resultados de cada laboratorio. Luego se utilizan los promedios, por ejemplo, para
calcular las estadísticas de desempeño que se describen en el numeral 7 y para elaborar
histograma o gráfico de barras como las que se describen en los numerales 8.2 y 8.3. Las
desviaciones estándar se utilizan, por ejemplo, para elaborar gráficos de medidas de
repetibilidad como se describe en los numerales 8.4 y 8.6.

Aunque todos los participantes pueden tener la intención de obtener la misma cantidad de
mediciones replicadas, tal vez no todos ellos informen esta cantidad de mediciones, por
ejemplo, si algunos ensayos se dañan y no se pueden repetir. Se recomienda el siguiente
procedimiento cuando esto sucede.

Cuando un laboratorio reporta por lo menos de 0,59n mediciones replicadas, entonces el


promedio y la desviación estándar de sus mediciones se deben incluir en los cálculos y se
deben tratar como si ellos hubiesen reportado n mediciones. El informe debe indicar cuántas
mediciones se reportaron.

Cuando un laboratorio reporta menos de 0,59n mediciones replicadas, entonces sus resultados
no se deben incluir en el cálculo de las estadísticas que afectan a otros laboratorios. Por
ejemplo, sus resultados no se deben incluir en el cálculo del valor asignado como se describe
en el numeral 5.6, ni en el cálculo de la desviación estándar para la evaluación de aptitud que
se describe en el numeral 6.6. Sus resultados se pueden utilizar para calcular sus propias
estadísticas de desempeño como se describe en el numeral 7, o se pueden incluir en los
gráficos que se describen en el numeral 8, pero el informe debe establecer cuantas mediciones
se reportaron y que éstas fueron menores que la cantidad que requiere el diseño.

NOTA La justificación para el multiplicador de 0,59 es la siguiente. La desviación estándar del promedio de n
mediciones replicadas es σr / √n. Si la cantidad de mediciones replicadas se reduce, esta desviación estándar se
incrementa de modo que si la cantidad real de mediciones replicadas se reduce de n a 0,59n, la desviación estándar
se incrementa en un factor de 1,3.

Se puede considerar que esto está en la línea límite de un incremento aceptable en la desviación estándar. Utilizar
el límite de 0,59n evitará así que el incremento en la desviación estándar sea mayor que esto. Existe claramente un
grado de arbitrariedad en el criterio utilizado para derivar esta regla de modo que el coordinador lo puede variar
consultando a los miembros del diseño, si así lo desea.

6. DETERMINACIÓN DE LA DESVIACIÓN ESTÁNDAR PARA LA EVALUACIÓN DE


APTITUD (Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), A.2.1.3)

6.1 MÉTODO DE SELECCIÓN

En los numerales 6.2 a 6.6 se describen cinco enfoques para el problema de determinar la
desviación estándar para la evaluación de aptitud. La elección entre estos métodos debe ser
responsabilidad del coordinador, en consulta con los miembros del diseño y cualquier
organismo de acreditación pertinente, y se deben tener en cuenta todas las reglamentaciones
correspondientes. No es probable que el método descrito en el numeral 6.6 sea aplicable
cuando la cantidad de laboratorios participantes en el diseño es pequeña. La determinación de
la desviación estándar debe ser responsabilidad del coordinador. Él debe preparar un informe
que brinde detalles de la forma en que se obtuvo la desviación estándar.

16
NORMA TÉCNICA COLOMBIANA NTC 5755

NOTA La GTC 55-1 (ISO/IEC GUIDE 43-1) utiliza el símbolo s para la desviación estándar de la evaluación de
aptitud. Esto es consistente con el uso normal cuando representa una desviación estándar de la muestra. En esta
norma, la desviación estándar para la evaluación de aptitud en algunas ocasiones se deriva mediante otros
métodos, de modo que es más indicado representarla con otro símbolo. Aquí se ha elegido el símbolo σˆ .

6.2 VALOR PRESCRITO

6.2.1 Generalidades

La desviación estándar para la evaluación de aptitud se puede establecer en un valor requerido


para una tarea específica de interpretación de datos, o se puede derivar a partir de un requisito
indicado en la legislación.

Este enfoque tiene la ventaja de que la desviación estándar para la evaluación de la aptitud se
relaciona directamente con una declaración de "aptitud para el propósito" del método de
medición.

6.2.2 Ejemplo: aflatoxinas en nueces, productos de nueces, higos secos, y productos


de higos secos

Existe una legislación que establece que un método utilizado para el ensayo de aflatoxinas
debería tener un coeficiente de reproducibilidad de variación no superior a 50 % cuando el
límite reglamentario es de 10 μg/kg. De este modo, si se utiliza un material de ensayo en un
diseño de ensayo de aptitud con un contenido de aflatoxinas de 10 μg/kg, entonces la
legislación implica que la desviación estándar de la reproducibilidad con este material no
debería ser superior a 5 μg/kg. En este caso, sería conveniente establecer la desviación
estándar para la evaluación de aptitud en 5 μg/kg.

6.3 POR PERCEPCIÓN

6.3.1 Generalidades

La desviación estándar para la evaluación de aptitud se podría establecer en un valor que


corresponda al nivel de desempeño que el coordinador y los miembros del diseño desearían
que los laboratorios pudieran lograr.

Con éste enfoque, la desviación estándar para la evaluación de la aptitud se hace equivalente
a la declaración de "aptitud para el propósito" para el método de medición.

Cuando la desviación estándar para la evaluación de la aptitud σˆ se elige mediante


prescripción o por percepción, es posible que el valor seleccionado no sea realista con
respecto a la reproducibilidad del método de medición. Se puede utilizar el siguiente método
para verificar que el valor seleccionado es realista, siempre y cuando la información sobre la
repetibilidad y la reproducibilidad del método esté disponible.

Si:

σR es la desviación estándar de la reproducibilidad, y

σr es la desviación estándar de la repetibilidad,

17
NORMA TÉCNICA COLOMBIANA NTC 5755

Calcule la desviación estándar interlaboratorio, σL así:

σ L = σ R2 − σ r2 (9)

Y a continuación calcule el valor del factor φ sustituyendo los valores de σL y σr y el valor


elegido para σˆ en la ecuación (10)

σˆ = (φ x σ L )2 (
+ σ r2 / n ) (10)

donde n es la cantidad de mediciones replicadas que cada laboratorio debe realizar.

Si el valor que se encuentra para φ es pequeño (es decir φ < 0,5), esto implica que el valor
seleccionado para σˆ corresponde a un nivel de reproducibilidad que los laboratorios no
pueden lograr en la práctica.

6.3.2 Ejemplo 1: medición de glucosa en suero humano

Suponga que se acepta que los laboratorios médicos deberían poder determinar los niveles de
glucosa en sangre en una tolerancia de ± 10 % del valor asignado, aunque es aceptable una
tolerancia de ± 6 mg/dl para concentraciones extremadamente bajas (por debajo de 60 mg/dl).
Esta información se puede utilizar para calcular la desviación estándar para la evaluación de la
aptitud como se indica a continuación:

a) para valores asignados X inferiores a 60 mg/dl y la tolerancia aceptable de ± 6 mg/dl:

σ̂ = 6,0 / 3,0 = 2,0 mg/dl,

b) para valores asignados X superiores a 60 mg/dl y la tolerancia de ± 10 % del valor


asignado:

σ̂ = 0,1 X / 3,0 = 0,033 X mg/dl,

El factor de 3,0 introducido aquí corresponde al valor crítico de 3,0 utilizado en la interpretación
de los puntajes-z (véase el numeral 7.4 y la ecuación 19).

6.3.3 Ejemplo 2: determinación del contenido de cemento del concreto endurecido

Por lo general, el contenido de cemento del concreto se mide en términos de masa en


kilogramos de cemento por metro cúbico de concreto (es decir, en kg/m3). En la práctica, el
concreto se produce en grado de calidad que tienen contenidos de cemento con diferencia de
25 kg/m3 y es conveniente que los laboratorios puedan identificar el grado correctamente. Por
esta razón, conviene que el valor seleccionado de σˆ no sea mayor a la mitad de 25 kg/m3. Un
experimento de precisión produjo los siguientes resultados, para un concreto con un contenido
de cemento promedio de 260 kg/m3: σR = 23,2 kg/m3 y σr = 14,3 kg/m3.

σ L = 23,2 2 − 14,32 = 18,3 kg / m 3 (11)

Tomando n como 2 y sustituyendo σL = 18,3 kg/m3, σr = 14,3 kg/m3 y σˆ = 12,5 kg/m3 en la


ecuación (10) tenemos:

18
NORMA TÉCNICA COLOMBIANA NTC 5755

12,5 = (18,3 φ )2 (
+ 14,32 / 2 ) (12)

A partir de la cual se puede calcular que φ = 0,40. De este modo, elegir σˆ = 12,5 kg/m3 implica
que los laboratorios pueden lograr una desviación estándar interlaboratorio inferior en un factor
de 0,4 a aquella que se encuentra en el experimento de precisión. Esto es claramente irreal.

6.4 A PARTIR DE UN MODELO GENERAL

6.4.1 Generalidades

El valor de la desviación estándar para el ensayo de aptitud se puede derivar a partir de un


modelo general para la reproducibilidad del método de medición.

La desventaja de este enfoque es que la reproducibilidad verdadera de un método de medición


en particular puede diferir significativamente del valor dado por el modelo, puesto que el uso de
un método general implica que la reproducibilidad depende únicamente del nivel del
mensurando y no del mensurando, el procedimiento de medición ni el tamaño de la muestra.

6.4.2 Ejemplo: curva de Horwitz

Horwitz proporciona un modelo general para la reproducibilidad de métodos analíticos que se


puede utilizar para derivar la siguiente expresión para la desviación estándar de la
reproducibilidad:

σR = 0,02c0,8495 (13)

en donde c es la concentración de las especies químicas que se deben determinar en


porcentaje (fracción de masa).

6.5 A PARTIR DE LOS RESULTADOS DE UN EXPERIMENTO DE PRECISIÓN

6.5.1 Generalidades

Cuando el método de medición que se va a utilizar en el diseño de ensayo de aptitud está


normalizado y está disponible la información sobre la repetibilidad y la reproducibilidad del
método, la desviación estándar para la evaluación de aptitud σˆ se puede calcular utilizando
esta información de la siguiente manera:

Si:

σR es la desviación estándar de la reproducibilidad, y

σr es la desviación estándar de la repetibilidad,

calcule la desviación estándar interlaboratorio así:

σ L = σ R2 − σ r2 (14)

Y calcule la desviación estándar para la evaluación de aptitud así:

(
σˆ = σ L2 + σ r2 / n ) (15)

19
NORMA TÉCNICA COLOMBIANA NTC 5755

en donde

n es la cantidad de mediciones replicadas que cada laboratorio debe realizar en una ronda del
diseño.

Cuando las desviaciones estándar de la repetibilidad y la reproducibilidad dependen del valor


promedio de los resultados de ensayo, las relaciones funcionales tendrán que derivarse con
otros métodos descritos en la NTC 3529-2 (ISO 5725-2). Estas relaciones deberían utilizarse
para calcular los valores de las desviaciones estándar de la repetibilidad y la reproducibilidad
adecuados al valor asignado que se va a utilizar en el ensayo de aptitud.

6.5.2 Ejemplo: determinación del contenido de cemento del concreto endurecido

Con los mismos datos utilizados en el ejemplo del numeral 6.3, la ecuación (15) produce una
desviación estándar para el ensayo de aptitud igual a:

( )
σˆ = 18,32 + 14,32 / 2 = 20,9 kg / m 3 (16)

Asumiendo que n = 2 mediciones replicadas que se deben realizar.

6.6 A PARTIR DE LOS DATOS OBTENIDOS EN UNA RONDA DEL DISEÑO DE


ENSAYO DE APTITUD

6.6.1 Generalidades

Con éste enfoque, la desviación estándar σˆ utilizada para evaluar la eficiencia de los
participantes en una ronda de un diseño se deriva de los resultados reportados por los
participantes en la misma ronda. La desviación estándar debe ser la desviación estándar
robusta de los resultados reportados por todos los participantes, calculados utilizando el
algoritmo A del Anexo C. En este contexto, el resultado reportado por un participante debe ser
el promedio de n mediciones replicadas obtenidas por el participante en la ronda.

Se pueden utilizar otros métodos de cálculo en lugar del algoritmo A, siempre que tengan una
base estadística sólida y que el informe describa el método que se utiliza.

Una desventaja de este enfoque es que el valor de σˆ puede variar significativamente de una
ronda a otra, dificultando utilizar los valores de puntaje-z por parte de un laboratorio que busca
tendencias que persisten en varias rondas. Esta desventaja se puede solucionar en un diseño
establecido utilizando valores combinados robustos de las desviaciones estándar derivadas de
una cantidad de rondas, calculados utilizando el algoritmo S del Anexo C.

6.6.2 Ejemplo: concentraciones de anticuerpos

Las Tablas 2 y 3 suministran un ejemplo de este enfoque.

6.7 COMPARACIÓN DE LOS VALORES DE PRECISIÓN DERIVADOS DE UN ENSAYO


DE APTITUD CON VALORES ESTABLECIDOS

Como una verificación del desempeño de los participantes y para medir el beneficio del diseño
para los participantes, se recomienda que el coordinador aplique el siguiente procedimiento.
Los resultados obtenidos en cada ronda de un diseño de ensayo de aptitud se deberían utilizar
para calcular los estimados de las desviaciones estándar de la repetibilidad y la
reproducibilidad del método de medición, utilizando los métodos robustos descritos en la
NTC 3529-5 (ISO 5725-5). Estos estimados se deberían trazar en gráficas series-tiempo, junto
20
NORMA TÉCNICA COLOMBIANA NTC 5755

con los valores de las desviaciones estándar de repetibilidad y reproducibilidad obtenidos en


los experimentos de precisión (si están disponibles).

El coordinador debería entonces examinar estas gráficas. Si ellas muestran que los valores de
precisión obtenidos en el ensayo de aptitud difieren en un factor de 2 o más con respecto a los
valores obtenidos en el experimento de precisión, entonces se recomienda que el coordinador
investigue el motivo. Si los gráficos muestran que la precisión del método de medición no
mejora con el tiempo entonces esto sugiere que:

- Los laboratorios participantes no están investigando las causas de las señales de acción
y advertencia o no están implementando correctamente las acciones correctivas;

- los laboratorios participantes no pueden identificar las causas de las señales de acción y
advertencia;

- el método está en un estado de control estadístico y las conclusiones confiables se


pueden basar en los datos proporcionados por el método.

7. CÁLCULO DE LA ESTADÍSTICA DE DESEMPEÑO

7.1 ESTIMADOS DEL SESGO DE LABORATORIO [Véase la GTC 55-1 (ISO/IEC GUIDE
43-1), A.2.1.4 ítem a)]

7.1.1 Generalidades

Supongamos que x representa el resultado (o el promedio de los resultados) reportado por un


participante para la medición de una característica del material de ensayo en una ronda de un
diseño ensayo de aptitud.

Entonces un estimado del sesgo D del laboratorio, cuando se mide esa característica, se puede
calcular así:

D = x − X (17)

en donde X es el valor asignado.

No se recomienda usar las estadísticas de desempeño que involucran el valor absoluto D del
sesgo de laboratorio o D2 porque ellas cancelan el signo del sesgo.

7.1.2 Interpretación de los sesgos de laboratorio


Cuando un participante reporta un resultado que suministra una elevación del sesgo del
laboratorio superior a 3,0 σˆ o menos de -3,0 σˆ , entonces se debe considerar que el resultado
da una "señal de acción". De igual modo, un sesgo del laboratorio por encima de 2,0 σˆ o por
debajo de -2,0 σˆ se debe considerar que indica una "señal de advertencia". Una "señal de
acción" única en una ronda o dos "señales de advertencia" en rondas sucesivas, se deben
tomar como evidencia de que se ha presentado una anomalía que requiere investigación. Este
criterio es equivalente a aquel que se indica en el numeral 7.4 para puntajes-z en el sentido de
que indicarán las mismas señales de acción y advertencia.
La justificación para el uso aquí de los multiplicadores de 2,0 y 3,0 (y en los otros criterios
similares que se indican posteriormente) es el siguiente. Si X y σˆ son buenos estimados de la
media y de la desviación estándar de la población de la cual se derivaron los valores x y la

21
NORMA TÉCNICA COLOMBIANA NTC 5755

distribución subyacente es normal, entonces los valores D estarán distribuidos de forma


aproximadamente normal con una media de cero y una desviación estándar σˆ . En estas
circunstancias, sólo se esperaría que aproximadamente 0,3 % de los sesgos estimados del
laboratorio estén fuera de el rango de -3,0 σˆ < D < 3,0 σˆ y únicamente 5 %
aproximadamente estarían en el rango entre -2,0 σˆ < D < 2,0 σˆ . Dado que estas
probabilidades son muy bajas, no es probable que las señales de acción se presenten por
casualidad cuando no existe un problema real, de modo que existe una oportunidad razonable
de identificar la razón para una anomalía cuando se da una señal de acción.

Cuando la desviación estándar para la evaluación de aptitud está fijada por cualquiera de los
métodos descritos en los numerales 6.2, 6.3 ó 6.4, ésta puede diferir significativamente de la
desviación estándar de la reproducibilidad y las probabilidades de 0,3 % y 5,0 % ya no se
aplican más.

Cuando la desviación estándar de la evaluación de aptitud se fija mediante cualquiera de los


métodos descritos en los numerales 6.2 ó 6.3, puede ser útil que los participantes utilicen las
estadísticas correctas de desempeño de manera tal que se pueda hacer una comparación
directa con el requisito de desempeño percibido o prescrito. Por ejemplo, en el caso del
ejemplo del numeral 6.3, en donde la meta para el error en las muestras de glucosa es ± 10 %
del valor asignado, se puede seguir el ejemplo, derivar una desviación estándar para la
evaluación de aptitud de 3,33 %, calcular los puntajes-z y continuar con 74. De forma
equivalente, se puede calcular el sesgo del laboratorio como la diferencia de porcentaje (como
se describe en el numeral 7.2) y comparar los directamente con la meta de 10 %.

7.1.3 Ejemplo: concentraciones de anticuerpos

La Tabla 4 presenta los resultados de la aplicación de este método a los datos tomados de la
Tabla 2, y la Figura 3 ilustra los histogramas de los estimados de los sesgos del laboratorio. La
comparación de las Figuras 1 y 2 muestra que los sesgos del laboratorio tienen la misma
distribución de los datos originales (aparte de los efectos pequeños debidos a la aproximación),
pero se centran en cero.
10,0 2,0 5,0

Z
K
5,0 DUZ 1,0 2,5
Z
IMX JPU GU
E CXa CDMWX
CFJS AEJLSa
0,0 ALOT 0,0 DEGIOQRW 0,0 FI
GVWY AFSY KQ
H LMN HNRVY
BKQa HV OT
NR B
-5,0 -1,0 BT -2,5 P

P
-10,0 -2,0 -5,0
Alérgeno d1 Alérgeno f1 Alérgeno e3

NOTA Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está definida
por la concentración de un material de referencia internacional.

Figura 3. Concentraciones de los tres anticuerpos IgE alérgeno-específicos - Histogramas de los estimados
de los sesgos del laboratorio (datos tomados de la Tabla 4)

22
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 4. Concentraciones de los tres anticuerpos IgE alérgeno-específicos (d1, f1 y e3) - Estimados de los
sesgos de laboratorio

Concentraciones
Laboratorio d1 f1 e3
kU/l kU/l kU/l
A 0,27 -0,14 0,67
B -2,74 -1,09W -1,83
C 0,87 0,40 0,80
D 4,57 -0,07 0,80
E 2,37 0,08 0,49
F 1,47 -0,12 0,19
G -0,63 0,05 1,59
H -1,65 -0,69 -0,85
I 3,17 -0,09 0,13
J 1,07 0,56 0,40
K -2,93 1,27 W -0,65
L -0,23 -0,44 0,35
M 2,77 -0,31 1,24
N -4,03 -0,33 -0,95
O -0,18 -0,03 -1,55
P -8,85 W 0,69 -2,47
Q -2,64 0,00 -0,55
R -4,08 0,09 -0,83
S 0,77 -0,25 0,51
T -0,13 -1,03 W -1,55
U 5,27 0,56 1,25
V -1,32 -0,62 -1,02
W -0,53 0,10 1,00
X 2,57 0,40 1,18
Y -0,93 -0,20 -1,17
Z 5,04 0,86 3,87 A
a -2,56 0,33 0,29
3,0 σ̂ 9,12 1,50 3,75
2,0 σ̂ 6,08 1,00 2,50
-2,0 σ̂ -6,08 -1,00 -2,50
-3,0 σ̂ -9,12 -1,50 -3,75
NOTA 1 Cuando se siguen los datos de concentración, A = señal de acción y W = señal de advertencia.

NOTA 2 Los sesgos del laboratorio en esta tabla se han derivado de los datos presentados en la Tabla 2,
utilizando los promedios robustos de la Tabla 2 como valores asignados para los tres niveles. Los límites
de acción y advertencia que se muestran en el fondo de la tabla se han calculado, utilizando las
desviaciones estándar robustas de la Tabla 2, como las desviaciones estándar para la evaluación de
aptitud.

NOTA 3 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad
está definida por la concentración de un material de referencia internacional.

7.2 DIFERENCIAS DE PORCENTAJES [Véase la GTC 55-1 (ISO/IEC GUIDE 43-1),


A.2.1.4 ítem b)]

7.2.1 Generalidades

Con la anotación indicada en el numeral 7.1, las diferencias de porcentajes se calculan así:

D % = 100 (x − X ) / X (18)

23
NORMA TÉCNICA COLOMBIANA NTC 5755

7.2.2 Interpretación de las diferencias de porcentaje

Las diferencias de porcentaje se deben interpretar utilizando guías equivalentes a aquellas


dadas para el sesgo del laboratorio en el numeral 7.1, es decir, cuando un participante reporta
un resultado que da origen a la diferencia de porcentaje por encima de 300 σ/X % por debajo
de -300 σ/X %, entonces se debe considerar que el resultado da una "señal de acción". De
igual modo, se debe considerar que una diferencia de porcentaje por encima de 200 σ/X % por
debajo de -200 σ/X % da una “señal de advertencia”. Una "señal de acción" única en una ronda
o "señales de advertencia" en dos rondas sucesivas, se deben tomar como evidencia de que se
ha presentado una anomalía que requiere investigación.

7.2.3 Ejemplo: concentraciones de anticuerpos

La Tabla 5 ilustra los resultados de la aplicación de este método a los datos de la Tabla 2, y la
Figura 4 muestra los histogramas de las diferencias de porcentajes. La comparación de las
Figuras 1 y 3 muestra que las diferencias de porcentaje tienen la misma distribución de los
datos originales (aparte de los efectos pequeños debidos a la aproximación), pero están
centrados en cero, igual que sucede con los estimados de los sesgos del laboratorio.

100,0 100,0 100,0


Z

50,0 UZ 50,0 Z 50,0


D P G
IM JU MUX
EX CXa CDW
CFJS RW AEJLSa
0,0 ALOT 0,0 DEGOQ 0,0 FI
GHVW Y AFISY KQ
Qa LMN HNRV
BK V Y
NR H BOT
-50,0 -50,0 -50,0
BT P

P
-100,0 -100,0 -100,0
Alérgeno d1 Alérgeno f1 Alérgeno e3

NOTA Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está definida
por la concentración de un material de referencia internacional.

Figura 4. Concentraciones de los tres anticuerpos IgE alérgeno-específicos (d1, f1 y e3) - Histogramas de las
diferencias de porcentaje (datos tomados de la Tabla 5)

24
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 5. Concentraciones de los tres anticuerpos IgE alérgeno-específicos (d1, f1 y e3) - Diferencias en
porcentaje

Laboratorio Diferencia en porcentaje


d1 f1 e3
% % %
A 2 -8 15
B -25 -60 W -42
C 8 22 18
D 41 -4 18
E 21 4 11
F 13 -7 4
G -6 3 37
H -15 -38 -20
I 29 -5 3
J 10 31 9
K -27 69 W -15
L -2 -24 8
M 25 -17 29
N -37 -18 -22
O -2 -2 -36
P -80 W 28 -57
Q -24 0 -13
R -37 5 -19
S 7 -14 12
T -1 -56 -36
U 48 31 29
V -12 -34 -23
W -5 5 23
X 23 22 27
Y -8 -11 -27
Z 46 47 89 A
a -23 18 7
300 σ̂ / X 82,7 82,0 86,2
200 σ̂ / X 55,1 54,6 57,5
-200 σ̂ / X -55,1 -54,6 -57,5
-300 σ̂ / X -82,7 -82,0 -86,2
NOTA 1 Cuando se siguen los datos de concentración, A = señal de acción y W = señal de Advertencia.

NOTA 2 Las diferencias de porcentaje en esta tabla se han derivado de los datos presentados en la
Tabla 2, utilizando los promedios robustos de la Tabla 2 como valores asignados para los tres niveles. Los
límites de acción y advertencia que se muestran en el fondo de la tabla se han calculado, utilizando las
desviaciones estándar robustas de la Tabla 2, como las desviaciones estándar para la evaluación de
aptitud.

7.3 RANGOS Y RANGOS DE PORCENTAJE [Véase la GTC 55-1 (ISO/IEC GUIDE 43-1),
A.2.1.4 ítem c)]

7.3.1 Generalidades

Con los resultados de p laboratorios en una ronda de un ensayo de aptitud, los rangos se
derivan asignando el rango de 1 al laboratorio que reporta el resultado más bajo, asignando 2
al laboratorio que reporta el siguiente resultado más bajo y así sucesivamente hasta que al
laboratorio que reporta el resultado más alto se le asigna el rango de p. Si dos o más resultados
son iguales, a ellos se les asigna el mismo rango promedio. Por ejemplo, en la Tabla 2, los
laboratorios C y X reportaron ambos una concentración de 2,23 para f1. Ellos comparten los
rangos 21 y 22, de modo que en la Tabla 6 a ambos se les asigna el rango de 21,5. Si la
prueba involucra varios mensurandos, se asignan rangos a cada mensurando por separado.

25
NORMA TÉCNICA COLOMBIANA NTC 5755

Si los rangos se denominan i = 1, 2 …, p, entonces los rangos de porcentaje se calculan como


100 (i - 0,5) / p%. En la Tabla 6 se presenta un ejemplo del cálculo de los rangos de porcentaje.

7.3.2 Interpretación de los rangos y los rangos de porcentaje

La interpretación de los rangos y los rangos de porcentaje no implica asumir que los datos
cumplen una distribución particular de probabilidades y su derivación no utiliza el valor
designado ni la desviación estándar para la evaluación de aptitud. Por esto, los rangos y los
rangos de porcentaje brindan un método sencillo para identificar los laboratorios que reportan
los resultados más extremos. Son de particular utilidad en las primeras rondas de un diseño de
aptitud cuando se pueden utilizar para identificar los laboratorios en donde es más probable
que se logren mejoras en el desempeño. Sin embargo, se recomienda observar la advertencia
que se encuentra en la GTC 55-1 (ISO 43-1), numeral 6.6.5: "el reporte del desempeño
asignando rangos a los laboratorios en una tabla de acuerdo con su desempeño no se
recomienda en los ensayos de aptitud. Por lo tanto, la asignación de rango se debería utilizar
con precaución extrema ya que puede ser errada y abierta a mala interpretación".

Tabla 6. Concentraciones de los tres anticuerpos IgE alérgeno-específicos (d1, f1 y e3) -Rangos
y rangos de porcentaje

Rango Rango de porcentaje


Laboratorio d1 f1 e3
d1 f1 e3
% % %
A 16 10 19 57 35 69
B 5 1 2 17 2 6
C 18 21,5 20,5 65 78 74
D 25 13 20,5 91 46 74
E 21 17 17 76 61 61
F 20 11 13 72 39 46
G 11 16 26 39 57 94
H 8 3 8 28 9 28
I 24 12 12 87 43 43
J 19 23,5 16 69 85 57
K 4 27 10 13 98 35
L 13 5 15 46 17 54
M 23 7 24 83 24 87
N 3 6 7 9 20 24
O 14 14 3,5 50 50 11
P 1 25 1 2 91 2
Q 6 15 11 20 54 39
R 2 18 9 6 65 31
S 17 8 18 61 28 65
T 15 2 3,5 54 6 11
U 27 23,5 25 98 85 91
V 9 4 6 31 13 20
W 12 19 22 43 69 80
X 22 21,5 23 80 78 83
Y 10 9 5 35 31 17
Z 26 26 27 94 94 98
a 7 20 14 24 72 50

7.4 PUNTAJES-z [Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), A.2.1.4 ítem d)

7.4.1 Generalidades

Con la misma anotación del numeral 7.2, el puntaje-z se calcula así:

z = ( x − X ) / σ̂ (19)

26
NORMA TÉCNICA COLOMBIANA NTC 5755

en donde

σ̂ es la desviación estándar para la evaluación de aptitud.

NOTA La GTC 55 (ISO/IEC 43) utiliza el símbolo s para la desviación estándar en la definición del puntaje-z. Esto
es correcto cuando esta cantidad se deriva como desviación estándar de una cantidad de resultados, pero no en
otros casos (por ejemplo, cuando se calcula a partir de los resultados de un experimento de precisión, o por
referencia a un modelo general como se indica en el numeral 6 .4).

7.4.2 Interpretación de los puntajes-z

Cuando un participante reporta un resultado que da origen a un puntaje-z por encima de 3,0 o
por debajo de -3,0, entonces se debe considerar que el resultado da una "señal de acción". De
igual modo, se debe considerar que un puntaje-z por encima de 2,0 o por debajo de -2,0 da una
“señal de advertencia”. Una "señal de acción" única o "señales de advertencia" en dos rondas
sucesivas, se deben tomar como evidencia de que se ha presentado una anomalía que
requiere investigación.

Con diseños de ensayo de aptitud que implican cantidades muy grandes de laboratorios (por
ejemplo más de 100 laboratorios), se pueden utilizar gráficas de probabilidad normal como las
que se indican en el numeral 7.9, en la Figura 6 o en ambas, para complementar la
interpretación de los puntajes-z. En el otro extremo, cuando únicamente hay una cantidad
pequeña de laboratorios (por ejemplo menos de 10 laboratorios), no se puede dar ninguna
señal. En este caso, los métodos gráficos que combinan los puntajes de varias rondas
suministrarán indicaciones más útiles del desempeño de los laboratorios que los resultados de
las rondas individuales.

7.4.3 Ejemplo: concentraciones de anticuerpos

Los puntajes-z derivados utilizando los promedios y las desviaciones estándar robustas
calculadas como se indica en la Tabla 2 se presentan en la Tabla 7 y como histogramas en la
Figura 5. La comparación de las Figuras 1 a 4 muestra que los puntajes-z tienen la misma
distribución de los datos originales (aparte de los efectos pequeños debido a la aproximación),
pero se centra en cero, igual que los estimados de los sesgos del laboratorio.

4,0 4,0 4,0

3,0 3,0 3,0 Z


K
2,0 2,0 2,0
DUZ PZ G
1,0 EIMX 1,0 CJUX 1,0 MUWX
CFJS a ACDEJLS
0,0 AGLOTW 0,0 DEFGIOQRW 0,0 FIa
HVY AMNSY HKQR
-1,0 BKQa -1,0 LV -1,0 NOTVY
NR H B
-2,0 -2,0 BT -2,0 P

-3,0 P -3,0 -3,0

-4,0 -4,0 -4,0


Alérgeno d1 Alérgeno f1 Alérgeno e3

Figura 5. Concentraciones de los tres anticuerpos IgE alérgeno-específicos - Histogramas de los puntajes-z
(datos tomados de la Tabla 7)

27
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 7. Concentraciones de los tres anticuerpos IgE alérgeno-específicos (d1, F1- Puntajes-z

Puntaje-z
Laboratorio
d1 f1 e3
A 0,09 -0,28 0,54
B -0,90 -2,18 W -1,46
C 0,29 0,80 0,64
D 1,50 -0,14 0,64
E 0,78 0,16 0,39
F 0,48 -0,24 0,15
G -0,21 0,10 1,27
H -0,54 -1,38 -0,68
I 1,04 -0,18 0,10
J 0,35 1,12 0,32
K -0,96 2,54 W -0,52
L -0,08 -0,88 0,28
M 0,91 -0,62 0,99
N -1,33 -0,66 -0,76
O -0,06 -0,06 -1,24
P -2,91 W 1,38 -1,98
Q -0,87 0,00 -0,44
R -1,34 0,18 -0,66
S 0,25 -0,50 0,41
T -0,04 -2,06 W -1,24
U 1,73 1,12 1,00
V -0,43 -1,24 -0,82
W -0,17 0,20 0,80
X 0,85 0,80 0,94
Y -0,31 -0,40 -0,94
Z 1,66 1,72 3,10 A
a -0,84 0,66 0,23
NOTA 1 Cuando se siguen los datos de concentración, A = señal de acción y W = señal de advertencia.

NOTA 2 Los puntajes-z en esta tabla se han derivado de los datos presentados en la Tabla 2, utilizando
los promedios robustos de la Tabla 2 como valores asignados para los tres niveles. Los límites de acción y
advertencia que se muestran en el fondo de la tabla se han calculado, utilizando las desviaciones estándar
robustas de la Tabla 2, como las desviaciones estándar para la evaluación de aptitud. La fórmula para el
puntaje-z de este ejemplo es z = ( x − X ) / σˆ = ( x − x *) / s * .

7.5 NÚMEROS En [Véase la GTC 55-1 (ISO/IEC GUIDE 43-1), A.2.1.4 ítem e)]

Esta estadística de desempeño se calcula así:

x−X
En =
2 2
U lab + U ref

en donde

X es el valor asignado determinado en un laboratorio de referencia;

U ref es la incertidumbre expandida de X,

U lab es la incertidumbre expandida del resultado x de un participante.

En contraste con los valores críticos de 2,0 y 3,0 utilizados con los puntajes-z, es común utilizar
un valor crítico de 1,0 con los números En. Esto se debe a que éstos números se calculan
utilizando las incertidumbres expandidas en el denominador en lugar de las desviaciones
estándar.

28
NORMA TÉCNICA COLOMBIANA NTC 5755

NOTA 1 Los números En se deberían utilizar con precaución cuando existe la posibilidad de que los participantes
tengan un conocimiento deficiente de su incertidumbre y no la puedan reportar de manera uniforme. Sin embargo, la
incorporación de información sobre la incertidumbre en la interpretación de los resultados de los ensayos de aptitud
puede jugar un papel importante en la mejoras de su comprensión de este tema difícil.

Cuando las incertidumbres expandidas se calculan utilizando un factor de cobertura de 2,0, un


valor crítico de 1,0 para un número En es equivalente al valor crítico de 2,0 utilizado con los
puntajes-z.

NOTA 2 Cuando las incertidumbres se estiman de manera consistente con el documento Guide to the expression
of uncertainty in measurement (GUM), los números En expresan la validez del estimado de la incertidumbre
expandida que se asocia con cada resultado. Un valor de |En| < 1 suministra evidencia objetiva de que el estimado
de la incertidumbre es consistente con la definición de incertidumbre expandida que se da en el GUM.

7.6 PUNTAJES-z'

7.6.1 Generalidades

Con la misma anotación del numeral 7.4, el puntaje-z' se calcula así:

z ′ = ( x − X ) / σˆ 2 + u X2 (21)

en donde

uX es la incertidumbre estándar del valor asignado X.

La ecuación (21) se puede utilizar cuando el valor asignado no se calcula utilizando los
resultados reportados por los participantes. Entonces, se puede utilizar cuando el valor
asignado se obtiene mediante los métodos descritos en los numerales 5.2, 5.3 y 5.4 y cuando
se usa el método descrito en el numeral 5.5 y los laboratorios expertos no toman parte en el
ensayo de aptitud. Cuando se utiliza el método descrito en 5.6, el valor asignado se
correlaciona con los resultados reportados por los participantes de modo que el uso de los
puntajes-z' tal como se definen en la ecuación (21) no es válido.

7.6.2 Interpretación de los puntajes-z'

Los puntajes-z' se deben interpretar igual que los puntajes-z (véase el numeral 7.4) y utilizando
los mismos valores críticos de 2,0 y 3,0.

NOTA Los criterios indicados en los numerales 7.1 y 7.2 para la interpretación de los sesgos del laboratorio y de
las diferencias de porcentaje se pueden modificar de manera similar reemplazando σ̂ por σˆ 2 + uX2

7.6.3 Uso de los puntajes-z'

La comparación de las fórmulas para el puntaje-z y para el puntaje-z' en los numerales 7.4 y 7.6
muestra que todos los puntajes-z' para una ronda de un diseño de ensayo de aptitud serán
inferiores a los correspondientes puntajes-z en un factor constante de

σˆ / σˆ 2 + uX2

Cuando se cumple la directriz para limitar la incertidumbre del valor asignado indicado en el
numeral 4.2, este factor estará en el rango:

0,96 ≤ σˆ / σˆ 2 + uX2 ≤ 1,00 (22)

29
NORMA TÉCNICA COLOMBIANA NTC 5755

Así, en este caso, los puntajes-z' serán casi idénticos a los puntajes-z y se puede concluir que
la incertidumbre del valor asignado es insignificante.

Cuando no se cumple la directriz del numeral 4.2, la diferencia en la magnitud de los puntajes-z' y
los puntajes-z puede ser tal que algunos puntajes-z exceden los valores críticos de 2,0 o 3,0 y por
lo tanto indiquen "señales de advertencia" mediante "señales de acción", mientras que los
puntajes-z' correspondientes no exceden estos valores críticos y por lo tanto no indican señales.

Cuando se decide si utilizar los puntajes-z o los puntajes-z', el coordinador debe considerar los
siguientes aspectos:

a) ¿Cumple la incertidumbre del valor asignado las directrices indicadas en el numeral 4.2?
Si lo hace, entonces no es probable que haya algún beneficio al utilizar los puntajes-z'.

b) Cuando no se cumple la directriz, se recomienda utilizar los puntajes-z' a pesar de su


complejidad adicional y las dificultades para explicarlos a los usuarios.

c) ¿Qué tan graves son las consecuencias para los laboratorios cuando sus resultados
dan origen a señales de advertencia o de acción? ¿Se utilizan los resultados para
descalificar los laboratorios para que no realicen métodos de medición para algunos
grupos de usuarios?

7.7 PUNTAJES ZETA (ζ)

7.7.1 Generalidades

Con la misma anotación del numeral 7.4, los puntajes-ζ se calculan así:

ξ = ( x − X ) / u x2 + uX2 (23)

en donde

ux es el estimado del propio laboratorio de la incertidumbre estándar de su resultado

x y uX es la desviación estándar del valor asignado X.

La ecuación (23) se puede utilizar cuando el valor asignado no se calcula utilizando los
resultados reportados por los participantes. Entonces, se puede utilizar cuando el valor
asignado se obtiene mediante los métodos descritos en los numerales 5.2, 5.3 y 5.4 y cuando
se usa el método descrito en el numeral 5.5 y los laboratorios expertos no toman parte en el
ensayo de aptitud. Cuando se utiliza el método descrito en el numeral 5.6, el valor asignado se
correlaciona con los resultados reportados por los participantes de modo que el uso de los
puntajes-ζ tal como se definen en la ecuación (23) no es válido.

NOTA 1 Los puntajes-ζ se diferencian de los números En por el uso de las incertidumbres estándar u(x) en lugar de
las incertidumbres expandidas U(x).

NOTA 2 Actualmente, no es una práctica común incorporar la información proporcionada por los laboratorios
participantes sobre la incertidumbre de sus mediciones en los puntajes utilizados en los diseños de ensayo de aptitud.
Sin embargo, es posible que dicha información se reporte cada vez más extensamente. El numeral 7.7 se incluye para
brindar a los coordinadores una guía acerca de la información que se podría incorporar, si está disponible. La
información sobre la incertidumbre de la medición se requiere ahora según la norma NTC-ISO/IEC 17025 de modo que
para los diseños de ensayo de aptitud que implican laboratorios que declaran cumplimiento con esa norma, los
coordinadores necesitan directrices acerca de cómo tratar dicha información.

30
NORMA TÉCNICA COLOMBIANA NTC 5755

7.7.2 Interpretación de los puntajes-ζ

Cuando existe un sistema eficaz en funcionamiento para validar los estimados de los propios
laboratorios de las incertidumbres estándar de sus resultados, los puntajes-ζ se pueden usar
en lugar que los puntajes-z y se deben interpretar de la misma manera que los puntajes-z
(véase el numeral 7.4), utilizando los mismos valores críticos de 2,0 y 3,0.

Cuando no funciona dicho sistema, los puntajes-ζ se deben utilizar únicamente junto con los
puntajes-z como una ayuda para mejorar el desempeño de los laboratorios, tal como se indica
a continuación. Si un laboratorio obtiene puntajes-z que repetidamente exceden el valor crítico
de 3,0, puede encontrar útil examinar paso a paso su etapa de procedimiento de ensayo y
derivar un supuesto de incertidumbre para tal procedimiento. El supuesto de incertidumbre
identificará los pasos en el procedimiento en donde se originan las incertidumbres más
grandes, de manera que el laboratorio puede ver hacia dónde extender su esfuerzo para lograr
una mejora. Si sus puntajes-ζ también exceden repetidamente el valor crítico de 3,0, esto
implica que su supuesto de incertidumbre no incluye todas las fuentes significativas de
incertidumbre (es decir, están pasando por alto algo importante).

Si un laboratorio obtiene un sesgo grande y su intervalo de incertidumbre X ± Ux no incluye el


valor asignado, entonces también tendrá un puntaje-ζ o un número En grande.

7.8 PUNTAJE Ez

x − (X − U X ) x − (X − U X )
Este puntaje se define como: E z − = y Ez + =
Ux Ux

en donde X es el valor asignado derivado utilizando los numerales 7.4 o 7.6, o un valor de referencia derivado
usando el numeral 7.5, y Ux es la incertidumbre expandida de X.

También x es el valor de un laboratorio y Ux es la incertidumbre expandida de x. Ux puede usar


2 σ̂ o 3 σ̂ en los numerales 7.4 y 7.6 y Ulab en el numeral 7.5.

Es común comparar los valores de Ez con un valor crítico de 1,0 cuando:

a) tanto Ez- y Ez+ están en el rango entre -1,0 y 1,0, el desempeño del laboratorio es
satisfactorio;

b) cuando uno de Ez- y Ez+ está fuera del rango entre -1,0 y 1,0, el desempeño del
laboratorio es cuestionable;

c) cuando Ez- y Ez+ están ambos por debajo de -1,0 o ambos están por encima de 1,0, el
desempeño del laboratorio no es satisfactorio.

7.9 EJEMPLO DEL ANÁLISIS DE DATOS CUANDO SE REPORTAN LAS


INCERTIDUMBRES

7.9.1 Generalidades

Los gráficos como las que se ilustran en las Figuras 6 y 7 brindan resúmenes útiles de los
resultados de los laboratorios y sus incertidumbres. Los laboratorios que tienen los sesgos de
laboratorio más grandes también tendrán puntajes-z más grandes. (Ellos aparecerán en alguno
de los extremos de los gráficos).

31
NORMA TÉCNICA COLOMBIANA NTC 5755

La Tabla 8 suministra datos auténticos obtenidos en un ejercicio en el cual 181 laboratorios


reportaron resultados con incertidumbres para plomo en agua. Los datos se reportaron como
mol/L. Los datos se han multiplicado por 1010 para obtener valores que se pueden manejar más
fácilmente. Esto implica que los resultados no tienen la misma incertidumbre ni el mismo sesgo.
Cada resultado tiene su propio sesgo Di obtenido de las sumas del sesgo del método y el
sesgo del laboratorio; además, cada método tiene por supuesto sus propias desviaciones
estándar de la reproducibilidad σR. Los laboratorios utilizaron diversos métodos para las
determinaciones y calcularon ellos mismos sus incertidumbres. Las incertidumbres se trataron
aquí como incertidumbres expandidas.

Los datos se presentan en la Tabla 8 tal como se reportaron, excepto que se han clasificado de
manera que los resultados estén en orden ascendente y los laboratorios se enumeraron en
este orden. U = 0 puede indicar una falla en el reporte de la incertidumbre. Existen varios
valores en la Tabla cuya validez es dudosa los cuales podrían ameritara una investigación
adicional en la práctica, y no es posible mostrar los resultados más extremos en los gráficos.
En particular, los valores negativos no se incluyen en los gráficos aunque se utilizan en los
cálculos. Estos datos brindan un ejemplo del reporte de los resultados negativos como se exige
en el numeral 4.6, aunque los contenidos negativos de plomo no son lógicamente posibles.

7.9.2 El valor asignado y su incertidumbre

El valor asignado se calcula como se describen en el numeral 5.6 como el promedio robusto de
los resultados, utilizando el algoritmo A del Anexo C. Esto proporciona un valor asignado:

X = x * = 605 x 10 −10 mol / l (24)

y una desviación estándar robusta:

s * = 142 x 10 −10 mol / l (25)

De acuerdo con el numeral 5.6, la incertidumbre estándar de este valor asignado es:

uX = 1,23 x s * / 181 = 13 x 10 −10 mol / l (26)

7.9.3 Desviación estándar para la evaluación de aptitud

La desviación estándar para la evaluación de aptitud se obtiene como se describe en el


numeral 6.6 como la desviación estándar robusta:

σˆ = s * = 142 x 10 −10 mol / l (27)

7.9.4 Directrices para la interpretación de la incertidumbre del valor asignado

De acuerdo con las directrices del numeral 4.2, la incertidumbre del valor asignado es
insignificante si:

uX ≤ 0,3σ̂ (28)

Con uX = 1,25 x s * / p y σˆ = s * como en este ejemplo, se puede calcular que la ecuación (28) se
satisface con p > 16. Con p = 181 laboratorios participantes, el criterio se satisface fácilmente.
Por lo tanto, no es necesario que en estos datos se consideren los puntajes-z' como se
describe en el numeral 7.6.

32
NORMA TÉCNICA COLOMBIANA NTC 5755

7.9.5 Análisis de datos para un número grande de laboratorios utilizando los gráficos
de probabilidad normal

La Figura 6 ilustra los resultados para los 181 laboratorios en un gráfico frente a sus rangos de
porcentaje (calculados como se describe en el numeral 7.3), utilizando una escala de
probabilidad normal para los rangos de porcentaje. Los resultados por debajo de 0 mol/l o por
encima de 1 600 x 10-10 mol/l no se incluyen en esta Figura.

Los puntajes-z se puede calcular como z = (x - 605)/142. Cuando un laboratorio alcanza un


puntaje-z por encima de 3,0 o por debajo de -3,0, el valor del puntaje-z se ilustra en esta figura
junto con el valor correspondiente.

La función de distribución acumulativa para la distribución normal con media de 605 x 10-10
mol/l y desviación estándar de 142 x 10-10 mol/l también se ilustra en la figura como la línea
recta interrumpida.

Los “valores de interrupción" finales utilizados en el algoritmo robusto son:

x * − 1,5s * = 605 − 1,5 x 142 = 392 x 10 −10 mol / l (29)


y

x * + 1,5s * = 605 + 1,5 x 142 = 818 x 10 −10 mol / l (30)

Se puede ver en la Figura 6 que los puntos cambian de dirección lejos de la línea interrumpida
por fuera de este rango. La implicación de esto es que no se puede considerar que todos los
resultados se obtengan de la misma población normal. Los puntos alejados de la línea
interrumpida se toman de una población con una variación mayor que los puntos cercanos a la
línea.

También se puede observar en la figura que los resultados que suministran puntajes-z por
encima de 3,0 o por debajo de -3,0 están muy alejados de la línea interrumpida. Esto sustenta
la conclusión de considerar que estos puntajes-z originan señales de "acción". (Es posible con
una gran cantidad de resultados que se obtengan puntajes-z por encima de 3,0 o por debajo de
-3,0, pero cuando se trazan como en la Figura 6 todos los puntos estarán cercanos a la línea
interrumpida. En tal caso, la Figura no sustentaría la conclusión tratar los puntajes-z como si
originaran señales de acción).

La Figura 7 ilustra los resultados sólo para aquellos laboratorios que proporcionan puntajes-z
dentro del rango ± 3,0, junto con las líneas verticales que indican las incertidumbres que ello
reportaron. (Los resultados de dos laboratorios, números 24 y 112, que reportaron
incertidumbres muy altas no se incluyen en la figura). La línea horizontal continua en esta figura
representa el valor asignado, y las líneas interrumpidas en cualquiera de los lados representan
la incertidumbre expandida del valor asignado.

Si los laboratorios realizaron cálculos válidos de las incertidumbres expandidas de sus


resultados, entonces casi todas las líneas verticales de la Figura 7 cortarán la región definida
por el valor asignado ± su incertidumbre expandida. Sin embargo, se puede observar en la
figura que existen muchos laboratorios, a ambos lados del valor asignado, cuyas líneas
verticales no alcanzan esta región. Esto implica que muchos laboratorios no han realizado
cálculos válidos de la incertidumbre; probablemente ellos no han incluido todas las fuentes
importantes de incertidumbre en sus cálculos.

33
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 8. Determinaciones del contenido de plomo en el agua (mol/l x 1010) para 181 laboratorios, junto con
los valores para las incertidumbres expandidas (U) de los resultados tal como estos laboratorios los
reportaron

Lab Resultado U Lab Resultado U Lab Resultado U Lab Resultado U


1 -960 000 0 51 545 43 101 618 224 151 740 20
2 -12 100 0 52 545 123 102 618 170 152 748 3
3 -4 800 0 53 550 8 103 620 25 153 767 113
4 -3 860 0 54 550 55 104 620 40 154 772 213
5 -1 500 0 55 550 5 105 621 6 155 800 60
6 -1 010 0 56 555 79 106 622 9 156 800 150
7 -1 000 0 57 556 30 107 622 6 157 821 203
8 -1 000 0 58 557 28 108 623 18 158 830 100
9 -965 0 59 557 28 109 625 15 159 857 27
10 -483 0 60 559 26 110 626 5 160 874 200
11 160 20 61 560 7 111 627 0 161 898 59
12 180 20 62 560 60 112 627 1 010 162 900 100
13 203 0 63 569 116 113 627 15 163 920 140
14 256 13 64 570 86 114 628 3 164 950 110
15 319 0 65 571 16 115 629 26 165 965 0
16 335 18 66 572 40 116 630 40 166 968 0
17 340 180 67 574 35 117 630 580 167 990 0
18 400 20 68 578 0 118 632 50 168 990 80
19 404 36 69 579 52 119 637 96 169 1 010 0
20 407 0 70 579 35 120 639 83 170 1 25 140
21 410 97 71 579 8 121 640 130 171 1 320 410
22 444 58 72 579 10 122 640 77 172 1 450 460
23 450 20 73 579 17 123 642 20 173 1 640 241
24 450 3 400 000 74 579 87 124 647 63 174 1 900 46
25 463 19 75 580 150 125 647 0 175 2 413 20
26 470 10 76 582 122 126 65 160 176 2 460 0
27 470 30 77 589 57 127 650 30 177 2 900 900
28 474 0 78 589 10 128 650 80 178 10 000 0
29 480 100 79 590 0 129 650 48 179 386 000 31 000
30 482 122 80 590 0 130 650 30 180 670 000 60 000
6 6
31 483 241 81 590 45 131 653 5 181 630x10 60x10
32 490 60 82 590 60 132 658 27
33 492 25 83 590 0 133 660 20
34 492 1 84 591 112 134 660 120
35 493 24 85 591 9 135 660 34
36 493 5 86 594 4 136 663 32
37 495 0 87 594 119 137 675 280
38 500 70 88 597 9 138 675 0
39 500 10 89 600 20 139 680 8
40 500 10 90 600 300 140 680 50
41 501 75 91 603 60 141 680 70
42 504 0 92 603 24 142 685 0
43 510 130 93 603 13 143 700 0
44 510 110 94 604 18 144 700 100
45 512 6 95 608 30 145 700 110
46 526 26 96 608 8 146 700 300
47 530 9 97 609 9 147 708 44
48 530 40 98 610 61 148 709 48
49 530 60 99 613 22 149 710 100
50 545 30 100 618 7 150 729 41

34
NORMA TÉCNICA COLOMBIANA NTC 5755

1 600
z = 6,0 x
z = 5,0 x
1 400 z = 4,5 x

1 200

1 000 x
xxxx
xxxx
xx
800 xxxx
x
xxxx
xxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
600 x
xxx
xx
xx
xx
xx
xx
xxx
xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
xxxxxx
xxxxxxxxxxxxxx
xxxxxxxxxxxx
400 xxxx
xxx
x z = -3,1
200 x
xx

0
0 10 20 30 40 50 60 70 80 90 95 X

X rango de porcentaje del laboratorio, %


Y contenido de plomo, mol/l x 1010

NOTA No se incluyen los resultados para 19 laboratorios

Figura 6. Gráfico de probabilidad normal de los resultados de las determinaciones del contenido de plomo
en el agua por 162 laboratorios

1 600

1 400

1 200

1 000

800

600

400
a
200

0
0 10 20 30 40 50 60 70 80 90 95 X

X rango de porcentaje del laboratorio, %


Y contenido de plomo, mol/l x 1010
a
valor asignado ± su incertidumbre expandida.

NOTA No se incluyen los resultados para 25 laboratorios.

Figura 7. Gráfico de probabilidad normal de las incertidumbres expandidas para las determinaciones del
contenido de plomo en el agua por 156 laboratorios

35
NORMA TÉCNICA COLOMBIANA NTC 5755

7.10 PUNTAJES COMBINADOS DE DESEMPEÑO

Esto es común, en una sola ronda de un diseño de ensayo de aptitud, para los resultados que
se han de obtener para más de un elemento de ensayo o para varios mensurandos. En esta
situación, los resultados para cada elemento de ensayo y para cada mensurando se deben
interpretar como se indica en los numerales 7.2 a 7.9, es decir, los resultados para cada
elemento de ensayo y cada mensurando se deben analizar por separado. Existen aplicaciones
cuando dos o más materiales con niveles especialmente diseñados se incluyen en un diseño
para medir otros aspectos de desempeño tales como repetibilidad o linealidad. En tales casos,
el coordinador debe proporcionar a los participantes las descripciones completas del diseño
estadístico y de los procedimientos que se van a utilizar. Si dos materiales similares se han
incorporado en el diseño con la intención de tratarlos como un par Youden, se deben aplicar los
métodos especiales descritos en el numeral 8.5.

Además, se recomienda que los métodos gráficos descritos en el numeral 8 también se utilicen
cuando los resultados se obtienen para más de un elemento de ensayo o para varios
mensurandos. Ellos combinan puntajes de formas que no ocultan los valores altos de los
puntajes individuales, y pueden revelar información adicional sobre el desempeño de los
laboratorios, como la correlación entre los resultados de diferentes mensurandos, que no son
aparentes en las tablas de los puntajes individuales.

En diseños que implican una gran cantidad de mensurandos, se puede usar un recuento de las
cantidades de señales de acción y advertencia para permitir que los laboratorios logren
identificar una o más de tales señales. A ellos se les puede suministrar un informe que
contenga los resultados detallados utilizando los métodos descritos en los numerales 7.2 a 7.9.
A los laboratorios que no obtiene ninguna señal se les puede suministrar únicamente un
informe breve.

NOTA No se recomienda el uso de puntajes compuestos cuando existe más de un elemento de ensayo para el
mismo mensurando (el promedio o la suma de puntajes-z o el promedio o la suma de la diferencia absoluta o de la
diferencia cuadrada), o el uso de puntajes compuestos cuando hay resultados para más de un mensurando (el
promedio absoluto de puntajes-z o la diferencia absoluta promedio con relación a los límites de evaluación). El
puntaje-z promedio (o la suma de ellos) tiene la falla grave de que un puntaje alto en uno de los elementos de
ensayo puede estar oculto si otros puntajes son bajos o si otro puntaje también es alto pero tiene el signo opuesto.
La diferencia absoluta promedio (o la suma) y la suma de las diferencias cuadradas también tienen la falla grave de
que un puntaje alto en un elemento de ensayo puede estar oculto si otros puntajes son bajos. El puntaje-z promedio
absoluto y la diferencia promedio absoluto con relación a los límites de evaluación también tienen esta misma falla.

8. MÉTODOS GRÁFICOS PARA COMBINAR PUNTAJES DE DESEMPEÑO PARA


VARIOS MENSURANDOS DE UNA RONDA DE ENSAYO DE APTITUD (Véase la
GTC 55-1 (ISO/IEC GUIDE 43-1), A.2.2.1)

8.1 APLICACIÓN

El coordinador debe considerar el uso de los puntajes de desempeño obtenidos en cada ronda
de un diseño de ensayo de aptitud para preparar los gráficos, como se describe en el numeral
8.2 y 8.3. El uso de puntajes-z en los gráficos tiene la ventaja de que se pueden trazar usando
ejes normalizados, simplificando así su presentación e interpretación. Los gráficos deben estar
disponibles para los participantes, permitiendo que cada uno observe en dónde están sus
propios resultados con relación a aquellos obtenidos por otros participantes. Se deben usar
letras o números código para representar a los participantes de forma que cada uno de ellos
pueda identificar sus propios resultados pero no puede determinar que participante obtuvo
ningún otro resultado. Los gráficos también deben estar disponibles para el coordinador,
permitiéndole juzgar la eficacia global del diseño y ver si es necesario revisar el criterio utilizado
para evaluar la aptitud.
36
NORMA TÉCNICA COLOMBIANA NTC 5755

8.2 HISTOGRAMAS DE LOS PUNTAJES DE DESEMPEÑO

8.2.1 Generalidades

Para preparar un histograma de puntajes-z, reúna los puntajes-z para la medición de una
característica en una ronda de un diseño de ensayo de aptitud en un histograma como el que
se indica la Figura 8. Utilice en el histograma un intervalo aproximado de 0,3 a 0,5 de forma
que el histograma proporcione una buena impresión visual. Trace líneas en ± 2,0 y ± 3,0 para
representar el criterio de evaluación de aptitud. Utilice un rango para registro histograma
aproximado de ± 6,0. Si los resultados no amplían este rango o si los puntos centrales están
muy unidos, el analista puede considerar un rango alternativo.

Cuando se prefieren los histogramas de los sesgos del laboratorio o de las diferencias de
porcentaje, los intervalos equivalentes del histograma y los límites de acción y advertencia son
los que se presentan a continuación. En estos casos, puede ser más fácil derivar los límites de
acción directamente de los requisitos prescritos o percibidos en lugar de calcularlos a partir de
la desviación estándar para la evaluación de aptitud.

Tabla 9. Límites de acción y advertencia para los puntajes de desempeño

Estadística de Intervalo del Límites de Límites de acción Rango del


desempeño histograma advertencia histograma
Sesgo del
0,3 σ̂ a 0,5 σ̂ ± 2,0 σ̂ ± 3,0 σ̂ ± 6,0 σ̂
laboratorio
Diferencia de
30 σ̂ /X a 50 σ̂ /X ± 200 σ̂ /X ± 300 σ̂ /X ± 600 σ̂ /X
porcentaje
Puntaje -z 0,3 a 0,5 ± 2,0 ± 3,0 ± 6,0

Los histogramas son un método adecuado de presentación gráfica cuando la cantidad de


características medidas es pequeña o cuando se mide una la cantidad de características
diferentes. Los participantes individuales pueden identificar la posición de sus propios puntajes
y evaluar su desempeño y la necesidad de investigar sus métodos. Un participante que ha
alcanzado un puntaje-z alto puede usar un histograma para observar qué tan excepcional es su
puntaje en comparación con los puntajes logrados por otros participantes.

El coordinador puede utilizar un histograma para observar la frecuencia con que los
participantes van en cumplir el criterio de evaluación de aptitud. Si las colas del histograma se
extienden por fuera de los límites de ± 3,0, entonces la falla parecería estar en el método (o los
métodos) de medición que se está utilizando y no en los participantes individuales. El método
(o los métodos) de medición se deberían mejorar o el criterio de evaluación de la aptitud se
debería relajar (aumentando el valor de σ̂ ). Si el histograma está dentro de los límites de ± 2,0,
con la posibilidad de uno o dos puntajes-z aislados por fuera de estos límites, entonces esto
sugiere que el criterio de evaluación de aptitud podría ser más estricto (reduciendo el valor
de σ̂ ).

8.2.2 Ejemplo: concentraciones de anticuerpos

Los puntajes-z para d1 se ilustran en la Figura 8 en la forma de un histograma.

37
NORMA TÉCNICA COLOMBIANA NTC 5755

0
-3,75 -2,75 -1,75 -0,75 0,25 1,25 2,25 3,25 X

X puntaje-z para el alérgeno d1

Y número de laboratorios

Figura 8. Histograma de los puntajes-z para una ronda de un ensayo de aptitud


(datos para el alérgeno d1 tomados de la Tabla 7)

8.3 GRÁFICO DE BARRAS DE LOS SESGOS NORMALIZADOS DEL LABORATORIO

8.3.1 Generalidades

Para preparar un gráfico de barras, reúna los puntajes-z en un gráfico de barras como el que se
ilustra la Figura 9, en el cual se agrupan los puntajes-z para cada participante. (El puntaje-z es
la misma estadística que aquella indicada como estadístico-h en la NTC 3529-2 (ISO 5725-2) y
los gráficos de barras descritos aquí son los mismos gráficos del estadígrafo-h descrito en la
NTC 3529-2 (ISO 5725-2)).

Los gráficos de barras son un método adecuado para presentar los puntajes-z para una
cantidad de características similares en un gráfico. Ellos revelarán si existe una característica
común en los puntajes-z para un participante, por ejemplo si él logra varios puntajes-z altos
indicando un desempeño deficiente.

8.3.2 Ejemplo: concentraciones de anticuerpos

Los puntajes-z tomados de la Tabla 7 se ilustran en un gráfico de barras en la Figura 9. A partir


de esta gráfica, los laboratorios B y Z pueden ver que ellos deberían buscar la causa de sesgo
que afecta a todos los tres niveles aproximadamente en la misma cantidad, mientras que los
laboratorios K y P pueden ver que en sus casos el signo del puntaje-z depende del tipo de
anticuerpo.

38
NORMA TÉCNICA COLOMBIANA NTC 5755

4,0

3,0

2,0

1,0

0,0

-1,0

-2,0

-3,0

-4,0
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a

Y puntaje-z

NOTA “A” hasta “a” indican el número del laboratorio.

Figura 9. Gráfico de barras de los puntajes-z (4,0 a -4,0) para una ronda de un ensayo de aptitud en la cual los
participantes determinaron las concentraciones de tres anticuerpos IgE alérgeno-específicos (datos
tomados de la Tabla 7)

8.4 GRÁFICOS DE BARRAS DE MEDICIONES NORMALIZADAS DE REPETIBILIDAD

Cuando se hacen determinaciones replicadas en una ronda de un ensayo de aptitud, los


resultados se pueden utilizar para calcular un gráfico del estadístico k como el descrito en la
NTC 3529-2 (ISO 5725-2).

8.5 GRÁFICO DE YOUDEN

8.5.1 Generalidades

Cuando las muestras de dos materiales similares se han sometido a ensayo en una ronda de
un diseño de aptitud, el gráfico de Youden brinda un método gráfico muy informativo para
estudiar los resultados. Esta se elabora al trazar los puntajes-z obtenidos en uno de los
materiales frente a los obtenidos en el otro material. Se utiliza una elipse de confianza,
calculada como se describe en el numeral 8.5.2, como ayuda para interpretar los gráficos. Un
gráfico de Youden para los datos originales, sesgos del laboratorio o sesgos de porcentaje se
puede derivar a partir de los puntajes-z como se explica en la siguiente Nota 1.

Cuando se elabora un gráfico de Youden se interpreta así:

a) Inspeccione los gráficos para los puntos que están muy separados del resto de los
datos. Si un laboratorio no sigue el método de ensayo correctamente, de modo que sus
resultados están sujetos a sesgo, se encontrará un punto muy alejado a lo largo del eje
principal de la elipse. Tal punto se puede presentar si un laboratorio sufre una variación
grande ocasional del nivel de sus resultados. Los puntos alejados del eje principal
representan a los participantes cuya repetibilidad es deficiente.
39
NORMA TÉCNICA COLOMBIANA NTC 5755

b) Inspeccione los gráficos para observar si hay evidencia de una relación general entre
los resultados para los dos materiales. Si existe, entonces muestra que hay una causa
de variación interlaboratorio que es común a muchos de los laboratorios, y brinda
evidencia de que el método de medición no se ha especificado adecuadamente. La
investigación del método de ensayo podría permitir la mejora general de la
reproducibilidad y del método. El ensayo de correlación de rango descrito a continuación
se puede utilizar para determinar si la relación entre los dos materiales es
estadísticamente significativa. El coeficiente de correlación del rango se prefiere aquí al
coeficiente de correlación ya que este último sería más sensible a la falta de normalidad
en los datos.

8.5.2 Elipse de confianza (basada en el método de Jackson)

8.5.2.1 Generalidades

Los dos materiales son A y B, indique los resultados obtenidos en A así:

x A,1, x A,2 ,..., x A, p

Y los obtenidos en B así:

x B,1, x B.2 ,..., xB, p

en donde p es la cantidad de laboratorios.

Calcule los promedios y las desviaciones estándar de los dos conjuntos de datos:

x A, x B, s A sB

Y calcule el coeficiente de correlación ρ̂ . Calcule los puntajes-z para los dos materiales así:

( )
z A,i = x A,i − x A, / s A donde i = 1, 2,..., p (31)

( )
zB,i = xB,i − x B, / sB donde i = 1, 2,..., p (32)

Calcule los puntajes combinados para los dos materiales:

z A, B ,i = z A2 ,i − 2 ρˆ z A,i z B ,i + z B2 (33)

Defina las variables normalizadas así:

( )
z A = x A − x A, / sB (34)

( )
zB = x B − x A, / sB (35)

En términos de las variables normalizadas, la elipse de confianza se puede escribir en términos


de T2 de Hotelling:

(
z A2 − 2 ρˆ z A z B + z B2 = 1− ρˆ 2 T 2 ) (36)

40
NORMA TÉCNICA COLOMBIANA NTC 5755

en donde

T 2 = 2{( p − 1) /( p − 2 )}F(1 − α ) (2, p − 1) (37)

En donde F(1 − α ) (2, p − 1) es el fractil (1 - α) de la distribución F con dos y (p -1) grados de libertad.
La elipse se puede trazar en un gráfico que tenga por ejes los puntajes-z, zA y zB trazando una
serie de puntos para −T ≤ z A ≤ T con:

( )(
zB = ρˆ z A ± 1 − ρˆ 2 T 2 − z A2 ) (38)

NOTA 1 Para trazar la elipse de confianza en un gráfico con ejes que muestran las unidades originales de la
medición, transforme la serie de puntos anterior de nuevo en las unidades originales utilizando:

x A = x A,. + s A x z A

x B = x B,. + sB x zB

Para trazar la elipse de confianza en un gráfico con ejes que muestran los sesgos del
laboratorio DA y DB, transforme la serie anterior de puntos utilizando:

DA = s A x z A

DB = sB x zB

Para trazar la elipse de confianza en un gráfico con ejes que muestran las diferencias de
porcentaje DA% y DB%, transforme la serie de puntos anterior utilizando:

DA% = 100 s A x z A / x A

DB% = 100 sB x zB / x B

Los puntajes-z combinados se pueden usar como ayuda para interpretar el gráfico de Youden.
Los puntajes-z combinados más altos corresponden a los niveles de significancia más altos de
100α% en el cálculo de la elipse de confianza, de modo que los puntajes-z combinados se
pueden usar para identificar los puntos más extremos en el gráfico de Youden. En ocasiones,
puede ser necesario excluir uno o más puntos distantes y volver a calcular la elipse: los
puntajes-z combinados se pueden usar entonces como ayuda para identificar los puntos que se
deben excluir.
NOTA 2 Es necesario un método robusto para calcular la elipse, pero los detalles de tal método aún no se han
desarrollado. El valor de interrupción se puede calcular observando que (zA,B,i)2 / (1 - ρ̂ ) tienen aproximadamente
2

la distribución chi cuadrado con dos grados de libertad, pero es posible que el factor de corrección se deba derivar
por simulación.

8.5.2.2 Ejemplo: concentración de anticuerpos

La Tabla 10 ilustra los datos obtenidos mediante el ensayo de dos muestras similares para las
concentraciones de anticuerpos, y los cálculos que se requiere para derivar la elipse de confianza.
Con p = 29 laboratorios y utilizando un nivel de significancia de 100α% = 5 %, F (1 - α) (2, p - 1) = 3,34.
De este modo, T = 2,632 y, en términos de las variables normalizadas, la elipse de confianza
del 95 % se puede escribir:
z A2 − 1,412 z A zB + zB2 = 3,48 (39)

41
NORMA TÉCNICA COLOMBIANA NTC 5755

La elipse se muestra junto con los puntos que representan los puntajes-z, en la Figura 10, junto
con las elipses para los niveles de probabilidad de 100α% = 1 % y 0,1 %. Los puntajes
combinados se ilustran en la Tabla 10.

La inspección de la Figura 10 revela que dos laboratorios (números 5:23) en el extremo


superior derecho tienen puntajes-z combinados de 1,641 y 2,099. El laboratorio 26 tiene un
puntaje-z alto en el material B y un puntaje-z combinado 2,059. Después de los laboratorios 5,
23 y 26, el laboratorio que suministra el siguiente puntaje-z combinado más alto es el número 8
(puntaje combinado de 1,501).

Los puntos para los laboratorios 23 y 26 están dentro de la elipse para los niveles de
probabilidad de 5 % y 1 %, de modo que sería apropiado considerar que sus resultados
originan señales de "advertencia" y verificar si sus resultados están en la siguiente ronda del
diseño.

Tabla 10. Datos y cálculos de las concentraciones de anticuerpos para dos alérgenos similares

Datos Puntaje-z Puntaje


Laboratorio combinado
i Alérgeno A Alérgeno B Alérgeno A Alérgeno B
xA,i xB,i zA,i zB,i zA,B,i
1 12,95 9,15 0,427 0,515 0,370
2 6,47 6,42 -1,540 -0,428 1,275
3 11,40 6,60 -0,043 -0,366 0,336
4 8,32 4,93 -0,978 -0,942 0,737
5 18,88 13,52 2,228 2,023 1,641
6 15,14 8,22 1,092 0,194 0,965
7 10,12 7,26 -0,432 -0,138 0,349
8 17,94 9,89 1,942 0,770 1,501
9 11,68 4,17 0,042 -1,204 1,234
10 12,44 7,39 0,272 -0,093 0,344
11 6,93 7,78 -1,400 0,042 1,430
12 5,97 5,80 -0,599 -0,642 0,477
13 11,73 5,77 0,057 -0,652 0,693
14 12,29 6,97 0,227 -0,238 0,429
15 10,95 6,23 -0,180 -0,493 0,388
16 10,95 5,90 -0,180 -0,607 0,497
17 11,17 7,74 -0,113 0,028 ,134
18 11,20 8,63 -0,104 0,335 0,415
19 7,64 3,74 -1,185 -1,353 0,986
20 12,17 7,33 0,190 -0,114 0,282
21 10,71 5,70 -0,253 -0,676 0,529
22 7,84 6,07 -1,124 -0,549 0,833
23 20,47 15,66 2,710 2,762 2,099
24 12,60 11,76 0,321 1,415 1,210
25 11,37 4,91 -0,052 -0,949 0,913
26 11,36 13,51 -0,055 2,019 2,059
27 10,75 5,48 -0,241 -0,752 0,607
28 12,21 9,77 0,203 0,729 0,603
29 7,49 5,82 -1,230 -0,635 0,902
Promedio 11,54 7,66 0,00 0,00
Desviación estándar 3,29 2,90 1,00 1,00
Coeficiente de
0,706 0,706
correlación
NOTA 1 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está
definida por la concentración de un material de referencia internacional.
NOTA 2 Los puntajes-z en esta tabla se han calculado utilizando valores no aproximados de los promedios y
desviaciones estándar, no se calculan utilizando los valores aproximados que se ilustran en el fondo de la Tabla.

42
NORMA TÉCNICA COLOMBIANA NTC 5755

5,0

4,0

3,0
x
2,0 x x
x
1,0 x
xx
x x
0,0 x x x xx
x xx x xxx x
xx
-1,0 x x
x x
-2,0 a
b
c
-3,0

-4,0

-5,0
-5,0 -4,0 -3,0 -2,0 -1,0 0,0 1,0 2,0 3,0 4,0 5,0 X

X puntaje-z para el alérgeno A


Y puntaje-z para el alérgeno B
a
nivel de 5 %
b
nivel de 1 %
c
nivel de 0,1 %

Figura 10. Gráfico de Youden de los puntajes-z tomados de la Tabla 10

8.5.3 Ensayo de correlación de rango

8.5.3.1 Generalidades

El ensayo de correlación de rango se realiza utilizando el coeficiente de correlación de


Spearman de la siguiente manera. Reemplace los resultados observados para el material A por
sus rangos (es decir, reemplace el valor más bajo por 1, el siguiente valor más bajo por 2, y así
sucesivamente hasta que el valor más alto se reemplace con p). Trate los resultados
observados para el material B de la misma manera. Las relaciones entre los resultados se
reemplazan con el valor promedio de los rangos para el conjunto de valores que se relacionan.
Calcule el coeficiente de correlación entre las dos series de rangos y compare el resultado con
el valor tabulado de la Tabla 11. Si el valor calculado es superior al tabulado, la relación entre
las variables es significativa. El coeficiente de correlación de rango se puede calcular en la
siguiente forma sencilla:

Si:

k A,1, k A,2,...,k A, p

representan los rangos de los laboratorios para el material A y

k B,1, k B,2,...,k B, p

Son los rangos para el material B. El coeficiente de correlación de rango se puede calcular así:

ρk =1 − 6 ∑ (k A,i
2
{(
− k B,i ) / p p 2 − 1 )} (40)

43
NORMA TÉCNICA COLOMBIANA NTC 5755

En donde la sumatoria es para los p laboratorios.

Tabla 11. Valores críticos para el coeficiente de correlación de rango

Cantidad de puntos de Valores críticos


datos Nivel del 5 % Nivel del 1 %
8 0,738 0,881
9 0,683 0,833
10 0,648 0,794
11 0,623 0,818
12 0,591 0,780
13 0,566 0,745
14 0,545 0,716
15 0,525 0,689
16 0,507 0,666
17 0,490 0,645
18 0,476 0,625
19 0,462 0,608
20 0,450 0,591
21 0,438 0,576
22 0,428 0,562
23 0,418 0,549
24 0,409 0,537
25 0,400 0,526
26 0,392 0,515
27 0,385 0,505
28 0,377 0,496
29 0,370 0,487
30 0,364 0,478

8.5.3.2 Ejemplo: concentraciones de anticuerpos

En la Tabla 12 se presenta un ejemplo del cálculo del coeficiente de correlación de rango. El


coeficiente de correlación de rango calculado es 0,605 el cual excede el valor tabulado en la
Tabla 11 de 0,487 para el nivel de 1 % para 29 puntos de datos, de modo que se puede
concluir que la relación aparente en la Figura 10 es estadísticamente significativa.

44
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 12. Cálculo del coeficiente de correlación de rango para los datos tomados de la Tabla 10

Datos Rango
Diferencia
Laboratorio Alérgeno Alérgeno Alérgeno Alérgeno
i A B A B |kA,i - kB,i|
zA,i zB,i kA,i kB,i
1 12,95 9,15 25 23 2
2 6,47 6,42 1 13 12
3 11,40 6,60 17 14 3
4 8,32 4,93 6 4 2
5 18,88 13,52 28 28 0
6 15,14 8,22 26 21 5
7 10,12 7,26 8 16 8
8 17,94 9,89 27 25 2
9 11,68 4,17 18 2 16
10 12,44 7,39 23 18 5
11 6,93 7,78 2 20 18
12 5,97 5,80 7 8 1
13 11,73 5,77 19 7 12
14 12,29 6,97 22 15 7
15 10,95 6,23 11,5 12 0.5
16 10,95 5,90 11,5 10 1.5
17 11,17 7,74 13 19 6
18 11,20 8,63 14 22 8
19 7,64 3,74 4 1 3
20 12,17 7,33 20 17 3
21 10,71 5,70 9 6 3
22 7,84 6,07 5 11 6
23 20,47 15,66 29 29 0
24 12,60 11,76 24 26 2
25 11,37 4,91 16 3 13
26 11,36 13,51 15 27 12
27 10,75 5,48 10 5 5
28 12,21 9,77 21 24 3
29 7,49 5,82 3 9 6
Suma del cuadrado de las diferencias 1 605,50
2
p(p - 1) 24 360
Coeficiente de correlación del rango calculado 0,605
Valor crítico tabulado para el nivel de significancia de 1 % 0,487
NOTA 1 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está
definida por la concentración de un material de referencia internacional.

45
NORMA TÉCNICA COLOMBIANA NTC 5755

8.6 GRÁFICOS DE LAS DESVIACIONES ESTÁNDAR DE REPETIBILIDAD

8.6.1 Generalidades

Cuando se hacen n mediciones replicadas por parte de los participantes en una ronda de un
diseño de ensayo de aptitud, los resultados se pueden utilizar para producir un gráfico que
identifique los laboratorios cuyo promedio y desviaciones estándar son inusuales. El gráfico se
elabora trazando las desviaciones estándar intralaboratorio si para cada laboratorio frente al
promedio correspondiente xi para el laboratorio.

Si:

X = x* el promedio robusto de x1, x2, …, xp, calculado con el algoritmo A,

S = s* el valor combinado robusto de s1, s2, …, sp, calculado con el algoritmo S,

y se asume que los datos tienen distribución normal. Según la hipótesis nula de que no hay
diferencia interlaboratorios en los valores de la población bien sea de las medias de laboratorio
o la desviaciones estándar intralaboratorio, la estadística

2 2
⎛ ⎞ ⎡ ⎤
⎜ n xi − X ⎟ + ⎢ 2(n − 1) ln ⎛⎜ si ⎞⎟ ⎥
⎜ S ⎟⎠ ⎝ S ⎠⎦
⎝ ⎣

Tiene aproximadamente la distribución χ2 con dos grados de libertad. De este modo, una región
crítica con un nivel de significancia de 1 % se puede trazar en el gráfico al indicar:

⎡ ⎤
⎢ ⎥
1
s = S exp ⎢⎢± χ2 ⎥
⎥ (41)
2(n − 1)
2
⎛ x−X ⎞
⎢ 2;0,99 − ⎜ n ⎟ ⎥
⎜ ⎟
⎢⎣ ⎝
S
⎠ ⎥⎦

En el eje de desviación estándar frente a x en el eje promedio para:

χ 22;0,99 χ 22;0,99
x =X −S a X +S (42)
n n

NOTA La Técnica del Círculo fue introducida por Van Nuland. El método descrito utilizó una aproximación normal
simple para la distribución de la desviación estándar que podría suministrar una región crítica que contiene
desviaciones estándar negativas. El método que se presenta aquí utiliza una aproximación para la distribución de la
desviación estándar que evita este problema, pero la región crítica ya no es un círculo como en el original. Además,
se utilizan valores robustos para el punto central en lugar de los promedios simples como en el método original.

8.6.2 Ejemplo: concentraciones de anticuerpos

La Tabla 13 presenta los resultados al determinar las concentraciones de algunos anticuerpos


en muestras de suero. Cada laboratorio realizó cuatro determinaciones replicadas, en
condiciones de repetibilidad. Las fórmulas que se presentan arriba se utilizan para obtener el
gráfico que se ilustra en la Figura 11. El gráfico muestra que varios de los laboratorios
recibieron señales de acción y advertencia.

46
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 13. Concentraciones de algunos anticuerpos en muestras de suero


(cuatro determinaciones replicadas en una muestra en cada laboratorio)

Laboratorio Promedio Desviación estándar


i kU/l kU/l
1 2,15 0,13
2 1,85 0,21
3 1,80 0,008
4 1,80 0,24
5 1,90 0,36
6 1,90 0,32
7 1,90 0,14
8 2,05 0,26
9 2,35 0,39
10 2,03 0,53
11 2,08 0,25
12 1,25 0,24
13 1,13 0,72
14 1,00 0,26
15 1,08 0,17
16 1,20 0,32
17 1,35 0,4
18 1,23 0,36
19 1,23 0,33
20 0,90 0,43
21 1,48 0,40
22 1,20 0,55
23 1,73 0,39
24 1,43 0,30
25 1,28 0,22
Promedio robusto 1,57
Desviación estándar robusta 0,34
NOTA Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad
está definida por la concentración de un material de referencia internacional.

47
NORMA TÉCNICA COLOMBIANA NTC 5755

1,6

1,4

1,2 a
b
c
1,0

0,8
x

0,6
x x
x
0,4 x x x x
x x
xx x x
x xx x xx
0,2 x
x
x x
x
0,0
0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 X

X promedio
Y desviación estándar

NOTA Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está definida
por la concentración de un material de referencia internacional.
a
nivel de 5 %
b
nivel de 1 %
c
nivel de 0,1 %

Figura 11. Gráfica de las desviaciones estándar frente a los promedios para 25 laboratorios
(datos tomados de la Tabla 13)

8.7 MUESTRAS DIVIDIDAS (VÉASE LA GTC 55-1 (ISO/IEC GUIDE 43-1), A.3.1.2)

8.7.1 Generalidades

Las muestras divididas se utilizan cuando es necesario realizar una comparación detallada de
los laboratorios. Por ejemplo, cuando un laboratorio es operado por un proveedor y el otro por
un cliente, y las dos organizaciones desean garantizar que los dos laboratorios están de
acuerdo. Se obtienen muestras de varios materiales que representan un amplio rango de la
propiedad de interés, cada muestra se divide en dos partes y cada laboratorio obtiene una
cantidad (por lo menos dos) de determinaciones replicadas en parte de cada muestra.

En ocasiones, más de dos laboratorios pueden estar implicados, en cuyo caso uno se debería
tratar como laboratorio de referencia y los otros se deberían comparar con este utilizando las
técnicas que aquí se describen.

Los datos del experimento de muestras divididas se deben usar para producir gráficas que
presenten la variación entre las mediciones replicadas para los dos laboratorios y la diferencia
entre sus resultados promedio para cada muestra. El análisis adicional dependerá de las
deducciones hechas a partir de estas gráficas.
48
NORMA TÉCNICA COLOMBIANA NTC 5755

8.7.2 Ejemplo: concentraciones de anticuerpos

La concentración de algunos anticuerpos en 21 muestras de suero se midieron con métodos de


radioinmunoensayo en dos laboratorios denominados X y Y. En cada laboratorio se realizaron
todas las mediciones por duplicado en la misma ronda. Las concentraciones obtenidas (en U/l)
se representan en la Tabla 14. Dado que el rango de medición es grande, las diferencias
relativas son pertinentes, de modo que los datos que se transforman tomando logaritmos con
base e antes de realizar los cálculos. Los datos transformados se ilustran en la Tabla 15 y los
gráficos que representan las estadísticas de la Tabla 15 se presentan en las Figuras 12, 13 y 14.

A partir de los gráficos de los rangos de las determinaciones replicadas, es aparente que la
variación entre los replicados para el laboratorio X es superior que para él Y. Los valores
combinados de estas estadísticas se presentan en la Tabla 15 y se podrían comparar utilizando
una prueba F si fuera de interés. Al observar la tercera gráfica, se puede ver que no existe un
patrón o una tendencia en los puntos. Sin embargo aunque los rangos de las determinaciones
replicadas de las Figuras 12 y 13 son casi todos inferiores a 0,2, muchas de las diferencias
entre los laboratorios de la Figura 14 son mucho más grandes que ésta. Este aspecto exige
investigación porque implica que la diferencia entre los laboratorios depende de la muestra.

La diferencia promedio entre los laboratorios se puede calcular y se ilustra en la Tabla 15. Esta
diferencia se puede utilizar para obtener una indicación de la importancia de la diferencia entre
los laboratorios, pero no se puede usar para predecir la diferencia entre los laboratorios que se
podrían lograr al analizar alguna muestra posterior. De este modo, con los datos
transformados, en promedio In(Y) - In(X) = 0,443, de modo que Y/X = 1,6, indica que el
laboratorio Y obtiene resultados, en promedio, superiores a los del laboratorio X en un factor de
1,6. Sin embargo con algunas muestras la diferencia es mucho mayor y en otras el laboratorio
X obtiene resultados superiores.

49
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 14. Concentraciones de algunos anticuerpos en 21 muestras de suero

Laboratorio Laboratorio Laboratorios


Laboratorio X Laboratorio Y
Muestra X Y XyY
i Réplica 1 Réplica 2 Réplica 1 Réplica 2 Promedio Promedio Promedio
U/l U/l U/l U/l U/l U/l U/l
1 19,106 18,174 11,473 11,705 18,640 11,589 15,115
2 6,424 7,171 5,812 5,812 6,798 5,812 6,305
3 6,619 5,989 11,705 11,473 6,304 11,589 8,947
4 0,543 0,664 0,861 0,905 0,604 0,883 0,743
5 43,816 46,063 49,899 55,147 44,940 52,523 48,731
6 2,096 2,535 24,047 26,843 2,316 25,445 13,880
7 10,591 9,875 9,116 8,671 10,233 8,894 9,563
8 13,874 13,599 12,554 12,807 13,737 12,681 13,209
9 1,974 2,363 1,094 1,020 2,169 1,057 1,613
10 9,393 10,591 13,736 14,585 9,992 14,161 12,076
11 1,840 1,616 2,484 2,460 1,728 2,472 2,100
12 31,817 34,124 48,424 55,147 32,971 51,786 42,378
13 1,150 1,051 2,014 2,270 1,101 2,142 1,621
14 0,625 0,684 1,051 1,174 0,655 1,113 0,884
15 73,700 79,838 119,104 127,740 76,769 123,422 100,096
16 2,181 2,340 2,560 3,065 2,261 2,813 2,537
17 8,415 8,166 5,755 5,585 8,291 5,670 6,980
18 1,419 1,632 8,846 8,846 1,526 8,846 5,186
19 0,861 0,887 2,612 3,065 0,874 2,839 1,856
20 10,697 10,486 15,029 14,880 10,592 14,955 12,773
21 0,230 0,177 0,795 0,795 0,204 0,795 0,499
NOTA 1 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está
definida por la concentración de un material de referencia internacional.

50
NORMA TÉCNICA COLOMBIANA NTC 5755

Tabla 15. Concentraciones y estadísticas para los datos de la Tabla 14

Laboratorio Laboratorio Diferencia


Laboratorio X Laboratorio Y
Muestra X Y Y-X
i Réplica 1 Réplica 2 Réplica 1 Réplica 2 Rango Rango
In U/l
In U/l In U/l In U/l In U/l In U/l In U/l
1 2,95 2,90 2,44 2,46 0,05 0,02 -0,475
2 1,86 1,97 1,76 1,76 0,11 0,00 -0,155
3 1,89 1,79 2,46 2,44 0,10 0,02 0,610
4 -0,61 -0,41 -0,15 -0,10 0,20 0,05 0,385
5 3,78 3,83 3,91 4,01 0,05 0,10 0,155
6 0,74 0,93 3,18 3,29 0,19 0,11 2,400
7 2,36 2,29 2,21 2,16 0,07 0,05 -0,140
8 2,63 2,61 2,53 2,55 0,02 0,02 -0,080
9 0,68 0,86 0,09 0,02 0,18 0,07 -0,715
10 2,24 2,36 2,62 2,68 0,12 0,06 0,350
11 0,61 0,48 0,91 0,90 0,13 0,01 0,360
12 3,46 3,53 3,88 4,01 0,07 0,13 0,450
13 0,14 0,05 0,70 0,82 0,09 0,12 0,665
14 -0,47 -0,38 0,05 0,16 0,09 0,11 0,530
15 4,30 4,38 4,78 4,85 0,08 0,07 0,475
16 0,78 0,85 0,94 1,12 0,07 0,18 0,215
17 2,13 2,10 1,75 1,72 0,03 0,03 -0,380
18 0,35 0,49 2,18 2,18 0,14 0,00 1,760
19 -0,15 -0,12 0,96 1,12 0,03 0,16 1,175
20 2,37 2,35 2,71 2,70 0,02 0,01 0,345
21 -1,47 -1,73 -0,23 -0,23 0,26 0,00 1,371
Rango combinado 0,119 0,083
Diferencia promedio entre los laboratorios 0,443
NOTA 1 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad está
definida por la concentración de un material de referencia internacional. El rango combinado se calcula según el
algoritmo S del Anexo C.

0,3
x
0,2 x xx
xx
0,1 x x xx x x
x x x x
x xxx x
0,0
0,1 1,0 10,0 100,0 1 000,0 X

X concentración promedio para el laboratorio X, %


Y rango de In[concentraciones] para el laboratorio X

Figura 12. Rangos de las determinaciones replicadas para el laboratorio X (con los rangos calculados a
partir de In[concentraciones])

51
NORMA TÉCNICA COLOMBIANA NTC 5755

0,3

0,2
xx
x x x x
0,1 x
x x x
x
x x x xxx
0,0 x x x
0,1 1,0 10,0 100,0 1 000,0 X

X concentración promedio para el laboratorio Y, %


Y rango de In[concentraciones] para el laboratorio Y

Figura 13. Rangos de las determinaciones replicadas para el laboratorio Y (con los rangos calculados a
partir del In[concentraciones]

3,0
x
2,0
x
x x
1,0
x x
xx xx xx x x
0,0 x
x x x
x x
x
-1,0

-2,0

-3,0
0,1 1,0 10,0 100,0 1 000,0 X

X concentración promedio para los laboratorios X y Y, %


Y diferencia en In[concentraciones] laboratorio Y - laboratorio X

Figura 14. Diferencias entre los promedios del laboratorio Y - X


(con las diferencias calculadas a partir del In[concentraciones])

9. MÉTODOS GRÁFICOS PARA COMBINAR PUNTAJES DE DESEMPEÑO DE VARIAS


RONDAS DE UN DISEÑO DE ENSAYO DE APTITUD (Véase la GTC 55-1 (ISO/IEC
GUIDE 43-1), A.3.2)

9.1 APLICACIONES

Cuando se van a combinar puntajes normalizados en varias rondas, el coordinador debe


considerar la preparación de gráficas, como se describe en los numerales 9.2 y 9.3. El uso de
estas gráficas, en las cuales se combinan los puntajes para varias rondas, puede permitir la
identificación de tendencias y otras características de los resultados que no son aparentes
cuando los puntajes para cada ronda se examinan por separado.

NOTA No se recomienda la utilización de "puntajes de ejecución” en los cuales los puntajes obtenidos por un
laboratorio se combinan en varias rondas pero no se representan gráficamente. El laboratorio puede tener una falla
que se presenta con el material de ensayo utilizado en una ronda pero no en las otras. Un puntaje de ejecución
puede esconder esta falla. El uso de puntajes de ejecución en forma de recuento de las cantidades de señales de
acción y advertencia se describe en el numeral 7.9.

52
NORMA TÉCNICA COLOMBIANA NTC 5755

9.2 GRÁFICO DE CONTROL SHEWHART PARA PUNTAJES-z

9.2.1 Generalidades

Para preparar esta gráfica, los puntajes-z para un laboratorio se trazan como puntos
individuales, con los límites de acción y advertencia establecidos en ± 2,0 y ± 3,0 en el estilo
que se ilustra en la Tabla 16 y la Figura 15. Cuando se miden varias características en cada
ronda, los puntajes-z para diferentes características se pueden trazar en la misma gráfica, pero
los puntos para las diversas características se deberían trazar utilizando diferentes símbolos
y/o diferentes colores. Véase la NTC -ISO 8258 para información sobre el trazado de gráficas
Shewhart.

El gráfico de control Shewhart es un método eficaz para identificar los problemas que causan
valores erráticos grandes de los puntajes-z.

Las reglas para interpretar esta gráfica implican que una señal de fuera de control se indica
cuando:

a) un solo punto está por fuera de los límites de acción (± 3,0),

b) dos de tres puntos sucesivos están por fuera del mismo límite de advertencia (± 2,0).

Cuando el gráfico indica una señal de fuera de control, las acciones establecidas en el numeral
4.1 se deben iniciar. Observe que la desviación estándar para la evaluación de aptitud no
necesariamente es la desviación estándar de los sesgos del laboratorio, de modo que los
niveles de probabilidad que generalmente se asocian con los límites de acción y advertencia en
el gráfico de control Shewhart no se pueden aplicar.

9.2.2 Ejemplo: concentraciones de alérgenos

Los datos se presentan en la Tabla 16 y se ilustran en la Figura 15.

Tabla 16. Datos para 20 rondas de un programa de ensayo de aptitud que involucra la determinación de la
concentración de tres alérgenos (d1, f1 y e3)

Fecha de la ronda Puntaje-z para el alérgeno Cusum para el puntaje-z


d1 f1 e3 d1 f1 e3
1991 Septiembre -1,4 -0,2 -0,5 -1,4 -0,2 -0,5
1991 Diciembre -0,9 -1,3 -1,0 -2,3 -1,5 -1,5
1992 Marzo 0,2 1,6 1,0 -2,1 0,1 -0,5
1992 Junio 1,0 -0,5 -1,1 -0,4
1992 Septiembre -0,4 -1,2 -1,5 -1,5 -1,6 -2,0
1992 Diciembre 0,0 0,3 -0,8 -1,5 -1,3 -2,8
1993 Marzo 0,9 -0,1 -1,1 -0,6 -1,4 -3,9
1993 Junio 2,0 0,3 1,0 1,4 -1,1 -2,9
1993 Septiembre 1,7 2,6 3,1 1,5
1993 Diciembre -0,8 -1,3 -0,6 2,3 0,2 -3,5
1994 Marzo -1,0 1,6 0,4 1,3 1,8 -3,1
1994 Junio -2,0 0,8 0,4 -0,7 2,6 -2,7
1994 Septiembre -1,6 4,0 -0,8 -2,3 6,6 -3,5
1994 Diciembre 1,5 1,1 -0,8 7,7
1995 Marzo 0,1 0,3 -1,5 -0,7 8,0 -5,0
1995 Junio -1,9 0,1 -0,5 -2,6 8,1 -5,5
1995 Septiembre -0,7 1,2 0,4 -3,3 9,3 -5,1
1995 Diciembre 0,3 -1,9 -0,8 -3,0 7,4 -5,9
1996 Marzo -1,3 -1,1 -4,3 6,3
1996 Junio -0,4 1,9 0,0 -4,7 8,2 -5,9

53
NORMA TÉCNICA COLOMBIANA NTC 5755

Y1

4,0
3,0
2,0
1,0
0,0
-1,0
-2,0
-3,0
-4,0
X
Y2

4,0
3,0
2,0
1,0
0,0
-1,0
-2,0
-3,0
-4,0
X
Y3

4,0
3,0
2,0
1,0
0,0
-1,0
-2,0
-3,0
-4,0
12

12

12

12

12
06
09

06
09

06
09

06
09

06
1991 - 09

1992 - 03

1993 - 03

1994 - 03

1995 - 03

1996 - 03

X fecha de la ronda
Y1 puntaje-z para el alérgeno d1
Y2 puntaje-z para el alérgeno f1
Y3 puntaje-z para el alérgeno e3

Figura 15. Gráficos de control Shewhart para los datos de un laboratorio para 20 rondas de un programa de
ensayo de aptitud (datos tomados de la Tabla 16)

54
NORMA TÉCNICA COLOMBIANA NTC 5755

9.3 CUADRO DE CONTROL CUSUM PARA LOS PUNTAJES-z

9.3.1 Generalidades

Para preparar este cuadro, la suma acumulativa (cusum) de los puntajes-z obtenidos por un
laboratorio en varias rondas de un ensayo de aptitud se calculan y se trazan como se ilustran la
Figura 16. Dado que el objetivo del cuadro cusum es detectar los casos en que los puntajes-z
se desvían de cero, el "valor objeto" para el cusum es cero, y el cusum se puede calcular
simplemente como la suma acumulativa de los puntajes-z. Véase la norma ISO/TR 7871 para
información sobre el trazado de los cuadros cusum.

Cuando se miden varias características en cada ronda se recomienda calcular una suma
acumulativa independiente para cada característica.

El cuadro de control cusum es un método eficaz para identificar los problemas que causan un
sesgo en la determinación de una característica, el cual que persiste en varias rondas. Cuando
dicho cuadro de control cusum indica una señal de fuera de control, se deben iniciar las
acciones indicadas en el numeral 4.1.

9.3.2 Ejemplo: concentración de alérgenos

La Tabla 16 contiene los puntajes-z y los valores cusum derivados de ellos para las
determinaciones de tres alérgenos. Los valores cusum se ilustran en la Figura 16. Los gráficos
sugieren que se presentó un cambio en los resultados del laboratorio a partir de marzo de 1994
en adelante.

10,0

0,0

-10,0
12

12

12

12

12
1991 - 09

1992 - 03
06
09

1993 - 03
06
09

1994 - 03
06
09

1995 - 03
06
09

1996 - 03
06

o alérgeno d1
+ alérgeno f1
X alérgeno e3

X fecha de la ronda
Y1 cusum de los puntajes-z

Figura 16. Cuadros de control Cusum de los datos de un laboratorio para 20 rondas de un programa de
ensayo de aptitud (datos tomados de la Tabla 16)

55
NORMA TÉCNICA COLOMBIANA NTC 5755

9.4 GRÁFICOS DE SESGOS NORMALIZADOS DE LABORATORIO FRENTE A LOS


PROMEDIOS DEL LABORATORIO

9.4.1 Generalidades

Cuando el nivel de una característica varía en un amplio rango de una ronda de ensayo de
aptitud a otra, los gráficos de los puntajes-z o de otros puntajes normalizados frente al nivel
demostrarán si el sesgo del laboratorio cambia con el nivel.

9.4.2 Ejemplo: concentraciones de alérgenos

La Tabla 17 presenta las determinaciones de las concentraciones de un alérgeno reportado por


un laboratorio en 13 rondas de un ensayo de aptitud, y la Figura 17 ilustra los puntajes-z
trazados frente al nivel de concentración. El gráfico sugiere que el laboratorio tiende a obtener
puntajes-z positivos a niveles de concentración más altos. Con estos datos, se puede usar el
análisis de regresión para demostrar que la tendencia es estadísticamente significativa.

Tabla 17. Determinaciones de la concentración del alérgeno d1 en un laboratorio

Concentración promedio
Fecha Puntaje-z
kU/l
1992 Junio 12,00 0,7
1992 Septiembre 4,82 -1,3
1992 Diciembre 17,20 2,3
1993 Marzo 8,53 1,3
1993 Junio 8,47 1,4
1993 Septiembre 2,57 0,3
1993 Diciembre 1,94 0,2
1994 Marzo 3,78 -0,1
1994 Junio 2,07 -0,5
1994 Septiembre 19,50 2,1
1994 Diciembre 3,13 1,3
1995 Marzo 16,70 1,7
1995 Junio 5,12 0,5
NOTA 1 Los datos son números de unidades (U) en miles (k) por litro (l) de muestra, donde una unidad
está definida por la concentración de un material de referencia internacional.

Y2

4,0
3,0
2,0
1,0
0,0
-1,0
-2,0
-3,0
-4,0
0,0 5,0 10,0 15,0 20,0 X

X concentración, kU/l
Y puntaje-z para el alérgeno d1

Figura 17. Relación entre el puntaje-z y el nivel de concentración para las determinaciones del alérgeno d1 en
un laboratorio

56
NORMA TÉCNICA COLOMBIANA NTC 5755

9.5 GRÁFICO DE PUNTOS

Cuando se somete a ensayo más de un elemento para el mismo mensurando en una ronda de
un ensayo de aptitud, los gráficos como el de control Shewhart aún pueden ser útiles. Un
gráfico de puntos es similar al gráfico Shewhart, pero con puntos múltiples en cada periodo de
tiempo y donde las líneas conectan la media de las medidas del desempeño en cada periodo
de tiempo.

El siguiente es un ejemplo de una situación en la que se somete a ensayo la glucosa en cinco


muestras diferentes cada tres meses. El criterio para una interpretación aceptable es ± 10 %,
para valores asignados de 60 mg/dl o superiores y de 6,0 mg/dl para valores asignados por
debajo de 60 mg/dl. Esta situación y el amplio rango de valores son adecuados para la
evaluación con puntajes-z, utilizando una desviación estándar fija para el ensayo de aptitud de
3,33 % o 2,0 mg/dl, dependiendo del valor asignado.

El gráfico de la Figura 18 muestra que hubo resultados únicos por fuera de los límites de ± 3 en
la primera y la tercera rondas, y unos pocos valores cuestionables en la serie. En este conjunto
de datos, el laboratorio tiene una repetibilidad deficiente en la primera ronda y un sesgo
ligeramente alto. En la segunda ronda, se ajustó el problema de precisión pero el sesgo no. En
la tercera ronda muestra el sesgo corregido, pero se vuelve a presentar el problema de
precisión original. La cuarta ronda muestra sesgo similar, pero mejor precisión.

Y 0
2000-01-01

2000-01-31

2000-03-01

2000-03-31

2000-04-30

2000-05-30

2000-07-29

2000-08-28

2000-09-27

X
1999-12-02

2000-06-29

-1

-2

-3

-4

X fecha de ensayo
Y puntaje-z

Figura 18. Puntajes-z de la glucosa en cuatro eventos de ensayo de aptitud

57
NORMA TÉCNICA COLOMBIANA NTC 5755

ANEXO A
(Normativo)

SÍMBOLOS

g Número de muestras sometidas a ensayo en una verificación de homogeneidad

n Cantidad de mediciones repetidas hechas para cada muestra

p Cantidad de laboratorios que tomaron parte en una ronda de un ensayo de aptitud

sS Desviación estándar entre las muestras

sx Desviación estándar de los promedios de las muestras

s* Desviación estándar robusta (una desviación estándar calculada con un algoritmo


robusto)

uX Incertidumbre estándar del valor asignado

Wt Rango de la porción entre ensayos

x Resultado de la medición

x* Promedio robusto (un promedio que se calcula por medio de un algoritmo robusto)

z Puntaje utilizado para la evaluación de aptitud

D Sesgo del laboratorio

X Valor asignado para la evaluación de aptitud

σL Desviación estándar interlaboratorio

σ̂ Desviación estándar para la evaluación de aptitud

σr Desviación estándar de la repetibilidad

σR Desviación estándar de la reproducibilidad

φ Factor utilizado para verificar el valor de σ obtenido por percepción

ln Logaritmo natural

58
NORMA TÉCNICA COLOMBIANA NTC 5755

ANEXO B
(Normativo)

VERIFICACIONES DE HOMOGENEIDAD Y ESTABILIDAD DE LAS MUESTRAS

B.1 PROCEDIMIENTO PARA UNA VERIFICACIÓN DE HOMOGENEIDAD

Prosiga con el procedimiento que se indica a continuación:

a) Seleccione un laboratorio para realizar la verificación de homogeneidad. Cuando se


acepta no realizar la verificación de homogeneidad en cada mesurado, seleccione un
método de medición para utilizar en la verificación de homogeneidad y la característica
del material de ensayo que se va a medir, la cual será sensible a la heterogeneidad
entre las muestras. De este modo, con un material granular, seleccione características
totalmente liberadas (por ejemplo el porcentaje que pasa a través de un tamiz con un
tamaño de apertura determinado). Cuando la medición es una proporción, una
característica que es una proporción pequeña puede ser más difícil de homogeneizar y
por ello más reveladora en una verificación de homogeneidad. (Una característica
totalmente liberada es aquella en que las partículas individuales exhiben valores
extremos de la característica. Una característica no está totalmente liberada si las
partículas individuales poseen la característica en grados diversos).

b) Prepare y empaque las muestras para una ronda del diseño de ensayo de aptitud,
asegurándose de que hay suficientes muestras para los participantes en el diseño y
para la verificación de homogeneidad.

c) Seleccione un número g de las muestras en sus empaques finales de manera aleatoria,


donde g mayor o igual a 10. La cantidad de muestras que se incluyen en la verificación
de homogeneidad se puede reducir si se cuenta con datos adecuados de verificaciones
previas de la homogeneidad en muestras similares, preparadas con los mismos
procedimientos.

d) Prepare dos porciones de ensayo de cada muestra utilizando técnicas adecuadas para
el material de ensayo con el fin de minimizar las diferencias debidas a la porción entre
ensayos.

e) Tomando las porciones de ensayo 2g en orden aleatorio, obtenga un resultado de


medición en cada una, completando toda la serie de mediciones en condiciones de
repetibilidad.

f) Calcule el promedio general x , la desviación estándar intra-muestras sw y la desviación


estándar entre las muestras sS, como se indica en el literal B.3.

B.2 CRITERIO DE EVALUACIÓN PARA UNA VERIFICACIÓN DE HOMOGENEIDAD

Compare la desviación estándar entre las muestras sS con la desviación estándar para la

evaluación de la aptitud σ . Las muestras se pueden considerar adecuadamente homogéneas
si:

sS ≤ 0,3 σ̂ (B.1)

59
NORMA TÉCNICA COLOMBIANA NTC 5755

La justificación para el factor de 0,3 es que cuando se cumple este criterio la desviación
estándar entre las muestras contribuye en no más de 10 % de la desviación estándar para el
ensayo de aptitud. Si no se cumple este criterio, el coordinador debe considerar las siguientes
posibilidades:

a) examinar el procedimiento de preparación de la muestra para determinar si es posible


hacer mejoras;

b) distribuir un número de muestras a cada participante en el diseño de aptitud y solicitar


que se obtenga un resultado de medición en cada muestra. La heterogeneidad de las
muestras se incrementará con la desviación estándar intra-muestra:

σ r1 = σ r2 + sS2 (B.2)

Use σr1 en lugar σr en la directriz para la selección de la cantidad de mediciones


aplicadas, ecuación (2).

c) incluir la desviación estándar entre las muestras en la desviación estándar para el


ensayo de aptitud, calculando σ̂ como:

σˆ = σˆ12 + sS2 (B.3)


En donde σ1 es la desviación estándar para el ensayo de aptitud que no incluye ninguna
tolerancia para la heterogeneidad de las muestras.

B.3 FÓRMULA PARA LA VERIFICACIÓN DE LA HOMOGENEIDAD

Los datos de una verificación de homogeneidad se representan mediante:

xt,k

en donde

t representa la muestra (t = 1,2 ..., g)

k representa la porción de ensayo (k = 1,2)

Defina el promedio de la muestra como:

xt,. = (xt,1 + xt,2 )/ 2 (B.4)

Defina el rango de la porción entre ensayos como:

wt = xt,1 − xt,2 (B.5)

Calcule el promedio general:

x.,. = ∑ x t ,. / g (B.6)

60
NORMA TÉCNICA COLOMBIANA NTC 5755

Calcule la desviación estándar de los promedios de las muestras:

sx = ∑ (x t ,. − x., )2 (g − 1) (B.7)

Determine la desviación estándar intra-muestra:

sw = ∑w 2
t (2 g ) (B.8)

en donde las sumatoria se hacen en todas las muestras (t = 1,2 ..., g)

Finalmente, calcule la desviación estándar entre las muestras así:

(
s S = s x2 − s w2 / 2 ) (B.9)

NOTA En lugar de utilizar los rangos, se pueden utilizar las desviaciones estándar de las porción entre los ensayos
como st = wt / 2 .

B.4 PROCEDIMIENTO PARA UNA VERIFICACIÓN DE ESTABILIDAD

a) Use el mismo laboratorio que realizó la verificación de homogeneidad para realizar la


verificación estabilidad. Utilice el mismo método de medición y mida la misma
característica del material ensayo.

b) Permita un retraso de tiempo entre los ensayos de homogeneidad y los de estabilidad


similar al retraso de tiempo que experimentarán las muestras sometidas a ensayo por
los participantes en el ensayo de aptitud.

c) Seleccione un número g de muestras aleatoriamente, donde g ≥3.

d) Prepare dos porciones de ensayo a partir de cada muestra utilizando las mismas
técnicas utilizadas en la verificación de homogeneidad.

e) Tomando las porciones de ensayo 2g en orden aleatorio, obtenga un resultado de


medición yt,k en cada una, completando toda la serie de mediciones en condiciones de
repetibilidad.

f) Calcule el promedio general y.,. de las mediciones obtenidas en el ensayo de


estabilidad.

B.5 CRITERIO DE EVALUACIÓN PARA UNA VERIFICACIÓN DE ESTABILIDAD

Compare el promedio general de las mediciones obtenidas en la verificación de homogeneidad


con el promedio general de los resultados obtenidos en la verificación de estabilidad. Se puede
considerar que las muestras son adecuadamente estables si:

x,., − y.,. ≤ 0,3σ̂ (B.10)

Si este criterio no se cumple, examine la preparación de la muestra y los procedimientos de


almacenamiento para determinar si es posible hacer mejoras.
61
NORMA TÉCNICA COLOMBIANA NTC 5755

B.6 EJEMPLO: COBRE EN HARINA DE SOYA (μg/g)

En un diseño en ensayo de aptitud en el cual se debe utilizar harina de soya como material de
ensayo, la desviación estándar para la evaluación de aptitud se ha establecido en σ̂ = 1,1 μg/g
utilizando los resultados de un experimento de precisión. De acuerdo con el criterio (B.1), la
desviación estándar entre las muestras no debería ser superior a 0,3 x 1,1 = 0,330 µg/g.

Para una verificación de homogeneidad, se escogieron aleatoriamente 12 de las muestras de


harina de soya preparadas para el diseño de ensayo de aptitud y se determinó el contenido de
cobre de dos porciones de ensayo de cada una de las muestras. Los datos se presentan en la
Tabla B.1 junto con los promedios de las muestras y los rangos de porción entre los ensayos.

La fórmula indicada en B.3 se puede emplear para calcular los siguientes valores:

Promedio general x .,. = 10,02 μg/g

Desviación estándar de los promedios de las muestras sx = 0,340 μg/g

Desviación estándar intra- muestras sw = 0,246 μg/g

Y por lo tanto, la desviación estándar entre las muestras ss = 0,292 μg/g

Este valor es inferior a 0,340 μg/g, de manera tal que se puede concluir que las muestras son
adecuadamente homogéneas para utilizar en el diseño de ensayo de aptitud.

Para la verificación de la estabilidad, se sometieron a ensayo tres de las muestras por parte del
mismo laboratorio un mes después y se obtuvo un resultado promedio de y .,. = 10,78 μg/g. La
diferencia y .,. - x .,. = 0,76 μg/g excede 0,3 σ̂ = 0,33 μg/g, de modo que se puede concluir
que las muestras no son adecuadamente estables.

Tabla B.1. Resultados de medición para la verificación de homogeneidad,


cobre en harina de soya (mg/g)

Número de la Porción de Porción de Promedio de la Rango de porción


muestra ensayo ensayo muestra entre ensayos
t 1 2 xt wt
1 10,5 10,4 10,45 0,1
2 9,6 9,5 9,55 0,1
3 10,4 9,9 10,15 0,5
4 9,5 9,9 9,70 0,4
5 10,0 9,7 9,85 0,3
6 9,6 10,1 9,85 0,5
7 9,8 10,4 10,10 0,6
8 9,8 10,2 10,00 0,4
9 10,8 10,7 10,75 0,1
10 10,2 10,0 10,10 0,2
11 9,8 9,5 9,65 0,3
12 10,2 10,0 10,10 0,2

62
NORMA TÉCNICA COLOMBIANA NTC 5755

ANEXO C
(Normativo)

ANÁLISIS ROBUSTO

C.1 ANÁLISIS ROBUSTO: ALGORITMO A

Este algoritmo produce valores robustos del promedio y de la desviación estándar de los datos
a los cuales se aplica.

NOTA 1 Los algoritmos A y S que se indican en este anexo se tomaron de la NTC 3529-5 (ISO 5725-5).

NOTA 2 La robustez es una propiedad del algoritmo de estimación, no de los estimados que produce, de manera
que no es estrictamente correcto denominar robustos a los promedios y las desviaciones estándar que se calculan
mediante tal algoritmo. Sin embargo, para evitar el uso de terminología excesivamente pesada, los términos
"promedio robusto" y "desviación estándar robusta" se deberían entender en esta norma como estimados de la
media de la población o de la desviación estándar de la población calculados utilizando un algoritmo robusto.

Indique los elementos p de los datos, clasificados en orden creciente mediante:

x1, x2 , ..., xi ..., x p

Calcule los valores iniciales para x* y s*, así:

x * = mediana de xi (i = 1, 2,..., p ) (C.1)

s * = 1,483 mediana de x i − x * (i = 1,2,..., p ) (C.2)

Actualice los valores de x* y s* así, calcule:

δ = 1,5s * (C.3)

Para cada xi (i = 1, 2,..., p ) , calcule:

⎧ x * − δ , si x i < x * − δ ⎫
⎪ ⎪
⎪ ⎪
x *i = ⎨ x * + δ , si x i > x * + δ ⎬ (C.4)
⎪x , de otra manera ⎪
⎪⎩ i ⎪⎭

Calcule los nuevos valores de x* y s* a partir de:

x* = ∑x *
i p (C.5)

∑ (x )
2
s* = 1,134 *
i −x* ( p − 1) (C.6)

en donde las sumatoria es en todo i.

Los estimados robustos x* y s* se pueden derivar mediante un cálculo repetido, es decir


actualizando los valores de x* y s* varias veces utilizando los datos modificados hasta que el
proceso converja. Se puede asumir la convergencia cuando no hay cambio de una duplicación a la
siguiente en la tercera cifra significativa de la desviación estándar robusta y de la cifra equivalente
del promedio robusto. Este es un método sencillo para programar en una computadora.
63
NORMA TÉCNICA COLOMBIANA NTC 5755

C.2 ALGORITMO S

Este algoritmo se aplica a las desviaciones estándar (o los rangos). Produce un valor
combinado robusto de las desviaciones estándar o los rangos a los cuales se aplica.

Indique los elementos p de los datos, clasificados en orden creciente así:

w1, w2 ,..., wi ,..., w p

(Éstos pueden ser rangos o desviaciones estándar)

Indique el valor combinado robusto con w* y los grados de libertad asociados a cada wi con ν.
(Cuando wi es un rango, v = 1. Cuando wi es la desviación estándar de n resultados de ensayo,
v = n - 1). Obtenga los valores de ξ y η requeridos por el algoritmo a partir de la Tabla C.1.

Calcule el valor inicial para w* así:

w * = mediana de wi (i = 1, 2, ..., p ) (C.7)

Actualice el valor de w* de la siguiente manera, calcule:

ψ = η x w* (C.8)

Para cada wi (i = 1, 2,..., p ) , calcule:

⎧ψ , si w i >ψ ⎫
w *i = ⎨ ⎬ (C.9)
⎩w i de otra manera ⎭

Calcule el nuevo valor de w* a partir de:

w* = ξ ∑ (w ) * 2
i p (C.10)

El estimado robusto w* se puede derivar con un cálculo repetido actualizando el valor w* varias
hasta que el proceso converja. Se puede asumir la convergencia cuando no hay cambio de una
duplicación a la siguiente en la tercera cifra significativa del rango robusto. Este es un método
sencillo para programar en una computadora.

Tabla C.1. Factores requeridos para el análisis robusto: algoritmo S

Grados de libertad Factor límite Factor de ajuste


ν η ξ
1 1,645 1,097
2 1,517 1,054
3 1,444 1,039
4 1,395 1,032
5 1,359 1,027
6 1,332 1,024
7 1,310 1,021
8 1,292 1,019
9 1,277 1,018
10 1,264 1,017
NOTA Los valores de ξ y η se derivan en el Anexo B de la NTC 3529-5 (ISO 5725-5)

64
NORMA TÉCNICA COLOMBIANA NTC 5755

ANEXO D
(Informativo)

BIBLIOGRAFÍA

[1] THOMPSON, M and WOOD, R. The International Harmonized Protocol for the
Proficiency Testing of (Chemical) Analytical Laboratories, AOAC, September 1993.

[2] JACKSON, J.E. Quality Control Methods for Two Related Variables. Industrial Quality
Control, 7, 1956, pp. 2-6.

[3] HORWITZ, W. Evaluation of Analytical Methods Used for Regulations of Food and
Drugs. Anal. Chem., 54, 1982, pp. 67A-76A

[4] NTC-ISO 8258, Gráficos de control de Shewhart (ISO 8258, Shewhart Control Charts).

[5] ISO/TR 7871, Cumulative Sum Charts. Guidance on Quality Control and Data Analysis
Using CUSUM Techniques.

[6] VAN NULAND, Y. ISO 9002 and the Circle Technique, Qual. Eng., 5, 1992, pp. 269-291.

[7] GTC 51, Guía para la expresión de incertidumbre en las mediciones. (GUM:1993, Guide
to the Expression of Uncertainty in Measurement BIPM; IEC, IFCC; ISO; IUPAC; IUPAP,
OIML2)).

[8] NTC 3529-2, Exactitud -veracidad y precisión- de métodos de medición y resultados.


Parte 2: Método básico para la determinación de repetibilidad y reproducibilidad en un
método normalizado de medición. (ISO 5725-2, Accuracy (Trueness and Precision) of
Measurement Methods and Results. Part 2: Basic Method for the Determination of
Repeatability and Reproducibility of a Standard Measurement Method).

[9] NTC 3529-3, Exactitud -veracidad y precisión- de métodos de medición y resultados.


Parte 3: Mediciones intermedias de la precisión de un método normalizado de medición.
(ISO 5725-3), Accuracy (Trueness and Precision)of Measurement Methods and Results.
Part 3: Intermediate Measures of the Precision of a Standard Measurement Method.

[10] NTC 3529-4, Exactitud -veracidad y precisión- de métodos de medición y resultados.


Parte 4: Métodos básicos para la determinación de la veracidad de un método de
medición normalizado. (ISO 5725-4, Accuracy (Trueness and Precision) of Measurement
Methods and Results. Part 4: Basic Methods for the Determination of the Trueness of a
Standard Measurement Method).

[11] NTC 3529-5, Exactitud -veracidad y precisión- de métodos de medición y resultados.


Parte 5: Métodos alternativos para la determinación de la precisión de un método de
medición normalizado. (ISO 5725-5, Accuracy (Trueness and Precision) of Measurement
Methods and Results. Part 5: Alternative Methods for the Determination of the Precision
of a Standard Measurement Method).

[12] NTC 3529-6 Exactitud (veracidad y precisión) de resultados y métodos de medición.


Parte 6: Uso en la práctica de los valores de exactitud. (ISO 5725-6, Accuracy (Trueness
and Precision) of Measurement Methods and Results. Part 6: Use in Practice of Accuracy
Values).

65
NORMA TÉCNICA COLOMBIANA NTC 5755

[13] NTC-ISO/IEC 17025, Requisitos generales de aptitud de laboratorios de ensayo y


calibración (ISO/IEC 17025, General Requirements for the Competence of Testing and
Calibration Laboratories).

[14] GTC 55-2, Ensayos de aptitud por comparaciones entre laboratorios. Parte 2: Selección
y uso de programas de ensayo de aptitud por organismos de acreditación de laboratorios
(ISO/IEC Guide 43-2:1997, Proficiency Testing by Interlaboratory Comparisons. Part 2:
Selection and Use of Proficiency Testing Schemes by Laboratory Accreditation Bodies).

66
NORMA TÉCNICA COLOMBIANA NTC 5755

DOCUMENTO DE REFERENCIA

INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Statistical Methods for Use in


Proficiency Testing by Interlaboratory Comparisons. Geneva: ISO, 2005, 66p (ISO 13528:2005 (E)).

67