Vous êtes sur la page 1sur 61

ESTADSTICA BSICA APLICADA AL

ANLISIS INSTRUMENTAL

Anglica Varn Lpez

Universidad del Valle


2017
QUIMIOMETRIA

Disciplina que utiliza


mtodos matemticos y
estadsticos para disear o
seleccionar procedimientos y
experimentos de medida
ptimos, y para proporcionar
la mxima informacin
mediante el anlisis de datos
qumicos

2
Optimizacin de parmetros experimentales
Calibracin ESTADSTICA
Procesamiento de Seales Matemtica
Anlisis de datos Computacin

Recoleccin, agrupacin,
ESTADSTICA presentacin, anlisis e
interpretacin de datos
provenientes de una poblacin

Mtodo cientfico que pretende


sacar conclusiones de una
poblacin a partir de las
observaciones hechas sobre una
3 muestra de sta.
POBLACION Vs MUESTRA
Poblacin: Es el conjunto total de objetos que comparten
una o ms caractersticas

Muestra: Es un subconjunto representativo de la


poblacin

Representativa Tamao
Aleatoria

Estadstica Calidad de Medidas

4
Permite explicar las correlaciones y
dependencias de un fenmeno de Diseo de Experimentos
ocurrencia en forma aleatoria o Anlisis Multivariante
condicional.

Factores k = variables
Diseo de experimentos ( pH, Temperatura, presin)

Niveles = valores de las variables


Evaluar los efectos de (pH = 4, 7, 10)
diversos factores y sus
niveles sobre un proceso Respuesta Y= Variable de inters
o variable de respuesta (rendimiento de reaccin)

Repeticiones n = # de rplicas

5 Tamao del experimento N = # nivelesk . n


Unifactorial Efecto de 1 factor sobre la respuesta
Diseo
Factorial 2k Diseo 22 2 x 2 4 experimentos

Efectos principales k1
Anlisis de k2
varianza
Interacciones k1 Vs k2

Significancia
Optimizar condiciones experimentales

Rendimiento de un proceso
Una industria qumica, que obtiene un determinado producto, est
interesada en comprobar si los cambios de temperatura influyen en la
cantidad de producto obtenido.
Temperatura Masa Producto
C (g)
15 1000 1002 998 999
25 1003 999 997 1000
35 1005 995 998 1002
45 996 1006 1000 999

Diseo: Unifactorial
Factores = Temperatura (C)
Variable de Respuesta = Masa de producto (g)
Niveles o tratamientos = 4
Numero de repeticiones n = 4
Nmero total de observaciones N = 16
7 Que conclusin arrojara el experimento realizado?
Ejemplo: Se desea evaluar el efecto del pH y el oxgeno disuelto en
la fotodegradacin de un contaminante en agua.

Cual diseo me permitira evaluar los efectos de estas variables con


el menor numero de experimentos?

K1 K2
Diseo:
[pH] [O2 disuelto]
Factores=
1 Variable de Respuesta =
Niveles o tratamientos =
2 +
Numero de repeticiones n =
3 +
Nmero total de observaciones N =
4 + + Que conclusin arrojara el experimento
nivel bajo realizado?
+ nivel alto
8
220 T impermeabilizacin
58 T Enfriamiento

Fuerza

Modelar la manera en que los cambios en las variables afectan una


respuesta de inters.
Hallar los niveles de las variables que optimizan una respuesta.
Seleccionar las condiciones operativas para cumplir las especificaciones.
9
Anlisis multivariante
Regresin Mltiple

Correlacin entre variables


R2

Predecir comportamientos

Reducir # de variables
evaluadas en un sistema
de estudio

10
ESTADSTICA

Cualitativo Anlisis Cuantitativo

CALIDAD CONFIABILIDAD

Pretratamiento y tratamiento de muestra

Durante

MUESTREO Antes ANALISIS Despus PROCESAMIENTO


DE DATOS

11 ERRORES
ERRORES

Sistemticos Aleatorios

Unidireccional Multidireccional

EXACTITUD PRECISIN

CONFIABILIDAD

12
RESULTADO CONFIABLE

Valido Preciso Exacto

Preciso Variabilidad
Variabilidad
entre las de la medicin
+
mediciones con el valor
Exacto esperado

13
Preciso pero NO Exacto

NI Preciso NI Exacto

Preciso Y Exacto VALIDO

14
ERROR = +

Detectable Al azar
Corregible No detectable

Uso de mtodos estandarizados Incremento en el


Planificacin de experimentos numero de medidas
Calibracin de equipos
Uso de patrones o estndares certificados
Uso de blancos de anlisis
15
Problema:
Una muestra certificada de suelo con 2.00 0.05 mg kg-1 de Hg
fue enviada a 4 laboratorios diferentes para ser analizados y
controlar su calidad de anlisis, los resultados tabulados fueron:
A 1.97 1.98 2.03 1.95 2.02 2.03
B 1.90 1.88 1.72 1.91 1.89 1.95
C 2.01 2.03 1.92 2.09 1.87 1.90
D 2.12 2.10 2.10 2.14 2.11 2.15

Indique los tipos de errores que se detectan en cada laboratorio.


Cuales son las posibles causas de esos errores y que
recomendara al jefe respectivo para eliminarlos?

16
Media Desviacin estndar
s

Poblacin

Muestra

Rango: Xi max - Xi min


17
GRADOS DE LIBERTAD
Nmero de valores no restringidos

Escoja 5 nmeros al azar


3 5 17 2 10 5 grados de libertad
Escoja 5 nmeros cuyo promedio sea 8
3 5 17 2 13 4 grados de libertad
Escoja 5 valores cuyo promedio sea 8 y su desviacin
estndar sea 6
3 5 17 3.7 11.3 3 grados de libertad

GL = n - m
18
m = Nmero de restricciones
Otras formas de expresar la dispersin de los datos
Desviacin estndar relativa:

Coeficiente de variacin:

Varianza:

19
Datos ordenados
} n = impar Valor medio de la serie de datos
Mediana (Me):
n = par Valor medio de los dos datos del
centro de la serie de datos
Valor de la serie de datos que se repite
Moda (Mo):
con mayor frecuencia

Ejercicio: Determine la Media, S, RSD,


CV, S2, rango, moda y mediana.
1.97 1.98 2.03 1.95 2.02 2.03
1.90 1.88 1.72 1.91 1.89 1.95
2.01 2.03 1.92 2.09 1.87 1.90
2.12 2.10 2.10 2.14 2.11 2.15

20
DISTRIBUCION DE LOS ERRORES

Distribucin de los errores

Grficas de distribucin de frecuencias

CURVAS DE
HISTOGRAMAS DISTRIBUCION

21
HISTOGRAMA

Frecuencias absolutas ni = N de veces que se repite cada variable Xi

Frecuencias relativas fi : Es el cociente entre la frecuencia absoluta y


el tamao de la muestra.
fi = ni /n
Total de las frecuencias
Frecuencias absolutas acumuladas Ni: absolutas para todos los Xi
que un cierto valor X, en una
Ni = ni + Ni-1
lista ordenada de eventos.
Frecuencias relativas acumuladas Fi: Cociente entre la frecuencia
Fi = Ni/n absoluta acumulada y el total de
22 la muestra.
Ejemplo:

La siguiente tabla muestra los resultados obtenidos del


anlisis de Cd en un suelo expresados en mg kg-1

0.80 0.82 0.79 0.84 0.82 0.83 0.80 0.79 0.77 0.82
0.84 0.76 0.78 0.85 0.78 0.81 0.80 0.77 0.84 0.81
0.79 0.78 0.80 0.79 0.80 0.80 0.81 0.83 0.81 0.77
0.80 0.82 0.79 0.81 0.80 0.79 0.76 0.81 0.82 0.80
0.81 0.80 0.79 0.77 0.81 0.78 0.79 0.79 0.80 0.83

23
1. Ordenar
2. Tabular la frecuencia
3. Representar grficamente

Ordenamiento

0.76 0.76 0.77 0.77 0.77 0.77 0.78 0.78 0.78 0.78
0.79 0.79 0.79 0.79 0.79 0.79 0.79 0.79 0.79 0.80
0.80 0.80 0.80 0.80 0.80 0.80 0.80 0.80 0.80 0.80
0.81 0.81 0.81 0.81 0.81 0.81 0.81 0.81 0.82 0.82
0.82 0.82 0.82 0.83 0.83 0.83 0.84 0.84 0.84 0.85

24
Tabulacin
Concentracin Frecuencia Frecuencia Frecuencia Frecuencia
(mg/kg) relativa acumulada relativa
acumulada
0.76 2 0,04 2 0,04
0.77 4 0,08 6 0,12
0.78 4 0,08 10 0,20
0.79 9 0,18 19 0,38
0.80 11 0,22 30 0,60
0.81 8 0,16 38 0,76
0.82 5 0,10 43 0,86
0.83 3 0,06 46 0,92
0.84 3 0,06 49 0,98
0.85 1 0,02 50 1,00
Total 50 1.00

25
Representacin grfica
0,25
12 ojiva 100%

Frecuencia Relativa
10 0,20
80%
Frecuencia

8
60% 0,15
6
40% 0,10
4
2 20%
0,05
0 0%
0.76
0.77
0.78
0.79
0.80
0.81
0.82
0.83
0.84
0.85

0
0.76 0.80 0.85
ppm Cd
Concentracin

26 11 datos = 0.80 22% datos = 0.80


Frecuencia Relativa Acumulada
50 1.0
Frecuencia acumulada
40 0,8

30 0,6

20 0,4

10 0,2

0 0
0.76 0.80 0.85 0.76 0.80 0.85
Concentracin Concentracin

30 datos 0.80 60% datos 0.80


Barras unidas variable continua Barras separadas Variables
discretas
27 Histograma Diagrama de frecuencias
Nmero de datos n

Agrupar Clases = intervalos continuos

Intervalo (i)
CELDA

Limite superior (Ls)


Marcas de clase (Xm) Limite inferior (Li)

28
Nmero de intervalos (h) = R/ i 5 - 15

Rango( R ) : Xmx- Xmin i = ancho del intervalo

Mtodo de Sturges

h = 1 + 3.322 log n Entero mas cercano

i = R / (1 + 3.322 log n) Valor impar mas cercano

* i = 0.09 /(1 + 3.322 log 50) = 0.014 0,01

29
EJEMPLO: Construir el histograma de la siguiente serie de datos
del volumen de agua medido por una pipeta volumtrica de 2,5 ml.
2,559 2,556 2,566 2,546 2,561
2,570 2,546 2,565 2,543 2,538
2,560 2,560 2,545 2,551 2,568
2,546 2,555 2,551 2,554 2,574 Nmero de datos: 110
2,568 2,572 2,550 2,556 2,551
2,561 2,560 2,564 2,567 2,560
2,551 2,562 2,542 2,549 2,561
2,556 2,550 2,561 2,558 2,556
2,559 2,557 2,532 2,575 2,551
2,550 2,559 2,565 2,552 2,560
2,534 2,547 2,569 2,559 2,549
2,544 2,550 2,552 2,536 2,570
2,564 2,553 2,558 2,538 2,564
2,552 2,543 2,562 2,571 2,553
2,539 2,569 2,552 2,536 2,537
2,532 2,552 2,575 2,545 2,551
2,547 2,537 2,547 2,533 2,538
2,571 2,545 2,545 2,556 2,543
2,551 2,569 2,559 2,534 2,561
2,567 2,572 2,558 2,542 2,574
2,570 2,542 2,552 2,551 2,553
2,546 2,531 2,563 2,554 2,544
30
h = (1 + 3.322 log n) = (1 + 3,322 log 110) = 7,8 8
i = R/h = (2,575-2,531)/8 = 0.0055 0,005
Valor impar mas cercano

Limites de celda Frecuencia


2,531 - 2,535 6
2,536 - 2,540 8
2,541 - 2,545 12
2,546 - 2,550 13
2,551 - 2,555 20
2,556 - 2,560 19
2,561 - 2,565 13
2,566 - 2,570 11
2,571 - 2,575 8
Total 110
31
Histograma
20 100%
frecuencia absoluta
18 90%
16 80%
14 frecuencia relativa 70%
acumulada
Frecuencia

12 60%
10 50%
8 40%
6 30%
4 20%
2 10%
0 0%
2.535 2.540 2.545 2.550 2.555 2.560 2.565 2.570 2.575

Volumen (mL)

32
DISTRIBUCIN NORMAL - CURVA DE GAUSS
Representacin de una funcin de probabilidad continua

-3 -2 -1 1 2 3

33

Media
1 2 Mediana IGUALES
Moda

Simetra alrededor de la media

rea bajo la curva

La unidad

34
DISTRIBUCION NORMAL ESTANDARIZADA

N(,) N(0,1) (-Z2 / 2)


F(Z) = e
(2)1/2
=0
=1
Z = Xi -

F (z)

rea bajo la curva

-3 -2 -1 0 +1 +2 +3
La unidad
z
35
36
37
38
39
Cual es la probabilidad de que en una distribucin normal
estandarizada:
Z -1.55
Z - 2.09
40 - 1.80 Z -1 .00
Distribucin Normal
40
35
30
probabilidad (%)

25
20
15
10
5
0
2.520 2.530 2.540 2.550 2.560 2.570 2.580
volumen (mL)
41
Curva Normal estndar para medidas de agua en una
pipeta volumtrica de 2.5 mL
0.45
(-Z2 / 2)
0.40 F(Z) = e
0.35 (2)1/2
0.30
Probabilidad

0.25
0.20
0.15
0.10
0.05
0.00
-3 -2 -1 0 1 2 3
Z

42
Ejemplo : Si las determinaciones repetidas del volumen medido por la pipeta
volumtrica tienen una distribucin normal y su media fue de 2.554 mL y su
desviacin estndar 0.011 mL, cual es la probabilidad de que el volumen
medido por la pipeta sea menor a 2.530 mL.

a) Que porcentaje de datos corresponder a un volumen entre 2.543 y 2.565


mL.
b) Cual es la probabilidad de que el volumen medido sea mayor a 2.550 mL

Ejercicio:
El contenido de un principio activo de un medicamento en pastillas debe ser
de 0.438 mg. Un gran nmero de mediciones del contenido de principio
activo en las pastillas dieron una media de 0.635 mg y una desviacin
estndar de 0.082 mg. S las mediciones tenan una distribucin Normal y se
verific que los anlisis hechos fueron correctos, Cul es el % total de las
pastillas analizadas que no cumple con las especificaciones si la mxima
desviacin estndar permitida para el contenido de principio activo es de
0.050 mg.
43
DISTRIBUCIN MUESTRAL DE LA MEDIA
Si la distribucin de datos de una poblacin no es normal, la
distribucin de un conjunto de medias de muestras provenientes de
dicha poblacin si se distribuir normalmente a medida que n aumente

TEOREMA DEL LIMITE CENTRAL

Para una muestra de n


medidas
Error tpico
o
=
Error estndar de la media

(e.e.m)
sm = sx
44
0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486

Datos individuales Medias


= 0.500 = 0.500
S = 0.0165 S = 0.0165/ 5 = 0.0074

45
70 distribucion de medidas individuales
distribucion de medias
60

50

40

30

20

10

0
0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53
concentracin [ppm]
46
47
48
Ejemplo: la distribucin de los valores del principio activo en las
pastillas de medicamento tuvo una media igual a 0.635 mg y una
desviacin estndar de 0.082 mg. Si los datos se agruparan para
hacer una distribucin de medias cual es la probabilidad que una
muestra de 30 pastillas tenga en promedio una concentracin de
principio activo entre 0.388 y 0.488 mg

49
INTERVALO DE CONFIANZA

Resultado analtico: Intervalo de confianza

Intervalo de confianza (IC): Intervalo dentro del cual se puede suponer


que se encuentra el valor verdadero.

Depende de la certeza 95%, 99%, 99.9%


deseada

Mayor certeza Mayor Intervalo

50
Para muestras grandes n
IC:
Z (95%) =1.96
Z
Z (99%) = 2.58

- Z Z

Limites de confianza: Valores extremos del intervalo de confianza

Lmite superior + Z
Z

Lmite inferior - Z

51
Para muestras pequeas
IC

t(n-1) s

Lmites de Confianza IC = t s

Lmite superior + t(n-1) s Confianza = C = t s
absoluta
Lmite inferior - t(n-1) s 2
n ts

52 C
Ejemplo:
1- Se determin la concentracin de Hg en 51 muestras de agua
potable. La media fue de 0.95 ng/L con una desviacin estndar
de 0.09 ng/L
a- Calcular el intervalo de confianza de la concentracin media
de Hg en el agua con 95% de certeza.
b- Cual debe ser el tamao de muestra para reducir el
intervalo de confianza a 0.02?

2- Para la determinacin de Cd en suelos se tomaron 11


muestras cuyo promedio fue de 1.0 mg/kg con un intervalo de
confianza al 95 % de 0.2 mg/kg. Cual fue la desviacin
estndar de los datos?.

53
Ejercicio:
El contenido de alcohol en una muestra de sangre certificada se
determin empleando una nueva metodologa, obteniendo los
siguientes resultados 0.084%, 0.089% y 0.079%.

a. Cuales son los lmites de confianza al 95% para la media,


suponiendo que las tres medidas dan una buena estimacin de la
precisin del mtodo.

b. Cual es el coeficiente de variacin de las medidas?

c. Cual sera el nmero de medidas necesario para reducir el IC a


0.002%

d. Si el contenido de alcohol reportado para la muestra certificada es de


0.100 0.002 %, que podra usted concluir sobre el error del nuevo
mtodo?
54
Deteccin de errores sistemticos
IC

t(n-1) s
No incluye a

Error sistemtico

Si el valor real de una medida es conocido y el


intervalo de confianza para la media experimental
no incluye este valor, es probable que exista error
sistemtico
55
PROPAGACIN DEL ERROR ALEATORIO

Cada Paso Procedimiento


Error aleatorio
analtico

Una medida no puede ser mas confiable o Resultado final


precisa que su paso menos preciso

El conocimiento de la precisin de los distintos pasos de un


procedimiento y de la forma como el error se propaga es
importante para determinar la incertidumbre global en la
medida obtenida.

56
DESVIACIN ESTNDAR DE RESULTADOS
CALCULADOS

57
Cifras significativas

Nmero de dgitos con que debe expresarse un valor teniendo


en cuenta la incertidumbre en la medida.
Corresponde a todos los dgitos que se conocen con certeza
y el primer digito incierto

REGLAS
Todos los dgitos entre 1-9 son significativos y el cero si est
entre valores distintos de cero.
El cero antes del punto decimal no es significativo
Todos los ceros a la izquierda de una cifra decimal que no
estn entre nmeros distintos de cero no son significativos
Los ceros finales despus del punto decimal son significativos
Los ceros finales en un nmero entero pueden o no ser
58 significativos
Ejercicios:
1. Cuantas cifras significativas tiene cada uno de los siguientes
valores:
6.023 x 1023 4
99.90 4
0.0200 3
0.00301 3
1 x 104 1
2.0 2

2. Se midieron 25 mL de agua en los siguientes materiales


volumtricos: bureta (0.01), probeta (1), pipeta graduada
(0.2, pipeta volumtrica (0.002), matraz aforado (0.003).

a. Exprese el volumen medido en cada instrumento con el nmero


correcto de cifras significativas.
59
Numero de cifras significativas en los resultados

Suma diferencia El resultado contendr igual nmero de


decimales que el valor con menos decimales.

Multiplicacin - divisin El resultado tendr tantas cifras


significativas como el valor con menos
cifras significativas usado en el clculo

Logaritmos En el logaritmo de un valor la mantisa debe


contener igual nmero de dgitos como cifras
significativas haya en el valor
Log 650 = 2.81291 = 2.813

60
caracterstica mantisa
Antilogaritmos el resultado debe contener tantas cifras
significativas como dgitos tenga la mantisa

Anti log 2.813 = 650

Redondeo de datos
1. Si el digito a la derecha del ltimo digito requerido es 5, el
ultimo digito requerido se mantiene sin cambio.

2. Si el digito a la derecha del ltimo digito requerido es 5, el


ultimo digito requerido aumenta una unidad.

3. Si el digito a la derecha del ltimo digito requerido es 5, el


ultimo digito requerido se redondea al nmero par mas cercano

61

Vous aimerez peut-être aussi