Vous êtes sur la page 1sur 33

Estadística descriptiva II

GLG-213

Universidad Mayor de San Andrés


Desviación estándar y varianza de la
media
• Si la media de una población es calculada de una selección aleatoria de
muestras, esta media no se correlaciona exactamente con la media
verdadera.
• Si varias muestras son tomados de la población, entonces la media variara
y se deberá obtener una desviación estándar de esta variación
la varianza de la media es :

 
n 2
1
sx   xi  x
2

n  1 * n i 1
y la desviación estándar :

 xi  x 
n 2

s
sx   i 1

n n  1 * n
Universidad Mayor de San Andrés
Desviación estándar y varianza de la
media
• Los 5 valores de densidad que vimos antes:
3.1, 3.3, 3.4, 3.5 y 3.6 g/cm3, tienen una media de 3.4 g/cm3
• La desviación estándar de la media es:

sx 
3.1  3.42  3.3  3.42  3.4  3.42  3.5  3.42  3.6  3.42
5*4
0.04  0.01  0  0.01  0.04 0.1
sx    0.07
20 20
• Esta formula es valida solo para valores estadísticamente
independientes (no para valores de pozos a diamantina)

Universidad Mayor de San Andrés


Ponderación de diferentes varianzas
de la media
• Durante el calculo de las varianzas de una reserva de un deposito mineral, es
común encontrar que las varianzas de diferentes partes del deposito deben ser
combinadas. Asumiendo que la media total del deposito es calculada sobre la base
de un factor de ponderación (el volumen o tonelaje):
n

x i * vi
x tot  i 1
n

vi 1
i

Las varianzas tambien pueden ser ponderadas por el volumen (tonelage) del deposito
n

 s i * vi
2 2

s 2 tot  i 1
2
 n 
  vi 
 i 1 

Universidad Mayor de San Andrés


Ponderación de diferentes varianzas
de la media
• Ejemplo:
El promedio de ley de un deposito de Pb y Zn hospedado en carbonatos son determinados para 3
zonas homogéneas. Las varianzas de Zn en esas zonas son:
Zona Varianza (%Zn) Volumen del
deposito
I 64.5 1.8 *106
II 83.2 2.0*106
III 105.8 1.6*106

(64.5 *1.8) 2  (83.2 * 2.0) 2  (105.8 *1.6) 2


s 2

1,8  2.0  1,62
tot

812.63 812.63
s 2 tot    27.8 (% Zn) 2

(5.4) 2 29.16
s tot  5.27 % Zn
La desviación estándar para todo el deposito es  5.27 % Zn
Estimación del error
• Se asume que la media de las muestras se
puede alejar de aquella de la población de
donde fue colectada
• Cuan precisa es la media con respecto a la
población?

Universidad Mayor de San Andrés


Estimación del error
• Supongamos que varias muestras de concentrado de Zn se colectan
• La media es 50.5% Zn, la varianza de la media es s2x=1.56 (%Zn) y la desviación es
sx = +/-1.25%Zn.
• Todos los valores de media describen ahora una distribución normal con media
=50.5 y s =+/-1.25
• El verdadero valor de la media del concentrado de zinc yace en algún lugar dentro
de esta distribución normal

Universidad Mayor de San Andrés


Estimación del error
• Para una distribución normal prácticamente 2/3 de todos los valores están
entre +s y –s, y cerca del 95% de todos los valores están entre+2s y-2s.
• Si numerosas series muestras de concentrado de zinc son recolectadas
esto implica que 2/3 de todas las muestras yacen entre 50.5 +/-1.25 (o sea
entre 49.25 y 51.75% de zinc) y solo cada un veinteavo (~5%) de la serie
estará fuera de 50.5+/- 2*1.25 (o sea menor que 48% o mayor a 53%)

Universidad Mayor de San Andrés


Estimación del error
• Esto muestra que una indicacion del error no tiene significado
a no ser que se le acompañe por un nivel de confianza, por lo
que podemos usar los siguientes enunciados:
– A un 95% de nivel de confianza:
50.5% +/- 2*1.25 = 50.5% +/-2.5%Zn
– A un 68% de nivel de confianza:
50.5%+/- 1*1.25 = 50.5%+/- 1.25% Zn
• Entonces el nivel de confianza corresponde al área bajo la
curva de distribución normal dentro de los limites de
confianza,
• Las áreas bajo las “colas” que están fuera de esos limites son
indicativos de la probabilidad del error

Universidad Mayor de San Andrés


Estimación del error distribución
t student
• Niveles de confianza de 99.95% se requieren en trabajos
médicos o de biología, pero en geología niveles de 84 a 95%
son suficientes
• Usualmente solo la desviación estándar s de la muestra es
conocida mientras que aquella de la población σ y por lo tanto
su distribución normal es desconocida
• Este problema se ha tratado de resolver con el uso de la
distribución t de Student

Universidad Mayor de San Andrés


Estimación del error distribución
t student
• Ejemplo
– Un concentrado de cobre ha sido muestrado 8
veces. Los valore analiticos de esas muestras son
como siguen:
• La media es 25.5% Cu
• La varianza es s2=0.29
• La desviación estándar es s=+/-0.54

Universidad Mayor de San Andrés


Estimación del error distribución
t student
• La media es 25.6% Cu
• La varianza es s2=0.29
• La desviación estándar es s=+/-0.54

Numero de Análisis de Cu Numero de Análisis de Cu


muestra (%) muestra (%)

1 25.8 5 26.3
2 25.0 6 25.2
3 24.8 7 26.1
4 25.9 8 25.7
• El intervalo de confianza se denota por ki. Los limites son:

s *t
ki  
n
donde t es el factor correpondiente tomado de la distribución t de Student
Universidad Mayor de San Andrés
Estimación del error distribución
t student
Numero de Análisis de Cu Numero de Análisis de Cu
muestra (%) muestra (%)

1 25.8 5 26.3
2 25.0 6 25.2
3 24.8 7 26.1
4 25.9 8 25.7

• El factor t depende del numero y el nivel de


confianza. Eligiendo un 90% en la tabla
usando la tabla para n = 4, t = 1.90
Universidad Mayor de San Andrés
Estimación del error distribución
t student
• La media es 25.6% Cu
• La varianza es s2=0.29
• La desviación estándar es s=+/-0.54

Numero de Análisis de Cu Numero de Análisis de Cu


muestra (%) muestra (%)

1 25.8 1 26.3
2 25.0 2 25.2
3 24.8 3 26.1
4 25.9 4 25.7

• Se puede decir ahora que el concentrado de Cu tiene una ley de 25.6% +/-0.4% a nivel de
confianza del 90%
s *t
ki 
n
s *t 0.54 *1.9
ki     0.4
n 8
Universidad Mayor de San Andrés
Estimación del error distribución
t student
• La media es 25.6% Cu
• La varianza es s2=0.29
• La desviación estándar es s=+/-0.54

Numero de Análisis de Cu Numero de Análisis de Cu


muestra (%) muestra (%)

1 25.8 1 26.3
2 25.0 2 25.2
3 24.8 3 26.1
4 25.9 4 25.7

• Este nivel de confianza relativo expresa que la verdadera media puede variar hasta un
1.4% (relativamente) a partir del valor medio calculado de 25.6% Cu

ki 0.36
  0.014
x 25.6

Universidad Mayor de San Andrés


El error promedio
• Es un simple valor (un nivel de confianza de 68%)

xs
• Solo para valores numéricos (por ej., datos físicos como la densidad)

• La ley promedio de un deposito o de concentrados son valores mas


complejos, por lo que se usa: s *t
x
n

Universidad Mayor de San Andrés


El logaritmo
• Es una de las mas importantes funciones en
matemáticas y se lo expresa como ln x y para
todas las “x” positivas se lo define como:

x dt
ln x  
1 t

Universidad Mayor de San Andrés


La constante “e”
ln e= 1
o equivalentemente:
e dt
ln x   1
1 t
El área debajo la curva y = 1/t desde t =1 a
t = e es precisamente 1
e = 2.7182818284…
n
 1
e  lim 1  
n 
 n

o sea, e es el limite de la secuencia :


 n 1
2 3 n
3 4
2,   ,   ,....  ....
2 3  2 
Universidad Mayor de San Andrés
Logaritmos naturales y la constante e wiki…

• El logaritmo natural de un numero x es la


potencia a la cual e tendria que ser elevado
para igualar x. Por ejemplo, ln(7.389) es 2,
porque e2= 7.389…El logaritmo natural de e
(ln(e)) es 1 porque e1=e, mientras que el
logartimo natural de 1 (ln (1)) es 0 porque
e0=1.

Universidad Mayor de San Andrés


Distribución logarítmica normal
• Los valores son transformados logarítmicamente
• Valores logarítmicos son usados para determinación
de la media, la varianza y la desviación estándar
• Todos los valores tienen que ser mayores a 0
Pozo # 1 x (g Au /ton) lnx
1 5.2 1.65
2 1.5 0.41
3 35.9 3.58
4 9.8 2.28
5 17.7 2.87

Universidad Mayor de San Andrés


Distribución logarítmica normal
• La media aritmética logarítmica “α” es el anti-logaritmo de la media
geométrica “γ”

Pozo # 1 x (g Au /ton) lnx


1 5.2 1.65
2 1.5 0.41
3 35.9 3.58
4 9.8 2.28
5 17.7 2.87
1 n
x   xi por lo que x  14.0
n i 1
La media ( ) de los valores logarítmic os es :
1 n 1.65  0.41  3.58  2.28  2.87 10.79
ln   lnx i    2.16
n i 1 5 5
Debido a que ln  2.16 el antilogari tmo de   8.65
Distribución logarítmica normal
• Medias aritméticas y medias geométricas
– La distribución de las leyes en algunos depósitos es
asimétrica hacia la derecha debido que altos valores
ocurren encima del rango normal de valores
– En casos reales la media aritmética es a menudo muy alta
en comparación a las leyes que son realmente obtenidas
durante el minado
– Se distingue el método del estimador t de Sichel para
corregir valores anómalos altos

Universidad Mayor de San Andrés


Distribución logarítmica normal
Valor de Valor Ln de
Au (g/t) Au (g/t)
1.8 0.59
2.7 0.99
3.2 1.16
4.1 1.41
4.9 1.59
6 1.79
6.5 1.87
7.5 2.01
8.9 2.19
9.9 2.29
10.5 2.35
13 2.56
15.3 2.73
16.2 2.79
19.4 2.97
23.8 3.17
27.1 3.30
35.2 3.56
50.7 3.93
79.7 4.38
Distribución logarítmica normal
frec abs
# xi en g/t Au frec. log xi
6 1.8 0 a 10 0.59
0.5 a 1 2
3 2.7 0.99
10 3.2 10 1.16
1.0 a 1.5 2
11 4.1 1.41
4 4.9 1.59
7 6 1.79 1.5 a 2.0 3
12 6.5 1.87
2 7.5 2.01
8 8.9 2.19
13 9.9 2.29
9 10.5 10 a 20 2.35 2.0 a 2.5 4
1 13 2.56
14 15.3 5 2.73
15 16.2 2.79
20 19.4 2.97 2.5 a 3.0 4
3 23.8 20 a 30 3.17
3.0 a 3.5 2
17 27.1 2 3.30
19 35.2 30 a 40:1 3.56
3.5 a 4.0 2
18 50.7 50 a 60:1 3.93
16 79.7 70 a 80:1 4.38 4.0 a 4.5 1
x 17.32 γ 2.38 Suma 20
Derivación de la distribución normal
• Los valores que describen una población son transformados
logarítmicamente a una distribución normal
h m x
10 4
9 3.5
8
3
7
2.5

Frecuencia
Frecuencia

6 m x h
5 2
4 1.5
3
1
2
1 0.5

0 0

g Au/t

ln g Au/t

Universidad Mayor de San Andrés


Derivación de la distribución normal
• La mediana m y la moda h han sido movidas
• Debido a que los intervalos del eje x han sido
reclasificados al ser transformados

Universidad Mayor de San Andrés


El uso de la malla logarítmica de probabilidad

• Ya usamos una malla de probabilidad simple,


ahora usaremos la malla de probabilidad
logarítmica
• La curva de frecuencias acumuladas de la
distribución log-normal también se representa
por una línea (línea recta de Hazen)
• El eje y con los valores % es el mismo mientras
que el eje x es subdividido logarítmicamente
• Krige (1978) desarrollo esta malla log-normal
para encontrar la media (α), la moda (h) y la
varianza (β2)
Universidad Mayor de San Andrés
El uso de la malla logarítmica de probabilidad
• Usaremos el mismo ejemplo, pero vamos a reclasificar los limites de clase
de forma mas geométrica
xi en g/t frec abs frec. rel % frec. frec. abs. frecu. frec. abs.
# Au frec. log xi abs. acum abs. % acum %
6 1.8 0 a 10 0.59 1.0 a 2.5 1 1 5 5
0.5 a 1 2
3 2.7 0.99 2.5 a 5 4 5 20 25
10 3.2 10 1.16
1.0 a 1.5 2
11 4.1 1.41
4 4.9 1.59
7 6 1.79 1.5 a 2.0 3 5.1 a 10 5 10 25 50
12 6.5 1.87
2 7.5 2.01
8 8.9 2.19
13 9.9 2.29
9 10.5 10 a 20 2.35 2.0 a 2.5 4 10.1 a 20 5 15 25 75
1 13 2.56
14 15.3 5 2.73
15 16.2 2.79
20 19.4 2.97 2.5 a 3.0 4
3 23.8 20 a 30 3.17 20.1 a 40 3 18 15 90
3.0 a 3.5 2
17 27.1 2 3.30
19 35.2 30 a 40:1 3.56
3.5 a 4.0 2
18 50.7 50 a 60:1 3.93 40.1 a 80 2 20 10 100
16 79.7 70 a 80:1 4.38 4.0 a 4.5 1
x 17.32 γ 2.38 Suma 20 20
El uso de la malla logarítmica de probabilidad

• Al plotear el % de frecuencia acumulada absoluta vs. el límite


superior de cada clase generamos una curva que debe ser “unida”
por la línea recta (línea de Hazen)
• Si se forma la línea se puede decir que los datos describe una
población log-normal
• Movemos paralelamente la línea hasta que toca a la curva en forma
de “s”, cerca donde esta indicado el valor de la media
• Una línea es dibujada paralela al eje x atreves de este punto
uniéndolo con nuestra primera línea de Hazen
• Bajamos este valor y encontramos el valor de la media aritmética
logarítmica α (~16.6 Au g/t)
• Este valor es menor a la media aritmética simple (17.3 Au g/t)
• El valor de la varianza (β2) se lee al extender la línea de Hazen
hasta el extremo superior derecho de la malla (~1.02)

Universidad Mayor de San Andrés


Media y varianza
• Para diferenciar de la media y la desviación estándar en la
distribución normal, la media en la distribución log-normal se
simboliza con letra α y para la varianza β
• Para el eje “y” de la campana se usa la siguiente formula:

2
1  ln   ln x 
  
1 
y *e 2 

x *  2
• La media es el logaritmo del valor de la mediana (datos no
transformados) o de la media geométrica “γ”, entonces:
α = lnγ ó γ = eα

Universidad Mayor de San Andrés


Media y varianza
• En el ejemplo que hicimos nuestra media
corresponde al valor de 50% en la frecuencia
acumulada y es γ = 10 Au g/t
1 n
  ln   *  ln xi
n i 1
esto da   ln  2.38 y entonces   10.8 Au g/t

Universidad Mayor de San Andrés


Varianza y desviación
• La varianza se puede estimar de la misma manera que hicimos antes usando la formula de la
varianza para valores no logarítmicos:
Valor de Au (g/t) Valor Ln de Au (g/t) xi-x (xi-x)^2
1.8 0.59 -1.79 3.22
2.7 0.99 -1.39 1.93
La desviación ~1.0
3.2 1.16 -1.22 1.48
4.1 1.41 -0.97 0.94
4.9 1.59 -0.79 0.63
6 1.79 -0.59 0.35
6.5 1.87 -0.51 0.26
7.5 2.01 -0.37 0.13
8.9 2.19 -0.20 0.04
9.9 2.29 -0.09 0.01
10.5 2.35 -0.03 0.00
13 2.56 0.18 0.03
15.3 2.73 0.35 0.12
16.2 2.79 0.40 0.16
19.4 2.97 0.58 0.34
23.8 3.17 0.79 0.62
27.1 3.30 0.92 0.84
35.2 3.56 1.18 1.39
50.7 3.93 1.54 2.39
79.7 4.38 2.00 3.99
2.4 18.87
Varianza y desviación
• La varianza es estimada gráficamente a partir de la desviación
estándar en el diagrama de probabilidad, leyendo directamente en
la malla los valores que corresponden a 16, 50 y 84%:
1   x84   x50 
  * ln    ln  
2   x50   x16 
• x84=28, x50=10 y x16=3.7

1   28   10  1
  ln 2.8  ln 2.7  1.03  0.99  1.01
1
  * ln    ln 
2   10   3.7  2 2

• Entonces la varianza β2 = 1.02

Universidad Mayor de San Andrés

Vous aimerez peut-être aussi