Vous êtes sur la page 1sur 23

M. Sc.

Samuel Canchaya Moya


Tel. 01-2579636
EPIG
FIGMM

M. Sc. Samuel Canchaya


scanchaya@pucp.pe

PROGRAMA CLASES TEÓRICAS


TEMA TITULO Contenido Fecha
26
1 Introducción Introducción general y coordinaciones para el dictado del curso
Marz
Validación de la data. Identificación y tratamiento de altos erráticos y bajos no
Introducción a la Teoría del
significativos. La importancia del muestreo. Exactitud, precisión, Definición de
2 Muestreo
muestra e incrementos. Variable aditiva, “Batch”. Definición de espécimen,
02 Abr
incrementos y muestra.

Los errores de muestreo y Los errores de P. Gy y F. Pitard. El concepto de Heterogeneidad. Errores


3 el Concepto de asociados con la heterogeneidad. El error fundamental. La fórmula de P. Gy. El 9Abr
Heterogeneidad error de Segregación, principales tipos de segregación. Homogenización.

El error de extracción de incrementos. El error de delimitación de incrementos. El


Los errores relacionados
4 con los incrementos
error de ponderación de los incrementos. El error de preparación de los 16 Abr
incrementos. El error del efecto de pepita “in situ”. Como minimizarlos.

Errores de fluctuación de corto plazo; errores de fluctuación de largo plazo;


Los errores de fluctuación
errores de fluctuación periódicos. Optimización de flujos monodimensionales; las
de la heterogeneidad en
variabilidades periódicas de corto y largo plazo, la variabilidad de proceso.
5 dominios
Introducción a la Variografía 1D. Cálculo, ploteo y ajuste de variogramas.
23 Abr
monodimensionales.
Interpretación de variogramas: Alcance, efecto de pepita, sill, meseta, deriva (drift
Variografía 1D
o trend). Aplicaciones en la optimización de flujos mineralúrgicos.

Determinación de las características críticas de la muestra: masa óptima,


cantidad de incrementos, diámetro máximo de los incrementos. Test de
El Protocolo de Muestreo
6 de material particulado.
heterogeneidad. Nomogramas de muestreo. La cadena de custodia de la 30 Abr
muestra. Protocolos de monitoreo y control de finos. Manual de procedimientos
de muestreo.
Almacenamiento convencional, al vacío o con gases. Refrigeración de muestras.
Almacenamiento y
7 transporte de las muestras
Características de los almacenes de muestras. Diseño de instalaciones de corte, 7 May
Fotografíado. Logueo de testigos. 2

1
Continuación…
TEMA TITULO Contenido Fecha
Estructura y aditividad de los errores en la cadena del muestreo. Muestreo primario,
Aseguramiento de la secundario y análisis. La importancia del Muestreo Primario. Lo más importante: 14
8
calidad Aseguramiento de la calidad del Muestreo Primario. Aseguramiento de la calidad del muestreo May
secundario y análisis.

EXAMEN PARCIAL 21May


El control de la calidad: elección y preparación de las muestras de control; tipos de muestras
28
de control: blancos, duplicados y estándares; inserción de muestras de control; determinación
9 Control de la Calidad May
de muestras fallidas; causalidad y plan de acción correctivo.

Herramientas y Homogenizadores, “Splitters”, cuarteadores rotatorios, espátulas y “backets” de sector angular;


4 Jun
10 aparejos de cortadora de disco diamantado, perforadora portátil, muestreadores o cortadores de flujo,
muestreo perforadores de pilas, rumas y similares; muestreadores automáticos; etc.
Por puntos, canales, paneles, “chips”, cortes, paladas, etc.; en tajos, testigos de perforación,
Tipos generales de
11 ripios, canchas, rumas, labores subterráneas, relaves, macizos rocosos, suelos, flujos 11 Jun
muestreo
mineralúrgicos, dominios sedimentarios, aguas, efluvios, etc.

Introducción a la Introducción a la Geoestadística. Las hipótesis geoestadísticas. Introducción a la Variografía


12 18 Jun
Variografía 1d y 2D 2D. Cálculo, ploteo y ajuste de variogramas 2D. Anisotropía y mapeo variográfico.

Interpretación de
Variogramas. Características e interpretación de los variogramas: efecto pepita, alcance, meseta, “drift”, etc. 25
13
Estimadores lineales Los estimadores lineales. Interpolación con kriging. Jun
y Kriging
Dimensionamiento óptimo del muestreo: distancia óptima de muestreo, mallas óptimas de
Principales muestreo, etc. Relación entre malla de perforación, costo y error asociado. Dimensionamiento
aplicaciones de la óptimo del muestreo: distancias óptimas de muestreo, implantación de mallas de muestreo,
14
geoestadística en el gestión óptima de programas de perforación, uso del variograma y del kriging para la
02 Jul
muestreo programación de taladros de relleno (“infill”) y nuevos taladros de exploración. Otras
aplicaciones.
EXAMEN FINAL 09 Jul
3
EXAMEN SUSTITUTORIO 16 Jul

PROGRAMA DE PRÁCTICAS
PRÁCTICA Contenido Fecha

Identificación y tratamiento de altos erráticos. Identificación y tratamiento de valores bajos no


1 significativos.
Caracterización estadística. Distribuciones sesgadas y log-normales. Efecto Proporcional.

2 Ejemplos de aplicación de la fórmula de P. Gy.


Cálculo, ploteo y ajuste de variogramas. Interpretación de variogramas: Alcance, efecto de
3
pepita, sill, meseta, deriva (drift o trend).
Ejemplos de variogramas 1D: “down hole”.
4
Aplicaciones de la variografía 1D en la optimización de flujos mineralúrgicos.

5 Nomogramas de muestreo. Implementación y aplicaciones.

Control de la calidad: inserción y evaluación de muestras de control: blancos, duplicados y


6
estándares; determinación de muestras fallidas; causalidad y plan de acción correctivo.
Demostración de uso de equipos: Homogenizador triaxial, “Splitters”, espátulas y “backets”
7
de sector angular; cortadora de disco diamantado, perforadora portátil, etc.
Muestreo por puntos, canales, paneles, “rock chips”, cortes, paladas, etc.; muestreo de
8
testigos DDH y RC, etc.
Cálculo, ploteo y ajuste de variogramas 2D. Anisotropía y mapeo variográfico.
Características e interpretación de los variogramas: efecto pepita, alcance, meseta, “drift”,
9
etc.
Interpolación con el Inverso de la “n” potencia. Interpolación con kriging. Mapeo variográfico.

2
5

Magnitud de los errores en cada fase

Sesgo % Error
Fase Actividad
% relativo
Muestreo 100 a 1,000
Muestreo
1000 Transporte y
primario 1 a 100
almacenamiento
Preparación mecánica,
Muestreo 10 a 100 QA/QC
QA/QC 50 reducción correcto
secundario
actual Preparación química 5 a 20
0.1 a 1 Análisis Análisis 0.1 a 5
Según: Gy (1999:10) Compilado a partir de: Gy (1999:10); Gy & Francois-
Bongarson (1999) y Paski (2006)

3
Proporción recomendable de
muestras de control
%
Tipo de muestras
recomendado
La única referida
Duplicados de campo 2 al Muestreo Primario
Duplicados gruesos 2
Duplicados de pulpa 2
Estándar bajo 2
Estándar medio 2
Estándar alto 2
Blancos gruesos 2
Blancos finos 2
Duplicados externos 4
TOTAL 20

7
Modificado a partir de Simon (2007)

Para cada fase la herramienta correcta

4
Distribución promedio de tiempo en las tareas
asociadas a aplicaciones geomatemáticas

• Validación de la Data
• Tratamiento de valores bajos
no significativos
• Identificación y tratamiento
35% 25%
de altos erráticos
• Compatibilización de datas
10% distintas
• Promedio, Desv.estándar,
15% 15% Varianza, Sesgo, Kurtosis, etc.
• Histograma
• Curva de acumulación de
Data frecuencias
C.Estad • Cálculo y ploteo de Variogramas
C. Geoestad • Anisotropias geométricas y zonales
• Análisis estructural geoestadístico
Process
• Interpretación de variogramas
Interpret • Etc.

10
Intervalos de Confianza 99.7 % Área bajo
95.0 % la curva
Distribución normal 68.0 %

de los errores:
Si no existe sesgo, en general los errores siguen una
distribución normal como la mostrada en el gráfico
P [-2s < e < +2s] = 0.95
donde: e es error y s2 su varianza
Lo cual significa que:
el error e caerá dentro del área comprendida entre
-2s y + 2s con un intervalo de confianza de 0.95

Dicho de otra manera:


el riesgo a equivocarnos será de 5%

e = +/- s intervalo de confianza de 68%

e = +/- 1.645 s intervalo de confz. de 90%

e = +/- 2s intervalo de confianza de 95%


A medida que aumenta la confianza el error aumenta;
e = +/- 3s intervalo de confianza de 99.7% mientras que el riesgo de equivocarnos disminuye .

Fundamento teórico: Teorema del límite central.

5
ss Es como plantearse un intervalo de
El concepto de s
confianza de : 99.99966 %

ss
Lo cual significa que se aspira a tener un
six sigma porcentaje de 99.99966 libre de defectos;
s o sólo 3.4 DPMO.

VARIAS DENOMINACIONES:
Six sigma
6s
6 sigma
6s
DPMO: Defectos por millón de oportunidades

Si fuéramos menos exigentes; v.gr. sólo 99.9%; esto significaría


catástrofes como:
• 96 accidentes aéreos por cada 100,000 vuelos.
• Por lo menos 20,000 prescripciones médicas erróneas por año.
• Corte de servicio de celular por 10 minutos cada semana.
Más allá de los dígitos, six sigma es una filosofía de negocios enfocada en la MEJORA CONTINUA,
optimizando procesos a partir de las necesidades de los clientes y con el uso de indicadores.

11

EDA: “Exploratory Data Analysis”

 Básicamente es el reconocimiento, esencialmente estructural y gráfico, de las


distintas características de la Data; así como el análisis general de su contenido.

 Un ejercicio importante del EDA es diferenciar los diferentes tipos de Data; en


función a su fecha de origen, tipo de análisis químico, diferentes laboratorios,
diferentes operadores o condiciones, con o sin QA/QC (Protocolos de
Aseguramiento y Control de la Calidad); así como, si se ha realizado ejercicios
previos de “compatibilidad” antes de juntarlas en un solo archivo.

 El EDA se interrelaciona y confunde con la Caracterización estadística, ya que


también usa sus herramientas gráficas y para algunos comprende también la
identificación de valores altos erráticos y bajos no significativos.

 El EDA también comprende la determinación de alguna estructura o modelo de la


data; así como la clasificación de la Data o la separación en sub-grupos.
12

6
Caracterización estadística

 Se entiende por CARACTERIZACION ESTADÍSTICA (CE), la


determinación e interpretación de los principales parámetros y tipos de
distribución de un determinado conjunto de datos o “data”.
 Básicamente de cada “data” se calcula: media, valor máximo, valor
mínimo, mediana, moda, varianza, desviación estándar, sesgo y
kurtosis.
 Estos datos se pueden entregar en forma de cuadros o gráficamente por
medio del denominado “box plot”
 También se plotea el respectivo histograma y curva de acumulación de
frecuencias.
 La interpretación de toda esta información constituye la CE
 Cualquier aplicación geomatemática o geoestadística debe estar siempre
precedida de una CE.
13

14

Mediana Moda
Promedio
Estadísticos
principales
Mediana
Promedio
Estadístico Valor
Moda.- El intervalo de clase con la mayor frecuencia Promedio 1.966

Mediana.- La mitad de toda la distribución de frecuencias Mediana 1.94


Moda 1.92
Varianza Desviación Desviac. estándar 0.192
estándar Varianza 0.03698
Coef. Variación CV 0.098
Coeficiente de variación.- Desv. estándar/promedio
Kurtosis -0.45
Sesgo.- Mide el grado de asimetría de una distribución. Cola Sesgo 0.28
más larga a la derecha: sesgo positivo; al revés negativo. Rango 0.86

Kurtosis.- Es el grado de “espigamiento” de una distribución. Mínimo 1.57


Leptocúrtica si es muy apuntada; Planocúrtica si es muy aplanada; Máximo 2.43
y Mesocúrtica si se trata de una situación intermedia. n 124

14

7
Quartiles

Q1 Q2 Q3

15

Presentación sumaria de estadísticos:


“Box-plot” (Diagrama de caja)
Boxplot of Swelling clays
3.2

Tercer 3.0 Valor


Quartil máximo
2.8

2.6
Swelling clays

2.4

2.2 Mediana
2.0
Primer
1.8
Quartil
1.6

Valor mínimo

16

8
Presentación sumaria de la
Caracterización Estadística
Summary for Cu_ppm
A nderson-D arling N ormality Test
A -S quared 41.60
P -V alue < 0.005

M ean 44.132
S tD ev 46.065
V ariance 2122.025
S kew ness 4.6149
Kurtosis 42.6063
N 724

M inimum 3.000
1st Q uartile 15.200
M edian 31.450
3rd Q uartile 57.625
0 100 200 300 400 500 600
M aximum 632.000
95% C onfidence Interv al for M ean
40.771 47.493
95% C onfidence Interv al for M edian
29.070 34.000
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
43.809 48.569
Mean

Median

30 35 40 45 50
17

Verificación de la “normalidad”
p > a  Distribuc. normal
de una distribución
Summary for Cu gpl
A nderson-D arling N ormality Test
A -S quared 0.29
P -V alue 0.600

M ean 39.059
S tDev 1.003
V ariance 1.005
S kew ness 0.152379
Kurtosis -0.253495
N 180

M inimum 36.600
1st Q uartile 38.300
M edian 39.100
3rd Q uartile 39.700
37 38 39 40 41 42
M aximum 41.900
95% C onfidence Interv al for M ean
38.911 39.206
95% C onfidence Interv al for M edian
38.800 39.200
95% C onfidence Interv al for S tDev
9 5 % C onfidence Inter vals
0.909 1.118
Mean

Median

38.8 38.9 39.0 39.1 39.2

18

9
Buen ajuste a recta
Test de normalidad p > a  Distribuc. normal

Probability Plot of Cu gpl


Normal
99.9
Mean 39.06
StDev 1.003
99 N 180
AD 0.293
95 P-Value 0.600
90
80
70
Percent

60
50
40
30
20
10
5

0.1
36 37 38 39 40 41 42 43
Cu gpl

19

Identificación y Tratamiento de
Valores Bajos No significativos

M. Sc. Samuel Canchaya Moya


20

10
Valores bajos y/o No significativos

 Se consideran valores bajos y/o No significativos:


 Aquellos por debajo de los límites de detección de los análisis químicos o mineralógicos
cuantitativos.
 Aquellos que a pesar de ser mayores a los límites de detección, son valores aún muy bajos,
que pueden ser considerados como el fondo o el “ruido” de la data.
 El concepto de “valor bajo” o “no significativo” es muy relativo y dependerá del tipo de
aplicación que se le dará a la data.
 La mejor forma de definir valores bajos y/o no significativos es a partir del análisis de percentiles
en la Curva de Acumulación de Frecuencias.
 Hay que tener mucho cuidado con las distribuciones extremadamente sesgadas, especialmente
las log-normales; en estos casos es recomendable plotear distribuciones a escala log-normal para
poder analizarlas adecuadamente.
 Es una práctica habitual, válida sólo para algunas aplicaciones, reemplazar los valores por debajo
del límite de detección por la mitad de su valor.
 Es recomendable “eliminar” las columnas de variables (v. gr. elementos químicos) que presentan
muchos valores por debajo de sus límites de detección; especialmente si se va a realizar Análisis
Estadístico Multivariable.

21

Identificación y Tratamiento de
Valores Altos Erráticos

M. Sc. Samuel Canchaya Moya


22

11
Definición de
valores altos
erráticos
 La ocurrencia aislada de
valores altos merece atención y
un tratamiento especial.

 Lo más crítico es definir si se


trata de valores altos
ERRATICOS.

 Estos valores son fácilmente


identificables en los
histogramas y gráficos de  Por lo general representan menos del 5% del total de la
frecuencia acumulada. población, y por ende del tonelaje; sin embargo, debido
a su alto valor, aportan sensiblemente en el valor
 Estos casos son especialmente metálico global, en proporciones entre 20 y 40%.
frecuentes en los yacimientos
de baja ley y/o de minerales  Por lo tanto, influyen y juegan un rol crucial en la
preciosos. economía del yacimiento.
23

Summary for Cu_ppm


A nderson-D arling N ormality Test
A -S quared 41.60
P -V alue < 0.005

M ean 44.132
S tDev 46.065
Con todos los datos V ariance 2122.025
S kew ness 4.6149
Kurtosis 42.6063
N 724

M inimum 3.000
1st Q uartile 15.200
Identificación de valores M edian
3rd Q uartile
31.450
57.625
0 100 200 300 400 500 600
altos erráticos M aximum 632.000
95% C onfidence Interv al for M ean
40.771 47.493
95% C onfidence Interv al for M edian
29.070 34.000
95% C onfidence Interv al for S tDev
9 5 % C onfidence Inter vals
43.809 48.569
Mean

Summary for Cu_ppm Median

30 arling N ormality
A nderson-D 35 Test 40 45 50

A -S quared 27.43
P -V alue < 0.005
Eliminando los altos erráticos: M ean 41.560
> 200 ppm Cu S tDev 34.626
V ariance 1198.994
S kew ness 1.45774
Kurtosis 2.12815
N 718

M inimum 3.000
1st Q uartile 15.175
M edian 31.200

0 30 60 90 120 150 180


3rd Q uartile 56.825 En ambos casos se rechaza la
M aximum 187.000
95% C onfidence Interv al for M ean hipótesis de normalidad porque:
p<a
39.023 44.097
95% C onfidence Interv al for M edian
29.000 33.675
95% C onfidence Interv al for S tDev
9 5 % C onfidence Inter vals
32.923 36.517
Mean

Median

30.0 32.5 35.0 37.5 40.0 42.5 45.0

12
Diagramas de caja para visualizar
valores erráticos
FILOSILICATOS COMPÓSITOS DIARIOS CHANCADORA TERCIARIA

9 9.03

8
7.18
7 6.94

6
5.52
5.23
5.17
5
Data

4.15
4 4

3 3.12
2.94
2.9

0 0.12

prf mmt kao

25

Monitoreo de la data para definir Estadísticos de kao:


x = 2.88
verdaderos altos ERRATICOS s = 1.18

Día kao Día kao


27 2.84 27 2.84
28 3.39 28 3.39
29 3.54 ALTO “ERRÁTICO” 29 3.54
30 3.58 30 3.58
31 2.67 31 2.67
32 9.03 x + 2s = 2.88 + 2.36 32 5.24
33 2.77 33 2.77
34 2.27 34 2.27
35 2.63 35 2.63
36 3.43 36 3.43
37 3.54 37 3.54

Día kao Día kao


116 2.58 116 2.58
117 2.40 117 2.40
118 3.54 118 3.54
119 5.17 119 5.17
120 4.28 120 4.28
121
122
7.18
5.52
121 7.18 ALTO “NO ERRÁTICO”
122 5.52
123 2.80 123 2.80
124 2.75 124 2.75
125 1.47 125 1.47
126 1.79 126 1.79

26

13
Scatterplot of kao vs prf

Comparación de nubes de 9

8
correlación con y sin altos 7

erráticos r = 0.54
6

kao
4

prf = 0.134 + 0.452 kao 3

0
0 1 2 3 4 5
prf
Scatterplot of kao vs prf
8

7
r = 0.61
6

5
prf = - 0.022 + 0.506 kao
kao

1
0 1 2 3 4
27
prf

Nube de correlación prf vs mmt

3.50
3.00
Efecto de altos erráticos
2.50
2.00
en el coeficiente de
prf

1.50
y = 0.069x + 1.204
regresión lineal
1.00 r² = 0.182
0.50 r = 0.427

0.00
0.00 5.00 10.00 15.00 20.00
mmt

prf vs mmt sin altos erráticos


2.50

2.00

1.50
prf

1.00
y = -0.646x + 2.687
r² = 0.769
0.50 r = - 0.877

0.00
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50
mmt

14
Nube de correlación mmt vs prf

2.50

2.00 Efecto de altos erráticos


1.50 en el coeficiente de
prf

1.00 y = 0.073x + 1.013


r² = 0.716
regresión lineal
0.50 r = 0.846

0.00
0.00 5.00 10.00 15.00 20.00
mmt

mmt vs. prf sin altos erráticos

1.60
1.40
1.20
1.00
prf

0.80
0.60 y = -0.017x + 1.199
0.40 r² = 0.006
r = 0.077
0.20
0.00
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50
mmt

Tratamiento de valores altos erráticos

 CORTES (“CUTTINGS”) EMPÍRICOS.-


 “Cut off” alto fijo.- V. gr. todos los “outliers” se reducen a 1 oz/t Au
 “Cut off alto variable”: regla del 1/3 – 1/3.- V. gr. 1.5 oz/t Au se reduce a:
0.33 + 0.33*(1.5 - 0.33) = 0.72 oz/t Au

 CORTES ESTADÍSTICOS.-
 Utilizando gráficos probabilísticos de frecuencia acumulada, donde los altos
erráticos se
discriminan fácilmente, para luego ser reducidos a un valor determinado.
 Usando “Control charts” (ver diapositivas siguientes)

 CORRECCIÓN LOGNORMAL O DE SICHEL (1952); Se reemplaza el alto errático por


el exponencial de la media de los logaritmos de los valores adyacentes multiplicados por
un factor de corrección que se obtiene en las tablas de Sichel, el cual es una función del
log de la varianza y del número de muestras; ver también DAVID (1977).
(Ejemplo en las diapositivas sub-siguientes).

30

15
Caracterizac. estadística kao (%)
Anderson-Darling Normality Test

Valores erráticos en A-Squared


P-Value <
5.43
0.005

“Control Charts” Mean


StDev
Variance
2.8756
1.1795
1.3913
Skewness 2.12283
Kurtosis 7.40478
1.5 3.0 4.5 6.0 7.5 9.0
N 144

Minimum 1.0700
1st Quartile 2.2550
Median 2.6500
Típico alto errático 95% Confidence Intervals
3rd Quartile 3.2450
Mean
Maximum 9.0300
Median

2.6 2.7 2.8 2.9 3.0 3.1


95% Confidence Interval for Mean
% kao
2.6813 3.0699

Control Chart of kao (%)

9
1 x s x + s x+2s x+3s
1 2.876 1.18 4.055 5.235 6.414
8
1
7
6.414 ALTERNATIVAS MAS USADAS:
Individual Value

6 1 1
1 1
5
1 1
5.235  Eliminar el alto errático
UCL=4.730
4 4.055  Reemplazarlo por la media más 1s, o
_ 2s o 3s
3 X=2.876
 Reducción por la regla del tercio
2
menos tercio.
1 LCL=1.021
0
1 15 29 43 57 71 85 99 113 127 141
31
Observation

Ejemplo de corrección log-normal o de Sichel

 Alto errático: 35.3


 Selección de dos valores contiguos
Prof. Au
m g/t log Au
a ambos lados
321.29 1.02  n=5
325.18 2.40  Media aritmética = 8.96
327.89 1.54
329.90 1.00 0.00  Cálculo del log de los n valores
331.35 1.50 0.18  Media de los logs = 0.56
333.15 35.3 1.55
 e media logs = 1.747
335.12 2.70 0.43
337.66 4.30 0.63  Log de la varianza = 2.34
339.26 1.05
341.18 1.47
343.29 1.08
media 8.96 0.56
var. 218.4 2.34

32

16
Tabla para la estimación del factor de Sichel (fcS)
V n

2.34 2.727

33

Tomado de Sichel (1966)

Ejemplo de corrección log-normal o de Sichel

 Alto errático: 35.3


 Selección de dos valores contiguos
Au
Prof. m g/t Log Au Au g/t
a ambos lados
321.29 1.02 1.02  n=5
325.18 2.40 2.40  Media aritmética = 8.96
327.89 1.54 1.54
329.90 1.00 0.00 1.00  Cálculo del log de los n valores
331.35 1.50 0.18 1.50  Media de los logs = 0.56
333.15 35.3 1.55 4.76
 e media logs = 1.747
335.12 2.70 0.43 2.70
337.66 4.30 0.63 4.30  Log de la varianza = 2.34
339.26 1.05 1.05  Factor de corrección (fcS)
341.18 1.47 1.47
343.29 1.08 1.08
de la tabla de Sichel = 2.727
media 8.96 0.56
 Media de Sichel = fcS * e media logs = 4.763
var. 218.4 2.34

34

17
Correlación lineal entre dos
variables

M. Sc. Samuel Canchaya Moya

35

Correlación entre dos variables

La correlación entre dos variables es el tipo de asociación que existe entre ambas;
la misma que es cuantificada por el denominado Coeficiente de Correlación “r”:

Donde: n

 ( xi  x)( yi  y)
Cov ( x, y )
r= • Cov es la covarianza: Cov( x, y ) = (1 / n)
Sx * Sy
i =1

• Sx y Sy son las desviaciones estándar


de x y y respectivamente
r  [1,  1]

También se usa “r2” que se relaciona con la varianza total de x y y.


Por ejemplo: para r = 0.88; entonces r2 = 0.77; lo cual significa que el 77 % de la
varianza total se puede explicar por una relación lineal.
36

18
37

Ejemplos de nubes de r  [1,  1]


correlación
x
x

r = 0.94 r = 0.54

y
y
x x

r = - 0.94

r = 0.09

y y

Ejemplo de nubes de correlación entre filosilicatos

Scatterplot of kao vs prf


8

7
prf = -0.022 + 0.506 kao
6

5
r = 0.61
kao

1
0 1 2 3 4
prf

38

19
Residuales en la regresión lineal

Y
y=b+mx

residual 6

residual 1

X
39

40

Análisis de “residuales”

Residual Plots for prf


Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99.9
99 1
90
Residual
Percent

0
50

10 -1
1
0.1 -2
-2 -1 0 1 1 2 3 4
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


80
1
60
Frequency

Residual

0
40
-1
20

0 -2
-1.5 -1.0 -0.5 0.0 0.5 1.0 1 1 0 2 0 30 40 5 0 6 0 7 0 80 90 10 0 11 0 1 2 0 1 30 1 40
Residual
Observation Order

20
Distribuciones sesgadas, Log-normales
y el Efecto Proporcional

M. Sc. Samuel Canchaya Moya


41

Típica distribución LOG-NORMAL del Au


en un yacimiento epitermal de HS
Valores bajos no
significativos Moda

Mediana

Altos erráticos
Media

Au ppb 42
Tomado de Canchaya (2004)

21
Summary Statistics for Cu ppm
Verificación Anderson-Darling Normality Test
A-Squared 14.69
práctica de la P-Value < 0.005

Mean 2473.2

log-normalidad StDev
Variance
3225.6
10404234.4
Skewness 2.68188
Kurtosis 8.95936
0 3000 6000 9000 12000 15000 18000
Obviamente se rechaza la hipótesis N 169

de normalidad: p-value << a Minimum 118.0


1st Quartile 440.0
Median 1130.0
95% Confidence Intervals 3rd Quartile 3562.0
Mean Maximum 19342.0
Median 95% Confidence Interval for Mean
1000 1500 2000 2500 3000
1983.4 2963.0
95% Confidence Interval for Median
Probability Plot of Cu ppm
Lognormal - 95% CI
99.9

99
95 Los logs de los valores de Cu
90
80 trazados en un gráfico de
70
Percent

60
50
40
Loc 7.115 acumulación ploteado en un
30 Scale 1.219
20 N 169
gráfico probabilístico se ajustan a
10
5 AD 1.159 una recta.
P-Value <0.005
1

0.1
10 100 1000 10000 100000 43
Cu ppm

Comprobación gráfica del


Efecto Proporcional
1500

1250
Ley media del oro (ppb)

1000

750

500

250

0
0 250 500 750 1000 1250 1500 1750 2000 2250 2500

Desviación estándar
44
Tomado de Canchaya (2004)

22
Referencias bibliográficas
 Canchaya S. (2004) Log-normalidad y efecto proporcional. Características frecuentes en los yacimientos
de oro.- XII Congr. Peruano Geol.; 4p.

 Canchaya S. (2013) Efecto proporcional: Característica frecuente en variables de exploración


geoquímica.- Pro-Explo 2013; Lima, 19 a 23 de Mayo.

 Canchaya S. (2013) Sampling of Variables with Proportional Effect.- GEOMET 2012; Sgo. de Chile Dic.
2012 y GEOMIN 2013; Sgo. de Chile Jul. 2013.

 David M. (1977) Geostatistical Ore Reserve Estimation.- Elsevier New York; 364 p.

 Rendu J. M. (1981) An Introduction to Geostatistical Methods of Mineral Evaluation.- South Afr. Inst. Min.
Metall.; Johannesburg; 84 p.

 Sichel H. S. (1952) New methods in the statistical evaluation of mine sampling data.- Trans. I. M. M.,
London; 61: 261-288.

 Sichel H. S. (1966) The estimation of means and associated confidence limits for smalls samples
from lognormal populations.- Symposium on Mathematical Statistics and Computer Applications I
Ore Valuation: 106-122; South Afr. Inst. Min. Metall.; Johannesburg. Citado por Rendu (1981).

45

23