Vous êtes sur la page 1sur 8

Análisis Estadístico de Datos Mineros

Introducción
La Estadística es la rama de las matemáticas que se ocupa de reunir, organizar
y analizar datos numéricos y que ayuda a resolver problemas como el diseño
de experimentos y la toma de decisiones.

ANALISIS UNIDIRECCIONAL DE DATOS (Formulas y Conceptos)

1. Parámetros Estadísticos
 Numero de Datos (n)
o Representa el total de datos preexistentes en los datos a
estudio

 Valor Mínimo
o Representa el valor mínimo de una serie de datos en
estudio

 Valor Máximo
o Representa el valor máximo de una serie de datos en
estudio

 Rango
o Se define como:
𝑹𝒂𝒏𝒈𝒐 = 𝑽𝒂𝒍𝒐𝒓 𝑴𝒂𝒙𝒊𝒎𝒐 − 𝑽𝒂𝒍𝒐𝒓 𝑴𝒊𝒏𝒊𝒎𝒐

 Numero de Intervalos (k)


o Se define como:
𝑲 = 𝟏 + 𝟑. 𝟑 ∗ 𝐥𝐨𝐠(𝒏)

 Amplitud (w)
o Se define como:
𝑹
𝒘=
𝑲
2. Medidas de Centralización
 Media
o Es el valor promedio de un conjunto de datos
o Corresponde a la suma de todos los datos dividido por el
número total de ellos. Es lo que se conoce como
"promedio".
o Se define como:

∑𝒏𝒊=𝟏 𝒙𝒊
̅=
𝒎𝒆𝒅𝒊𝒂 = 𝑿
𝒏

 Mediana
o Puede representar el valor central de un conjunto de datos
ordenados o la media de los dos valores centrales
o Se define como:
𝒏 = 𝒑𝒂𝒓 → 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑿𝒏+𝟏
𝟐
𝟏
𝒏 = 𝒊𝒏𝒑𝒂𝒓 → 𝒎𝒆𝒅𝒊𝒂𝒏𝒂 = (𝑿𝒏 + 𝑿𝒏+𝟏 )
𝟐 𝟐 𝟐

 Moda
o Es el valor que ocurre con mayor frecuencia en un conjunto
de datos, es decir, que se repite varias veces.
o Si el conjunto de datos presenta una sola moda se llamará
Unimoda, pero de presentar dos modas se llamara bimodal

 Quartil 1 - Quartil 2 - Quartil 3


o Son 3 valores que distribuyen la serie de datos, ordenada
de forma creciente o decreciente, en cuatro tramos iguales,
en los que cada uno de ellos concentra el 25% de los
resultados.
o Se define como:

𝒋
− 𝑭𝒊−𝟏
𝟒(𝒏)
𝑸𝒋 = 𝑳𝒊 + 𝑾𝒊 [ ]
𝒇𝒊

𝒑𝒂𝒓𝒂 𝒋 = 𝟏, 𝟐, 𝟑
 Percentiles
o Son 99 valores que distribuyen la serie de datos, ordenada
de forma creciente o decreciente, en cien tramos iguales,
en los que cada uno de ellos concentra el 1% de los
resultados

3. Medidas de Dispersión
 Varianza
o Medida de dispersión con respecto a la media.
o Corresponde a la diferencia numérica entre una medida
individual o número y la media aritmética de una serie
completa de tales medidas o números.
o Se define como:
𝒏
𝟏
𝟐 ̅ )𝟐
𝝈 = ∑(𝑿𝒊 − 𝑿
𝒏
𝒊=𝟏

 Desviación Estándar
o Es un dato que representa la variabilidad existente en un
conjunto de datos, ya que por ejemplo dos conjuntos de
datos pueden presentar la misma media aritmética, pero
poseer distinta variabilidad, por eso este estadígrafo nos
permite saber acerca de la variabilidad o dispersión de los
datos.
o Se define como:

𝝈 = √𝝈𝟐

 Coeficiente de Variabilidad
o Se define como:
𝝈
𝑪𝑽 =
̅
𝑿
4. Medidas de Forma
 Coeficiente de Asimetría
o Mide si la curva tiene una forma simétrica, es decir, si
respecto al centro de la misma (centro de simetría) los
segmentos de curva que quedan a derecha e izquierda son
similares.
o Se define como:
𝝁𝟑
𝒔𝒌 =
𝝈𝟑

𝒏
𝟏
̅ )𝟑
𝝁𝟑 = ∑(𝑿𝒊 − 𝑿
𝒏
𝒊=𝟏

Donde:
 sk < 0 asimetría Negativa
 sk > 0 asimetría positiva
 sk = 0 asimetría nula = simetría
 Kurtosis
o Mide si los valores de la distribución están más o menos
concentrados alrededor de los valores medios de la
muestra.
o Se define como:
𝝁𝟒
𝑬= −𝟑
𝝈𝟒

𝒏
𝟏
̅ )𝟒
𝝁𝟒 = ∑(𝑿𝒊 − 𝑿
𝒏
𝒊=𝟏

Donde:
 E < 0 histograma más “puntiagudo” que la ley de Gauss
 E > 0 histograma más “achatado” que la ley de Gauss
 E = 0 histograma sin achatamiento, igual que la ley de Gauss
ANALISIS BIDIRECCIONAL DE DATOS (Formulas y Conceptos)

Se procederá a determinar los siguientes parámetros:

 Covarianza

Se define como:

𝑪𝒙𝒚 = ̅̅̅̅ ̅ ∗𝒀
𝑿𝒀 − 𝑿 ̅

Donde:

𝑋̅ = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑥

𝑌̅ = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑌

̅̅̅̅
𝑋𝑌 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝐿 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑋 𝑒 𝑌

Para nuestro caso se define como:

̅̅̅̅̅̅̅̅̅̅̅
𝑪𝑨𝒈.𝒁𝒏 = 𝑨𝒈 ∗ 𝒁𝒏 − ̅̅̅̅ ̅̅̅̅
𝑨𝒈 ∗ 𝒁𝒏

Donde:

̅̅̅̅
𝐴𝑔 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑙𝑒𝑦𝑒𝑠 𝑑𝑒 𝐴𝑔

̅̅̅̅ = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑙𝑒𝑦𝑒𝑠 𝑑𝑒 𝑍𝑛


𝑍𝑛

̅̅̅̅̅̅̅̅̅̅
𝐴𝑔 ∗ 𝑍𝑛 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝐿 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑙𝑒𝑦𝑒𝑠 𝑑𝑒 𝐴𝑔 𝑦 𝑍𝑛

Nota:

Con el cálculo de la covarianza se puede demostrar:

 Si la Correlación es positiva: 𝐶𝑥𝑦 > 0


 Si la Correlación es negativa: 𝐶𝑥𝑦 < 0
 Si la Correlación es nula: 𝐶𝑥𝑦 = 0
 Coeficiente de correlación

Se define como:
𝑪𝒙𝒚
𝝆=
𝜹 𝒙 ∗ 𝜹𝒚

Donde:

𝜌 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛

𝐶𝑥𝑦 = 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑥𝑦

𝛿𝑥 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑥

𝛿𝑦 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑦

Para nuestro caso se define como:

𝐶𝐴𝑔.𝑍𝑛
𝜌=
𝛿𝐴𝑔 ∗ 𝛿𝑍𝑛

Donde:

𝜌 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛

𝐶𝐴𝑔.𝑍𝑛 = 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝐴𝑔. 𝑍𝑛

𝛿𝐴𝑔 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎𝑠 𝑙𝑒𝑦𝑒𝑠 𝑑𝑒 𝐴𝑔

𝛿𝑍𝑛 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎𝑠 𝑙𝑒𝑦𝑒𝑠 𝑑𝑒 𝑍𝑛

Nota:
Rango de correlación −1 ≤ 𝜌 ≤ 1
Si la correlación es positiva 0 < 𝜌 ≤ 1
Si la correlación es negativa −1 ≤ 𝜌 < 0
Si la correlación es nula 𝜌 = 0

-1 -0,5 0 0,5 1

Verde: correlación significativa


Rojo: correlación débil
 Modelo de Regresión Lineal

o Ecuación de minimización de errores


∅ = ∑ 𝒆𝟐 = ∑(𝒁𝒏 − 𝒁𝒏 ∗)𝟐 = 𝒎𝒊𝒏𝒊𝒎𝒐 … (1)

o Ecuación Lineal Simple: 𝒚∗ = 𝒂 + 𝒃 ∗ 𝒙

Para nuestro caso: 𝑍𝑛∗ = 𝑎 + 𝑏 ∗ 𝐴𝑔 …… (2)

o Reemplazando Ecuaciones 2 en 1
∅ = ∑ 𝒆𝟐 = ∑(𝒁𝒏 − 𝒂 + 𝒃 ∗ 𝑨𝒈)𝟐 … (3)

o Calculo de los Valores a y b


̅−𝒃∗𝒙
𝒂=𝒚 ̅
𝑪𝒙𝒚
𝒃=
(𝜹𝒙 )𝟐
Para nuestro caso:
𝑪𝒙𝒚
𝒃= 𝟐
(𝜹𝑨𝒈 )

𝒂 = ̅̅̅̅
𝒁𝒏 − 𝒃 ∗ ̅̅̅̅
𝑨𝒈

o El error de Estimación

∑𝒏𝒊=𝟏 𝒆𝟐 ∑(𝒁𝒏 − 𝒂 + 𝒃 ∗ 𝑨𝒈)𝟐


∅𝟐 = =
𝒏−𝟐 𝒏−𝟐
DISTRIBUCION NORMAL – MODELO NORMAL (Formulas)

 Ecuación de Normalización
̅
𝑿𝒊 − 𝑿
𝒁=
𝝈
Donde:
𝑍 = 𝐹𝑢𝑛𝑐𝑖𝑜𝑛 𝑑𝑒 𝑁𝑜𝑟𝑚𝑎𝑙𝑖𝑧𝑎𝑐𝑖𝑜𝑛
𝑋𝑖 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜
𝑋̅ = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟

 Proporción factible
𝑷 = 𝟏 − 𝑭(𝒛)

 Ecuación de Estimación

𝝈
̅ 𝒇𝒊𝒏𝒂𝒍 = 𝑿
𝑿 ̅+ ∗ ∅(𝒛)
𝑷

𝟏 𝟏 𝟐
∅(𝒛) = ∗ 𝒆−𝟐∗(𝒛)
√𝟐𝝅

ANEXO

 Se anexa un CD con los cálculos estadísticos los cuales se


analizaron con Excel.

Vous aimerez peut-être aussi