Académique Documents
Professionnel Documents
Culture Documents
DE CAJAMARCA
Facultad de ingeniera
Escuela Acadmico Profesional de
Ingeniera de Minas
ASIGNATURA: Geoestadstica
TEMA: Anlisis de datos mediante Histogramas
INTEGRANTES:
Calua Infante, Freddy
Lpez Martos, Doris
Lozano Pinedo, Annie Sharaneyda
Meja Liberato, Anny
Saldaa Gallardo, Danny
INTRODUCCIN
Este documento sirve de gua para la construccin de Histogramas y permite profundizar, ms all de
su propia significacin matemtica, en el anlisis del funcionamiento y la eficacia de procesos y
procedimientos, a travs de su informacin sobre la frecuencia de aparicin de diferentes sucesos
dentro de los mismos.
Pgina 1
INDICE
OBJETIVO Y ALCANCE
03
04
1.1.- VARIABILIDAD
04
1.2.- HISTOGRAMAS
04
1.3.- ESTRATIFICACIN
05
1.4.- RECORRIDO
05
2.- PROCESO
06
06
2.2.- CONSTRUCCIN
06
2.3.- INTERPRETACIN
11
11
15
16
2.4.- UTILIZACIN
16
17
17
17
18
5.2 DESAGRUPAMIENTO
19
21
6. EJEMPLOS APLICATIVO
22
30
30
30
31
37
7.5 CONCLUCIONES
38
40
Pgina 2
OBJETIVO Y ALCANCE
Definir las reglas bsicas a seguir para la construccin e interpretacin de los Histogramas,
resaltando las situaciones en que pueden, o deben ser utilizados.
Es de aplicacin a todos aquellos estudios en que es necesario analizar la pauta de
comportamiento de un determinado fenmeno en funcin de su frecuencia de aparicin.
Su utilizacin ser beneficiosa para el desarrollo de los proyectos abordados por los Equipos y
Grupos de mejora y por todos aquellos individuos u organismos que estn implicados en la
mejora de la calidad.
Pgina 3
HISTOGRAMA
1.- DEFINICIONES / CONCEPTOS
1.1.- VARIABILIDAD
- Los ejes que produce una mquina tienen diferente dimetro dentro del mismo lote debido a
pequeas variaciones en las condiciones de la materia prima, a holguras de los elementos mviles, al
desgaste de la herramienta, etc.
El plato que prepara un cocinero tiene diferente gusto en diferentes ocasiones debido a variaciones en
el peso de los condimentos utilizados, en el tiempo de coccin, etc.
1.2.- HISTOGRAMAS
Definicin: Es un resumen grfico de los valores producidos por las variaciones de una determinada
caracterstica, representando la frecuencia con que se presentan distintas categoras dentro de dicho
conjunto.
Pgina 4
Ejemplo:
Caractersticas principales
1.3.- ESTRATIFICACIN
Definicin: Separacin de un conjunto de datos en diferentes grupos o categoras, de forma que los
datos pertenecientes a cada grupo comparten unas caractersticas comunes que definen la categora.
1.4.- RECORRIDO
Definicin: Medida de la dispersin, correspondiente a la diferencia entre el valor mximo y el valor
mnimo de un conjunto de valores.
Pgina 5
2.- PROCESO
2.1.- DIAGRAMA DE FLUJO
2.2.- CONSTRUCCIN
Paso 1: Preparacin de los datos
Como en todas las herramientas de anlisis de datos, el primer paso consiste en recoger estos de forma
correcta o asegurarse de la adecuacin de los existentes.
Identificar en la tabla de datos originales el valor mximo, el valor mnimo y el recorrido (R = Vmax Vmin).
Ejemplo: Datos sobre la cantidad exacta de caf contenido en paquetes de 250 gramos. (120 unidades
medidas)
Clases: Son los intervalos en que se divide la caracterstica sobre la que se han tomado los datos. El
nmero de clases es igual al de barras del Histograma.
a) Definir el nmero de clases que debe tener el Histograma segn la tabla siguiente:
Numero recomendado de clases en un histograma
Pgina 7
El mnimo para un histograma son 40 datos. Pueden darse menos si el histograma original ha sido
estratificado.
Dependiendo del nmero de clases en que agrupemos los datos perderemos ms o menos informacin
tratando de identificar la pauta de comportamiento.
La tabla anterior es un buen compromiso entre la mxima sencillez de anlisis y la mnima prdida de
informacin.
En el ejemplo de los paquetes de caf hay 120 datos, necesitamos entonces aproximadamente 8 clases
para el histograma.
Paso 4: Construir las clases anotando los lmites de cada una de ellas
Los lmites de la primera clase incluirn el valor mnimo de los datos.
Para evitar que algunos datos coincidan con los lmites de los intervalos, definir stos de forma que
tengan una cifra ms detrs de la coma.
Si, por ejemplo, los datos tienen dos cifras detrs de la coma (3,55; 3,83; 3,64; 3,73; 3,78, etc), se
definirn las clases hasta la tercera cifra detrs de la coma (3,545-3,555; 3,555-3,565, etc).
Si se obtiene una clase ms o menos respecto del nmero recomendado, debido al redondeo
posteriormente efectuado, no existe deterioro ni en la sencillez ni en la informacin.
Pgina 8
Ejemplo: Como el valor menor en nuestros datos es 243 grs., empezaremos el primer intervalo en
242.5 grs. y construiremos ocho clases con 2 grs. de amplitud
Determinar el nmero de datos que estn incluidos en cada una de las clases (frecuencia de clase).
El recuento se har de la siguiente forma:
Empezar con el primer dato de la lista e identificar la clase en la cual est incluido. Sealar para dicha
clase, un "palote". Repetir el mismo proceso para cada dato del conjunto.
Para facilitar el recuento final se dibujan los "palotes" en grupos de cinco, cuatro verticales y el quinto
cruzndolos. La suma de los "palotes" marcados para cada clase corresponde a la frecuencia de la
misma.
Comprobar que el nmero total de datos es igual a la suma de las frecuencias de cada clase.
Ejemplo
Pgina 9
EJEMPLO:
Frecuencia
Pgina 10
2.3.- INTERPRETACIN
El resultado de este anlisis es una teora sobre el funcionamiento del proceso o sobre la causa
del problema que se est investigando.
La experiencia y habilidad del grupo de trabajo en la interpretacin son fundamentales en la
utilizacin de esta herramienta, puesto que no existen reglas fijas que se puedan utilizar para
explicar de forma precisa las pautas de variacin en cualquier situacin.
Los equipos de trabajo deben profundizar en el conocimiento del proceso en estudio para
utilizar esta herramienta de forma eficaz.
Es la distribucin natural, habitual para, los datos de gran cantidad de procesos. Por esta
circunstancia se llama Distribucin Normal.
Sin embargo la forma de campana no asegura, por s misma y sin analizar su valor medio y el
recorrido de los datos, que el proceso funcione de forma satisfactoria.
Pgina 11
Distribucin en campana
Distribucin plana
Una gran parte plana, sin ningn pico y con dos ligeras colas a los lados.
Esta forma puede ser el resultado de varias distribuciones en campana con sus centros
distribuidos uniformemente a lo largo del recorrido de los datos.
Se debern identificar los diferentes procesos que intervienen dentro del proceso bsico.
Distribucin en peine
Pgina 12
Distribucin plana
Distribucin en peine
El proceso con el pico pequeo ser una anormalidad o deficiencia que no sucede a menudo o
regularmente.
Se deben analizar las condiciones en que se presenta el pico menor tratando de estratificar los
datos.
Estos picos unidos a distribuciones sesgadas o truncadas indican falta de eficacia en la
eliminacin de elementos defectuosos.
Ejemplo:
Se ha encargado al empleado responsable de contestar a las reclamaciones de los clientes que
registre, durante un mes, el tiempo que se emplea en dar respuesta a las mismas.
Para este proceso el procedimiento estableca un tiempo mximo de cinco das.
Para evitar reproches, el empleado registraba cinco das en todas aquellas ocasiones en que se
superaba este lmite, por lo que el Histograma correspondiente al tiempo de respuesta mostraba
una distribucin con un pico en el extremo.
Pgina 13
Su forma es asimtrica, con un pico descentrado dentro del recorrido de los datos, las colas
descienden: bruscamente en un lado y suavemente en el otro. Esta distribucin es tpica de
procesos con lmites prcticos a un lado del valor nominal o a datos parciales de un proceso
(distribuciones con parte de los datos suprimidos).
Ejemplo 1:
Al analizar el tiempo en que se tardan en cursar las rdenes de compra una vez recibidas, se
observa que un gran porcentaje lo es en un da y el resto tardan dos, tres y hasta cuatro das
debido a diferentes circunstancias.
Al representar el Histograma de los tiempos requeridos para cursar dichas rdenes tendremos
una "distribucin truncada".
Ejemplo 2:
Al analizar el dimetro de los ejes de un pedido y construir el Histograma correspondiente,
obtenemos una distribucin sesgada cuyos extremos son similares a las tolerancias especficas
para dicho dimetro.
Al contactar con los proveedores, estos nos comentan que tan realizado una revisin completa
del pedido (inspeccin 100%) para eliminar los ejes con dimetro fuera de tolerancias.
Pgina 14
Distribucin sesgada
Distribucin truncada
b) Tambin se necesitan a menudo los lmites para interpretar otras formas de Histogramas y
decidir sobre los siguientes pasos a dar por el grupo de trabajo.
Incluso ante una distribucin perfecta de campana, el grupo de trabajo debe plantearse
cuestiones tales como:
Pgina 15
a) Si los datos utilizados no son adecuados (sesgados, inexactos, anticuados, poco significativos,
etc) las conclusiones no reflejarn la situacin real.
b) Otra deficiencia en las conclusiones obtenidas del Histograma puede provenir de una
muestra pequea y poco representativa.
Como regla prctica se debern recoger al menos cuarenta observaciones para cada uno de los
Histogramas que se desee realizar.
En los casos en que esto no sea posible se debern utilizar otros tipos de herramientas o
consultar con un experto en estadstica que disee un plan de muestreo y comprobacin de
hiptesis adecuado.
2.4.- UTILIZACIN
El Histograma es una herramienta muy til cuando un equipo se enfrenta con la tarea de
analizar datos que presentan variaciones.
Pgina 16
- Determinacin de causas
- Anlisis de sntomas
La herramienta est
relacionada con:
Pgina 17
Pgina 18
z R, F ( z) Prob[Z (x) z]
Bajo la hiptesis de estacionalidad, F(z) no depende de x. Una interpretacin de este resultado
es que la definicin de F(z) no hace referencia a la posicin en el espacio de los sitios con datos
(de donde viene la denominacin a priori). No permite entonces distinguir los sitios del
espacio segn los valores tomados por los datos circundantes.
En la prctica, se puede estimar la densidad o la funcin de distribucin gracias al histograma o
al histograma acumulado de los datos disponibles.
5.2 DESAGRUPAMIENTO
Cuando la malla de muestreo es irregular, el histograma de los datos puede no ser representativo
del campo estudiado. Los datos agrupados atribuyen demasiada importancia a las zonas
densamente muestreadas y dan una visin deformada del histograma subyacente real que se
obtendra muestreando exhaustivamente el campo. Por ejemplo, si las muestras se ubican
preferentemente en las zonas de altos valores, el histograma experimental presentar una media
mayor que la del histograma real.
Para corregir el efecto del agrupamiento de las muestras, una primera solucin es seleccionar
una parte de los datos cuya reparticin es aproximadamente uniforme en el campo, los cuales
servirn para el clculo de los histogramas y estadsticas.
Una segunda opcin
Consiste en ponderar los datos, asignando un peso pequeo a los datos agrupados y un peso
mayor a los datos aislados, y en tomar en cuenta estos pesos al momento de calcular el
histograma experimental
Denotemos como {xa, a = 1... n} los sitios con datos. Si se asigna a cada dato un peso igual a
1/n, el histograma acumulado experimental es igual, para todo valor z, a la proporcin de los
datos inferiores a z, o sea:
1
z R, F ( z )
n
Pgina 19
z ( x ) z
Ahora bien, atribuyendo pesos a los datos {wa, a = 1... n} no necesariamente iguales, pero cuya
suma vale 1, el histograma acumulado corregido se escribe:
z R, F ( z )
z ( x ) z
Los mtodos geomtricos son frecuentemente empleados para determinar los pesos de
desagrupamiento {wa, a = 1... n}.
Mtodo de los polgonos de influencia
El peso de un dato es proporcional a su rea de influencia en la zona de estudio
Pgina 20
Pgina 21
6. EJEMPLOS APLICATIVO
Explorar los datos: distribuciones de frecuencia, los histogramas, los estadsticos, los mapas
con la localizacin de los datos, los mapas de smbolos, etc.
DATOS
N Porosidad
1
5.67
2
7.65
3
7.11
4
4.76
5
9.7
6
8.41
7
12.35
8
10.84
9
7.04
10
8.18
11
9.32
12
6.13
13
9.16
14
8.71
15
10.84
16
10.08
17
11.9
18
8.41
19
5.75
N Porosidad
20
4.68
21
10.68
22
11.59
23
10.91
24
8.86
25
12.2
26
8.71
27
7.19
28
8.71
29
10
30
10.68
31
9.62
32
9.47
33
5.97
34
7.49
35
8.41
36
9.09
37
9.16
38
9.16
N Porosidad
39
8.94
40
9.92
41
9.32
42
6.05
43
12.89
44
11.44
45
11.37
46
9.01
47
7.95
48
15.09
49
5.22
50
11.14
51
13.11
52
10.08
53
9.47
54
7.04
55
9.77
56
14.03
57
11.29
Pgina 22
N
58
59
60
61
62
63
64
Porosidad
15.32
12.96
8.86
9.32
13.72
13.11
15.09
LI
4.68
6.20
7.72
9.24
10.76
12.28
13.80
LS
6.20
7.72
9.24
10.76
12.28
13.80
15.32
X
FREC_ABS FREC_REL F_ABS_AC F_REL_AC
5.44
8
0.13
8
0.13
6.96
6
0.09
14
0.22
8.48
16
0.25
30
0.47
10.00
14
0.22
44
0.69
11.52
10
0.16
54
0.84
13.04
6
0.09
60
0.94
14.56
4
0.06
64
1.00
Tabla2. Distribucin de frecuencias. Porosidad.
HISTOGRAMA
Pgina 23
ESTADISTICOS
ESTADISTICO
N
MAX
MIN
RANGO
MEDIA
MODA (nica)
MEDIANA
DESV EST
VARIANZA
COEF_VAR
N_CLASES (Sturges).
TAMAO DE CLASE
Q1
Q3
P10
P90
R INTERC (Q)
R PERC (RP)
CURTOSIS
COEF_SESGO
VALOR
64
15.32
4.68
10.64
9.63
8.41
9.32
2.53
6.38
0.26
7.00
1.52
8.35
11.18
6.07
13.07
2.83
6.99
-0.18
0.23
Pgina 24
Pgina 25
Deducir si la distribucin de dicha variable puede ser asimilada a una distribucin normal.
Y a una log normal? Explicar las razones.
La distribucin de la variable porosidad sigue una distribucin normal, ya que con esta
distribucin se ajustan ms los valores a una recta.
Pgina 26
Observar detenidamente este mapa y verificar si existe algn valor que est marcadamente
fuera del rango de variacin de los valores cercanos a l.
En el grfico 6, se muestran 3 crculos negros que son aquellas zonas donde hay puntos con
valores de porosidad bastante diferente a sus vecinos. En la zona inferior izquierda hay valores
desde 6 hasta 12, en la zona inferior desde 5 hasta 12, y en la zona superior derecha desde 7
hasta 14.
Pgina 27
Responder a las siguientes preguntas: Dnde estn los valores ms altos?, hay alguna
direccin aparente en la cual los valores de los datos sean ms continuos? (observar la
disposicin de los valores bajos y altos).
Los valores ms altos los encontramos en la misma figura 6 encerrados en un crculo verde,
estn en la parte superior derecha, superior izquierda e inferior derecha, van desde 12 hasta 15.
Aparentemente en la direccin noroeste sureste, los valores son ms continuos, no se ve
mucho contraste en esta direccin, tal es as que no se ubic ningn crculo negro (contraste)
ah. En la figura 7 esta direccin est representada con una elipse azul.
Pgina 28
Este grafico nos ayuda a detectar direcciones de anisotropa, y podemos comprobar en l lo que
se deca en los prrafos anteriores, es decir hay ms continuidad espacial en la direccin
noroeste sureste (azul en el grafico 8), y hay zonas de contraste en la parte inferior izquierda y
superior derecha (rojo grafico 8).
Pgina 29
Pgina 30
Solamente con fines de ilustracin sobre el comportamiento particular que presentan algunos
elementos metlicos en determinados tipos de depsitos, se presenta el caso del histograma del
Fe, que tiene un comportamiento lognormal sesgado a la derecha en el yacimiento de hierro de
Marcona, que tambin fue hallado anteriormente para el Fe, por el Dr. A. Marn en el
yacimiento de hierro del noroeste australiano (MARIN A. 1978).
Pgina 31
Pgina 32
Pgina 33
Pgina 34
Pgina 35
Pgina 36
Distribucin Espacial del Oro y la Plata La distribucin espacial de las leyes de oro y de las
leyes de la plata para este tipo de yacimiento Epitermal de Alta Sulfuracin (HS) presentan
disposiciones espaciales diferentes, es decir no guardan correlacin espacial como tambin lo
indican los anlisis estadsticos. El coeficiente de variacin de la variable oro es de 1.79 y el
coeficiente de variacin de la plata es de 1.45, datos estadsticos que guardan relacin con las
distribuciones espaciales encontradas para ambas variables econmicas. Las leyes de plata de
valores mayores a 5.5 ppm que representan la zonacin de mayores valores de ley se presenta
como una capa elongada en concordancia con la superficie y tiene un espesor de 40 metros
aproximadamente, y con algunos valores errticos que no bajan de la cota 3897.95 m.s.n.m. Las
leyes de oro de valores mayores a 1.4 ppm ya representan valores econmicos para este
yacimiento, por el volumen de su tonelaje, se presentan como una zonacin ms profunda a la
zonacin de alta ley de la plata, que se extiende hasta un nivel inferior de 3815.46 m.s.n.m.
segn ha sido registrado en los sondajes, lo cual indica un espesor de 200.15 metros en
promedio en altura.
Pgina 37
7.5 CONCLUCIONES
El proyecto cuenta con la informacin de 60 sondajes constituyendo mayor poblacin con
respecto a los canales, con un total de 4,420 muestras compsito. Se defini un modelo
geolgico en funcin de los tipos de alteracin y eventos de mineralizacin propios del tipo de
mineralizacin para un yacimiento Epitermal de Alta Sulfuracin. Es de resaltar que el dominio
geolgico se defini para todo el yacimiento en funcin de las leyes de oro y plata por tener
limitacin de informacin de las dems variables metlicas.
Pgina 38
Pgina 39
8. BIBLIOGRAFA Y LINCOGRAFIA
o CHAUVET P. & CHILES J. (1975) Kriging a method for cartography of the
sea floor. Int. Hydrogr. Rev., LII (1):25-41.
http://www.geo.upm.es/postgrado/CarlosLopez/geoestadistica/VARIOGR
AMA.ppt.
http://www.dspace.espol.edu.ec/bitstream/123456789/5978/3/cap%C3%
ADtulo%202.doc
Pgina 40