Tema02 Introducc Estadìstica EfectProp
Tema02 Introducc Estadìstica EfectProp
Tema02 Introducc Estadìstica EfectProp
EPIG
FIGMM
• Validación de la Data
• Tratamiento de valores bajos
no significativos
• Identificación y tratamiento
35% 25%
de altos erráticos
• Compatibilización de datas
10% distintas
• Promedio, Desv.estándar,
15% 15% Varianza, Sesgo, Kurtosis, etc.
• Histograma
• Curva de acumulación de
Data frecuencias
C.Estad • Cálculo y ploteo de Variogramas
C. Geoestad • Anisotropias geométricas y zonales
• Análisis estructural geoestadístico
Process
• Interpretación de variogramas
Interpret • Etc.
1
3
Intervalos de Confianza 99.7 % Área bajo
95.0 % la curva
Distribución normal 68.0 %
de los errores:
Si no existe sesgo, en general los errores siguen una
distribución normal como la mostrada en el gráfico
P [-2s < e < +2s] = 0.95
donde: e es error y s2 su varianza
Lo cual significa que:
el error e caerá dentro del área comprendida entre
-2s y + 2s con un intervalo de confianza de 0.95
ss
Lo cual significa que se aspira a tener un
six sigma porcentaje de 99.99966 libre de defectos;
s o sólo 3.4 DPMO.
VARIAS DENOMINACIONES:
Six sigma
6s
6 sigma
6s
DPMO: Defectos por millón de oportunidades
2
EDA: “Exploratory Data Analysis”
❑ Básicamente es el reconocimiento, esencialmente estructural y gráfico, de las
distintas características de la Data; así como el análisis general de su contenido.
Caracterización estadística
3
7
Mediana Moda
Promedio
Estadísticos
principales
Mediana
Promedio
Estadístico Valor
Moda.- El intervalo de clase con la mayor frecuencia Promedio 1.966
Quartiles
Q1 Q2 Q3
4
Presentación sumaria de estadísticos:
“Box-plot” (Diagrama de caja)
Boxplot of Swelling clays
3.2
2.6
Swelling clays
2.4
2.2 Mediana
2.0
Primer
1.8
Quartil
1.6
Valor mínimo
Presentación sumaria de la
Caracterización Estadística
Summary for Cu_ppm
A nderson-D arling N ormality Test
A -S quared 41.60
P -V alue < 0.005
M ean 44.132
S tD ev 46.065
V ariance 2122.025
S kew ness 4.6149
Kurtosis 42.6063
N 724
M inimum 3.000
1st Q uartile 15.200
M edian 31.450
3rd Q uartile 57.625
0 100 200 300 400 500 600 M aximum 632.000
95% C onfidence Interv al for M ean
40.771 47.493
95% C onfidence Interv al for M edian
29.070 34.000
95% C onfidence Interv al for S tD ev
9 5 % C onfidence Inter vals
43.809 48.569
Mean
Median
30 35 40 45 50
10
5
Verificación de la “normalidad”
p > a → Distribuc. normal
de una distribución
Summary for Cu gpl
A nderson-Darling N ormality Test
A -S quared 0.29
P -V alue 0.600
M ean 39.059
S tDev 1.003
V ariance 1.005
S kew ness 0.152379
Kurtosis -0.253495
N 180
M inimum 36.600
1st Q uartile 38.300
M edian 39.100
3rd Q uartile 39.700
37 38 39 40 41 42 M aximum 41.900
95% C onfidence Interv al for M ean
38.911 39.206
95% C onfidence Interv al for M edian
38.800 39.200
95% C onfidence Interv al for S tDev
9 5 % C onfidence Inter vals
0.909 1.118
Mean
Median
11
60
50
40
30
20
10
5
0.1
36 37 38 39 40 41 42 43
Cu gpl
12
6
Identificación y Tratamiento de
Valores Bajos No significativos
14
7
Identificación y Tratamiento de
Valores Altos Erráticos
Definición de
valores altos
erráticos
❑ La ocurrencia aislada de
valores altos merece atención y
un tratamiento especial.
8
Summary for Cu_ppm
A nderson-Darling N ormality Test
A -S quared 41.60
P -V alue < 0.005
M ean 44.132
S tDev 46.065
Con todos los datos V ariance 2122.025
S kew ness 4.6149
Kurtosis 42.6063
N 724
M inimum 3.000
1st Q uartile 15.200
Identificación de valores M edian
3rd Q uartile
31.450
57.625
0 100 200 300 400 500 600
altos erráticos M aximum 632.000
95% C onfidence Interv al for M ean
40.771 47.493
95% C onfidence Interv al for M edian
29.070 34.000
95% C onfidence Interv al for S tDev
9 5 % C onfidence Inter vals
43.809 48.569
Mean
30
A nderson-Darling 35 Test
N ormality 40 45 50
A -S quared 27.43
P -V alue < 0.005
Eliminando los altos erráticos: M ean 41.560
> 200 ppm Cu S tDev 34.626
V ariance 1198.994
S kew ness 1.45774
Kurtosis 2.12815
N 718
M inimum 3.000
1st Q uartile 15.175
M edian 31.200
Median
9 9.03
8
7.18
7 6.94
6
5.52
5.23
5.17
5
Data
4 4.15
4
3 3.12
2.94
2.9
0 0.12
18
9
Monitoreo de la data para definir Estadísticos de kao:
x = 2.88
verdaderos altos ERRATICOS s = 1.18
19
Comparación de nubes de 9
8
correlación con y sin altos 7
erráticos r = 0.54
6
5
kao
0
0 1 2 3 4 5
prf
Scatterplot of kao vs prf
8
7
r = 0.61
6
5
prf = - 0.022 + 0.506 kao
kao
1
0 1 2 3 4 20
prf
10
Nube de correlación prf vs mmt
3.50
3.00
Efecto de altos erráticos
2.50
2.00
en el coeficiente de
prf
1.50
y = 0.069x + 1.204
regresión lineal
1.00 r² = 0.182
0.50 r = 0.427
0.00
0.00 5.00 10.00 15.00 20.00
mmt
2.00
1.50
prf
1.00
y = -0.646x + 2.687
r² = 0.769
0.50 r = - 0.877
0.00
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50
mmt
2.50
0.00
0.00 5.00 10.00 15.00 20.00
mmt
1.60
1.40
1.20
1.00
prf
0.80
0.60 y = -0.017x + 1.199
0.40 r² = 0.006
r = 0.077
0.20
0.00
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50
mmt
11
Tratamiento de valores altos erráticos
❑ CORTES ESTADÍSTICOS.-
❑ Utilizando gráficos probabilísticos de frecuencia acumulada, donde los altos
erráticos se
discriminan fácilmente, para luego ser reducidos a un valor determinado.
❑ Usando “Control charts” (ver diapositivas siguientes)
23
Minimum 1.0700
1st Quartile 2.2550
Median 2.6500
Típico alto errático 95% Confidence Intervals
3rd Quartile 3.2450
Mean
Maximum 9.0300
Median
9
1 x s x + s x+2s x+3s
1 2.876 1.18 4.055 5.235 6.414
8
1
7
6.414 ALTERNATIVAS MAS USADAS:
Individual Value
6 1 1
1 1 1 1
5 5.235 ❑ Eliminar el alto errático
UCL=4.730
4 4.055 ❑ Reemplazarlo por la media más 1s, o
_ 2s o 3s
3 X=2.876
2
❑ Reducción por la regla del tercio
menos tercio.
1 LCL=1.021
0
1 15 29 43 57 71 85 99 113 127 141
24
Observation
12
Ejemplo de tratamiento log-normal o de Sichel
25
2.34 2.727
26
13
Ejemplo de tratamiento log-normal o de Sichel
27
28
14
Correlación entre dos variables
La correlación entre dos variables es el tipo de asociación que existe entre ambas;
la misma que es cuantificada por el denominado Coeficiente de Correlación “r”:
Donde: n
( xi − x)( yi − y)
Cov( x, y )
r= • Cov es la covarianza: Cov( x, y ) = (1 / n)
Sx * Sy
i =1
30
r = 0.94 r = 0.54
y
y
x x
r = - 0.94
r = 0.09
y y
15
Ejemplo de nubes de correlación entre filosilicatos
7
prf = -0.022 + 0.506 kao
6
5
r = 0.61
kao
1
0 1 2 3 4
prf
31
Y
y=b+mx
residual 6
residual 1
X
32
16
33
Análisis de “residuales”
Residual
Percent
0
50
10 -1
1
0.1 -2
-2 -1 0 1 1 2 3 4
Residual Fitted Value
Residual
0
40
-1
20
0 -2
-1.5 -1.0 -0.5 0.0 0.5 1.0 1 1 0 2 0 30 40 5 0 6 0 7 0 80 90 10 0 11 0 1 2 0 1 30 1 40
Residual
Observation Order
17
Típica distribución LOG-NORMAL del Au
en un yacimiento epitermal de HS
Valores bajos no
significativos Moda
Mediana
Altos erráticos
Media
Au ppb 35
Tomado de Canchaya (2004)
Mean 2473.2
log-normalidad StDev
Variance
3225.6
10404234.4
Skewness 2.68188
Kurtosis 8.95936
0 3000 6000 9000 12000 15000 18000
Obviamente se rechaza la hipótesis N 169
99
95 Los logs de los valores de Cu
90
80 trazados en un gráfico de
70
Percent
60
50
40
Loc 7.115 acumulación ploteado en un
30 Scale 1.219
20 N 169
gráfico probabilístico se ajustan a
10
5 AD 1.159 una recta.
P-Value <0.005
1
0.1
10 100 1000 10000 100000 36
Cu ppm
18
Comprobación gráfica del
Efecto Proporcional
1500
1250
Ley media del oro (ppb)
1000
750
500
250
0
0 250 500 750 1000 1250 1500 1750 2000 2250 2500
Desviación estándar
37
Tomado de Canchaya (2004)
Referencias bibliográficas
❑ Canchaya S. (2004) Log-normalidad y efecto proporcional. Características frecuentes en los yacimientos de
oro.- XII Congr. Peruano Geol.; 4p.
❑ Canchaya S. (2013) Sampling of Variables with Proportional Effect.- GEOMET 2012; Sgo. de Chile Dic.
2012 y GEOMIN 2013; Sgo. de Chile Jul. 2013.
❑ David M. (1977) Geostatistical Ore Reserve Estimation.- Elsevier New York; 364 p.
❑ Rendu J. M. (1981) An Introduction to Geostatistical Methods of Mineral Evaluation.- South Afr. Inst. Min.
Metall.; Johannesburg; 84 p.
❑ Sichel H. S. (1952) New methods in the statistical evaluation of mine sampling data.- Trans. I. M. M.,
London; 61: 261-288.
❑ Sichel H. S. (1966) The estimation of means and associated confidence limits for smalls samples from
lognormal populations.- Symposium on Mathematical Statistics and Computer Applications in Ore Valuation:
106-122; South Afr. Inst. Min. Metall.; Johannesburg. Citado por Rendu (1981).
38
19