Ayudantía/Laboratorio 5 Kriging MIN 235 – Geoestadística Rodrigo Estay Huidobro
[email protected]
Estimadores lineales ponder ponderados ados La idea básica es estimar el valor de una variable regionalizada (por ejemplo, la ley de cobre total) en una posición u donde no conocemos el valor verdadero, planteando:
donde Z*(u) es el valor estimado para para la posición u, {Z(ui), i=1...n} son los valores de los datos en las posiciones { ui, i=1...n}, a es un coeficiente aditivo y { i, i=1...n} son ponderadores.
Estimadores lineales ponder ponderados ados La idea básica es estimar el valor de una variable regionalizada (por ejemplo, la ley de cobre total) en una posición u donde no conocemos el valor verdadero, planteando:
donde Z*(u) es el valor estimado para para la posición u, {Z(ui), i=1...n} son los valores de los datos en las posiciones { ui, i=1...n}, a es un coeficiente aditivo y { i, i=1...n} son ponderadores.
Estimadores lineales ponder ponderados ados
¿Qué factores podrían considerarse en la asignación de los ponderadores? –
–
cercanía a la posición que está siendo estimada redundancia entre los valores de datos
–
continuidad continuid ad o variabilidad espacial
–
anisotropía (dirección preferencial) preferencial)
Estimadores lineales ponderados Más cercano vecino
Atribuye toda la ponderación al dato más cercano al sitio a estimar (i = 1 para el dato más cercano, i = 0 para los otros datos, a = 0) También llamado por “estimador polígonos de influencia”, puesto que el sitio a estimar se encuentra en el polígono de influencia del dato que se lleva toda la ponderación
Estimadores lineales ponderados Inverso de la distancia Atribuye a cada data una ponderación proporcional al inverso de su distancia al sitio a estimar Existen variantes, donde se eleva la distancia a una cierta potencia:
donde d i es la distancia entre el dato nºi y la posición que se está estimando, c es una constante pequeña, y w es un valor usualmente comprendido entre 1 y 3
Estimadores lineales ponderados Inverso de la distancia Inverso de la distancia
Inverso del cuadrado de la distancia
Estimadores lineales ponderados Kriging Los estimadores anteriores son sencillos de aplicar, pero la asignación de la ponderación sólo depende del criterio de cercanía. La idea del método de kriging es incorporar los otros criterios (redundancias entre datos, continuidad espacial, anisotropía) mediante el uso del variograma. De este modo, se logra obtener estimaciones más precisas mejor planificación, mejor selección estéril / mineral, + $$$ →
Estimadores lineales ponderados Kriging El Kriging es el mejor estimador lineal insesgado (Best Linear Unbiased Estimator , BLUE) –
“lineal” porque es una combinación lineal ponderada de los
datos –
“insesgado” porque el error de estimación tendrá una media
igual a 0 –
“mejor” en el sentido del error de varianza mínima para un
modelo dado de covarianza / variograma
Estimadores lineales ponderados Kriging Existen varios tipos de kriging: –
–
–
Kriging simple: media m conocida Kriging ordinario: media m desconocida Kriging con deriva: media desconocida que depende de cada posición m(u) •
•
•
–
Kriging no lineal: aplica kriging a una transformada de la variable •
•
•
•
–
–
Kriging universal - intrínseco: la deriva es un polinomio de las coordenadas Kriging trigonométrico : la deriva es una función periódica Kriging con deriva externa : la deriva es proporcional a una variable secundaria Kriging lognormal : cuando el logaritmo de los datos tiene una distribución normal Kriging de indicadores : aplica kriging a datos binarios (indicadores) que codifican probabilidades de pertenecer a un tipo de roca o de sobrepasar una ley de corte Kriging disyuntivo : aplica kriging a factores que descomponen la variable a estimar Kriging multi-Gaussiano : aplica kriging a la transformada Gaussiana de los datos
Kriging multivariable = cokriging Etc.
Kriging Simple Hipótesis 1) Se conoce el valor promedio m de la variable regionalizada 2) También se conoce el variograma g(h), el cual presenta una meseta: g() = s2 existe una funcion de covarianza, dada por C(h) = s2 – g(h)
Kriging Simple Queremos construir el “mejor estimador lineal insesgado” para estimar el valor en un sitio u:
Para determinar el coeficiente a y los ponderadores {i, i=1...n}, se examina las condiciones de insesgo y de varianza mínima.
Kriging Simple Condición de insesgo El valor esperado del error de estimación es:
Para que este valor esperado sea nulo, se debe plantear
Kriging Simple Varianza mínima La varianza del error de estimación se expresa en función de la covarianza
=
var{ Z * (u)} n
=
2 cov{ Z * (u),Z (u)} var{ Z (u)} n
n
cov{ Z (u ),Z (u )} 2 cov{ Z (u),Z (u )} i
j
i
i
j
i1
i1 j 1
n
=
n
n
C (u u ) 2 C (u u ) i
i1 j 1
i
j
i
i
j
i1
i
C (0)
C (0)
Kriging Simple Varianza mínima Los ponderadores óptimos (que minimizan la varianza del error) pueden determinarse tomando derivadas parciales con respecto a los ponderadores
e igualándola a cero:
Este sistema de n ecuaciones con n ponderadores desconocidos es el sistema de kriging simple (KS)
Kriging Simple El estimador se escribe:
La media aparece con un ponderador que es el complemento de la ponderación acumulada de los datos. Mientras más lejos el sitio u de los datos, menores serán sus ponderadores y mayor será la ponderación de la media. De cierto modo, la media “compensa” la falta de información aportada por los datos
Kriging Simple Varianza del error
Asimismo, es posible determinar el valor de la varianza del error (que se minimizó). Esta varianza lleva el nombre de “varianza de kriging”, aunque se refiere a la varianza del error de kriging:
Puede calcularse sin conocer los valores de los datos. Se demuestra que esta varianza siempre es menor o igual a s2.
Kriging Ordinario Hipótesis 1) No se conoce el valor promedio m de la variable regionalizada. Esto permite generalizar el kriging a situaciones donde esta media no es constante en el espacio: la media puede variar de una región a otra, siempre que sea aproximadamente constante en cada vecindad de kriging. 2) Sólo se conoce el variograma g(h) o la función de covarianza C(h)
Kriging Ordinario Condición de insesgo El valor esperado del error de estimación es: E { Z (u) Z (u)} a *
n
E { Z (u )} E { Z (u)} i
i
i 1
n
a i m m i 1
Siendo m desconocida, para que este valor esperado sea nulo se debe plantear
a0
n
1 i
i 1
Kriging Ordinario Varianza mínima La varianza del error de estimación se expresa en función de la covarianza var{ Z (u) Z (u)} *
=
var{ Z * (u)} n
=
2 cov{ Z * (u),Z (u)} var{ Z (u)} n
n
cov{ Z (u ),Z (u )} 2 cov{ Z (u),Z (u )} i
j
i
i
j
i1
i1 j 1
n
=
n
n
C (u u ) 2 C (u u ) i
i1 j 1
i
j
i
i
j
i1
i
C (0)
C (0)
Kriging Ordinario Varianza mínima Los ponderadores óptimos (que minimizan la varianza del error sujeto a que la suma de los ponderadores sea igual a 1) pueden determinarse introduciendo un multiplicador de Lagrange m
n var{ Z (u) Z (u)} i j C (u i u j ) 2 i C (u u i ) C (0) 2 m i 1 i 1 j 1 i 1 1 i n
n
n
*
0
y anulando las derivadas parciales con respecto a los ponderadores y con respecto al multiplicador de Lagrange
Kriging Ordinario Las derivadas parciales son: n [ ] 2 j C (ui u j ) 2 C (u ui ) 2 m , i 1,...n i j 1
[ ] n 2 i 1 m i 1
Se desemboca en el sistema de kriging ordinario (KO) n j C (u i u j ) m C (u ui ) , i 1,... n j 1 n 1 i i 1
Kriging Ordinario En notación matricial:
C (u1 u1 ) C (u u ) n 1 1
C (u1 u n ) 1
C (u n u n ) 1 1 0
mide las correlaciones (redundancias) entre datos
1 n m
C (u1 u) C (u u) n 1
mide las correlaciones entre datos y valor a estimar
Kriging Ordinario Se puede escribir también en términos de variograma
g (u1 u1 ) g (u u ) n 1 1
g (u1 u n ) 1
g (u n u n ) 1 1 0
1 n m
g (u1 u) g (u u) n 1
No es preciso que el variograma tenga una meseta para que exista este sistema. Por ende, se puede utilizar aun cuando el variograma crece infinitamente y no existe ni varianza ni covarianza
Kriging Ordinario Varianza del error La varianza del error ( “varianza de kriging”) vale: 2 (u) s 2 s KO
n
C (u u) m i
i
i 1
n
i g (ui u) m i 1
Puede calcularse sin conocer los valores de los datos. En ocasiones, esta varianza puede ser mayor que s2.
Ejemplo Dada la siguiente configuración, calcular el estimador de kriging simple y ordinario y las respectivas varianza para estimar Z(u0). El modelo variográfico a utilizar es: g(h) = 0,3 + 1,75 exp(a=30) Se sabe que Z(u1) = 0,5 g/t, Z(u2) = 16 g/t y la media del sector (vecindad) es m = 1,4 g/t
3 | h | g(h) C 1 exp a Solución KS:
Solución KO:
1 = 0,208 2 = 0,410
1 = 0,399 2 = 0,601 = 0,595
Z(u0) = 7,22 g/t 2 KS = 1,43 (g/t)
Z(u0) = 9,82 g/t = 1,66 (g/t)2
Z(u0)
Z(u2)
Z(u1)
Kriging de bloques El kriging (simple, ordinario…) puede ser extendido a la estimación directa del valor promedio en un bloque: Z(V)
1
Z(u)du V V
El sistema de kriging sólo difiere del sistema de kriging puntual en el miembro de la derecha: hay que reemplazar la covarianza punto-punto C(ui – u) por la covarianza punto-bloque: C (ui ,V)
1
1
N
C (u ,u)d u C (u ,x ) V N V
i
i
k
k 1
donde {xk, k = 1… N} son puntos que discretizan el bloque V.
Observación sobre el sistema de kriging Los ponderadores y la varianza de kriging toman en cuenta: aspectos geométricos : distancias entre el sitio a estimar y los datos; distancias (redundancias) entre los datos mismos aspectos variográficos : continuidad espacial, anisotropía, mediante la covarianza o el variograma –
–
No toman en cuenta información local: valores de los datos ( en particular, son indiferentes a la presencia de un efecto proporcional ) –
→
A continuación, se presenta un estudio de la sensibilidad de los resultados a cambios en la configuración geométrica de los datos y del modelo variográfico.
Efecto de Distancia Caso base y efecto del aumento en la distancia sobre los ponderadores g (h) 0,2 0,8 Sph(100)
Efecto Pantalla y Anisotropía Efecto pantalla y de la anisotropía (Anis. Geom. 4 x 1) sobre los ponderadores g (h) 0,2 0,8 Sph(100)
Efecto de Declusterización y Distancia Efecto de declusterización y distancia sobre los ponderadores g (h) 0,2 0,8 Sph(100)
Cambio en efecto pepita Efecto sobre los ponderadores de un cambio en el efecto pepita
Propiedades del Kriging Interpolación exacta: la estimación en un sitio con dato es igual al valor del dato y la varianza de kriging en este sitio vale 0 Aditividad: la estimación de la ley de un bloque es igual al promedio de las estimaciones de leyes puntuales en este bloque Suavizamiento : la dispersión de los valores estimados es menor que la dispersión de los valores verdaderos, sobre todo en las zonas donde hay pocos datos. En consecuencia, se tiende a subestimar las zonas de altas leyes y sobreestimar las zonas de bajas leyes. El kriging es inapropiado para evaluación de procesos donde los valores extremos son importantes (→ simulaciones) Insesgo y precisión : por construcción Sesgo condicional: el error promedio puede no tener esperanza nula cuando se considera sólo los sitios donde la ley estimada es alta (o baja). En general, el sesgo condicional es pequeño si se usa suficientes datos (>15)
Propiedades del Kriging Sesgo condicional
Al tener sesgo condicional, se incurre en una mala apreciación del negocio. La ley media del material mandado a planta (material cuya estimación supera una ley de corte) es inferior a la ley media estimada de este material, mientras que la ley media del material mandado a botadero es superior a la ley media estimada de este material.
Propiedades del Kriging Suavizamiento
Kriging Plan de Kriging ¿Cuáles son los datos a utilizar en la estimación? •
Vecindad única: se usa todos los datos
•
Vecindad móvil : se usa sólo los datos cercanos al sitio (bloque) a estimar –
–
–
En general, se toma una vecindad en forma de elipse (2D) o elipsoide (3D), orientado según la anisotropía observada en el variograma Se suele dividir la vecindad en sectores angulares (cuadrantes en 2D ú octantes en 3D) y buscar datos en cada sector Los radios del elipse (elipsoide) no necesariamente corresponden a los alcances del variograma, sino que se definen de manera de poder encontrar suficientes datos para hacer la estimación
Kriging Plan de Kriging
Ejemplo de vecindad móvil
Ejemplo Se tiene 2 muestras con sus leyes de cobre y se desea estimar la ley en un sitio no muestreado, tal como se indica en la figura y la tabla siguiente. 0.6
Coordenada 1 3 5
0.5
] % [ 0.4 e r b o 0.3 c e d y 0.2 e L
Ley de Cobre 0.3 0.5 ¿?
0.1 0 0
1
2
3
4
5
6
Coordenada
La ley media en el yacimiento entero se estima en 0.7%. El variograma de las leyes en la dirección que nos interesa se muestra a continuación. 3.5 3
Estimar la ley en el sitio no muestreado por kriging simple y por kriging ordinario, usando una vecindad con 1 dato, luego con los 2 datos. Comentar los resultados.
a 2.5 m a r 2 g o 1.5 i r a V 1
0.5 0 0
2
4
6 Distancia
8
10
Kriging Validación Para validar los parámetros del kriging (modelo de variograma, vecindad elegida), se puede usar los siguientes métodos: •
•
Validación cruzada: se estima sucesivamente cada dato considerando solamente los datos restantes Jack-knife: se divide la muestra inicial en dos partes (por ejemplo, cuando hay dos campañas de sondajes), y se estima una parte a partir de la otra
Luego, se hace un estudio estadístico de los errores cometidos para saber si el kriging fue “satisfactorio” (buena precisión, poco sesgo condicional…)
Kriging Validación Criterios de validación: •
medias de los errores y de los errores estandarizados: deben ser
cercanas a cero estimador sin sesgo •
varianza de los errores: debe ser la más baja posible
estimador preciso •
varianza de los errores estandarizados: debe ser cercana a 1
el variograma cuantifica adecuadamente la incertidumbre •
nube de dispersión entre valores reales y estimados : la
regresión debe acercarse a la diagonal insesgo condicional
Aplicación a los datos de Andina Elección del plan de kriging
Se compara tres planes de kriging por “ jack-knife”: estimar 902 datos a partir de los 1474 datos restantes. restantes. La variable en estudio es la ley de cobre. • plan 1: estimar con los 2 datos más cercanos
• plan 2: estimar con los 24 datos más cercanos (3 por
octante) • plan 3: estimar con los 48 datos más cercanos (6 por
octante) En cada caso, se recurre al kriging ordinario o rdinario,, que sólo requiere especificar el modelo de variograma variograma (media desconocida).
Aplicación a los datos de Andina Histogramas Histogramas de los errores cometidos
Las medias de los lo s errores son casi nulas insesgo La mayor precisión se alcanza en los planes 2 y 3
Aplicación a los datos de Andina Nubes de correlación entre leyes reales y estimadas
El sesgo condicional y la dispersión de la nube son mínimos en los planes 2 y 3.
Aplicación a los datos de Andina Kriging ordinario de las leyes en un banco con el plan 2, usando los datos de exploración
Aplicación a los datos de Andina Kriging simple de las leyes en un banco con el plan 2 (ley media = 0.98%), usando los datos de exploración
Aplicación a los datos de Andina Kriging ordinario de bloques de soporte 5m 5m 12m, usando los datos de exploración
Aplicación a los datos de Andina Kriging ordinario de bloques de soporte 25m 25m 12m, usando los datos de exploración
Aplicación a los datos de Andina Kriging ordinario de bloques de soporte 25m 25m 12m, usando los pozos de tronadura
Parámetros asociados a una ley de corte de 0.5% Cu:
costo mina 0.6 US$/t; costo planta 4.4 US$/t; recuperación 0.8; costo fundición 770 US$/t; precio cobre 1870 US$/t
Aplicación a los datos de Andina Resultados económicos para una ley de corte de 0.5% Cu
14%
mineral a planta estéril a planta
16%
2% 5%
8% 3%
mineral a botadero estéril a botadero
73%
79%
Tonelaje a planta [Mt] Ley promedio efectiva [%Cu] Ley promedio estimada [%Cu] Cantidad de metal efectiva [mt] Cantidad de metal estimada [mt] Beneficio efectivo [MUS$] Beneficio previsto [MUS$]
Kriging
Pozos
71.64 1.041 1.057 745.8 757.3 298.1 308.2
64.42 1.089 1.143 701.5 736.3 295.2 325.8
Para su estudio…. Influencia de los parámetros en los resultados del kriging Se busca estimar el valor en el sitio “?” a partir de los valores observados
en A, B, C, D, E, F.
Influencia del comportamiento del variograma en el origen (1) Variograma lineal v/s variograma parabólico en el origen esférico (alcance 1, meseta 1)
Gaussiano (alcance 1, meseta 1)
Influencia del comportamiento del variograma en el origen (2) Variograma lineal v/s variograma con discontinuidad en el origen esférico (alcance 1, meseta 1)
esférico (0.5) + pepita (0.5)
Influencia del comportamiento del variograma en el origen (3) Variograma lineal v/s variograma totalmente pepítico esférico (alcance 1, meseta 1)
efecto pepita puro (meseta 1)
Influencia de la meseta del variograma Se toma el modelo esférico como referencia esférico (alcance 1, meseta 1)
esférico (alcance 1, meseta 2)
Influencia del alcance del variograma (1)
esférico (alcance 1, meseta 1)
esférico (alcance 2, meseta 1)
Influencia del alcance del variograma (2)
esférico (alcance 1, meseta 1)
esférico (alcance 0.5, meseta 1)
Influencia del efecto de hoyo del variograma
esférico (alcance 1, meseta 1)
seno cardinal (semi-período 0.2)
Influencia de la anisotropía del variograma
esférico (alcance 1, meseta 1)
esférico anisótropo (meseta 1, alcances 2 [N45E] y 0.5 [N45O])
Influencia del tipo de kriging: simple u ordinario (1) esférico (alcance 1, meseta 1) kriging ordinario
esférico (alcance 1, meseta 1) kriging simple
Influencia del tipo de kriging: simple u ordinario (2) esférico (alcance 0.5, meseta 1) kriging ordinario
esférico (alcance 0.5, meseta 1) kriging simple
Influencia del tipo de kriging: puntual o de bloque (1) esférico (alcance 1, meseta 1) kriging puntual
esférico (alcance 1, meseta 1) kriging de un bloque 0.25 0.25