Que es Kriging? Es una interpolación óptima basada en la regresión contra los valores z observados de los puntos de datos circundantes, medidos de acuerdo al espacio de valores de cov arianza. Que es interpolación? Es la estimación de una variable en una ubicación no medida de valores observados observados en locaciones circundantes. Por ejemplo, estimando la porosidad a u = (2000 m, 4700 m) basado en los valores de porosidad de los seis datos de puntos más cercanos de nuestra zona.
Parecería razonable estimar la porosidad pesos dato
dado por algunas funciones de decremento de distancia,
.
∑
mediante el promedio ponderado
, con
, desde al punto de
Todos los algoritmos de interpolación i nterpolación (interpolación inversa, splines, funciones básicas radiales, triangulación, etc.) estiman los valores a una locación dada como una suma ponderada de valores de datos a locaciones circundantes. Casi todos los pesos asignados asignados de acuerdo a las funciones que dan un decremento de peso con incrementos de distancia de separación. El Kriging asigna pesos de acuerdo a una función medida de datos manejados (moderadamente), en vez de una arbitraria función, pero pero es solo un algoritmo de interpolación que brindará resultados muy similares a otros en muchos casos (Isaak and Srivastava, 1989). En particular:
-
Si la locación de los datos son bastante densos y uniformemente distribuidos a través del área de estudio, se obtendrán estimados muy buenos a pesar de los algoritmos de interpolación.
-
Si la locación de los datos cae en pocas agrupaciones con largos espaciamientos entre ellos, puede conseguir estimaciones independientes poco confiables de algoritmos de interpolación.
Algunas ventajas del Kriging: -
Ayuda a compensar los efectos de la agrupación de datos, asignando puntos individuales dentro del grupo de menos peso que los puntos de datos aislados (o, tratar grupos más similar a los puntos simples).
-
Determina un error de estimación (varianza de Kriging), en conjunto con la estimación de la variable, Z, consigo mismo (pero el mapa de error es básicamente una versión escalda de un mapa de distancia al punto mas cercano de datos, así que no es único).
-
Disponibilidad de la estimación de error proporciona bases para simulación estocástica de las realizaciones posibles de Z(u).
ENFOQUE Y TERMINOLOGIA KRIGING
Goovaerts, 1997: “Todos los estimadores Kriging no son más que variantes del estimador básico de regresión lineal Z*(u) definido como:
Con
α
: Vectores de localización para puntos de estimación y uno de los datos de los puntos
vecinos, indexado por .
: Número de puntos de datos en la vecindad local usado para la estimación de Z*(u). : Valores esperados (promedios) de
: Peso de Kriging asignado al dato
y
.
que recibirá diferente peso para la estimación de locación diferente. es tratado como un campo aleatorio con un componente tendiente,
componente residual,
para la estimación de la locación ; mismo dato
, y un
. El Kriging estima el residual en u como la suma
ponderada de residuales en puntos de datos circundantes. Los pesos Kriging,
, son derivados
a partir de la función de covarianza o semivariograma, el cual debería caracterizar el componente residual. La distinción entre tendencia y residual algo arbitrario; varía con la escala.
La región de los seis puntos del ejemplo anterior:
FUNDAMENTOS DE KRIGING La forma básica del estimador Kriging es:
El objetivo es determinar pesos,
, lo cual minimiza la varianza del estimador.
Bajo la restricción insesgada:
El campo aleatorio (RF) residual,
es descompuesto dentro de componentes de tendencia y , con el componente residual tratado como un campo aleatorio
con un promedio estacionario de 0 y una covarianza estacionaria (una función de retardo, h, pero no de posición, u):
La función de covarianza residual es generalmente derivado del la entrada del modelo semivariograma,
.
Por lo tanto, el semivariograma alimentamos al programa Kriging que debe representar el componente residual de la variable.
Los tres principales variantes de Kriging, Simple, Ordinario y Kriging con una tendencia, difiere en sus tratamientos de componente de tendencia,
.
SIMPLE KRIGING
Para kriging simple, asumimos que la tendencia del componente es un promedio constante y conocido,
, de modo que:
Este estimado es automáticamente insesgado, desde que . El error de estimación
de modo que
variables aleatorias representando residuales en los puntos de datos, estimación, :
es una combinación lineal de , y el punto de
Usando reglas para la varianza de una combinación lineal de variables aleatorias, la varianza de error es luego dado por:
Para minimizar la varianza de error, tomaremos la derivada de la expresión anterior con respecto a cada peso de kriging y se pone cada derivada a cero. Esto induce al siguiente sistema de ecuaciones:
Debido a que el promedio es constante, la función de covarianza para para el componente residual,
es el mismo que
, de modo que podemos escribir el sistema de
kriging simple directamente en términos de
:
Esto puede ser escrito en forma de matriz como:
Donde
es la matriz de covarianza entre los puntos de datos, con elementos
, k es el vector de covarianza entre los puntos de datos y el punto de estimación, con
elementos dados por
,y
es el vector de pesos de simple kriging para los
puntos de datos circundantes. Si el modelo de covarianza es licito (es decir, el modelo semivariograma subyacentes es lícito) y no hay dos puntos de datos que sean colocalizadas, luego la matriz de covarianza de datos es definida positiva y podemos resolver para los pesos de kriging usando:
Una vez que tenemos los pesos de kriging, podemos calcular la estimación kriging y la varianza de kriging, el cual es dado por:
Después substituyendo los pesos de kriging dentro de la expresión de varianza de error anterior. ¿Qué hace toda esta matemática? Esto encuentra un set de pesos para estimar el valor de variabilidad en la locación de valores en un set de puntos de datos vecinos. El peso en cada punto de datos generalmente decrece con el incremento de la distancia a ese punto, en concordancia con las decrecientes covariazas de datos de estimación especificado en la mano derecha del vector, k. Sin embargo, el set de pesos es también diseñado para tener en cuenta la redundancia entre los puntos de datos,
representados en las covarianzas de punto de datos “punto a dato” en la matris K, -1
Multiplicando k por K (en la izquierda) disminuirá los pesos de los puntos cayendo en relativos grupos a puntos aislados a la misma distancia. Aplicaremos Kriging simple a nuestros datos de porosidad, usando el variograma esférico que
ajustamos anteriormente, con cero “nugget”, un “sill” de 0.78, y un rango de 4141m:
Ya que estamos usando un semivariograma esférico, la función de covarianza es dado por:
Para distancias de separación, h, arriba de 4141m, y 0 más allá de ese rango. El gráfico de
[]
abajo muestra los elementos de la m ano derechas del vector,
, obtenido de conectar las distancias del dato a
punto de estimación dentro de esta función de covarianza:
La matriz de distancias entre pares de puntos de datos (redondeando al metro más cercano) es dado por:
Esto se traslada dentro de una matriz de covarianza de datos:
(redondeado a lugares de 2 decimales). Note en particular la correlación relativamente alta entre los puntos 5 y 6, separado por 447m. El vector resultante de los pesos de kriging es:
Observe que el punto 6 es asignado a muy pequeños pesos relativo al punto 1 de datos, aunque ambos están a la misma distancia desde el punto de estimación y tienen
aproximadamente la misma covarianza de puntos de datos para la estimación de puntos (
). Esto es por que el punto 6 de datos es efectivamente “screened” por
el e cercano punto 5 de datos. Los puntos de datos 5 y 6 bastante estrechamente correlacionada con cualquiera y 5 tiene mas fuerte correlacion con el punto estimado, vemos que el punto 6 de datos es efectivamente ignorado. Tenga en cuenta que las covarianzas y por lo tanto los pesos kriging son determinados enteramente por la configuración de los dato s y el modelo de covarianza, no los valores actuales de los datos.
Las porosidades en los puntos 5 y 6 podrían de hecho ser muy diferentes y este no tendría influencia en los pesos de kriging. El valor de porosidad promedio para 85 pozos es 14.70% y los valores de porosidad en los seis pozos del ejemplo son 13.84%, 12.15%, 12.87%, 12.68%, 14.41% y 14.59%. El residual estimado del promedio en u es dado por el producto escalar de los pesos de kriging y los vectores residuales en los puntos de datos:
Añadiendo el promedio de nuevo dentro de este residual estimada nos da una porosidad estimada de
.
Similarmente, conectando los pesos de kriging y el vector k dentro de la expresión para la varianza de estimación nos da una varianza de 0.238 (cuadrado del porcentaje). Dado estas dos piezas de información, podemos representar la porosidad en u = (2000m, 4700m) como una distribución normal con un promedio de 12.83% y una variación estándar de 0.49%. Nótese que, al igual que los pesos de kriging, el estimado de la varianza depende enteramente de la configuración de los datos y la función de covarianza, no en los valores de sí mismos. La varianza de estimación Kriging sería el mismo a pesar de si los valores de porosidad actual en la vecindad fueron muy similares o altamente variable. La influencia de los valores de los datos, a través de la adecuación del modelo de semivariograma, es muy indirecta. Aquí tenemos los estimados del simple kriging y la desviación estándar en rejillas 100x80 con 100 metros de espaciamiento usando el modelo de semivariograma esférico y estimando cada valor de celda de 16 puntos más cercanos de datos vecinos (locaciones de pozos):
Kriging Ordinario. Para el Kriging ordinario, en lugar de asumir que la media es co nstante en todo el dominio, se
supone que es constante en el vecindario local de cada punto de la estimación, que es: para cada valor de los datos en las i nmediaciones,
estimar Z(u). En este caso, el estimador Kriging puede ser escrito
, que usamos para
y filtramos la media local desconocida, al exigir que los pesos kriging sumen 1, dando lugar a un estimador kriging ordinario de:
con
Con el fin de minimizar la varianza del error sujeto a la restricción de la unidad de suma en los
pesos, que en realidad instalamos el sistema para que minimice el error de la varianza más un término adicional que implica un parámetro de Lagrange,
:
Así la minimización con respecto a las fuerzas del parámetro de Lagrange la restricción será:
En este caso, el sistema de ecuaciones para los pesos resulta ser:
( )
Donde
es una vez más la función de covarianza para el componente residual de la
variable. En Kriging simple, podríase igualar
y
, la función de covarianza para la
variable en si, debido a la suposición de un promedio constante. Esta cualidad no es fundamentada, pero en la práctica la sustitución es generalmente hecho de todos modos, en la suposición que el semivariograma, a partir del cual C(h) es derivado, efectivamente filtra la influencia de las tendencias de gran escala en la media. De hecho, la restricción de la unidad de suma en los pesos permite el sistema kriging ordinario
para ser declarado directamente en términos del semivariograma (en lugar de los valores de arriba). En este sentido, el kriging ordinario, es enfoque de interpolación que sigue
naturalmente a partir de un análisis de semivariograma, ya que ambas herramientas tienden a filtrar las tendencias en la media. Una vez que los pesos kriging (y el parámetro de Lagrange) son obtenidos, el error de varianza del kriging ordinario es dado por:
En los términos de matriz, el sistema de kriging ordinario es una versión aumentada del sistema kriging simple. Para nuestro ejemplo de seis puntos sería:
Cuya solución es:
La estimación kriging ordinario en u =(2.000 m,4.700m)resulta ser 12.93%, con una desviación estándar de 0,490%, ligeramente diferentes de los valores de kriging simple de 12,83% y 0,488%.
Otra vez, usando 16 vecinos más cercanos para cada punto de estimación, la estimación de porosidad por el kriging ordinario y la desviación estándar se parecen mucho a las de kriging simple:
Kriging con tendencia
El kriging con tendencia (el método formalmente como kriging universal) es más parecido al kriging ordinario, excepto que en lugar de adecuar justo un promedio local en la vecindad de estimación de puntos, adecuamos una tendencia lineal o de mayor orden en las cordenadas (x,y) de los puntos de datos. Un modelo de tendencia lineal local (por ejemplo, de primer orden) seria dado por:
Incluyendo el modelo en el sistema de kriging involucra el mismo tipo de estencion como usamos para el kriging ordinario, con la adición con dos o más parámetros Lagrange y dos
columnas y filas extras en la matriz K de quien sus elementos (ninguno cero) están en las cordenadas x y y de los puntos de datos. Tendencias de alto orden (cuadrática, cubica) podría ser manejado de la misma forma, pero en la práctica esto se raro usar cualquier función de tendencia de alto orden que la tendencia de primer orden. Kriging Ordinario es kriking con un modelo de tendencia de orden cero. Si la variable de interés exhibe una tendencia significante, una aproximación típica sería
intentar estimar un “de-tendente” semivariograma usando uno de los métodos descritos en la lectura de los semivariograma y luego alimentar esto dentro de kriging con una tendencia de primer orden. Sin embargo, Goovaerts (1997) advierte contra este enfoque y en su lugar recomienda presentar el kriging simple de los residuales de una tendencia global (con un promedio constante de 0) y luego añadiendo de nuevo los residuales kriging dentro de la tendencia global.
Sea el campo aleatorio { Z (s): s∈ D
⊂
Rd } donde se ha observado el atributo Z en las
ubicaciones n s , s , , s 1 2 y se desear predecir dicho atributo en una ubicación no observada, basándose en los valores obtenidos en las muestras hechas. Las técnicas de predicción espacial son modalidades de una familia de métodos llamada Kriging. El nombre se debe al Ingeniero minero D.G. Krige, quien desarrolló en la década de los 50, métodos empíricos para predecir características de una mina en alguna ubicación de interés donde no se conocían datos, usando las características conocidas en lugares cercanos donde si habían sido tomados. Su método original es conocido como Kriging ordinario. El Kriging aparece en muchas formas de acuerdo a si se conocen la media, la distribución de probabilidad de Z(s), si las predicciones son hechas para puntos o áreas y así sucesivamente. Sin embargo, es importante recordar que el Kriging no es el único método de predicción espacial; existen métodos determinísticos como distancia inversa, interpolación polinomial global, interpolación polinomial local, tr iangulación lineal, funciones de base radial entre otros. La ventaja del kriging sobre los métodos determinísticos es la estimación de la varianza del error de predicción, lo cual permite además estimar intervalos de confianza para dicha predicción además de que el kriging es un método de estimación que da el mejor estimador lineal insesgado (cuando se cumplen todos los supuestos). Inicialmente, el kriging fue desarrollado para aquellos casos donde hay presencia de estacionariedad y posteriormente fue extendido para casos donde se cumple la hipótesis intrínseca.
Generalidades sobre el kriging La toma de muestras da la información de lo que ocurre en cada punto. Sin embargo, no da información acerca de la relación que pueda existir entre dichos puntos. Se requiere de una forma precisa de estimar valores en puntos intermedios o en el caso de bloques, por ejemplo, estimar el promedio sobre el bloque. La precisión del estimador usado depende de varios factores:
El número de muestras tomadas
La calidad de la medición en cada punto
Las ubicaciones de las muestras en la zona; si las muestras son igualmente espaciadas se alcanza una mejor cobertura, dando mayor información acerca de la zona que aquella que se obtendría de muestras muy agrupadas en unos sectores y separadas en otros. Sin embargo, en la práctica, debido a las características de las regiones de estudio, muchas veces es preciso tomar muestras irregularmente espaciadas.
Las distancias entre las muestras; para la predicción es más confiable usar muestras vecinas que muestras distantes, esto es, la precisión mejora cuando la cercanía de las muestras aumenta, y se deteriora cuando esta disminuye. La extrapolación no es aconsejable.
La continuidad espacial de la variable o atributo en estudio; es más fácil estimar el valor de una variable bastante regular en una región que una que presenta grandes fluctuaciones.
Introducción a la teoría del kriging Supongamos que se tienen las mediciones Z(s1), Z(s2), Z(s3) y Z(s4), en los puntos s1, s2, s3 y s4 respectivamente, y se requiere predecir el valor Z(s0). El valor a predecir se ubica mas cerca de s2 que de cualquier otra ubicación donde se tenga medición; por lo tanto, es lógico pensar que Z(s0) es mas parecido a Z(s2) que a cualquiera de los otros tres valores medidos. De acuerdo a lo anterior, se puede optar para la predicción, por una media ponderada de las cuatro mediciones, en la cual Z(s2) tiene mayor peso que cualquier otra, seguida en su orden por Z(s4), Z(s3) y por último Z(s1).
Donde z(u)* es el mejor predictor lineal de kriging