UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN" - TACNA Facultad de Ingeniería Escuela Académico Profesional de Ingeniería de Minas
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
ING. JORGE SEGURA DÁVILA TACNA - PERÚ 2011-2012
Contenido Presentación
Capítulo 1 Introducción 1.1. 1.2. 1.3. 1.4. 1.5. 1.6.
Geoestadística Antecedentes Históricos Síntesis Evolutiva Definición y Objetivos Necesidad de la Geoestadística Aplicaciones de la Geoestadística
1 1 2 3 3 4
Capítulo 2 Análisis Exploratorio de Datos 2.1. 2.2. 2.3. 2.4. 2.5.
Conocimiento del Problema Conceptos Necesarios de Estadística Básica Porqué un Análisis Estadístico Conjunto de Datos y Aplicaciones Curvas Ley Tonelaje
6 6 16 17 24
Capítulo 3 Geoestadística y Teoría de las Variables Regionalizadas 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8. 3.9. 3.10. 3.11.
Variables Regionalizadas Notacion Condensada Ejemplos de Variables Regionalizadas (V.R.) Campo y Soporte Variables Aditivas Objetivos de la Teoria El Modelo Matemático de La Geoestadística: las Funciones Aleatorias Función de Distribución y Momentos de una Función Aleatoria Funciones Aleatorias Estacionarias Relacion Entre el Semivariograma y la Covarianza El Correlograma
29 29 29 33 35 36 37 39 40 41 42
Capítulo 4 Análisis Extructural de Datos 4.1. 4.2. 4.3. 4.4. 4.5. 4.6.
Variograma Experimental Parámetros del Variograma Comportamiento del Variograma para Distancias Pequeñas Comportamiento del Variograma para Grandes Distancias Cálculo del Variograma a Malla Regular Cálculo del Variograma para Mallas Irregulares -I-
43 45 46 49 52 66
II
Métodos Numéricos Aplicados a Ingeniería
4.7. Mapa de Variograma 4.8. Anisotropías 4.9. Problemas más Comunes Encontrados en el Cálculo del Variograma
77 78 80
Capítulo 5 Modelamiento de Variogramas 5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 5.7.
Modelado de Variogramas Parámetros del Variograma Modelos Teóricos de Variogramas Modelamiento del Variograma Experimental Casos de Estudio Problemas en el Modelaje de Variogramas Validación del Modelo Teórico
82 82 83 88 90 96 97
Capítulo 6 Varianza de Estimación 6.1. 6.2. 6.3. 6.4. 6.5.
Enunciado del Problema: El Error de Estimación Análisis de Parámetros Cálculo de La Varianza de Estimación Casos de Estudio
98 99 101 102 105
Capítulo 7 Modelo de Kriging 7.1. 7.2. 7.3. 7.4. 7.5. 7.6.
Introducción Las Ecuaciones del Krigeado Ordinario para Bloques Casos de Estudio del Krigeado Ordinario para Bloques Krigeado Puntual Propierdades del Kriging o Krigeado Casos de Estudio Sobre Krigeado Puntual
112 114 116 123 124 129
Referencia Bibliográfica
136
Anexo 1 Data Yacimiento de Carbón
137
__________
Presentación El presente texto universitario, desarrollado durante el uso de la licencia por año sabático 2011, tiene por objetivo servir a los estudiantes de pre grado como libro de soporte para el aprendizaje de las técnicas geoestadisticas aplicadas a la ingeniería de minas y ciencias ambientales. Asimismo puede ser usado en todas las carreras que se imparten en la Universidad Nacional Jorge Basadre Grohmann de Tacna y demás universidades a nivel mundial, como texto básico para la enseñanza de la geoestadistica. La necesidad de acudir a herramientas estadísticas para el análisis de datos en todas las áreas del conocimiento, han hecho que aparezcan con el correr de los años nuevas metodologías que, no obstante se centran en fundamentos probabilísticos comunes, sin embargo son específicas para cada una de las diversas disciplinas del saber. Actualmente a nivel mundial la Geoestadistica, conocida también como estadística espacial, ha logrado un desarrollo sólido en el campo científico, si bien es cierto que nació en el campo de la minería, hoy en día se viene aplicando en todas las áreas del conocimiento y demás ciencias de la tierra. Es necesario hacer un merecido reconocimiento a los precursores de esta ciencia por sus valiosos aportes al conocimiento científico, en los nombres de: Danie Gerhardus Krige, nacido en el Estado Libre de Orange en Sudáfrica, pionero en el campo de la geoestadística y fue profesor en la University of the Witwatersrand en Sudáfrica. Tomó los trabajos de Sichel (1947; 1949) quien observó la naturaleza asimétrica de la distribución del contenido de oro en las minas surafricanas, la equiparó a una distribución de probabilidad lognormal y desarrolló las fórmulas básicas para esta distribución. Ello permitió una primera estimación de las reservas, pero bajo el supuesto de que las mediciones eran independientes, en clara contradicción con la experiencia de que existen “zonas” más ricas que otras. Una primera aproximación a la solución de este problema fue dada por D.G. Krige (1951) que propuso una variante del método de medias móviles, el cual puede considerarse como el equivalente al krigeado que, como se verá más adelante, es uno de los métodos de estimación lineal en el espacio con mayores cualidades teóricas. Georges Matheron, (1962) desarrolló la técnica denominada kriging basada en la labor investigadora previa de Krige. La formulación rigurosa y la solución al problema de predicción vino de la mano de Matheron, de la Escuela de Minas de Paris, quien es considerado como padre de la Geoestadistica. Formuló la Teoría de las Variables Regionalizadas y definió a la geoestadistica como ¨ la aplicación del formalismo de las funciones aleatorias al reconocimiento y estimación de fenómenos naturales¨. Asimismo un sincero agradecimiento a los hombres de ciencia Andre Journel, Michael David, Margaret Armstrong, Clayton Deutsch, Isobel Clark, Marco A, Sironvalle y demás profesionales, que con sus aportes diarios robustecen la teoría y aplicación de la geoestadistica. Organización del libro A continuación describiremos brevemente el contenido del libro:
- III -
IV
Métodos Numéricos Aplicados a Ingeniería
Introducción: Geoestadística, antecedentes históricos, síntesis evolutiva, definición y objetivos, necesidad de la geoestadística, y aplicaciones de la geoestadística. 1.-
2.- Análisis Exploratorio de Datos: conocimiento del problema, conceptos necesarios de estadística básica, porque un análisis estadístico, conjunto de datos y aplicaciones, curvas ley tonelaje. 3.- Geoestadística y Teoría de las Variables Regionalizadas: Variables regionalizadas, notacion condensada, ejemplos de variables regionalizadas (v.r.), campo y soporte, variables aditivas, objetivos de la teoria, el modelo matemático de la geoestadística: las funciones aleatorias, función de distribución y momentos de una función aleatoria, funciones aleatorias estacionarias, relacion entre el semivariograma y la covarianza, el correlograma. 4.- Análisis Extructural de Datos: Variograma experimental, parámetros del variograma, comportamiento del variograma para distancias pequeñas, comportamiento del variograma para grandes distancias, cálculo del variograma a malla regular, cálculo del variograma para mallas irregulares, mapa de variograma, anisotropías, problemas más comunes encontrados en el cálculo del Variograma. 5.- Modelamiento de Variogramas: Modelado de variogramas, parámetros del variograma, modelos teóricos de variogramas, modelamiento del variograma experimental, casos de estudio, problemas en el modelaje de variogramas, validación del modelo teórico. 6.- Varianza de Estimación: enunciado del problema, el error de estimación, análisis de parámetros, cálculo de la varianza de estimación, casos de estudio. 7.- Modelo de Kriging: Introducción, las ecuaciones del krigeado ordinario para bloques, casos de estudio del krigeado ordinario para bloques, krigeado puntual, propierdades del kriging o krigeado, casos de estudio sobre krigeado puntual. Finalmente las Referencias Bibliográficas y Anexo.
Msc. Jorge Segura Dávila
__________
CAPÍTULO 1 INTRODUCCIÓN 1.7. GEOESTADÍSTICA La Geoestadística abarca la mayor parte de las ciencias naturales exactas y su aplicación hoy en día es cada vez mayor, por tanto es nuestro interés dar a conocer en este texto, el uso de las herramientas de la Geoestadística a fín de ayudar a los alumnos a interpretar y aplicar las teorías geoestadísticas básicas necesarias en las etapas de exploración, explotación y evaluación de yacimientos. El punto de partida para la formalización del modelo geoestadístico de un fenómeno natural es el análisis variográfico que sintetiza el comportamiento espacial del mismo y que constituye el corazón de la Geoestadística. 1.8. ANTECEDENTES HISTÓRICOS Los orígenes de la Geoestadística están en la minería, como antecedentes pueden citarse los trabajos de Sichel (1947, 1949) y Krige (1951), cuyos estudios están referidos al inmenso archivo de datos que representan las minas de oro sudafricanas. El primero observó la naturaleza asimétrica de la distribución del contenido de oro en las minas sudafricanas, la equiparó a una distribución lognormal y desarrolló las fórmulas básicas para esta distribución. Ello permitía una primera estimación de las reservas, pero suponía implícitamente que los datos eran independientes, en clara contradicción con la experiencia de que existen “zonas” más ricas que otras. Una primera aproximación a la solución de este problema fue dada por Krige, que propuso una variante del método de medias móviles que puede considerarse equivalente al del krigeado simple que, como veremos, es uno de los métodos básicos de estimación lineal. Observaron que las distribuciones de las leyes son función de las dimensiones del soporte de las muestras. Encontraron experimentalmente la relación de Krige: D2(v/G) = D2(v/V) + D2(V/G) Que la Geoestadística demostrará formalmente. A partir de estas consideraciones Krige y Sichel definieron estimadores t insesgados de la ley media de un panel utilizando las características media y varianza de los logaritmos de las leyes de las muestras. Después, estudiando las regresiones entre las leyes verdaderas de bloques ya explotados y medias móviles de las leyes de muestras disponibles a priori, Krige y Ueckermann (1963) definieron nuevos estimadores óptimos no ligados a la hipótesis restrictiva de la lognormalidad. Estos estimadores de Krige que dieron nombre a la técnica del Krigeage, formalizada mas tarde por Matheron, permiten resolver sin sesgos el problema difícil de la estimación de reservas des-1-
2
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
pués de un análisis exhaustivo de la base de datos. En resumen la escuela sudafricana da inicio al origen de la Geoestadística, al establecer y aclarar las nociones claves de:
Correlaciones espaciales. Influencia de las dimensiones de las muestras o del panel sobre las distribuciones. Sesgos de estimación cuando se efectúan selecciones sobre el mineral.
Sin embargo, para tener una visión de conjunto, es necesario esperar las primeras obras (1955, 1962) de George Matheron, un minero matemático y probabilista quien utilizó el enorme conocimiento experimental de la escuela sudafricana y adaptando el lenguaje probabilístico a cada realidad concreta, en el Centro de Morfología Matemática de la Escuela de Minas de París; logró formalizar en un lenguaje riguroso las observaciones experimentales de sus antecesores, dando lugar a la teoría formal de la Geoestadística. En los años sucesivos la teoría se fue depurando, ampliando el campo de validez y reduciendo las hipótesis necesarias, y se desarrollaron las técnicas de aplicación fundamentalmente por las aportaciones de G. Matheron y su equipo de trabajo. Desde la Minería, las técnicas geoestadísticas se han exportado a otros muchos campos y, como técnica, la Geoestadística ha logrado alcanzar su madurez. En la actualidad, las áreas de trabajo más activas se encuentran por un lado, en el estudio de las implicaciones que sobre las distintas ramas del conocimiento tienen las funciones aleatorias y el formalismo geoestadístico y, por otro lado, en la búsqueda de formulaciones alternativas para la caracterización de la variabilidad espacial. En este contexto cabe destacar la actividad del grupo de la Universidad de Stanford dirigido por A. Journel. 1.9. SÍNTESIS EVOLUTIVA En la actualidad los dominios de aplicación de la Geoestadística son amplios, sin hacer referencia directamente a la minería que es el campo que le dio origen, se pueden mencionar: el petróleo, en la caracterización de reservorios, en la simulación condicional de variables petrofísicas, en el uso de la sísmica en las estimaciones. En la pesca, en la estimación de provisiones de peces, de variables condicionantes, profundidad, temperatura del agua. En la geofísica marina, en los problemas de filtrar perturbaciones temporales que mezclan el magnetismo espacial, en las características de su cartografía. La Salud: en la distribución espacial de enfermedades, en la exposición de individuos a diversos ruidos. La ingeniería civil, en la construcción de obras de grandes dimensiones, que exigen del conocimiento de la variabilidad espacial de propiedades del terreno. Las finanzas, en la relación entre el análisis técnico con el análisis económico. Los materiales, en la previsión de propiedades físicas de los materiales. En la cartografía, la hidrogeología, el medio ambiente, los campos forestales, el análisis de imágenes, la elección de la red de muestreo. Muchos, son los ejemplos que se pueden presentar, todos coincide en que a partir del estudio de la variabilidad de sus propiedades, se obtienen elementos para predecir sus características. El desarrollo formal, lo podemos resumir, en lo siguiente:
1962 Teoria formal de la Geoestadística. 1970 Explosión a nivel mundial de la Geoestadística. __________
1 Introducción
3
1980 Maduración, consolidación. 1990 Aceptación. 2000 Aplicaciones, en diversos campos de la ciencia. 2010 Fortalecimiento científico. 2012 Nuevas aplicaciones en todas las áreas del conocimiento humano, en el campo de la robótica y simulación.
1.10. DEFINICIÓN Y OBJETIVOS DEFINICIONES
G. Matheron, en su forma actual la definió como: “La aplicación del formalismo de las funciones aleatorias al reconocimiento y estimación de fenómenos naturales”. A la función aleatoria (F.A) la podemos visualizar como un variable aleatoria (V.A) definida en todos los puntos del espacio, o lo que es igual cada realización de la FA es una función espacial (variable regionalizada VR). Lo característico de una FA es que cada realización se puede concebir como suma de una componente estructurada y otra aparentemente errática. Una VA es una función numérica de los puntos de un espacio muestral X Rn (-,+). La Geoestadística es la aplicación de la teoría de las variables regionalizadas a los problemas de reconocimiento, de estimación y de economía minera.
OBJETIVOS
Expresar las características estructurales Z(x) en una forma matemática adecuada (modelo). - Continuidad - Anisotropía
Resolver de manera satisfactoria los problemas de estimación - Definir estimadores óptimos - Encontrar intervalos de confianza, cuantificación del error
1.11. NECESIDAD DE LA GEOESTADÍSTICA Todos sabemos que en los yacimientos, las leyes siguen una determinada función de distribución y que no varían al azar, sin embargo, con mucha frecuencia ese hecho no se toma en cuenta al momento de la cubicación o estimación de reservas. Los procesos de concentración de materias primas y elementos valiosos que conforman un yacimiento, son procesos naturales que se ciñen a ciertos patrones y que por lo tanto no son productos del azar; por consiguiente no se puede estudiar un yacimiento por el método estadístico simple o por los métodos clásicos cuya primera condición a priori es suponer (erróneamente por cierto) que los fenómenos geológicos son completamente aleatorios que no se rigen por patrones determinados. Supongamos que las leyes de una veta, tomadas a distancias diferentes de muestreo, a lo largo de una galería presenta la siguiente distribución. TRAMO A Ley Z(x) Muestra N° _________
1 2 3 ● ● ● 1 2 3
4 ● 4
5 6 ● ● 5 6
5 ● 7
4 ● 8
3 ● 9
2 1 ● ● 10 11
4
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
TRAMO B Ley Z(x) Muestra N°
3 2 4 ● ● ● 1 2 3
6 ● 4
1 ● 5
5 ● 6
1 ● 7
3 ● 8
2 4 5 ● ● ● 9 10 11
El estimador estadístico clásico encontraría para ambos tramos las mismas medias y varianzas, e incluso hasta el mismo histograma; por lo tanto supondrá que en ambos tramos la veta se puede cubicar y trabajar en la misma forma. Esta simplificación es errónea, ya que podemos ver que en el tramo A existe un cierto patrón de distribución de las leyes, con una zona central rica que se va empobreciendo hacia ambos lados; mientras que en el tramo B, se trata de una distribución más al azar. Lamentablemente en una mina con muchos niveles, muchos metros de galería y miles de muestras, analizadas quizás por varios metales, no será tan fácil reconocer a simple vista, si existe o no algún patrón de distribución o estructura. Necesitamos de una técnica con elementos más poderosos, y que (por el afán de simplificar el problema) no comience justamente por ignorar lo que deseamos encontrar: Que función rige la distribución de las variables en un yacimiento; es decir, una relación matemática que nos informe cómo varían las leyes, la potencia, el peso específico y otros parámetros mensurables en el yacimiento. La mejor herramienta actual para estudiar la distribución de tales variables es la GEOESTADISTICA; esta rama de la geomatemática emplea para ello la denominada función Variograma, que es su herramienta básica. 1.12. APLICACIONES DE LA GEOESTADÍSTICA La Geoestadística se aplica a diversos problemas de caracterización del fenómeno natural y a la estimación de las variables regionalizadas. CAMPOS DE APLICACION DOMINIO DE LA APLICACIÓN Industria minera Geología Industria Petrolera Geoquímica Oceanografía Hidrogeología Meteorología Agronomía Topografía Medio Ambiente Medicina
VARIABLES ESTUDIADAS Acumulación de Leyes y Potencia Peso específico, Porosidad, fallas y discontinuidades Potencia de mantos, Porosidad y Sondajes Investigación de Elementos Fondos Marinos y Población de Peces Conductividad Hidráulica, Coeficientes de Almacenamiento, Niveles Piezométricos y Concentración. Presión, Velocidad del Aire, Lluvia y temperatura. Densidad de Arboles y Plagas Elevaciones Variables de contaminación en aire, agua y suelos. Variables relacionadas a diversas patologías. __________
1 Introducción
5
APLICACIONES EN MINERIA
Control de calidad y control de datos. Verificación de datos. Modelamiento geológico: Es muy importante la relación entre la Geología y la Geoestadística, las mismas que deben estar en comunicación. Evaluación preliminar de recursos. Optimización de programas de muestreo. Modelamiento de depósitos. Selección de métodos de minado. Estimación de reservas de mineral. Evaluación de yacimientos. Análisis de riesgo. Análisis económico.
Desde que G.Matheron (1962,…,1965) registra la partida de nacimiento de la Geoestadística, se puede afirmar que esta técnica llega al Perú recién en el año 1970, apartir del año 1974 se han estudiado varios yacimientos, a tal nivel que incluso en algunas publicaciones periódicas y textos de Geoestadística editados en otros países (como Francia, Australia, Inglaterra, Canadá, Chile, etc.),se citan algunos casos peruanos; por ejemplo Journel & Huijbregts(1978) en su exelente libro Mining Geostatistics incluyen el estudio del yacimiento de Michiquillay como caso típico de estimación de reservas en pórfidos de cobre, emplearon para ello los resultados del estudio geoestadístico de Minero Perú (Ex empresa estatal), por los años 1975, 1976. Mas adelante se incluye en el mismo libro, los resultados del estudio geoestadístico de la veta argentífera de la mina Uchucchacua, como ejemplo típico de evaluación de reservas en yacimientos del tipo veta. En la actualidad, el Perú experimenta un desarrollo cada vez mayor de la aplicación de la Técnica Geoestadística a los diversos problemas de la Industria Minera y el medio ambiente, debido al boom minero que sigue atrayendo cada vez mas a los inversionistas extranjeros, dado el proceso de desarrollo económico con inclusión social que el gobierno lleva adelante.
_________
CAPÍTULO 2 ANÁLISIS EXPLORATORIO DE DATOS 2.6. CONOCIMIENTO DEL PROBLEMA Antes de comenzar un estudio geoestadístico se deben discutir todos los elementos que aporten conocimientos del problema a resolver, la estructura geológica en que se desarrolla la mineralización o el fenómeno en estudio, organización y verificación de la información disponible y finalmente realizar el análisis exploratorio de los datos. Una vez obtenido los datos, es necesario que se controlen integralmente a fin de verificar de una parte su exactitud y de otra su representatividad. Es importante que se esté familiarizado con los datos, discutir todos los elementos necesarios a fin de conocer el problema a resolver (Armstrong y Carignan, 1997). En la minería los resultados son muy sensibles al nivel de información usado (Carrasco-Castelli y Jara-Salame, 1998; Lantuéjoul, 1994), cualquier modificación involuntaria en la etapa inicial se refleja sistemáticamente durante todo el estudio (Armstrong y Roth, 1997; Armstrong y Carignan, 1997). El análisis y el procesamiento de los datos mineros, están basados en las herramientas que nos ofrece la Geoestadística, la misma que incorpora la localización de las muestras en el espacio. El problema a resolver implica dos pasos fundamentales: 1ro. Caracterizar e interpretar el comportamiento de los datos referidos a las muestras existentes. 2do. Usar la interpretación para predecir los valores probables respecto a situaciones desconocidas. 2.7. CONCEPTOS NECESARIOS DE ESTADÍSTICA BÁSICA Con el objetivo de conocer la información disponible se puede hacer un análisis de la estadística descriptiva (Krajewski y Gibbs, 1993; Journel y Huijbregts, 1978; David, 1977). A continuación se presenta un resumen de los conceptos necesarios de estadística básica. A: Cálculos estadísticos o estadística descriptiva. Permiten determinar si la distribución de los datos es normal, lognormal, o si no se ajustan a una distribución estadística, lo cual implica tener conocimiento de: 1.- Numero de casos: Es el número de valores muestreados del fenómeno en estudio, representados por n y los datos por xi, i = 1, . . . , n, que llamamos distribución. 2.- Rango de la distribución: Es la diferencia entre el valor máximo y el mínimo. 3.- Media: Es la media aritmética de la distribución, dado por la fórmula: 1 n Xi Xm n i 1 n = número de datos contenidos en la muestra. Xi = valor de cada variable en el conjunto de datos (muestra). -6-
2 Análisis Exploratorio de Datos
7
4.- Moda: Es el valor más frecuente de la distribución. 5.- Mediana: Es el valor para el cual la mitad de los datos son menores y la otra mitad están por encima de este valor. Si ordenamos los datos en orden ascendente podemos calcular la mediana como. X(n+1)/2 (Xn/2 + Xn/2+1)/2
M =
si n es impar. si n es par.
La mediana es también llamada percentil 50, además los datos no solo se dividen en dos grupos, sino que se pueden dividir en cuatro partes, cuartiles, donde Q1 = percentil 25, Q2 = Mediana y Q3 = percentil 75, si los datos se dividen en 10, tenemos los deciles. De forma general estas medidas se pueden calcular por: p(n+1)/100 ésima observación de los datos ordenados ascendentemente, donde p es el percentil que se desea calcular. 6.- Varianza: Describe la variabilidad de la distribución. Es la medida de la desviación o dispersión de la distribución y se calcula por:
2
1 n n 1 i 1
Xi X m
2
n = número de datos contenidos en la muestra. Xi = valor de cada variable en el conjunto de datos (muestra). Xm = media o valor promedio del conjunto de datos. La razón principal por la que se aboga por la división entre n-1 en la estimación de la varianza, es porque proporciona un mejor estimado; si dividimos por n-1 nos referimos a la varianza muestral S2 como un estimador insesgado de la varianza poblacional 2. Esto significa que si un experimento fuera repetido muchas veces se podría esperar que el promedio de los valores así obtenidos para S2 igualaría a 2. Por otra parte si dividimos entre n los valores obtenidos para S2 serían como promedio demasiado pequeño, sin embargo cuando tenemos muestras mayores a 100 datos, los resultados de la varianza muestral y poblacional tienden a ser iguales. 7.- Desviación estándar: Describe la tendencia o dispersión de la distribución. Es la medida de desviación alrededor de la media. Se calcula por: = 2 8.- Coeficiente de asimetría: Describe la simetría de la distribución relativa a la distribución normal. Se calcula por:
3
1 n Xi X m 3 S 3 n i 1
n = número de datos contenidos en la muestra Xi = valor de cada variable en el conjunto de datos (muestra) Xm = media o valor promedio del conjunto de datos. S3 = momento de tercer orden. En la distribución normal la asimetría tiene valor cero, un valor negativo indica una cola a la izquierda y un valor positivo indica una cola a la derecha. _________
8
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
9.- Curtosis: Describe el grado de esbeltez de la distribución, tomado por lo general en relación a una distribución normal, y se puede calcular por: 1 n 4 4 Xi Xm S 4 n i 1
n = número de datos contenidos en la muestra Xi = valor de cada variable en el conjunto de datos (muestra) Xm = media o valor promedio del conjunto de datos. S4 = momento de cuarto orden. La distribución normal tiene curtosis igual a tres, y es llamada mesocúrtica. A las distribuciones más agudas, con colas relativamente anchas, se les llama leptocúrticas, tienen valores de curtosis mayores que tres, y las distribuciones más bien achatadas en el centro se llaman platicúrticas, tienen valores menores que tres, en ocasiones se acostumbra a definir la curtosis como 4 - 3. 10.- Error estándar: Describe el grado de conocimiento de los datos y se puede calcular por: =
2 /n
La distribución normal tiene un valor de error estándar menor que 1.25 y la distribución lognormal o una distribución con tendencia positiva, tiene valores de error estándar mayores que 1.25. 11.- Coeficiente de variación: Es una medida de la variación relativa de los datos y puede ser calculado por: CV = S/Xm y en porcentaje como: 100 CV = 100 (S/Xm) % CV = coeficiente de variación S = desviación estándar Xm = media Proporciona una comparación entre la variación de grandes valores y la variación de pequeños valores. Las técnicas de Geoestadística Lineal que predomina en el campo de las geociencias producen los mejores resultados cuando el coeficiente de variación es menor que uno, CV 1. Para CV 1 se recomiendan técnicas de Geoestadística no Lineal. 12.- Prueba Chi-Cuadrado: Permite determinar si la distribución es normal, lognormal o alguna otra distribución probabilística, es su lugar puede ser usada la prueba “Kolmogorov Smirnov” como se refleja por muchos autores es más robusta. 13.- Prueba t-Student: Permite determinar si en una distribución bimodal las medias de las poblaciones son estadísticamente diferentes. B: Construcción de gráficos estadísticos: Estos gráficos permiten ilustrar y entender las distribuciones de los datos, identificar datos errados, valores extremos, los mismos incluyen: 1.- Mapa base, sección cruzada y vista en perspectiva: Son usados para visualizar la relación espacial en 2 y 3 dimensiones, permiten encontrar errores en la información. 2.- Histogramas: Son usados para ver las características descriptivas de la distribución. Es un gráfico de barras donde en las abscisas aparecen los límites de las clases y en las ordenadas las frecuencias correspondientes a cada clase. __________
2 Análisis Exploratorio de Datos
9
3.- Frecuencia acumulativa: Usado para identificar el tipo de distribución muestral y ayuda a determinar si están presentes poblaciones mixtas. Es un gráfico de límite de clase contra frecuencia acumulada. En el caso de gráficos estadísticos es útil usar los gráficos de frecuencia absoluta, relativa, acumulativa y el diagrama de dispersión, como se presenta en muchos sistemas. Todos estos elementos permiten decidir sobre las condiciones de estacionaridad vistas anteriormente. Muchos autores sólo toman como elementos fundamentales de estadística básica que: la media y la mediana tome valores próximos; el coeficiente de variación sea inferior a 1; la distribución de los datos esté próxima a la curva normal y no existan valores extremos que afecten el desarrollo del análisis estructural. 4.- Distribución Normal: La distribución normal o gaussiana es el modelo más importante y de mayor uso de todas las distribuciones continuas de probabilidad. Un gran número de estudios indican que la distribución normal proporciona una adecuada representación de las distribuciones de una gran cantidad de variables físicas. DEFINICION: Se dice que una V.A. X se encuentra normalmente distribuida si su función de densidad de probabilidad esta dada por: f ( x; , )
1 2 *
e
1 x 2
2
para
- < x <
- < <
>0
El parámetro no influye en la forma de la curva f(x), su variación conduce a un desplazamiento de la curva a lo largo del eje x.
_________
10
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
La variación del parámetro , altera la forma de la curva f(x).
RESUMEN DE MEDIDAS
E ( x) xf ( x)dx
E (x)
1 xi n
1 2 x i n 2
E( x ) 2 2
x 2
i
n
Limites de confianza para n>25 Central 68% x ; x Central 95% x 1.96 ; x 1.96 Central 99.7% x 3 ; x 3 DISTRIBUCION DE LA MEDIA Media = x
Varianza =
n2
2 n
Limites de confianza para n>25 ;x x n n Central 68% ; x 1.96 x 1.96 n n Central 95% __________
2 Análisis Exploratorio de Datos
11
;x 3 x 3 n n Central 99.7% Limites de confianza para n<25 Límite central (1-2p) ; x TP x TP n n 5.- Función de Distribución Acumulativa: La probabilidad de que una V.A. normalmente distribuida X sea menor ó igual a un valor específico x, esta dada por la función de distribución acumulativa F(x) 1 t 2 P( X x) F x; , Exp 2 dt 2 1
x
Esta integral no puede evaluarse en forma cerrada, sin embargo se puede tabular F(x;,) como una función de y , lo que necesitaría una tabla para cada par de valores. Como existe un número infinito de valores de y , esta tarea es virtualmente imposible. 6.- Distribución Normal Standard: Ecuación de transformación z
x
Donde y son la media y la desviación estándar de X respectivamente. De acuerdo con lo anterior Z es una V.A. estandarizada con media 0 y desviación estándar 1, lo que nos conduce a la Ley Normal Reducida (LNR)
P X x PZ z
_________
12
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Función de densidad de probabilidad (PDF)
f ( x)
z2 Exp 2 2 1
Función de distribución acumulativa Si: P( X x) P( Z z ) Fx ( x; , ) Fz ( z;0,1) Donde Fz (z;0,1 ) es la función de distribución acumulativa de la función de probabilidad normal estandarizada, la misma que se encuentra tabulada en forma extensa.
PZ z Fz z;0,1
t2 Exp 2 2 1
z
dt
Para cualquier valor específico de z, el correspondiente valor en la tabla es la probabilidad de que la V.A. normal estandarizada Z sea menor o igual a z. __________
2 Análisis Exploratorio de Datos
INTERVALOS DE CONFIANZA
_________
13
14
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
7.- Modelo Log Normal: Se dice que una variable aleatoria X sigue un Ley Lognormal, si su logaritmo (neperiano, base e) sigue una Ley Normal. Su función de densidad de probabilidad viene expresada de la siguiente manera: 1 ln x e 1 2 e ...x 0 f ( x) * 2 * x e 0.....x 0 2
ó
f ( x)
1
2
e
1 ln x e 2 e
2
d ln x
Considerando la constante de aditividad , tendríamos: f ( x)
1 ln( x )
1 * e 2 2 * x
1
2
.... x
PARÁMETROS Si los datos se asemejan a una distribución lognormal, la población se puede definir como una población lognormal de dos parámetros, siendo estos parámetros la media y la varianza de la población logarítmica. Entonces el valor verdadero de la ley media se puede obtener con la fórmula:
e
2 e e 2
2 2 e e 1 2
__________
2 Análisis Exploratorio de Datos
15
donde: = valor estimado de la Ley Media. e = Media de la distribución de los logaritmos de las leyes. e = Desviación estándar de la distribución de los logaritmos de las leyes.
2 = Varianza estimada de las leyes. Puede ocurrir que, al representar los datos logarítmicos en un diagrama de probabilidad, no se ajusten exactamente a una recta, mostrando una cierta curvatura en el ajuste, lo que es indicativo de la presencia de una población lognormal de tres parámetros. Este tercer parámetro, denominado constante aditiva , se calcula como:
x50 x75 * x 25 x 25 x 75 2 * x50
Siendo los xi los valores de los percentiles correspondientes a cada caso. Este valor se añade a la población original de datos (sin transformar logaritmicamente) y, a continuación, se realiza la transformación logarítmica, obteniéndose una nueva población ln(xi+) que, representada en el papel probabilístico, sí genera ya una línea recta. Para calcular, en este caso, el valor de la ley Media, se aplica el procedimiento descrito para la población de dos parámetros, sustrayéndose el valor de la constante aditiva del resultado final. Las fórmulas quedarían:
e
2 e e 2
2 ( ) 2 e e 1 2
TRANSFORMACIÓN Si z Lnx Obtendríamos la siguiente función de probabilidad Normal f ( x)
1 2 *
e
1 z 2
2
8.- Modelo estandarizado: Sí, t
Lnx Ln 1 x Ln
De donde obtenemos: _________
16
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Lnx Ln t
dx dt en términos de diferenciales: x
reemplazando esta expresión en la ley normal 1
f ( x)dx
2
e
1 ln x ln 2
2
dx x
Obtenemos el siguiente modelo estandarizado. F (t )
1
t
2
e
1 2 t 2
dt
En esta función de distribución acumulada, t se constituye como una variable aleatoria normal reducida de valor medio = 0 y varianza igual a 1; cuyos valores se encuentran en tablas. LIMITES DE CONFIANZA Para datos originales, los mismos que la distribución normal. 2.8. PORQUE UN ANÁLISIS ESTADÍSTICO Al inicio hablamos de diferentes problemas y la necesidad de predecir las variables donde no tenemos información de muestreo. Esto implica buscar una aproximación estadística. Efectivamente dentro del marco conceptual del trabajo par un análisis estadístico. Nosotros podemos enfocar el problema de la siguiente manera: -
Detalles a considerarse dentro del caso de estudio. Caracterización e interpretación del comportamiento de las muestras de los datos alrededor de la vecindad espacial. Combinar las variables asumidas, la interpretación y la teoría estadística para producir el "Mejor" estimador para el valor desconocido. Usar la base teórica para proveer medidas de incertidumbre o confianza en la "Mejor" estimación.
La base teórica de la Geoestadística incorpora a la teoría de la estadística clásica y obtiene los mismos resultados cuando la variable asume un comportamiento aleatorio.
__________
2 Análisis Exploratorio de Datos
17
El área de influencia donde los datos muestran una correlación espacial, están dados por una distancia ¨a¨, entonces habrá una relación estructural entre las muestras, un grado de dependencia entre ellas, que es estudiada por la Geoestadistica. En cambio cuando no hay ninguna relación entre las muestras del conjunto de datos, se dice que hay una independencia entre sus valores y se puede observar un comportamiento aleatorio entre las mismas, la Geoestadistica en estas zonas de independencia de valores, encontrara los mismos resultados que la estadística clásica. 2.9. CONJUNTO DE DATOS Y APLICACIONES 1.- CASO DE ESTUDIO CON DATOS DE UNA MINA DE CARBÓN. Conjunto de datos simulados sobre un estrato real de carbón en el Africa el Sur. Los taladros perforados sobre el estrato de carbón son medidos para encontrar la siguiente información: espesor (mts), contenido de energía o valor calorífico del carbón (expresado en Megajoules por Ton.), contenido de ceniza (%) y contenido de sulfuros (%). Las tres coordenadas expresadas en metros son medidas desde arriba (collar) del estrato del carbón donde es intersectado por el taladro. SOFTWARE: Para los ejemplos del TEXTO puede utilizarse el software Geostokos (Ecosse) diseñado especialmente para la enseñanza y que corre bajo la plataforma de windows 98/2000 y NT. Este programa puede bajarse desde internet: Otras herramientas alternativas, usadas en el presente texto, son los siguientes software: Geoeas, Variowin, Surfer, Excel, Etc. Asimismo existen en Internet una diversidad de programas y demos de libre disposición, a los cuales puede acudir el alumno. COAL PROJET DATA MUESTRA ESTE NORTE ELEVACION POTENCIA (ID) (mts) (mts.) (mts) (mts) 01 02 ... ... 96
VALOR CALORIFICO (MJ)
CENIZA SULFUROS (%) (%)
9500 9650
12600 12600
605,90 605,10
1,84 1,73
22,26 21,36
19,29 19,97
0,83 0,78
11000
14100
606,90
1,69
25,57
14,63
1,03
Los datos completos, son presentados en anexos del presente texto. La variable a ser estudiada será el valor calorífico, expresado en (MJ). Daremos un procedimiento para diseñar la tabla de frecuencias que nos conducirá a construir gráficos y mediante un análisis cualitativo ver si estos datos siguen un modelo normal o log normal, que serán confirmados por análisis estadísticos cuantitativos. Procedimiento para el diseño de la tabla de frecuencias: Después de haberse recopilado la información de campo y organizado en una base de datos, se elige la variable a ser analizada y se procede a construir una Distribución de Frecuencias, para facilitar el análisis y la interpretación correspondiente. La estructura de la tabla es la siguiente: INTERVALO
[L1,L2) [L2,L3) … [Lk-1,Lk] _________
Xi
fi
hi
Fi
Hi
hi*100
Hi*100
18
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Procedimiento de cálculo 1. Determinar el rango (R) de variación de los datos. R = Xmax - Xmin (diferencia entre el dato máximo y mínimo). 2. Determinar el número de intervalos (K) en forma directa, seleccionando un número entre 5 y 30 intervalos, o calcularlo mediante la fórmula de Sturges, cuyo resultado debe ser redondeado al entero inmediato superior. K = 1 + 3.3log(n)
n >= 10
3. Determinar la amplitud o ancho del intervalo (W) W=R/K 4. Determinar los límites de los intervalos L1 = [Xmin , Xmin + W) L2 = [Xmin + W, Xmin + 2W) L3 = [Xmin + 2W, Xmin +3W) … Lk = [Xmin + (k-1)W, Xmin + KW] Presentación de datos Los datos pueden ser presentados mediante los siguientes gráficos:
Histograma de frecuencias. Polígono de frecuencias. Histograma acumulado. Gráficos de variabilidad. Grafico de probabilidad. Otros.
Cálculos previos para la construcción de la tabla de frecuencias, usando los datos de la mina de carbón. VARIABLE n min max Rango k w
VALOR 96 19,92 30,46 10,54 8 1,32
Distribución de frecuencias INTERVALOS Li Ls 19,920 21,240 21,240 22,560 22,560 23,880 23,880 25,200 25,200 26,520 26,520 27,840 27,840 29,160 29,160 30,480
Xi
fi
20,580 21,900 23,220 24,540 25,860 27,180 28,500 29,820
9 13 15 21 15 11 8 4
hi 0,094 0,135 0,156 0,219 0,156 0,115 0,083 0,042
Fi 9,000 22,000 37,000 58,000 73,000 84,000 92,000 96,000
Hi 0,094 0,229 0,385 0,604 0,760 0,875 0,958 1,000
hi*100 9,375 13,542 15,625 21,875 15,625 11,458 8,333 4,167
Hi*100 9,375 22,917 38,542 60,417 76,042 87,500 95,833 100,000
__________
2 Análisis Exploratorio de Datos
19
Construcción del histograma Xi VS fi : HISTORAMA 25 20 15 10 5 0 20,580 21,900 23,220 24,540 25,860 27,180 28,500 29,820
Cualitativamente observamos que los datos siguen un modelo Normal, con una tendencia hacia la zona central, que aproximadamente equidistan de los extremos. HISTOGRAMA ACUMULADO 120,000 100,000 80,000 60,000 40,000 20,000
29 ,8 20
28 ,5 00
27 ,1 80
25 ,8 60
24 ,5 40
23 ,2 20
21 ,9 00
20 ,5 80
0,000
Gráfico acumulado Xi VS Fi , con crecimiento ascendente. Variabilidad 35,00 30,00 25,00 20,00 15,00 10,00 5,00
95 00 96 50 95 00 10 70 0 10 40 0 10 25 0 10 25 0 98 00 10 10 0 98 00 96 50 98 00
0,00
Gráfico mostrando las variaciones del valor calorífico, a lo largo de la coordenada Este. _________
20
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
MEDIDAS ESTADISTICAS CUANTITATIVAS, CALCULADO CON EL PROGRAMA GEOEAS.
Grafico de probabilidad, basado en la recta de Henry, para demostrar la normalidad del conjunto de datos, obsérvense las medidas estadísticas, cuyos valores confirman que los datos siguen una Distribución Normal, con parámetros, media igual a 24.624 MJ y varianza de 6.043 o desviación estándar de 2.458 MJ. El valor de la media y la mediana, tienden al valor de 24.6 MJ. lo que quiere decir que el valor es bastante representativo, con un coeficiente de asimetría (Skewness) de 0.228, que confirma el sesgo mínimo de la data. 2.- CASO DE ESTUDIO CON DATOS DE UNA MINA DE ORO Las muestras tomadas en un yacimiento de oro, configuran los siguientes datos expresados en gr/ton. 0,1
0,2
0,5
1,0
1,2
2,1
2,5
3,0
5,1
10
Calcular las medidas estadísticas, analizar la variabilidad de los datos y la tendencia hacia un modelo Normal o Log Normal. Estructura de datos para un cálculo manual ID
Xi
1 2 3 4 5 6 7 8 9 10
0,1 0,2 0,5 1 1,2 2,1 2,5 3 5,1 10
(Xi - Media)^2 (Xi - Media)^3 (Xi - Media)^4
6,101 5,617 4,285 2,465 1,877 0,221 0,005 0,185 6,401 55,205
-15,069 37,220981 -13,312 31,549566 -8,870 18,360368 -3,870 6,075732 -2,571 3,522754 -0,104 0,048797 0,000 0,000024 0,080 0,034188 16,194 40,971521 410,172 3047,580984
Hi*100
10 20 30 40 50 60 70 80 90 100 __________
2 Análisis Exploratorio de Datos
21
Aplicando las formulas estadísticas, tenemos los siguientes resultados: Medida
Valor
media mediana Var desv std CV (%) Q1 Q3 IQR moment3 moment4 sk E
2,570 1,650 8,236 2,870 111,668 0,350 2,750 2,400 38,265 318,536 1,619 1,696
histograma 6 5
fi
4 3 2 1 0 1
3
5 Xi
7
9
Asociado al conjunto de datos de la mina de oro, observando el histograma y las medidas estadísticas, notamos que hay valores OUTLIERS, fuera de la vecindad del conjunto y uno de esos valores es el dato cuyo valor tiene 10 gr/ton, lo que hace que la distribución tenga un sesgo pronunciado con tendencia al modelo Log Normal y el valor de la media no es representativo ya que tiene una tendencia hacia los valores altos, mostrándose una gran diferencia entre el valor de la media y la mediana (0.92 gr/ton). Esto implica que no podemos seguir con nuestro análisis, ya que primero tenemos que homogenizar nuestra data para no arrastrar errores, que podrían repercutir más adelante cuando uno haga estimaciones y modelamientos, los mismos que devendrían en no confiables. Vamos a eliminar el valor alto de 10 gr/ton de la data y veamos ahora cual es el comportamiento el modelo y sus medidas estadísticas. Medida Media Mediana Var desv std CV (%) Q1 Q3 IQR Moment3 Moment4 Sk E
_________
Valor 1,744 1,200 2,336 1,528 87,611 0,275 2,400 2,125 3,290 16,156 0,921 -0,039
22
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
histograma 6 5
fi
4 3 2 1 0 1
3
5 Xi
7
9
El modelo Log Normal está más definido y ahora la diferencia entre la media y la mediana es menor (0.54 grs/ton). Los alumnos ahora comprenderán porque es necesario hacer el análisis estadístico, previo a un análisis espacial o geoestadistico, el objetivo es no incurrir en mayores errores. 3.- CASO DE UN YACIMIENTO DE ORO CON 30 DATOS. Leyes en grs/ton. ID 1 2 3 4 5 6 7 8 9 10
Xi
ID 11 12 13 14 15 16 17 18 19 20
0,1 5,5 0,5 1,0 1,2 2,1 2,5 3,0 5,1 10,0
Xi 0,6 1,4 6,8 5,1 8,4 4,2 0,3 1,5 1,8 2,2
ID 21 22 23 24 25 26 27 28 29 30
Xi 0,4 0,5 1,5 2,3 3,2 2,9 4,3 3,8 7,2 4,9
Histograma deducido en base a una tabla de frecuencias. Yacimiento de Oro 14 12 10 fi
8 6 4 2 0 1,0
2,7
4,4
xi
6,1
7,8
9,5
Observamos claramente que los datos tienden a un modelo Log Normal. Veamos como resultan las medidas estadísticas, calculadas con el Programa Geoeas. __________
2 Análisis Exploratorio de Datos
23
El gráfico de probabilidad, nos muestran que estos datos no siguen una Distribución Normal, ya que no se alinean a una recta, sobre todo en los primeros datos. La asimetría o sesgo es evidente por los valores mostrados del coeficiente Skewness de 1.019, que indica el sesgo existente en el conjunto de datos, demostrando la aproximación a un modelo Log Normal. Haciendo la transformación logarítmica de los datos con Yi = Ln (Xi), obtenemos una distribución normal, con los siguientes resultados:
Estos valores logarítmicos, se aproximan a una distribución normal, obsérvese la similitud de los valores de la media y la mediana, con un coeficiente de asimetría Skewness, mínimo de -0.031. Estimación de los parámetros del modelo Log Normal, en unidades el conjunto de datos. Reemplazando los valores logarítmicos en las formulas, obtenemos:
e
_________
2 e e 2
24
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA 0.541 0.995 2
e 3.54
3.54
2 2 e e 1 2 (3.54) 2 e 0.541 1 2 8.99 3 2
Entonces decimos, que la data del yacimiento de oro, sigue un Modelo Log Normal con parámetros, media igual a 3.54 grs/ton y con una varianza de 8.99 o una desviación estándar de 3 grs/ton. 2.10.
CURVAS LEY TONELAJE
Las aplicaciones de las Curvas Ley Tonelaje nos permiten analizar el comportamiento de un conjunto de datos de un determinado yacimiento minero, en cuanto a sus recursos económicamente explotables de acuerdo a una Ley mínima o Cutt Off. Con lo que se puede presentar varias alternativas, en función a sus reservas. Según el modelo que siga cada yacimiento, tendrá un procedimiento especifico. 1.- Curvas Ley Tonelaje cuando el yacimiento sigue un Modelo Normal Proporción de mineral sobre una ley de corte
P 1 F z z
xc
Fz z;0,1
t2 Exp 2 2 1
z
dt
(tabla Distribución Normal Standar)
Ley promedio recuperable
xc x
( z)
* ( z) P
z2 exp 2 2 1
2.- Curvas Ley Tonelaje cuando el yacimiento sigue un Modelo Log Normal Cálculo de parámetros logarítmicos Paso Previo, cuando los parámetros están expresados en unidades logarítmicas. Cuando los datos estadísticos están referidos al cálculo original de las muestras xi , enton__________
2 Análisis Exploratorio de Datos
25
ces es necesario calcular previamente los parámetros logarítmicos para después proceder con el método normal.
S 2 S Ln 2 1 x
xe Ln x 0.5 s e2
2 e
donde: s e2 = Varianza de los logarítmicos. s 2 = Varianza muestral original. x 2 = Media muestral original. xe = Media de los logarítmicos.
Cálculo de la proporción del tonelaje minable (P) Evaluación de Z Z
LnX c X e e
o
Z
dt
(tabla)
x e 1 Ln c e 2
Z=t F (t )
1 2
t
e
1 2 t 2
P 1 F t Ley promedio recuperable ( X lc ) X lc
Q *x P
Q 1 F z se F z s e valor calculado o de tabla También se puede usar la siguiente fórmula. 1 x e F Ln c e 2 xc 1 xc e F Ln 2 e
F(z) = Tabla 3.- Aplicaciones de las Curvas Ley Tonelaje. 1. Caso de estudio de un depósito de hierro: Tenemos un depósito de hierro, el cual se conoce que las muestras siguen una distribución normal con un ley promedio del 48% y _________
26
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
una desviación estándar del 5%. Asimismo el modelo de bloques del yacimiento nos da una desviación estándar del 4.45%. Analizar las incidencias de las dos distribuciones en el cálculo de la Ley/Tonelaje. Representaremos los modelos en función a sus parámetros y utilizando las formulas del modelo normal y cálculos efectuados en el programa Excel, para reproducir las funciones de densidad de probabilidad. Distribución Normal 0,09 0,08 0,07 0,06
f(x)
0,05 Muestras Bloques
0,04 0,03 0,02 0,01 0
-30 -20 -0,01 -10 0
10
20
30
40
50
60
70
80
90
x
Modelo normal para muestras y bloques. Calculo del Tonelaje y Ley para varias leyes de corte, usando el programa Excel y las formulas expuestas anteriormente, para el Modelo Normal. L.C. 40 42 44 46 48 50 52 54 56
MUESTRAS P(%) L.MEDIA 94,52 48,59 88,49 49,10 78,81 49,84 65,54 50,81 50 51,99 34,46 53,34 21,19 54,84 11,51 56,44 5,48 58,12
BLOQUES P(%) L.MEDIA 96,39 48,37 91,12 48,79 81,56 49,45 67,34 50,38 50 51,55 32,66 52,91 18,44 54,43 8,88 56,06 3,61 57,77
Cada Ley de Corte, representa una alternativa de explotación con una proporción de tonelaje económicamente explotable con su respectiva Ley, para cada modelo de muestras y bloques. Generalmente un yacimiento se explota en base al modelo de bloques, en este caso, por ejemplo si las condiciones de la tecnología y el mercado determinan utilizar una Ley de Corte de 44 %, entonces tendríamos el 81.56 % de mineral económicamente explotable con una ley promedio de 49.45 %. Con estos datos, representamos las curvas Ley Tonelaje.
__________
2 Análisis Exploratorio de Datos
27
Ley de Corte/Tonelaje
1,2 1 0,8 P
Muestras
0,6
Bloques
0,4 0,2 0 35
40
45 L.C 50
55
60
Curvas Ley de Corte/Tonelaje, para el modelo de muestras y bloques del depósito de hierro. Ley de Corte/Ley Media
Ley Media
60
55 Muestras Bloques 50
45 35
40
45
LC
50
55
60
Curvas Ley de Corte/Ley media, para el modelo de muestras y bloques del depósito de hierro. 2. Caso de estudio de un yacimiento de Pb y Zn. Tomemos el caso de un yacimiento de Pb, Zn, donde el porcentaje de metal combinado es la variable económica. Se conoce que las muestras están distribuidas lognormalmente con un valor promedio del 12% y una desviación estándar del 8%. La unidad de minado seleccionada es un bloque de 10x10x5 mts., cuya desviación estándar es igual a 5.56% de metal combinado. Analizar las incidencias del cálculo de la Ley/tonelaje. Representaremos los modelos en función a sus parámetros y utilizando las formulas del modelo lognormal y cálculos efectuados en el programa Excel, para reproducir las funciones de densidad de probabilidad.
_________
28
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA FUNCION DE PROBABILIDAD LOGNORMAL 0,12 0,1
f(x)
0,08 muestras
0,06
bloques 0,04 0,02 0 0
10
20
30
40
50
X
Función de probabilidad para el Modelo Log Normal para muestras y bloques. Calculo del Tonelaje y Ley para varias leyes de corte, usando el programa Excel y las formulas expuestas anteriormente, para el modelo Log Normal. L.C. 4 5 6 7 8 9 10 11
MUESTRAS P(%) L.MEDIA 93,29 12,637 87,12 13,213 79,76 13,924 71,92 14,734 64,12 15,616 56,69 16,550 49,83 17,523 43,62 18,525
P(%) 98,11 94,17 87,60 78,95 69,19 59,23 49,77 41,20
BLOQUES L.MEDIA 12,159 12,459 12,941 13,579 14,338 15,188 16,105 17,072
Cada Ley de Corte, representa una alternativa de explotación con una proporción de tonelaje económicamente explotable con su respectiva Ley, para cada modelo de muestras y bloques. Generalmente un yacimiento se explota en base al modelo de bloques, en este caso, por ejemplo si las condiciones de la tecnología y el mercado determinan utilizar una Ley de Corte del 7 %, entonces tendríamos el 78.95 % de mineral económicamente explotable con una ley promedio de 13.579 %.
__________
CAPÍTULO 3 GEOESTADÍSTICA Y TEORÍA DE LAS VARIABLES REGIONALIZADAS 3.1. VARIABLES REGIONALIZADAS En términos mineros se define la geoestadística como la aplicación de la teoría de las variables regionalizadas a la estimación de los recursos mineros. Una variable regionalizada es una función que representa la variación en el espacio de una cierta magnitud asociada a un fenómeno natural, abreviada generalmente como V.R. Sea x un punto del espacio. Se designa la variable regionalizada por la notación z(x). 3.2. NOTACION CONDENSADA Antes de estudiar ejemplos de variables regionalizadas, mencionemos que en geoestadística se utiliza la notación condensada: Un punto del espacio se representa por la letra x. Por ejemplo la ley en el punto x se representa por z(x). Por consiguiente, z(x) puede significar:
z(x)
z(x1, x2)
si el problema es bidimensional (2-D)
z(x1, x2, x3)
si el problema es tridimensional (3-D)
si el problema es unidimensional (1-D)
Se observa que existen problemas de notación: Se acostumbra a designar una variable regionalizada con la letra z, lo cual coincide con la notación utilizada para la cota o elevación. 3.3. EJEMPLOS DE VARIABLES REGIONALIZADAS (V.R.) Ejemplo 1: En el espacio de una dimensión, sea z(x) = Ley de Cu a lo largo de una galería:
Figura 3.1: Canaletas en una galería.
- 29 -
30
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 3.2: Galería reconocida entre los puntos A y A’
Las leyes muestreadas en las canaletas se pueden graficar:
Figura 3.3: Leyes muestreadas en las canaletas entre A y A’. Ejemplo 2: En la dimensión tiempo (una dimensión t), el precio de un metal p(t).
Fig. 3.4: Precio del cobre (promedio mensual (1987-2005) en centavos de dólar / libra.
__________
3
Geoestadística y Teoría de las Variables Regionalizadas
Ejemplo 3:
31
En el espacio de dos dimensiones, sea z(x1, x2) = z(x) = potencia minera-
lizada en un yacimiento de nitratos:
Figura 3.5: Depósito de nitratos-yodo: La zona mineralizada, de color rojo en la figura, se llama caliche. Ejemplo 4: En el espacio de tres dimensiones, sea z(x1, x2, x3) = z(x) = Ley de Cu en el punto x dentro de un depósito masivo:
Figura 3.6: Caso típico de depósito de óxidos-sulfuros. La capa superior corresponde a grava.
_________
32
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 3.7. Planta en mina. Leyes de bloques de 25mx25mx15m. Zona de óxidos. En un depósito de este tipo se puede comprobar que la ley de cobre se comporta de manera diferente en la zona de óxidos y en la zona de sulfuros. Esto nos conduce a considerar para la ley de cobre, dos variables regionalizadas diferentes. Ejemplo 5: En el espacio de tres dimensiones, sea z(x1, x2, x3) = z(x) = densidad de la roca en un punto x dentro de un depósito minero:
Figura 3.8: Densidades superficiales en ton/m3 en un yacimiento de cobre. __________
3
Geoestadística y Teoría de las Variables Regionalizadas
33
La densidad in situ, medida en toneladas / m3 es una variable importante para cubicar los recursos de un depósito minero. Los ejemplos anteriores nos muestran que una variable regionalizada es simplemente una función z(x) del punto x.
Sin embargo, esta función no se comporta como las funciones que se estu-
dian en Matemáticas: En general z(x) es muy desordenada en su variación espacial y no se podrá expresar, en particular, z(x) como un polinomio (ver figuras 3.1 al 3.8). 3.4. CAMPO Y SOPORTE Se llama campo a la zona en la cual se estudia la variable regionalizada. Para definir bien el campo (por ejemplo los límites) es necesario utilizar un modelo geológico adecuado, por ejemplo, en la figura 3.6 se podrían distinguir dos campos disjuntos, los cuales se pueden tratar de manera independiente y corresponden a unidades geológicas: Unidad óxidos y unidad sulfuros. Entonces en un mismo depósito minero D pueden haber varios campos o unidades D1, D2, ..., Dk, en general disjuntos, cuya reunión es el conjunto D.
Figura 3.9: Unidades D1, D2, D3, D4 en una sección del depósito de cobre porfídico de Inca de Oro. Las unidades corresponden a una interpretación geológica a partir de los sondajes.
En algunas situaciones, cada campo debería tener un tratamiento geoestadístico diferente: Para estimar una zona V contenida en una cierta unidad, sólo se utilizan datos de la misma unidad: Se dice que se tienen fronteras duras. Las
fronteras
duras
entre
las
unidades
Dr y Ds se justifican
cuando
existe independencia entre las leyes de Dr y Ds (es decir existe una discontinuidad geológica). La independencia debe ser comprobada mediante un análisis de las leyes en las fronteras de las unidades Dr y Ds. El soporte es el volumen de la muestra que define la variable regionalizada. A menudo el soporte es _________
34
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
un cilindro (figura 3.10) llamado testigo:
Figura 3.10: Un testigo. Tiene un cierto largo l y un cierto diámetro d.
z(x) será entonces la ley del volumen de muestra localizado en el punto x., en el ejemplo 5 el soporte es un cilindro vertical de 15 metros de largo. En general, en el estudio de una variable regionalizada no es conveniente mezclar soportes de tamaños diferentes. En el caso en que los testigos que constituyen el sondaje son de tamaño irregular, es necesario hacer una operación la cual consiste en regularizar o compositar el sondaje, es decir disponer de datos (compósitos) de longitud constante (figura 3.11).
Figura 3.11: Regularización de un sondaje a un largo constante b. Esta operación produce errores
La figura 3.12 muestra una sección transversal en un depósito de óxidos de cobre. Las líneas representan los sondajes de exploración. El punto rojo se denomina collar del sondaje. El collar está caracterizado por las coordenadas x0, y0, z0 y por dos ángulos: (θ, φ) Azimuth e inclinación.
__________
3
Geoestadística y Teoría de las Variables Regionalizadas
35
Figura 3.12: Sección en el depósito de cobre. Se observan las unidades grava ( estéril), lixiviado, óxidos y sulfuros. Un compósito está caracterizado por sus coordenadas x, y, z, las leyes de cobre total, de cobre soluble, un código que indica la unidad, además del nombre del sondaje que contiene al compósito.
Cada compósito está caracterizado por sus coordenadas x, y, z, sus leyes, un código que indica el dominio o unidad geológica y la identificación del sondaje, eventualmente otra información. Se tiene así la base de datos de sondajes del depósito, la cual, en formato de texto, puede ser incorporada en cualquier paquete computacional. Para tratar las desviaciones de los sondajes, se divide el sondaje en tramos rectilíneos L1, L2, …, Lr.
Figura 3.13: Azimuth θ (se mide en grados desde el norte) e inclinación φ (se mide en grados desde la horizontal) de un sondaje.
3.5. VARIABLES ADITIVAS En general, en la estimación de recursos mineros conviene utilizar variables aditivas. Una variable regionalizada es aditiva cuando se cumple la condición siguiente: Se conoce la variable z en dos soportes V1 y V2, con valores medios respectivos z1 y z2, entonces el valor medio de la variable z en el soporte homogeneizado V1 U V2 es igual al promedio ponderado de z1 y z2, en particular si _________
36
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
V1 = V2, entonces el valor medio de la variable es (z1 + z2) / 2. Por ejemplo, la variable índice de trabajo WI(x) (parámetro de conminución que expresa la resistencia de la roca a ser molida, en Kwh/ton) no es aditivo. Sin embargo es muy importante disponer de un modelo del WI en una mina. Otros casos de variables no aditivas son, la recuperación metalúrgica, y, en una mina de óxidos de cobre, la razón (llamada solubilidad) (ley de CuS) / (ley de CuT). En el caso de una veta (figura 3.14) el sondaje S determina una potencia aparente p (y una potencia real p0) y una ley z. La ley z no es aditiva. En este caso hay que estudiar dos variables aditivas: La potencia p0 y la acumulación en un punto x, definida como el producto de la ley por la potencia.
Figura 3.14: Veta y variables aditivas. 3.6. OBJETIVOS DE LA TEORIA La teoría de las variables regionalizadas se propone dos objetivos principales: Expresar las características estructurales de una variable regionalizada mediante una forma matemática adecuada. Resolver, de manera satisfactoria, el problema de la estimación de una variable regionalizada a partir de un conjunto de muestras, asignando errores a las estimaciones. Estos dos objetivos están relacionados: El error de estimación depende de las características estructurales (continuidad, anisotropías) y se tendrá un error mayor si la variable regionalizada es más irregular y discontinua en su variación espacial. Ejemplo: La figura 3.15 siguiente representa el caso de una variable regionalizada z(x) = ley de cobre definida en un soporte cuadrado de lado axa: La ley de corte es w = 0.5. Se definen otros soportes (tamaño del bloque): (a)x(2a), (2a)x(a), (2a)x(2a), (3a)x(3a) y (6a)x(6a). T es el tonelaje sobre la ley de corte medido en número de bloques de tamaño axa. m es la ley media de los bloques cuya ley es superior a la ley de corte. B es el beneficio convencional, definido por: B=T(m–c) __________
3
Geoestadística y Teoría de las Variables Regionalizadas
37
La importancia económica de la anisotropía y del soporte es evidente.
Figura 3.15: Importancia económica del soporte y la anisotropía. A medida que aumenta el soporte, se diluyen las leyes. Observar que la ley de corte es mayor que la ley media. Repetir los cálculos para una ley de corte de 0.40 3.7. EL MODELO MATEMÁTICO DE LA GEOESTADÍSTICA: LAS FUNCIONES ALEATORIAS Para alcanzar los objetivos propuestos es necesario disponer de un modelo matemático. La geoestadística utiliza una cierta interpretación probabilística de la variable regionalizada, mediante el modelo de las funciones aleatorias. En teoría de probabilidad una serie de k variables aleatorias dependientes Z1, Z2, ..., Zk definen un _________
38
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
vector aleatorio Z = (Z1, Z2, ..., Zk) con k componentes. Análogamente, cuando el valor de una función Z(x) es una variable aleatoria, al variar x en el espacio Rn de n dimensiones, Z(x) define una familia de variables aleatorias. A cada punto x0 del espacio le corresponde una variable aleatoria Z(x0). La función aleatoria (F.A) Z(x) puede también interpretarse como una función del punto x, cuyo valor en x0 no es un número sino una variable aleatoria. Nótese que en general las variables aleatorias correspondientes a dos puntos Z(x1) y Z(x2) no tienen porqué ser independientes. Un experimento sobre la F.A. Z(x) proporciona una función ordinaria z(x) llamada trayectoria o realización de la F.A. Z(x); estas realizaciones son a menudo muy irregulares, como puede apreciarse en la figura 3.16.
Figura 3.16: Realización de la función aleatoria Z(x) La hipótesis constitutiva de la geoestadística consiste en afirmar que la variable regionalizada en estudio es la realización de una cierta función aleatoria. Lo anterior equivale a decir que las leyes de nuestro yacimiento se generaron a partir de un proceso o experimento muy complejo.
Figura 3.17: Función aleatoria y variable regionalizada. Los colores indican rangos de la variable. La Geoestadística considera una variable regionalizada a z(x) en estudio, como una realización particular de una cierta función aleatoria Z(x). Una variable distribuida en el espacio de forma que presenta una estructura espacial de correlación se dice que esta regionalizada. Así, una variable regionalizada (V.R.) es una función que representa el desplazamiento en el espacio de una cierta magnitud asociada a un fenómeno natural. En adelante no haremos distinción entre la función alea__________
3
Geoestadística y Teoría de las Variables Regionalizadas
39
toria Z(x) y su realización z(x). Es muy frecuente observar en una V.R. dos aspectos complementarios y aparentemente contradictorios:
Un aspecto aleatorio asociado con las variaciones erráticas e impredecibles de la variable, y. Un aspecto general estructurado que refleja en cierta forma las características globales de variación del fenómeno regionalizado.
La interpretación probabilística de una V.R. como realización de una F.A. Z(x) tiene sentido operativo sólo si es posible inferir, al menos en parte, la función de distribución o ley de probabilidad de Z(x). En general, no es posible la inferencia estadística a partir de una sola realización, de la misma manera que no es posible reconstituir la función de distribución de una variable aleatoria a partir de una sola observación. Para hacer posible la inferencia estadística, se hace imprescindible introducir hipótesis adicionales acerca de Z(x) para poder reducir el número de "parámetros" de los que depende la función de distribución. Estas hipótesis tienen que ver con la homogeneidad espacial de la función aleatoria. Por ejemplo, suponer que la función aleatoria es estacionaria puede pensarse como equivalente a que la función aleatoria se "repite" en el espacio y esta "repetición" proporciona la información equivalente a muchas realizaciones de la misma F.A., permitiendo de esta forma la posibilidad de la inferencia estadística. Observaciones: a) No se puede afirmar que una variable regionalizada es una función aleatoria. Esto tendría el mismo sentido que decir “el número 6 es una variable aleatoria”. El enunciado correcto de la hipótesis probabilística de la geoestadística es: “z(x) es la realización de una función aleatoria Z(x)”. b) Para que esta hipótesis probabilística tenga un sentido real, es necesario poder reconstituir, al menos en parte, la ley de probabilidad de la función aleatoria, lo cual supone que la inferencia estadística (es decir el cálculo de parámetros que caracterizan la función aleatoria) es posible. Es necesario introducir una hipótesis suplementaria a la función aleatoria Z(x). Esta hipótesis es conocida como hipótesis de estacionaridad y expresa que la variación espacial de las realizaciones de Z(x) deben ser homogéneas. Esta hipótesis se puede debilitar al suponer que las diferencias Z(x) – Z(y) son estacionarias localmente (lo cual se conoce como hipótesis intrínseca). La estacionaridad es una propiedad del modelo (función aleatoria) y quedará más clara cuando se estudie el cálculo de variogramas. 3.8. FUNCIÓN DE DISTRIBUCIÓN Y MOMENTOS DE UNA FUNCIÓN ALEATORIA Considérese una función aleatoria Z(x) definida en Rn . Para cualesquiera k puntos x1, x2, ..., xk, el vector aleatorio [Z(x1), Z(x2), ..., Z(xk)] se caracteriza por su función de distribución k-variable. Fx1 , x2 ,..., xk ( Z 1 , Z 2 ,..., Z k ) Pr obZ ( x1 ) Z 1 , Z ( x 2 ) Z 2 ,..., Z ( x k ) Z k
(3.1)
El conjunto de todas estas distribuciones para todo valor de k y para cualquier selección de puntos en Rn constituye la "ley espacial de probabilidad" de la función aleatoria Z(x).
_________
40
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
El momento de primer orden es la esperanza matemática definida como:
E Z ( x) m( x)
(3.2)
Aunque la función m(x) se conoce con los nombres de deriva y tendencia, algunos autores prefieren la utilización del término deriva. Los tres momentos de segundo orden a ser considerados son: a) La varianza o momento de segundo orden de Z(x) respecto a m(x).
2 Var Z ( x) E Z ( x) m( x)
2
(3.3)
b) La covarianza de dos variables aleatorias Z(xi) y Z(xj), se define como:
C ( xi , x j ) EZ ( xi ) m( xi ) Z ( x j ) m( x j )
(3.4)
Es en general una función de xi y xj. Esta función se llama a veces función de autocovarianza. c) El semivariograma, llamado muchas veces indistintamente como el variograma. En adelante cualquiera de estos nombres que se use, hará referencia a la siguiente definición:
( xi , x j )
1 2 E Z ( xi ) Z ( x j ) 2
(3.5)
Nótese que tanto la varianza como el semivariograma son siempre positivos, mientras que la covarianza puede adoptar valores negativos. 3.9. FUNCIONES ALEATORIAS ESTACIONARIAS Se dice que una función aleatoria es estrictamente estacionaria sí su función de distribución (4.1) es invariante respecto a cualquier traslación del vector h, o lo que es lo mismo, la función de distribución del vector aleatorio [Z(x1), Z(x2),..., Z(xk)] es idéntica a la del vector [Z(x1+h), Z(x2+h),..., Z(xk+h)] para cualquier h. Sin embargo, puesto que la Geoestadística lineal se basa en los dos primeros momentos de la función aleatoria, es suficiente suponer que estos dos momentos existen y limitar la hipótesis de estacionariedad a los dos primeros momentos. Se dice que una función aleatoria Z(x) es estacionaria de orden 2 o de segundo orden, sí: a)
E[Z(x)] existe y no depende de x, es decir:
E Z ( x) m b)
para todo x
(3.6)
Para toda parejas de variables aleatorias {Z(x+h), Z(x)}su covarianza existe y sólo depende del vector de separación h, es decir: C ( x h, x) E Z ( x h) Z ( x) m 2 C (h)
(3.7)
La estacionariedad de la covarianza implica que la varianza Var[Z(x)] existe, es finita y no depende de x, es decir, Var[Z(x)] = C(0). __________
3
Geoestadística y Teoría de las Variables Regionalizadas
c)
41
Bajo esta misma hipótesis, el semivariograma también es estacionario y se cumple que:
( x h, x) (h)
1 2 E Z ( x h) Z ( x) 2
(3.8)
Dado que h es un vector y una función escalar, en general puede depender tanto de la magnitud h h como de la orientación u = h/h. Es decir (h) puede ser anisotrópica. Sin embargo, en la mayoría de los casos el número de datos no es suficiente para estimar esta anisotropía y se suele hacer la hipóstesis de suponer que es independiente de la orientación de h y tomarlo como isotrópico. 3.10. RELACIÓN ENTRE EL SEMIVARIOGRAMA Y LA COVARIANZA Cuando la función aleatoria es estacionaria, la relación entre el semivariograma y la covarianza es inmediata, ya que de acuerdo con la ecuación (4.8) se cumple:
( h)
1 2 E Z ( x h) m Z ( x) m 2
1 2 2 E Z ( x h) m E Z ( x) m 2 E ( Z ( x h) m)( Z ( x) m) 2 Var ( Z ) E( Z ( x h) m)( Z ( x) m) (3.9)
y puesto que de (3.7) se deduce que:
C (h) EZ ( x h) mZ ( x) m
(3.10)
se obtiene finalmente que:
(h) Var ( Z ) C (h)
(3.11)
Es decir, bajo la hipótesis de estacionariedad el semivariograma resulta ser igual a la varianza menos la covarianza, por lo que la equivalencia es total (véase la figura 4.2) sin embargo cuando la media varía "lentamente" de forma que en la escala local se puede suponer constante (aunque desconocida), el semivariograma es independiente del valor local de dicha media, mientras que la autocovarianza requiere su estimación. Esto introduce un sesgo en el cálculo de la función de autocovarianza. En este sentido, (h) es un estadístico más conveniente que C(h), para aquellas funciones cuya media varia lentamente.
Figura 4.2: Relación entre el semivariograma y la función de covarianza
_________
42
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
3.11. EL CORRELOGRAMA Una tercera función que también caracteriza la estructura de correlación es el correlograma (h) definido como el cociente entre la covarianza C(h) y la varianza:
( h)
C ( h) ( h) 1 C (0) C (0)
(3.12)
__________
CAPÍTULO 4 ANÁLISIS EXTRUCTURAL DE DATOS 4.4. VARIOGRAMA EXPERIMENTAL La mayoría de los fenómenos naturales poseen una continuidad espacial, los datos contiguos muestran mayor similitud que si estos estuvieran alejados. Al observar la disposición de los datos, se nota que existe un cierto orden, una cierta continuidad. Así un valor alto tenderá a situarse cerca del valor alto. El variograma resume las principales características del comportamiento espacial de la variable en estudio y es parte fundamental en el proceso del análisis estructural, su interpretación como el momento de segundo orden, da lugar al estimador *(h) conocido como el variograma experimental. El variograma experimental se estima en base a los datos y a la estructura del fenómeno. La variabilidad entre dos puntos del espacio, x y x+h, distantes del vector h (figura 4.1), esta caracterizada por la función variograma, que se constituye en la herramienta fundamental de la Geoestadistica, teóricamente está definida por:
(h) E Z ( x h) Z ( x)
2
(4.1)
Figura 4.1: Dos puntos a la distancia vectorial h.
En la práctica el variograma experimental se obtiene mediante la siguiente expresión:
* ( h)
1 N (h) Z ( xi h) Z ( xi )2 2 N (h) i 1
(4.2)
Donde Z(xi) son los valores experimentales en los puntos xi, en los que se dispone de datos tanto en xi como en xi +h; N(h) es el número de pares de puntos separados por una distancia h. Por ejemplo si h = (20,10), entonces cada par de muestras comparadas deben separarse por 20 metros en la dirección Oeste - Este y 10 metros en la dirección Sur - Norte ( ver figura 4.2).
Figura 4.2 Pares de muestras a una distancia h - 43 -
44
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Dicho de otro modo, el variograma experimental es el promedio de las diferencias al cuadrado de los datos distantes del vector h, dividido entre 2; es decir:
(diferencias ) 2 de.valores.en 1 (h) Pr omedio 2 datos.que.estan.a.la.distancia.h *
(4.3)
Este algoritmo es el que hay que adaptar en cada situación práctica (mallas regulares e irregulares en el espacio de n dimensiones, n = 1, 2, 3). De las expresiones citadas, se deducen fácilmente las siguientes propiedades:
( 0) 0 ( h) 0 ( h) ( h )
(4.4)
La última relación traduce el hecho que (z1-z2)2 = (z2-z1)2, siendo z1 y z2 los datos de las muestras 1 y 2 distantes del vector h, que están formando pares.
Figura 4.3: La función gama de h es par.
En la práctica, y especialmente cuando se trabaja en dos o tres dimensiones, las distancias entre los puntos de cada pareja son distintos y puede no haber dos parejas de puntos situados a la misma distancia. Por lo tanto lo que se hace es definir una serie de intervalos de clase y asignar al cálculo del variograma experimental todas las parejas cuyas distancias del vector h estén contenidas en el intervalo. El número de direcciones puede ser diferente 4, 8, 16, etc. (ver figura 4.4)
Figura 4.4: Definición de intervalos para el cálculo de *(h) __________
4 Análisis Estructural de Datos
45
La elección de los parámetros que define cada intervalo no está exenta de dificultad y suele requerir algunas iteraciones y una cierta dosis de práctica. Así lo más común es repetir el cálculo con varias amplitudes y elegir aquella que permita una buena definición del variograma, de forma que los h no estén tan separados que no se pueda discernir el variograma, ni tan juntos que el número de parejas sea pequeño y las oscilaciones del variograma experimental resulten excesivas. 4.5. PARÁMETROS DEL VARIOGRAMA Típicamente el variograma tiene la siguiente forma:
Figura 4.5: Parámetros del variograma Normalmente el variograma es una función monótona no decreciente, ya que al aumentar h también aumenta, al menos en sentido cuadrático, la diferencia entre Z(x+h) y Z(x) (véase la figura 4.5). Si Z es estacionaria, (h) alcanza un valor límite constante llamado meseta que coincide con la varianza de Z. La distancia a la que se alcanza este valor se denomina rango o alcance y marca la zona de influencia en torno a un punto, más allá de la cual la autocorrelación es nula. Aunque (0) = 0, con frecuencia el variograma es discontinuo en el origen, con un salto finito que se llama pepita, o efecto pepita (del inglés "nugget"). INTERPRETACION DEL EFECTO PEPITA (NUGGET EFFECT) Históricamente, el origen de este efecto está en la aparición, más o menos errática, de pepitas de oro en las muestras de un mineral. En este caso, puede encontrarse una pepita en alguna muestra sin que ello implique que se van a encontrar en las demás. Otra fuente de discontinuidad en el origen, son los errores de muestreo. Los siguientes ejemplos muestran algunas formas que puede adoptar el variograma en el origen.
Figura 4.6: Comportamiento en el origen _________
46
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
El primer caso presenta un comportamiento puramente aleatorio sin ninguna correlación espacial, donde la irregularidad de los datos es total. En este caso se dice que el variograma presenta un efecto pepita puro. El segundo ejemplo es indicativo de un comportamiento francamente irregular, tal vez discontinuo, en el que parte de la estructura espacial se concentra a distancias inferiores a las observadas. El tercer ejemplo nos muestra un variograma nulo en el origen, pero pendiente no nula, que es indicativo de una alta correlación espacial de los datos. 4.6. COMPORTAMIENTO DEL VARIOGRAMA PARA DISTANCIAS PEQUEÑAS Estudiaremos el comportamiento de la función (h) para | h | pequeño, para lo cual estudiaremos cuatro casos hipotéticos. Caso 1: Leyes muy regulares y continuas
Figura 4.7: Leyes muy regulares (la variable es derivable). Para una distancia b pequeña, las dos leyes de la figura son casi iguales, lo que implica que para | h | pequeño, (h) es próximo a cero; luego el gráfico de (h) en una vecindad del origen será como en la figura:
Figura 4.8: Variograma parabólico en el origen. Se dice que (h) tiene un comportamiento parabólico en el origen.
__________
4 Análisis Estructural de Datos
47
Caso 2: Continuidad y regularidad promedio
Figura 4.9: Leyes con continuidad promedio. La variable es continua pero no es derivable. En este caso, para una distancia pequeña, la diferencia de leyes es significativa; luego el gráfico de (h) en una vecindad del origen será:
Figura 4.10: Variograma lineal en el origen. Se dice que (h) tiene un comportamiento lineal en el origen. Caso 3: Existencia de micro variaciones:
Figura 4.11: Presencia de una estructura a menor escala. La variable es más discontinua. Si la equidistancia entre datos b es menor que la escala de variación d de las micro- estructuras, el variograma en una vecindad del origen será:
_________
48
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 4.12: Efecto de pepita en el origen. Existe un crecimiento rápido hasta | h | = d (debido a la micro regionalización) y luego un crecimiento más moderado (debido a la variación a gran escala): se dice que existe efecto de pepita. Co se llama constante de pepita. En la práctica la equidistancia o paso b es mayor que d y se tendrá un gráfico del tipo:
Figura 4.13: Extrapolación al origen del variograma experimental. Es decir existe una discontinuidad aparente en el origen. El nombre efecto de pepita proviene del estudio de los depósitos de oro. Consideremos por ejemplo un testigo en un depósito de oro:
Figura 4.14: Efecto de pepita en un testigo de una mina de oro. En general, el efecto de pepita se produce debido a microvariaciones y/o a errores en el muestreo, la manipulación, preparación o análisis químico. __________
4 Análisis Estructural de Datos
49
Caso 4: Caso límite en el cual la irregularidad de las leyes es total:
Figura 4.15. Irregularidad máxima. La variable es caótica. Por muy pequeña que sea la distancia b, las leyes de dos puntos a esta distancia son prácticamente independientes. El gráfico de (h) será:
Figura 4.16: Efecto de pepita puro: El variograma no depende de la distancia h. Se dice que (h) presenta un efecto de pepita puro: (0) = 0, (h) = C
si h ≠ 0.
4.4. COMPORTAMIENTO DEL VARIOGRAMA PARA GRANDES DISTANCIAS Estudiaremos ahora el comportamiento de la función (h) para | h | grande, para lo cual analizaremos tres casos hipotéticos: Caso 1: Leyes con crecimiento (decrecimiento) progresivo:
Figura 4.17: Leyes con tendencia o deriva. _________
50
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Se dice que existe una deriva o tendencia. Al hacer el cálculo se observará que (h) siempre crece:
Figura 4.18: Variograma con crecimiento sistemático.
Caso 2: Leyes con pseudo-periodicidades: El fenómeno tiende a repetirse de manera estacionaria (es decir, varía de manera homogénea y sin deriva):
Figura 4.19: Fenómeno estacionario con periodicidades. Si se calcula la función (h), se observará la presencia de máximos y mínimos:
Figura 4.20: Variograma con efecto de hoyo. __________
4 Análisis Estructural de Datos
51
Se dice que el variograma presenta efecto de hoyo o de agujero. En la figura, d = 9 unidades proporciona una medida del pseudo-período ; ∆ es una medida de la intensidad del efecto (si el fenómeno es perfectamente periódico, entonces ∆ = 0). Caso 3: Fenómeno estacionario sin pseudo-periodicidades (o fenómeno de transición): El fenómeno es homogéneo en su variación espacial, con cambios bruscos.
Figura 4.21: Fenómeno estacionario sin periodicidades. Este caso debería corresponder al anterior, en el cual la magnitud ∆ crece. Si se calcula la función (h), se tiene:
Figura 4.22: Variograma de un fenómeno estacionario sin periodicidades, con alcance y meseta. Se observa que a partir de una cierta distancia, del orden a = 6 unidades, la función (h) permanece aproximadamente constante: (6) = (7) = (8) = . . .
= constante = C
Esto quiere decir que da lo mismo que la distancia que separa los puntos sea 6, 7, 8 o más unidades; en otras palabras, dos puntos cuya distancia sea superior a a = 6 unidades son prácticamente independientes en ley. La magnitud a se llama alcance y la constante C se llama meseta.
_________
52
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 4.23: Variograma con alcance a y meseta C. El alcance proporciona una medida de la zona de influencia de una muestra porque dos muestras cuya distancia es mayor que el alcance son prácticamente independientes:
Figura 4.24: Zona de influencia de una muestra localizada en el punto x0. 4.10. CÁLCULO DEL VARIOGRAMA A MALLA REGULAR VARIOGRAMA A 1 DIMENSION (R1) Aplicaremos el algoritmo del variograma experimental, para diferentes ejemplos, donde explicaremos el procedimiento de cálculo numérico, formando los pares a partir de la malla mínima. Ejemplo Nº 1: En la figura 4.25, se muestran los datos de leyes muestreados a lo largo de una galería, empleando una malla regular de 2 metros. Por ejemplo para el caso de cálculo del variograma en una dirección se tiene en el siguiente ejemplo, Fig. 1, leyes distanciadas cada dos metros. En la Fig. 2 se describe el cálculo de cada punto del variograma para distancias h=2m, h=4m, h=6m, etc.
Fig. 4.25: Datos de leyes muestreados en una galería, cada 2 metros. Aplicamos el algoritmo del variograma experimental.
* ( h)
1 N (h) Z ( xi h) Z ( xi )2 2 N (h) i 1 __________
4 Análisis Estructural de Datos
53
Cada punto del variograma, se ira calculando, formando pares para distancias de h = 2 metros, h= 4 metros, h=6 metros y así sucesivamente tomando múltiplos de la malla empleada (2 m.). En la figura 4.25, se muestran los pares formados para h=2 metros y h=4 metros, de la misma forma se formarán los pares para los demás valores de h. Para elegir el valor máximo de h, la práctica ha demostrado que los pares muestran una correlación aceptable hasta la mitad de la dimensión del campo, es decir en este ejemplo el h máximo seria 8 metros, sin embargo estamos calculando hasta h=10 m.
Fig. 4.26: Cálculo del variograma experimental Puntos del Variograma experimental h (m.) N(h) *(h) 2
8
0.038
4
7
0.087
6
6
0.039
8
5
0.003
10
4
0.039
Fig. 4.27: Puntos del variograma experimental. _________
54
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
El variograma experimental muestra posibles cambios estructurales en la galería en los puntos de quiebre, sin embargo el ejemplo muestra pocos datos y este comportamiento puede ser también a la falta de datos, nótese que el numero de pares con los cuales se ha calculado los puntos, van decreciendo a partir de los 8 pares. Ejemplo Nº 2: La siguiente data corresponde a un yacimiento de oro, las muestras siguen una malla regular de 6 metros. Calcular el variograma experimental. Nº de Datos
g/t Au
Nº de Datos
g/t Au
1
0,357
14
0,429
2
0,253
15
0,428
3
0,53
16
0,357
4
0,456
17
0,582
5
0,661
18
0,533
6
0,638
19
0,277
7
0,617
20
0,397
8
0,387
21
0,423
9
0,391
22
0,22
10
0,315
23
0,237
11
0,466
24
0,338
12
0,517
25
0,277
13
0,339
CALCULO DEL VARIOGRAMA EXPERIMENTAL Calculo de las distancias para el vector ¨h¨, h(min)= 6 metros, se toma el valor de la malla entre las muestras.
CÁLCULOS H(min)
6 m.
H(max)
72 m.
C Cálculo del primer punto del variograma para h=6 m. *(6).
Fig. 4.28: Pares formados a una distancia de h=6 m. __________
4 Análisis Estructural de Datos
55
Aplicamos la siguiente formula del variograma experimental, obteniendo los siguientes resultados:
* ( h)
1 N (h) Z ( xi h) Z ( xi )2 2 N (h) i 1
Nº pares
Z(x)
Z(x+h)
[Z(x+h)-Z(x)]^2
1
0,357
0,253
0,010816
2
0,253
0,53
0,076729
3
0,53
0,456
0,005476
4
0,456
0,661
0,042025
5
0,661
0,638
0,000529
6
0,638
0,617
0,000441
7
0,617
0,387
0,0529
8
0,387
0,391
0,000016
9
0,391
0,315
0,005776
10
0,315
0,466
0,022801
11
0,466
0,517
0,002601
12
0,517
0,339
0,031684
13
0,339
0,429
0,0081
14
0,429
0,428
0,000001
15
0,428
0,357
0,005041
16
0,357
0,582
0,050625
17
0,582
0,533
0,002401
18
0,533
0,277
0,065536
19
0,277
0,397
0,0144
20
0,397
0,423
0,000676
21
0,423
0,22
0,041209
22
0,22
0,237
0,000289
23
0,237
0,338
0,010201
24
0,338
0,277
0,003721
SUMATORIA
_________
0,453994
56
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Cálculo del segundo punto del variograma para h=12 m. *(12).
Fig. 4.29: Pares formados a una distancia de h=12 m.
Nº pares 1
Z(x)
Z(x+h)
0,357
0,53
[Z(x+h)Z(x)]^2 0,029929
2
0,253
0,456
0,041209
3
0,53
0,661
0,017161
4
0,456
0,638
0,033124
5
0,661
0,617
0,001936
6
0,638
0,387
0,063001
7
0,617
0,391
0,051076
8
0,387
0,315
0,005184
9
0,391
0,466
0,005625
10
0,315
0,517
0,040804
11
0,466
0,339
0,016129
12
0,517
0,429
0,007744
13
0,339
0,428
0,007921
14
0,429
0,357
0,005184
15
0,428
0,582
0,023716
16
0,357
0,533
0,030976
17
0,582
0,277
0,093025
18
0,533
0,397
0,018496
19
0,277
0,423
0,021316
20
0,397
0,22
0,031329
21
0,423
0,237
0,034596
22
0,22
0,338
0,013924
23
0,237
0,277
0,0016
SUMATORIA
0,595005
__________
4 Análisis Estructural de Datos
57
Los demás puntos del variograma se calculan con la misma metodología, formando los pares para cada distancia de ¨h¨. Cálculo del penúltimo punto del variograma para h=66 m. *(66).
Fig. 4.30: Pares formados a una distancia de h=66 m.
Nº pares 1
Z(x)
Z(x+h)
0,357
0,517
[Z(x+h)Z(x)]^2 0,026
2
0,253
0,339
0,007
3
0,53
0,429
0,01
4
0,456
0,428
8.00E-04
5
0,661
0,357
0,092
6
0,638
0,582
0,003
7
0,617
0,533
0,007
8
0,387
0,277
0,012
9
0,391
0,397
4.00E-05
10
0,315
0,423
0,012
11
0,466
0,22
0,061
12
0,517
0,237
0,078
13
0,339
0,338
1.00E-06
14
0,429
0,277
0,023
SUMATORIA
_________
0,332
58
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Cálculo del último punto del variograma para h=72 m. *(72).
Fig. 4.31: Pares formados a una distancia de h=72 m.
Nº pares 1
Z(x)
Z(x+h)
0,357
0,339
[Z(x+h)Z(x)]^2 0,000324
2
0,253
0,429
0,030976
3
0,53
0,428
0,010404
4
0,456
0,357
0,009801
5
0,661
0,582
0,006241
6
0,638
0,533
0,011025
7
0,617
0,277
0,1156
8
0,387
0,397
0,0001
9
0,391
0,423
0,001024
10
0,315
0,22
0,009025
11
0,466
0,237
0,052441
12
0,517
0,338
0,032041
13
0,339
0,277
0,003844
SUMATORIA
0,282846
__________
4 Análisis Estructural de Datos
59
Resumen de puntos calculados del variograma [Z(x+h)-
h
Nºpares
6
24
0,454
0,009
12
23
0,595
0,013
18
22
0,6
0,014
24
21
0,757
0,018
30
40
0,731
0,009
36
39
0,454
0,006
42
18
0,534
0,015
48
17
0,512
0,015
54
16
0,365
0,011
60
15
0,426
0,014
66
14
0,332
0,012
72
13
0,283
0,011
Z(x)]^2
Y*(h)
Fig. 4.32: Variograma experimental para la data del yacimiento de oro.
VARIOGRAMA EN 2 DIMENSIONES (R2) Para una data en dos dimensiones, tenemos cuatro direcciones de cálculo para el variograma experimental, tal como podemos apreciar en la siguiente figura:
_________
60
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Fig. 4.33: Direcciones de cálculo para el variograma. Ejemplo Nº 1: Con los datos de las leyes de cobre de una mina a cielo abierto, que se presentan en la figura 4.34, calcular el variograma experimental.
Fig. 4.34: Leyes de cobre en un banco de una mina a cielo abierto, espaciados a una malla de 10 metros. Para el cálculo del variograma experimental *(h), en este caso h es un vector (con coordenadas cartesianas o polares):
Figura 4.35: componentes del vector h. En este dibujo θ no es el azimuth sino el ángulo de coordenadas polares.
__________
4 Análisis Estructural de Datos
61
Cálculo del variograma en la dirección =90o del vector h. Es decir, la dirección NS. El vector h sólo puede ser:
Figura 4.36: Vectores orientados según dirección NS, con distancias múltiplos de 10 m. Calculemos (h1) = NS(10). Al aplicar el algoritmo hay que considerar las (diferencias)2 posibles: (zi - zj)2 cuando ambos datos zi y zj están definidos. La siguiente figura muestra las diferencias que hay que calcular:
Figura 4.37: Parejas posibles para calcular *(10 m.), en la dirección NS (hay 36 vectores). Luego:
De manera análoga se obtiene: (h2) = 0.0987
(con 27 pares)
(h3) = 0.1888
(con 21 pares)
_________
62
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Cálculo del variograma en la dirección =0o del vector h. Es decir la dirección EW. El vector h sólo puede ser:
Figura 4.38: Vectores orientados según dirección EW. Las diferencias que hay que calcular son:
Figura 4.39: Parejas posibles para calcular (10 m) en la dirección EW (hay 36 vectores). Se obtiene entonces: (h1)= 0.0146 (h2)= 0.0330 (h3)= 0.041
(con 36 pares) (con 33 pares) (con 27 pares)
La practica demuestra que para estudiar las estructuras, basta con calcular (h), en dos direcciones adicionales: = 45o y = 135o, tal como se muestran en las siguientes figuras. El desarrollo numérico se deja par que el alumno proceda a resolverlo y graficar los respectivos variogramas.
Figura 4.40: Cálculo de gama de h en la dirección de 45°. La distancia entre parejas es ahora 14.41 metros.
__________
4 Análisis Estructural de Datos
63
Figura 4.41: Cálculo de gama de h en la dirección de 135°. La distancia entre parejas contiguas (el paso) es 14.41 metros. En estas direcciones hay que tener presente que el módulo de h es un múltiplo de 10√2. Resumen de puntos calculados Dirección N-S (=90o) Dirección E-W (=0o) h(m.)
Nh)
*(h)
h(m.)
Nh)
*(h)
10
36
0.0535
10
36
0.0146
20
27
0.0987
20
33
0.0330
30
21
0.1888
30
27
0.041
Variograma Experimental en las dos direcciones calculadas
Figura 4.42: Variograma anisótropo. La variación de las leyes es más regular en la dirección EW que en la NS.
Se observa una clara anisotropía que nos indica que el fenómeno es más regular en la dirección EW que en la N-S. (Esto se puede comprobar al mirar como varían las leyes en esas direcciones: ver la figura 4.34)
_________
64
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Ejemplo Nº 2: Los datos que se proporcionan a continuación provienen de un banco en una mina de fierro:
Figura 4. 43: Datos de leyes de fierro. Al aplicar el algoritmo general se obtienen los gráficos siguientes, correspondientes a los variogramas experimentales:
Figura 4.44: Variograma N-S
Figura 4.45: Variograma E-W __________
4 Análisis Estructural de Datos
65
Figura 4.46: Variograma dirección 45° (paso = 14.41 metros)
Figura 4.47: Variograma dirección 135° (paso = 14.41 metros)
Observamos que (h) es casi el mismo según las direcciones: podemos concluir que el fenómeno es isótropo. En este caso se justifica calcular el variograma promedio, llamado variograma omnidireccional, el cual se puede obtener, en este caso, mediante un promedio ponderado de los valores del variograma (ponderación por el número de parejas N'): Su cálculo se justifica en el caso isótropo.
_________
66
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Gráfico del Variograma Omnidireccional:
Figura 4.48: Variograma Omnidireccional. 4.11. CÁLCULO DEL VARIOGRAMA PARA MALLAS IRREGULARES Cálculo a malla irregular en una dimensión R1: Los datos que generalmente se representan en R1, son los muestreos correspondientes a sondajes, galerías, chimeneas y otros, siendo los más comunes en la dirección horizontal o vertical. Cuando estamos frente a un muestreo irregular de los datos, se toman los siguientes criterios para la conformación de los intervalos o clases de la variable distancia del vector h. Para cada lag h se define una tolerancia h y se utilizan únicamente los puntos que se encuentran a una distancia mayor o igual a (h - h) y menor que (h + h). Tal como se muestra en la figura 4.49:
Figura 4.49: Formación de los intervalos de distancia. El valor de h se escoge como el 50% del valor del lag h. De esta forma los intervalos o clases de distancias no se superponen y no hay valores de la variable fuera de una clase de distancia, como puede observarse en la figura 4.50.
__________
4 Análisis Estructural de Datos
67
Figura 4.50: Intervalos o clases de distancia, con h = 50%. De esta manera se procede a calcular todas las distancias entre muestras y a seleccionar todas aquellas que caen en dichos intervalos, cuantificando el número de pares y aplicando el algoritmo de cálculo del variograma experimental. Ejemplo Nº 1: Se tiene un yacimiento de plata con las siguientes leyes y distancias de muestreo, a lo largo de una galería. Calcular el variograma experimental.
Figura 4.51: Muestreo irregular a lo largo de una galería. Tabla de Datos N° Muestra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Distancias (Eje X m.) 0 3 5 5 4 6 2 2 4 3 2 6 2 5 6
Valores de h h total h min h máx.
_________
55 m. 2 m. 6 m.
Ley Ag 5.8 3.4 5.1 6.8 9.9 7.6 6.4 6.8 6.7 7.5 8.9 7.4 6.3 6.2 8.8
68
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Determinación de los intervalos para cada valor de h, considerando un h = 50%. h
Intervalo [i j]
4 8 12 16 20 24 28 32 36
2 4 6 8 10 12 14 16 18
6 12 18 24 30 36 42 48 54
__________
4 Análisis Estructural de Datos
69
Resumen de datos para el cálculo el variograma experimental, en el intervalo 2,6.
N(h) =
17
*=(Z(x+h)-Z(x))2 = *[2,6] =
46.45 1.366
h(Promedio)=
4.118
De igual modo procedemos para el cálculo del variograma experimental, en el intervalo 4,12.
N(h) =
30
*=(Z(x+h)-Z(x))2 =
118.2
*[2,6] =
1.97
h(Promedio)=
7.767
Con el mismo procedimiento se continúa calculando los variogramas experimentales par los intervalos 6,18, hasta el 18,54. Los resultados se presentan en el siguiente cuadro. _________
70
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Resumen de resultados del variograma experimental *(h)
h(promedio)
4 8 12 16 20 24 28 32
Intervalo [i j] 2 6 4 12 6 18 8 24 10 30 12 36 14 42 16 48
1.366 1.97 2.444 2.357 2.362 2.642 2.824 2.623
4.118 7.767 11.7 15.37 18.75 22.55 25.41 27.71
36
18
2.811
29.62
h
54
Figura 4.52: Variograma con malla irregular a lo largo de una galería. Calculo a malla irregular en dos dimensiones R2: En estos casos tenemos dos variables principales a definir, la tolerancia en distancia y el incremento angular del vector h, para definir el intervalo o sector a ser utilizado. Para cada dirección del vector h, se define una tolerancia angular y una tolerancia en distancia h. la elección de y h, depende de la distribución espacial de los datos y de la práctica, en algunos casos la practica recomienda utilizar = 22.5o y h = 0.5(h), donde el valor de h, empieza tomando la distancia mínima, llamada paso, para el cálculo de *(h).
Figura 4.53: método de los sectores para el cálculo de *(h). __________
4 Análisis Estructural de Datos
71
Las muestras que caen en el sector, estarán aproximadamente a la distancia h de la muestra de origen del vector, formando los pares correspondientes. Conforme crece el vector h, el ángulo se abre, el sector se hace grande y la aproximación tiende a ser grosera. Algunos software computacionales definen otro tipo de zona para evitar este problema (método del lápiz), considerando una distancia ¨d¨, llamada ancho de banda.
Figura 4.54. Aproximación para h grande.
En estos casos, se definen los parámetros , h y d. para formar los sectores en función a las distancias que va tomando el vector h.
Figura 4.55. Formación de sectores de acuerdo a la distancia de h. _________
72
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Aplicado al cálculo del variograma experimental para una data de un yacimiento, los sectores que se van formando para cada valor del vector h, se desplazan a lo largo de la dirección elegida para el cálculo de *(h).
Figura 4.56. Desplazamiento de los sectores diseñados, para cada distancia de h y en la dirección de cálculo de *(h). El método de los sectores, se puede generalizar al espacio de tres dimensiones.
Figura 4.57. Aproximación en el espacio de tres dimensiones: especie de cono.
Figura 4.58. Compósitos en el espacio de tres dimensiones, con leyes de cobre en una mina a tajo abierto. __________
4 Análisis Estructural de Datos
73
Ejemplo1: En el siguiente mapa se muestran las leyes de alcalinos en un banco de una mina de hierro. Calcular el variograma experimental.
Figura 4.59. Mapa de datos con leyes de alcalinos de un banco de una mina de hierro.
Utilizamos el programa Variowin para el cálculo del variograma experimental, en diferentes direcciones. Parámetros de cálculo: Dirección de calculo oo (E-W) Distancia mínima para el vector h= 10 m. Tolerancia en distancia 5 m. Tolerancia angular = 22.5o Algoritmo de cálculo:
_________
74
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 4.60. Variograma experimental en la dirección E-W.
Parámetros de cálculo en la dirección de 90o Distancia mínima para el vector h= 10 m. Tolerancia en distancia 5 m. Tolerancia angular = 22.5o Algoritmo de cálculo:
Figura 4.61. Variograma experimental en la dirección N-S.
__________
4 Análisis Estructural de Datos
Parámetros de cálculo en la dirección de 45o Distancia mínima para el vector h= 10 m. Tolerancia en distancia 5 m. Tolerancia angular = 22.5o Algoritmo de cálculo:
Figura 4.62. Variograma experimental en la dirección N-E.
Parámetros de cálculo en la dirección de 135o Distancia mínima para el vector h= 10 m. Tolerancia en distancia 5 m. Tolerancia angular = 22.5o Algoritmo de cálculo:
_________
75
76
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 4.63. Variograma experimental en la dirección N-W.
Los variogramas experimentales de las leyes de alcalinos del yacimiento de hierro, tienen una caracterización isotrópica, por lo que podemos calcular el variograma omnidireccional. Variograma Omnidireccional en la dirección E-W. Distancia mínima para el vector h= 10 m. Tolerancia en distancia 5 m. Tolerancia angular = 90o Algoritmo de cálculo:
Figura 4.64. Variograma Omnidireccional en la dirección E-W. __________
4 Análisis Estructural de Datos
77
La nube variográfica Dada una cierta dirección, la nube variográfica consiste en graficar, para una dirección dada, el valor de todas las diferencias:
en función de la distancia entre los puntos xi y xj .
En la figura 4.65 se ha representado la nube variográfica correspondiente a leyes de alcalinos en una mina de hierro, en la dirección de azimuth 45°, con tolerancia angular de 22.5°. Esta herramienta permite detectar la influencia de algunos datos anómalos en el cálculo del variograma. Estos datos podrían ser filtrados en la variografía.
Figura 4.65: Nube variográfica. El dato anómalo 1.51 es el responsable de las diferencias que están en la elipse de la derecha.
4.12.
MAPA DE VARIOGRAMA
Es una herramienta que permite determinar las direcciones de anisotropía de la variable en estudio, para lo cual se define la malla (2n +1)*(2n +1), el valor del lag h y asignar a cada bloque el valor de *(h).
_________
78
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 4.66: Diseño de la malla para el mapa.
Figura 4.67: Mapa de variograma mostrando el caso de anisotropía. 4.13.
ANISOTROPÍAS
Generalmente cuando el variograma experimental es calculado en distintas direcciones presenta distintos comportamientos con la variación de la distancia. Anisotropía Geométrica. Anisotropía Zonal. Anisotropía Híbrida. __________
4 Análisis Estructural de Datos
79
Anisotropía Geométrica Es aquella en la que el variograma en distintas direcciones presenta el mismo sill pero rangos distintos Mayor continuidad espacial en la dirección de mayor rango. Menor continuidad espacial en la dirección de menor rango
Figura 4.68: Variogramas, mostrando la anisotropía geométrica.
Anisotropía Zonal Es aquella en la que el variograma en distintas direcciones presenta el mismo rango pero diferente sill . Presencia de diferentes estructuras
Figura 4.69: Variogramas, mostrando la anisotropía zonal.
_________
80
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Anisotropía Hibrida
Es aquella en la que el variograma en distintas direcciones presenta rangos diferentes y distintos sill.
Presencia de diferentes estructuras Característico de variogramas horizontales y verticales
Figura 4.69: Variogramas, mostrando la anisotropía hibrida.
4.14.
PROBLEMAS MÁS COMUNES ENCONTRADOS EN EL CÁLCULO DEL VARIOGRAMA De lo expresado hasta aquí, además de lo planteado en muchos textos de geoestadística, se puede obtener la impresión de que es fácil el cálculo del variograma experimental. La fuente de problemas que se pueden presentar en la realización del un análisis estructural es muy variada, lo que está en correspondencia con la variedad de casos que se resentan en la naturaleza. Algunos de los problemas más comunes discutidos son: El valor idóneo del incremento h: Una inadecuada selección de h puede proporcionar un variograma errático, aunque no se puede dar un criterio exacto o aproximado sobre cual el mejor valor de h, es recomendable recalcular *(h) para distintos valores de h, hasta encontrar una forma suavizada del mismo. Distribuciones con valores extremos: La existencia de valores extremos, altos o bajos, en una distribución, puede conducir a la obtención de un variograma fuertemente errático. En este caso la solución puede ser simple, eliminar los datos extremos, porque pueden ser ocasionados por errores, en otros casos pueden encontrarse en zonas geográficamente distintas y pueden ser tratados de manera separada. Una herramienta útil para la detección de valores extremos y encontrar el incremento adecuado puede ser, calculado la "Nube de Variogramas", el cual consiste en representar los valores de [Z(xi+h)-Z(xi)]2/2 contra h, para cada par posible de la información inicial. La existencia de poblaciones mixtas: Existen datos que pueden mostrar diferentes poblaciones, los cuales pueden estar estadísticamente diferenciados. En muchos casos las poblaciones __________
4 Análisis Estructural de Datos
81
están geográficamente diferenciadas, donde se recomienda tratar las zonas por separado. En otros casos las poblaciones se presenten mezcladas geográficamente, en este caso una solución puede ser un cambio de escala, con lo que se logra reducir la diferencia de los valores extremos. Se presentan otras razones por los que los variogramas son erráticos, las cuales son: 1.- No hay suficientes muestras. 2.- Las muestras no son representativas del fenómeno. 3.- Las clasificaciones de las muestras no son válidas. 4.- El área estudiada es no homogénea. 5.- Pequeños o largos conjuntos de datos son necesarios. 6.- Pequeñas o largas distancia deben ser calculadas. 7.- Más o menos distancias deben ser calculadas. 8.- Pequeñas tolerancias son necesarias. 9.- Las muestras pueden tener localizaciones incorrectas. 10.- Los valores muestreados pueden ser erróneos. El problema fundamental en la obtención de un variograma correcto es, la elección adecuada de los intervalos de distancias para los cuales será calculado el variograma, de modo que en éstos la cantidad de pares encontrados sea suficiente desde el punto de vista estadístico.
_________
CAPÍTULO 5 MODELAMIENTO DE VARIOGRAMAS 5.1. MODELADO DE VARIOGRAMAS El modelado de variogramas incluye dos etapas fundamentales, una vez construido el variograma experimental o empírico es necesario ajustar a este un modelo teórico, con el objetivo de determinar los parámetros descriptivos del variograma que posteriormente serán usados en la estimación. 5.2. PARÁMETROS DEL VARIOGRAMA Los parámetros del variograma caracterizan tres elementos importantes en la variabilidad de un atributo que son: la discontinuidad en el origen (existencia de efecto de pepita), el valor máximo de variabilidad (meseta), y el área de influencia de la correlación (alcance), (figura 5.1). Como se presentan y se describen a continuación.
Figura 5.1: Parámetros del variograma. El Efecto Pepita (Nugget): El variograma por definición es nulo en el origen, pero en la práctica las funciones obtenidas pueden presentar discontinuidad en el origen, a esta discontinuidad se le llama efecto de pepita, en ingles (Nugget effect). Puede ser obtenido trazando una línea recta entre los primeros puntos del variograma empírico y extender ésta hasta que se intercepte con el eje Y. Si esta intersección ocurre por debajo de cero, el valor asumido por este efecto es cero, pues valores negativos de g (0) no tienen significado y no es común. El efecto pepita se representa como Co. La Meseta (Sill): Es el valor de (h) para el cual con el aumento de h su valor permanece constante, se representa como (CT = C + Co) y se denomina meseta. Puede obtenerse trazando una línea paralela a la abscisa y que se ajuste a los puntos de mayor valor del variograma y su valor se lee en la intersección de esta línea con la ordenada. El Alcance (Range): La distancia h para la cual las variables Z(x) y Z(x+h) son independientes, se denomina alcance y se representa por (a), es decir, las distancias para la cual los valores de la variable dejan de estar correlacionados, o lo que es lo mismo, la distancia para la cual el variograma alcanza su meseta.
- 82 -
5
Modelamiento de Variogramas
83
El alcance siempre tiene valor positivo y puede ser obtenido a partir de la intersección de las líneas descritas en los puntos anteriores, ese punto leído en la abscisa es una fracción del propio alcance, fracción que se detallara posteriormente en la explicación de los modelos teóricos. 5.3. MODELOS TEÓRICOS DE VARIOGRAMAS Los modelos teóricos de variogramas admisible o autorizados más utilizados en la práctica se presentan, atendiendo a las dos características más importantes en el modelado de variogramas que son: 1.- Su comportamiento en el origen, el cual puede ser linear, parabólico y con Efecto de Pepita y 2.- La presencia o ausencia de meseta. Estos modelos son: Efecto Pepita Puro: Corresponde a un fenómeno puramente aleatorio (ruido blanco), sin correlación entre las muestras, cualquiera sea la distancia que las separe, (figura 5.2), donde S representa el valor de la meseta.
0 h s
si h 0 si h 0
Figura 5.2: Modelo Efecto Pepita Puro. Modelo Esférico: Este modelo es probablemente el más utilizado, es una expresión polinomial simple, en su forma representada en la figura 5.3, se puede observar un crecimiento casi lineal y después a cierta distancia finita del origen se alcanza una estabilización, la meseta. La tangente en el origen encuentra a la meseta en el punto de abscisa (2/3)a, donde a representa el valor del alcance.
_________
84
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 5.3: Modelo Esférico. Modelo Cuadrático:
Figura 5.4: Modelo Cuadrático. Modelo Exponencial: Este modelo a diferencia del esférico crece inicialmente más rápido y después se estabiliza de forma asintótica (figura 5.5). Como la meseta no se alcanza a una distancia finita, se usa con fines prácticos el "alcance efectivo" o "alcance práctico" a´, valor que se obtiene en el punto de abscisa para el cual el modelo obtiene el 95% de la meseta, con un valor a´=3a, donde a es el parámetro de escala. La tangente en el origen encuentra a la meseta en el punto a=(1/3)a´.
|h| > 0
__________
5
Modelamiento de Variogramas
85
Figura 5.5: Modelo Exponencial.
Modelo Gaussiano: Este es un modelo extremadamente continuo (figura 5.6), inicialmente presenta un comportamiento parabólico en el origen, después al igual que en el modelo Exponencial se alcanza la meseta de forma asintótica. El alcance práctico tiene un valor de a´=1.73a, que es el valor de la abscisa donde se alcanza el 95% de la meseta.
|h| > 0
Figura 5.6: Modelo Gaussiano.
Modelo con Función Potencia: Este es un modelo sin meseta, su forma se representa en la figura 5.7, para valores de a correspondientes a 0.5, 1.0 y 1.5. (h)
_________
= |h| con ]0, 2[
86
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 5.7: Modelo con Función Potencia.
Para el valor de =1 en el modelo anterior se obtiene el modelo Lineal, al cual no tiene ni meseta ni alcance. Ahora por efectos prácticos, sin embargo, muchos programas informáticos denotan la pendiente del modelo lineal con la relación S/a (figura 5.8). (h) = (S/a) |h|
Figura 5.8: Modelo Lineal. Modelo Cúbico: Con rango o alcance a, meseta igual a S, comportamiento cuadrático en el origen y representa fenómenos bastante continuos.
__________
5
Modelamiento de Variogramas
87
Figura 5.9: Modelo Cúbico. Modelo Seno Cardinal: La meseta alcanza asintóticamente, rango aparente igual a a, rango experimental igual a 3a, comportamiento cuadrático en el origen. Se utiliza para representar fenómenos continuos con periodicidades.
Figura 5.10: Modelo Seno Cardinal.
Se han presentado los modelos más usados en la práctica, aunque se debe señalar, existen otros modelos que son ampliamente descritos en el manual de referencias del sistema geoestadístico Isatis. Estos modelos pueden ser ajustados individualmente, aunque es posible encontrar en la práctica aplicaciones donde a los variogramas experimentales se les debe ajustar más de un modelo teórico, es decir, a través de superposición, nombrándose estructuras imbricadas.
_________
88
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
La selección del modelo y los parámetros apropiados a las características del variograma empírico, para ser usados en la interpolación geoestadística que veremos posteriormente es el punto más importante en el proceso planteando, además, esta selección es fundamental en el caso particular de la minería donde se presentan yacimientos: con irregularidad en la densidad de barrenos; sin una adecuada perforación; con alta asimetría en la distribución o que carecen de un modelado geológico propio. Al respecto se refieren muchos autores sobre el efecto negativo que puede tener en la estimación el uso del krigeaje sin un estudio de estructura espacial y la selección adecuada del modelo de variograma y sus parámetros.
5.4. MODELAMIENTO DEL VARIOGRAMA EXPERIMENTAL El objetivo de ajustar un modelo teórico es disponer de una ecuación, la cual se utilizará en los cálculos posteriores. En general, los paquetes computacionales trabajan exclusivamente con el modelo teórico. Distinguiremos dos variogramas.
El variograma experimental, calculado a partir de los datos.
El variograma teórico, que corresponde a una ecuación que se ajusta al variograma experimental:
Figura 5.11: Variograma Experimental y Teórico. Es evidente que el variograma teórico debe respetar al variograma experimental, sobre todo en los primeros puntos, que son más confiables. El ajuste de variogramas constituye un punto crucial en un estudio geoestadístico porque todos los cálculos posteriores se harán utilizando exclusivamente el modelo teórico. Para tener un buen ajuste, hay que considerar que uno de los objetivos finales es la estimación de leyes de bloques (modelo de bloques), dentro de una cierta vecindad restringida de manera de no considerar demasiadas muestras para estimar la ley de cada bloque, cuyo modelo es fundamental para la planificación minera.
__________
5
Modelamiento de Variogramas
89
Figura 5.12: Modelo de bloques. En el siguiente modelo tridimensional de bloques, existen tres unidades geológicas (a bloque completo).
Figura 5.13: Modelo tridimensional de bloques. Si la vecindad de búsqueda es circular o esférica, sólo se utilizará la función (h) hasta una distancia máxima de IhI= 2R; luego conviene ajustar (h) hasta IhI = 2R. Para estimar el bloque de la siguiente figura, solo se utilizan los compósitos que están dentro del círculo de radio R.
Figura 5.14: Vecindad de estimación. En el caso de la figura siguiente, si se usa una vecindad restringida, ambos modelos darán los mismos resultados; pero el modelo 2 es más simple y más fácil de ajustar:
_________
90
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 5.15: Modelos de variograma. Ajuste automático El ajuste de modelos de variogramas se puede realizar también de forma automática. Esta ha sido presentada por varios autores, en la que se sugieren una forma particular de aplicar el método de los mínimos cuadrados y así obtener el modelo y sus parámetros, teniendo en cuenta que el modelo obtenido sea definido positivo, como ya se ha indicado. Existen varios métodos para estimar los parámetros del variograma entre visuales y automáticos. Ahora, el ajuste realizado de forma automática no tiene porque reportar mejores resultados en el proceso de estimación, recomendándose validar el modelo seleccionado de acuerdo al estimador a utilizar. Un criterio decisivo, independiente de la forma utilizada en la elección del modelo teórico y sus parámetros, es si lugar a dudas, emplear el método de la validación cruzada con el estimador a utilizar en el proceso de estimación. 5.5. CASOS DE ESTUDIO Ejemplo Nº 1: Data de 75 000 taladros de voladura.
Figura 5.16: Variograma experimental ajustado al Modelo Esférico.
__________
5
Modelamiento de Variogramas
91
Ejemplo Nº 2: Data de sondajes de una mina de cobre explotado por el método de block caving, donde se ha calculado el variograma experimental en la dirección N-S.
Figura 5.17: Variograma experimental ajustado al Modelo Exponencial.
Ejemplo Nº 3: Retomando el caso del ejemplo Nº 1 del capítulo anterior, cuyo variograma experimental omnidireccional, calculado en la dirección E-W, se presenta en la figura Nº 4.64. Se pide modelar este variograma. Luego de haber utilizado el método de prueba error prueba y el programa Variowin. Donde se han efectuado varias corridas con diferentes modelos y parámetros, elegimos el modelo exponencial, por representar el mejor ajuste al variograma experimental.
Figura 5.18: Variograma Omnidireccional ajustado al Modelo Exponencial.
Parámetros
_________
a
=
78.096
c1
=
80
Co
=
0.001047
92
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
AJUSTE EN EL ESPACIO DE DOS Y TRES DIMENSIONES En la practica se dispone de un conjunto d variogramas 1(h), 2(h),…., k(h) correspondientes a las direcciones 1, 2,….., k.
Figura 5.19: Direcciones de cálculo de los Variogramas. Análisis de anisotropía Conviene aquí realizar un análisis sobre el comportamiento de la variabilidad del atributo en estudio. Se conoce que el variograma describe las características de continuidad espacial de la variable regionalizada en una dirección, pero este comportamiento puede variar según la dirección que se analice. Se exige por este motivo un análisis del comportamiento de la continuidad en distintas direcciones, el Análisis de Anisotropía. Cuando el variograma calculado en diferentes direcciones (norte-sur, este-oeste, y en direcciones intermedias de 45º o de 22.5º, con tolerancia de 22.5o), muestra similar comportamiento, se dice que el fenómeno es Isotrópico, cuando muestran diferentes comportamientos es Anisotrópico. Los tipos de anisotropías más comunes son la Geométrica y la Zonal. Caso Isotrópico Es el cao más simple y se cumple que:
Se utiliza entonces como modelo general el variograma ajustado al variograma omnidireccional:
En esta notación:
__________
5
Modelamiento de Variogramas
93
En el caso estudiado de la figura 4.64, el modelo isotrópico ajustado es:
Con otra notación, puede ser:
Caso Anisotrópico En este caso los variogramas direccionales, son en general diferentes:
En la práctica se distinguen dos tipos de comportamiento anisotrópicos del variograma. Anisotropía Geométrica: Se produce cuando los diversos variogramas pueden reducirse a un variograma isótropo mediante una transformación lineal de las coordenadas. El caso más común en la práctica es cuando los variogramas presentan un mismo valor de meseta pero diferentes alcances:
Figura 5.20: Elipse de anisotropía geométrica (Rosa de alcances) En la figura se ha representado una anisotropía geométrica (en el caso isótropo lo anterior sería un círculo). Sea k = a1/a2 > 1 la razón entre el alcance mayor y menor. Las fórmulas de transformación de coordenadas nos muestran que:
_________
94
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
ϕ es el ángulo formado entre el eje x y el eje x' de la elipse. γ1 es el variograma de la dirección 1. k = a1/a2. En el caso de un variograma lineal con diferentes pendientes: (h) =ω(θ ) | h | se procede de manera análoga, utilizando la elipse de pendientes o de inversos de pendientes. En el caso del ejemplo de la figura 4.34 del capitulo anterior, se puede suponer en primera aproximación, que el eje de la elipse coincide con los ejes de las coordenadas:
Aplicando la fórmula anterior, con = 0,
Anisotropía Zonal: En este caso la anisotropía no puede ser reducida por una transformación lineal simple de las coordenadas.
Figura 5.21: Anisotropía Zonal.
Se define entonces el modelo de anisotropía zonal como un modelo anidado (o imbricado), es decir: γ (h) =γ 1(h1) +γ 2 (h2 ) +...
__________
5
Modelamiento de Variogramas
95
En que cada constituyente puede representar su propia anisotropía. Por ejemplo, en un yacimiento sedimentario el variograma vertical puede ser muy diferente al variograma horizontal:
Figura 5.22: Ejemplo de Anisotropía Zonal. Se puede utilizar en este caso un modelo del tipo:
En que:
Y hz corresponde a la dirección vertical. Efecto proporcional Cuando en el cálculo del variograma se detecta que existe una relación lineal entre el valor medio de las muestras usadas en el cálculo de cada (h) y la desviación estándar correspondiente, se dice que existe un efecto proporcional (heterosedasticidad). Este efecto se puede detectar ploteando los valores de Xm contra s , es decir, que el coeficiente de variación (s /Xm) sea aproximadamente constante, ocurre cuando los datos presentan una distribución lognormal. (figura 5.23).
Figura 5.23: Efecto proporcional.
_________
96
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
La solución a este problema consiste en dividir cada valor del variograma local por el cuadrado de la media local, y obtener lo que se conoce como variograma relativo. F(h) = (h)/Xm2(h)
Puede ser calculado usando los pasos anteriormente presentados para el cálculo de los variogramas tradicionales. Existen otras medidas de la continuidad espacial descritas en Journel y Huijbregts (1978) y Pannatier (1993), las cuales permiten un análisis estructural detallado con diferentes objetivos. 5.6. PROBLEMAS EN EL MODELAJE DE VARIOGRAMAS Los problemas más comunes al modelar variogramas que complican este proceso. Se analizan los siguientes casos. 1.- La anisotropía geométrica está presente: Indica que los variogramas direccionales tienen la misma meseta pero diferentes alcances, ésta puede ser corregida a través de una transformación linear de coordenadas que permita reducir una elipse a un círculo. 2.- La anisotropía zonal está presente: indica que tanto las mesetas como los alcances son diferentes para los variogramas direccionales, puede ser corregido separando el variograma en sus componentes isotrópicos horizontal y anisotrópico vertical. 3.- La tendencia de los datos está presente: indica que los valores medidos aumentan o disminuyen dramáticamente en la zona estudiada con el aumento de la distancia. Esto puede ser resuelto aplicando polinomios a la ecuación del variograma, es decir un análisis de tendencia. 4.- El efecto proporcional está presente: Indica que la desviación estándar local es proporcional al cuadrado de la media local y que los datos presentan una distribución lognormal, puede ser resuelto dividiendo cada valor del variograma local por el cuadrado de la media local, es decir usando variogramas relativos. 5.- Existencia de estructuras anidadas: indica que diferentes procesos operan a diferentes escalas, como por ejemplo alguno o todos los siguientes: A muy pequeñas distancias la variabilidad puede estar presente debido a cambios de una composición mineral a otra. A pequeñas distancias la variabilidad puede estar presente debido a errores. A grandes distancia la variabilidad puede estar presente debido a casos transitorios de desgaste mineral. El cual puede ser resuelto aplicando varios modelos simultáneamente. 6.- Existencia de efecto hueco: indica que muy pocos pares están disponible para la comparación a una distancia específica. Y puede ser resuelto recuperando más casos para la distancia definida. 7.- La periodicidad está presente: indica que el comportamiento del variograma repite por sí mismo periodicidades, por ejemplo: El valor de la meseta puede aumentar o disminuir sistemáticamente, o un caso en que los valores son tomados alternativamente a través de diferentes estratos, como piedras areniscas, esquistos, etc. Esto puede ser resuelto si es un problema real y __________
5
Modelamiento de Variogramas
97
no un antifaz del análisis, la periodicidad puede ser también un fenómeno real mostrado por zonal ricas y pobres repetidas a espacios similares. 5.7. VALIDACIÓN DEL MODELO TEÓRICO Como el ajuste de los modelos teóricos al variograma experimental, se realiza de forma visual o interactiva, variando los valores Co (efecto de pepita), C + Co (meseta) y a (alcance), hasta coincidir con los parámetros que mejor se ajustan, es conveniente validar el modelo seleccionado y los parámetros meseta y alcance escogidos. El método de validación cruzada ha sido ampliamente utilizado para evaluar el grado de bondad de un modelo de variograma y reconocido como un método óptimo de estimación de sus parámetros. La operación de validar un variograma teórico ajustado a uno experimental siempre toma mucho tiempo, éste se considera como el último de los pasos importantes del análisis de variabilidad, debido a que una vez obtenido este resultado será utilizado en la estimación por krigeaje en cualquiera de sus variantes. Validación cruzada Sea Z(x) una función aleatoria estacionaria con variograma (h), su función de covarianza C(h) viene dada por C(h) = s 2 - (h) donde s 2 es la varianza de Z(x). Sea Zx1, Zx2,...,Zxn los valores de Z(x) en n puntos medidos. La validación cruzada consiste en suprimir el i-ésimo valor medido Z(xi) y estimarlo a partir del resto de los datos. El valor estimado Z*(xi) se calcula por krigeaje, procedimiento explicado más adelante. Si se repite este proceso para los N puntos, se pueden calcular n errores de validación: E(xi) = Z*(xi)- Z(xi) i = 1, 2, . . . , N. Así se van probando diferentes valores de los parámetros del variograma hasta que los errores de validación cumplen los siguientes criterios estadísticos: 1. El error medio, dado por T1 = (1/n) å i=1,n [Z(xi) - Z*(xi)], debe ser aproximadamente igual a cero. 2. El error medio cuadrado, dado por T2 = (1/n) å i=1,n [Z(xi) - Z*(xi)]2, debe ser pequeño. 3. La medida, T3 = (1/n) å i=1,n { [Z(xi) - Z*(xi)]/s } 2, debe ser igual a uno. 4. La medida, T4 = Corr{ [Z(xi) - Z*(xi)]/s , Z*(xi)} , debe ser cero. 5. La medida, T5 = Corr{ Z(xi), Z*(xi)} , debe ser uno. Otros autores sólo plantean que las medidas fundamentales son la indicada por T1 y T3.
_________
CAPÍTULO 6 VARIANZA DE ESTIMACIÓN 6.1. ENUNCIADO DEL PROBLEMA: Sea un bloque o zona V y un conjunto de datos z(x1), z(x2), . . . , z(xN), en que: xi
=
coordenada del dato z(xi)
z(xi)
=
ley en el punto xi
Figura 6.1: Volumen a estimar. Localización de las muestras.
N = Nº de datos No se conoce la ley media de V: zV En la práctica, se estima la ley media desconocida por una fórmula lineal del tipo:
zˆV α1 z(x1 ) α 2 z(x2 ) ... α N z(xN ) En que los αi verifican la condición de insesgado:
α 1 α 2 ... α N 1 Los pesos αi dependen del método de estimación utilizado: - 98 -
5
Modelamiento de Variogramas
99
1
αi
MEDIA ARITMÉTICA N
Si
αi POLÍGONOS S 1 d ik i N 1 k i 1 d i
INVERSO DISTANCIA
Se supone, entonces, que los i son conocidos. 6.2. EL ERROR DE ESTIMACIÓN Expresada como:
ε zˆV zV en
que zˆV es la ley estimada (conocida) y zv es la ley real (desconocida).
Mencionemos que es equivalente definir el error como:
ε Zv - zˆV Debido a que zv es desconocido, entonces
ε es desconocido.
Renunciamos entonces a co-
nocer el error en signo y magnitud. Sin embargo, se puede caracterizar probabilísticamente el error
ε , al utilizar el modelo matemático.
Asumimos entonces que ε es una magnitud aleatoria, es decir una variable aleatoria. Esta magnitud es decir, una magnitud aleatoria tiene una cierta ley de probabilidad caracterizada por una esperanza matemática mE y una varianza E2 Respecto de la ley de probabilidad del error, asumimos que: La ley de probabilidad del error es la ley normal o de Gauss . En Geoestadística esta aproximación es razonable, pero se pueden utilizar otras aproximaciones tales como la desigualdad de Chebichev
_________
100
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 6.2: Densidad de probabilidad de la ley normal o de Gauss.
Conviene recordar las siguientes áreas de la ley de Gauss:
Figura 6.3: Ley normal. σ es la desviación estándar.
Figura 6.4: Ley normal, regla de los dos sigma. Es el caso más utilizado en la práctica.
__________
5
Modelamiento de Variogramas
101
Figura 6.5: Ley normal, regla de los tres sigma.
En otras palabras, utilizando probabilidades: P(m - σ ≤ ε≤ m + σ)
=
0.68
P(m - 2σ ≤ ε≤ m + 2σ)
=
0.95
P(m - 3σ ≤ ε≤ m + 3σ)
=
0.997
6.3. ANÁLISIS DE PARÁMETROS Estudio de mE: En términos teóricos: mE = E(ε) Este valor es nulo porque los errores se compensan (siempre que el método de estimación verifique la condición de insesgado α = 1). Luego:
mE 0 2
Estudio de σ E En términos teóricos
σ 2E = E[(ε – mE )2 ] = E [ε2 ] σ 2E = E [ε2 ] La Geoestadística demuestra que se puede calcular numéricamente el valor de
_________
σ2E
102
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Luego, el problema está resuelto. Según las propiedades de la Ley de Gauss, podemos afirmar que: P(m - σ ≤ ε≤ m + σ) = 0.68
(i)
P(m - 2σ ≤ ε≤ m + 2σ) = 0.95
(ii)
P(m - 3σ ≤ ε≤ m + 3σ) = 0.997
(iii)
En la práctica se utiliza frecuentemente la ecuación (ii); es decir, se admite un riesgo de equivocación del 5%. En otras palabras:
-2σ ≤ ε≤ m + 2σ con 95% de confianza o bien, se puede afirmar, con 95% de confianza que la ley verdadera es igual a la ley estimada ± dos sigma (regla de las dos sigmas):
zV zˆV 2 σ E
(con 95% de confianza)
Si usted no cree en esta aproximación gaussiana utilice la desigualdad de Chebychev, la cual establece que, cualquiera que sea la variable aleatoria ε :
Existe una desigualdad aún mejor, llamada desigualdad de Gauss, la cual establece, en nuestras condiciones que (ver Cramer, 1955):
En resumen el problema radica en el cálculo n umérico de σ 2 E o de la desviación estándar.
σE
=
6.4. CÁLCULO DE LA VARIANZA DE ESTIMACIÓN 2 σ : Cálculo de E
Sabemos que:
σ 2E = E [ε2 ]= E [(zˆV – ZV)2] Por otra parte:
__________
5
Modelamiento de Variogramas
103
(La ley real desconocida se calcula, en el caso de ser posible, por el promedio de las leyes de todos los puntos x dentro de V). La integral anterior puede ser simple, doble o triple. Luego el error es la diferencia entre una sumatoria y una integral:
Al desarrollar te:
ε2 y tomar luego la esperanza matemática, se demuestra la fórmula siguien-
Esta fórmula fundamental para el cálculo de la varianza, también puede escribirse en términos del variograma, de la siguiente manera: σ2E = 2(v,V) - (V,V) - (v,v) Por ejemplo, si se calculan con esta fórmula las varianzas del error para los tres casos de la figura 6.6, se tendrán las desigualdades:
Figura 6.6: Varianza del error en tres casos.
En la expresión de σ2E (en notación condensada)
(p, q) significa el valor numérico de (h)
(modelo o ecuación), siendo h el vector que une los puntos p y q:
Figura 6.7: Vector que une los puntos p y q.
_________
104
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Antes de explicar cómo se calculan los términos en forma numérica, observamos que depende de: N xi V (h)
σ2E
es decir, el número de datos. es decir, las coordenadas de los datos. es decir, la geometría y el tamaño del bloque o zona V. es decir, de la regularidad o irregularidad de las leyes.
αi
es decir, del método de estimación.
Significado de los términos en la expresión de σ2E : En la expresión anterior xi representa las coordenadas de los datos; x (ó y) representa un punto variable dentro del bloque (o zona) V. En el cálculo de la fórmula fundamental se supone que se conoce el modelo de variograma. i) Término
(xi, xj):
Representa el valor de
(h) siendo h el vector que une los pun-
tos xi y xj:
Figura 6.8: Vector que une el dato en xi con el dato en xj
ii) :
Término: Representa el valor medio de la función (h) (h es el vector que une xi con x), siendo x un punto variable dentro de V:
Figura 6.9: El punto xi es fijo, el otro punto es variable dentro de V.
__________
5
Modelamiento de Variogramas
105
En la práctica la integral anterior se calcula por discretización de V en k puntos Entonces, la aproximación es:
Esta aproximación es mejor cuando el número k de puntos dentro de V es más grande. La práctica recomienda un número mínimo de puntos dentro de V de manera de obtener una precisión aceptable i)
Si V es bidimensional:
k ≥ 36 ptos.
ii)
Si V es tridimensional:
k ≥ 64 ptos.
Se puede tomar un valor de k superior a los recomendados, pero los procesos computacionales serán más lentos. iii)
Término :
Representa el valor medio de la función
(h)
(h es el vector que une x con y) siendo x e y
dos puntos variables dentro de V:
Figura 6.10: El punto x y el punto y describen independientemente l conjunto V.
Esta integral también se calcula por discretización de V en k puntos. Entonces, la aproximación es:
El cálculo numérico de σ2E es entonces posible. Se puede utilizar un programa computacional para calcular σ2E o bien 2 σ E 6.5. CASOS DE ESTUDIO Ejemplo Nº 1: En el yacimiento isótropo de la figura 4.64 , se tiene que: _________
106
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
(hx,hy) = 0.417 raíz
cuadrada(hx2,
h2y)
Individualizamos el bloque siguiente:
Figura 6.11: Bloque con N=2 muestras.
a) Si se estima zV por zV = 0.5 Z(x1) + 0.5 Z(x2) = 38, un cálculo computacional proporciona: 2 σ E = 3.02 Luego: zV = 38 3.02 (con 95% de confianza) b) Si se estima zV por zV = 1 z(x1) = 35, se obtiene: 2 σ E = 2.84 Luego: zV = 35 2.84 En este caso se utilizó un solo dato (contra 2 del caso anterior) y sin embargo se obtuvo un error menor. La razón de esta aparente paradoja es que en el caso a) se utilizó mal la información de los sondajes, atribuyéndoles a ambos el mismo peso 0.5. Es evidente que el dato z(x1) debe tener mayor peso que el dato z(x2). c) Si se estima zV por zV = 0.75 z(x1) + 0.25z(x2) = 36.5, se obtiene 2 σ E = 2.38. Luego: zV = 36.5 2.38 Como este error (con confianza del 95%) es menor que los dos anteriores, se elimina la paradoja. Este ejemplo nos lleva a la conclusión que no basta con tener datos sino que hay que utilizarlos bien (es decir, ponderarlos en forma adecuada). Sin embargo, nos queda una inquietud (que responderemos en el capítulo siguiente): ¿Existe otra ponderación de los datos que nos proporcione un error menor? Observaciones: 1 La fórmula para el cálculo de la varianza de estimación o varianza del error σ
2 E
__________
5
Modelamiento de Variogramas
107
σ2E = 2(v,V) - (V,V) - (v,v) No depende de las leyes z(x1), z(x2), . . . , z(xN) utilizadas en el estimador ZV = αiz(xi) (en estricto rigor sí depende porque estas leyes se utilizaron en el cálculo de (h) ). Por consiguiente, se puede calcular la varianza del error en el caso de agregar uno o más sondajes adicionales. Se puede entonces cuantificar la ganancia de precisión que aportaría un reconocimiento suplementario. 2. Nos podríamos plantear el problema inverso: Suponer que en el estimador ZV = αiz(xi) los pesos
αi
son desconocidos y definir un criterio para calcularlos.
Intuitivamente vemos que el criterio debería ser: "encontrar los pesos 2 de minimizar σ E. Esta es la idea del método del krigeado.
αi
de manera
Ejemplo Nº 2: el análisis variográfico para un yacimiento, nos da el siguiente resultado. EW NS NW NE
DATOS X
Y
LEY
80
40
10g/t
50
70
5g/t
50
40
¿B?
Calcular la varianza de estimación para el bloque de 10x10 mts, cuyo centro de gravedad está en el punto (50,40). Considerar sólo la muestra w1, el estudiante deberá resolver el cálculo de la varianza de estimación con todas las muestras implantadas en el bloque B. Representación gráfica del bloque
Figura 6.12: Bloque para la estimación de la varianza. E2 = 2 (V,B) – BB - VV V = W1 B=B _________
108
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
CÁLCULO DEL TÉRMINO (V,B) = (W1,B) Discretización del bloque “b” (k =9), en bloques de 10 x 10 metros.
Figura 6.13: Discretización de B en 9 Bloques. CÁLCULO DE LA MATRIZ DE DISTANCIAS (POR PITÁGORAS) W1 - B W1
1 25,4951
2 29,1548
3 35,3553
4 15,8114
5 21,2132
6 29,1548
7 7,07107
8 15,8114
9 25,4951
MATRIZ DE VARIOGRAMAS Reemplazando distancia (h) de acuerdo al modelo: NE W1 - B W1
1
2
3
4
5
6
7
8
9
(W1,B)
0,50956 0,53915 0,58563 0,42274 0,47276 0,53915 0,33246 0,42274 0,50956 0,48153
CÁLCULO DEL TÉRMINO (V,B) = (B,B)
Figura 6.14: Distancias dentro de B. __________
5
Modelamiento de Variogramas
109
MATRIZ DE DISTANCIAS DEL BLOQUE ((B,B)) B
1
2
3
4
5
6
7
8
9
1
0
10
20
10
14,142
22,361
20
22,361
28,284
0
10
14,142
10
14,142
22,361
20
22,361
0
22,361
14,142
10
28,284
22,361
20
0
10
20
10
14,142
22,361
0
10
14,142
10
14,142
0
22,361
14,142
10
0
10
20
0
10
2 3 4 5 6 7 8 9
0
MATRIZ DE VARIOGRAMAS (de acuerdo a los modelos) 1 1
0
2
3
4
0,3484 0,4906 0,1946
2 3
0
5
6
0,347
4
8
9
0,4178 0,2793 0,4178 0,4631
0,3484 0,4064 0,1946 0
7
0,347
0,4829 0,2793 0,4178
0,4829 0,4064 0,1946 0,5323 0,4829 0,2793 0
5
0,3484 0,4906 0,1946 0
0,347
0,4178
0,3484 0,4064 0,1946
0,347
6
0
7
0,4829 0,4064 0,1946 0
8
0,3484 0,4906 0
9
0,3484 0
SUMATORIA = 13.198 (B,B) = (13.198 *2)/81 = 0.3254. CALCULO DE (v,v) = (W1,W1) W1 W1
0
(W1,W1) = 0 , debido a que la distancia del vector h = 0 Reemplazando los datos calculados en la formula fundamental para el cálculo de la varianza de estimación, tenemos: E2 = 2 (V,B) – BB - VV _________
110
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
E2 = 2*(0.4815) – 0.3254 – 0 E2 = 0.6376 Ejemplo Nº 2: Se tiene un bloque de 100 X 100 pies, implantado en un yacimiento que sigue un modelo esférico con un efecto pepita de 1, meseta igual 1 y alcance de 100 pies. Calcular la varianza de estimación en base a la siguiente configuración geométrica.
Figura 6.15: Geometría del problema implantado en un modelo de bloques. Modelo Esférico
Varianza de estimación:
Discretización en cuatro bloques de 50 X 50 pies
Figura 6.16: Discretización del bloque. Cálculo del término
W1 W2 W3 W4
=?
W1
MATRIZ DE DISTANCIAS W2 W3
W4
0 100 100 141.42
100 0 141.42 100
141.42 100 100 0
100 141.421 0 100
__________
5
Modelamiento de Variogramas
111
MATRIZ DE DISTANCIAS DE VARIOGRAMAS W1 0 2 2 2
W1 W2 W3 W4
Cálculo del término
W2 2 0 2 2
W3 2 2 0 2
W4 2 2 2 0 Prom:
(v,v) 1.500 1.500 1.500 1.500 1.500
=? MATRIZ DE DISTANCIAS 1 35.36 79.06 79.06 106.07
W1 W2 W3 W4
2 79.06 35.36 106.07 79.06
3 79.06 106.07 35.36 79.06
4 106.07 79.06 79.06 35.36
MATRIZ DE VARIOGRAMAS 1 W1 W2 W3 W4
Cálculo de
1.02 1.88 1.88 2.00
2
3
1.88 1.02 2.00 1.88
1.88 2.00 1.02 1.88
(v,B)
4 2.00 1.88 1.88 1.02 Prom:
1.693 1.693 1.693 1.693 1.693
=? MATRIZ DE DISTANCIAS
1 2 3 4
1 0.00 50.00 50.00 70.71
2 50.00 0.00 70.71 50.00
3 50.00 70.71 0.00 50.00
4 70.71 50.00 50.00 0.00
MATRIZ DE VARIOGRAMAS 1 2 3 4
1 0.00 1.38 1.38 1.77
2 1.38 0.00 1.77 1.38
CÁLCULO DE LA VARIANZA DE ESTIMACION
_________
3 1.38 1.77 0.00 1.38
4 1.77 1.38 1.38 0.00 Prom:
(B,B) 1.129 1.129 1.129 1.129 1.129
CAPÍTULO 7 MODELO DE KRIGING 7.1. INTRODUCCIÓN En términos mineros, la técnica del kriging o krigeado consiste en encontrar la mejor estimación lineal insesgada de un bloque o zona V considerando la información disponible; es decir, las muestras interiores y exteriores a V.
Figura 7.1: Volumen a estimar. El krigeado atribuye un peso λi a la muestra z(xi). Estos pesos λi se calculan de manera de minimizar la varianza del error cometido. Interés del Krigeado El interés del krigeado proviene de su misma definición: al minimizar σE2 estamos seguros de obtener la estimación más precisa posible de V o equivalentemente, de sacar el mejor provecho posible de la información disponible. El nombre krigeado proviene de los trabajos de Daniel Krige en las minas de oro sudafricanas de Rand, en los años 50. La teoría fue formalizada una década más tarde por el geomatemático francés Georges Matheron. El interés práctico más importante del krigeado, proviene, no del hecho que asegura la mejor precisión posible, sino más bien porque permite evitar un error sistemático. En la mayoría de los depósitos mineros, se deben seleccionar, para la explotación, un cierto número de bloques, considerados como rentables y se deben abandonar otros bloques considerados no-explotables. Daniel Krige demostró que, si esta selección se realizara considerando exclusivamente las muestras interiores a cada bloque, resultaría necesariamente (en promedio) una sobreestimación de los bloques seleccionados. La razón de este problema es que el histograma de las leyes reales de los bloques tiene menos leyes extremas, ricas o pobres, luego tiene más leyes intermedias que el histograma calculado con las muestras interiores, y, si se calcula el efecto de
- 112 -
6
Modelo de Kriging
113
una selección sobre este último histograma, los paneles eliminados serán en realidad menos pobres que lo que se había previsto, y los paneles conservados menos ricos.
Figura 7.2: Histograma de bloques y de muestras.
De acuerdo a lo expresado anteriormente, el krigeado define el estimador lineal:
Con la condición de isesgado (llamado también condición de universalidad):
Los pesos i se calculan de manera de minimizar la varianza E2 del error = ZK – ZV, en que ZV es la ley media desconocida de V. Como es natural, el krigeado atribuye pesos altos a las muestras cercanas a V y pesos débiles a las alejadas. Sin embargo, esta regla intuitiva puede fallar en ciertas situaciones en las cuales se habla de efecto de pantalla o de transferencia de influencia. Estudiaremos estos conceptos con un ejemplo: La figura siguiente muestra un bloque que debe ser estimado a partir de 8 muestras S1, S2,…..S8.
Figura 7.3: Transferencia de influencia y efecto de pantalla.
El krigeado encontrará en este caso, suponiendo isotropía espacial:
_________
114
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
1 i
(i = 2, 3, ….., 8)
La muestra S1 es la de mayor peso. 2 , 3 i
(i = 4, 5, …, 8)
Las muestras S2 y S3 tienen mayor peso que las muestras S4, S5, …., S8. 6 0 Se dice que la muestra S5 hace pantalla a la muestra S6. 4 5 + 6 + 7 + 8 Se dice que hay una transferencia de influencia; es decir, la influencia de la muestra S4 se reparte entre las muestras S5, S6, S7 y S8. Se puede afirmar que el krigeado “desagrupa” la información. La menor o mayor intensidad de los efectos anteriores depende, evidentemente, del variograma (efecto de pepita, meseta, alcance). Por ejemplo, si se tiene un variograma lineal isótropo, γ(h)=ω|h| , se tienen los pesos siguientes para estimar el bloque B:
Figura 7.4: Variograma lineal y pesos del krigeado. Se tienen 3 muestras. Se produce un “desagrupamiento”
7.2. LAS ECUACIONES DEL KRIGEADO ORDINARIO PARA BLOQUES Para obtener las ecuaciones de krigeado hay que minimizar la expresión de E2
pero los λi deben verificar la condición:
__________
6
Modelo de Kriging
115
El método clásico para minimizar la expresión de E2 (igualar a cero las derivadas parciales de E2 Respecto de 1, 2,….., N) no asegura que la suma de los i sea 1. En este caso hay que utilizar el método de lagrange, el cual explicaremos con un ejemplo matemático. Ejemplo: Minimizar la función A = x2 + y2 si x + y = 1 El método de Lagrange define la función A siguiente: A = x2 + y2 - 2( x + y – 1) es una incógnita auxiliar llamada parámetro de Lagrange. Observamos que A es una función de tres variables: x, y, . Por otra parte, si se verifica la condición x +y = 1, entonces A = A. El método de Lagrange consiste en igualar a cero las derivadas parciales de A.
Es fácil de ver que la solución de este sistema es x = 0.5 y = 0.5 = 0.5 Luego el mínimo de A o de A es: A = (0.5)2 + (0.5)2 = 0.5 Por lo general el parámetro carece de significación física. En el caso del krigeado hay que considerar la expresión:
Se demuestra que al realizar N + 1 derivaciones, se obtiene el sistema de ecuaciones siguiente:
_________
116
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
que es un sistema lineal de N+1 ecuaciones con N+1 incógnitas (λ1, λ2, . . . , λN, μ) Se demuestra que el sistema siempre tiene solución (se supone que el modelo de (h) es autorizado), salvo el caso en el cual existen dos (o más) muestras diferentes con las mismas coordenadas: Este caso no debería presentarse en la práctica pero a veces ocurre, lo cual hace necesario una revisión previa de la base de datos. EXPRESION MATRICIAL 0 12 21 0 . . . . . . n2 n1 1 1
13 23 . . . n3 1
... 1n ... 2 n . . . ... 0 ... 1
1 1 1 1 2 2 . . . . . . . . . . 1 n n 0 1
El método que hemos presentado se conoce como krigeado ordinario y se puede aplicar siempre que la variable regionalizada no presente una deriva en la vecindad de estimación. Varianza del error Se demuestra que la expresión de σE2 se simplifica, obteniéndose:
7.3. CASOS DE ESTUDIO DEL KRIGEADO ORDINARIO PARA BLOQUES Ejemplo 1: En el caso del yacimiento isótropo de la siguiente figura, estudiado anteriormente, tenemos:
Figura: 7.5: Configuración geométrica del bloque a krigear.
Modelo
__________
6
Modelo de Kriging
117
Se obtiene, con la ayuda de un programa computacional:
Ejemplo Nº 2: En el caso del yacimiento anisotropico estudiado anteriormente en la figura 4.64, se tiene el bloque siguiente:
Figura 7.6: Configuración geométrica del bloque con leyes de cobre.
Al usar un programa computacional, se obtiene los ponderadores siguientes:
_________
118
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Vemos que el krigeado ha considerado la anisotropía, asignando mayor peso a los datos 2 y 3 que a 4 y 5. Ejemplo Nº 3: Estimar la ley de cobre total para el bloque mostrado en la figura del yacimiento. Elegir un plan de krigeado en base al modelo cuadrático que tiene un efecto pepita de 0.4; meseta de 3.8 y un alcance de 60 metros. Cada bloque tiene una dimensión de 10x10 metros. Asimismo calcular su error de estimación. (sugerencia, puede tomar un radio de influencia de 10m). YACIMIENTO DE COBRE
0.5
0.8
2.5
1.6 3.2
1.9 2.3
1.2
1.8
1.8
B 2.4
1.9
1.5
3.6
1.3
1.3
2.4 2.1
1.6
Figura 7.7: Configuración geométrica del yacimiento. SOLUCIÓN: Selección de muestras de acuerdo al radio de influencia de 10 metros.
Radio de 10 m.
X2
X1
X5
X3
X4
Figura 7.8: Muestras de acuerdo al radio de influencia.
__________
6
Modelo de Kriging
119
Parámetros C0= C= S= a=
Modelo Cuadrático
0.4 3.8 4.2 60
h h2 S 2 (h) a a 2 S
Aplicación de matrices para el cálculo de los ponderadores i.
Cálculo de la LEY
Cálculo de la varianza
Calculo de intervalo de confianza.
Cálculo de las distancias entre muestras
Figura 7.9: Muestras para el cálculo de distancias. _________
para 0 h a para h a
120
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Matriz de distancias entre muestras x1 x2 x3 x4 x5 0 10 14.142 15.811 10 10 0 10 15.811 14.142 14.142 10 0 7.171 10 15.811 15.811 7.171 0 7.171 10 14.142 10 7.171 0
x1 x2 x3 x4 x5
Cálculo de variogramas entre muestras, usando el modelo cuadrático. Matriz de variogramas entre muestras x1 x2 x3 x4 x5
x1 0 1.283 1.747 1.922 1.283
x2 1.283 0 1.283 1.922 1.747
x3 1.747 1.283 0 0.932 1.283
x4 1.922 1.922 0.932 0 0.932
x5 1.283 1.747 1.283 0.932 0
Cálculo de distancias entre las muestras con los puntos discretizados del bloque.
Figura 7.10: Discretización del bloque en 4 puntos.
MATRIZ DE VARIOGRAMAS 0 1' 2' 3' 4' PROM X1 0.48 1.034 1.354 1.034 0.976 X2 1.034 0.48 1.034 1.354 0.976 X3 1.354 1.034 0.48 1.304 0.976 X4 1.595 1.595 1.034 1.034 1.315 X5 1.034 1.354 1.034 0.48 0.976
__________
6
Modelo de Kriging
121
MATRIZDE DISTANCIAS 0
1'
2'
3'
4'
x1
3.536
7.906
10.606
7.906
x2
7.906
3.536
7.906
10.606
x3 10.606
7.906
3.536
7.906
x4 12.748 12.748
7.906
7.906
x5
7.906
3.536
7.906
10.606
Calculo de variogramas entre muestras y los puntos discretizados del bloque, usando el modelo cuadrático. Reemplazando los datos calculados en la matriz de kriging. 0
1.283
1.747
1.922
1.283
1
λ1
0.976
1.283
0
1.283
1.922
1.747
1
λ2
0.976
1.747
1.283
0
0.932
1.283
1
λ3
0.976
1.922
1.922
0.932
0
0.932
1
λ4
1.315
1.283
1.747
1.283
0.932
0
1
λ5
0.976
1
1
1
1
1
0
M
1
Resultados λ1 λ2 λ3 λ4 λ5 M
CÁLCULO DE LA LEY DEL BLOQUE
_________
0,250 0,250 0,246 0,008 0,246 -0,105
122
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
CÁLCULO DEL ERROR DE ESTIMACIÓN DE LA LEY DEL BLOQUE
Previo a este paso necesitamos discretizar el bloque de la siguiente manera para calcular
Figura 7.11: Discretización del bloque para el cálculo del error de estimación de la ley.
Matriz de distancias entre los puntos del bloque 1' 1' 2'
2' 0
3'
4'
5
7.071
5
0
5
7.071
0
5
3' 4'
0
Matriz de variogramas 1' 2' 3' 4'
1' 2' 3' 4' 0 0.671 0.932 0.671 0 0.671 0.932 0 0.671 0
Cálculo de
__________
6
Modelo de Kriging
123
Cálculo de la varianza
Cálculo de intervalo de confianza.
7.4. KRIGEADO PUNTUAL En algunas ocasiones, en vez de estimar la ley media de un bloque V, interesa estimar la ley en un punto x0 (problema de interpolación). Corresponde al caso particular en que el volumen V tiende a cero. Se obtiene el sistema siguiente:
Este sistema de ecuaciones lo representamos también como un esquema matricial, de la siguiente manera: 0 12 21 0 . . . . . . n2 n1 1 1
_________
13 23 . . . n3 1
... 1n ... 2 n . . . ... 0 ... 1
1 1 1 1 2 2 . . . . . . . . . . 1 n n 0 1
124
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Donde la matriz independiente 1, 2,….., n. son los variogramas promedio entre el punto a ser estimado y las muestras ubicadas dentro de la vecindad seleccionada. La expresión para el cálculo de la varianza de estimación es:
Figura 7.12: Krigeado del punto X0. Se puede generar una grilla de valores interpolados al hacer variar x0. Esta técnica tiene aplicación en la cartografía automática y en la simulación de leyes. El krigeado puntual tiene la propiedad de ser un interpolador exacto en el sentido de que si se desea estimar la ley en un punto conocido (por ejemplo el punto A de la figura 7.12), el krigeado proporciona la ley del dato con una varianza E2 = 0. Se dice que el krigeado puntual ¨pasa por los puntos¨.
Figura 7.13: Krigeado puntual en R1 versus interpolador de mínimos cuadrados. Esta propiedad no lo tienen otros interpoladores tales como los mínimos cuadrados. 7.5. PROPIEDADES DEL KRIGING O KRIGEADO Las propiedades más importantes del método del krigeado son: __________
6
Modelo de Kriging
125
a). Propiedad de simetría. Si (h) es isótropo, entonces datos que son simétricos respecto de V y con respecto a los otros datos tienen pesos iguales.
Figura 7.14: Propiedad de simetría del krigeado. Del ejemplo de la figura 7.14, tenemos:
Esta propiedad era útil cuando se resolvían los sistemas de krigeado manualmente. b). Composición de kriogeados. Sean dos volúmenes disjuntos V1 y V2; sean Z1 y Z2 los estimadores de krigeado respectivos:
Figura 7.15: Composición de krigeados.
Entonces el krigeado Z de V1 V2 es:
Es decir una ponderación por volúmenes o por tonelajes. Esta relación no es válida para las varianzas; si se desea conocer la varianza es necesario krigear el bloque V1 V2 o bien utilizar una aproximación. _________
126
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
c). Vecindad de estimación.
Figura 7.16: Vecindad de estimación. Para el krigeado no importa la agrupación de datos al lado izquierdo del bloque (el krigeado desagrupa la información. ¿Cuál radio tomar?.
En estricto rigor, el krigeado de un bloque V debería realizarse considerando todos los datos disponibles (krigeado completo). Sin embargo, esta situación implica cálculos muy largos; por otra parte, las muestras alejadas tendrían un peso casi nulo. Por esta razón la práctica recomienda restringirse a una vecindad de estimación que puedes ser una esfera o circulo, o bien un elipsoide o elipse (3D y 2D). Como recomendación práctica, el radio de búsqueda en una cierta dirección no debe ser inferior al alcance en esa dirección. La práctica ha demostrado que, en el espacio de dos dimensiones, con una vecindad que contenga un promedio del orden de 8 muestras, los resultados son buenos. En el espacio de tres dimensiones la situación es más compleja y debe ser analizada en cada caso particular.
Figura 7.17: Espacio 3D, búsqueda de parámetros. En el espacio 3D hay que elegir los parámetros de búsqueda de manera de que se produzca ¨interpolación¨ entre los sondajes. En el gráfico anterior se observa que quedarán bloques mejor estimados que otros y habrá que categorizarlos en medidos, indicados e inferidos. __________
6
Modelo de Kriging
127
d). Estrategia de búsqueda. Esta estrategia establece los parámetros que hay que utilizar para la búsqueda de compósitos a utilizar en la estimación del bloque. Dependiendo del software utilizado, estos parámetros son: Radios de búsqueda (Rx, Ry, Rz). En primera aproximación se pueden utilizar los alcances del variograma en las direcciones (x, y, z), en una vecindad con forma de elipsoide.
Figura 7.18: Elipsoide de búsqueda.
En algunas situaciones este elipsoide puede estar inclinado, el centroide es el centro de gravead del bloque. Minimo K de muestras para krigear. Sirve para controlar el caso en que solo una muestra cae en la vecindad. Si, por ejemplo, se pone K = 2, solo se krigearan los bloques que tengan dos o mas datos en la vecindad. Maximo r de muestras para krigear. Si se pone, por ejemplo r = 32, entonces cuando en la vecindad de un cierto bloque existan mas de 32 compósitos, solo se utilizarán en la estimación los 32 compósitos más cercanos al centro del bloque. Este parámetro se usa para mayor velocidad de los cálculos. Máximo I de muestras por octante. Si se pone, por ejemplo I = 2, en cada octante se utilizarán las dos muestras más cercanas al centro del bloque.
Figura 7.19: Octantes para la aplicación del krigeage.
_________
128
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
¿Qué pasa si existen sondajes aproximadamente horizontales en el caso de la izquierda?. Algunos paquetes computacionales utilizan el hemisferio superior e inferior, en el caso de la derecha. El objetivo de este parámetro es desagrupar (pero, dadas las propiedades del krigeado. ¿Se justifica su uso?. Máximo s de compósitos por sondaje. Si se pone, por ejemplo s = 2, en cada sondaje se utilizará un máximo de 2 compósitos, los más cercanos al centro del bloque. El objetivo de este parámetro es forzar la interpolación entre sondajes. Los parámetros I y s deben ser utilizados con precausion. Para no introducir artefactos, es recomendable que estos valores sean altos, lo que hace que su uso no sea interesante. (ver figuras 20, 21 y 22).
Figura 7.20: Sondaje inclinado con parámetro I=1. Al usar los octantes con I = 1, se utilizan exclusivamente los compósitos 1 y 5. Luego hay que usar un I mayor.
Figura 7.21: Sondajes inclinados con parámetro s=1. Al usar un máximo de s = 1 de compósitos por sondaje, sólo se usan los compósitos 8 y 3 (casi a la misma cota que el bloque), sin tomar en cuenta la variación en la vertical. Luego hay que usar un s mayor. La figura 7.22 ilustra un perfil de una mina estimado por octantes (máximo 2 compósitos) y el mismo perfil estimado con un máximo de 32 compósitos en la vecindad (sin octantes y sin máximo de compósitos por sondaje).
__________
6
Modelo de Kriging
129
Figura 7.22: Perfil de una mina estimado por octantes. A la izquierda se presenta la estimación por octantes y máximo por sondaje (se produce el efecto ¨pan queque¨). A la derecha no existen restricciones. Todos los sondajes (no dibujados) son verticales. Los compósitos tienen un largo igual a la altura del banco. 7.6. CASOS DE ESTUDIO SOBRE KRIGEADO PUNTUAL Ejemplo Nº 1: Los siguientes valores representan una configuración respecto a una pequeña sección de un yacimiento, que sigue un modelo exponencial, cuyos parámetros son a=10m y S = 10m. Estimar la Ley en el Punto X0(65E, 137N) y calcular el error de estimación. DATA Nº Muestra 1 2 3 4 5 6 7
COORD. ESTE (metros) 61 63 64 68 71 73 75
COORD. NORTE (metros) 139 140 129 128 140 141 128
LEY PPM 477 696 227 646 606 791 783
MODELO EXPONENCIAL h h s1 exp a
Parámetros: a= S=
10 10
Configuración geométrica para el cálculo de distancias entre la muestra X1, con respecto a las demás muestras.
_________
130
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Figura 7.23: Esquema para el cálculo de distancias de X1 a las demás muestras.
Figura 7.24: Cálculo de distancia de X1 a la muestra X2.
Con este procedimiento calculamos todas las distancias entre las muestras, obteniendo los siguientes resultados: Matriz de Distancias X1 X1 X2 X3 X4 X5 X6 X7
0 2.235 10.440 13.038 10.046 12.166 17.804
X2 2.235 0 11.045 13 8 10.05 16.971
X3 10.440 11.045 0 4.123 13.038 15 11.045
X4 13.038 13 4.123 0 12.369 13.928 7
X5 X6 10.05 12.166 8 10.04987562 13.038 15 12.369 13.9288 0 2.2367 2.236 0 13.601 13.1534
X7 17.804 16.971 11.045 7 13.601 13.153 0
En base a las distancias del cuadro anterior, calculamos los variogramas entre la muestras del yacimiento. Figura 7.23. Usando el modelo exponencial con los parámetros dados. h h s1 exp a
__________
6
Modelo de Kriging
131
X1 X1 X2 X3 X4 X5 X6 X7
0 2,01 6,48 7,29 6,34 7,038 8,31
Matriz de Variogramas X2 X3 X4 2,00 6,48 7,29 0 6,69 7,27 6,694 0 3,38 7,27 3,38 0 5,52 7,29 7,1 6,34 7,77 7,52 8,17 6,69 5,03
X5 X6 X7 6,34 7,038 8,31 5,52 6,34 8,17 7,29 7,77 6,69 7,21 7,52 5,03 0 2,00 7,43 2,0 0 7,32 7,43 7,32 0
Cálculo de distancias entre el punto a estimar X0 y las demás muestras implantadas en el yacimiento.
Figura 7.25: Esquema para el cálculo de la distancia de X0 a las demás muestras.
Matriz de Distancias X0 X1 4.472 X2 3.61 X3 8.062 X4 9.487 X5 6.708 X6 8.944 X7 13.454 Cálculo de variogramas, usando el modelo exponencial con sus respectivos parámetros y reemplazando las distancias del vector h.
_________
132
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Matriz de Variogramas X0 X1 3,60583988 X2 3,03021002 X3 5,53448257 X4 6,12755886 X5 4,88700625 X6 5,91147163 X7 7,39564487 Reemplazando todos los datos en la matriz de krigeado puntual, tenemos:
0
2,0
6,48
7,29
6,34
7,04
8,314
1
λ1
3,606
2,0
0
6,69
7,27
5,51
6,34
8,17
1
λ2
3,030
6,48
6,69
0
3,38
7,29
7,77
6,69
1
λ3
5,534
7,29
7,27
3,38
0
7,4
7,52
5,034
1
λ4
6,128
6,34
5,51
7,29
7,1
0
2, 3
7,434
1
λ5
4,887
7,04
6,34
7,77
7,52
2,
0
7,32
1
λ6
5,911
8,31
8,17
6,69
5,03
7,43
7,32
0
1
λ7
7,396
1
1
1
1
1
1
1
0
μ
1
Resolviendo la matriz, tenemos los siguientes resultados: Ponderadores de Kriging 0,17477219 λ1 0,39202394 λ2 0,14133432 λ3 0,07281127 λ4 0,21743227 λ5 -0,01975261 λ6 0,02137862 λ7 -0,04189247 μ Cálculo de la Ley en el punto X0.
Cálculo de la varianza
__________
6
Modelo de Kriging
133
Ejemplo Nº 2: En un yacimiento de plomo, se tiene un conjunto de 4 muestras, cuyas leyes son: x1=8.2%, x2=9.6%, x3=13.15% y x4=6.3%. Estimar la Ley en el punto X0, sabiendo que la data sigue un modelo esférico con un alcance de 250 metros, efecto pepita de 17 y un valor de meseta igual a 66.
Figura 7.26: Esquema geométrico del problema, con bloques de 100 x 100 m. Modelo esférico 3 h 1 h3 S (h) 2 a 2 a 3 S
para 0 h a para h a
Esquema matricial a utilizar para el cálculo de los ponderadores de Kriging.
1
1
1
1
1 1 1 1 0
λ1 λ2 λ3 λ4 μ
Matriz de distancias entre muestras X1 X2 X3 X4
_________
X1 0 111,803 111,803 111,803
X2 111,803 0 70.711 158.114
X3 111,803 70,711 0 100
X4 111,803 158,114 100 0
1
134
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
Cálculo de los variogramas usando el modelo esférico Matriz de variogramas X1 X2 X3 X4
X1 0 51,966 51,966 51,966
X2 51,966 0 34.275 68.242
X3 51,966 34,275 0 47.144
X4 51,966 68,242 47,144 0
Cálculo de distancias entre el punto a estimar X0, con respecto a las demás muestras.
X0
Matriz de distancias 1 2 3 50 100 70,711
4 70,711
Cálculo de los variogramas, usando el modelo esférico para cada distancia del vector h.
X0
Matriz de variogramas 1 2 3 24,568 47,144 34,275
4 34,275
Reemplazando los variogramas calculados, en la matriz de Krigeado, tenemos:
Resolviendo la matriz, tenemos los siguientes resultados: λ1 = 0.464 λ2 = 0.03 λ3 = 0.243 λ4 = 0.264 = -3.289 Ley estimada
__________
6
Modelo de Kriging
Error de estimación
5.19 %
_________
135
REFERENCIA BIBLIOGRÁFICA
- 136 -
Anexo 1 Data Yacimiento de Carbón Coal Project data
²
Coord. X Coord. Y Elevación Potencia Valor Calorífico (MJ) Ceniza (%) 9500 12600 605.90 1.84 22.26 19.29 9650 12600 605.10 1.73 21.36 19.97 9950 12600 601.50 1.65 22.34 19.09 10100 12600 601.50 2.22 22.19 21.96 10250 12600 601.30 2.54 22.43 18.55 10550 12600 602.60 2.65 24.07 17.63 10850 12600 603.20 2.84 22.11 18.65 9500 12750 604.70 2.18 20.90 20.59 9650 12750 604.50 2.08 21.70 20.49 9800 12750 604.50 1.47 20.83 20.74 10100 12750 601.70 2.17 23.19 18.65 10400 12750 601.10 3.10 24.34 17.53 10550 12750 601.60 3.11 25.55 14.60 10700 12750 599.50 3.29 25.23 16.47 10850 12750 600.10 3.26 23.48 19.29 11000 12750 599.20 2.95 24.23 16.11 9500 12900 606.10 1.94 21.84 20.66 9650 12900 605.40 2.29 20.58 21.23 9800 12900 604.00 1.71 21.35 21.81 9950 12900 602.50 2.13 24.02 17.68 10100 12900 601.40 2.35 23.53 18.24 10250 12900 599.70 3.07 23.36 16.96 10400 12900 599.70 2.80 24.53 16.73 10550 12900 600.80 3.10 24.67 17.53 10700 12900 598.90 3.26 25.19 15.84 11000 12900 598.70 2.90 24.43 16.86 9500 13050 605.80 2.23 21.36 20.40 9650 13050 605.80 1.94 20.78 21.08 9800 13050 604.10 1.94 21.73 20.48 9950 13050 602.70 2.42 23.28 17.51 10100 13050 599.00 2.71 24.56 17.18 10250 13050 599.40 2.71 25.50 16.14 10400 13050 598.40 2.99 24.89 16.50 10550 13050 597.90 2.85 23.19 18.57 10700 13050 598.10 2.83 24.48 17.75 10850 13050 598.00 3.08 25.19 18.10 9500 13200 606.60 2.11 23.43 19.91 9650 13200 606.30 1.74 22.68 20.16 9800 13200 603.90 2.18 24.04 17.24 10100 13200 600.20 2.82 24.57 15.80 10250 13200 599.20 2.75 26.29 14.85 10400 13200 597.00 2.74 26.85 14.00 10550 13200 598.90 2.87 25.64 15.46 10700 13200 601.30 2.63 26.03 14.58 10850 13200 600.00 2.31 26.62 16.65 11000 13200 600.30 2.46 25.80 13.04 9800 13350 603.60 2.11 24.91 17.71 9950 13350 602.30 2.37 24.94 16.14
- 137 -
sulfuros (%) 0.83 0.78 1.03 1.11 1.03 1.24 0.86 0.99 0.89 1.07 1.12 1.29 1.15 0.93 0.99 1.02 1.10 0.98 0.97 0.83 0.93 1.00 0.71 0.93 1.12 0.95 1.15 0.75 0.95 1.11 1.14 1.21 1.14 0.78 1.14 1.21 1.04 0.77 1.00 0.91 1.09 1.01 0.97 1.04 1.04 1.07 1.21 0.84
138 10250 10400 10550 10700 10850 11000 9500 9650 9800 9950 10250 10400 10550 10850 9500 9650 10100 10250 10400 10550 10700 11000 9500 9650 9800 10100 10250 10400 10550 10700 11000 9500 9650 9950 10250 10400 10700 10850 11000 9500 9800 9950 10100 10250 10400 10700 10850 11000
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA 13350 13350 13350 13350 13350 13350 13500 13500 13500 13500 13500 13500 13500 13500 13650 13650 13650 13650 13650 13650 13650 13650 13800 13800 13800 13800 13800 13800 13800 13800 13800 13950 13950 13950 13950 13950 13950 13950 13950 14100 14100 14100 14100 14100 14100 14100 14100 14100
600.40 599.80 600.90 601.30 600.60 600.40 608.20 606.80 604.50 603.10 601.50 602.90 603.00 603.00 608.80 608.10 606.10 605.40 605.30 604.80 605.90 603.70 611.00 610.10 608.30 606.90 607.00 607.10 606.70 607.60 606.80 614.30 614.20 607.90 608.30 608.20 608.40 607.80 605.30 615.50 612.20 611.60 609.20 610.00 609.80 608.60 606.80 606.90
2.55 3.01 2.76 2.14 1.85 1.97 2.34 2.42 2.20 2.30 2.45 2.43 2.68 1.58 2.13 2.17 2.00 2.17 1.95 2.12 1.53 2.01 1.96 2.26 2.03 2.14 2.09 2.14 2.16 1.98 2.11 2.17 1.71 1.89 2.11 2.21 2.04 1.73 1.66 1.83 1.54 1.30 1.89 2.13 2.36 1.94 1.75 1.69
27.31 28.72 26.55 28.22 27.05 25.97 21.47 23.07 23.76 26.80 28.98 29.55 29.56 28.38 20.97 23.41 25.61 29.30 30.46 28.27 28.41 27.15 21.13 22.67 21.86 25.62 26.60 28.98 28.75 27.17 26.59 19.92 21.19 23.54 24.82 26.11 25.39 26.62 25.75 20.45 22.80 23.85 24.58 24.25 24.71 24.29 25.24 25.57
14.82 11.60 14.97 12.06 12.69 16.19 19.89 19.02 18.41 14.28 12.51 11.38 12.03 13.05 21.93 17.99 16.79 12.59 11.92 10.91 12.12 13.79 20.92 18.73 18.78 13.93 15.24 12.42 11.67 13.65 15.62 23.02 22.15 17.34 18.99 14.20 17.49 13.05 16.10 21.53 19.73 17.36 18.17 17.23 16.50 18.16 16.37 14.63
1.30 1.22 0.97 1.40 1.17 0.96 0.82 1.09 1.00 1.16 1.27 1.28 1.11 1.25 0.87 0.88 1.10 1.40 1.37 0.99 1.21 1.25 1.06 0.85 0.98 1.05 1.26 1.10 1.13 1.24 1.03 0.93 1.09 0.86 1.35 0.84 1.22 1.05 1.34 0.77 0.96 1.02 0.87 0.92 1.09 1.09 1.11 1.03
__________
Anexo 1 Data Yacimiento de Carbón
139
CALCULOS PREVIOS VARIABLE VALOR n 96 min 19.92 max 30.46 Rango 10.54 k 8 w 1.32 DISTRIBUCION DE FRECUENCIAS INTERVALOS Li Ls 19.920 21.240 22.560 23.880 25.200 26.520 27.840 29.160
Presentación
_________
21.240 22.560 23.880 25.200 26.520 27.840 29.160 30.480
Xi
fi
20.580 21.900 23.220 24.540 25.860 27.180 28.500 29.820
9 13 15 21 15 11 8 4
hi 0.094 0.135 0.156 0.219 0.156 0.115 0.083 0.042
Fi 9.000 22.000 37.000 58.000 73.000 84.000 92.000 96.000
Hi 0.094 0.229 0.385 0.604 0.760 0.875 0.958 1.000
hi*100 9.375 13.542 15.625 21.875 15.625 11.458 8.333 4.167
Hi*100 9.375 22.917 38.542 60.417 76.042 87.500 95.833 100.000
140
GEOESTADÍSTICA PARA LA ENSEÑANZA UNIVERSITARIA
__________