Análisis Exploratorio de Datos Evaluación de Yacimientos Mineros Universidad de Santiago Septiembre 2017
Outline •
•
•
•
•
Bibliografía Conceptos claves Análisis Exploratorio de Datos Definición de los dominios de estimación Resumen
Bibliografía •
•
•
Introduction to Isaaks E. and Srivastava R., R., An Introduction applied geostatistics, Oxford University Press, New York, 1989. Rossi. M and Deutsch C., Mineral Resource Estimation, Springer, New York, 2014. Sinclair A.J. and Blackwell G.H., G.H., Applied Mineral Inventory Estimation, Cambridge University Press, Cambridge, 2002.
CONCEPTOS CLAVES CLAVES
¿Qué es un modelo? •
•
•
Un modelo es una representación de un objeto o fenómeno en el mundo real. El modelo recoge la estructura y características esenciales del objeto o fenómeno a estudiar. El modelo se utiliza para explorar, entender, predecir o simular el fenómeno modelado Un buen modelo es aquel que logra acercarse a la realidad PREDICCIÓN
La estadística La estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presentar y analizar datos así como obtener conclusiones válidas y tomar decisiones razonables en base a dicho análisis
La geoestadística La geoestadística es una disciplina que permite analizar datos ubicados en el espacio Leyes de Cu, Mo, As, etc. Mediciones de propiedades de carácter geológico (factores modificantes en la evaluación de reservas) Geo metalúrgicas Dureza (BWI, Starkey, TPH), Recuperación metalurgica, Reología (sedimentación)
Geo mecánicas RMR, RQD, FF, GSI, mediciones de carga uniaxial, etc.
Geologicas Porcentaje de especies minerales, tipos de alteración, litologías, etcétera.
La geoestadística pone énfasis en el contexto geológico de los datos y su relación espacial
La geoestadística •
Tipos de variables que estudia la geoestadística: –
–
–
•
Continuas Discretas Categóricas
La geoestadística es una herramienta de la evaluación de recursos
La geoestadística en el negocio minero •
Campañas de exploración – –
•
Estudio de factibilidad y operación – –
•
Categorización de recursos in situ Sondajes Infill Producción futura
Modelamiento geológico Estimación de recursos Cálculo de reservas
Explotación – – – –
Pozos de tronadura Modelos Grade Control Control de leyes Destino Planta-Stock-Botadero Conciliación LP-CP
Continuidad •
•
Geológica: Forma espacial de una característica geométrica Depósito mineral (vetas, brechas, pliegues, etc) Numérica: Distribución espacial de una característica medible, como la ley o el ancho de una zona de continuidad geológica
Hipótesis de estacionaridad
Estacionaridad estricta
Media y varianza constante
Estacionaridad de orden 2 o débil
Estacionaridad estricta
Efecto Proporcional
La variabilidad (dispersión) de las leyes no es constante en un depósito Efecto Proporcional A mayor ley media, mayor variabilidad
Compósitos
Se requiere que los datos se encuentren a un mismo soporte. Mientras más largo el compósito, menos dispersos y erráticos los valores
Curvas tonelaje ley •
•
•
•
Dan cuenta de la ley media sobre una ley de corte A medida que la ley de corte se incrementa, el tonelaje disminuye El tonelaje puede expresarse como una fracción del volumen Para estimar la CTL de un nivel puntual a un soporte volumétrico (SMU) se requiere de un modelo de cambio de soporte
Variable aditiva
Carrasco, Chilés, Seguret (2008)
ANÁLISIS EXPLORATORIO DE DATOS
Análisis Exploratorio de datos (AED) •
•
Evalúa el comportamiento de un grupo de atributos geológicos entre sí, y en relación a variables de interés como leyes de elementos Caracteriza de manera cuantitativa las relaciones entre los atributos geológicos y variables de interés
Objetivo principal AED •
En evaluación de yacimientos, el AED busca determinar los atributos geológicos que controlan las distribuciones estadísticas y espaciales de los elementos considerando su continuidad, conectividad e intercalación espacial
Objetivos específicos del AED •
Entender la información
•
Decidir el supuesto de estacionaridad
•
•
Definir las unidades geológicas o dominios de estimación Apoyar las decisiones adoptadas en el modelamiento geológico
Herramientas AED •
•
•
•
Despliegue y visualización de los datos Herramientas estadísticas Análisis de los valores escapados Desagrupamiento
Análisis exploratorio de datos – Her Herra ramie mient ntas as AED
DESPLIEGUE DE LA INFORMACIÓN
Visualización de datos •
•
Poderosa y simple herramienta que permite contextualizar la información. Proporciona información que no es posible de entender y apreciar con las estadísticas
•
•
•
Relaciones alta/baja ley Agrupamiento de datos Controles/derivas
• •
Unidades geológicas Densidad de información Relaciones de contacto
Análisis exploratorio de datos – Herramientas AED
HERRAMIENTAS ESTADÍSTICAS
Herramientas estadísticas •
•
•
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas Estadísticas multivariables Estadísticas espaciales
Herramientas estadísticas •
•
•
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas Estadísticas multivariables Estadísticas espaciales
Histograma •
•
•
•
Visualiza la frecuencia de un valor Distribución de valores Valores escapados Multi-modalidades
Diagrama de caja •
Resume de manera simple y clara las estadísticas de una distribución
Herramientas estadísticas •
•
•
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas Estadísticas multivariables Estadísticas espaciales
Diagrama de caja
Herramientas estadísticas •
•
•
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas Estadísticas multivariables Estadísticas espaciales
Gráficos de probabilidad •
Útiles para realizar comparaciones entre poblaciones
•
Histogramas de frecuencia acumulada (F) con escalamiento en la abscisa – –
•
Probabilidad normal Probabilidad log-normal
Permiten identificar valores escapados, tanto en la parte alta como baja de la distribución
Gráficos de probabilidad •
Los “quiebres” en las distribuciones permiten inferir la existencia de una o
más poblaciones •
La ausencia de “quiebres” no implica que no exista más de una población
Gráficos de probabilidad •
Los “quiebres” en las distribuciones permiten inferir la existencia de una o
más poblaciones •
La ausencia de “quiebres” no implica que no exista más de una población
Cuantiles
•
•
Valor de la variable correspondiente a una frecuencia acumulada dada Se pueden leer los intervalos de probabilidad desde los gráficos F.
Herramientas estadísticas •
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas –
–
•
•
Medidas de posición central Medidas de dispersión
Estadísticas multivariables Estadísticas espaciales
Medidas de posición central •
Media
m
1
n
z (u n
)
1
si n es impar z (u( n1) / 2 ) M ( z (un / 2 ) z (u( n / 2)1 )) si n es par 2
•
Mediana
•
Moda (Valor más frecuente)
Media, Mediana, Moda
Herramientas estadísticas •
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas –
–
•
•
Medidas de posición central Medidas de dispersión
Estadísticas multivariables Estadísticas espaciales
Medidas de dispersión •
Varianza
s
2
1
n
( z (u n
•
Desviación estándar
•
Rango intercuartil
•
Coeficiente de variación
•
) m) 2
1
s
s
2
IQR Q 3 Q1
CVexp .
s m
CV > 0.8 dominio muy variables -> revisar y entender, no mezclar leyes
Varianza •
•
Mide la dispersión de los valores de la variable respecto a la media aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética. La varianza se expresa en las mismas unidades que la variable analizada elevadas al cuadrado.
Propiedades, Esperanza y Varianza 1 Ea a 2 E aX b aEX b 3 E X Y EX EY N
N
i1 ai X i i 1 ai EX i
4 E
5 VarX E X EX X EX 6 Var aX b a VarX 2
7 Cov X , Y E X EX Y EY 8 Var X Y VarX VarY 2Cov X , Y 9 Cova1 X 1 b1 , a2 X 2 b2 a1a2Cov X 1 , X 2
10 Var
a X i i 1 j 1 ai a j Cov X i X j i 1 i
N
N
N
i 1 ai2VarX i 2i j ai a j Cov X i X j N
Observaciones sobre la Varianza •
•
•
La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas. En los casos que no se pueda calcular la media tampoco será posible hallar la varianza. La varianza viene expresada en las mismas unidades que los datos al cuadrado
Herramientas estadísticas •
•
•
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas Estadísticas multivariables Estadísticas espaciales
Nubes direccionales •
•
Muestran el comportamiento de la variable en los ejes coordenadas Permiten identificar valores escapados, tendencias o cambios en la continuidad espacial
Estadígrafos multivariables •
•
•
•
Gráficos de dispersión entre variables Regresión lineal entre variables Análisis de componentes principales (PCA) Tablas cruzadas (matriz de confusión) de atributos geológicos
QQ-plot •
•
•
•
Gráfico Q-Q: para comparar dos distribuciones F1 y F2 cuantil a cuantil. No se utiliza para comparar la relación par a par que hay entre las variables. Escoger una serie de valores de probabilidad pk, k = 1, 2, …, K Graficar q1(pk) versus q2(pk), k = 1 , 2 , …, K
Nubes de dispersión
•
•
Muestra la relación “uno a uno” entre las muestras
Da cuenta del nivel de correlación entre dos variables
Correlación •
•
•
•
Coeficiente de correlación medida de la dependencia lineal entre dos variables:
Una correlación de | ρxy= 1| implica que X e Y están perfectamente correlacionadas. Independencia entre dos variables implica que el coeficiente de correlación es cero: ρxy = 0. Sin embargo, la inversa no es siempre cierta. Correlación cero no implica necesariamente independencia entre las dos variables. El coeficiente de correlación lineal varía entre -1 y +1.
Herramientas estadísticas •
•
•
•
•
•
Histograma Diagrama de caja Gráficos de probabilidad Estadísticas básicas Estadísticas multivariables Estadísticas espaciales
Medias condicionales
Derivas •
•
•
Corresponden al cálculo de las leyes medias y varianzas de las variables de interés según coordenadas. La elección del paso en cada coordenada debe guardar relación con el espaciamiento de la malla de sondajes y tamaño de compósitos en la vertical. Permiten evaluar el comportamiento espacial de las variables de interés, detectar tendencias al alza o baja, así como el nivel de variabilidad según coordenadas.
Análisis de contacto •
•
Corresponde al cálculo de las leyes medias de una variable en torno al contacto o cambio entre dos unidades de cierto atributo geológico. Dos visiones: –
–
A lo largo del sondajes visión local Entre todos los datos visión global de las transiciones
Análisis de contacto
Tipos de contacto •
Blando –
•
Duro –
•
Existe una tendencia al alza (o baja) de las leyes en torno al contacto de ambas leyes con una diferencia abrupta.
Transicional blando –
•
Cuando existe un cambio abrupto entre las leyes de dos unidades contiguas
Transicional duro –
•
Leyes similares entre ambas unidades en las cercanías del contacto
Cuando las leyes presentan una tendencia a la alza o baja entre una unidad a otra con una diferencia leve en torno al contacto
Errático –
No poseen una clara tendencia.
Contacto duro (D)
Transicional blando (TB)
Transicional duro (TD)
Transicional bando (TB)
Erráticos
Matriz de contacto
Análisis exploratorio de datos
VALORES ANÓMALOS O ESCAPADOS
Outliers •
•
•
Valores que no parecieran pertenecer a la misma población Constituyen un problema en el diseño de modelos predictivos y sobre las estadísticas básicas Generan un efecto desproporcionado sobre los valores que se estiman
Valores extremos •
Provocan un efecto desproporcionado sobre las estadísticas : –
–
•
desestructuran variograma valores estimados
Opciones? –
–
–
–
Clasificarlos en poblaciones estadísticas separadas Usar estadísticas robustas -> Menos sensibles a V.E. Transformar los datos para reducir su influencia Disminuir valores -> Capping
DEFINICIÓN DE LOS DOMINIOS DE ESTIMACIÓN
Dominios (o unidades) de estimación •
•
El objetivo del AED consiste en definir dominios geológica y estadísticamente homogéneos donde efectuar la estimación Los dominios corresponderán a volúmenes sobre los cuales se llevará a cabo la interpolación
Características de los dominios de estimación •
Por lo general, son combinación de atributos geológicos, tales como: – – – – – –
•
Alteración Litologías Zona Mineral Dominios estructurales Porcentaje de especies minerales Entre otras
En ocasiones, cuando no se cuenta con suficiente información geológica o la información disponible no evidencia controles sobre la distribución de la variable de interés, se utilizan isoleyes para definir las UE
Ejemplos dominios estimación
Ejemplos dominios estimación
• • • •
Separación en medias, std Separación en distribuciones Separación en contactos ¿Monomodales?
¿Cómo proponer dominios de estimación? •
•
•
•
•
•
•
•
Distribuciones mono-modales Bajos niveles de dispersión Diferencias en las medias Distribución espacial diferenciada Estacionaridad en el dominio Número de muestras aceptables Contactos duros entre unidades Coherencia espacial y coherencia geológica
Definición de dominio para dureza Zona mineral Gentileza José Soto
MNZ
LITO
ALT
GEO
SEC
ALL
ALL
ALL
A-QS-CS
PRI-PROF-H
PRO-PCO-BRE PRI RXAC-AND-USED PRIPY
ALL
P-K
PRI-PROF-T
A-QS-CS
PRI-CAJA-H
P-K ALL
PRI-CAJA-T
PRIPY
Definición de dominio para dureza Litología Gentileza José Soto
MNZ
LITO
ALT
GEO
SEC
ALL
ALL
ALL
A-QS-CS
PRI-PROF-H
PRO-PCO-BRE PRI RXAC-AND-USED PRIPY
ALL
P-K
PRI-PROF-T
A-QS-CS
PRI-CAJA-H
P-K ALL
PRI-CAJA-T
PRIPY
Definición de dominio para dureza Alteración Gentileza José Soto
MNZ
LITO
ALT
GEO
SEC
ALL
ALL
ALL
A-QS-CS
PRI-PROF-H
PRO-PCO-BRE PRI RXAC-AND-USED PRIPY
ALL
P-K
PRI-PROF-T
A-QS-CS
PRI-CAJA-H
P-K ALL
PRI-CAJA-T
PRIPY
Definición de dominio para dureza Dominio de estimación Gentileza José Soto
MNZ
LITO
ALT
GEO
SEC
ALL
ALL
ALL
A-QS-CS
PRI-PROF-H
PRO-PCO-BRE PRI RXAC-AND-USED PRIPY
ALL
P-K
PRI-PROF-T
A-QS-CS
PRI-CAJA-H
P-K ALL
PRI-CAJA-T
PRIPY
RESUMEN
Resumen •
•
En evaluación de yacimientos, el EDA busca determinar los atributos geológicos que controlan las distribuciones estadísticas y espaciales de los elementos considerando su continuidad, conectividad e intercalación espacial Los resultados del EDA permiten facilitar la elección de los atributos geológicos a modelar y sirven de guía en la estimación de recursos