GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad...

52
1 GEOESTADÍSTICA PARA EXPLORACIONES ProEXPLO 2013 Instituto de Ingenieros de Minas del Perú Lima, Perú 17 y 18 de Mayo, 2013 Mario E. Rossi, MSc. Geoestadística, Ing. de Minas. GeoSystems International, Inc.

Transcript of GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad...

Page 1: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

1

GEOESTADÍSTICA PARA EXPLORACIONES

ProEXPLO 2013

Instituto de Ingenieros de Minas del Perú

Lima, Perú

17 y 18 de Mayo, 2013

Mario E. Rossi, MSc. Geoestadística, Ing. de Minas.

GeoSystems International, Inc.

Page 2: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

2

TEORÍA DE LAS VARIABLES REGIONALIZADAS

Gran parte de la estadística clásica se basa en el Teorema Central del Límite (Teoría Gausiana). Tiene limitaciones en su aplicabilidad a variables correlacionadas en el espacio.

La geoestadística depende se ha desarrollado en muchos aspectos en base a la Teoría Gausiana, pero adaptada a variables relacionadas en el espacio.

Énfasis en aspectos prácticos del modelamiento de recursos, modelos de incertidumbre, y análisis de riesgos mineros.

Se requiere conocimientos de la teoría geoestadística, una semana es poco para desarrollar todos los elementos teóricos necesarios!

Page 3: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

3

VARIABLES REGIONALIZADAS Y FUNCIONES ALEATORIAS

Considere una variable; por ejemplo ley de mineral, espesor de mantos, pH, etc. variando en el espacio A: z(x), x ε A.

El valor z(x) se interpreta como una realización (evento) de Z(x).

z(x) es una variable regionalizada, mientras que Z(x) es la variables aleatoria.

Page 4: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

4

VARIABLES REGIONALIZADAS Y FUNCIONES ALEATORIAS (Cont)

El concepto entonces es convertir en aleatorias las variables {z(x), x ε A}, interpretándolas como eventos del grupo {Z(x), x ε A}.

Las variables aleatorias (VA) {Z(x), x ε A} se supone tienen todas las misma función de probabilidades:

F(x1,...,xN; z1,...,zN) = Prob{Z(x1) ≤ z1,..., Z(xN) ≤ zN },

que también se puede escribir como Prob{Z(x) ≤ z} = F(z), independiente de x.

Page 5: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

5

VARIABLES REGIONALIZADAS Y FUNCIONES ALEATORIAS (Cont)

La distribución de frecuencias acumuladas (cdf) univariable de la VA Z(x) se utiliza para caracterizar la incertidumbre (cuánto no conocemos) del valor z(x); la cdf multivariable se utiliza para caracterizar la incertidumbre conjunta de los N valores z(x1) , ... , z(xN).

La cdf bivariable (N=2) cdf de dos VA cualquiera Z(x1), Z(x2), es particularmente importante dado que la geoestadística convencional se restringe a distribuciones uni- (F(x;z)) y bivariable:

F(x1, x2;z1,z2)=Prob{Z(x1) ≤ z1,Z(x2) ≤ z2}

Page 6: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

6

VARIABLES REGIONALIZADAS Y FUNCIONES ALEATORIAS (cont)

Lo que acabamos de describir es la decisión de estacionaridad.

Es una decisión del experto, quien decide que área A es estadísticamente homogénea (estacionaria).

La decisión de estacionaridad es necesaria porque es la única manera que tenemos de combinar información provenientes de distintas ubicaciones, esto es, hacer inferencia como si pertenecieran a una misma población.

Las VA Z(x) no son independientes. La agrupación de todas las VA se conoce como la Función Aleatoria (FA), {Z(x), x ε A}.

Page 7: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

7

VARIABLES REGIONALIZADAS Y FUNCIONES ALEATORIAS (cont)

La única realidad son las variables regionalizadas z(x), o sea, las muestras. Todo lo demás es solamente una construcción necesaria para el modelamiento geoestadístico.

Matheron definió la estacionaridad basada en la existencia (o no) de los momentos estadísticos de la FA {Z(x), x ε A}. Los conceptos pueden ser aún mas oscuros, pero al mismo tiempo mas familiares.

Page 8: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

8

DEFINICIÓN CONVENCIONAL DE LA ESTACIONARIDAD

Estacionaridad Estricta: todos los momentos multivariables de la función aleatoria definida son los mismos.

Significa que, de manera estricta, todas las variables aleatorias definidas en cada ubicación x tiene la misma cdf que las otras.

Page 9: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

9

DEFINICIÓN CONVENCIONAL DE LA ESTACIONARIDAD (cont)

Estacionaridad de Orden 2: solamente los dos primeros momentos (estadísticos de primer y segundo orden, Valor Esperado y Covarianza) de la FA no varían con la translación. Si la covarianza existe, entonces la varianza necesariamente existe. { } ( ) ( )E Z m zdF z zf z dz

+∞ +∞

−∞ −∞

= = =∫ ∫

{ , } {[ ][ ]} { }

( )( ) ( , )

X Y X Y

X Y XY

Cov X Y E X m Y m E XY m m

E dx x m y m f x y dy+∞ +∞

−∞ −∞

= − − = −

= − −∫ ∫

Page 10: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

10

DEFINICIÓN CONVENCIONAL DE LA ESTACIONARIDAD (cont)

Estacionaridad Intrínseca es cuando el Valor

Esperado (media) de la FA no depende de la ubicación (como antes), y la varianza de todos los incrementos h es finita y no depende de la ubicación x:

( ) ( ) ( ) ( ) ( ){ }22 Var Y Y E Y Yγ = − + = − + h u u h u u h

Page 11: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

11

DEFINICIÓN CONVENCIONAL DE LA ESTACIONARIDAD (cont)

Cuasi-estacionaridad es cuando los estadísticos de

primer y segundo orden de la FA se infieren localmente, dentro de subzonas del volumen total de interés.

Esto es lo que se hace más comúnmente en la práctica geoestadística, también llamada estacionaridad local.

Page 12: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

12

ESTACIONARIDAD: HIPÓTESIS O DECISIÓN?

El aspecto de mayor consecuencia en el cálculo de recursos es definir que parte de nuestro depósito A es estadísticamente homogéneo.

Se puede probar esta decisión a priori?

Estacionaridad implica que todos los datos dentro de A pueden ser combinados. Así obtenemos los estadísticos que nos interesan, y podemos aplicar todas las otras propiedades de nuestro modelo probabilístico a la FA.

Page 13: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

13

ESTACIONARIDAD: HIPÓTESIS O DECISIÓN? (Cont.)

Cualquier test estadístico se aplica al modelo, no al espacio real A.

La decisión de homogeneidad solamente se puede evaluar a posteriori.

Además, en la aplicación diaria, esta decisión se ve afectada por aspectos pragmáticos: falta de información; conocimiento geológico o físico acerca del fenómeno estudiado; importancia (impacto) de las variables modeladas en el proyecto; etc.

Page 14: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

14

Page 15: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

15

Page 16: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

16

ANALÍSIS ESTADÍSTICO

Un primer análisis de los datos nos permite identificar ciertas características importantes, como tendencias, errores de muestreo, presencia de mas de una población, impacto de valores extremos, etc.

Las herramientas utilizadas pueden incluir histogramas, diagramas de dispersión, diagramas cuantil-cuantil, curvas de nivel, promedios espaciales, etc.

También se incluye en esta etapa la variografía.

Page 17: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

17

ANÁLISIS ESTADÍSTICO BÁSICO

Entrega una primera visión de los datos, EDA por sus siglas en inglés. Incluye: Histogramas; Diagramas de Dispersión y gráficos de correlación; Gráficos Q-Q y P-P; Curvas de Nivel; Promedios móviles; Desglomeración espacial; Etc.

El objetivo es identificar características espaciales y globales que permitan

obtener una decisión de estacionaridad adecuada, tales como: Tendencias; Errores de muestreo; Presencia de poblaciones múltiples; Impacto de valores extremos; Etc.

Page 18: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

18

CONCEPTOS BÁSICOS

La presentación clásica estadística se basa en definir una población que es una colección infinitamente grande de valores de interés, por ejemplo un yacimiento mineral.

Una muestra es un elemento seleccionado de la población. Una buena muestra debe reflejar las características esenciales (estadísticas) de la población de la que fué tomada.

Una muestra aleatoria es una muestra a la que puede pertenecer cualquier miembro de la población, y todos las posibles muestras tienen la misma oportunidad de ser incluídas.

El espacio de las muestras es el juego (set) de todos los posibles resultados de un experimento (muestreo) aleatorio.

El evento del espacio de las muestras es un grupo de resultados de ese espacio en el cual sus miembros tienen características comunes.

Page 19: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

19

CONCEPTOS BÁSICOS (CONT)

Eventos estadísticamente independientes indican que la ocurrencia de un evento no está condicionado por la ocurrencia de otros eventos.

El muestro en yacimientos minerales no cumplen con el

requerimiento de muestras representativas de un población; sin embargo, aplicamos conceptos de la estadística tradicional.

La inferencia estadística (estadística inductiva) se basa en la noción de que la muestra es representativa. Si es así, se pueden sacar conclusiones acerca de la población. Pero tal inferencia nunca es exacta o cierta, por lo que utilizamos un lenguaje probabilístico.

Page 20: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

20

CONCEPTOS BÁSICOS (CONT)

La estadística descriptiva es una fase del estudio estadístico que describe y analiza una muestra son intentar hacer inferencias acerca de la población. Aunque el objetivo en la estimación de recursos siempre implica inferencia, utilizamos muchas estadística descriptiva para visualizar y entender la información.

El concepto esencial es la estacionaridad; esto es nuestra selección de datos que juntamos para analizar.

Page 21: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

21

CONCEPTOS BÁSICOS (CONT)

Algunas de las herramientas y conceptos desarrollados en este módulo son útiles para tomar una decisión de estacionaridad robusta; pero no olvidar que para agrupar datos, necesitamos estacionaridad.

Las herramientas estadísticas se utilizan para: Entender mejor la información entregada; Asegurar la calidad de la información; y Condensar la información.

Pero en general, no estamos interesados en las

estadísticas de las muestras – nuestro objetivo es hacer inferencias acerca de la población.

Page 22: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

22

DISTRIBUCIONES UNIVARIABLES

La función de distribución cumulativa (CDF) es la manera universal de expresar un estado de conocimiento incompleto (incertidumbre). Si la variable aleatoria es Z, la CDF F(z) se define como:

El valor z (minúscula) es un valor específico. Prob{∙} puede significar una probabilidad o una proporción.

( ) Prob{ } [0,1]F z Z z= ≤ ∈

Page 23: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

23

DISTRIBUCIONES UNIVARIABLES (Cont)

Un histograma acumulado (cdf) es útil para ver todos los valores de las muestras en un mismo gráfico e identificar distintas poblaciones estadísticas. Los cdf se crean a la misma resolución que las muestras, no por clases como el pdf (histograma de frecuencias).

La curva de frecuencias de acumuladas representa el estado de conocimiento mas completo acerca de nuestros datos.

Es importante determinar cuán representativo cada muestra es de la mineralización (QA/QC), y también si la distribución completa de las muestras representan bien las leyes del depósito; tenemos que compensar por sesgos o mala distribución espacial de las muestras?

La probabilidad de que Z tome un valor en un intervalo definido por dos límites a y b (con b>a) es la diferencia en los valores de la CDF evaluada para b y a:

Prob{ [ , ]} ( ) ( )Z a b F b F a∈ = −

Page 24: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

24

DISTRIBUCIONES UNIVARIABLES (Cont)

La función de densidad de probabilidades (PDF) es la derivadad de

la CDF, si es que esta es diferenciable. La PDF se puede obtener diferenciando la CDF:

0

( ) ( )( ) '( ) lim ( ) ( )z

dz

F z dz F zf z F z F z f z dzdz→

−∞

+ −= = = ∫

Page 25: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

25

DISTRIBUCIONES UNIVARIABLES (Cont)

La herramienta estadística básica utilizada en el análisis de los datos es el histograma.

Hay tres decisiones que tomar: Escala aritmética or logarítmica – aritmética es razonable porque las leyes se

promedian aritméticamente; pero logarítmica nos muestra mejor las características de distribuciones sesgadas positivamente;

El rango de valores que se quiere mostrar; y El número de clases que se quiere mostrar, el que depende de la cantidad de datos

disponibles. Mientras menos datos existan, más se debe disminuir el número de clases. El criterio es reducir el ruido (mas clases cuando hay suficientes datos) al mismo tiempo que se muestran los agrupamientos y tendencias generales (menos clases).

Se analizan varios parámetros: La media es sensible a los valores extremos; La mediana lo es a la falta de información en el medio de la distribución; La dispersión se mide con la desviación estándar (σ); La variabilidad se caracteriza mejor con el Coeficiente de Variación (CV), σ/m.

Page 26: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

26

DISTRIBUCIONES UNIVARIABLES (Cont)

Page 27: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

27

DISTRIBUCIONES NORMAL Y LOGNORMAL

La distribución Gausiana (Normal) se caracteriza con dos parámetros, su media y su varianza. La PDF de una distribución Normal estándar tiene una media 0 y varianza 1. La CDF de una distribución Normal no tiene una ecuación analítica cerrada, pero la estándar está tabulada. La distribución Normal tiene una simetría característica.

21 1( ) exp22

z mg zσσ π

− = −

Page 28: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

28

DISTRIBUCIONES NORMAL Y LOGNORMAL (Cont)

La distribución lognormal es importante en la historia de la estadística y geoestadística.

Una variable aleatoria positiva se dice que tiene una distribución lognormal cuando la variable Y=ln(X) tiene una distribución normal. Las distribuciones lognormales también se caracterizan con dos parámetros, su media y su varianza. En la práctica, se pueden caracterizar tanto por sus parámetros

aritméticos como logarítmicos.

Page 29: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

29

DISTRIBUCIONES NORMAL Y LOGNORMAL (Cont)

El Teorema Central del Límite dice que la suma de un gran número de variables aleatorias estandarizadas independientes y con la misma distribución (iid, no necesariamente Gausianas) tienden a la distribución Normal. Esto es, si n VA’s Zi tienen el mismo CDF y medias igual a zero, la VA tiende hacia una CDF Gausiana a medida que n se incrementa hacia un valor infinito.

El corolario de este Teorema es que el producto de un gran número de VA’s iid tienden a una distribución Gausiana.

Page 30: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

30

PARÁMETROS DE LAS DISTRIBUCIONES: CUANTILES

Los cuantiles son valores Z (leyes) específicas a las que se le asigna un valor de probabilidad según la CDF correspondiente. El cuantil p de la distribución F(z) es el valor zp para el cual:

Los 99 cuantiles con valores de probabilidad desde 0.01 a 0.99 en incrementos de 0.01 son los centiles. Los 3 cuantiles con valores de probabilidad de 0.25, 0.5 y 0.75 son los cuartiles. El cuantil de 0.5 es la mediana.

El Rango Intercuartil (IR) es la diferencia entre los cuartiles superior e inferior: IR = q(0.75) – q(0.25) y se use como una medida robusta de la extensión de la distribución.

El signo del sesgo (skewness) o diferencia entre la media y la mediana (m-M). Hablamos de distribuciones positivamente o negativamente segadas.

Los cuantiles se usan para hacer distintas comparaciones. Se pueden comparar por ejemplo las distribuciones de los compósitos originales con valores simulados; dos tipos de muestreos (RC vs. DDH); o resultados de dos laboratorios diferentes.

( ) Prob{ }p pF z Z z p= ≤ =

Page 31: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

31

CUANTILES (Cont)

Una buena manera de comparar dos distribuciones es usar el gráfico Q-Q, que muestra cuantiles que se corresponden.

Para construir un Q-Q se escogen una serie de valores de probabilidades pk, k = 1, 2, …, K. Se grafica q1(pk) versus q2(pk), para k = 1, 2, …, K.

Si todos los puntos caen sobre la línea de 45º, las dos distribuciones son idénticas.

Si la línea está corrida pero es paralela a la de 45º, las dos distribuciones tienen la misma forma, pero medias diferentes.

Si la pendiente de la línea es linear, pero no es 45º, las dos distribuciones tienen distintas varianzas.

Page 32: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

32

CUANTILES (Cont)

Si la curva tiene un carácter no linera, las dos distribuciones tienen formas diferentes.

Otro gráfico que se puede utilizar es el P-P, el cual muestra las probabilidades acumuladas para pares de cuantiles. Una línea recta significa que las dos distribuciones tienen la misma forma.

Page 33: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

33

TENDENCIA CENTRAL

El valor esperado de una VA (media, o momento de primer orden) es un operador linear, y es el promedio espacial ponderado por su probabilidad de la VA:

El valor esperado de la dispersión al cuadrado con respecto a la media es la varianza (σ2):

La raíz cuadrada de la varianza es la desviación estándar. El coeficiente de variación no tiene unidades, y es la desviación estándar dividida por la media.

{ } ( ) ( )E Z m zdF z zf z dz+∞ +∞

−∞ −∞

= = =∫ ∫

2

2 2 2

2 2

2 2

{ } {[ ] }

{ 2 }

{ } 2 { }

{ }

z

z z

z z

Var Z E Z mE Z Zm mE Z m E Z mE Z m

σ

= −

= − +

= − +

= −

Page 34: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

34

TENDENCIA CENTRAL (Cont)

Hay otras medidas de la tendencia central, incluyendo la mediana, la moda

(la observación mas común), y la media geométrica:

También hay otras medidas de la dispersión. Incluyen el rango (diferencia entre los valores máximo y mínimo), el IR descripto antes, y la desviación absoluta media (MAD):

1

1

( ) ( )

( )

N

j jj

N

jj

w u z u z

w u

=

=

⋅ −∑

1

1

N N

jj

z=

Page 35: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

35

VALORES EXTREMOS Y OUTLIERS

Un número pequeño de datos puede afectar las estadísticas de manera significativa. Los parámetros mas sensibles son la media, la varianza, el coeficiente de correlación, y los variogramas.

Suponiendo que los datos no son erróneos, hay dos maneras de tratarlos: Clasificarlos como valores pertenecientes a una población diferente, y procesarlos o

estimarlos con otra metodología; Usar estadísticas robustas, tanto descriptivas como predictivas; por ejemplo, la

mediana; correlación por rango, correlograma, etc.

En la práctica, hay que entender el posible impacto de estos valores en los cálculos de recurso. Esto implica entender el impacto espacial de estos valores y en el contenido de metal final estimado.

Los gráficos de frecuencia acumulada pueden ser utilizados a veces para identificar (y corregir) valores extremos; por ejemplo, los valores extremos pueden ser alineados con la pendiente original (tendencia) de los demás valores.

Estos outliers se estudian y tratan de manera especifica, caso por caso. No hay una regla general. La consideración fundamental es su impacto en los modelos de recursos.

Page 36: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

36

DISTRIBUCIONES PARAMÉTRICAS Y NO PARAMÉTRICAS

Un modelo paramétrico tiene una expresión analítica cerrada para la distribución de probabilidades; está caracterizada por un número finito de parámetros, como por ejemplo la distribución Normal.

Las distribuciones paramétricas se utilizan en diferentes circumstancias; las mas comunes son la Normal, LogNormal, Unfirme, Triangular, y Exponencial.

La geoestadística moderna no se preocupa mucho por caracterizar distribuciones paramétricas porque cualquier distribución puede ser transformada a cualquier otra.

Las distribuciones paramétricas se utilizan mas comúnmente cuando hay poca cantidad de información.

Page 37: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

37

DISTRIBUCIONES BIVARIABLES

Es habitual considerar múltiples varaibles. No solo pueden existir mas de una ley en el depósito, sino también la ley en ubicaciones múltiples es una distribución multi-variable.

Las definiciones de la CDF y la PDF pueden extenderse a distribuciones bivariables. Se define, por ejemplo, un histograma bivariable dividiendo el rango de las variables X e Y en clases y graficando las frecuencias bivariables correspondientes.

Pero es mas común graficar simplemente los valores apereados en un diagrama de dispersión en escala aritmética o logarítmica.

Page 38: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

38

DISTRIBUCIONES BIVARIABLES (Cont)

Las medias y varianzas de cada variable se usan para caracterizar las distribuciones univariables. La covarianza se utiliza para caracterizar distribuciones bivariables:

La covarianza nos dice si la relación bivariable es directa o inversa. El producto de [X-mX]●[Y-mY] es positivo en los cuadrantes II y IV; es negativo en los cuadrantes I y III. El valor esperado es el promedio de todos los productos posibles.

{ , } {[ ][ ]} { }

( )( ) ( , )

X Y X Y

X Y XY

Cov X Y E X m Y m E XY m m

E dx x m y m f x y dy+∞ +∞

−∞ −∞

= − − = −

= − −∫ ∫

Page 39: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

39

DISTRIBUCIONES BIVARIABLES (Cont)

Las unidades de la covarianza es el valor de una variable multiplicada por la otra. Estas unidades son difíciles de entender (Au en g/t * Ag en g/t). Por suerte, podemos estandarizar la covarianza.

El coeficiente de correlación es la covarianza dividida por las desviaciones estándar respectivas:

El coeficiente de correlación no tienen dimensiones; varía entre -1 (una relación inversa perfecta) y +1 (relación directa perfecta).

Un coeficiente de correlación = 0 significa falta de correlación, pero no de independencia! Puede ocurrir que exista una relación no linera entre ambas variables.

{ , }XY

X Y

Cov X Yρσ σ

=

Page 40: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

40

DISTRIBUCIONES BIVARIABLES (Cont)

Los valores extremos afectan notablemente la varianza y la covarianza. Los valores extremos pueden destruir una buena correlación, o mejorar una correlación mala.

El dibujo de la izquierda muestra una buena correlación con un mal coeficiente de correlación, y el de la derecha muestra una mala correlación con un buen coeficiente de correlación.

Page 41: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

41

DISTRIBUCIONES BIVARIABLES (Cont)

La correlación de rango (rank correlation) es mas robusta. La idea es calcular el coeficiente de correlación sobre el (rango) ordenamiento de los datos. Cada valor de la variable es reemplazado por su ubicación (rango) en ese ordenamiento. El coeficiente de correlación es calculado de la misma manera, pero usando las respectivas posiciones de cada dato.

Es habitual mostrar ambos coeficientes de correlación en los gráficos de dispersión. Pero todos los métodos clásicos de mínimos cuadrados requieren el uso de la covarianza tradicional, no sobre las transformaciones de los datos originales. Por lo tanto, el coeficiente de correlación de rango es una herramienta exploratorio únicamente.

Page 42: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

42

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN

Para analizar las características espaciales de las variables (leyes) se utilizan herramientas como: Estadísticas en ventanas móviles para detectar tendencias y efectos

proporcionales; Gráficos de indicadores para analizar la distribución espacial de las leyes,

especialmente el rompimiento de la estructura espacial de las leyes altas; Las curvas de nivel se pueden usar como herramientas para detectar

tendencias y otras características de los datos.

Las muestran se toman con criterio geológico, no estadístico. Las perforaciones se ubican en las zonas de mayor interés, que generalmente son zonas de alta ley.

Esta práctica lleva a la necesidad de ajustar las estadísticas descriptivas y los métodos predictivos (regresiones) para que sean representativo de todo el volumen de interés.

Page 43: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

43

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

Las técnicas de desaglomeración asignan a cada dato una ponderación basada en la redundancia (cercanía) de otros datos, ω i, i=1,…n.

El método más simple de desaglomeración es el poligonal, que determina cada ponderación proporcional al área o volumen de cada muestra. Este método funciona bien cuando los límites del área de interés están bien definidos y la razón de la ponderación mas grande a la mas pequeña es menor que 10 a 1.

El método de desaglomeración por celdas es utilizado comúnmente (Journel, 1983; Deutsch, 1989). El método funciona de la siguiente manera: Se divide el volumen de interés en una grilla de celdas l=1...,L. Se cuentan las celdas ocupadas por muestras Lo y el número de muestras en cada celda ocupada

nlo, lo=1,..,Lo. Se asigna una ponderación inversamente proporcional al número de muestras en la celda; por

ejemplo, para la muestra i que cae en la celda l, la ponderación es:

Estas ponderaciones son mayores que cero y suman 1. Cada celda que no tenga datos no recibe ponderaciones.

1i

l on Lω =

Page 44: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

44

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

En el ejemplo que se muestra aquí, el volumen de interés se divide en una malla de 36 celdas, de las cuales 33 tienen muestras.

Page 45: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

45

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

Las ponderaciones dependen del tamaño de celda y del origen definido and the origin of the grid network.

Cuando el tamaño de la celda es muy pequeño, cada muestra ocupa su propia celda, y por lo tanto las ponderaciones son idénticas, ωi = 1/n.

Cuando el tamaño de la celda es muy grande, todas las muestras ocupan una única celda, y por lo tanto otra vez ω i = 1/n.

Se deben hacer varias pruebas antes de definir el tamaño óptimo de celda, su forma, y el origen de la grilla. Es habitual escoger un tamaño de celda que se corresponda a una grilla geológica de base (de exploración inicial), tal que haya una muestra por celda en las zonas con menor cantidad de información.

Page 46: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

46

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

Se deben chequear cambios significativos en las ponderaciones para pequeños cambios en los tamaños de la celda; grandes cambios en los valores probablemente indican que las ponderaciones y las medias están siendo afectadas por algunos pocos valores extremos.

El tamaño de celda se selecciona de manera tal que las ponderaciones resultan en el menor valor de la media (muestras aglomeradas en zonas de alta ley) o mayor valor de la media (muestras aglomeradas en zonas de baja ley).

Es habitual graficar la media desaglomerada versus el tamaño de celda para ver si existen mínimos o máximos locales.

Page 47: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

47

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

Dec

lust

ered

Mea

n, P

oros

ity, %

Cell Size

0. 200. 400. 600. 800. 1000.19.0

20.0

21.0

22.0

23.0

minimum declustered mean

Page 48: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

48

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

La forma de las celdas se acomodan a la configuración de los datos. En el caso de cuerpos tabulares o vetiformes, por ejemplos, se define una geometría de celda rectangular. Igualmente, se debe considerar la mayor densidad de información en la vertical (o a lo largo del sondaje).

El origen de la grilla y el número de celdas L deben ser escogidos tal que todas las muestras sean consideradas.

Si se fija el tamaño de la celda y se cambia el origen de la grilla, los resultados serán diferentes. Para evitar este artificio del método, se deben definir varios orígenes de grilla para cada tamaño de celda. Las ponderaciones finales son el promedio de todas las ponderaciones para cada tamaño de celda.

Page 49: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

49

ANÁLISIS ESPACIAL DE LOS DATOS Y AGLOMERACIÓN (Cont)

Las ponderaciones para deasglomerar se determinan en base a la configuración de los datos; por lo tanto, todas las variables que tienen las mismas muestras requieren solo un set de ponderaciones.

Si el muestreo es desigual se requerirán diferentes ponderaciones para cada variable. Por ejemplo, no todas las muestras tienen valores de Au y Ag, lo que significa que hay que obtener un set de ponderaciones para el Au y otro diferente para la Ag.

En general, se requiere un set de ponderaciones para cada UG o dominio de estimación.

Las ponderaciones se utilizan principalmente para obtener un histograma y estadísticas representativas para cada variable; pero también se pueden usar para obtener coeficientes de correlación, aplicando cada set de ponderaciones a cada variable. De todas maneras, no son ponderaciones bivariables, por lo que no proveen una herramienta para desaglomerar el variogram, por ejemplo.

Page 50: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

50

TRANSFORMACIÓN DE LOS DATOS

Las distribuciones Gausianas se usan habitualmente debido a sus muy convenientes propiedades estadísticas.

Estas propiedades se derivan del Teorema Central del Límite, el mas importante Teorema en estadística.

Las transformaciones de los datos a otras distribuciones se hace para lidiar mejor con la predicción de los datos originales, tanto para estimaciones como para simulaciones.

Algunas transformaciones clásicas incluyen la Gausiana (Normal Scores), Log-normal, y de indicadores.

En todos los casos excepto para los indicadores, se requiere una transformación inversa, lo que trae desafíos adicionales.

Page 51: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

51

TRANSFORMACIÓN DE LOS DATOS (Cont)

Métodos basado en las distribuciones Gausianas son comunes en geoestadística. Cualquier distribución puede ser transformada a una Gausiana usando una transformación cuantil a cuantil, utilizando la de cada distribución.

Page 52: GEOESTADÍSTICA PARA EXPLORACIONES - … · DEFINICIÓN CONVENCIONAL DE LA ... Cuasi-estacionaridad es cuando los estadísticos de primer y segundo orden de la ... El muestro en yacimientos

52

TRANSFORMACIÓN DE LOS DATOS (Cont)

La transformación preserva el rango y es reversible. Una de las desventajas de este tipo de transformación es que el significado de los números se pierde, y que no se puede hacer la transformación inversa de los promedios por ser no linear.

Otro aspecto a cuidar son los valores “empatados” en la distribución original. Esto se dá cuando hay muchos valores debajo del límite de detección.

Hay dos maneras de “desempatar” (“despike”) los valores. Una manera, implementada en GSLIB, es agregar un pequeño valor aleatorio. Otra manera, es agregar un pequeño valor que depende de la media local de datos.

La transformación se aplica casi siempre a distribuciones continuas, con excepción de los métodos Gausianos truncados.