Apuntes AED AE Kriging

!"#$%&' %$ )*"+,-,- .$/$-#'%,-01/

!"#$%&$' )%*+ ,-.#$/" 0%1.23 42.$5

1A.E.D.

- Histogramas ( Distribucion , casos atipicos, tendensias) -Uso de Estadisticas descriptiva tendencia central, medidas de dispersion, medidas de forma. - Media , Moda , Mediana - desviacion estandar y varianza - Coeficiente de curtosis, sesgo y variacion. - Distribucion Normal Autocorrelation Espacial (Ej Indice de Moran)

3.Estimación

2- A.E.

Ordinario Variograma (semivariograma)Kriging Kriging Universal

()

#ˆ h

=

1

n

![Z 2n(h)

x

" Zx

+h

]2

Kriging Simple Kriging residual Co-Kriging Otros.

i =1

γ(h)

= Semivarianza

h= distancia

n(h) = Número total de pares de datos definidos para un distancia definida (lag) Z = valores de la variable para un punto específico Estudio direcional de fenomeno (Anisotropia)

Justificación del Análisis Exploratorio de Datos Espaciales .

En la aplicación de la geoestadística es de suma importancia, al igual que en otros procedimientos estadísticos (por ejemplo los modelos ARIMA dentro de la teoría de series de tiempo), el análisis gráfico. La identificación de valores extremos y su ubicación geográfica, la evaluación de la forma de la distribución y el cálculo de medidas de localización, variabilidad y correlación es muy importante para establecer si algunos supuestos necesarios para la aplicación de la teoría geoestadística son válidos o para definir que procedimiento de predicción es el más conveniente.

Por ejemplo, la decisión de usar kriging ordinario o kriging universal se fundamenta en identificar si la media es o no constante en la región. El uso de kriging log-normal se basa en un criterio empírico relacionado con la forma asimétrica de la distribución de los datos muestrales. La decisión de emplear cokriging depende de la detección de asociaciones entre las variables.

Objetivos del Análisis Exploratorio de datos:

1) Analizar (mediante herramientas estadísticas simples) la cantidad, la calidad y la ubicación de los datos disponibles. 2) Definir la(s) zona(s) de estudio. Una división del campo en varias sub-zonas puede ser relevante si uno observa cambios abruptos en la distribución espacial de valores, o si la geología del fenómeno lo indica. 3) Anticipar dificultades o problemas que puedan surgir en la fase de estimación local (por ejemplo, presencia de valores atípicos que se destacan de aquellos de los datos vecinos).

1.A.E.D.

Distribución normal Una distribución de probabilidad sigue una distribución normal, cuando la representación gráfica de su función de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y que tiene 2 puntos de inflexión situados a ambos lados de la media y a distancia igual a la desviación estándar, es decir de la forma

•

Tiene una única moda, que coincide con su media y su mediana •

La curva normal es asintótica al eje de abscisas.

•

Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

•

Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución

•

La curtosis es igual a cero (0).

•

El coeficiente de sesgo es igual a cero (0)

2&/3'3,+,%'% %$ 4,-#&,351,6* 7/&8'+

2&/3'3,+,%'% %$ %,-#&,351,6* 9/: ;7/&8'+

Conceptos básicos de estadística

•

!"#$%&"'($ %*"(+,-'.$/ -$ %$%,1' ' +/- 8<#/%/- %$ &$1/+$11,6*= %$-1&,>1,6*= ?,-5'+,@'1,6* A &$-58$* %$ %'#/- /&,:,*'%/- ' >'&0& %$ +/- B$*68$*/- %$ $-#5%,/

Para analizar los datos usualmente se construyen las tablas de frecuencias y se utilizan: ; ; ;

9' 8$%,' C$%,'*' C/%'

; ; ;

4$-?,'1,6* $-#"*%'& D'&,'*@' !/$E1,$*#$ %$ ?'&,'1,6*

; ;

!/$E1,$*#$ %$ 15&#/-,!/$E1,$*#$ %$ -$-:/

Medidas de tendencia central Medidas de dispersión

Medidas de forma

a. Medidas de tendencia central

Intentan identificar el dato más representativo de la distribución del conjunto. Son las siguientes. Media. Se le suele llamar promedio, se define como la suma de los

valores de todas las observaciones divididas por el número total de datos. Se denota con ! o X. En su cálculo intervienen todos los datos, por lo tanto, se ven influenciados por valores la variación de cualquiera de ellos. En particular, es sensible a los extremos, pues estos producen grandes modificaciones.

Mediana. Es el valor de la serie de datos que deja la mitad de las observaciones por debajo

de ella y la otra mitad por encima, es decir, divide al conjunto de datos en dos partes iguales y se denota por Me. Dado que sólo depende del orden de los datos, tiene la ventaja de que no es sensible a los valores extremos. En datos agrupados se calcula de la siguiente forma. 1. Calcular: n/2 2. La mediana será el valor de la variable cuya frecuencia absoluta acumulada primero iguale o supere a N/2. Este será el intervalo en el que se encuentra la mediana.

Moda. Es el dato que más veces se repite, es decir, aquel dato o rango que

presenta mayor frecuencia absoluta. Puede haber más de una moda en una distribución. Se denota por Mo.

b. Medidas de dispersión

Las medidas de dispersión indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Nos dan una idea sobre la homogeneidad o que tan agrupado están los datos. Desviación estándar. Indica cuánto tienden a alejarse los valores puntuales de la

media. Se suele representar por una S. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media.

Varianza. Describe la variabilidad de la distribución. Es la medida de la

desviación o dispersión de la distribución. Se calcula mediante la ecuación.

Coeficiente de variación. Mide la representatividad de la media. Valores extremos

del mismo nos llevarán a concluir que la media no es representativa, es decir, existirán valores entre las observaciones que se separan significativamente de las demás.

c. Medidas de forma

Miden el grado de deformación respecto a una curva patrón (distribución normal). Coeficiente de curtosis. Mide el grado de aplastamiento o apuntamiento de

la gráfica de la distribución de la variable estadística. Datos concentrados respecto a la media (desviación estándar pequeña) dará una grafica alargada; si los datos están dispersos la gráfica será achatada o aplastada.

F'G' 1/*1$*#&'1,6*

7/&8'+ 1/*1$*#&'1,6*

)+#' 1/*1$*#&'1,6*

Coeficiente de sesgo o asimetría: Evalúa el grado de distorsión o

inclinación que adopta la distribución de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de simetría de Pearson es:

H, !" $ %& '( %,-#&,351,6* $- -,8<#&,1'= $* $-$ 1'-/ +'- %$-?,'1,/*$- ' +' %$&$1I' A ' +' ,@J5,$&%' %$ +' 8$%,' -$ 1/8>$*-'*K H, !" ) %& +' %,-#&,351,6* $- '-,8<#&,1' *$:'0?'K 9' 8'A/&L' %$ +'/3-$&?'1,/*$- $-#"* ' +' %$&$1I' %$ +' >&/A$11,6* %$ +' 8$%,'K

H, !" * % +' %,-#&,351,6* $- '-,8<#&,1' >/-,0?'K 9' 8'A/&L' %$ +'/3-$&?'1,/*$- $-#"* ' +' ,@J5,$&%' %$ +' >&/A$11,6* %$ +' 8$%,'K

Tablas de Frecuencias

Una forma de presentar ordenadamente un grupo de observaciones, es a través de tablas de distribución de frecuencias. Para construir una tabla de frecuencia se deben ordenar los datos de menor a mayor e incluir los siguientes parámetros.

0+*(1*2(,$ 34"561#$ 72,8 0+*(1*2(,$ >*6$'.$ 7?8

0+*(1*2(,$ 34"561#$ 3(1:16$%$ 7A,8

!" *6 29:*+5 %* %$#5" ;1* *"#<2 *2 12 :,":5 ,2#*+.$65= !" 6$ @+*(1*2(,$ $4"561#$ %,.,%,%$ -5+ *6 29:*+5 #5#$6 %* %$#5"= !" 6$ "1:$ %* 6$" @+*(1*2(,$" $4"561#$" %* #5%5" 65" .$65+*" ,2@*+,5+*" 5 ,B1$6*" $6 .$65+ (52",%*+$%5= C$ 96':$ @+*(1*2(,$ $4"561#$ $(1:16$%$ *" ,B1$6 $6 29:*+5 %* ($"5"= !" *6 +*"16#$%5 %* %,.,%,+ ($%$ @+*(1*2(,$

0+*(1*2(,$ >*6$'.$ 3(1:16$%$ 70,8

$4"561#$ $(1:16$%$ -5+ *6 29:*+5 #5#$6 %* %$#5"=

A1:*+5 %* (6$"*"

3:-6,#1% %* 6$ (6$"* 5 ,2#*+.$65

I$+($ %* (6$"*

D2%,($ *6 29:*+5 %* ,2#*+.$65" *2 ;1* "* $B+1-$+$2 65" %$#5"= E* 54'*2* $6 %,.,%,+ -5+ %5"F 6$ %,@*+*2(,$ %*6 .$65+ :
En el caso de datos agrupados se deberán determinar el número de intervalos, la amplitud de los mismos y la marca de clase, de la siguiente forma:

(Cesar Perez)

Trabajo practico.

Con el fin de que este sea un ejemplo práctico para abordar el análisis geoestadistico con ArcGIS, ilustraremos todo los conceptos con un ejemplo a partir de datos de monitoreo de niveles piezométricos de agua subterránea que se presentan en la tabla siguiente. Para ello se seguirán los siguientes pasos. J$+$ +*"1:,+F 65" -$"5" $ "*B1,+ *2 *6 $2<6,"," *G-65+$#5+,5 %* 65" %$#5" "52 65" ",B1,*2#*"= MK N&:'*,@'& +/- %'#/- %$ 8$*/& ' 8'A/&K OK !'+15+'& +' #'3+' %$ B&$15$*1,'K PK Q$'+,@'& $+ I,-#/:&'8' %$ B&$15$*1,'-K RK !'+15+'& +/- >'&"8$#&/- :$/$-#'%L-01/K SK D$&,E1'1,6* %$ +' */&8'+,%'% 1/* &$->$1#/ ' +' 8$%,'= 8/%' A 8$%,'*'K TK D$&,E1'1,6* %$ +' */&8'+,%'% 1/* &$->$1#/ ' +' '-,8$#&L' I/&,@/*#'+ U1/$E1,$*#$ %$ -$-:/VK WK D$&,E1'1,6* %$ +' */&8'+,%'% 1/* &$->$1#/ '+ 1/$E1,$*#$ %$ ?'&,'1,6*K XK Q$'+,@'1,6* %$ +' #&'*-B/&8'1,6* %$ +/- %'#/-= -, $- *$1$-'&,/K YK Q$1'+15+/ %$ +/- >'&"8$#&/- $-#'%L-01/- A 1/8>'&'1,6* >'&' ?$&,E1'& +' */&8'+,%'% %$ +/- %'#/-K

1.- Resolver con la base de datos entregadas Tabla de frecuencias

A5

D2#*+.$65

I$+($ %* (6$"*

K= a= Marca clase =

@+*(1*2(,$ $4"561#$

@+*(1*2(,$ $4"561#$ $(1:16$%$

@+*(1*2(,$ +*6$'.$

@+*(1*2(,$ +*6$'.$ $(1:16$%$

2 -Resolver Grafique el histograma de frecuencias: A partir de la tabla anterior se construye el histograma de frecuencias, el cual nos da una idea del comportamiento de los datos.

3- Calcular los parámetros geoestadístico

J$+<:*#+5

K$#5" $B+1-$%5"

I*%,$ I*%,$2$ I5%$ K*".,$(,L2 *"#<2%$+ O$+,$2P$ Q5*?(,*2#* %* O$+,$(,L2 Q1+#5"," E*"B5 5 $",:*#+&$

K$#5" 25 $B+1-$%5"

IL%165 M*5"#$'"'($6 $2$6H"# %* 3+(MDE

N4"*+.$(,52*"

J$+<:*#+5" %* .$6,%$(,L2 %* A5+:$6,%$% *2 65" %$#5"= >*"-*(#5 -$+<:*#+5" %* #*2%*2(,$ (*2#+$6=

•

I* R I5R S U H5 ?'&,'1,6* 8"Z,8' $*#&$ $++'- %$3$ -$& %$ 5*' 5*,%'% UMVK +!,-(. /0.,12

>*"-*(#5 -$+<:*#+5" %* @5+:$

[* $+ 1'-/ %$ $Z,-0& '-,8$#&L' I/&,@/*#'+ = -$ >&/>/*$ -$:\* +3,-4,.5 6'78,&V= +/ -,:5,$*#$] 67 8 9

• ^_`!H`_^KS= -$ '1$>#' +' B5*1,6* %$ %,-#&,351,6* %$ >&/3'3,+,%'% 1/8/ */&8'+= -$ >5$%$ '>+,1'& $+ 8<#/%/ :$/$-#'%L-01/ ' +/%'#/-K ^KS_`!H`_M= $- *$1$-'&,/ &$'+,@'& 5*' #&'*-B/&8'1,6* %$ %'#/U*/&8'+,@'1,6*V %$ 0>/ &'L@ 15'%&'%'K

• `!HàM= $- *$1$-'&,/ I'1$& 5*' #&'*-B/&8'1,6* %$ 0>/ +/:'&L#8,1/ U+* / +/:V

•

J5+ (5*?(,*2#* %* .$+,$(,L2=

b'*#/ +' B5*1,6* %$ %,-#&,351,6* %$ +/- %'#/- 1/8/ +' ?'&,'*@' -/* B5*1,/*$- %$ +' 8$%,' +' 15'+ $- '+#'8$*#$ -$*-,3+$ ' +/- ?'+/&$- $Z#&$8/-K [* 1/*-$15$*1,' -$ %$3$ #$*$& 1/*/1,8,$*#/ %$ +' 'B$1#'1,6* %$ $-#/- ?'+/&$- $Z#&$8/- -/3&$ +' 8$%,'= >'&' $++/ -$ 1'+15+' $+ 1/$E1,$*#$ %$ ?'&,'1,6*K [* #/%/ 1'-/ -$ %$3$ ?$&,E1'& +/ -,:5,$*#$K

H, !D _ M^^= */ I'A >&/3+$8' 1/* +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/H, M^^_!D_cO^^= 9/- $B$1#/- 1'5-'%/- >/& +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/- -/* #/+$&'3+$H, !DaO^^= -$ 0$*$ >&/3+$8'- -$?$&/- 1/* +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/-K [-#/ $- ,8>/&#'*#$= >5$- $* 1'-/ %$ J5$ +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/- 'B$1#$* ' +' 85$-#&' / ' +' %,-#&,351,6* %$ +/- 8,-8/-= -$ %$3$&" '*'+,@'& -, $- 1/*?$*,$*#$ $+,8,*'&+/- $* 1'-/ J5$ /3$%$@1'* ' 5* $&&/& $* +' 8$%,1,6* / I'1$& 5*' #&'*-B/&8'1,6* %$ +/- %'#/- >'&' &$%51,& -5 ,*d5$*1,' $* +' 85$-#&'K

Q6$"* TUVA5.

C$45+$#5+,5" 7>*"1:*28

MK;4,-#&,351,6* */&8'+ A +/:;*/&8'+ U[G$8>+/V OK; [-#5%,/ $Z>+/&'#/&,/ %$ %'#/- U>&/1$%,8,$*#/= I$&&'8,$*#'- %$ '*"+,-,-= ?'+/&$- 'e>,1/-= $#1V PK; D'&,/:&'8' $Z>$&,8$*#'+ U1"+15+/= >'&"8$#&/-= ,*#$&>&$#'1,6*V [G$8>+/ U-, $- J5$ '+1'*@/V C/%$+'8,$*#/ %$ ?'&,/:&'8'- f $G$8>+/ RK; !'+15+/ %$ [&&/& %$ C5$-#&'- Ug*#$&?'+/- %$ 1/*E'*@'V SK; g*#$&>&$#'1,6* %$ ?'&/:&'8'TK; C'>'- ?'&,/:&'E1/WK; [+$11,6* %$ +' %,&$11,6* %$+ 1'+15+/ ?'&,/:&'E1/ U)*,-/#&/>L'V XK;C/%$+'8,$*#/ %$ ?'&,/:&'8' / 'G5-#$ %$+ ?'&,/:&'8' $Z>$&,8$*#'+K

hcX 'c R=MW

I$+($ %* (6$"*

@+*(1*2(,$ $4"561#$

@+*(1*2(,$ $4"561#$ @+*(1*2(,$ +*6$'.$ @+*(1*2(,$ +*6$'.$ $(1:16$%$ $(1:16$%$

A5

D2#*+.$65

M

O=^^WT ; T=MWWT

R=^YOT

OY

OY

^=SS

^=SS

O

T=MWWT ;M^=PRWT

X=OTOT

W

PT

^=MP

^=TX

P

M^=PRWT ;MR=SMWT

MO=RPOT

T

RO

^=MM

^=WY

R

MR=SMWT ;MX=TXWT

MT=TÔT

R

RT

^=^X

^=XW

S

MX=TXWT ;OO=XSWT

O^=WWOT

M

RW

^=Ô

^=XY

T

OO=XSWT ;OW=ÔWT

OR=YROT

R

SM

^=^X

^=YT

W

OW=ÔWT ;PM=MYWT

OY=MMOT

M

SO

^=Ô

^=YX

X

PM=MYWT ;PS=PTWT

PP=OXOT

M

SP

^=Ô

M

PS

P^

OY

OS

O^

MS

M^ W

T R

S

R M

M

M

OW=ÔWT ;PM=MYWT

PM=MYWT ;PS=PTWT

^ O=^^WT ; T=MWWT

T=MWWT ;M^=PRWT

M^=PRWT ;MR=SMWT

MR=SMWT ;MX=TXWT

MX=TXWT ;OO=XSWT

H$&,$M

OO=XSWT ;OW=ÔWT

>*"16#$%5 %* 65" -$+<:*#+5" M*5V*"#$%,"'(5" %*6 3= ! K= 2'&"8$#&/

4'#/':&5>'%/-

4'#/- */ ':&5>'%/-

C6%5+/ .$/-#'0-01'+ '*'+A-# %$ )&1.gH

C$%,'

YKRRP

YPKWWT

YPKWWT

C$%,'*'

RKXM

SKXTY

SKXTY

C/%'

RKPWX

;

;

4$-?,'1,6* $-#"*%'&

WKWR

XK^ROM

XK^ROM

D'&,'*@'

T=^RR

T=RTWS

T=RTWS

XOi

XSKXi

XSKWSi

!5&#/-,-

MKPX

MKRW^Y

H$-:/ / '-,8$#&L'

MKRT

MKRWWP

!/$E1,$*#$ %$

N3-$&?'1,/*$-

D'&,'1,6* ) +' 15&#/-,- J5$ 1'+15+' )&1.gH -$ +$ %$3$ &$-#'& P

A*(*",#$:5" 12$ #+$"@5+:$(,L2 %* A5+:$6,%$% WWWW )+:5*/-j

E,*:-+* WWW

;9/:;7/&8'+ ; Q',@ !5'%&'%' ; k; -1/&$ U >'&' %'#/- 85+01+'-$ $* 8<#/%/- %$ ,*#$:&'1,6* $->'1,'+V

>*-$"$2%5 65 $2$6,P$%5

H$ /3-$&?' +' 8$%,'= +' 8$%,'*' A +' 8/%' -/* %,B$&$*#$Media = 9.3776 Mediana = 5.869 Moda = 4.378

Diferencia > 1

!H c MKRT= ?'+/& 8'A/& J5$ M= >/& +/ #'*#/ $- *$1$-'&,/ '>+,1'& 5*' #&'*-B/&8'1,6* %$ 0>/ +/:'&L#8,1/ ' +/- %'#/-K l 0<|CS|<0.5, se acepta la funci 6n de distribuci6n de probabilidad como normal, se puede aplicar el m
datos. •0.5<|CS|<1, es necesario realizar una transformaci6n de datos (normalizaci6n) de tipo raLz cuadrada. •|CS|>1, es necesario hacer una transformaci 6n de tipo logarLtmico (ln o log)

!D c XSKX _ M^^= +/ 15'+ ,*%,1' J5$ */ I'A >&/3+$8'- 1/* ?'+/&$- $Z#&$8/-K •Si CV < 100, no hay problema con los valores extremos de los datos •Si 100200, se tiene problemas severos con los valores extremos de los datos

E,*:-+* WWW

C5BVA5+:$6

C'&1' %$ 1+'-$

B&$15$*1,' '3-/+5#'

B&$15$*1,' '3-/+5#' '1585+'%'

B&$15$*1,' &$+'0?'

B&$15$*1 ,' &$+'0?' '1585+' %'

7/

g*#$&?'+/

g*#$&?'+/

M

^=TYTY

;M=^STY

^=XX

W

W

^=MP

^=MP

O

M=^STY

;M=RMSP

M=OR

M^

MW

^=MY

^=PO

P

M=RMSP

;M=WWPW

M=SY

M^

OW

^=MY

^=SM

R

M=WWPW

;O=MPOM

M=YS

S

PO

^=^Y

^=T

S

O=MPOM

;O=RY^S

O=PM

W

PY

^=MP

^=WR

T W

O=RY^S O=XRXY

;O=XRXY ;P=O^WP

O=TW P=^P

T R

RS RY

^=MM ^=^X

^=XS ^=YO

X

P=O^WP

;P=STSW

P=PY

R

SP

^=^X

M

Q52(61,:5"

9/- %'#/- $-#"* %$*#&/ %$ +/- >'&"8$#&/- >'&' '%8,0& 5* 1/8>/&#'8,$*#/ 7/&8'+

I*%,$ R X=YT I*%,$2$ R X=ZZ I5%$ R X=[X %*".,$(,L2 *"#<2%$+R \=Z]Z .$+,$2P$ R\=^XY Q.$+,$(,52 R [X_ Q1+#5","RV\=Y] "*"B5 5 $",:*#+&$ R\=`[

)HgC[bQg) 2NHgbgD) 9: 9,

m

H/no'&$

M*5"#$'"'($6 32$6H"#

$Z>+/&'& .$+,$4,6,%$% %* %$#5"

*G$:,2$+ #*2%*2(,$" B654$6*"

)*"+,-,- $Z>+/&'#/&,/ %$ %'#/-

)*"+,-,- $-#&51#5&'+

,2.*"'B$+ 6$ $1#5(5++*6$(,L2 H 6$ (5++*6$(,L2 *2#+* 65" %$#5"

'5#/ 1/&&$+'1,6* $->'1,'+ / #$8>/&'+ p %$>$*%$*1,' $->'1,'+ ; ?'&,/:&'8' $Z>$&,8$*#'+ U'*'+,@' +' '+$'#/&,$%'%V )G5-#$ %$+ ?'&,/:&'8' U8/%$+/ 8'#$8'01/VK

[-08'1,/* h&,:,*:

C$" a*++$:,*2#$" %* $2<6,"," *2 "5bc$+*

e*2%*2(,$" %$ +/- %'#/- -$ 'G5-#'* '+:5*' B5*1,6* >/+,*/8,'+ 012(,L2 C,2*$6 7X*+ M+$%58 @7G8 R :G d 4 012(,L2 (1$%+<'($ 7E*B12%5 B+$%58 @7G8 R $GT d 4G d ( 012(,L2 J56,25:,$6 7`*+ B+$%58

!6,:,2$+ E,*:-+* WWW

e*2%*2(,$"

[- ,8>/&#'*#$ '*'+,@'& -, +/- %'#/- 8'*,E$-#'* #$*%$*1,'- %,&$11,/*'+$- J5$ >$&8,#'* $-#'3+$1$& 1/&&$+'1,/*$- $* $-'- %,&$11,/*$-= A B/&85+'& 8/%$+/- %$ 1/8>/&#'8,$*#/K

J5+ ;1* a$H #*2%*2(,$ W !" 41*25F :$65F 25 ,:-5+#$W

J$+$ 21*"#+5" %$#5" f,%+5B*56LB,(5"F !G,"#*2 #*2%*2(,$" %,+*((,52$6*"W

!"#*V 5*"#*

A5+#*VE1+

Q52#*G#1$6,P$(,L2

K52%* *"#$:5" *2 *6 $2<6,","

E,"#*:<'($

2.A.E.

Porque la autocorrelation es importante? •

E1B,*+* 6$ -+*"*2(,$ %* -+5(*"5" *"-$(,$6*"

• C51I/ %$ +/- '*"+,-,- $-#'%L-01/- $-#"* 3'-'%/ $* $+ -5>5$-#/ J5$ +/- ?'+/&$- %$ +'- /3-$&?'1,/*$- $* 1'%' 5*,%'% %$ 85$-#&$/ -/* ,*%$>$*%,$*#$- 5*/- %$ /#&/,*%$>$*%,$*#$8$*#$ %$ +' %,-#'*1,' %$ -$>'&'1,6*K

Puntos cercanos Atributos en el espacio pero independientes disimilares en de la distancia atributos

Puntos cercanos en el espacio y similar en atributos

Ref: Alfonso Condal

g-/#&/>L'r'*,-/#&/>L' g2 :*%,5 *" %*25:,2$%5 ,"L#+5-5 ", "1" -+5-,*%$%*" h",($" "52 ,%i2'($" *2 #5%$" 6$" %,+*((,52*"= g2 ","#*:$ "*+< ($6,?($%5 %* ,"L#+5-5 ", "1" -+5-,*%$%*" h",($" 7:$(+5"(L-,($"8 "52 ,2.$+,$2#*" *2 +*6$(,L2 (52 12$ %,+*((,L2 -$+'(16$+F H -5+ 65 #$2#5F ", 2,2B12$ %* *66$" -5"** %*-*2%*2(,$ %,+*((,52$6K !2 *6 ($"5 *2 ;1* 12$ "56$ %* "1" -+5-,*%$%*" "*$ %,+*((,52$6F *6 ","#*:$ (*"$ %* "*+ ,"L#+5-5j *" $2,"L#+5-5= H$ %,&" #'83,<* J5$ 5*' 8':*,#5% q-,1' $- '*,-6#&/>'= / ,-6#&/>'= -$:\* J5$ %$>$*%' / */ %$ +' %,&$11,6* -$:\* +' 15'+ -$ 8,%$K [* $+ -$*0%/ >&,8,0?/ A &$-#&,*:,%/ %$+ #<&8,*/= +' ,-/#&/>L' A +' '*,-/#&/>L' -/* >&/>,$%'%$- %$ +/- 15$&>/- / 1/*G5*#/8'1&/-16>,1/-K !2 *"#$ $(*-(,L2 B*2*+$6F $6 "*+ *6 '*:-5 H *6 *"-$(,5 :$B2,#1%*" h",($"F H -5+ *665 :*%,46*"F "* a$46$ @+*(1*2#*:*2#* %* "1 ,"5#+5-&$ 5 %* "1 $2,"5#+5-&$=

s5$*#$] bI<&t-$ H',*#;u5+,$* Uvw2[Q.[NV

)*,-/#&/>,' • !5'*%/ $Z,-#$ '+#' '5#/1/&&$+'1,6* $->'1,'+ $* 5*' %,&$11,6* $->$1LE1' 8'- J5$ $* +'- /#&'- ]

• 9' E:5&' 85$-#&' 5* 1'-/ %$ '*,-/#&/>L' :$/8<#&,1'= $+ 15'+ $,*1/&>/&'%/ '+ 8/%$+/ ?'&,/:&"E1/ ' #&'?<- %$ 5*' #&'*-B/&8'1,6* +,*$'+K

http://zappa.nku.edu/~longa/geomed/modules/geostats_lite/lec/illinois.html

b/+$&'*1,' '*:5+'&

I$-$ %* O$+,5B+$:$ / XÙ Y\

[- 5*' I$&&'8,$*#' J5$ >$&8,#$ %$#$&8,*'& +'%,&$11,/*$- %$ '*,-/#&/>L' %$

[U

+' ?'&,'3+$ $* $-#5%,/ 7$=:>-.:"*.-=- ?@<$.:=$%&-/

C$B `

,"1$/" 0%:3" &.;<:#"

[-1'+' A [-#&51#5&'-

C3M R T\ * D2#*+.$65" -*;1*k5" R U

K52%* a$H $2,"5#+5-&$ WW

Variogramas

• Supuesto estadísticos: Estacionaridad — Media y la varianza no sean función de la localidad muestreada. Estacionaridad de segundo grado (debil) – Varianza es una función de la distancia de separación entre los valores Isotropia— No tendencias direcionales presentes en los datos. Sin embargo siempre se calculan variopgramas direccionales para determinar la tendencia de los datos.

E,2 *:4$+B5 !2 $6B125" ($"5" *"#5" 25 "* (1:-6* %*4,%5 $ 6$" #*2%*2(,$" -+*"*2#*" *2 65" %$#5"= !2 *"#5" ($"5" "* "1B,*+* *6,:,2$+ 6$ #*2%*2(,$ $2#*" %*6 $2<6,","

)K QK !/*%'+r [K C$&'r 4K 2$1I

32,"5#+5-&$" *2 *6 .$+,5B+$:$/

.$*$&'+8$*#$ 15'*%/ $+ ?'&,/:&'8' $Z>$&,8$*#'+ $- 1'+15+'%/ $* %,-0*#'%,&$11,/*$- >&$-$*#' %,-0*#/- 1/8>/&#'8,$*#/- 1/* +' ?'&,'1,6* %$ +' %,-#'*1,'K

)*,-/#&/>L' .$/8<#&,1' )*,-/#&/>L' k/*'+

32,"5#+5-&$ M*5:i#+,($ /

[- 'J5$++' $* +' J5$ $+ ?'&,/:&'8' $* %,-0*#'%,&$11,/*$- >&$-$*#' $+ 8,-8/ -7'' >$&/ &'*:/- %,-0*#/-

C'A/& 1/*0*5,%'% $->'1,'+ $* +' %,&$11,6* %$ 8'A/& &'*:/

3

2,5

2 a m a r 1,5 g o ir a V

N-S E-O

1

0,5

0

C$*/& 1/*0*5,%'% $->'1,'+ $* +' %,&$11,6* %$ 8$*/& &'*:/

0, 0

0, 9

2, 0

3, 0

4, 1

5, 1

6, 2

7, 2

Distancia

8, 3

9, 3 10, 4 11, 4

3

2,5

2 a m a 1,5 r g o ir a V

N-S E-O

1

0,5

0 0,0

0,9

2,0

3,0

4,1

5,1

6,2

7,2

Distancia

8,3

9,3

10,4 11,4

32,"5#+5-&$ l52$6 / 3,5 3

[- 'J5$++' $* +' J5$ $+ ?'&,/:&'8' $* %,-0*#'%,&$11,/*$- >&$-$*#' $+ 8,-8/ &'*:/ >$&/ %,B$&$*#$ -7''

2,5 a 2 m a r g o i r 1,5 a V

1

2&$-$*1,' %$ %,B$&$*#$$-#&51#5&'-

0,5 0 0

0, 94 1, 99 3,0 4 4, 09 5,1 4 6, 19 7,2 4 8, 29 9,3 4 10,4 11,4 Distancia

3,5 3 2,5 a 2 m ra g io r 1,5 a V

1 0,5 0 0

0,94 1,99 3,04 4,0 9 5,14 6,19 7,2 4 8,29 9,3 4 10,4 11,4 Distancia

El variograma experimental

[- 5*' I$&&'8,$*#' J5$ >$&8,#$ '*'+,@'& $+ 1/8>/&#'8,$*#/ $->'1,'+ %$ 5*' >&/>,$%'% / ?'&,'3+$ -/3&$ 5*' @/*' %'%' [G$8>+/]

4$#$1#'& %,&$11,/*$- %$ '*,-/#&/>L' k/*'- %$ ,*d5$*1,' A -5 $Z#$*-,6* U1/&&$+'1,6* $->'1,'+V

D'&,'3,+,%'% 1/* +' %,-#'*1,'

D'&,/:&'8' b$6&,1/;4$E*,1,6* !:;<;=7>(> ,-?(@7(' 0,7 0,6 0,5 le b 0,4 a i r a 0,3 V

0,2 0,1 0 1

3

5

7

9

1

3

5

7

9

1

3

5

1

1

1

1

1

2

2

2

Ubicación

0,012 0,01

a m 0,008 a r g 0,006 io r a 0,004 V

0,002 0 1

3

5

7

9

1 1

Distancia

3 1

5 1

7 1

9 1

D'&,/:&'8' b$6&,1/;4$E*,1,6* !:;<;=7>(> ,-?(@7('

1

0,12

0,8

0,1

e l b 0,6 ia r a 0,4 V

a 0,08 m a r 0,06 g o i r 0,04 a V

0,2

0,02

0 0

5

10

15

20

25

0 0

Ubicación

2

4

6

8 Distancia

2

1

1,5 e l b ia r a V

0,8

a m a 0,6 r g io 0,4 r a V

1 0,5 0 1

3

5

7

9

11 1 3 1 5 1 7 1 9

-0,5

0,2 0

-1

1234567 Ubicación

Distancia

10

O$+,5B+$:$ !G-*+,:*2#$6

()

#ˆ h

=

1

n

![Z

2n(h) i

γ(h)

" Zx x

+h

]2

1

=

= Semivarianza

h= distancia

n(h) = Número total de pares de datos definidos para un distancia definida (lag) Z = valores de la variable para un punto específico

O$+,5B+$:$

()

" h

=

1 2

E [ Z ( x) ! Z ( x + h)]

2

Z x + h1

x + h1

h1 4$#$11,6* %$ 1'&'1#$&L-01'- J5$ ?'&L'* -$:\* +' %,&$11,6* A +' %,-#'*1,'

( )

Z x

x

h

(

Z x+h

x+h

)

I5:*2#5" %* g2$ .$+,$46* +*B,52$6,P$%$

O$+,5B+$:$

a m a r g o ir a V

a m ra g o ri a V

Distancia

Distancia

Variograma (semivariograma)

()

#ˆ h

=

1

n

[Z ! 2n ( h ) i =1

El semivariograma The basado semi-variogram esta en lais based on modelling modelación de lathe (squared) differences in diferencias the z-values asde a function (cuadradas) los of the distances between valores z como una all of the de known función la points. distancia entre los puntos conocidos

" Zx x

+h

]2

El variograma experimental ;

K*?2,%5 "565 $ (,*+#$" %,"#$2(,$"

;

N4#*2*+ 12 :5%*65 #*L+,(5 %*6 .$+,5B+$:$ *G-*+,:*2#$6

V 3m1"#$+ 12$ @12(,L2 (52'21$

U%$ .,&'+%/ v$*'/V

En terminos gráficos

!Nugget

(C0): Es la semivarianza a h = 0 (intercepto en Y). Indica la varianza no explicada debido a efectos de la escala y muestreo !Sill

(meseta) (C + C0) : La asintota del modelo. Indica la varianza de la variable de estudio !Range

(Rango) (A) : Distancia a la cual la semivarianza se estabiliza. Indica la extensión de la estructura de los datos. Fuera de este valor los datos vallosdatos ya no presentan autocorrelación.

Para decribir la variables regionalizadas, se calculan los variogramas empíricos y se comparan y ajustan a los modelos teóricos. Son 4 los modelos teóricos comunes: No sill or range

Linear: !(d)

=

co

+

bd

Exponential: !(d)

=

c o

+c

!

!d

[1 exp(

a

/ )]

Spherical:

#co + c[3d / 2a) % (d 3 / 2a 3 )], d $ a !(d) = " !co + c, d > a

c0 = nugget

Gaussian: !(d)

=

co

+

c[1 ! exp( ! d

Donde:

2

2

/ a )]

b = Pendiente de la regresión a = range

)K QK !/*%'+r [K C$&'r 4K 2$1I

c0+ c = sill

g*%,1' 5*' $-#&51#5&' 3,$* %$E*,%'

7/ $-#&51#5&'

g*%,1' J5$ +/%'#/- $-#'* $-#&51#5&'%/- $* 8'- %$ 5*' $-1'+' )K QK !/*%'+r [K C$&'r 4K 2$1I

g*%,1' J5$ +' $-#&51#5&' $-#' x-5'?$8$*#$y %$E*,%'

!/8>/&#'8,$*#/ +,*$'+ g*%,1' J5$ >'&' %,-#'*1,'>$J5$z'-= $+ ?'&,/:&'8' 0$*$ 5* 1/8>/&#'8,$*#/ +,*$'+K

Q$>&$-$*#' ?'&,'3+$1/*0*5'- >$&/ */ %,B$&$*1,'3+$-K )-L= +' >&/>,$%'% >5$%$ 1'83,'& &">,%'8$*#$ %$ 5* >5*#/ ' /#&/K

3,5 3 2,5 a m a 2 r g io r 1,5 a V

1 0,5 0 0

5 1,

3

5 4,

6

5 7,

9

,5 10 Distancia

3,5 3

!/8>/&#'8,$*#/ +,*$'+ 9' ?'&,'3,+,%'% %$ +' >&/>,$%'% %$>$*%$&" %$ +' >$*%,$*#$ %$ +' &$1#' $* $+ /&,:$*

2,5 a m a 2 r g o ir 1,5 a V

1 0,5 0

0 12

3 45

6 78

9 10 1 1 Distancia

) 8'A/& >$*%,$*#$= 8'A/& ?'&,'3,+,%'%

) 8$*/& >$*%,$*#$= 8$*/& ?'&,'3,+,%'%

3 2,5 a 2 m ra g 1,5 io r a V 1

0,5 0 0 1 2 3 4 5 6 7 8 9 10 11 Distancia

!/8>/&#'8,$*#/ !5'%&"01/

g*%,1' J5$ >'&' %,-#'*1,'- >$J5$z'-= $+ ?'&,/:&'8' 0$*$ 5* 1/8>/&#'8,$*#/ 15'%&"01/K

3,5 3 2,5

Q$>&$-$*#' ?'&,'3+$- -58'8$*#$ 1/*0*5'- $ ,*E*,#'8$*#$ %,B$&$*1,'3+$-K )-L= +' >&/>,$%'% 7N >5$%$ 1'83,'& &">,%'8$*#$ %$ 5* >5*#/ ' /#&/K

a m 2 a r g io r 1,5 a V

1 0,5 0

1

4

7

0 1

3 1

6 1

9 1

Distancia

2 2

5 2

8 2

1 3

4 3

7 3

!/8>/&#'8,$*#/ vL3&,%/]

8

D'&,'1,6* 8"- -5'?$ ' %,-#'*1,'- 1/&#'D'&,'1,6* 8"- B5$&#$ ' %,-#'*1,'- :&'*%$-

7 6 a m5 a r g4 o ir a3 V

2

g*%,1' >&$-$*1,' %$ $-#&51#5&'- '1#5'*%/ ' %,B$&$*#$- $-1'+'-

1 0 0

1, 5

3

4, 5

6

7,5

9 10, 5 1 2 1 3, 5 1 5 1 6, 5 1 8 Distancia

!/8>/&#'8,$*#/ ' :&'*%$%,-#'*1,'- ]

7N bN4NH 9NH D)QgN.Q)C)H 2NH[[7 {7 Q)7.N w {7 Hg99 sg7gbN

g74g!) 9) 2Q[H[7!g) 4[ {7) 4[QgD) N ABCDE

a m a r g io r a V

D)Qg)F9[ 7N [Hb)!gN7)Qg) Distancia

I5%*65" %* $m1"#* .$+,5B+$?(5

Bentos en la costa rocosa de Campeche

Brach idontes exustu s

a)

3.10

Eje espacial c)

e)

2.33

100

1.55

) 100 % ( 80 e c n 60 a d n 40 u b A20

c)

0.78

I s’ n ra o M

0.00 0.00

b)

Grain = 0.05 m Extent = 1 m 0.33

0.67

3.10

1.00

f)

2.33 1.55

Brachidontes exustus

100

0.78

0 0

20

40

60

80

10 0

1

80

0.00 0.00

Distance (m)

c’)

0.8

I 0.6 ’s n 0.4 ra o0.2 M

V

ecn 60 iar 40 a

c) 0.5

1

0

10

Log Distance (m) 20

40

60

80

1.55 0.78

0

-0.2

0.33

0.67

1.00

100

0.0d)

100

Distance (m)

"La

modificación del grano y extensión permite describir la distribución de especies con diferente nivel de precisión "La identificación de escalas optimas de observación debe de estar basada en la proporción de la varianza explicada

0.00 0.00 3.10

80 0 20 40 60 80 100

60

n 40 ir 20 V 0

G 510 ra 15 in (m 2025 )

100

60

0.78 0.00 0.00

20

1

Topography Heterogeneity Orientation Temperature Total

Grain = 4.0 m Extent = 40.0 m 13.33 26.67 40.00

h)

0.5

2.33 1.55

40

m) Ex tent (

80

g)

2.33

20

0.0

3.10

Grain = 0.15 m Extent = 1 m

%

Grain = 4.0 m Extent = 80.0 m 26.67 53.33 80.00

Separation distance (h)

0.0

1

10

100

Log distance (m) )K QK !/*%'+r [K C$&'r 4K 2$1I

Pech et al, in press (ecography)

2&'101/jj

)[4 N )K[HbQ{!b{Q)9 ||

•

` (69"#*+/ 3B+1-$:,*2#5" *2 *6 *"-$(,5 F5 (145 %* %$#5"

• T e*2(,$" -+,2(,-$6*" g2$ (1$%+$'($ 7+5m$8 H 12$ :*25" -+5212(,$%$ ;1* *G-52*2(,$6 7$P168= T%5 H `*+ 5+%*2=

• C5" :5%*65" 65" -5%*:5" B*2*+$+ (52 #*2%*2(,$" 5 ",2 $;1*66$"j %*-*2%,*2%5 %* 21*"#+5 ,2#*+i" "54+* *6 @*2L:*25F H$ ;1* 6$ #*2%*2(,$ -1*%* "*+ 65 ;1* 41"($:5"

){bN!NQQ[9)!gN7 c H[CgD)QgN.Q)C) [C2gQg!N ; !ND)Qg)7k)

)7gHNbQN2g) 4gQ[!!gN7)9

!QNHH; !ND)Qg)7![ ] Q[2Q[H[7b) 2)Q[H 4[ 9N!)!gN7[H [7bQ[ 9NH 4)bNH

INK!CNE K! 3ngEe! O3>DNM>30DQN

I5%*65" %* E*:,.$+,$2P$"

[Hs[Qg!N

[}2N7[7!g)9

.){HHg)7N

CN4[9NH CN7NCg!NH g*%,1'* >&$-$*1,' %$ 7N [Hb)!gN7)Qg[4)4 $* '+:5*' %,&$11,6*

E*:$2$

0*(a$

J6$2 3/ E5bc$+*

J6$2 o/ E,2 "5bc$+*

!:#:$=A.$

9FG

M 3FH

)*"+,-,- ?'&,/:&"E1/ r

IFJ

[-08'1,6* %$ &$15&-/- U1+'-$V

BCD

O

[-#5%,/ $Z>+/&'#/&,/ %$ %'#/-

1/*-5+#'- #'++$& UCK2[Q[kV

Q52#+56

9KK

h&,:,*: A $-08'1,6* %$ &$15&-/-

3KL

H,85+'1,6* :$/$-#'%L-01' U1+'-$V

EFG

C,4+* gEI 7($6*2%$+,58

BFH

0*+,$%5

9KM H,85+'1,6* :$/$-#'%L-01' U+'3V

P

b&'3'G/ 3L% %$ +'3

EIC

b&'3'G/ %$ +'3

r

1/*-5+#'- #'++$& UC2[Q[kV

C,4+* gEI 7($6*2%$+,58

?%$." BC

0*+,$%5

9G b&'3'G/ %$ +'3

R

3H

IJ b&'3'G/ %$ +'3 BD

b&'3'G/ %$ +'3

Q!>e3I!A

!2#+*B$ ,2@5+:*" 7%5" #$66*+*"8

b&'3'G/ %$ +'3

3.ESTIMACIÓN

h&,:,*:

[+ >&/3+$8' :$*$&'+ %$ +'- >&$%,11,/*$Existe siempre un interes en predecir el valor Z en un punto X, Y (Yx,y) dado los valores de Zi, en donde i representa un punto conocido. Pero…. 1. No se tiene información 2. Se conoce información en puntos cercanos

)K QK !/*%'+r [K C$&'r 4K 2$1I

?

h&,:,*: Los valores no conocidos son calculados empleando los valores circundantes de los puntos de referencia. Los valores circundantes son ponderados antes de predecir el valor del punto no muestreado La ponderación esta basada en la distancia existente entre los puntos de referencia, la el punto que se quiere predecir y el arreglo (estructura) espacial de los puntos de referencia

Kriging esta basado en la téoría de las variables regionalizadas y asume que la variación espacial es estadísticamente homogenea a través de toda la extensión de interes. Esto es que el mismo patrón de variación esta presente en todas los puntos.

h&,:,*:

Kriging produce el mejor estimador lineal (sin tendencia) de los puntos no muestreados siempre y cuando la semivarianza de los datos y el modelo hayan sido previamente modelados.

e,-5" %* p+,2B,2B

Kriging Ordinario Kriging Universal Kriging Simple Kriging residual __________ Co-Kriging Geo-Multivariada _____ Simulation Multipoint. Geo - No Lineal

h&,:,*: • Kriging ordinario: empleado cuando no existen direcciones específicas en las tendencias de los datos.

• Kriging universal. Considera direccionalidad de los datos (en sistemas de información geográfica la dereccionalidad es modelada por una constante linear, de segundo o de tercer orden).

• kriging puntual : Produces valores para puntos específicos no muestreados.

• Kriging en bloques: Produce valores produces para areas. Los valores estimados tienen varianza pequeña debido a que son derivados del promedio de un bloque de puntos de referencia.

• Co-kriging: Emplea 2 o mas variables para estimar valores no conocidos en uno de ellos (e.g: composición del suelo y contenido de agua del suelo). )K QK !/*%'+r [K C$&'r 4K 2$1I

Se pretende estimar el valor del punto 0(65E, 137N), basados en la información de los puntos circundantes (7). La tabla indica las coordenadas (x,y) de los 7 puntos de referencia y la distancia existente entre estos (v) y el punto 0 (punto a estimar). )K QK !/*%'+r [K C$&'r 4K 2$1I

Variogram model

Covariance function

Parameters: C0 = 0, a = 10, C1 = 10 )K QK !/*%'+r [K C$&'r 4K 2$1I

To solve for the weights, we multiply both sides by C-1, the inverse of the left-hand side covariance matrix:

)K QK !/*%'+r [K C$&'r 4K 2$1I

h&,:,*: 8'#&,1$Matrix de distancia

Covariances se calculan en base a la distancia entre todos los puntos de referencia y el punto de interes :

C(h) = 10 e –0.3|h|

h&,:,*: 8'#&,1$-

)K QK !/*%'+r [K C$&'r 4K 2$1I

Q$-5+#Kriging weights:

Estimated value for point 0:

)K QK !/*%'+r [K C$&'r 4K 2$1I

e$+*$" %* *"#1%,5/

MK; Q$'+,@'& $* .Hf Ar/ C/%5+/ .$/$-#'%,-01' )&1.gH= $+ '*'+,-,- $Z>+/&'#/&,/ %$ %'#/-= $-#&51#5&'+= 'G5-#$ ?'&,:&'E1/= $-08'1,6* h&,:,*: A /3#$*1,6* %$+ 8'>' 8/%$+'%/K OK; Q$'+,@'& $* .Hf Ar/ C/%5+/ .$/$-#'%,-01' )&1.gH = +'- #&$- $#'>'- %$ '*"+,-,%$ 5* >&/1$-/ :$/$-#'%,-01/ >'&' +/- %'#/- $*#&$:'%/- >/& :&5>/-K s$1I' %$ &$?,-,6* A 1/*-5+#'- #'++$& 8/%$+'8,$*#/ %$ -$z'+$- ~gsg] C,<&1/+$- MTK PK; [-#5%,'& $+ 1'+15+/ %$ $-08'1,6* h&,:,*: N&%,*'&,/= %$ +'- 5+08'>&$-$*#'1,/*$- %$ $-#' >&$-$*#'1,6*K

Apuntes AED AE Kriging

Recommend Documents