!"#$%&' %$ )*"+,-,- .$/$-#'%,-01/
!"#$%&$' )%*+ ,-.#$/" 0%1.23 42.$5
1A.E.D.
- Histogramas ( Distribucion , casos atipicos, tendensias) -Uso de Estadisticas descriptiva tendencia central, medidas de dispersion, medidas de forma. - Media , Moda , Mediana - desviacion estandar y varianza - Coeficiente de curtosis, sesgo y variacion. - Distribucion Normal Autocorrelation Espacial (Ej Indice de Moran)
3.Estimación
2- A.E.
Ordinario Variograma (semivariograma)Kriging Kriging Universal
()
#ˆ h
=
1
n
![Z 2n(h)
x
" Zx
+h
]2
Kriging Simple Kriging residual Co-Kriging Otros.
i =1
γ(h)
= Semivarianza
h= distancia
n(h) = Número total de pares de datos definidos para un distancia definida (lag) Z = valores de la variable para un punto específico Estudio direcional de fenomeno (Anisotropia)
Justificación del Análisis Exploratorio de Datos Espaciales .
En la aplicación de la geoestadística es de suma importancia, al igual que en otros procedimientos estadísticos (por ejemplo los modelos ARIMA dentro de la teoría de series de tiempo), el análisis gráfico. La identificación de valores extremos y su ubicación geográfica, la evaluación de la forma de la distribución y el cálculo de medidas de localización, variabilidad y correlación es muy importante para establecer si algunos supuestos necesarios para la aplicación de la teoría geoestadística son válidos o para definir que procedimiento de predicción es el más conveniente.
Por ejemplo, la decisión de usar kriging ordinario o kriging universal se fundamenta en identificar si la media es o no constante en la región. El uso de kriging log-normal se basa en un criterio empírico relacionado con la forma asimétrica de la distribución de los datos muestrales. La decisión de emplear cokriging depende de la detección de asociaciones entre las variables.
Objetivos del Análisis Exploratorio de datos:
1) Analizar (mediante herramientas estadísticas simples) la cantidad, la calidad y la ubicación de los datos disponibles. 2) Definir la(s) zona(s) de estudio. Una división del campo en varias sub-zonas puede ser relevante si uno observa cambios abruptos en la distribución espacial de valores, o si la geología del fenómeno lo indica. 3) Anticipar dificultades o problemas que puedan surgir en la fase de estimación local (por ejemplo, presencia de valores atípicos que se destacan de aquellos de los datos vecinos).
1.A.E.D.
Distribución normal Una distribución de probabilidad sigue una distribución normal, cuando la representación gráfica de su función de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y que tiene 2 puntos de inflexión situados a ambos lados de la media y a distancia igual a la desviación estándar, es decir de la forma
•
Tiene una única moda, que coincide con su media y su mediana •
La curva normal es asintótica al eje de abscisas.
•
Es simétrica con respecto a su media. Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.
•
Cuanto mayor sea la desviación estándar, más se dispersarán los datos en torno a la media y la curva será más plana. Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución
•
La curtosis es igual a cero (0).
•
El coeficiente de sesgo es igual a cero (0)
2&/3'3,+,%'% %$ 4,-#&,351,6* 7/&8'+
2&/3'3,+,%'% %$ %,-#&,351,6* 9/: ;7/&8'+
Conceptos básicos de estadística
•
!"#$%&"'($ %*"(+,-'.$/ -$ %$%,1' ' +/- 8<#/%/- %$ &$1/+$11,6*= %$-1&,>1,6*= ?,-5'+,@'1,6* A &$-58$* %$ %'#/- /&,:,*'%/- ' >'&0& %$ +/- B$*68$*/- %$ $-#5%,/
Para analizar los datos usualmente se construyen las tablas de frecuencias y se utilizan: ; ; ;
9' 8$%,' C$%,'*' C/%'
; ; ;
4$-?,'1,6* $-#"*%'& D'&,'*@' !/$E1,$*#$ %$ ?'&,'1,6*
; ;
!/$E1,$*#$ %$ 15/-,!/$E1,$*#$ %$ -$-:/
Medidas de tendencia central Medidas de dispersión
Medidas de forma
a. Medidas de tendencia central
Intentan identificar el dato más representativo de la distribución del conjunto. Son las siguientes. Media. Se le suele llamar promedio, se define como la suma de los
valores de todas las observaciones divididas por el número total de datos. Se denota con ! o X. En su cálculo intervienen todos los datos, por lo tanto, se ven influenciados por valores la variación de cualquiera de ellos. En particular, es sensible a los extremos, pues estos producen grandes modificaciones.
Mediana. Es el valor de la serie de datos que deja la mitad de las observaciones por debajo
de ella y la otra mitad por encima, es decir, divide al conjunto de datos en dos partes iguales y se denota por Me. Dado que sólo depende del orden de los datos, tiene la ventaja de que no es sensible a los valores extremos. En datos agrupados se calcula de la siguiente forma. 1. Calcular: n/2 2. La mediana será el valor de la variable cuya frecuencia absoluta acumulada primero iguale o supere a N/2. Este será el intervalo en el que se encuentra la mediana.
Moda. Es el dato que más veces se repite, es decir, aquel dato o rango que
presenta mayor frecuencia absoluta. Puede haber más de una moda en una distribución. Se denota por Mo.
b. Medidas de dispersión
Las medidas de dispersión indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Nos dan una idea sobre la homogeneidad o que tan agrupado están los datos. Desviación estándar. Indica cuánto tienden a alejarse los valores puntuales de la
media. Se suele representar por una S. Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca de la media.
Varianza. Describe la variabilidad de la distribución. Es la medida de la
desviación o dispersión de la distribución. Se calcula mediante la ecuación.
Coeficiente de variación. Mide la representatividad de la media. Valores extremos
del mismo nos llevarán a concluir que la media no es representativa, es decir, existirán valores entre las observaciones que se separan significativamente de las demás.
c. Medidas de forma
Miden el grado de deformación respecto a una curva patrón (distribución normal). Coeficiente de curtosis. Mide el grado de aplastamiento o apuntamiento de
la gráfica de la distribución de la variable estadística. Datos concentrados respecto a la media (desviación estándar pequeña) dará una grafica alargada; si los datos están dispersos la gráfica será achatada o aplastada.
F'G' 1/*1$*#&'1,6*
7/&8'+ 1/*1$*#&'1,6*
)+#' 1/*1$*#&'1,6*
Coeficiente de sesgo o asimetría: Evalúa el grado de distorsión o
inclinación que adopta la distribución de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de simetría de Pearson es:
H, !" $ %& '( %,-#&,351,6* $- -,8<#&,1'= $* $-$ 1'-/ +'- %$-?,'1,/*$- ' +' %$&$1I' A ' +' ,@J5,$&%' %$ +' 8$%,' -$ 1/8>$*-'*K H, !" ) %& +' %,-#&,351,6* $- '-,8<#&,1' *$:'0?'K 9' 8'A/&L' %$ +'/3-$&?'1,/*$- $-#"* ' +' %$&$1I' %$ +' >&/A$11,6* %$ +' 8$%,'K
H, !" * % +' %,-#&,351,6* $- '-,8<#&,1' >/-,0?'K 9' 8'A/&L' %$ +'/3-$&?'1,/*$- $-#"* ' +' ,@J5,$&%' %$ +' >&/A$11,6* %$ +' 8$%,'K
Tablas de Frecuencias
Una forma de presentar ordenadamente un grupo de observaciones, es a través de tablas de distribución de frecuencias. Para construir una tabla de frecuencia se deben ordenar los datos de menor a mayor e incluir los siguientes parámetros.
0+*(1*2(,$ 34"561#$ 72,8 0+*(1*2(,$ >*6$'.$ 7?8
0+*(1*2(,$ 34"561#$ 3(1:16$%$ 7A,8
!" *6 29:*+5 %* %$#5" ;1* *"#<2 *2 12 :,":5 ,2#*+.$65= !" 6$ @+*(1*2(,$ $4"561#$ %,.,%,%$ -5+ *6 29:*+5 #5#$6 %* %$#5"= !" 6$ "1:$ %* 6$" @+*(1*2(,$" $4"561#$" %* #5%5" 65" .$65+*" ,2@*+,5+*" 5 ,B1$6*" $6 .$65+ (52",%*+$%5= C$ 96':$ @+*(1*2(,$ $4"561#$ $(1:16$%$ *" ,B1$6 $6 29:*+5 %* ($"5"= !" *6 +*"16#$%5 %* %,.,%,+ ($%$ @+*(1*2(,$
0+*(1*2(,$ >*6$'.$ 3(1:16$%$ 70,8
$4"561#$ $(1:16$%$ -5+ *6 29:*+5 #5#$6 %* %$#5"=
A1:*+5 %* (6$"*"
3:-6,#1% %* 6$ (6$"* 5 ,2#*+.$65
I$+($ %* (6$"*
D2%,($ *6 29:*+5 %* ,2#*+.$65" *2 ;1* "* $B+1-$+$2 65" %$#5"= E* 54'*2* $6 %,.,%,+ -5+ %5"F 6$ %,@*+*2(,$ %*6 .$65+ :
En el caso de datos agrupados se deberán determinar el número de intervalos, la amplitud de los mismos y la marca de clase, de la siguiente forma:
(Cesar Perez)
Trabajo practico.
Con el fin de que este sea un ejemplo práctico para abordar el análisis geoestadistico con ArcGIS, ilustraremos todo los conceptos con un ejemplo a partir de datos de monitoreo de niveles piezométricos de agua subterránea que se presentan en la tabla siguiente. Para ello se seguirán los siguientes pasos. J$+$ +*"1:,+F 65" -$"5" $ "*B1,+ *2 *6 $2<6,"," *G-65+$#5+,5 %* 65" %$#5" "52 65" ",B1,*2#*"= MK N&:'*,@'& +/- %'#/- %$ 8$*/& ' 8'A/&K OK !'+15+'& +' #'3+' %$ B&$15$*1,'K PK Q$'+,@'& $+ I,-#/:&'8' %$ B&$15$*1,'-K RK !'+15+'& +/- >'&"8$#&/- :$/$-#'%L-01/K SK D$&,E1'1,6* %$ +' */&8'+,%'% 1/* &$->$1#/ ' +' 8$%,'= 8/%' A 8$%,'*'K TK D$&,E1'1,6* %$ +' */&8'+,%'% 1/* &$->$1#/ ' +' '-,8$#&L' I/&,@/*#'+ U1/$E1,$*#$ %$ -$-:/VK WK D$&,E1'1,6* %$ +' */&8'+,%'% 1/* &$->$1#/ '+ 1/$E1,$*#$ %$ ?'&,'1,6*K XK Q$'+,@'1,6* %$ +' #&'*-B/&8'1,6* %$ +/- %'#/-= -, $- *$1$-'&,/K YK Q$1'+15+/ %$ +/- >'&"8$#&/- $-#'%L-01/- A 1/8>'&'1,6* >'&' ?$&,E1'& +' */&8'+,%'% %$ +/- %'#/-K
1.- Resolver con la base de datos entregadas Tabla de frecuencias
A5
D2#*+.$65
I$+($ %* (6$"*
K= a= Marca clase =
@+*(1*2(,$ $4"561#$
@+*(1*2(,$ $4"561#$ $(1:16$%$
@+*(1*2(,$ +*6$'.$
@+*(1*2(,$ +*6$'.$ $(1:16$%$
2 -Resolver Grafique el histograma de frecuencias: A partir de la tabla anterior se construye el histograma de frecuencias, el cual nos da una idea del comportamiento de los datos.
3- Calcular los parámetros geoestadístico
J$+<:*#+5
K$#5" $B+1-$%5"
I*%,$ I*%,$2$ I5%$ K*".,$(,L2 *"#<2%$+ O$+,$2P$ Q5*?(,*2#* %* O$+,$(,L2 Q1+#5"," E*"B5 5 $",:*#+&$
K$#5" 25 $B+1-$%5"
IL%165 M*5"#$'"'($6 $2$6H"# %* 3+(MDE
N4"*+.$(,52*"
J$+<:*#+5" %* .$6,%$(,L2 %* A5+:$6,%$% *2 65" %$#5"= >*"-*(#5 -$+<:*#+5" %* #*2%*2(,$ (*2#+$6=
•
I* R I5R S U H5 ?'&,'1,6* 8"Z,8' $*#&$ $++'- %$3$ -$& %$ 5*' 5*,%'% UMVK +!,-(. /0.,12
>*"-*(#5 -$+<:*#+5" %* @5+:$
[* $+ 1'-/ %$ $Z,-0& '-,8$#&L' I/&,@/*#'+ = -$ >&/>/*$ -$:\* +3,-4,.5 6'78,&V= +/ -,:5,$*#$] 67 8 9
• ^_`!H`_^KS= -$ '1$>#' +' B5*1,6* %$ %,-#&,351,6* %$ >&/3'3,+,%'% 1/8/ */&8'+= -$ >5$%$ '>+,1'& $+ 8<#/%/ :$/$-#'%L-01/ ' +/%'#/-K ^KS_`!H`_M= $- *$1$-'&,/ &$'+,@'& 5*' #&'*-B/&8'1,6* %$ %'#/U*/&8'+,@'1,6*V %$ 0>/ &'L@ 15'%&'%'K
• `!H`aM= $- *$1$-'&,/ I'1$& 5*' #&'*-B/&8'1,6* %$ 0>/ +/:'&L#8,1/ U+* / +/:V
•
J5+ (5*?(,*2#* %* .$+,$(,L2=
b'*#/ +' B5*1,6* %$ %,-#&,351,6* %$ +/- %'#/- 1/8/ +' ?'&,'*@' -/* B5*1,/*$- %$ +' 8$%,' +' 15'+ $- '+#'8$*#$ -$*-,3+$ ' +/- ?'+/&$- $Z#&$8/-K [* 1/*-$15$*1,' -$ %$3$ #$*$& 1/*/1,8,$*#/ %$ +' 'B$1#'1,6* %$ $-#/- ?'+/&$- $Z#&$8/- -/3&$ +' 8$%,'= >'&' $++/ -$ 1'+15+' $+ 1/$E1,$*#$ %$ ?'&,'1,6*K [* #/%/ 1'-/ -$ %$3$ ?$&,E1'& +/ -,:5,$*#$K
H, !D _ M^^= */ I'A >&/3+$8' 1/* +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/H, M^^_!D_cO^^= 9/- $B$1#/- 1'5-'%/- >/& +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/- -/* #/+$&'3+$H, !DaO^^= -$ 0$*$ >&/3+$8'- -$?$&/- 1/* +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/-K [-#/ $- ,8>/'*#$= >5$- $* 1'-/ %$ J5$ +/- ?'+/&$- $Z#&$8/- %$ +/- %'#/- 'B$1#$* ' +' 85$-#&' / ' +' %,-#&,351,6* %$ +/- 8,-8/-= -$ %$3$&" '*'+,@'& -, $- 1/*?$*,$*#$ $+,8,*'&+/- $* 1'-/ J5$ /3$%$@1'* ' 5* $&&/& $* +' 8$%,1,6* / I'1$& 5*' #&'*-B/&8'1,6* %$ +/- %'#/- >'&' &$%51,& -5 ,*d5$*1,' $* +' 85$-#&'K
Q6$"* TUVA5.
C$45+$#5+,5" 7>*"1:*28
MK;4,-#&,351,6* */&8'+ A +/:;*/&8'+ U[G$8>+/V OK; [-#5%,/ $Z>+/&'#/&,/ %$ %'#/- U>&/1$%,8,$*#/= I$&&'8,$*#'- %$ '*"+,-,-= ?'+/&$- 'e>,1/-= $#1V PK; D'&,/:&'8' $Z>$&,8$*#'+ U1"+15+/= >'&"8$#&/-= ,*#$&>&$#'1,6*V [G$8>+/ U-, $- J5$ '+1'*@/V C/%$+'8,$*#/ %$ ?'&,/:&'8'- f $G$8>+/ RK; !'+15+/ %$ [&&/& %$ C5$-#&'- Ug*#$&?'+/- %$ 1/*E'*@'V SK; g*#$&>&$#'1,6* %$ ?'&/:&'8'TK; C'>'- ?'&,/:&'E1/WK; [+$11,6* %$ +' %,&$11,6* %$+ 1'+15+/ ?'&,/:&'E1/ U)*,-/#&/>L'V XK;C/%$+'8,$*#/ %$ ?'&,/:&'8' / 'G5-#$ %$+ ?'&,/:&'8' $Z>$&,8$*#'+K
hcX 'c R=MW
I$+($ %* (6$"*
@+*(1*2(,$ $4"561#$
@+*(1*2(,$ $4"561#$ @+*(1*2(,$ +*6$'.$ @+*(1*2(,$ +*6$'.$ $(1:16$%$ $(1:16$%$
A5
D2#*+.$65
M
O=^^WT ; T=MWWT
R=^YOT
OY
OY
^=SS
^=SS
O
T=MWWT ;M^=PRWT
X=OTOT
W
PT
^=MP
^=TX
P
M^=PRWT ;MR=SMWT
MO=RPOT
T
RO
^=MM
^=WY
R
MR=SMWT ;MX=TXWT
MT=T^OT
R
RT
^=^X
^=XW
S
MX=TXWT ;OO=XSWT
O^=WWOT
M
RW
^=^O
^=XY
T
OO=XSWT ;OW=^OWT
OR=YROT
R
SM
^=^X
^=YT
W
OW=^OWT ;PM=MYWT
OY=MMOT
M
SO
^=^O
^=YX
X
PM=MYWT ;PS=PTWT
PP=OXOT
M
SP
^=^O
M
PS
P^
OY
OS
O^
MS
M^ W
T R
S
R M
M
M
OW=^OWT ;PM=MYWT
PM=MYWT ;PS=PTWT
^ O=^^WT ; T=MWWT
T=MWWT ;M^=PRWT
M^=PRWT ;MR=SMWT
MR=SMWT ;MX=TXWT
MX=TXWT ;OO=XSWT
H$&,$M
OO=XSWT ;OW=^OWT
>*"16#$%5 %* 65" -$+<:*#+5" M*5V*"#$%,"'(5" %*6 3= ! K= 2'&"8$#&/
4'#/':&5>'%/-
4'#/- */ ':&5>'%/-
C6%5+/ .$/-#'0-01'+ '*'+A-# %$ )&1.gH
C$%,'
YKRRP
YPKWWT
YPKWWT
C$%,'*'
RKXM
SKXTY
SKXTY
C/%'
RKPWX
;
;
4$-?,'1,6* $-#"*%'&
WKWR
XK^ROM
XK^ROM
D'&,'*@'
T=^RR
T=RTWS
T=RTWS
XOi
XSKXi
XSKWSi
!5/-,-
MKPX
MKRW^Y
H$-:/ / '-,8$#&L'
MKRT
MKRWWP
!/$E1,$*#$ %$
N3-$&?'1,/*$-
D'&,'1,6* ) +' 15/-,- J5$ 1'+15+' )&1.gH -$ +$ %$3$ &$-#'& P
A*(*",#$:5" 12$ #+$"@5+:$(,L2 %* A5+:$6,%$% WWWW )+:5*/-j
E,*:-+* WWW
;9/:;7/&8'+ ; Q',@ !5'%&'%' ; k; -1/&$ U >'&' %'#/- 85+01+'-$ $* 8<#/%/- %$ ,*#$:&'1,6* $->'1,'+V
>*-$"$2%5 65 $2$6,P$%5
H$ /3-$&?' +' 8$%,'= +' 8$%,'*' A +' 8/%' -/* %,B$&$*#$Media = 9.3776 Mediana = 5.869 Moda = 4.378
Diferencia > 1
!H c MKRT= ?'+/& 8'A/& J5$ M= >/& +/ #'*#/ $- *$1$-'&,/ '>+,1'& 5*' #&'*-B/&8'1,6* %$ 0>/ +/:'&L#8,1/ ' +/- %'#/-K l 0<|CS|<0.5, se acepta la funci 6n de distribuci6n de probabilidad como normal, se puede aplicar el m
datos. •0.5<|CS|<1, es necesario realizar una transformaci6n de datos (normalizaci6n) de tipo raLz cuadrada. •|CS|>1, es necesario hacer una transformaci 6n de tipo logarLtmico (ln o log)
!D c XSKX _ M^^= +/ 15'+ ,*%,1' J5$ */ I'A >&/3+$8'- 1/* ?'+/&$- $Z#&$8/-K •Si CV < 100, no hay problema con los valores extremos de los datos •Si 100200, se tiene problemas severos con los valores extremos de los datos
E,*:-+* WWW
C5BVA5+:$6
C'&1' %$ 1+'-$
B&$15$*1,' '3-/+5#'
B&$15$*1,' '3-/+5#' '1585+'%'
B&$15$*1,' &$+'0?'
B&$15$*1 ,' &$+'0?' '1585+' %'
7/
g*#$&?'+/
g*#$&?'+/
M
^=TYTY
;M=^STY
^=XX
W
W
^=MP
^=MP
O
M=^STY
;M=RMSP
M=OR
M^
MW
^=MY
^=PO
P
M=RMSP
;M=WWPW
M=SY
M^
OW
^=MY
^=SM
R
M=WWPW
;O=MPOM
M=YS
S
PO
^=^Y
^=T
S
O=MPOM
;O=RY^S
O=PM
W
PY
^=MP
^=WR
T W
O=RY^S O=XRXY
;O=XRXY ;P=O^WP
O=TW P=^P
T R
RS RY
^=MM ^=^X
^=XS ^=YO
X
P=O^WP
;P=STSW
P=PY
R
SP
^=^X
M
Q52(61,:5"
9/- %'#/- $-#"* %$*#&/ %$ +/- >'&"8$#&/- >'&' '%8,0& 5* 1/8>/'8,$*#/ 7/&8'+
I*%,$ R X=YT I*%,$2$ R X=ZZ I5%$ R X=[X %*".,$(,L2 *"#<2%$+R \=Z]Z .$+,$2P$ R\=^XY Q.$+,$(,52 R [X_ Q1+#5","RV\=Y] "*"B5 5 $",:*#+&$ R\=`[
)HgC[bQg) 2NHgbgD) 9: 9,
m
H/no'&$
M*5"#$'"'($6 32$6H"#
$Z>+/&'& .$+,$4,6,%$% %* %$#5"
*G$:,2$+ #*2%*2(,$" B654$6*"
)*"+,-,- $Z>+/&'#/&,/ %$ %'#/-
)*"+,-,- $-#&51#5&'+
,2.*"'B$+ 6$ $1#5(5++*6$(,L2 H 6$ (5++*6$(,L2 *2#+* 65" %$#5"
'5#/ 1/&&$+'1,6* $->'1,'+ / #$8>/&'+ p %$>$*%$*1,' $->'1,'+ ; ?'&,/:&'8' $Z>$&,8$*#'+ U'*'+,@' +' '+$'#/&,$%'%V )G5-#$ %$+ ?'&,/:&'8' U8/%$+/ 8'#$8'01/VK
[-08'1,/* h&,:,*:
C$" a*++$:,*2#$" %* $2<6,"," *2 "5bc$+*
e*2%*2(,$" %$ +/- %'#/- -$ 'G5-#'* '+:5*' B5*1,6* >/+,*/8,'+ 012(,L2 C,2*$6 7X*+ M+$%58 @7G8 R :G d 4 012(,L2 (1$%+<'($ 7E*B12%5 B+$%58 @7G8 R $GT d 4G d ( 012(,L2 J56,25:,$6 7`*+ B+$%58
!6,:,2$+ E,*:-+* WWW
e*2%*2(,$"
[- ,8>/'*#$ '*'+,@'& -, +/- %'#/- 8'*,E$-#'* #$*%$*1,'- %,&$11,/*'+$- J5$ >$&8,#'* $-#'3+$1$& 1/&&$+'1,/*$- $* $-'- %,&$11,/*$-= A B/&85+'& 8/%$+/- %$ 1/8>/'8,$*#/K
J5+ ;1* a$H #*2%*2(,$ W !" 41*25F :$65F 25 ,:-5+#$W
J$+$ 21*"#+5" %$#5" f,%+5B*56LB,(5"F !G,"#*2 #*2%*2(,$" %,+*((,52$6*"W
!"#*V 5*"#*
A5+#*VE1+
Q52#*G#1$6,P$(,L2
K52%* *"#$:5" *2 *6 $2<6,","
E,"#*:<'($
2.A.E.
Porque la autocorrelation es importante? •
E1B,*+* 6$ -+*"*2(,$ %* -+5(*"5" *"-$(,$6*"
• C51I/ %$ +/- '*"+,-,- $-#'%L-01/- $-#"* 3'-'%/ $* $+ -5>5$-#/ J5$ +/- ?'+/&$- %$ +'- /3-$&?'1,/*$- $* 1'%' 5*,%'% %$ 85$-#&$/ -/* ,*%$>$*%,$*#$- 5*/- %$ /#&/,*%$>$*%,$*#$8$*#$ %$ +' %,-#'*1,' %$ -$>'&'1,6*K
Puntos cercanos Atributos en el espacio pero independientes disimilares en de la distancia atributos
Puntos cercanos en el espacio y similar en atributos
Ref: Alfonso Condal
g-/#&/>L'r'*,-/#&/>L' g2 :*%,5 *" %*25:,2$%5 ,"L#+5-5 ", "1" -+5-,*%$%*" h",($" "52 ,%i2'($" *2 #5%$" 6$" %,+*((,52*"= g2 ","#*:$ "*+< ($6,?($%5 %* ,"L#+5-5 ", "1" -+5-,*%$%*" h",($" 7:$(+5"(L-,($"8 "52 ,2.$+,$2#*" *2 +*6$(,L2 (52 12$ %,+*((,L2 -$+'(16$+F H -5+ 65 #$2#5F ", 2,2B12$ %* *66$" -5"** %*-*2%*2(,$ %,+*((,52$6K !2 *6 ($"5 *2 ;1* 12$ "56$ %* "1" -+5-,*%$%*" "*$ %,+*((,52$6F *6 ","#*:$ (*"$ %* "*+ ,"L#+5-5j *" $2,"L#+5-5= H$ %,&" #'83,<* J5$ 5*' 8':*,#5% q-,1' $- '*,-6#&/>'= / ,-6#&/>'= -$:\* J5$ %$>$*%' / */ %$ +' %,&$11,6* -$:\* +' 15'+ -$ 8,%$K [* $+ -$*0%/ >&,8,0?/ A &$-#&,*:,%/ %$+ #<&8,*/= +' ,-/#&/>L' A +' '*,-/#&/>L' -/* >&/>,$%'%$- %$ +/- 15$&>/- / 1/*G5*#/8'1&/-16>,1/-K !2 *"#$ $(*-(,L2 B*2*+$6F $6 "*+ *6 '*:-5 H *6 *"-$(,5 :$B2,#1%*" h",($"F H -5+ *665 :*%,46*"F "* a$46$ @+*(1*2#*:*2#* %* "1 ,"5#+5-&$ 5 %* "1 $2,"5#+5-&$=
s5$*#$] bI<&t-$ H',*#;u5+,$* Uvw2[Q.[NV
)*,-/#&/>,' • !5'*%/ $Z,-#$ '+#' '5#/1/&&$+'1,6* $->'1,'+ $* 5*' %,&$11,6* $->$1LE1' 8'- J5$ $* +'- /#&'- ]
• 9' E:5&' 85$-#&' 5* 1'-/ %$ '*,-/#&/>L' :$/8<#&,1'= $+ 15'+ $,*1/&>/&'%/ '+ 8/%$+/ ?'&,/:&"E1/ ' #&'?<- %$ 5*' #&'*-B/&8'1,6* +,*$'+K
http://zappa.nku.edu/~longa/geomed/modules/geostats_lite/lec/illinois.html
b/+$&'*1,' '*:5+'&
I$-$ %* O$+,5B+$:$ / X`U Y\
[- 5*' I$&&'8,$*#' J5$ >$&8,#$ %$#$&8,*'& +'%,&$11,/*$- %$ '*,-/#&/>L' %$
[U
+' ?'&,'3+$ $* $-#5%,/ 7$=:>-.:"*.-=- ?@<$.:=$%&-/
C$B `
,"1$/" 0%:3" &.;<:#"
[-1'+' A [-#&51#5&'-
C3M R T\ * D2#*+.$65" -*;1*k5" R U
K52%* a$H $2,"5#+5-&$ WW
Variogramas
• Supuesto estadísticos: Estacionaridad — Media y la varianza no sean función de la localidad muestreada. Estacionaridad de segundo grado (debil) – Varianza es una función de la distancia de separación entre los valores Isotropia— No tendencias direcionales presentes en los datos. Sin embargo siempre se calculan variopgramas direccionales para determinar la tendencia de los datos.
E,2 *:4$+B5 !2 $6B125" ($"5" *"#5" 25 "* (1:-6* %*4,%5 $ 6$" #*2%*2(,$" -+*"*2#*" *2 65" %$#5"= !2 *"#5" ($"5" "* "1B,*+* *6,:,2$+ 6$ #*2%*2(,$ $2#*" %*6 $2<6,","
)K QK !/*%'+r [K C$&'r 4K 2$1I
32,"5#+5-&$" *2 *6 .$+,5B+$:$/
.$*$&'+8$*#$ 15'*%/ $+ ?'&,/:&'8' $Z>$&,8$*#'+ $- 1'+15+'%/ $* %,-0*#'%,&$11,/*$- >&$-$*#' %,-0*#/- 1/8>/'8,$*#/- 1/* +' ?'&,'1,6* %$ +' %,-#'*1,'K
)*,-/#&/>L' .$/8<#&,1' )*,-/#&/>L' k/*'+
32,"5#+5-&$ M*5:i#+,($ /
[- 'J5$++' $* +' J5$ $+ ?'&,/:&'8' $* %,-0*#'%,&$11,/*$- >&$-$*#' $+ 8,-8/ -7'' >$&/ &'*:/- %,-0*#/-
C'A/& 1/*0*5,%'% $->'1,'+ $* +' %,&$11,6* %$ 8'A/& &'*:/
3
2,5
2 a m a r 1,5 g o ir a V
N-S E-O
1
0,5
0
C$*/& 1/*0*5,%'% $->'1,'+ $* +' %,&$11,6* %$ 8$*/& &'*:/
0, 0
0, 9
2, 0
3, 0
4, 1
5, 1
6, 2
7, 2
Distancia
8, 3
9, 3 10, 4 11, 4
3
2,5
2 a m a 1,5 r g o ir a V
N-S E-O
1
0,5
0 0,0
0,9
2,0
3,0
4,1
5,1
6,2
7,2
Distancia
8,3
9,3
10,4 11,4
32,"5#+5-&$ l52$6 / 3,5 3
[- 'J5$++' $* +' J5$ $+ ?'&,/:&'8' $* %,-0*#'%,&$11,/*$- >&$-$*#' $+ 8,-8/ &'*:/ >$&/ %,B$&$*#$ -7''
2,5 a 2 m a r g o i r 1,5 a V
1
2&$-$*1,' %$ %,B$&$*#$$-#&51#5&'-
0,5 0 0
0, 94 1, 99 3,0 4 4, 09 5,1 4 6, 19 7,2 4 8, 29 9,3 4 10,4 11,4 Distancia
3,5 3 2,5 a 2 m ra g io r 1,5 a V
1 0,5 0 0
0,94 1,99 3,04 4,0 9 5,14 6,19 7,2 4 8,29 9,3 4 10,4 11,4 Distancia
El variograma experimental
[- 5*' I$&&'8,$*#' J5$ >$&8,#$ '*'+,@'& $+ 1/8>/'8,$*#/ $->'1,'+ %$ 5*' >&/>,$%'% / ?'&,'3+$ -/3&$ 5*' @/*' %'%' [G$8>+/]
4$#$1#'& %,&$11,/*$- %$ '*,-/#&/>L' k/*'- %$ ,*d5$*1,' A -5 $Z#$*-,6* U1/&&$+'1,6* $->'1,'+V
D'&,'3,+,%'% 1/* +' %,-#'*1,'
D'&,/:&'8' b$6&,1/;4$E*,1,6* !:;<;=7>(> ,-?(@7(' 0,7 0,6 0,5 le b 0,4 a i r a 0,3 V
0,2 0,1 0 1
3
5
7
9
1
3
5
7
9
1
3
5
1
1
1
1
1
2
2
2
Ubicación
0,012 0,01
a m 0,008 a r g 0,006 io r a 0,004 V
0,002 0 1
3
5
7
9
1 1
Distancia
3 1
5 1
7 1
9 1
D'&,/:&'8' b$6&,1/;4$E*,1,6* !:;<;=7>(> ,-?(@7('
1
0,12
0,8
0,1
e l b 0,6 ia r a 0,4 V
a 0,08 m a r 0,06 g o i r 0,04 a V
0,2
0,02
0 0
5
10
15
20
25
0 0
Ubicación
2
4
6
8 Distancia
2
1
1,5 e l b ia r a V
0,8
a m a 0,6 r g io 0,4 r a V
1 0,5 0 1
3
5
7
9
11 1 3 1 5 1 7 1 9
-0,5
0,2 0
-1
1234567 Ubicación
Distancia
10
O$+,5B+$:$ !G-*+,:*2#$6
()
#ˆ h
=
1
n
![Z
2n(h) i
γ(h)
" Zx x
+h
]2
1
=
= Semivarianza
h= distancia
n(h) = Número total de pares de datos definidos para un distancia definida (lag) Z = valores de la variable para un punto específico
O$+,5B+$:$
()
" h
=
1 2
E [ Z ( x) ! Z ( x + h)]
2
Z x + h1
x + h1
h1 4$#$11,6* %$ 1'&'1#$&L-01'- J5$ ?'&L'* -$:\* +' %,&$11,6* A +' %,-#'*1,'
( )
Z x
x
h
(
Z x+h
x+h
)
I5:*2#5" %* g2$ .$+,$46* +*B,52$6,P$%$
O$+,5B+$:$
a m a r g o ir a V
a m ra g o ri a V
Distancia
Distancia
Variograma (semivariograma)
()
#ˆ h
=
1
n
[Z ! 2n ( h ) i =1
El semivariograma The basado semi-variogram esta en lais based on modelling modelación de lathe (squared) differences in diferencias the z-values asde a function (cuadradas) los of the distances between valores z como una all of the de known función la points. distancia entre los puntos conocidos
" Zx x
+h
]2
El variograma experimental ;
K*?2,%5 "565 $ (,*+#$" %,"#$2(,$"
;
N4#*2*+ 12 :5%*65 #*L+,(5 %*6 .$+,5B+$:$ *G-*+,:*2#$6
V 3m1"#$+ 12$ @12(,L2 (52'21$
U%$ .,&'+%/ v$*'/V
En terminos gráficos
!Nugget
(C0): Es la semivarianza a h = 0 (intercepto en Y). Indica la varianza no explicada debido a efectos de la escala y muestreo !Sill
(meseta) (C + C0) : La asintota del modelo. Indica la varianza de la variable de estudio !Range
(Rango) (A) : Distancia a la cual la semivarianza se estabiliza. Indica la extensión de la estructura de los datos. Fuera de este valor los datos vallosdatos ya no presentan autocorrelación.
Para decribir la variables regionalizadas, se calculan los variogramas empíricos y se comparan y ajustan a los modelos teóricos. Son 4 los modelos teóricos comunes: No sill or range
Linear: !(d)
=
co
+
bd
Exponential: !(d)
=
c o
+c
!
!d
[1 exp(
a
/ )]
Spherical:
#co + c[3d / 2a) % (d 3 / 2a 3 )], d $ a !(d) = " !co + c, d > a
c0 = nugget
Gaussian: !(d)
=
co
+
c[1 ! exp( ! d
Donde:
2
2
/ a )]
b = Pendiente de la regresión a = range
)K QK !/*%'+r [K C$&'r 4K 2$1I
c0+ c = sill
g*%,1' 5*' $-#&51#5&' 3,$* %$E*,%'
7/ $-#&51#5&'
g*%,1' J5$ +/%'#/- $-#'* $-#&51#5&'%/- $* 8'- %$ 5*' $-1'+' )K QK !/*%'+r [K C$&'r 4K 2$1I
g*%,1' J5$ +' $-#&51#5&' $-#' x-5'?$8$*#$y %$E*,%'
!/8>/'8,$*#/ +,*$'+ g*%,1' J5$ >'&' %,-#'*1,'>$J5$z'-= $+ ?'&,/:&'8' 0$*$ 5* 1/8>/'8,$*#/ +,*$'+K
Q$>&$-$*#' ?'&,'3+$1/*0*5'- >$&/ */ %,B$&$*1,'3+$-K )-L= +' >&/>,$%'% >5$%$ 1'83,'& &">,%'8$*#$ %$ 5* >5*#/ ' /#&/K
3,5 3 2,5 a m a 2 r g io r 1,5 a V
1 0,5 0 0
5 1,
3
5 4,
6
5 7,
9
,5 10 Distancia
3,5 3
!/8>/'8,$*#/ +,*$'+ 9' ?'&,'3,+,%'% %$ +' >&/>,$%'% %$>$*%$&" %$ +' >$*%,$*#$ %$ +' &$1#' $* $+ /&,:$*
2,5 a m a 2 r g o ir 1,5 a V
1 0,5 0
0 12
3 45
6 78
9 10 1 1 Distancia
) 8'A/& >$*%,$*#$= 8'A/& ?'&,'3,+,%'%
) 8$*/& >$*%,$*#$= 8$*/& ?'&,'3,+,%'%
3 2,5 a 2 m ra g 1,5 io r a V 1
0,5 0 0 1 2 3 4 5 6 7 8 9 10 11 Distancia
!/8>/'8,$*#/ !5'%&"01/
g*%,1' J5$ >'&' %,-#'*1,'- >$J5$z'-= $+ ?'&,/:&'8' 0$*$ 5* 1/8>/'8,$*#/ 15'%&"01/K
3,5 3 2,5
Q$>&$-$*#' ?'&,'3+$- -58'8$*#$ 1/*0*5'- $ ,*E*,#'8$*#$ %,B$&$*1,'3+$-K )-L= +' >&/>,$%'% 7N >5$%$ 1'83,'& &">,%'8$*#$ %$ 5* >5*#/ ' /#&/K
a m 2 a r g io r 1,5 a V
1 0,5 0
1
4
7
0 1
3 1
6 1
9 1
Distancia
2 2
5 2
8 2
1 3
4 3
7 3
!/8>/'8,$*#/ vL3&,%/]
8
D'&,'1,6* 8"- -5'?$ ' %,-#'*1,'- 1/'D'&,'1,6* 8"- B5$$ ' %,-#'*1,'- :&'*%$-
7 6 a m5 a r g4 o ir a3 V
2
g*%,1' >&$-$*1,' %$ $-#&51#5&'- '1#5'*%/ ' %,B$&$*#$- $-1'+'-
1 0 0
1, 5
3
4, 5
6
7,5
9 10, 5 1 2 1 3, 5 1 5 1 6, 5 1 8 Distancia
!/8>/'8,$*#/ ' :&'*%$%,-#'*1,'- ]
7N bN4NH 9NH D)QgN.Q)C)H 2NH[[7 {7 Q)7.N w {7 Hg99 sg7gbN
g74g!) 9) 2Q[H[7!g) 4[ {7) 4[QgD) N ABCDE
a m a r g io r a V
D)Qg)F9[ 7N [Hb)!gN7)Qg) Distancia
I5%*65" %* $m1"#* .$+,5B+$?(5
Bentos en la costa rocosa de Campeche
Brach idontes exustu s
a)
3.10
Eje espacial c)
e)
2.33
100
1.55
) 100 % ( 80 e c n 60 a d n 40 u b A20
c)
0.78
I s’ n ra o M
0.00 0.00
b)
Grain = 0.05 m Extent = 1 m 0.33
0.67
3.10
1.00
f)
2.33 1.55
Brachidontes exustus
100
0.78
0 0
20
40
60
80
10 0
1
80
0.00 0.00
Distance (m)
c’)
0.8
I 0.6 ’s n 0.4 ra o0.2 M
V
ecn 60 iar 40 a
c) 0.5
1
0
10
Log Distance (m) 20
40
60
80
1.55 0.78
0
-0.2
0.33
0.67
1.00
100
0.0d)
100
Distance (m)
"La
modificación del grano y extensión permite describir la distribución de especies con diferente nivel de precisión "La identificación de escalas optimas de observación debe de estar basada en la proporción de la varianza explicada
0.00 0.00 3.10
80 0 20 40 60 80 100
60
n 40 ir 20 V 0
G 510 ra 15 in (m 2025 )
100
60
0.78 0.00 0.00
20
1
Topography Heterogeneity Orientation Temperature Total
Grain = 4.0 m Extent = 40.0 m 13.33 26.67 40.00
h)
0.5
2.33 1.55
40
m) Ex tent (
80
g)
2.33
20
0.0
3.10
Grain = 0.15 m Extent = 1 m
%
Grain = 4.0 m Extent = 80.0 m 26.67 53.33 80.00
Separation distance (h)
0.0
1
10
100
Log distance (m) )K QK !/*%'+r [K C$&'r 4K 2$1I
Pech et al, in press (ecography)
2&'101/jj
)[4 N )K[HbQ{!b{Q)9 ||
•
` (69"#*+/ 3B+1-$:,*2#5" *2 *6 *"-$(,5 F5 (145 %* %$#5"
• T e*2(,$" -+,2(,-$6*" g2$ (1$%+$'($ 7+5m$8 H 12$ :*25" -+5212(,$%$ ;1* *G-52*2(,$6 7$P168= T%5 H `*+ 5+%*2=
• C5" :5%*65" 65" -5%*:5" B*2*+$+ (52 #*2%*2(,$" 5 ",2 $;1*66$"j %*-*2%,*2%5 %* 21*"#+5 ,2#*+i" "54+* *6 @*2L:*25F H$ ;1* 6$ #*2%*2(,$ -1*%* "*+ 65 ;1* 41"($:5"
){bN!NQQ[9)!gN7 c H[CgD)QgN.Q)C) [C2gQg!N ; !ND)Qg)7k)
)7gHNbQN2g) 4gQ[!!gN7)9
!QNHH; !ND)Qg)7![ ] Q[2Q[H[7b) 2)Q[H 4[ 9N!)!gN7[H [7bQ[ 9NH 4)bNH
INK!CNE K! 3ngEe! O3>DNM>30DQN
I5%*65" %* E*:,.$+,$2P$"
[Hs[Qg!N
[}2N7[7!g)9
.){HHg)7N
CN4[9NH CN7NCg!NH g*%,1'* >&$-$*1,' %$ 7N [Hb)!gN7)Qg[4)4 $* '+:5*' %,&$11,6*
E*:$2$
0*(a$
J6$2 3/ E5bc$+*
J6$2 o/ E,2 "5bc$+*
!:#:$=A.$
9FG
M 3FH
)*"+,-,- ?'&,/:&"E1/ r
IFJ
[-08'1,6* %$ &$15&-/- U1+'-$V
BCD
O
[-#5%,/ $Z>+/&'#/&,/ %$ %'#/-
1/*-5+#'- #'++$& UCK2[Q[kV
Q52#+56
9KK
h&,:,*: A $-08'1,6* %$ &$15&-/-
3KL
H,85+'1,6* :$/$-#'%L-01' U1+'-$V
EFG
C,4+* gEI 7($6*2%$+,58
BFH
0*+,$%5
9KM H,85+'1,6* :$/$-#'%L-01' U+'3V
P
b&'3'G/ 3L% %$ +'3
EIC
b&'3'G/ %$ +'3
r
1/*-5+#'- #'++$& UC2[Q[kV
C,4+* gEI 7($6*2%$+,58
?%$." BC
0*+,$%5
9G b&'3'G/ %$ +'3
R
3H
IJ b&'3'G/ %$ +'3 BD
b&'3'G/ %$ +'3
Q!>e3I!A
!2#+*B$ ,2@5+:*" 7%5" #$66*+*"8
b&'3'G/ %$ +'3
3.ESTIMACIÓN
h&,:,*:
[+ >&/3+$8' :$*$&'+ %$ +'- >&$%,11,/*$Existe siempre un interes en predecir el valor Z en un punto X, Y (Yx,y) dado los valores de Zi, en donde i representa un punto conocido. Pero…. 1. No se tiene información 2. Se conoce información en puntos cercanos
)K QK !/*%'+r [K C$&'r 4K 2$1I
?
h&,:,*: Los valores no conocidos son calculados empleando los valores circundantes de los puntos de referencia. Los valores circundantes son ponderados antes de predecir el valor del punto no muestreado La ponderación esta basada en la distancia existente entre los puntos de referencia, la el punto que se quiere predecir y el arreglo (estructura) espacial de los puntos de referencia
Kriging esta basado en la téoría de las variables regionalizadas y asume que la variación espacial es estadísticamente homogenea a través de toda la extensión de interes. Esto es que el mismo patrón de variación esta presente en todas los puntos.
h&,:,*:
Kriging produce el mejor estimador lineal (sin tendencia) de los puntos no muestreados siempre y cuando la semivarianza de los datos y el modelo hayan sido previamente modelados.
e,-5" %* p+,2B,2B
Kriging Ordinario Kriging Universal Kriging Simple Kriging residual __________ Co-Kriging Geo-Multivariada _____ Simulation Multipoint. Geo - No Lineal
h&,:,*: • Kriging ordinario: empleado cuando no existen direcciones específicas en las tendencias de los datos.
• Kriging universal. Considera direccionalidad de los datos (en sistemas de información geográfica la dereccionalidad es modelada por una constante linear, de segundo o de tercer orden).
• kriging puntual : Produces valores para puntos específicos no muestreados.
• Kriging en bloques: Produce valores produces para areas. Los valores estimados tienen varianza pequeña debido a que son derivados del promedio de un bloque de puntos de referencia.
• Co-kriging: Emplea 2 o mas variables para estimar valores no conocidos en uno de ellos (e.g: composición del suelo y contenido de agua del suelo). )K QK !/*%'+r [K C$&'r 4K 2$1I
Se pretende estimar el valor del punto 0(65E, 137N), basados en la información de los puntos circundantes (7). La tabla indica las coordenadas (x,y) de los 7 puntos de referencia y la distancia existente entre estos (v) y el punto 0 (punto a estimar). )K QK !/*%'+r [K C$&'r 4K 2$1I
Variogram model
Covariance function
Parameters: C0 = 0, a = 10, C1 = 10 )K QK !/*%'+r [K C$&'r 4K 2$1I
To solve for the weights, we multiply both sides by C-1, the inverse of the left-hand side covariance matrix:
)K QK !/*%'+r [K C$&'r 4K 2$1I
h&,:,*: 8'#&,1$Matrix de distancia
Covariances se calculan en base a la distancia entre todos los puntos de referencia y el punto de interes :
C(h) = 10 e –0.3|h|
h&,:,*: 8'#&,1$-
)K QK !/*%'+r [K C$&'r 4K 2$1I
Q$-5+#Kriging weights:
Estimated value for point 0:
)K QK !/*%'+r [K C$&'r 4K 2$1I
e$+*$" %* *"#1%,5/
MK; Q$'+,@'& $* .Hf Ar/ C/%5+/ .$/$-#'%,-01' )&1.gH= $+ '*'+,-,- $Z>+/&'#/&,/ %$ %'#/-= $-#&51#5&'+= 'G5-#$ ?'&,:&'E1/= $-08'1,6* h&,:,*: A /3#$*1,6* %$+ 8'>' 8/%$+'%/K OK; Q$'+,@'& $* .Hf Ar/ C/%5+/ .$/$-#'%,-01' )&1.gH = +'- #&$- $#'>'- %$ '*"+,-,%$ 5* >&/1$-/ :$/$-#'%,-01/ >'&' +/- %'#/- $*#&$:'%/- >/& :&5>/-K s$1I' %$ &$?,-,6* A 1/*-5+#'- #'++$& 8/%$+'8,$*#/ %$ -$z'+$- ~gsg] C,<&1/+$- MTK PK; [-#5%,'& $+ 1'+15+/ %$ $-08'1,6* h&,:,*: N&%,*'&,/= %$ +'- 5+08'>&$-$*#'1,/*$- %$ $-#' >&$-$*#'1,6*K