Variogram
I rumslig statistik är det teoretiska variogrammet , betecknat en funktion som beskriver graden av rumsligt beroende av ett rumsligt slumpmässigt fält eller stokastisk process . Semivariogrammet , är halva variogrammet
När det gäller ett konkret exempel från guldbrytningsområdet kommer ett variogram att ge ett mått på hur mycket två prover tagna från gruvområdet kommer att variera i guldprocent beroende på avståndet mellan dessa prover. Prover som tas långt ifrån varandra kommer att variera mer än prover som tas nära varandra.
Definition
Semivariogrammet definierades först av Matheron (1963) som hälften av den genomsnittliga kvadratskillnaden mellan värdena vid punkter ( s och ) separerade på avstånd . Formellt
där är en punkt i det geometriska fältet , och är värdet i den punkten. Trippelintegralen är över 3 dimensioner. är separationsavståndet (t.ex. i meter eller km) av intresse. Till exempel kan värdet representera järnhalten i marken, på någon plats (med geografiska koordinater för latitud, longitud och höjd) över någon region med element av volym . För att erhålla semivariogrammet för en given skulle alla par av punkter på det exakta avståndet samplas. I praktiken är det omöjligt att prova överallt, så det empiriska variogrammet används istället.
Variogrammet är dubbelt så stort som semivariogrammet och kan definieras, ekvivalent, som variansen av skillnaden mellan fältvärden på två platser ( och , notera ändring av notation från till och till ) över realiseringar av fältet (Cressie 1993):
Om det rumsliga slumpmässiga fältet har konstant medelvärde , är detta ekvivalent med förväntan på den kvadratiska ökningen av värdena mellan platserna och (Wackernagel 2003) (där och är punkter i rymden och ev. tid):
I fallet med en stationär process kan variogrammet och semivariogrammet representeras som en funktion av skillnaden endast mellan platser, genom följande relation (Cressie 1993) :
Om processen dessutom är isotropisk kan variogrammet och semivariogrammet representeras av en funktion av avståndet endast (Cressie 1993):
Indexen eller skrivs vanligtvis inte. Termerna används för alla tre formerna av funktionen. Dessutom används ibland termen "variogram" för att beteckna semivariogrammet, och symbolen används ibland för variogrammet, vilket skapar en viss förvirring.
Egenskaper
Enligt (Cressie 1993, Chiles och Delfiner 1999, Wackernagel 2003) har det teoretiska variogrammet följande egenskaper:
- Semivariogrammet är icke-negativt eftersom det är förväntningen på en ruta.
- Semivariogrammet på avstånd 0 är alltid 0, eftersom .
- En funktion är ett semivariogram om och endast om det är en villkorligt negativ definitiv funktion, dvs för alla vikter med förbehåll för och platser den rymmer:
- variansen av ges av det negativa av denna dubbelsumma och måste vara icke-negativ. [ omtvistad ]
- Om kovariansfunktionen för en stationär process existerar är den relaterad till variogram med
- Om ett stationärt slumpmässigt fält inte har något rumsligt beroende (dvs. om ), är semivariogrammet konstanten överallt utom vid origo, där det är noll.
- är en symmetrisk funktion.
- Följaktligen är en jämn funktion .
- Om det slumpmässiga fältet är stationärt och ergodiskt är lim motsvarar fältets varians. Gränsen för semivariogrammet kallas också dess tröskel .
- Som en konsekvens kan semivariogrammet vara icke-kontinuerligt endast vid ursprunget. Höjden på hoppet vid utgångspunkten kallas ibland nugget eller nugget effekt.
Parametrar
Sammanfattningsvis används följande parametrar ofta för att beskriva variogram:
- nugget : Höjden på semivariogrammets hopp vid diskontinuiteten vid origo.
- tröskel : Gräns för variogrammet som tenderar till oändliga fördröjningsavstånd.
- range : Avståndet där skillnaden mellan variogrammet och tröskeln blir försumbar. I modeller med fast tröskel är det avståndet från vilket detta först nås; för modeller med en asymptotisk tröskel, anses det konventionellt vara avståndet när semivariansen först når 95 % av tröskeln.
Empiriskt variogram
I allmänhet behövs ett empiriskt variogram för uppmätta data, eftersom exempelinformation inte är tillgänglig för varje plats. Provinformationen kan till exempel vara koncentration av järn i jordprover eller pixelintensitet på en kamera. Varje del av exempelinformation har koordinater för ett 2D-exempelutrymme där och är geografiska koordinater. När det gäller järnet i jorden kan provutrymmet vara tredimensionellt. Om det också finns tidsvariationer (t.ex. fosforhalt i en sjö) så vara en 4-dimensionell vektor . För det fall då dimensioner har olika enheter (t.ex. avstånd och tid) kan en skalningsfaktor tillämpas på var och en för att erhålla ett modifierat euklidiskt avstånd.
Provobservationer betecknas . Prover kan tas på totalt olika platser. Detta skulle tillhandahålla som en uppsättning sampel på platserna . I allmänhet visar diagram semivariogramvärdena som en funktion av provpunktseparationen . I fallet med empiriskt semivariogram används separationsavståndsfack bara är en funktion av och är inte beroende av andra variabler såsom mittposition). Sedan kan det empiriska semivariogrammet beräknas för varje bin:
Eller med andra ord, varje par av punkter separerade med (plus eller minus ett toleransområde för bin-bredd ) hittas. Dessa bildar uppsättningen av punkter . Antalet av dessa punkter i det här facket är . Sedan hittas för varje par av punkter ). Dessa kvadratiska skillnader adderas och normaliseras med det naturliga talet . Per definition divideras resultatet med 2 för semivariogrammet vid denna separation.
För beräkningshastighet behövs bara de unika poängparen. Till exempel, för 2 observationer par [ ] tagna från platser med separation endast [ ] måste beaktas, eftersom paren [ ] ger ingen ytterligare information.
Variogram modeller
Det empiriska variogrammet kan inte beräknas vid varje fördröjningsavstånd och på grund av variation i uppskattningen är det inte säkerställt att det är ett giltigt variogram, enligt definitionen ovan. Vissa geostatistiska metoder som kriging kräver dock giltiga semivariogram. I tillämpad geostatistik är de empiriska variogrammen därför ofta approximerade av modellfunktioner som säkerställer validitet (Chiles&Delfiner 1999). Några viktiga modeller är (Chiles&Delfiner 1999, Cressie 1993):
-
- Den sfäriska variogrammodellen
-
Parametern har olika värden i olika referenser, på grund av tvetydigheten i definitionen av intervallet. T.ex. är värdet som används i (Chiles&Delfiner 1999). Funktionen är 1 om och 0 annars.
Diskussion
Tre funktioner används i geostatistik för att beskriva den rumsliga eller tidsmässiga korrelationen av observationer: dessa är korrelogrammet , kovariansen och semivariogrammet . Det sista kallas också enklare variogram .
Variogrammet är nyckelfunktionen inom geostatistik eftersom det kommer att användas för att passa en modell av det observerade fenomenets tidsmässiga/ spatiala korrelation . Man gör alltså en distinktion mellan det experimentella variogrammet som är en visualisering av en möjlig spatial/temporal korrelation och variogrammodellen som vidare används för att definiera krigingfunktionens vikter . Observera att det experimentella variogrammet är en empirisk uppskattning av kovariansen av en Gaussprocess . Som sådan kanske den inte är positiv definitivt och därför inte direkt användbar i kriging , utan begränsningar eller ytterligare bearbetning. Detta förklarar varför endast ett begränsat antal variogrammodeller används: oftast den linjära, den sfäriska, den Gaussiska och de exponentiella modellerna.
Ansökningar
Det empiriska variogrammet används i geostatistik som en första uppskattning av den variogrammodell som behövs för rumslig interpolation med kriging .
- Empiriska variogram för den spatiotemporala variabiliteten av koldioxidgenomsnittad koldioxid användes för att bestämma sammanfallskriterier för satellit- och markbaserade mätningar.
- Empiriska variogram beräknades för densiteten av ett heterogent material (Gilsocarbon).
- Empiriska variogram beräknas från observationer av starka markrörelser från jordbävningar . Dessa modeller används för seismiska risk- och förlustbedömningar av rumsligt fördelad infrastruktur.
Relaterade begrepp
Den kvadratiska termen i variogrammet, till exempel , kan ersättas med olika potenser: Ett madogram definieras med den absoluta skillnaden , och ett rodogram definieras med kvadratroten av den absoluta skillnaden, . Estimatorer baserade på dessa lägre befogenheter sägs vara mer resistenta mot extremvärden . De kan generaliseras som ett "variogram av ordning α ",
- ,
där ett variogram är av ordningen 2, ett madogram är ett variogram av ordningen 1 och ett rodogram är ett variogram av ordningen 0,5.
När ett variogram används för att beskriva korrelationen mellan olika variabler kallas det korsvariogram . Cross-variogram används vid co-kriging. Skulle variabeln vara binär eller representera klasser av värden, talar man då om indikatorvariogram . Indikatorvariogram används i indikatorkriging.
Vidare läsning
- Cressie, N., 1993, Statistics for spatial data, Wiley Interscience.
- Chiles, JP, P. Delfiner, 1999, Geostatistics, Modeling Spatial Uncertainty, Wiley-Interscience.
- Wackernagel, H., 2003, Multivariate Geostatistics, Springer.
- Burrough, PA och McDonnell, RA, 1998, Principles of Geographical Information Systems.
- Isobel Clark, 1979, Practical Geostatistics, Applied Science Publishers .
- Clark, I., 1979, Practical Geostatistics , Applied Science Publishers.
- David, M., 1978, Geostatistical Ore Reserve Estimation , Elsevier Publishing.
- Hald, A., 1952, Statistisk teori med tekniska tillämpningar , John Wiley & Sons, New York.
- Journel, AG och Huijbregts, Ch. J., 1978 Mining Geostatistics , Academic Press.
- Glass, HJ, 2003, Metod för att bedöma kvaliteten på variogrammet, The Journal of The South African Institute of Mining and Metallurgy .