GeoDa
GeoDa är ett gratis programpaket som utför rumslig dataanalys , geovisualisering , rumslig autokorrelation och rumslig modellering.
Den körs på olika versioner av Windows , Mac OS och Linux . Paketet utvecklades ursprungligen av Spatial Analysis Laboratory vid University of Illinois i Urbana-Champaign under ledning av Luc Anselin . Från 2016 fortsätter utvecklingen vid Center for Spatial Data Science (CSDS) vid University of Chicago .
GeoDa har kraftfulla möjligheter att utföra rumslig analys, multivariat utforskande dataanalys och global och lokal rumslig autokorrelation . Den utför också grundläggande linjär regression . När det gäller rumsliga modeller ingår både den rumsliga fördröjningsmodellen och den rumsliga felmodellen, båda uppskattade med maximal sannolikhet .
OpenGeoDa släpps under GNU GPL version 3.0.
Historia
GeoDa ersatte det som tidigare kallades DynESDA, en modul som fungerade under det gamla ArcView 3.x för att utföra utforskande rumslig dataanalys (eller ESDA ). Aktuella utgåvor av GeoDa är inte längre beroende av närvaron av ArcView eller andra GIS-paket på ett system.
Funktionalitet
Projekt i GeoDa består i grunden av en shapefil som definierar gitterdata, och en attributtabell i ett .dbf-format. Attributtabellen kan redigeras inuti GeoDa.
Paketet är specialiserat på utforskande dataanalys och geovisualisering, där det utnyttjar tekniker för dynamisk länkning och borstning . Detta innebär att när användaren har flera vyer eller fönster i ett projekt, kommer att markera ett objekt i ett av dem att samma objekt i alla andra fönster.
GeoDa kan också producera histogram , boxplots , scatterplots för att utföra enkla utforskande analyser av data. Det viktigaste är dock möjligheten att kartlägga och koppla dessa statistiska enheter med den rumsliga fördelningen av fenomenet som användarna studerar.
Dynamisk länkning och borstning i GeoDa
Dynamisk länkning och borstning är kraftfulla enheter eftersom de tillåter användare att interaktivt upptäcka eller bekräfta misstänkta mönster av rumslig arrangemang av data eller på annat sätt förkasta existensen av dessa. Det tillåter användare att extrahera information från data i rumsliga arrangemang som annars kan kräva mycket tunga datorrutiner för att bearbeta siffrorna och ge användbara statistiska resultat. Det senare kan också kosta användarna en hel del i form av expertkunskap och mjukvarukapacitet.
Anselins Moran scatter plot
En mycket intressant enhet tillgänglig i GeoDa för att utforska globala mönster av autokorrelation i rymden är Anselins Moran -spridningsdiagram. Den här grafen visar en standardiserad variabel i x -axeln kontra den rumsliga fördröjningen för den standardiserade variabeln. Den rumsliga eftersläpningen är inget annat än en sammanfattning av effekterna av de närliggande rumsliga enheterna. Den sammanfattningen erhålls med hjälp av en rumslig viktmatris, som kan ha olika former, men en mycket vanligt använd är angränsningsmatrisen . Kontiguitetsmatrisen är en matris som har ett värde på ett i positionen (i, j) närhelst den rumsliga enheten j är angränsande till enheten i. För enkelhetens skull är matrisen standardiserad på ett sådant sätt att raderna summeras till ett genom att dividera varje värde med radsumman för den ursprungliga matrisen.
I huvudsak presenterar Anselins Moran-spridningsdiagram relationen mellan variabeln på platsen i med avseende på värdena för den variabeln på de närliggande platserna. Genom konstruktion motsvarar lutningen på linjen i spridningsdiagrammet Morans I-koefficient. Det senare är en välkänd statistik som står för den globala rumsliga autokorrelationen. Om den lutningen är positiv betyder det att det finns en positiv rumslig autokorrelation: höga värden på variabeln på plats i tenderar att klustras med höga värden på samma variabel på platser som är grannar till i och vice versa. Om lutningen i spridningsdiagrammet är negativ betyder det att vi har ett slags schackbrädemönster eller en sorts rumslig tävling där höga värden i en variabel i plats i tenderar att samlokaliseras med lägre värden i närliggande platser.
I Anselins Moran-spridningsdiagram beräknas kurvans lutning och visas ovanpå grafen. I det här fallet är detta värde positivt, vilket innebär att områden med hög kriminalitet tenderar att också ha grannar med höga satser, och vice versa.
Globala kontra lokala analyser i GeoDa
På global nivå kan vi prata om klustring , dvs den allmänna trenden för kartan som ska klustras; på lokal nivå kan vi prata om kluster , dvs vi kan peka ut var klustren finns. Det senare kan bedömas med hjälp av Local Indicators of Spatial Association - LISA . LISA- analys gör det möjligt för oss att identifiera var är områdenas höga värden för en variabel som är omgivna av höga värden på angränsande områden, dvs vad som kallas hög-höga kluster. Samtidigt identifieras även låg-låg-klustren från denna analys.
En annan typ av fenomen som är viktig att analysera i detta sammanhang är förekomsten av extremvärden som representerar höga värden på variabeln på en given plats omgiven av låga värden på närliggande platser. Denna funktion är tillgänglig i GeoDa med hjälp av Anselins Moran scatter plot. Observera dock att det faktum att ett värde är högt i jämförelse med värdena på närliggande platser inte nödvändigtvis betyder att det är en extremvärde då vi behöver bedöma den statistiska signifikansen av det sambandet. Med andra ord kan vi hitta områden där det verkar finnas kluster eller där det kan tyckas finnas kluster, men när de statistiska procedurerna genomförs blir de icke statistiskt signifikanta kluster eller extremvärden. Procedurerna som används för att bedöma statistisk signifikans består av en Monte Carlo-simulering av olika arrangemang av data och konstruktion av en empirisk fördelning av simulerad statistik. Därefter jämförs det ursprungligen erhållna värdet med fördelningen av simulerade värden och om värdet överstiger 95h-percentilen sägs det att den hittade relationen är signifikant vid 5%.
Vidare läsning
- Anselin, Luc, Xun Li och Julia Koschinsky (2021). GeoDa, från skrivbordet till ett ekosystem för att utforska rumsliga data. Förtryck
- Anselin, Luc, Ibnu Syabri och Youngihn Kho (2006). GeoDa: En introduktion till rumslig dataanalys. Geografisk analys 38, 5-22
- Anselin, Luc, Rey, Sergio J. (2014). Modern Spatial Econometrics in Practice: A Guide to GeoDa, GeoDaSpace och PySAL. GeoDa Press LLC, Chicago, IL