Avståndsprovtagning
Avståndsprovtagning är en allmänt använd grupp av närbesläktade metoder för att uppskatta tätheten och/eller förekomsten av populationer . De huvudsakliga metoderna är baserade på linjetransekter eller punkttransekter . I denna provtagningsmetod är de insamlade data avstånden för objekten som undersöks från dessa slumpmässigt placerade linjer eller punkter, och målet är att uppskatta medeldensiteten för objekten inom en region.
Grundläggande linjetransektmetodik
Ett vanligt tillvägagångssätt för avståndssampling är användningen av linjetransekter. Observatören korsar en rät linje (placerad slumpmässigt eller efter någon planerad fördelning). Närhelst de observerar ett objekt av intresse (t.ex. ett djur av den typ som undersöks), registrerar de avståndet från sin nuvarande position till objektet ( r ), såväl som vinkeln för detekteringen till transektlinjen ( θ ). Objektets avstånd till transekten kan då beräknas som x = r * sin( θ ). Dessa avstånd x är detektionsavstånden som kommer att analyseras i vidare modellering.
Objekt detekteras ut till ett förutbestämt maximalt detektionsavstånd w . Inte alla objekt inom w kommer att detekteras, men ett grundläggande antagande är att alla objekt på noll avstånd (dvs på själva linjen) detekteras. Den totala detektionssannolikheten förväntas alltså vara 1 på linjen och minska med ökande avstånd från linjen. Fördelningen av de observerade avstånden används för att uppskatta en "detektionsfunktion" som beskriver sannolikheten att detektera ett objekt på ett givet avstånd. Med tanke på att olika grundläggande antaganden gäller, tillåter denna funktion uppskattningen av den genomsnittliga sannolikheten P för att detektera ett objekt givet som ligger inom linjens bredd w . Objektdensitet kan sedan uppskattas som D = n / ( P * a ) , där n är antalet detekterade objekt och a är storleken på det täckta området (transektens totala längd ( L ) multiplicerat med 2 w ).
Sammanfattningsvis, modellering av hur detekterbarheten avtar med ökande avstånd från transekten gör det möjligt att uppskatta hur många objekt det finns totalt i området av intresse, baserat på antalet som faktiskt observerades.
Undersökningsmetodiken för punkttransekter är något annorlunda. I detta fall förblir observatören stillastående, undersökningen slutar inte när slutet av transekten nås utan efter en förutbestämd tid, och uppmätta avstånd till observatören används direkt utan omvandling till tvärgående avstånd. Detekteringsfunktionstyper och anpassning skiljer sig också till viss del.
Detektionsfunktion
Avfallet av detekterbarhet med ökande avstånd från transektlinjen modelleras med hjälp av en detektionsfunktion g( y ) (här är y avståndet från linjen). Denna funktion är anpassad till fördelningen av detektionsområden som representeras som en sannolikhetstäthetsfunktion (PDF). PDF:en är ett histogram över insamlade avstånd och beskriver sannolikheten för att ett objekt på avstånd y kommer att detekteras av en observatör på mittlinjen, med detektioner på själva linjen ( y = 0) antas vara säkra ( P = 1).
Företrädesvis är g( y ) en robust funktion som kan representera data med oklara eller svagt definierade fördelningsegenskaper, vilket ofta är fallet i fältdata. Flera typer av funktioner används ofta, beroende på den allmänna formen på detektionsdatas PDF:
Detektionsfunktion | Form |
---|---|
Enhetlig | 1/ v |
Halvnormalt | exp(- y 2 /2 σ 2 ) |
Farograd | 1-exp(-( y / σ ) -b ) |
Negativ exponentiell | exp(- ay ) |
Här är w det övergripande detektionstrunkeringsavståndet och a , b och σ är funktionsspecifika parametrar. Halvnormal- och riskhastighetsfunktionerna anses generellt vara mest sannolika för att representera fältdata som samlats in under välkontrollerade förhållanden. Detektionssannolikhet som verkar öka eller förbli konstant med avståndet från transektlinjen kan indikera problem med datainsamling eller undersökningsdesign.
Kovariater
Serieutvidgningar
En ofta använd metod för att förbättra anpassningen av detekteringsfunktionen till data är användningen av serieexpansion. Här är funktionen uppdelad i en "nyckel"-del (av den typ som beskrivs ovan) och en "serie"-del; dvs g( y ) = nyckel( y )[1 + serie( y )]. Serien har i allmänhet formen av ett polynom (t.ex. ett hermitpolynom ) och är avsett att lägga till flexibilitet till nyckelfunktionens form, så att den passar bättre till data-PDF. Även om detta kan förbättra precisionen av densitets-/överflödsuppskattningar, är dess användning endast försvarbar om datamängden är av tillräcklig storlek och kvalitet för att representera en tillförlitlig uppskattning av detekteringsavståndsfördelning. Annars finns det en risk för att överanpassas och att icke-representativa egenskaper hos datamängden kan påverka anpassningsprocessen.
Antaganden och källor till partiskhet
Eftersom avståndsprovtagning är en jämförelsevis komplex undersökningsmetod, beror tillförlitligheten av modellresultaten på att ett antal grundläggande antaganden uppfylls. De mest grundläggande listas nedan. Data som härrör från undersökningar som bryter mot ett eller flera av dessa antaganden kan ofta, men inte alltid, korrigeras i viss utsträckning före eller under analys.
Antagande | Överträdelse | Förebyggande/post-hoc-korrigering | Dataexempel |
---|---|---|---|
Alla djur på själva transektlinjen detekteras (dvs P(0) = 1) | Detta kan ofta antas vid markundersökningar, men kan vara problematiskt vid undersökningar ombord. Överträdelse kan resultera i stark partiskhet av modelluppskattningar | I undersökningar med dubbla observatörer kan en observatör få i uppdrag att "bevaka mittlinjen". Post-hoc-fixar är ibland möjliga men kan vara komplicerade. Det är därför värt att undvika eventuella brott mot detta antagande |
|
Djuren är slumpmässigt och jämnt fördelade över det undersökta området | De främsta källorna till partiskhet är a) klustrade populationer (flockar etc.) men individuella detektioner behandlas som oberoende b) transekter placeras inte oberoende av täthetsgradienter (vägar, vattendrag etc.) c) transekter är för nära varandra |
a) registrera inte individer utan kluster + klusterstorlek, inkludera sedan uppskattning av klusterstorleken i detektionsfunktionen b) placera transekter antingen slumpmässigt eller över kända densitetsgradienter c) se till att maximalt detektionsområde ( w ) inte överlappar mellan transekterna |
|
Djur rör sig inte före upptäckt | Den resulterande förspänningen är försumbar om rörelsen är slumpmässig. Rörelse som svar på observatören (undvikande/attraktion) kommer att medföra en negativ/positiv fördom i detekterbarhet | Undvikandebeteende är vanligt och kan vara svårt att förebygga i fält. En effektiv post-hoc-åtgärd är att utjämna data genom att dela upp upptäckter i intervaller och genom att använda detekteringsfunktioner med en axel (t.ex. riskhastighet) | |
Mått (vinklar och avstånd) är exakta | Slumpmässiga fel är försumbara, men systematiska fel kan leda till partiskhet. Detta händer ofta med avrundning av vinklar eller avstånd till föredragna ("runda") värden, vilket resulterar i högning vid särskilda värden. Avrundning av vinklar till noll är särskilt vanligt | Undvik dead reckoning i fält genom att använda avståndsmätare och vinkeltavlor. Post-hoc-utjämning av data genom uppdelning i detekteringsintervall är effektiv för att åtgärda mindre fördomar |
Mjukvaruimplementationer
En projektgrupp vid University of St Andrews har en uppsättning paket för användning med R samt ett fristående program för Windows.
Vidare läsning
- El-Shaarawi (red) 'Encyclopedia of Environmetrics', Wiley-Blackwell, 2012 ISBN 978-0-47097-388-2 , sex volymer.