Punktprocess

I statistik och sannolikhetsteori är en punktprocess eller punktfält en samling matematiska punkter som är slumpmässigt placerade på ett matematiskt utrymme som den verkliga linjen eller det euklidiska utrymmet . Punktprocesser kan användas för rumslig dataanalys , vilket är av intresse inom så olika discipliner som skogsbruk, växtekologi, epidemiologi, geografi, seismologi, materialvetenskap, astronomi, telekommunikation, beräkningsneurovetenskap, ekonomi och andra.

Det finns olika matematiska tolkningar av en punktprocess, till exempel ett slumpmässigt räkningsmått eller en slumpmässig uppsättning. Vissa författare betraktar en punktprocess och stokastisk process som två olika objekt så att en punktprocess är ett slumpmässigt objekt som uppstår från eller är associerat med en stokastisk process, även om det har påpekats att skillnaden mellan punktprocesser och stokastiska processer inte är tydlig. . Andra betraktar en punktprocess som en stokastisk process, där processen indexeras av uppsättningar av det underliggande utrymmet på vilket det är definierat, såsom den verkliga linjen eller -dimensionellt euklidiskt utrymme. Andra stokastiska processer som förnyelse och räkneprocesser studeras i teorin om punktprocesser. Ibland är termen "punktprocess" inte att föredra, eftersom ordet "process" historiskt betecknade en utveckling av något system i tid, så punktprocess kallas också ett slumpmässigt punktfält.

Punktprocesser på den reella linjen utgör ett viktigt specialfall som är särskilt mottagligt att studera, eftersom punkterna är ordnade på ett naturligt sätt, och hela punktprocessen kan beskrivas fullständigt av de (slumpmässiga) intervallen mellan punkterna. Dessa punktprocesser används ofta som modeller för slumpmässiga händelser i tid, såsom ankomsten av kunder i en kö ( köteori ), av impulser i en neuron ( beräkningsneurovetenskap ), partiklar i en geigerräknare , placering av radiostationer i en telekommunikationsnät eller av sökningar på världsomspännande webben .

Allmän punktprocessteori

I matematik är en punktprocess ett slumpmässigt element vars värden är "punktmönster" på en uppsättning S . Medan i den exakta matematiska definitionen ett punktmönster specificeras som ett lokalt ändligt räknemått , är det tillräckligt för mer tillämpade syften att tänka på ett punktmönster som en räknebar delmängd av S som inte har några gränspunkter . [ förtydligande behövs ]

Definition

För att definiera allmänna punktprocesser börjar vi med ett sannolikhetsutrymme och ett mätbart utrymme där är ett lokalt kompakt sekundräknat Hausdorff-utrymme och är dess Borel σ-algebra . Betrakta nu en heltalsvärd lokalt ändlig kärna från till , det vill säga en mappning så att:

  1. För varje , ett lokalt ändligt mått på . [ förtydligande behövs ]
  2. För varje , är en slumpmässig variabel över .

Denna kärna definierar ett slumpmässigt mått på följande sätt. Vi skulle vilja tänka på som en avbildning som mappar till ett mått (nämligen ), där är mängden av alla lokalt ändliga mått på . Nu, för att göra denna mappning mätbar, måste vi definiera ett -fält över . Detta -fält är konstruerat som den minimala algebra så att alla utvärderingskartor av formen , där är relativt kompakt , är mätbara. Utrustad med detta -fält är ett slumpmässigt element, där för varje , är ett lokalt ändligt mått över .

Nu menar vi med en punktprocess helt enkelt ett heltalsvärde slumpmässigt mått (eller motsvarande heltalsvärde kärna) konstruerad enligt ovan. Det vanligaste exemplet för tillståndsrummet S är det euklidiska rummet Rn eller en delmängd därav, där ett särskilt intressant specialfall ges av den reella halvlinjen [0,∞). Punktprocesser är dock inte begränsade till dessa exempel och kan bland annat också användas om punkterna i sig själva är kompakta delmängder av Rn , i vilket fall ξ vanligtvis benämns en partikelprocess .

Det har noterats [ citat behövs ] att termen punktprocess inte är särskilt bra om S inte är en delmängd av den verkliga linjen, eftersom det kan antyda att ξ är en stokastisk process . Termen är emellertid väl etablerad och obestridd även i det allmänna fallet.

Representation

Varje instans (eller händelse) av en punktprocess ξ kan representeras som

där betecknar Dirac-måttet , n är en heltalsvärd slumpvariabel och är slumpmässiga element i S . Om är nästan säkert distinkta (eller motsvarande, nästan säkert för alla ), är punktprocessen känd som enkel .

En annan annorlunda men användbar representation av en händelse (en händelse i händelseutrymmet, dvs. en serie punkter) är räkningsnotationen, där varje instans representeras som en N ( t ) {\displaystyle N(t kontinuerlig funktion som tar heltalsvärden: :

observationsintervallet . Det betecknas ibland med och eller betyder .

Förväntningsmått

Förväntningsmåttet Eξ (även känt som medelmått ) för en punktprocess ξ är ett mått på S som tilldelar varje Borel-delmängd B av S det förväntade antalet punkter av ξ i B . Det är,

Laplace funktionell

Den Laplace-funktionella för en punktprocess N är en karta från mängden av alla positiva värderade funktioner f på tillståndsrummet för N , till definieras enligt följande:

De spelar en liknande roll som de karakteristiska funktionerna för slumpmässig variabel . Ett viktigt teorem säger att: två punktprocesser har samma lag om deras Laplace-funktioner är lika.

Momentmått

Den te potensen av en punktprocess, definieras på produktutrymmet enligt följande:

Genom klasssats definierar unikt produktmåttet på Förväntningen kallas e momentmåttet . Det första momentmåttet är medelmåttet.

Låt . De gemensamma intensiteterna för en punktprocess med hänsyn till Lebesgue-måttet är funktioner så att för alla disjunkta avgränsade Borel-delmängder

Gemensamma intensiteter finns inte alltid för punktprocesser. Med tanke på att moment av en slumpvariabel bestämmer slumpvariabeln i många fall kan ett liknande resultat förväntas för ledintensiteter. Detta har faktiskt visat sig i många fall.

Stationaritet

En punktprocess sägs vara stationär om har samma fördelning som för alla För en stationär punktprocess är medelmåttet för någon konstant och där står för Lebesgue-måttet. Denna kallas punktprocessens intensitet . En stationär punktprocess på har nästan säkert antingen 0 eller ett oändligt antal punkter totalt. För mer om stationära punktprocesser och slumpmässiga mätningar, se kapitel 12 i Daley & Vere-Jones. Stationaritet har definierats och studerats för punktprocesser i mer allmänna utrymmen än .

Exempel på punktprocesser

Vi ska se några exempel på punktprocesser i

Poisson point process

Det enklaste och mest förekommande exemplet på en punktprocess är Poissonpunktprocessen , som är en rumslig generalisering av Poissonprocessen . En Poisson-process (räkning) på linjen kan karakteriseras av två egenskaper: antalet punkter (eller händelser) i osammanhängande intervall är oberoende och har en Poisson-fördelning . En Poisson-punktsprocess kan också definieras med dessa två egenskaper. Vi säger nämligen att en punktprocess är en Poissonpunktprocess om följande två villkor gäller

1) är oberoende för disjunkta delmängder

2) För varje avgränsad delmängd , har en Poisson-fördelning med parametern där betecknar Lebesgue-måttet .

De två villkoren kan kombineras och skrivas enligt följande: För alla disjunkta avgränsade delmängder och icke-negativa heltal vi har det

Konstanten kallas intensiteten för Poissonpunktprocessen. Observera att Poissonpunktprocessen kännetecknas av den enda parametern Det är en enkel, stationär punktprocess. För att vara mer specifik kallar man ovanstående punktprocess för en homogen Poisson-punktprocess. En inhomogen Poisson-process definieras enligt ovan men genom att ersätta med där är en icke-negativ funktion på

Cox point process

En Cox-process (uppkallad efter Sir David Cox ) är en generalisering av Poisson-punktprocessen, genom att vi använder slumpmässiga mått i stället för . Mer formellt, låt vara ett slumpmässigt mått . En Cox-punktprocess som drivs av det slumpmässiga måttet är punktprocessen med följande två egenskaper:

  1. Givet , är Poisson fördelad med parametern för alla gränsade delmängd
  2. För varje ändlig samling av disjunkta delmängder och betingade av vi har att är oberoende.

Det är lätt att se att Poisson-punktprocessen (homogen och inhomogen) följer som speciella fall av Cox-punktsprocesser. Medelmåttet för en Cox-punktsprocess är och alltså i specialfallet med en Poisson-punktsprocess , det är

För en Cox Point-process kallas intensitetsmåttet . Vidare, om har en (slumpmässig) densitet ( Radon–Nikodym derivata ) dvs.

då kallas intensitetsfältet för Cox point-processen. Stationariteten hos intensitetsmåtten eller intensitetsfälten innebär stationariteten hos motsvarande Cox-punktsprocesser.

Det har funnits många specifika klasser av Cox Point-processer som har studerats i detalj, såsom:

  • Log-Gaussian Cox-punktprocesser: för ett Gaussiskt slumpmässigt fält
  • Skottbrus Cox point processer:, för en Poissonpunktsprocess och kärna
  • Generaliserat skottbrus Cox-punktsprocesser: en punktprocess och kärnan
  • Lévy-baserade Cox-punktsprocesser: för en Lévy-bas och kärnan och
  • Permanenta Cox-punktsprocesser: för k oberoende gaussiska slumpmässiga fält s
  • Sigmoidal Gaussian Cox punktprocesser: för ett Gaussiskt slumpmässigt fält och slumpmässigt

Genom Jensens olikhet kan man verifiera att Cox-punktsprocesser uppfyller följande olikhet: för alla avgränsade Borel-delmängder ,

där står för en Poissonpunktsprocess med intensitetsmått Således fördelas poäng med större variabilitet i en Cox-punktsprocess jämfört med en Poisson-punktsprocess. Detta kallas ibland klustring eller attraktiv egenskap hos Cox Point-processen.

Determinanta punktprocesser

En viktig klass av punktprocesser, med tillämpningar till fysik , slumpmässig matristeori och kombinatorik , är determinanta punktprocesser .

Hawkes (självspännande) processer

En Hawkes-process , även känd som en självspännande räkneprocess, är en enkel punktprocess vars villkorliga intensitet kan uttryckas som

där är en kärnfunktion som uttrycker det positiva inflytandet från tidigare händelser på det aktuella värdet av intensitetsprocessen μ är en möjligen icke-stationär funktion som representerar den förväntade, förutsägbara eller deterministiska delen av intensiteten, och är tidpunkten för den i -te händelsen i processen.

Geometriska processer

Givet en sekvens av icke-negativa slumpvariabler , om de är oberoende och cdf:en av ges av för , där är en positiv konstant, då kallas en geometrisk process (GP).

Den geometriska processen har flera förlängningar, inklusive α-serieprocessen och den dubbelgeometriska processen .

Punktprocesser på den riktiga halvlinjen

Historiskt sett hade de första punktprocesserna som studerades den reella halvlinjen R + = [0,∞) som tillståndsrum, vilket i detta sammanhang vanligtvis tolkas som tid. Dessa studier motiverades av önskemålet att modellera telekommunikationssystem, där punkterna representerade händelser i tid, såsom samtal till en telefonväxel.

Punktprocesser på R + beskrivs typiskt genom att ange sekvensen av deras (slumpmässiga) mellanhändelsetider ( T 1 , T 2 , ...), från vilka den faktiska sekvensen ( X 1 , X 2 , ...) av evenemangstider kan erhållas som

Om tiderna mellan händelser är oberoende och identiskt fördelade kallas den erhållna poängprocessen en förnyelseprocess .

Intensiteten i en punktprocess

Intensiteten λ ( t | H t ) för en punktprocess på den verkliga halvlinjen med avseende på en filtrering H t definieras som

H t kan beteckna historiken för händelsepunktstider som föregår tid t men kan också motsvara andra filtreringar (till exempel i fallet med en Cox-process).

I -notationen kan detta skrivas i en mer kompakt form:

Kompensatorn för en punktprocess, även känd som den dubbelförutsägbara projektionen , är den integrerade villkorliga intensitetsfunktionen definierad av

Relaterade funktioner

Papangelou intensitetsfunktion

Papangelou- intensitetsfunktionen för en punktprocess i det -dimensionella euklidiska rymden definieras som

där är bollen centrerad vid av en radie , och N utanför .

Sannolikhetsfunktion

Den logaritmiska sannolikheten för en parametriserad enkel punktprocess beroende på vissa observerade data skrivs som

Punktprocesser i rumslig statistik

Analysen av punktmönsterdata i en kompakt delmängd S av Rn är ett stort studieobjekt inom rumslig statistik . Sådana data förekommer inom ett brett spektrum av discipliner, bland annat

  • skogsbruk och växtekologi (positioner för träd eller växter i allmänhet)
  • epidemiologi (hemplatser för infekterade patienter)
  • zoologi (hålor eller bon av djur)
  • geografi (positioner för mänskliga bosättningar, städer eller städer)
  • seismologi (epicentra av jordbävningar)
  • materialvetenskap (positioner för defekter i industriella material)
  • astronomi (platser för stjärnor eller galaxer)
  • beräkningsneurovetenskap (spikar av neuroner).

Behovet av att använda punktprocesser för att modellera dessa typer av data ligger i deras inneboende rumsliga struktur. Följaktligen är en första fråga av intresse ofta om de givna data uppvisar fullständig rumslig slumpmässighet (dvs. är en realisering av en rumslig Poisson-process ) i motsats till att uppvisa antingen rumslig aggregering eller rumslig inhibering.

Däremot består många datamängder som betraktas i klassisk multivariatstatistik av oberoende genererade datapunkter som kan styras av en eller flera kovariater (vanligtvis icke-spatiala).

Förutom applikationerna i rumslig statistik är punktprocesser ett av de grundläggande objekten inom stokastisk geometri . Forskningen har också i stor utsträckning fokuserat på olika modeller byggda på punktprocesser som Voronoi-tesselationer , slumpmässiga geometriska grafer och booleska modeller .

Se även

Anteckningar