Maximal-entropi slumpmässig grafmodell

Slumpmässiga grafmodeller för maximal entropi är slumpmässiga grafmodeller som används för att studera komplexa nätverk som omfattas av principen om maximal entropi under en uppsättning strukturella begränsningar, som kan vara globala, distributionsmässiga eller lokala.

Översikt

Vilken slumpmässig grafmodell som helst (vid en fast uppsättning parametervärden) resulterar i en sannolikhetsfördelning grafer , och de som är maximal entropi inom den betraktade klassen av distributioner har den speciella egenskapen att vara maximalt opartiska nollmodeller för nätverksslutledning (t.ex. biologiskt nätverk slutledning ). Varje modell definierar en familj av sannolikhetsfördelningar på uppsättningen grafer av storlek (för varje för några ändliga ) , parametriserad av en samling begränsningar på observerbara definieras för varje graf (såsom fast förväntad medelgrad , gradfördelning av en viss form eller specifik gradsekvens ), framtvingad i graffördelningen tillsammans med entropimaximering med metoden Lagrange-multiplikatorer . Observera att "maximal entropi" i detta sammanhang inte hänvisar till entropin för en enda graf, utan snarare entropin för hela den probabilistiska ensemblen av slumpmässiga grafer.

Flera vanligt studerade slumpmässiga nätverksmodeller är i själva verket maximal entropi, till exempel ER- graferna och (som var och en har en global begränsning för antalet kanter), såväl som konfigurationsmodellen ( CM ). och mjuk konfigurationsmodell (SCM) (som var och en har lokala begränsningar, en för varje nodvis gradvärde). I de två modellparen som nämns ovan är en viktig skillnad i huruvida begränsningen är skarp (dvs. uppfylld av varje element i uppsättningen av storleks-n {\ -grafer med en sannolikhet som inte är noll i ensemblen), eller mjuk (dvs. nöjda i genomsnitt över hela ensemblen). Det tidigare (skarpa) fallet motsvarar en mikrokanonisk ensemble , villkoret för maximal entropi ger alla grafer som uppfyller som equiprobable; det senare (mjuka) fallet är kanoniskt , vilket ger en exponentiell slumpmässig grafmodell (ERGM).

Modell Begränsningstyp Begränsningsvariabel Sannolikhetsfördelning
ER , Skarp, global Totalt kantantal
ER , Mjuk, global Förväntat totalt kantantal
Konfigurationsmodell Skarpt, lokalt Grad av varje vertex,
Mjuk konfigurationsmodell Mjuk, lokal Förväntad grad av varje vertex,

Kanonisk ensemble av grafer (allmän ram)

Antag att vi bygger en slumpmässig grafmodell som består av en sannolikhetsfördelning på mängden av enkla grafer med hörn. Gibbs -entropin för denna ensemble kommer att ges av

Vi skulle vilja ha ensemble-medelvärdena för observerbara såsom genomsnittlig grad , genomsnittlig klustring eller genomsnittlig kortaste väglängd ) för att kunna justeras , så vi lägger "mjuka" begränsningar på graffördelningen:

där märka begränsningarna. Tillämpning av metoden med Lagrange-multiplikatorer för att bestämma fördelningen som maximerar samtidigt som den uppfyller , och normaliseringsvillkoret resulterar i följande:

där är en normaliseringskonstant ( partitionsfunktionen ) och är parametrar (Lagrange-multiplikatorer) kopplade till de motsvarande indexerade grafen observerbara, som kan ställas in för att ge grafprover med önskade värden för dessa egenskaper, i genomsnitt; resultatet är en exponentiell familj och kanonisk ensemble ; specifikt ger en ERGM .

Erdős–Rényi-modellen

I det kanoniska ramverket ovan infördes begränsningar för ensemble-genomsnittliga kvantiteter . Även om dessa egenskaper i genomsnitt kommer att anta värden som kan specificeras genom lämplig inställning av varje specifik instans kan ha , vilket kan vara oönskat. Istället kan vi ställa ett mycket striktare villkor: varje graf med en sannolikhet som inte är noll måste uppfylla exakt. Under dessa "skarpa" begränsningar bestäms den maximala entropifördelningen. Vi exemplifierar detta med Erdős–Rényi-modellen .

Den skarpa begränsningen i är den för ett fast antal kanter , det vill säga , för alla grafer ritade från ensemblen (instansierad med en sannolikhet betecknad ). Detta begränsar provutrymmet från (alla grafer på hörn) till delmängden . Detta är i direkt analogi med den mikrokanoniska ensemblen i klassisk statistisk mekanik , där systemet är begränsat till ett tunt grenrör i fasutrymmet för alla tillstånd av ett visst energivärde .

När vi begränsar vårt provutrymme till , har vi inga externa begränsningar (förutom normalisering) att uppfylla, och därför väljer vi för att maximera utan att använda Lagrange-multiplikatorer. Det är välkänt att den entropimaximerande fördelningen i frånvaro av externa begränsningar är den enhetliga fördelningen över provutrymmet (se maximal entropi-sannolikhetsfördelning ), från vilken vi får:

där det sista uttrycket i termer av binomialkoefficienter är antalet sätt att placera kanter bland möjliga kanter , och därmed är kardinaliteten av .

Generaliseringar

En mängd ensembler med maximal entropi har studerats på generaliseringar av enkla grafer. Dessa inkluderar till exempel ensembler av enkla komplex och viktade slumpmässiga grafer med en given förväntad gradsekvens

Se även