Exponentiell familj slumpmässiga grafmodeller
Del av serie om | ||||
nätverksvetenskapsteori | ||||
---|---|---|---|---|
Nätverkstyper | ||||
Grafer | ||||
|
||||
Modeller | ||||
|
||||
| ||||
Exponential family random graph models ( ERGM) är en familj av statistiska modeller för att analysera data från sociala och andra nätverk . Exempel på nätverk som undersökts med ERGM är kunskapsnätverk, organisatoriska nätverk, kolleganätverk, sociala medier, nätverk för vetenskaplig utveckling och andra.
Bakgrund
Det finns många mått för att beskriva de strukturella egenskaperna hos ett observerat nätverk, såsom täthet, centralitet eller assortativitet. Dessa mått beskriver dock det observerade nätverket som bara är en instans av ett stort antal möjliga alternativa nätverk. Denna uppsättning alternativa nätverk kan ha liknande eller olika strukturella egenskaper. För att stödja statistiska slutsatser om de processer som påverkar bildandet av nätverksstruktur, bör en statistisk modell beakta uppsättningen av alla möjliga alternativa nätverk viktade på deras likhet med ett observerat nätverk. Men eftersom nätverksdata är till sin natur relationell, bryter den mot antagandena om oberoende och identisk fördelning av vanliga statistiska modeller som linjär regression . Alternativa statistiska modeller bör återspegla den osäkerhet som är förknippad med en given observation, tillåta slutsatser om den relativa frekvensen om nätverkssubstrukturer av teoretiskt intresse, disambiguera påverkan av förvirrande processer, effektivt representera komplexa strukturer och koppla processer på lokal nivå till egenskaper på global nivå. Gradbevarande randomisering , till exempel, är ett specifikt sätt på vilket ett observerat nätverk kan betraktas i termer av flera alternativa nätverk.
Definition
Den exponentiella familjen är en bred familj av modeller för att täcka många typer av data, inte bara nätverk. En ERGM är en modell från denna familj som beskriver nätverk.
Formellt består en slumpmässig graf av en uppsättning av noder och dyader (kanter) Y om noderna är anslutna och annars.
Grundantagandet för dessa modeller är att strukturen i en observerad graf kan förklaras av en given vektor med tillräcklig statistik som är en funktion av det observerade nätverket och, i vissa fall, nodalattribut. På så sätt är det möjligt att beskriva vilken typ av beroende som helst mellan de undyadiska variablerna:
där är en vektor av modellparametrar associerade med och .
Dessa modeller representerar en sannolikhetsfördelning på varje möjligt nätverk på noder. Storleken på uppsättningen möjliga nätverk för ett oriktat nätverk (enkel graf) av storleken är . Eftersom antalet möjliga nätverk i uppsättningen avsevärt överstiger antalet parametrar som kan begränsa modellen, är den ideala sannolikhetsfördelningen den som maximerar Gibbs- entropin .
Vidare läsning
- Byshkin, M.; Stivala, A.; Mira, A.; Robins, G.; Lomi, A. (2018). "Snabb maximal sannolikhetsuppskattning via jämviktsförväntningar för stora nätverksdata" . Vetenskapliga rapporter . 8 (1): 11509. arXiv : 1802.10311 . Bibcode : 2018NatSR...811509B . doi : 10.1038/s41598-018-29725-8 . PMC 6068132 . PMID 30065311 .
- Caimo, A.; Friel, N (2011). "Bayesiansk slutledning för exponentiella slumpmässiga grafmodeller". Sociala nätverk . 33 : 41–55. arXiv : 1007.5192 . doi : 10.1016/j.socnet.2010.09.004 .
- Erdős, P.; Rényi, A (1959). "På slumpmässiga grafer". Publicationes Mathematicae . 6 : 290-297.
- Fienberg, SE; Wasserman, S. (1981). "Diskussion av en exponentiell familj av sannolikhetsfördelningar för riktade grafer av Holland och Leinhardt". Journal of the American Statistical Association . 76 (373): 54–57. doi : 10.1080/01621459.1981.10477600 .
- Frank, O.; Strauss, D (1986). "Markov grafer". Journal of the American Statistical Association . 81 (395): 832–842. doi : 10.2307/2289017 . JSTOR 2289017 .
- Handcock, MS; Hunter, DR; Butts, CT; Goodreau, SM; Morris, M. (2008). "statnet: Programvaruverktyg för representation, visualisering, analys och simulering av nätverksdata" . Journal of Statistical Software . 24 (1): 1–11. doi : 10.18637/jss.v024.i01 . PMC 2447931 . PMID 18618019 .
- Harris, Jenine K (2014). En introduktion till exponentiell slumpmässig grafmodellering. Salvia.
- Hunter, DR; Goodreau, SM; Handcock, MS (2008). "Goodness of Fit of Social Network Models". Journal of the American Statistical Association . 103 (481): 248–258. CiteSeerX 10.1.1.206.396 . doi : 10.1198/016214507000000446 .
- Hunter, D.R; Handcock, MS (2006). "Inferens i kurvade exponentiella familjemodeller för nätverk". Journal of Computational and Graphical Statistics . 15 (3): 565–583. CiteSeerX 10.1.1.205.9670 . doi : 10.1198/106186006X133069 .
- Hunter, DR; Handcock, MS; Butts, CT; Goodreau, SM; Morris, M. (2008). "ergm: Ett paket för att passa, simulera och diagnostisera exponentiella familjemodeller för nätverk" . Journal of Statistical Software . 24 (3): 1–29. doi : 10.18637/jss.v024.i03 .
- Jin, IH; Liang, F. (2012). "Anpassa sociala nätverksmodeller med hjälp av varierande trunkeringsstokastisk approximation MCMC-algoritm". Journal of Computational and Graphical Statistics . 22 (4): 927–952. doi : 10.1080/10618600.2012.680851 .
- Koskinen, JH; Robins, GL; Pattison, PE (2010). "Analysera exponentiella slumpmässiga grafmodeller (p-stjärnor) med saknade data med hjälp av Bayesiansk dataförstärkning" . Statistisk metodik . 7 (3): 366–384. doi : 10.1016/j.stamet.2009.09.007 .
- Morris, M.; Handcock, MS; Hunter, DR (2008). "Specifikation av slumpmässiga grafmodeller för exponentiell familj: termer och beräkningsaspekter" . Journal of Statistical Software . 24 (4): 1548–7660. doi : 10.18637/jss.v024.i04 . PMC 2481518 . PMID 18650964 .
- Rinaldo, A.; Fienberg, SE; Zhou, Y. (2009). "Om geometrin för deskreta exponentiella slumpmässiga familjer med tillämpning på exponentiella slumpmässiga grafmodeller". Electronic Journal of Statistics . 3 : 446-484. arXiv : 0901.0026 . doi : 10.1214/08-EJS350 .
- Robins, G.; Snijders, T.; Wang, P.; Handcock, M.; Pattison, P (2007). "Senaste utvecklingen av exponentiella slumpmässiga grafmodeller (p*) för sociala nätverk" ( PDF) . Sociala nätverk . 29 (2): 192–215. doi : 10.1016/j.socnet.2006.08.003 . hdl : 11370/abee7276-394e-4051-a180-7b2ff57d42f5 .
- Schweinberger, Michael (2011). "Instabilitet, känslighet och degeneration av diskreta exponentiella familjer" . Journal of the American Statistical Association . 106 (496): 1361–1370. doi : 10.1198/jasa.2011.tm10747 . PMC 3405854 . PMID 22844170 .
- Schweinberger, Michael; Handcock, Mark (2015). "Lokalt beroende i slumpmässiga grafmodeller: karakterisering, egenskaper och statistisk slutledning" . Journal of the Royal Statistical Society, Series B . 77 (3): 647–676. doi : 10.1111/rssb.12081 . PMC 4637985 . PMID 26560142 .
- Schweinberger, Michael; Stewart, Jonathan (2020). "Koncentration och konsistensresultat för kanoniska och kurvade exponentiella familjemodeller av slumpmässiga grafer". Statistikens annaler . 48 (1): 374–396. arXiv : 1702.01812 . doi : 10.1214/19-AOS1810 .
- Snijders, TAB (2002). "Markov-kedjan Monte Carlo-uppskattning av exponentiella slumpmässiga grafmodeller" (PDF) . Journal of Social Structure . 3 .
- Snijders, TAB; Pattison, PE; Robins, GL; Handcock, MS (2006). "Nya specifikationer för exponentiella slumpmässiga grafmodeller". Sociologisk metodik . 36 : 99–153. CiteSeerX 10.1.1.62.7975 . doi : 10.1111/j.1467-9531.2006.00176.x .
- Strauss, D; Ikeda, M (1990). "Pseudolikelihood-uppskattning för sociala nätverk" . Journal of the American Statistical Association . 5 (409): 204–212. doi : 10.2307/2289546 . JSTOR 2289546 .
- van Duijn, MA; Snijders, TAB; Zijlstra, BH (2004). "p2: en modell för slumpmässiga effekter med kovariater för riktade grafer". Statistica Neerlandica . 58 (2): 234–254. doi : 10.1046/j.0039-0402.2003.00258.x .
- van Duijn, MAJ; Gile, KJ ; Handcock, MS (2009). "Ett ramverk för jämförelse av maximal pseudo-sannolikhet och maximal sannolikhetsuppskattning av exponentiella familjemodeller för slumpmässiga grafer" . Sociala nätverk . 31 (1): 52–62. doi : 10.1016/j.socnet.2008.10.003 . PMC 3500576 . PMID 23170041 .
- ^ Harris, Jenine K (2014). En introduktion till exponentiell slumpmässig grafmodellering . ISBN 9781452220802 . OCLC 870698788 .