Flerdimensionellt nätverk
Del av serie om | ||||
nätverksvetenskapsteori | ||||
---|---|---|---|---|
Nätverkstyper | ||||
Grafer | ||||
|
||||
Modeller | ||||
|
||||
| ||||
I nätverksteori är flerdimensionella nätverk , en speciell typ av flerskiktsnätverk, nätverk med flera typer av relationer. Allt mer sofistikerade försök att modellera verkliga system som multidimensionella nätverk har gett värdefull insikt inom områdena sociala nätverksanalys , ekonomi, urbana och internationella transporter , ekologi , psykologi, medicin, biologi, handel, klimatologi, fysik, beräkningsneurovetenskap , driftledning och finans.
Terminologi
snabba utforskning av komplexa nätverk har förföljts av en brist på standardiserade namnkonventioner, eftersom olika grupper använder överlappande och motsägelsefull terminologi för att beskriva specifika nätverkskonfigurationer (t.ex. multiplex, flerskikts, flernivå, multidimensionell, multirelationell, sammankopplad). För att till fullo utnyttja datauppsättningsinformationen om kommunikationens riktningsbeskaffenhet, överväger vissa författare endast direkta nätverk utan några etiketter på hörn, och introducerar definitionen av kantmärkta multigrafer som kan täcka många flerdimensionella situationer. Termen "helt flerdimensionell" har också använts för att hänvisa till en multi-partite kantmärkt multigraf. Flerdimensionella nätverk har också nyligen ändrats till specifika instanser av flerskiktsnätverk. I det här fallet finns det lika många lager som det finns dimensioner, och länkarna mellan noder inom varje lager är helt enkelt alla länkar för en given dimension.
Definition
Oviktade flerskiktsnätverk
I elementär nätverksteori representeras ett nätverk av en graf där är uppsättningen av noder och länkarna mellan noder, typiskt representerade som en tuppel av noder , . Även om denna grundläggande formalisering är användbar för att analysera många system, har verkliga nätverk ofta ökad komplexitet i form av flera typer av relationer mellan systemelement. En tidig formalisering av denna idé kom genom dess tillämpning inom området för sociala nätverksanalyser (se t.ex. och artiklar om relationella algebror i sociala nätverk) där flera former av social koppling mellan människor representerades av flera typer av länkar.
För att tillgodose närvaron av mer än en typ av länk representeras ett flerdimensionellt nätverk av en trippel , där är en uppsättning dimensioner (eller lager), där varje medlem är en annan typ av länk, och består av trippel med och .
Observera att som i alla riktade grafer är länkarna och distinkta.
Enligt konvention är antalet länkar mellan två noder i en given dimension antingen 0 eller 1 i ett flerdimensionellt nätverk. Det totala antalet länkar mellan två noder över alla dimensioner är dock mindre än eller lika med .
Viktade flerskiktsnätverk
I fallet med ett viktat nätverk utökas denna triplett till en kvadruplett där är vikten på länken mellan och i dimensionen .
Vidare, som ofta är användbart i sociala nätverksanalyser, kan länkvikter anta positiva eller negativa värden. Sådana undertecknade nätverk kan bättre återspegla relationer som vänskap och fiendskap i sociala nätverk. Alternativt kan länktecken anges som själva dimensionerna, t.ex. där och Detta tillvägagångssätt har särskilt värde när man överväger oviktade nätverk.
Denna uppfattning om dimensionalitet kan utökas om attribut i flera dimensioner behöver specifikation. I det här fallet är länkarna n -tupler . En sådan utökad formulering, där länkar kan finnas inom flera dimensioner, är ovanlig men har använts i studien av flerdimensionella tidsvarierande nätverk .
Allmän formulering i termer av tensorer
Medan endimensionella nätverk har tvådimensionella angränsande matriser av storleken i ett flerdimensionellt nätverk med -dimensioner, blir angränsande matris en flerlagers angränsande tensor, en fyrdimensionell matris av storlek . Genom att använda indexnotation kan närliggande matriser indikeras med för att koda kopplingar mellan noderna och , medan flerskiktiga angränsande tensorer indikeras av , för att koda förbindelser mellan nod i lager och nod i lager . Precis som i endimensionella matriser, är riktade länkar, signerade länkar och vikter lätt anpassade till detta ramverk.
I fallet med multiplexnätverk , som är speciella typer av flerskiktsnätverk där noder inte kan kopplas samman med andra noder i andra lager, en tredimensionell matris av storlek ( med poster räcker för att representera systemets struktur genom att koda kopplingar mellan noderna och i lager .
Flerdimensionella nätverksspecifika definitioner
Flera lager grannar
I ett flerdimensionellt nätverk är grannarna till någon nod alla noder kopplade till över dimensioner.
Banlängd i flera lager
En väg mellan två noder i ett flerdimensionellt nätverk kan representeras av en vektor r där e posten i r är antalet länkar som korsas i den e dimensionen av . Som med överlappande grad kan summan av dessa element tas som ett grovt mått på en väglängd mellan två noder.
Nätverk av lager
Förekomsten av flera lager (eller dimensioner) gör det möjligt att introducera det nya konceptet med nätverk av lager , speciellt med flerlagersnätverk. Faktum är att lager kan vara sammankopplade på ett sådant sätt att deras struktur kan beskrivas av ett nätverk, som visas i figuren.
Nätverket av lager är vanligtvis viktat (och kan vara riktat), även om vikterna i allmänhet beror på tillämpningen av intresse. Ett enkelt tillvägagångssätt är att, för varje par av lager, summera alla vikter i kopplingarna mellan deras noder för att erhålla kantvikter som kan kodas in i en matris . Rank-2 angränsande tensor, som representerar det underliggande nätverket av lager i rymden ges av
där är den kanoniska matrisen med alla komponenter lika med noll förutom posten som motsvarar rad och kolumn som är lika med en. Genom att använda tensorialnotationen är det möjligt att erhålla det (viktade) nätverket av lager från flerlagers angränsande tensor som .
Centralitetsåtgärder
Grad
I ett icke sammankopplat flerdimensionellt nätverk, där mellanskiktslänkar saknas, representeras graden av en nod av en vektor med längd . Här är ett alternativt sätt att beteckna antalet lager i flerskiktsnätverk. För vissa beräkningar kan det dock vara mer användbart att helt enkelt summera antalet länkar intill en nod över alla dimensioner. Detta är den överlappande graden : . Liksom med endimensionella nätverk kan skillnad på liknande sätt göras mellan inkommande länkar och utgående länkar. Om mellanskiktslänkar finns måste definitionen ovan anpassas för att ta hänsyn till dem, och flerskiktsgraden ges av
där tensorerna och har alla komponenter lika med 1. Heterogeniteten i antalet anslutningar av en nod över de olika skikten kan beaktas genom deltagandekoefficienten.
Mångsidighet som centralitet i flera lager
När det utvidgas till sammankopplade flerskiktsnätverk, dvs de system där noder är anslutna över skikt, förstås begreppet centralitet bättre i termer av mångsidighet. Noder som inte är centrala i varje lager kan vara de viktigaste för flerskiktssystemen i vissa scenarier. Till exempel är detta fallet när två lager kodar olika nätverk med endast en nod gemensam: det är mycket troligt att en sådan nod kommer att ha den högsta centralitetspoängen eftersom den är ansvarig för informationsflödet över lagren.
Egenvektors mångsidighet
När det gäller endimensionella nätverk kan egenvektors mångsidighet definieras som lösningen av egenvärdesproblemet som ges av där Einsteins summeringskonvention används för enkelhetens skull. Här är ger flerskiktsgeneraliseringen av Bonacichs egenvektorcentralitet per nod och lager. Den övergripande egenvektorns mångsidighet erhålls helt enkelt genom att summera poängen över skikten som .
Katz mångsidighet
När det gäller dess endimensionella motsvarighet erhålls Katz mångsidighet som lösningen av tensorialekvationen där en är en konstant mindre än det största egenvärdet och är en annan konstant som vanligtvis är lika med 1. Den övergripande Katz mångsidigheten erhålls helt enkelt genom att summera poängen över skikten som .
HITS mångsidighet
För endimensionella nätverk har HITS-algoritmen ursprungligen introducerats av Jon Kleinberg för att betygsätta webbsidor. Algoritmens grundantagande är att relevanta sidor, namngivna auktoriteter, pekas av speciella webbsidor, namngivna nav. Denna mekanism kan matematiskt beskrivas av två kopplade ekvationer som reducerar till två egenvärdesproblem. När nätverket är oriktat är auktoritets- och navcentralitet ekvivalenta med egenvektorcentralitet. Dessa egenskaper bevaras av den naturliga utvidgningen av de ekvationer som Kleinberg föreslagit till fallet med sammankopplade flerskiktsnätverk, givet av och , där indikerar transponeringsoperatorn, och indikerar nav respektive myndighetscentralitet. Genom att kontrahera navet och auktoritetstensorerna får man de övergripande mångsidigheten som och .
PageRank mångsidighet
PageRank , mer känd som Google Search Algorithm är ett annat mått på centralitet i komplexa nätverk, som ursprungligen introducerades för att rangordna webbsidor. Dess utvidgning till fallet med sammankopplade flerskiktsnätverk kan erhållas enligt följande.
För det första är det värt att notera att PageRank kan ses som steady-state-lösningen för en speciell Markov-process på toppen av nätverket. Random walkers utforskar nätverket enligt en speciell övergångsmatris och deras dynamik styrs av en random walk master-ekvation . Det är lätt att visa att lösningen av denna ekvation är ekvivalent med den ledande egenvektorn för övergångsmatrisen.
Slumpmässiga vandringar har definierats även i fallet med sammankopplade flerskiktsnätverk och kantfärgade multigrafer (även kända som multiplexnätverk). För sammankopplade flerskiktsnätverk ges den övergångstensor som styr dynamiken hos de slumpmässiga vandrare inom och över skikten av , där är en konstant, vanligtvis satt till 0,85, är antalet noder och är antalet lager eller dimensioner. Här heta Google-tensor och är rank-4 tensor med alla komponenter lika med 1.
Som sin endimensionella motsvarighet består PageRank-mångsidigheten av två bidrag: ett som kodar en klassisk slumpmässig promenad med hastighet och en kodar teleportering över noder och lager med hastighet .
Om vi anger med egentensorn för Google-tensorn vilket betecknar den konstanta -ange sannolikhet för att hitta rullatorn i nod och lager , flerskikts PageRank erhålls genom att summera över lager egentensorn:
Triadisk stängning och klustringskoefficienter
Liksom många annan nätverksstatistik blir innebörden av en klustringskoefficient tvetydig i flerdimensionella nätverk, på grund av det faktum att trippel kan stängas i andra dimensioner än de uppstod. Flera försök har gjorts för att definiera lokala klustringskoefficienter, men dessa försök har belyst det faktum att konceptet måste vara fundamentalt annorlunda i högre dimensioner: vissa grupper har baserat sitt arbete på icke-standardiserade definitioner, medan andra har experimenterat med olika definitioner av slumpmässiga promenader och 3-cykler i flerdimensionella nätverk.
Gemenskapsupptäckt
Även om tvärdimensionella strukturer har studerats tidigare, misslyckas de med att upptäcka mer subtila associationer som finns i vissa nätverk. Att ta en något annorlunda uppfattning om definitionen av "gemenskap" i fallet med flerdimensionella nätverk möjliggör tillförlitlig identifiering av gemenskaper utan krav på att noder är i direkt kontakt med varandra. Till exempel skulle två personer som aldrig kommunicerar direkt men ändå surfar på många av samma webbplatser vara livskraftiga kandidater för denna typ av algoritm.
Modularitetsmaximering
En generalisering av den välkända modularitetsmaximeringsmetoden för gemenskapsupptäckt har ursprungligen föreslagits av Mucha et al. Denna multiupplösningsmetod förutsätter en tredimensionell tensorrepresentation av nätverksanslutningen inom lager, som för kantfärgade multigrafer, och en tredimensionell tensorrepresentation av nätverksanslutningen över lager. Det beror på upplösningsparametern och vikten för mellanskiktsanslutningar. I en mer kompakt notation, med användning av tensorial notation, kan modularitet skrivas som , där { är den flerskiktiga adjacency-tensorn, är tensorn som kodar nollmodellen och värdet på komponenterna i definieras som 1 när en nod i lager tillhör en viss gemenskap, märkt med index , och 0 när det inte gör det.
Tensornedbrytning
Icke-negativ matrisfaktorisering har föreslagits för att extrahera gemenskapsaktivitetsstrukturen för temporala nätverk. Flerskiktsnätverket representeras av en tredimensionell tensor som en kantfärgad multigraf, där lagrens ordning kodar för tidens pil. Tensorfaktorisering med hjälp av Kruskal-nedbrytning tillämpas alltså på för att tilldela varje nod till en gemenskap över tiden.
Statistisk slutsats
Metoder baserade på statistisk slutledning, som generaliserar befintliga tillvägagångssätt införda för endimensionella nätverk, har föreslagits. Stokastisk blockmodell är den mest använda generativa modellen, lämpligt generaliserad till fallet med flerskiktsnätverk.
När det gäller endimensionella nätverk kan principiella metoder som minsta beskrivningslängd användas för modellval i gemenskapsdetekteringsmetoder baserade på informationsflöde.
Strukturell reducerbarhet
Med tanke på den högre komplexiteten hos flerskiktsnätverk med avseende på endimensionella nätverk, ägnas ett aktivt forskningsfält åt att förenkla strukturen hos sådana system genom att använda någon form av dimensionsreduktion.
En populär metod är baserad på beräkningen av Jensen-Shannon-kvantdivergensen mellan alla par av lager, som sedan utnyttjas för sina metriska egenskaper för att bygga en avståndsmatris och hierarkiskt gruppera lagren. Lager aggregeras successivt enligt det resulterande hierarkiska trädet och aggregeringsproceduren stoppas när objektivfunktionen, baserat på nätverkets entropi , får ett globalt maximum. Detta giriga tillvägagångssätt är nödvändigt eftersom det underliggande problemet skulle kräva att alla möjliga lagergrupper av vilken storlek som helst måste verifieras, vilket kräver ett stort antal möjliga kombinationer (vilket ges av Bell-numret och skalas superexponentiellt med antalet enheter). För flerskiktssystem med ett litet antal lager har det dock visat sig att metoden fungerar optimalt i de flesta fall.
Andra flerskiktsnätverksbeskrivningar
Gradkorrelationer
Frågan om gradkorrelationer i endimensionella nätverk är ganska okomplicerad: tenderar nätverk av liknande grad att ansluta till varandra? I flerdimensionella nätverk blir vad denna fråga betyder mindre tydlig. När vi hänvisar till en nods grad, hänvisar vi till dess grad i en dimension, eller kollapsade över allt? När vi försöker undersöka anslutningar mellan noder, jämför vi samma noder över dimensioner, eller olika noder inom dimensioner, eller en kombination? Vilka är konsekvenserna av variationer i var och en av denna statistik på andra nätverksfastigheter? I en studie visade sig assortativitet minska robustheten i ett duplexnätverk.
Vägdominans
Givet två flerdimensionella banor, r och s , säger vi att r dominerar s om och endast om: displaystyle så att .
Kortaste vägen upptäckt
Bland annan nätverksstatistik är många centralitetsmått beroende av förmågan att bedöma kortaste vägarna från nod till nod. Att utöka dessa analyser till ett flerdimensionellt nätverk kräver att ytterligare anslutningar mellan noder införlivas i de algoritmer som för närvarande används (t.ex. Dijkstras ) . Nuvarande tillvägagångssätt inkluderar att kollapsa flerlänksanslutningar mellan noder i ett förbearbetningssteg innan variationer utförs på en bredd-första sökning av nätverket.
Flerdimensionellt avstånd
två noder i ett flerdimensionellt nätverk är genom att jämföra alla flerdimensionella vägar mellan dem och välja den delmängd som vi definierar som kortast via vägdominans: låt MP ( vara uppsättningen av alla vägar mellan och . Då avståndet mellan och en uppsättning banor så att så att dominerar . Längden på elementen i uppsättningen av kortaste vägar mellan två noder definieras därför som det flerdimensionella avståndet .
Dimensionsrelevans
I ett flerdimensionellt nätverk , relevansen av en given dimension (eller uppsättning dimensioner) för en nod kan bedömas utifrån förhållandet: .
Dimensionsanslutning
I ett flerdimensionellt nätverk där olika dimensioner av samband har olika verkliga värden, är statistik som kännetecknar fördelningen av länkar till de olika klasserna av intresse. Det är därför användbart att överväga två mått som bedömer detta: dimensionsanslutning och kantexklusiv dimensionsanslutbarhet. Det förra är helt enkelt förhållandet mellan det totala antalet länkar i en given dimension och det totala antalet länkar i varje dimension: . Den senare bedömer, för en given dimension, antalet par av noder som endast är sammankopplade med en länk i den dimensionen: .
Burstdetektering
Burstiness är ett välkänt fenomen i många verkliga nätverk, t.ex. e-post eller andra mänskliga kommunikationsnätverk. Ytterligare dimensioner av kommunikation ger en mer trogen återgivning av verkligheten och kan lyfta fram dessa mönster eller minska dem. Därför är det av avgörande betydelse att våra metoder för att upptäcka bursty beteende i nätverk rymmer flerdimensionella nätverk.
Diffusionsprocesser på flerskiktsnätverk
Diffusionsprocesser används i stor utsträckning inom fysiken för att utforska fysiska system, såväl som inom andra discipliner som samhällsvetenskap, neurovetenskap, urban och internationell transport eller finans. Nyligen har enkla och mer komplexa diffusiva processer generaliserats till flerskiktsnätverk. Ett resultat som är gemensamt för många studier är att diffusion i multiplexnätverk, en speciell typ av flerskiktssystem, uppvisar två regimer: 1) vikten av mellanskiktslänkar, som förbinder skikt med varandra, inte är tillräckligt hög och multiplexsystemet beter sig som två (eller fler) frikopplade nätverk; 2) vikten av länkar mellan skikten är tillräckligt hög för att skikten kopplas ihop, vilket ger upphov till oväntade fysiska fenomen. Det har visat sig att det sker en abrupt övergång mellan dessa två regimer.
Faktum är att alla nätverksbeskrivningar som är beroende av någon diffusiv process, från centralitetsåtgärder till gemenskapsdetektering, påverkas av lager-lager-kopplingen. Till exempel, i fallet med gemenskapsdetektering, gynnar låg koppling (där information från varje lager separat är mer relevant än den övergripande strukturen) kluster inom lager, medan hög koppling (där information från alla lager samtidigt är mer relevant än varje lager separat) ) gynnar tvärskiktskluster.
Slumpmässiga promenader
När det gäller endimensionella nätverk är det möjligt att definiera slumpmässiga vandringar på toppen av flerskiktssystem. Men med tanke på den underliggande flerskiktsstrukturen är slumpmässiga vandrare inte begränsade till att flytta från en nod till en annan inom samma lager ( hopp ), utan tillåts också att röra sig över lager ( växel ).
Random walks kan användas för att utforska ett flerskiktssystem med det slutliga målet att nysta upp dess mesoskaliga organisation , dvs. att dela upp det i gemenskaper , och har nyligen använts för att bättre förstå navigerbarheten hos flerskiktsnätverk och deras motståndskraft mot slumpmässiga fel, såväl som för effektivt utforska denna typ av topologier.
I fallet med sammankopplade flerskiktssystem kan sannolikheten att flytta från en nod i lager till nod i lager kodas in i rank-4 övergångstensorn och den diskreta tidsvandringen kan beskrivas med masterekvationen
där indikerar sannolikheten att hitta rullatorn i nod i lager vid tidpunkten .
Det finns många olika typer av promenader som kan kodas in i övergångstensorn beroende på hur vandrare får hoppa och byta. Till exempel kan vandraren antingen hoppa eller byta i ett enda tidssteg utan att skilja mellan mellan- och intralagerlänkar ( klassisk slumpmässig gång ), eller så kan den välja att antingen stanna i det aktuella lagret och hoppa, eller att byta lager och hoppa sedan till en annan nod i samma tidssteg ( physical random walk ). Mer komplicerade regler, motsvarande specifika problem att lösa, finns i litteraturen. I vissa fall är det möjligt att analytiskt hitta den stationära lösningen av masterekvationen.
Klassisk diffusion
Problemet med klassisk diffusion i komplexa nätverk är att förstå hur en kvantitet kommer att flöda genom systemet och hur lång tid det tar att nå det stationära tillståndet. Klassisk diffusion i multiplexnätverk har nyligen studerats genom att introducera begreppet supra-adjacency-matris, som senare erkändes som en speciell utjämning av multilayer-adjacency-tensorn. I tensorial notation kan diffusionsekvationen på toppen av ett allmänt flerskiktssystem skrivas kortfattat som
där är mängden spridande kvantitet vid tidpunkten i nod i lager . Rang-4-tensorn som styr ekvationen är den laplaciska tensoren, som generaliserar den kombinatoriska laplaciska matrisen av endimensionella nätverk. Det är värt att notera att i icke-tensorial notation tar ekvationen en mer komplicerad form.
Många av egenskaperna hos denna diffusionsprocess är fullständigt förstådda i termer av det näst minsta egenvärdet för den laplaciska tensorn. Det är intressant att diffusion i ett multiplexsystem kan vara snabbare än diffusion i varje lager separat, eller i deras aggregering, förutsatt att vissa spektrala egenskaper är uppfyllda.
Information och epidemier sprider sig
Hur information (eller sjukdomar) sprids genom ett flerskiktssystem har nyligen varit föremål för intensiv forskning.