I datornätverk är självlikhet en egenskap hos nätverksdataöverföringsdynamiken . När man modellerar nätverksdatadynamik är de traditionella tidsseriemodellerna, såsom en autoregressiv glidande medelvärdesmodell inte lämpliga. Detta beror på att dessa modeller endast tillhandahåller ett ändligt antal parametrar i modellen och därmed interaktion i ett ändligt tidsfönster, men nätverksdata har vanligtvis en långdistansberoende tidsstruktur. En självliknande process är ett sätt att modellera nätverksdatadynamik med en så lång räckviddskorrelation. Den här artikeln definierar och beskriver nätverkets dataöverföringsdynamik i samband med en självliknande process. Processens egenskaper visas och metoder ges för att grafera och uppskatta parametrar som modellerar nätverksdatas självlikhet.
Definition
Antag att är en svagt stationär (2:a ordningens stationär) process med medelvärde varians \ och autokorrelationsfunktionen . Antag att autokorrelationsfunktionen har formen som , där och är en långsam varierande funktion i oändligheten , det vill säga för alla . Till exempel, och är långsamt varierande funktioner. Låt 1 , betecknar en aggregerad punktserie över icke-överlappande block med storleken , för varje är positivt heltal .
Exakt självliknande process
-
kallas en exakt självliknande process om det finns en självliknande parameter så att har samma fördelning som . Ett exempel på exakt självliknande process med är Fractional Gaussian Noise (FGN) med .
Definition: Fractional Gaussian Noise (FGN)
kallas det fraktionella gaussiska bruset, där är en fraktionell Brownsk rörelse .
exakt andra ordningens självliknande process
-
kallas en exakt andra ordningens självliknande process om det finns en självliknande parameter så att har samma varians och autokorrelation som .
asymptotisk andra ordningens självliknande process
-
kallas en asymptotisk andra ordningens självliknande process med självliknande parameter om som ,
Några relativa situationer av självliknande processer
Long-Range-Dependence (LRD)
Antag att är en svagt stationär (2:a ordningens stationär) process med medelvärde och varians . Autokorrelationsfunktionen (ACF) för lag ges av
Definition:
En svagt stationär process sägs vara "Long-Range-Dependence" om
En process som uppfyller som sägs ha långdistansberoende. Den spektrala täthetsfunktionen för långdistansberoende följer en kraftlag nära ursprunget. Motsvarande , har långdistansberoende om spektral densitetsfunktion för autokorrelationsfunktion, , har formen av som där , varierar långsamt vid 0.
se också
Långsamt sönderfallande varianser
När en autokorrelationsfunktion för en självliknande process uppfyller som , det betyder att den även uppfyller som , där är en finit positiv konstant oberoende av m, och 0<β<1.
Uppskattning av självlikhetsparametern "H"
R/S-analys
Antag att den underliggande processen är Fractional Gaussian Noise. Betrakta serierna , och låt .
Provvariansen för är
Definition:R/S-statistik
Om är FGN, då en regressionsmodell: där I synnerhet för en tidsserie med längden dela upp tidsseriedata i grupper vardera av storlek , beräkna för varje grupp. För varje n har vi alltså datapar ( ).Det finns punkter för varje , så vi kan anpassa en regressionsmodell för att uppskatta mer exakt. Om lutningen på regressionslinjen är mellan 0,5~1 är det en självliknande process.
Varians-tid plot
Varians av provmedelvärdet ges av . För att uppskatta H, beräkna urvalsmedelvärden för underserier av längden . Totalt medelvärde kan ges av sampelvarians . Varians-tidsplotterna erhålls genom att plotta mot och vi kan passa en enkel minsta kvadratlinje genom de resulterande punkterna i planet ignorerar de små värdena på k.
För stora värden på förväntas punkterna i diagrammet vara utspridda runt en rät linje med en negativ lutning . För kortdistansberoende eller oberoende bland observationer är lutningen på den räta linjen lika med -1. Självlikhet kan härledas från värdena för den uppskattade lutningen som är asymptotiskt mellan –1 och 0, och en uppskattning av graden av självlikhet ges av
Periodogrambaserad analys
Whittle's approximativa maximum likelihood estimator ( MLE ) används för att lösa Hurst's parameter via spektraldensiteten av . Det är inte bara ett verktyg för att visualisera Hursts parameter, utan också en metod för att göra några statistiska slutsatser om parametrarna via de asymptotiska egenskaperna hos MLE. I synnerhet följer Gauss-process . Låt spektraldensiteten för , , där och konstruerar en autoregression (AR) modell med kort räckvidd, det vill säga med .
Således minimerar Whittle's estimator av funktionen , där anger periodogrammet för X som och . Dessa integrationer kan bedömas av Riemann summa.
Sedan följer en normalfördelning om kan uttryckas som en form av en modell med oändligt glidande medelvärde.
För att uppskatta måste man först beräkna detta periodogram. Eftersom är en estimator av spektraltätheten, bör en serie med långdistansberoende ha ett periodogram, som är proportionellt mot nära origo. Periodogramdiagrammet erhålls genom att plotta mot . Att sedan anpassa en regressionsmodell av på bör ge en lutning av . Lutningen för den monterade räta linjen är också uppskattningen av . Således erhålls uppskattningen
Obs: Det finns två vanliga problem när vi tillämpar periodogrammetoden. För det första, om data inte följer en gaussisk fördelning, kan transformation av data lösa denna typ av problem. För det andra är det provspektrum som avviker från den antagna spektrala tätheten ett annat. En aggregeringsmetod föreslås för att lösa detta problem. Om är en Gauss-process och spektraldensitetsfunktionen för uppfyller som , funktionen, konvergerar i distribution till FGN som .
- P. Whittle, "Uppskattning och information i stationära tidsserier", Art. Matta. 2, 423-434, 1953.
- K. PARK, W. WILLINGER, Self-Similar Network Traffic and Performance Evaluation, WILEY,2000.
- WE Leland, W. Willinger, MS Taqqu, DV Wilson, "On the self-similar nature of Ethernet traffic", ACM SIGCOMM Computer Communication Review 25,202-213,1995.
- W. Willinger, MS Taqqu, WE Leland, DV Wilson, "Self-Similarity in High-Speed Packet Traffic: Analysis and Modeling of Ethernet Traffic Measurements", Statistical Science 10,67-85,1995.