Stressmajorisering

Stressmajorisering är en optimeringsstrategi som används i multidimensionell skalning (MDS) där, för en uppsättning av -dimensionella dataobjekt, en konfiguration av punkter i -dimensionellt utrymme eftersträvas som minimerar den så kallade spänningsfunktionen } . Vanligtvis är eller , dvs matrisen listar punkter i eller dimensionellt euklidiskt utrymme så att resultatet kan visualiseras (dvs. en MDS-plot ). Funktionen är en kostnads- eller förlustfunktion som mäter de kvadratiska skillnaderna mellan ideala ( -dimensionella) avstånd och faktiska avstånd i r -dimensionellt rum. Det definieras som:

där är en vikt för mätningen mellan ett par punkter , är det euklidiska avståndet mellan och och är det ideala avståndet mellan punkterna (deras separation) i det -dimensionella datautrymmet. Observera att kan användas för att specificera en grad av tillförlitlighet i likheten mellan punkter (t.ex. 0 kan anges om det inte finns någon information för ett visst par).

En konfiguration som minimerar ger en plot där punkter som ligger nära varandra motsvarar punkter som också ligger nära varandra i den ursprungliga -dimensionellt datautrymme.

Det finns många sätt som kan minimeras. Till exempel rekommenderade Kruskal ett iterativt tillvägagångssätt för brantaste nedstigning . En betydligt bättre metod (när det gäller garantier för och konvergenshastighet) för att minimera stress introducerades dock av Jan de Leeuw . De Leeuws iterativa majoriseringsmetod vid varje steg minimerar en enkel konvex funktion som både begränsar ovanifrån och berör ytan av i en punkt , kallad den stödjande punkt . I konvex analys kallas en sådan funktion en majoriserande funktion. Denna iterativa majoriseringsprocess kallas också för SMACOF-algoritmen ("Skalning genom att MAjorisera en komplicerad funktion").

SMACOF-algoritmen

Spänningsfunktionen kan utökas enligt följande:

Observera att den första termen är en konstant och den andra termen är kvadratisk i (dvs för den hessiska matrisen är den andra termen ekvivalent med tr ) och därför relativt lätt att lösa. Den tredje termen begränsas av:

där har:

för

och för

och .

Bevis på denna ojämlikhet är Cauchy-Schwarz- ojämlikheten, se Borg (s. 152–153).

Således har vi en enkel kvadratisk funktion som majoriserar stress:


Den iterativa minimeringsproceduren är då:

  • vid steget sätter vi
  • stoppa om upprepa annars.

Denna algoritm har visat sig minska stressen monotont (se de Leeuw).

Använd i grafritning

Stressmajorisering och algoritmer som liknar SMACOF har också tillämpning inom området för grafritning . Det vill säga att man kan hitta en någorlunda estetiskt tilltalande layout för ett nätverk eller en graf genom att minimera en stressfunktion över nodernas positioner i grafen. I det här fallet vanligtvis inställda på de grafteoretiska avstånden mellan noderna och och vikterna tas som . Här vald som en avvägning mellan att bevara lång- eller kortdistans idealavstånd. Goda resultat har visats för .