Semidefinite inbäddning
Maximum Variance Unfolding (MVU) , även känd som Semidefinite Embedding (SDE), är en algoritm inom datavetenskap som använder semidefinite programmering för att utföra icke-linjär dimensionalitetsreduktion av högdimensionell vektoriell indata.
Det motiveras av observationen att kärnans principal komponentanalys (kPCA) inte minskar datadimensionaliteten, eftersom den utnyttjar Kernel-tricket för att icke-linjärt mappa originaldata till ett inre produktutrymme .
Algoritm
MVU skapar en mappning från de högdimensionella ingångsvektorerna till något lågdimensionellt euklidiskt vektorutrymme i följande steg:
- En grannskapsgraf skapas. Varje ingång är ansluten med sina k-närmaste ingångsvektorer (enligt euklidisk avståndsmetrik) och alla k-närmaste grannar är anslutna till varandra. Om data samplas tillräckligt bra, är den resulterande grafen en diskret approximation av det underliggande grenröret.
- Grannskapsgrafen "viks upp" med hjälp av semidefinite programmering. Istället för att lära sig utgångsvektorerna direkt, syftar den semidefinita programmeringen till att hitta en inre produktmatris som maximerar de parvisa avstånden mellan två valfria ingångar som inte är anslutna i grannskapsgrafen samtidigt som de närmaste grannarnas avstånd bevaras.
- Den lågdimensionella inbäddningen erhålls slutligen genom applicering av flerdimensionell skalning på den inlärda inre produktmatrisen.
Stegen att tillämpa semidefinite programmering följt av ett steg för att reducera linjär dimensionalitet för att återställa en lågdimensionell inbäddning i ett euklidiskt rum föreslogs först av Linial , London och Rabinovich.
Optimeringsformulering
Låt vara den ursprungliga ingången och vara inbäddningen. Om är två grannar, då är den lokala isometrirestriktionen som måste uppfyllas:
Låt vara grammatriserna för och (dvs: ). Vi kan uttrycka ovanstående begränsning för varje grannpunkt i termer av :
Dessutom vill vi också begränsa inbäddningen att centrera vid origo:
Som beskrivits ovan, förutom att avstånden för närliggande punkter bevaras, syftar algoritmen till att maximera det parvisa avståndet för varje par av punkter. Den objektiva funktionen som ska maximeras är:
Intuitivt är maximering av funktionen ovan likvärdigt med att dra punkterna så långt bort från varandra som möjligt och därför "vika ut" grenröret. Den lokala isometri-restriktionen
Låt η
förhindrar att objektivfunktionen divergerar (går till oändligheten).
Eftersom grafen har N punkter, är avståndet mellan två valfria punkter . Vi kan sedan binda den objektiva funktionen enligt följande:
Den objektiva funktionen kan skrivas om rent i form av grammatrisen:
Slutligen kan optimeringen formuleras som:
Efter att grammatrisen har lärts in genom semidefinite programmering, kan utgången erhållas via Cholesky-dekomponering .
I synnerhet kan grammatrisen skrivas som där är det i:te elementet av egenvektor av egenvärdet .
Det följer att det -te elementet i utgången är .
Se även
- Lokalt linjär inbäddning
- Isometri (matematik)
- Lokal Tangent Space Alignment
- Riemannska grenrör
- Energiminimering
Anteckningar
- Linial, London och Rabinovich, Nathan, Eran och Yuri (1995). "Geometrin hos grafer och några av dess algoritmiska tillämpningar" . Combinatorica . 15 (2): 215–245. doi : 10.1007/BF01200757 . S2CID 5071936 .
- Weinberger, Sha och Saul, Kilian Q., Fei och Lawrence K. (4 juli 2004a). Att lära sig en kärnmatris för icke-linjär dimensionalitetsreduktion . Proceedings of the Twenty First International Conference on Machine Learning (ICML 2004). Banff, Alberta , Kanada.
- Weinberger och Saul, Kilian Q. och Lawrence K. (27 juni 2004b). Oövervakad inlärning av bildgrenrör genom semidefinite programmering . 2004 IEEE Computer Society-konferens om datorseende och mönsterigenkänning. Vol. 2.
- Weinberger och Saul, Kilian Q. och Lawrence K. (1 maj 2006). "Oövervakad inlärning av bildgrenrör genom semidefinite programmering" (PDF) . International Journal of Computer Vision . 70 : 77–90. doi : 10.1007/s11263-005-4939-z . S2CID 291166 .
- Lawrence, Neil D (2012). "Ett förenande probabilistiskt perspektiv för minskning av spektral dimensionalitet: insikter och nya modeller" . Journal of Machine Learning Research . 13 (maj): 1612. arXiv : 1010.4830 . Bibcode : 2010arXiv1010.4830L .