Johnson–Lindenstrauss lemma

Inom matematik är Johnson–Lindenstrauss-lemmat ett resultat uppkallat efter William B. Johnson och Joram Lindenstrauss angående lågdistorsionsinbäddningar av punkter från högdimensionellt till lågdimensionellt euklidiskt rum . Lemmat säger att en uppsättning punkter i ett högdimensionellt utrymme kan bäddas in i ett utrymme med mycket lägre dimension på ett sådant sätt att avstånden mellan punkterna nästan bevaras . Kartan som används för inbäddningen är åtminstone Lipschitz och kan till och med tas som en ortogonal projektion .

Lemmat har tillämpningar inom komprimerad avkänning , mångfaldsinlärning , dimensionsreduktion och grafinbäddning . Mycket av den data som lagras och manipuleras på datorer, inklusive text och bilder, kan representeras som punkter i ett högdimensionellt utrymme (se vektorrumsmodellen för text). De väsentliga algoritmerna för att arbeta med sådan data tenderar dock att fastna mycket snabbt när dimensionen ökar. Det är därför önskvärt att reducera dimensionaliteten hos datan på ett sätt som bevarar dess relevanta struktur. Johnson–Lindenstrauss lemma är ett klassiskt resultat i denna riktning.

Lemmat är också tätt upp till en konstant faktor, dvs det finns en uppsättning punkter av storleken m som behöver dimension

för att bevara avstånden mellan alla par av punkter inom en faktor på ( .

Lemma

Givet , pekar en mängd av in ( ), och ett heltal [ omtvistad ] , det finns en linjär karta så att

för alla .

Formeln kan ordnas om:

Alternativt, för alla och vilket heltal som helst det finns en linjär funktion så att begränsningen är - bi-Lipschitz .

Ett bevis på lemma tar ƒ för att vara en lämplig multipel av den ortogonala projektionen på ett slumpmässigt delrum av dimensionen i och utnyttjar fenomenet koncentration av åtgärd .

En ortogonal projektion kommer i allmänhet att minska det genomsnittliga avståndet mellan punkter, men lemmat kan ses som att det handlar om relativa avstånd , som inte förändras under skalning. I ett nötskal slår du tärningen och får en slumpmässig projektion, som kommer att minska medelavståndet, och sedan skalar du upp avstånden så att medelavståndet återgår till sitt tidigare värde. Om du fortsätter att kasta tärningen kommer du, i polynomisk slumpmässig tid, att hitta en projektion för vilken de (skalerade) avstånden uppfyller lemmat.

Alternativt uttalande

Ett relaterat lemma är det fördelningsmässiga JL-lemmat. Detta lemma anger att för alla och positivt heltal , finns det en fördelning över från vilken matrisen dras så att för och för valfri enhetslängdsvektor gäller påståendet nedan .

Man kan få JL-lemmat från distributionsversionen genom att sätta och för något par u , v båda i X . Sedan följer JL-lemmat av en union bunden över alla sådana par.

Påskyndar JL-transformen

Givet A tar beräkning av matrisvektorprodukten tid. Det har gjorts en del arbete med att härleda distributioner för vilka matrisvektorprodukten kan beräknas på mindre än tid.

Det finns två huvudsakliga arbetslinjer. Den första, Fast Johnson Lindenstrauss Transform (FJLT), introducerades av Ailon och Chazelle 2006. Denna metod möjliggör beräkning av matrisvektorprodukten på bara för varje konstant .

Ett annat tillvägagångssätt är att bygga en distribution som stöds över matriser som är glesa. Denna metod tillåter att endast en bråkdel av posterna i matrisen behålls, vilket innebär att beräkningen kan göras på bara tid. Dessutom, om vektorn bara har poster som inte är noll, tar Sparse JL tid vilket kan vara mycket mindre än d tid som används av Fast JL.

Tensoriserade slumpmässiga projektioner

Det är möjligt att kombinera två JL-matriser genom att ta den så kallade ansiktsdelningsprodukten , som definieras som radernas tensorprodukter (föreslogs av V. Slyusar 1996 för radar- och digitala antenner ). Mer direkt, låt och vara två matriser. Då är den ansiktsdelande produkten

Denna idé om tensorisering användes av Kasiviswanathan et al. 2010 för differentierad integritet .

JL-matriser som definieras så här använder färre slumpmässiga bitar och kan appliceras snabbt på vektorer som har tensorstruktur, på grund av följande identitet:

,

där är den elementmässiga ( Hadamard ) produkten. Sådana beräkningar har använts för att effektivt beräkna polynomkärnor och många andra linjäralgebraalgoritmer [ förtydligande behövs ] .

År 2020 visades det att om matriserna är oberoende eller Gaussiska matriser, den kombinerade matrisen uppfyller JL-lemmat om antalet rader är minst

.

För stora är detta lika bra som den helt slumpmässiga Johnson-Lindenstrauss, men en matchande nedre gräns i samma papper visar att detta exponentiella beroende av ( är nödvändigt. Alternativa JL-konstruktioner föreslås för att kringgå detta.

Se även

Anteckningar

Vidare läsning