CUR-matrisuppskattning
En CUR-matrisapproximation är en uppsättning av tre matriser som, när de multipliceras tillsammans, nära approximerar en given matris. En CUR-approximation kan användas på samma sätt som den låggradiga approximationen av singular value decomposition ( SVD). CUR-uppskattningar är mindre exakta än SVD, men de erbjuder två viktiga fördelar, båda härrör från det faktum att raderna och kolumnerna kommer från den ursprungliga matrisen (istället för vänster och höger singularvektorer):
- Det finns metoder för att beräkna det med lägre asymptotisk tidskomplexitet jämfört med SVD.
- Matriserna är mer tolkbara; Betydelsen av rader och kolumner i den sönderdelade matrisen är i huvudsak desamma som deras betydelser i den ursprungliga matrisen.
Formellt är en CUR-matrisapproximation av en matris A tre matriser C , U och R så att C är gjord av kolumner av A , R är gjord från rader av A , och att produkten CUR nära approximerar A . Vanligtvis väljs CUR för att vara en rank - k approximation, vilket betyder att C innehåller k kolumner av A , R innehåller k rader av A och U är en k -by- k matris. Det finns många möjliga CUR-matrisapproximationer och många CUR-matrisapproximationer för en given rang.
CUR-matrisapproximationen används ofta [ citat behövs ] i stället för lågrankad approximation av SVD i principal komponentanalys . CUR är mindre exakt, men kolumnerna i matrisen C är hämtade från A och raderna i R är hämtade från A . I PCA innehåller varje kolumn i A ett dataprov; sålunda är matrisen C gjord av en delmängd av datasampel. Detta är mycket lättare att tolka än SVD:s vänstra singularvektorer, som representerar data i ett roterat utrymme. På liknande sätt är matrisen R gjord av en delmängd av variabler som mäts för varje dataprov. Detta är lättare att förstå än SVD:s högra singularvektorer, som är ytterligare en rotation av data i rymden.
Matematisk definition
Hamm och Huang ger följande teorem som beskriver grunderna för en CUR-nedbrytning av en matris med rang :
Sats: Betrakta rad- och kolumnindex med . Beteckna submatriserna och . Om rank( ) = rank( ), då , där betecknar Moore–Penrose-pseudoinversen .
Med andra ord, om har låg rang, kan vi ta en delmatris av samma rang, tillsammans med några rader och kolumner i och använd dem för att rekonstruera .
Algoritmer
CUR-matrisuppskattningen är inte unik och det finns flera algoritmer för att beräkna en. En är ALGORITHMCUR.
Algoritmen "Linjär tid CUR" väljer helt enkelt J genom att sampla kolumner slumpmässigt (med ersättning) med sannolikhet proportionell mot de kvadratiska kolumnnormerna, ; och på liknande sätt sampling I proportionell mot de kvadratiska radnormerna, . Författarna visar att ta och där , uppnår algoritmen Frobenius error bound , där är den optimala rankningen k approximation.
Tensor
Tensor-CURT-nedbrytning är en generalisering av matris-CUR-nedbrytning. Formellt är en CURT-tensorapproximation av en tensor A tre matriser och en (kärn-)tensor C , R , T och U så att C är gjord av kolumner av A , R är gjord av rader av A , T är gjord av rör av A och att produkten U(C,R,T) (där -e posten i den är är nära A . Vanligtvis väljs CURT för att vara en rank - k approximation, vilket betyder att C innehåller k kolumner av A , R innehåller k rader av A , T innehåller rör av A och U är en k -by- k -by- k (kärna -) tensor.
Se även
- ^ a b Michael W. Mahoney; Petros Drineas. "CUR-matrisupplösningar för förbättrad dataanalys" . Hämtad 26 juni 2012 .
- ^ Boutsidis, Christos; Woodruff, David P. (2014). Optimala CUR-matrisnedbrytningar . STOC '14 Proceedings av det fyrtiosjätte årliga ACM-symposiet om Theory of Computing.
- ^ Sång, Zhao; Woodruff, David P.; Zhong, Peilin (2017). Low Rank Approximation med Entrywise L1-Norm Error . STOC '17 Proceedings av det fyrtionionde årliga ACM-symposiet om Theory of Computing. arXiv : 1611.00898 .
- ^ Keaton Hamm och Longxiu Huang. Perspektiv på CUR-nedbrytningar. Applied and Computational Harmonic Analysis, 48(3):1088–1099, 2020.
- ^ Drineas, Petros; Kannan, Ravi; Mahoney, Michael W. (2006-01-01). "Snabba Monte Carlo-algoritmer för matriser I: Approximation av matrismultiplikation" . SIAM Journal on Computing . 36 (1): 132–157. doi : 10.1137/S0097539704442684 . ISSN 0097-5397 .
- ^ Sång, Zhao; Woodruff, David P.; Zhong, Peilin (2017). "Relativt fel Tensor Low Rank Approximation". arXiv : 1704.08246 [ cs.DS ].