Projektionssträvan
Projection pursuit (PP) är en typ av statistisk teknik som går ut på att hitta de mest "intressanta" möjliga projektionerna i flerdimensionell data. Ofta anses projektioner som avviker mer från en normalfördelning vara mer intressanta. När varje projektion hittas reduceras data genom att ta bort komponenten längs den projektionen, och processen upprepas för att hitta nya projektioner; detta är "strävan"-aspekten som motiverade tekniken som kallas matchande jakt .
Tanken med projektionssträvan är att lokalisera projektionen eller projektionerna från högdimensionellt utrymme till lågdimensionellt utrymme som avslöjar flest detaljer om strukturen av datamängden. När en intressant uppsättning projektioner har hittats kan befintliga strukturer (kluster, ytor, etc.) extraheras och analyseras separat.
Projektionssträvan har använts i stor utsträckning för separation av blinda källor , så det är mycket viktigt i oberoende komponentanalys . Projektionssträvan söker en projektion åt gången så att den extraherade signalen är så icke-Gaussisk som möjligt.
Historia
Projektionsförföljande teknik föreslogs och experimenterades ursprungligen av Kruskal. Besläktade idéer förekommer i Switzer (1970) "Numerical classification" s. 31–43 i "Computer Applications in the Earth Sciences: Geostatistics, and Switzer and Wright (1971) "Numerical classification of eocene nummulitids," Mathematical Geology pp 297–311. framgångsrik implementering beror på Jerome H. Friedman och John Tukey (1974), som namngav projektion pursuit.
Det ursprungliga syftet med projektionssträvan var att maskinplocka "intressanta" lågdimensionella projektioner av ett högdimensionellt punktmoln genom att numeriskt maximera en viss objektiv funktion eller projektionsindex.
Flera år senare utvidgade Friedman och Stuetzle idén bakom projektionssträvan och lade till regression för projektionssträvan (PPR), klassificering av projektionssträvande (PPC) och uppskattning av densitet för projektion (PPDE).
Funktion
Det mest spännande med projektionssträvan är att det är en av de mycket få multivariata metoderna som kan kringgå "dimensionalitetens förbannelse" som orsakas av det faktum att högdimensionellt utrymme för det mesta är tomt. Dessutom kan projektionssträvan ignorera irrelevanta (dvs. bullriga och informationsfattiga) variabler. Detta är en distinkt fördel jämfört med metoder baserade på interpunktsavstånd som minimala spännträd, flerdimensionell skalning och de flesta klustringstekniker.
Många av metoderna för klassisk multivariat analys visar sig vara specialfall av projektionssträvan. Exempel är principal komponentanalys och diskriminantanalys samt kvartimax- och oblimaxmetoderna i faktoranalys .
En allvarlig nackdel med projiceringsmetoder är deras höga krav på datortid.