Semantisk kartläggning (statistik)

Semantisk kartläggning (SM) i statistik är en metod för dimensionalitetsreduktion (omvandlingen av data från ett högdimensionellt utrymme till ett lågdimensionellt utrymme). SM kan användas i en uppsättning flerdimensionella vektorer av funktioner för att extrahera några nya funktioner som bevarar de viktigaste dataegenskaperna.

SM utför dimensionalitetsreduktion genom att gruppera de ursprungliga egenskaperna i semantiska kluster och kombinera funktioner mappade i samma kluster för att generera en extraherad egenskap. Givet en datamängd konstruerar denna metod en projektionsmatris som kan användas för att mappa ett dataelement från ett högdimensionellt utrymme till ett reducerat dimensionellt utrymme.

SM kan användas i konstruktion av textutvinning och informationshämtningssystem , såväl som system som hanterar vektorer med hög dimensionalitet. SM är ett alternativ till slumpmässig kartläggning , analys av huvudkomponenter och latenta semantiska indexeringsmetoder .

Se även

  • CORRÊA, RF; LUDERMIR, TB Förbättring av självorganisering av dokumentsamlingar genom semantisk kartläggning. Neurocomputing (Amsterdam), v. 70, sid. 62-69, 2006. doi:10.1016/j.neucom.2006.07.007
  •   CORRÊA, RF och LUDERMIR, TB (2007) "Dimensionality Reduction of very large document collections by Semantic Mapping" . Proceedings of 6th Int. Workshop om självorganiserande kartor (WSOM). ISBN 978-3-00-022473-7 .

externa länkar