Frekvent mönsterupptäckt

Frequent pattern discovery (eller FP discovery , FP mining eller Frequent itemset mining ) är en del av kunskapsupptäckten i databaser , Massive Online Analysis och data mining ; den beskriver uppgiften att hitta de vanligaste och mest relevanta mönstren i stora datamängder. Konceptet introducerades först för gruvtransaktionsdatabaser. Frekventa mönster definieras som delmängder (objektuppsättningar, delsekvenser eller understrukturer) som förekommer i en datamängd med en frekvens som inte är lägre än en användarspecificerad eller automatiskt bestämd tröskel.

Tekniker

Tekniker för FP-brytning inkluderar:

För det mesta kan FP-upptäckt göras med hjälp av associationsregelinlärning med speciella algoritmer Eclat , FP-growth och Apriori-algoritmen .

Andra strategier inkluderar:

och respektive specifika tekniker.

Implementeringar finns för olika maskininlärningssystem eller moduler som MLlib för Apache Spark .