Logistisk modellträd
Del av en serie om |
maskininlärning och datautvinning |
---|
Inom datavetenskap är ett logistiskt modellträd ( LMT ) en klassificeringsmodell med en tillhörande övervakad träningsalgoritm som kombinerar logistisk regression (LR) och inlärning av beslutsträd .
Logistiska modellträd är baserade på den tidigare idén om ett modellträd: ett beslutsträd som har linjära regressionsmodeller vid sina blad för att tillhandahålla en bitvis linjär regressionsmodell (där vanliga beslutsträd med konstanter vid sina blad skulle producera en bitvis konstant modell). I den logistiska varianten LogitBoost- algoritmen för att producera en LR-modell vid varje nod i trädet; noden delas sedan med C4.5 -kriteriet. Varje LogitBoost-anrop varmstartas [ vagt ] från dess resultat i den överordnade noden. Till sist beskärs trädet.
Den grundläggande LMT-induktionsalgoritmen använder korsvalidering för att hitta ett antal LogitBoost-iterationer som inte överpassar träningsdatan. En snabbare version har föreslagits som använder Akaike-informationskriteriet för att kontrollera LogitBoost-stopp.