Förklaringsbaserat lärande

Förklaringsbaserad inlärning ( EBL ) är en form av maskininlärning som utnyttjar en mycket stark, eller till och med perfekt, domänteori (dvs. en formell teori om en applikationsdomän som liknar en domänmodell inom ontologiteknik , inte att förväxla med Scotts domän teori ) för att göra generaliseringar eller forma begrepp från träningsexempel. Det är också kopplat till kodning (minne) för att hjälpa till med inlärning .

Detaljer

Ett exempel på att EBL använder en perfekt domänteori är ett program som lär sig att spela schack genom exempel. En specifik schackposition som innehåller en viktig funktion som "Tvingad förlust av svart dam i två drag" innehåller många irrelevanta funktioner, som den specifika spridningen av bönder på brädet. EBL kan ta ett enstaka träningsexempel och bestämma vad som är relevanta egenskaper för att bilda en generalisering.

En domänteori är perfekt eller komplett om den innehåller i princip all information som behövs för att avgöra en fråga om domänen. Till exempel är domänteorin för schack helt enkelt schackreglerna. Genom att känna till reglerna är det i princip möjligt att härleda det bästa draget i alla situationer. Men att faktiskt göra ett sådant avdrag är omöjligt i praktiken på grund av en kombinatorisk explosion . EBL använder utbildningsexempel för att göra sökandet efter deduktiva konsekvenser av en domänteori effektivt i praktiken.

I huvudsak fungerar ett EBL-system genom att hitta ett sätt att härleda varje träningsexempel från systemets befintliga databas med domänteori. Att ha ett kort bevis på träningsexemplet utökar domänteoridatabasen, vilket gör det möjligt för EBL-systemet att hitta och klassificera framtida exempel som liknar träningsexemplet mycket snabbt. Den största nackdelen med metoden - kostnaden för att tillämpa de inlärda bevismakron, eftersom dessa blir många - analyserades av Minton.

Grundläggande formulering

EBL-programvaran tar fyra ingångar:

  • ett hypotesrum (uppsättningen av alla möjliga slutsatser)
  • en domänteori (axiom om en domän av intresse)
  • träningsexempel (specifika fakta som utesluter en möjlig hypotes)
  • operationalitetskriterier (kriterier för att bestämma vilka funktioner i domänen som är effektivt igenkännbara, t.ex. vilka funktioner som är direkt detekterbara med hjälp av sensorer)

Ansökan

En särskilt bra applikationsdomän för en EBL är naturlig språkbehandling (NLP). Här är en rik domänteori, dvs. en grammatik för naturligt språk – även om den varken är perfekt eller fullständig, anpassad till en viss applikation eller viss språkanvändning, med hjälp av en trädbank (träningsexempel). Rayner var pionjär i detta arbete. Den första framgångsrika industriella applikationen var ett kommersiellt NL-gränssnitt till relationsdatabaser. Metoden har framgångsrikt tillämpats på flera storskaliga parsingsystem för naturligt språk, där nyttoproblemet löstes genom att utelämna den ursprungliga grammatiken (domänteorin) och använda specialiserade LR-parsningstekniker, vilket resulterade i enorma hastigheter, till en kostnad av täckning, men med en vinst i disambiguation. EBL-liknande tekniker har också tillämpats på ytgenerering, motsatsen till att analysera.

När EBL appliceras på NLP kan operationalitetskriterierna vara handgjorda, eller kan härledas från trädbanken med antingen entropin för dess eller-noder eller en måltäckning/disambigueringsavvägning (= återkallelse/precisionsavvägning = f -Göra). EBL kan också användas för att sammanställa grammatikbaserade språkmodeller för taligenkänning, från allmänna enhetsgrammatiker. Notera hur nyttoproblemet, som först avslöjades av Minton, löstes genom att förkasta den ursprungliga grammatiken/domänteorin, och att de citerade artiklarna tenderar att innehålla frasen grammatikspecialisering - tvärtom mot den ursprungliga termen förklaringsbaserad generalisering. Det bästa namnet för denna teknik skulle kanske vara datadriven minskning av sökutrymmet. Andra personer som arbetade på EBL för NLP inkluderar Guenther Neumann, Aravind Joshi, Srinivas Bangalore och Khalil Sima'an.

Se även