Plåtnotation

I Bayesiansk slutledning är plattnotation en metod för att representera variabler som upprepas i en grafisk modell . Istället för att rita varje upprepad variabel individuellt, används en platta eller rektangel för att gruppera variabler i en subgraf som upprepas tillsammans, och ett nummer ritas på plattan för att representera antalet repetitioner av subgrafen i plattan. Antagandena är att subgrafen dupliceras så många gånger, variablerna i subgrafen indexeras med upprepningsnumret och alla länkar som korsar en plattgräns replikeras en gång för varje subgrafupprepning.

Exempel

I det här exemplet betraktar vi Latent Dirichlet allocation , ett Bayesianskt nätverk som modellerar hur dokument i en korpus är topiskt relaterade. Det finns två variabler som inte finns i någon platta; α är parametern för den enhetliga Dirichlet prior på ämnesfördelningen per dokument, och β är parametern för den enhetliga Dirichlet prior på ordfördelningen per ämne.

Den yttersta plattan representerar alla variabler relaterade till ett specifikt dokument, inklusive ämnesfördelningen för dokument i . M :et i hörnet av plattan indikerar att variablerna inuti upprepas M gånger, en gång för varje dokument. Den inre plattan representerar variablerna som är associerade med vart och ett av de orden i dokument i : är ämnesfördelningen för det j: te ordet i dokument i , och är det faktiska ordet som används.

N : et i hörnet representerar upprepningen av variablerna i den inre plattan gånger, en gång för varje ord i dokumentet i . Cirkeln som representerar de enskilda orden är skuggad, vilket indikerar att varje är observerbar , och de andra cirklarna är tomma, vilket indikerar att de andra variablerna är latenta variabler . De riktade kanterna mellan variablerna indikerar beroenden mellan variablerna: till exempel beror varje och β .

Tillägg

Bayesiansk multivariat Gaussisk blandningsmodell med plåtnotation. Mindre rutor indikerar fasta parametrar; större cirklar indikerar slumpvariabler. Ifyllda former indikerar kända värden. Indikationen [K] betyder en vektor med storleken K ; [D,D] betyder en matris med storleken D × D ; Enbart K betyder en kategorisk variabel med K -utfall. Den snirkliga linjen som kommer från z som slutar i ett kryss indikerar en omkopplare — värdet på denna variabel väljer, för de andra inkommande variablerna, vilket värde som ska användas från storlek- K -matrisen av möjliga värden.

Ett antal tillägg har skapats av olika författare för att uttrycka mer information än bara de villkorliga relationerna. Få av dessa har dock blivit standard. Den kanske vanligaste förlängningen är att använda rektanglar istället för cirklar för att indikera icke-slumpmässiga variabler – antingen parametrar som ska beräknas, hyperparametrar som ges ett fast värde (eller beräknas genom empiriska Bayes ), eller variabler vars värden beräknas deterministiskt från en slumpmässig variabel.

Diagrammet till höger visar några fler icke-standardiserade konventioner som används i vissa artiklar på Wikipedia (t.ex. variations Bayes ):

  • Variabler som egentligen är slumpmässiga vektorer indikeras genom att sätta vektorstorleken inom parentes i mitten av noden.
  • Variabler som faktiskt är slumpmässiga matriser indikeras på liknande sätt genom att sätta matrisstorleken inom parentes i mitten av noden, med kommatecken som skiljer radstorlek från kolumnstorlek.
  • Kategoriska variabler indikeras genom att placera deras storlek (utan hakparentes) i mitten av noden.
  • Kategoriska variabler som fungerar som "switchar", och som väljer en eller flera andra slumpvariabler att villkora på från en stor uppsättning sådana variabler (t.ex. blandningskomponenter), indikeras med en speciell typ av pil som innehåller en snirklig linje och slutar på en T-korsning.
  • Fetstil används konsekvent för vektor- eller matrisnoder (men inte kategoriska noder).

Mjukvaruimplementering

Plattnotering har implementerats i olika TeX / LaTeX ritpaket, men också som en del av grafiska användargränssnitt till Bayesianska statistikprogram som BUGS och BayesiaLab.

  1. ^ Ghahramani, Zoubin (augusti 2007). Grafiska modeller (Tal). Tübingen, Tyskland . Hämtad 21 februari 2008 .
  2. ^   Buntine, Wray L. (december 1994). "Operationer för lärande med grafiska modeller" (PDF) . Journal of Artificial Intelligence Research . AI Access Foundation. 2 : 159-225. arXiv : cs/9412102 . Bibcode : 1994cs.......12102B . doi : 10.1613/jair.62 . ISSN 1076-9757 . Hämtad 21 februari 2008 .