Indisk bufféprocess

I den matematiska sannolikhetsteorin är den indiska bufféprocessen ( IBP ) en stokastisk process som definierar en sannolikhetsfördelning över glesa binära matriser med ett ändligt antal rader och ett oändligt antal kolumner. Den här distributionen är lämplig att använda som tidigare för modeller med potentiellt oändligt antal funktioner. Formen av föregående säkerställer att endast ett ändligt antal särdrag kommer att finnas i varje ändlig uppsättning observationer, men fler särdrag kan dyka upp när fler datapunkter observeras.

Indisk bufféprocess före

Låt vara en binär matris som indikerar närvaron eller frånvaron av en latent egenskap. IBP placerar följande prior på :

där är antalet icke-nollkolumner i , är antalet ettor i kolumn av , är det N: te övertonstalet och är antalet förekomster av den binära vektorn som inte är noll bland kolumnerna i . Parametern styr det förväntade antalet funktioner som finns i varje observation.

I den indiska bufféprocessen motsvarar raderna i Den första kunden tar de första rätterna. Den -te kunden tar sedan rätter som tidigare har provats med sannolikhet , där är antalet personer som redan har provat maträtt . Han tar också nya rätter. Därför en om kund provade -e rätten och noll annars.

Denna process är oändligt utbytbar mot en ekvivalensklass av binära matriser som definieras av en vänsterordnad många-till-en-funktion. erhålls genom att ordna kolumnerna i den binära matrisen från vänster till höger med storleken på det binära talet uttryckt av den kolumnen, med den första raden som den mest signifikanta biten.

Se även