g-prior

Inom statistik är g-prior en objektiv prior för regressionskoefficienterna för en multipel regression . Den introducerades av Arnold Zellner . Det är ett nyckelverktyg i Bayes och empiriska Bayes variabelval .

Definition

Betrakta en datamängd , där är euklidiska vektorer och är skalärer . Multipel regressionsmodellen är formulerad som

där är slumpmässiga fel. Zellners g-prior för är en multivariat normalfördelning med kovariansmatris proportionell mot den inversa Fisher-informationsmatrisen för liknande en Jeffreys prior .

Antag att är iid normala med noll medelvärde och varians . Låt vara matrisen med e raden lika med . Då är g-priorn för den multivariata normalfördelningen med föregående medelvärde en hyperparameter och kovariansmatris proportionell mot dvs.

där g är en positiv skalär parameter.

Posterior distribution av beta

Den bakre fördelningen av anges som

där och

är den maximala sannolikheten (minsta kvadraterna) skattaren för . Vektorn av regressionskoefficienter kan uppskattas av dess bakre medelvärde under g-prior, dvs som det viktade medelvärdet av maximal sannolikhetsestimatorn och ,

Tydligen, som g →∞, konvergerar det bakre medelvärdet till skattaren för maximal sannolikhet.

Urval av g

Uppskattning av g är något mindre enkel än uppskattning av . En mängd olika metoder har föreslagits, inklusive Bayes och empiriska Bayes-estimatorer.