Pareto-interpolation
Pareto-interpolation är en metod för att uppskatta medianen och andra egenskaper hos en population som följer en Pareto - fördelning . Det används inom ekonomin när man analyserar inkomstfördelningen i en befolkning, då man ska basera uppskattningar på ett relativt litet slumpmässigt urval taget från befolkningen.
Familjen av Pareto-distributioner parametriseras av
- ett positivt tal κ som är det minsta värde som en slumpvariabel med en Pareto-fördelning kan ta. Såsom tillämpat på inkomstfördelning är κ den lägsta inkomsten för någon person i befolkningen; och
- ett positivt tal θ "Pareto-index"; när detta ökar, blir svansen av distributionen tunnare. Tillämpat på inkomstfördelning innebär detta att ju större Pareto-index θ är desto mindre blir andelen inkomster många gånger så stor som de minsta inkomsterna.
Pareto-interpolation kan användas när den tillgängliga informationen inkluderar andelen av urvalet som faller under vart och ett av två specificerade tal a < b . Till exempel kan det observeras att 45 % av individerna i urvalet har inkomster under a = 35 000 USD per år och 55 % har inkomster under b = 40 000 USD per år.
Låta
- P a = andel av provet som ligger under a ;
- P b = andel av provet som ligger under b .
Då är uppskattningarna av κ och θ
och
Uppskattningen av medianen skulle då vara
eftersom den faktiska befolkningsmedianen är
- US Census Bureau, Memorandum om statistiska tekniker som användes i 2001 års inkomstundersökning (PDF) . Se ekvation 10 på sid. 24.
- Stults, Brian J, Härledning av medianhushållsinkomst . Ger en härledning av ekvationerna för Pareto-interpolation.