Bagplot
En bagplot , eller starburst plot , är en metod i robust statistik för att visualisera två- eller tredimensionella statistiska data, analogt med den endimensionella boxplotten . Introducerad 1999 av Rousseuw et al., låter bagplotten en visualisera platsen, spridningen, skevheten och extremvärdena för en datamängd.
Konstruktion
Säckplotten består av tre kapslade polygoner , kallade "påsen", "staketet" och "öglan".
- Den inre polygonen, som kallas påsen , är konstruerad på basis av Tukey depth , det minsta antalet observationer som kan innehållas av ett halvplan som också innehåller en given punkt. Den innehåller högst 50 % av datapunkterna
- Den yttersta av de tre polygonerna, som kallas staketet , är inte ritad som en del av säckplotten, utan används för att konstruera den. Den bildas genom att blåsa upp påsen med en viss faktor (vanligtvis 3). Observationer utanför stängslet flaggas som extremvärden .
- Observationerna som inte är markerade som utstickare omges av en slinga , observationernas konvexa skrov inom stängslet .
En asterisksymbol (*) nära mitten av grafen används för att markera djupmedianen, punkten med högsta möjliga Tukey-djup. Observationerna mellan påsen och staketet är markerade med linjesegment, på en linje till djupmedianen, som förbinder dem med påsen. Den tredimensionella versionen består av en inner- och en ytterväska. Ytterpåsen ska ritas i transparenta färger så att innerpåsen förblir synlig.
Egenskaper
Säckplotten är invariant under affina transformationer av planet och robust mot extremvärden.