Missvisande graf

Exempel på en trunkerad (vänster) kontra fullskalig graf (höger), med samma data

Inom statistik är en vilseledande graf , även känd som en förvrängd graf , en graf som missvisar data , vilket utgör ett missbruk av statistik och med resultatet att en felaktig slutsats kan härledas från den.

Grafer kan vara vilseledande genom att vara alltför komplexa eller dåligt konstruerade. Även när de är konstruerade för att visa egenskaperna hos deras data korrekt, kan grafer bli föremål för olika tolkningar, eller oavsiktliga typer av data kan till synes och i slutändan felaktigt härledas.

Vilseledande grafer kan skapas avsiktligt för att hindra korrekt tolkning av data eller av misstag på grund av obekantskap med grafprogram , felaktig tolkning av data eller på grund av att data inte kan förmedlas korrekt. Vilseledande grafer används ofta i falsk reklam . En av de första författarna som skrev om vilseledande grafer var Darrell Huff , utgivare av 1954 års bok How to Lie with Statistics .

Fältet datavisualisering beskriver sätt att presentera information som undviker att skapa vilseledande grafer.

Vilseledande grafmetoder

Den [en vilseledande graf] är mycket effektivare, men eftersom den inte innehåller några adjektiv eller adverb för att förstöra illusionen av objektivitet, det finns inget som någon kan fästa vid dig.

Det finns många sätt på vilka en vilseledande graf kan konstrueras.

Överdriven användning

Användningen av grafer där de inte behövs kan leda till onödig förvirring/tolkning. Generellt gäller att ju mer förklaring en graf behöver, desto mindre behövs själva grafen. Grafer förmedlar inte alltid information bättre än tabeller.

Partisk märkning

Användningen av partiska eller laddade ord i diagrammets titel, axeletiketter eller bildtext kan göra läsaren olämplig.

Tillverkade trender

På samma sätt kan ett försök att dra trendlinjer genom okorrelerade data vilseleda läsaren att tro att det finns en trend där det inte finns någon. Detta kan både vara resultatet av avsiktligt försök att vilseleda läsaren eller på grund av fenomenet illusorisk korrelation .

Tårtdiagram

  • Att jämföra cirkeldiagram av olika storlekar kan vara vilseledande eftersom människor inte kan avläsa den jämförande arean av cirklar korrekt.
  • Användningen av tunna skivor, som är svåra att urskilja, kan vara svår att tolka.
  • Användningen av procentsatser som etiketter på ett cirkeldiagram kan vara vilseledande när urvalsstorleken är liten.
  • Att göra ett cirkeldiagram i 3D eller lägga till en lutning kommer att göra tolkningen svår på grund av förvrängd perspektiveffekt . Stapeldiagram med cirkeldiagram där höjden på skivorna varieras kan förvirra läsaren.

Jämföra cirkeldiagram

Att jämföra data på barcharts är i allmänhet mycket lättare. I bilden nedan är det mycket svårt att avgöra var den blå sektorn är större än den gröna sektorn på piecharts.

Tre uppsättningar procentsatser, ritade som både piechart och barcharts. Att jämföra data på barcharts är i allmänhet mycket lättare.

3D cirkeldiagram skivperspektiv

Ett perspektivdiagram (3D) används för att ge diagrammet ett 3D -utseende. Den tredje dimensionen används ofta av estetiska skäl och förbättrar inte läsningen av data; tvärtom är dessa intrigar svåra att tolka på grund av den förvrängda effekten av perspektiv som är förknippad med den tredje dimensionen. Användningen av överflödiga dimensioner som inte används för att visa data av intresse avråds för diagram i allmänhet, inte bara för cirkeldiagram. I ett 3D-cirkeldiagram verkar skivorna som är närmare läsaren vara större än de på baksidan på grund av vinkeln de presenteras med. Denna effekt gör läsare mindre presterande när det gäller att bedöma den relativa storleken på varje skiva när de använder 3D än 2D

Jämförelse av cirkeldiagram
Missvisande cirkeldiagram Vanligt cirkeldiagram
Misleading Pie Chart.png Sample Pie Chart.png

Objekt C verkar vara minst lika stort som objekt A i det missvisande cirkeldiagrammet, medan det i själva verket är mindre än hälften så stort. Objekt D ser mycket större ut än objekt B, men de har samma storlek.

Edward Tufte , en framstående amerikansk statistiker, noterade varför tabeller kan föredras framför cirkeldiagram i The Visual Display of Quantitative Information :

Tabeller är att föredra framför grafik för många små datamängder. Ett bord är nästan alltid bättre än ett dumt cirkeldiagram; det enda som är värre än ett cirkeldiagram är flera av dem, för då ombeds tittaren att jämföra kvantiteter som befinner sig i rumslig oordning både inom och mellan pajer – med tanke på deras låga datatäthet och misslyckande att ordna siffror längs en visuell dimension, cirkeldiagram bör aldrig användas.

Felaktig skalning

Användning av piktogram i stapeldiagram bör inte skalas enhetligt, eftersom detta skapar en perceptuellt missvisande jämförelse. Området för piktogrammet tolkas istället för endast dess höjd eller bredd. Detta gör att skalningen gör att skillnaden ser ut att vara kvadratisk.

Felaktig skalning av 2D-piktogram i ett stapeldiagram
Felaktig skalning Regelbunden Jämförelse
Improperly scaled picture graph.svg Picture Graph.svg Comparison of properly and improperly scaled picture graph.svg

I det felaktigt skalade piktogramstapeldiagrammet är bilden för B faktiskt 9 gånger så stor som A.

2D-formskalningsjämförelse
Fyrkant Cirkel Triangel
Box scaling.svg Circle scaling.svg Triangle scaling.svg

Den upplevda storleken ökar vid skalning.

Effekten av felaktig skalning av piktogram exemplifieras ytterligare när piktogrammet har 3 dimensioner, i vilket fall effekten är kubad.

Graph showing improper 3D pictogram scaling.svg

Grafen över husförsäljning (till vänster) är missvisande. Det verkar som att bostadsförsäljningen har vuxit åttafaldigt under 2001 jämfört med föregående år, medan den faktiskt har vuxit fördubblas. Dessutom är antalet försäljningar inte specificerat.

Ett felaktigt skalat piktogram kan också tyda på att själva föremålet har ändrats i storlek.

Vilseledande Regelbunden
Pictograph not aligned and different size.svg Pictograph aligned and similar size.svg

Förutsatt att bilderna representerar ekvivalenta kvantiteter visar den missvisande grafen att det finns fler bananer eftersom bananerna upptar mest yta och ligger längst till höger.

Logaritmisk skalning

Logaritmiska (eller log) skalor är ett giltigt sätt att representera data. Men när de används utan att vara tydligt märkta som loggvågar eller visas för en läsare som inte är bekant med dem, kan de vara vilseledande. Loggskalor sätter datavärdena i termer av ett valt nummer (basen av loggen) till en viss effekt. Basen är ofta e (2,71828...) eller 10. Loggskalor kan till exempel ge en höjd på 1 för ett värde på 10 i data och en höjd på 6 för ett värde på 1 000 000 (10 6 ) i data . Log skalor och varianter används ofta, till exempel för vulkaniskt explosivitetsindex, Richterskalan för jordbävningar, storleken på stjärnor och pH för sura och alkaliska lösningar. Även i dessa fall kan loggskalan göra data mindre uppenbara för ögat. Ofta är anledningen till att logga skalor används att grafens författare vill visa väldigt olika skalor på samma axel. Utan stockskalor blir det visuellt opraktiskt att jämföra mängder som 10 3 mot 10 9 . En graf med en loggskala som inte var tydligt märkt som sådan, eller en graf med en loggskala som presenteras för en tittare som inte kände till logaritmiska skalor, skulle i allmänhet resultera i en representation som fick datavärden att se av liknande storlek, faktiskt, vara av vitt skilda storleksordningar. Felanvändning av en log-skala kan göra att väldigt olika värden (som 10 och 10 000) visas tätt intill varandra (på en bas-10 log-skala skulle de bara vara 1 och 4). Eller det kan få små värden att verka negativa på grund av hur logaritmiska skalor representerar tal som är mindre än basen.

Missbruk av logga skalor kan också göra att relationer mellan kvantiteter verkar linjära medan dessa relationer är exponentiella eller maktlagar som stiger mycket snabbt mot högre värden. Det har konstaterats, om än huvudsakligen på ett humoristiskt sätt, att "allt som helst ser linjärt ut på en log-logg plot med tjock tusch" .

Jämförelse av linjära och logaritmiska skalor för identiska data
Linjär skala Logaritmisk skala
Linear scale.png Logarithmic scale (2).png

Båda graferna visar en identisk exponentialfunktion av f ( x ) = 2 x . Grafen till vänster använder en linjär skala som tydligt visar en exponentiell trend. Grafen till höger använder dock en logaritmisk skala, som genererar en rät linje. Om grafvisaren inte var medveten om detta, skulle grafen tyckas visa en linjär trend.


Trunkerad graf

En trunkerad graf (även känd som en trasad graf ) har en y- axel som inte börjar på 0. Dessa grafer kan skapa intryck av en viktig förändring där det är relativt liten förändring.

Även om trunkerade grafer kan användas för att övertrassera skillnader eller för att spara utrymme, avråds användningen av dem ofta. Kommersiell programvara som MS Excel tenderar att trunkera grafer som standard om alla värden ligger inom ett smalt intervall, som i det här exemplet. För att visa relativa skillnader i värden över tid kan ett indexdiagram användas. Trunkerade diagram kommer alltid att förvränga de underliggande siffrorna visuellt. Flera studier fann att även om människor var korrekt informerade om att y-axeln var trunkerad, överskattade de fortfarande de faktiska skillnaderna, ofta avsevärt.

Trunkerat stapeldiagram
Trunkerat stapeldiagram Vanligt stapeldiagram
Truncated Bar Graph.svg Bar graph.svg

Dessa grafer visar identiska data ; men i det trunkerade stapeldiagrammet till vänster verkar data visa signifikanta skillnader, medan dessa skillnader knappast är synliga i det vanliga stapeldiagrammet till höger.

EU 3.png


Det finns flera sätt att indikera y -axelbrytningar:

Indikerar ett y -axelbrott
Bar graph break.svg Y-axis break.svg

Axeländringar

Ändra y -axel maximum
Originalgraf Mindre max Större max
Line graph1.svg Line graph3.svg Line graph2.svg

Att ändra y -axelns maximum påverkar hur grafen ser ut. Ett högre maximum gör att grafen verkar ha mindre volatilitet, mindre tillväxt och en mindre brant linje än ett lägre maximum.

Ändra förhållandet av grafens dimensioner
Originalgraf Halvbredd, dubbelt så hög Två gånger bredd, halvhöjd
Line graph1.svg Line graph1-3.svg Line graph1-4.svg

Att ändra förhållandet mellan en grafs dimensioner påverkar hur grafen ser ut.

Ingen skala

Skalorna i en graf används ofta för att överdriva eller minimera skillnader.

Missvisande stapeldiagram utan skala
Mindre skillnad Mer skillnad
Example truncated bar graph.svg
Bar graph missing zero1.svg

Avsaknaden av ett startvärde för y- axeln gör det oklart om grafen är trunkerad. Dessutom hindrar avsaknaden av bockmarker läsaren från att avgöra om grafstaplarna är korrekt skalade. Utan en skala kan den visuella skillnaden mellan staplarna enkelt manipuleras.

Vilseledande linjediagram utan skala
flyktighet Stadig, snabb tillväxt Långsam tillväxt
No scale line graph1.svg No scale line graph2.svg No scale line graph3.svg

Även om alla tre graferna delar samma data, och därför den faktiska lutningen för ( x , y ) data är densamma, kan sättet som data plottas ändra det visuella utseendet på vinkeln som linjen på grafen gör. Detta beror på att varje plot har en annan skala på sin vertikala axel. Eftersom skalan inte visas kan dessa grafer vara missvisande.

Felaktiga intervaller eller enheter

De intervall och enheter som används i en graf kan manipuleras för att skapa eller mildra förändringsuttryck.

Utelämnar data

Grafer skapade med utelämnade data tar bort information från vilken man kan basera en slutsats.

Scatter plot med saknade kategorier
Scatter plot med saknade kategorier Regelbunden spridning
Scatter Plot with missing categories.svg A scatter plot without missing categories.svg

I spridningsdiagrammet med saknade kategorier till vänster verkar tillväxten vara mer linjär med mindre variation.

I finansiella rapporter kan negativ avkastning eller data som inte korrelerar med en positiv utsikt uteslutas för att skapa ett mer gynnsamt visuellt intryck. [ citat behövs ]

3D

Användningen av en överflödig tredje dimension, som inte innehåller information, avråds starkt, eftersom det kan förvirra läsaren.

Komplexitet

Grafer är utformade för att möjliggöra enklare tolkning av statistiska data. Emellertid kan grafer med överdriven komplexitet fördunkla data och göra tolkningen svår.

Dålig konstruktion

Dåligt konstruerade grafer kan göra data svåra att urskilja och därmed tolka.

Extrapolering

Vilseledande grafer kan i sin tur användas för att extrapolera vilseledande trender.

Mäter distorsion

Flera metoder har utvecklats för att avgöra om grafer är förvrängda och för att kvantifiera denna förvrängning.

Lögnfaktor

var

En graf med en hög lie-faktor (>1) skulle överdriva förändringar i data den representerar, medan en med en liten lie-faktor (>0, <1) skulle dölja förändringar i data. En perfekt exakt graf skulle uppvisa en lögnfaktor på 1.

Diagramdiskrepansindex

var

Grafdiskrepansindex , även känt som grafförvrängningsindex ( GDI ), föreslogs ursprungligen av Paul John Steinbart 1998. GDI beräknas som en procentandel som sträcker sig från -100 % till positiv oändlighet, med noll procent som indikerar att grafen har varit korrekt konstruerad och allt utanför marginalen på ±5 % anses vara förvrängt. Forskning om användningen av GDI som ett mått på grafikförvrängning har funnit att det är inkonsekvent och diskontinuerligt, vilket gör det svårt att använda GDI som ett mått för jämförelser.

Data-bläck-förhållande

Data-bläckförhållandet bör vara relativt högt. Annars kan diagrammet ha onödig grafik.

Datatäthet

Datatätheten bör vara relativt hög, annars kan en tabell vara bättre lämpad för att visa data.

Användning i ekonomi och företagsrapporter

Grafer är användbara vid sammanfattning och tolkning av finansiella data. Grafer gör det möjligt att se trender i stora datamängder samtidigt som de tillåter att data tolkas av icke-specialister.

Grafer används ofta i företagens årsredovisningar som en form av intryckshantering . I USA behöver grafer inte granskas, eftersom de faller under AU Section 550 Annan information i dokument som innehåller reviderade finansiella rapporter .

Flera publicerade studier har tittat på användningen av grafer i företagsrapporter för olika företag i olika länder och har funnit frekvent användning av felaktig design, selektivitet och mätförvrängning i dessa rapporter. Förekomsten av vilseledande grafer i årsredovisningar har lett till krav på att standarder ska fastställas.

Forskning har funnit att även om läsare med dålig ekonomisk förståelse har en större chans att bli felinformerad av vilseledande grafer, kan även de med finansiell förståelse, såsom låneansvariga, bli vilseledda.

Akademin

Uppfattningen av grafer studeras inom psykofysik , kognitiv psykologi och beräkningsvisioner .

Se även

Böcker

Vidare läsning

externa länkar