Ta den bästa heuristiken

Inom psykologi är ta -det-bästa-heuristiken en heuristik (en enkel strategi för beslutsfattande ) som bestämmer mellan två alternativ genom att välja baserat på den första ledtråden som särskiljer dem, där ledtrådarna ordnas efter signalens giltighet (högst till lägst) . I den ursprungliga formuleringen antogs ledtrådarna ha binära värden (ja eller nej) eller ha ett okänt värde. Logiken i heuristiken är att den baserar sitt val på enbart den bästa signalen (anledning) och ignorerar resten.

Psykologerna Gerd Gigerenzer och Daniel Goldstein upptäckte att heuristiken gjorde förvånansvärt bra slutsatser i verkliga miljöer, som att sluta sig till vilken av två städer som är störst. Heuristiken har sedan dess modifierats och tillämpats på domäner från medicin , artificiell intelligens och politiska prognoser . Det har också visat sig att heuristiken exakt kan modellera hur experter, såsom flygplatstulltjänstemän och professionella inbrottstjuvar, fattar beslut. Heuristiken kan också förutsäga detaljer om den kognitiva processen , såsom antal använda ledtrådar och svarstider, ofta bättre än komplexa modeller som integrerar alla tillgängliga ledtrådar; som sådan är det ett exempel på mindre-är-mer-effekten .

Beslutsfattande med en anledning

Teorier om beslutsfattande förutsätter vanligtvis att alla relevanta skäl (funktioner eller ledtrådar) genomsöks och integreras i ett slutgiltigt beslut. Men under osäkerhet (i motsats till risk) är de relevanta ledtrådarna vanligtvis inte alla kända, inte heller deras exakta vikter och korrelationerna mellan ledtrådarna. I dessa situationer kan det vara ett rimligt alternativ att bara förlita sig på den bästa tillgängliga signalen som möjliggör snabba, sparsamma och korrekta beslut. Detta är logiken i en klass av heuristik som kallas "en-reason decision making", som inkluderar ta det bästa. Överväg ledtrådar med binära värden (0, 1), där 1 indikerar signalvärdet som är associerat med ett högre kriteriumvärde. Uppgiften är att härleda vilket av två alternativ som har det högre kriterievärdet. Ett exempel är vilket av två NBA-lag som vinner matchen, baserat på signaler som hemmamatch och vem som vann den senaste matchen. Ta-det-bästa-heuristiken innebär tre steg för att göra en sådan slutsats:

Sökregel : Titta igenom ledtrådar i den ordning de är giltiga.

Stoppregel : Stoppa sökningen när den första signalen hittas där värdena för de två alternativen skiljer sig åt.

Beslutsregel : Förutsäg att alternativet med det högre cue-värdet har det högre värdet på utfallsvariabeln.

Giltigheten v för en cue ges av v = C/(C+W), där C är antalet korrekta slutledningar när en cue särskiljer, och W är antalet felaktiga slutledningar, alla uppskattade från sampel.

Ta det bästa för jämförelseuppgiften

Överväg uppgiften att härleda vilket objekt, A eller B, som har ett högre värde på ett numeriskt kriterium. Föreställ dig som ett exempel att någon måste bedöma om den tyska staden Köln har en större befolkning än den andra tyska staden Stuttgart. Denna bedömning eller slutsats måste baseras på information som tillhandahålls av binära ledtrådar, som "Är staden en delstatshuvudstad?". Ur en formell synvinkel är uppgiften en kategorisering: Ett par (A, B) ska kategoriseras som X A > X B eller X B > X A (där X betecknar kriteriet), baserat på cue-information.

Ledtrådar är binära; det betyder att de antar två värden och kan modelleras till exempel som att de har värdena 0 och 1 (för "ja" och "nej"). De rangordnas efter deras cue validity , definierad som andelen korrekta jämförelser mellan paren A och B, för vilka den har olika värden, dvs för vilka den skiljer mellan A och B. Take-the-bäst analyserar varje cue, den ena efter den andra, enligt rangordningen efter giltighet och stopp första gången en cue särskiljer objekten och drar slutsatsen att objektet med det större värdet också har ett större värde på kriteriet. Matrisen för alla objekt i referensklassen, från vilka A och B har tagits, och av de cue-värden som beskriver dessa objekt utgör en så kallad miljö. Gigerenzer och Goldstein, som introducerade Take-The-Best (se Gerd Gigerenzer & Daniel Goldstein , DG (1996) ) betraktade, som ett genomgångsexempel, just par av tyska städer. men bara de med mer än 100 000 invånare. Jämförelseuppgiften för ett givet par (A,B) tyska städer i referensklassen, bestod i att fastställa vilken som har en större befolkning, baserat på nio ledtrådar. Leder var binärt värderade, till exempel om staden är en delstatshuvudstad eller om den har ett fotbollslag i den nationella ligan. Stödvärdena skulle kunna modelleras med 1:or (för "ja") och 0:or (för "nej") så att varje stad kunde identifieras med sin "cue-profil", dvs. e-vektorn av 1' och 0:or, ordnade enligt rangordningen av signaler.

Frågan var: Hur kan man sluta sig till vilket av två objekt, till exempel stad A med cue-profil (100101010) och stad B med cue-profil (100010101) , som får högre poäng på det etablerade kriteriet, dvs befolkningsstorlek? Ta-det-bästa-heuristiken jämför helt enkelt profilerna lexikografiskt, precis som siffror skrivna i bas två jämförs: det första cue-värdet är 1 för båda, vilket betyder att den första cue inte skiljer mellan A och B. Det andra cue-värdet är 0 för båda, återigen utan diskriminering. Samma sak händer för det tredje cue-värdet, medan det fjärde cue-värdet är 1 för A och 0 för B, vilket innebär att A bedöms ha ett högre värde på kriteriet. Med andra ord, X A > X B om och endast om (100101010) > (100010101) .

Matematiskt betyder detta att de ledtrådar som hittats för jämförelsen tillåter en kvasi -ordnings isomorfism mellan objekten som jämförs på kriteriet, i detta fall städer med deras populationer, och deras motsvarande binära vektorer. Här betyder "kvasi" att isomorfismen i allmänhet inte är perfekt, eftersom uppsättningen av signaler inte är perfekt.

Vad som är förvånande är att denna enkla heuristik har en bra prestanda jämfört med andra strategier. Ett uppenbart mått för att fastställa prestandan hos en slutledningsmekanism bestäms av procentandelen korrekta bedömningar. Det som är viktigast är dessutom inte bara prestandan för heuristiken vid anpassning av kända data, utan när man generaliserar från en känd träningsuppsättning till nya objekt.

Czerlinski, Goldstein och Gigerenzer jämförde flera strategier med Take-the-best: en enkel Tallying, eller enhetsviktsmodell (även kallad "Dawes' Rule" i den litteraturen), en viktad linjär modell på ledtrådarna viktade av deras giltighet (även kallad "Dawes' Rule" i den litteraturen). "Franklins regel" i den litteraturen), linjär regression och minimalistisk. Deras resultat visar robustheten hos Take-the-bäst i generalisering.

Heuristic performance on the German city data set
Heuristisk prestanda på den tyska stadsdatauppsättningen, genererad med ggplot2 baserat på data i. Se stegen för att reproducera på CRAN .
Heuristic performance across 20 data sets
Heuristisk prestanda över 20 datamängder från en illustration inuti referensnr

Tänk till exempel på uppgiften att välja den större staden av två städer när

  • Modeller är anpassade till en datauppsättning av 83 tyska städer
  • Modeller väljer den största av ett par städer för alla 83*82/2 par av städer.

Procenten korrekt var ungefär 74 % för regression, Take-the-bäst, enhetsvikt linjär. Mer specifikt var poängen 74,3 %, 74,2 % och 74,1 %, så regression vann med liten marginal.

Men uppsatsen övervägde också generalisering (även känd som förutsägelse utanför urvalet).

  • Modeller är anpassade till en datauppsättning av en slumpmässigt utvald hälften av 83 tyska städer
  • Modeller väljer den största av ett par städer som dras från den *andra* halvan av städerna.

I det här fallet, när 10 000 olika slumpmässiga uppdelningar användes, hade regression i genomsnitt 71,9% korrekt, Take-the-bäst hade 72,2% korrekt och enhet med linjär hade 71,4% korrekt. Ta-det-bästa-heuristiken var mer exakt än regression i det här fallet. Dessa resultat presenterades i.

Se även