Hanabi (kortspel)

Hanabi
Hanabi cover.jpg
Kartongen av Hanabi
Designers Antoine Bauza
Förlag R&R-spel, Cocktailspel, Abacus Spiele
Spelare 2 till 5
Inställningstid 5 minuter
Speltid 20-30 minuter
Chans Medium
Åldersgrupp 8 och uppåt
Kompetens Avdrag , Minne , Samarbete , Planering

Hanabi (av japanska 花火 , fyrverkerier) är ett kooperativt kortspel skapat av den franske speldesignern Antoine Bauza och publicerat 2010. Spelare är medvetna om andra spelares kort men inte sina egna, och försöker spela en serie kort i en specifik ordning att sätta igång en simulerad fyrverkerishow . Typerna av information som spelare kan ge till varandra är begränsad, liksom den totala mängd information som kan ges under spelet. 2013 vann Hanabi Spiel des Jahres , ett branschpris för årets bästa brädspel.

Gameplay

Hanabi - leken innehåller kort i fem färger (vit, gul, grön, blå och röd): tre 1:or, två vardera av 2:or, 3:or och 4:or, och en 5:or. Spelet börjar med 8 tillgängliga informationssymboler och 3 säkringssymboler . För att starta spelet får spelarna en hand som innehåller fem kort (fyra för 4 eller 5 spelare). Som i Blind Man's Bluff kan spelare se varandras kort men de kan inte se sina egna. Spelet fortsätter runt bordet; varje tur måste en spelare vidta en av följande åtgärder:

  • Ge information : Spelaren pekar ut korten för antingen ett givet nummer eller en given färg i en annan spelares hand (exempel: "Detta kort är ditt enda röda kort", "Dessa två kort är dina enda 3:or"). Den information som ges ska vara fullständig och korrekt. (I vissa utgåvor är det tillåtet att indikera att en spelare har noll av något; andra versioner förbjuder uttryckligen detta fall.) Att ge information förbrukar en informationstoken.
  • Kasta ett kort : Spelaren väljer ett kort från sin hand och lägger till det i slänghögen och drar sedan ett kort för att ersätta det. Det kasserade kortet är ur spelet och kan inte längre spelas. Att kassera ett kort fyller på en informationstoken.
  • Spela ett kort : Spelaren väljer ett kort från sin hand och försöker lägga till det till de kort som redan spelats. Detta är framgångsrikt om kortet är en 1 i en färg som ännu inte har spelats, eller om det är nästa nummer i följd i en färg som har spelats. Annars förbrukas en säkringstoken och det felspelade kortet slängs. Att framgångsrikt spela en 5:a i valfri färg fyller på en informationstoken. Oavsett om spelet lyckades eller inte, drar spelaren ett ersättningskort.

Spelet slutar omedelbart när antingen alla säkringspoletter är förbrukade, vilket resulterar i en spelförlust, eller när alla 5:or har spelats framgångsrikt, vilket leder till en spelvinst. Annars fortsätter spelet tills kortleken tar slut, och en hel runda efter det. I slutet av spelet summeras värdena för de högsta korten i varje färg, vilket resulterar i en totalpoäng av 25 möjliga poäng.

Reception

Hanabi fick positiva recensioner. Board Game Quest belönade spelet med fyra och en halv stjärnor, och prisade dess unika, tillgänglighet och engagemang. På liknande sätt berömde The Opinionated Gamers spelets engagemang och beroendeframkallande. Den vann flera priser, inklusive 2013 års Spiel des Jahres- vinnare och 2013 års Fairplay À la carte-pristagare. Hanabi placerade sig också på sjätte plats i Deutscher Spiele Preis 2013 .

Dator Hanabi

Hanabi är ett samarbetsspel med ofullkomlig information .

Datorprogram som spelar Hanabi kan antingen delta i självspel eller "ad hoc lagspel". I självspel spelar flera instanser av programmet med varandra i ett lag. De delar alltså en noggrant finslipad strategi för kommunikation och spel, även om de naturligtvis inte får dela information om varje spel olagligt med andra instanser av programmet.

I ad hoc-lagspel spelar programmet med andra godtyckliga program eller mänskliga spelare.

En mängd olika datorprogram har utvecklats genom att handkoda regelbaserade strategier. De bästa programmen, som WTFWThat, uppnådde nästan perfekta resultat i självspel med fem spelare, med en genomsnittlig poäng på 24,9 av 25.

AI-utmaning

2019 föreslog DeepMind Hanabi som ett idealiskt spel för att etablera ett nytt riktmärke för forskning om artificiell intelligens i kooperativt spel.

I självspelningsläge är utmaningen att utveckla ett program som kan lära sig från grunden att spela bra med andra instanser av sig själv. Sådana program uppnår endast cirka 15 poäng per spel från och med 2019, mycket sämre än handkodade program. Detta gap har dock minskat avsevärt från och med 2020, med Simplified Action Decoder som uppnådde omkring 24 poäng.

Ad hoc lagspel är en mycket större utmaning för AI, eftersom "Hanabi lyfter resonemang om andra agenters övertygelser och avsikter till förgrunden". Att spela på mänsklig nivå med ad hoc-team kräver algoritmerna för att lära sig och utveckla kommunikationskonventioner och strategier över tid med andra spelare via en sinnesteori . Datorprogram utvecklade för självspel misslyckas illa när de spelar i ad hoc-lag, eftersom de inte vet hur de ska lära sig att anpassa sig till hur andra spelare spelar. Hu et al. visat att inlärningssymmetri-invarianta strategier hjälper AI-agenter att undvika att lära sig oförtolkbara konventioner, förbättra deras prestanda när de matchas med separat utbildade AI-agenter (som får cirka 22 poäng) och med människor (som ger cirka 16 poäng jämfört med en baslinjemodell för självspel som fick cirka 9 poäng. ).

Deepmind släppte ett ramverk för öppen källkod för att underlätta forskning, kallat Hanabi Learning Environment.

Se även

externa länkar