Vinnare-tag-allt i aktion urval

Winner-take-all är ett datavetenskapligt koncept som har använts i stor utsträckning inom beteendebaserad robotik som en metod för handlingsval för intelligenta agenter . Winner-take-all-system fungerar genom att koppla moduler (task-designed areas) på ett sådant sätt att när en åtgärd utförs stoppar den alla andra åtgärder från att utföras, så att endast en åtgärd inträffar åt gången. Namnet kommer från idén att "vinnare"-åtgärden tar hela motorsystemets kraft.

Historia

Under 1980- och 1990-talen försökte många robotiker och kognitionsforskare hitta snabbare och effektivare alternativ till den traditionella världsmodelleringsmetoden för handlingsval. År 1982 publicerade Jerome A. Feldman och DH Ballard " Connectionist Models and Their Properties", som hänvisade till och förklarade vinnare-ta-allt som en metod för handlingsval. Feldmans arkitektur fungerade på den enkla regeln att i ett nätverk av sammankopplade åtgärdsmoduler kommer varje modul att ställa sin egen utdata till noll om den läser en högre ingång än sin egen i någon annan modul. 1986 introducerade Rodney Brooks beteendebaserad artificiell intelligens . [ förtydligande behövs ] Vinnare-ta-allt-arkitekturer för handlingsval blev snart ett vanligt inslag i beteendebaserade robotar, eftersom urvalet skedde på nivån för handlingsmodulerna (bottom-up) snarare än på en separat kognitiv nivå (top-down ), som producerar en tät koppling av stimulans och reaktion.

Typer av vinnare-ta-allt-arkitekturer

Hierarki

I den hierarkiska arkitekturen programmeras handlingar eller beteenden i en lista med hög till låg prioritet, med hämmande kopplingar mellan alla åtgärdsmoduler. Agenten utför lågprioriterade beteenden tills ett högre prioriterat beteende stimuleras, då det högre beteendet hämmar alla andra beteenden och tar över det motoriska systemet helt. Prioriterade beteenden är vanligtvis nyckeln till agentens omedelbara överlevnad, medan beteenden med lägre prioritet är mindre tidskänsliga. Till exempel skulle "rymma från rovdjur" rankas över "sömn". Även om den här arkitekturen tillåter tydlig programmering av mål, har många robotiker flyttat bort från hierarkin på grund av dess inflexibilitet.

Heterarki och fullt distribuerad

I den heterarkiska och fullt distribuerade arkitekturen har varje beteende en uppsättning villkor som måste uppfyllas innan det kan utföras, och en uppsättning eftervillkor som kommer att vara sanna efter att åtgärden har utförts. Dessa för- och eftervillkor bestämmer i vilken ordning beteenden måste utföras och används för att kausalt koppla åtgärdsmoduler. Detta gör att varje modul kan ta emot input från andra moduler såväl som från sensorerna, så att moduler kan rekrytera varandra. Till exempel, om agentens mål var att minska törst, skulle beteendet "dryck" kräva förutsättningen att ha vatten tillgängligt, så modulen skulle aktivera modulen som ansvarar för "hitta vatten". Aktiveringarna organiserar beteenden i en sekvens, även om endast en åtgärd utförs åt gången. Fördelningen av större beteenden över moduler gör detta system flexibelt och robust mot brus. Vissa kritiker av denna modell anser att alla befintliga uppsättningar av uppdelningsregler för föregångaren och konfliktorkopplingar mellan moduler ger subpar åtgärdsval. Dessutom återkopplingsslingan som används i modellen under vissa omständigheter leda till felaktigt val av åtgärd.

Skiljedomare och centralt koordinerad

I den arbiter och centralt koordinerade arkitekturen är åtgärdsmodulerna inte kopplade till varandra utan till en central arbiter. När beteenden utlöses börjar de "rösta" genom att skicka signaler till skiljedomaren, och beteendet med det högsta antalet röster väljs. I dessa system skapas bias genom "röstvikten", eller hur ofta en modul får rösta. Vissa arbiter-system tar en annan vändning på denna typ av vinnare-ta-allt genom att använda en "kompromiss"-funktion i domaren. Varje modul kan rösta för eller emot varje mindre åtgärd i en uppsättning åtgärder, och medlaren väljer åtgärden med flest röster, vilket innebär att det gynnar flest beteendemoduler.

Detta kan ses som ett brott mot den allmänna regeln mot att skapa representationer av världen i beteendebaserad AI, etablerad av Brooks. Genom att utföra kommandofusion skapar systemet en större sammansatt kunskapspool än vad som erhålls från enbart sensorerna, vilket bildar en sammansatt inre representation av miljön. Försvarare av dessa system hävdar att förbud mot världsmodellering sätter onödiga begränsningar för beteendebaserad robotik, och att agenter drar nytta av att bilda representationer och fortfarande kan förbli reaktiva.

Se även