Förkroppsligad kognitionsvetenskap
Embodied kognitionsvetenskap är ett tvärvetenskapligt forskningsfält, vars syfte är att förklara mekanismerna bakom intelligent beteende. Den består av tre huvudsakliga metoder: modellering av psykologiska och biologiska system på ett holistiskt sätt som betraktar sinnet och kroppen som en enda enhet; bildandet av en gemensam uppsättning allmänna principer för intelligent beteende; och experimentell användning av robotmedel i kontrollerade miljöer.
Bidragsgivare
Embodied kognitiv vetenskap lånar mycket från förkroppsligad filosofi och de relaterade forskningsområdena kognitionsvetenskap, psykologi , neurovetenskap och artificiell intelligens . Bidragsgivare till området inkluderar:
- Ur neurovetenskapens perspektiv, Gerald Edelman från Neurosciences Institute vid La Jolla, Francisco Varela från CNRS i Frankrike och JA Scott Kelso från Florida Atlantic University
- Ur psykologins perspektiv, Lawrence Barsalou , Michael Turvey , Vittorio Guidano och Eleanor Rosch
- Ur lingvistikens perspektiv Gilles Fauconnier , George Lakoff , Mark Johnson , Leonard Talmy och Mark Turner
- Ur språkinlärningsperspektiv, Eric Lenneberg och Philip Rubin på Haskins Laboratories
- Ur antropologins perspektiv, Edwin Hutchins , Bradd Shore , James Wertsch och Merlin Donald .
- Ur perspektivet av autonom agentdesign tillskrivs tidigt arbete ibland Rodney Brooks eller Valentino Braitenberg
- Ur perspektivet artificiell intelligens, Understanding Intelligence av Rolf Pfeifer och Christian Scheier eller How the Body Shapes the Way We Think , av Rolf Pfeifer och Josh C. Bongard
- Ur filosofins perspektiv Andy Clark , Dan Zahavi , Shaun Gallagher och Evan Thompson
1950 föreslog Alan Turing att en maskin kan behöva en människoliknande kropp för att tänka och tala:
Man kan också hävda att det är bäst att förse maskinen med de bästa sinnesorganen som man kan köpa för pengar, och sedan lära den att förstå och tala engelska. Den processen kan följa ett barns normala undervisning. Saker skulle påpekas och namnges etc. Återigen, jag vet inte vad det rätta svaret är, men jag tycker att båda tillvägagångssätten bör prövas.
Traditionell kognitiv teori
Förkroppsligande kognitiv vetenskap är en alternativ teori till kognition där den minimerar tilltal till beräkningsteori om sinne till förmån för större betoning på hur en organisms kropp bestämmer hur och vad den tänker. Traditionell kognitiv teori bygger främst på symbolmanipulation, där vissa indata matas in i en bearbetningsenhet som producerar en utdata. Dessa indata följer vissa syntaxregler, från vilka bearbetningsenheten finner semantisk mening. Således produceras en lämplig utdata. Till exempel är en människas sensoriska organ dess inmatningsanordningar, och stimuli som erhålls från den yttre miljön matas in i nervsystemet som fungerar som bearbetningsenheten. Härifrån kan nervsystemet läsa den sensoriska informationen eftersom den följer en syntaktisk struktur, vilket skapar en utdata. Denna produktion skapar sedan kroppsliga rörelser och frambringar beteende och kognition. Särskilt anmärkningsvärt är att kognition är förseglad i hjärnan, vilket betyder att mental kognition är avskuren från den yttre världen och endast är möjlig genom inmatning av sensorisk information.
Det förkroppsligade kognitiva förhållningssättet
Den förkroppsligade kognitionsvetenskapen skiljer sig från den traditionalistiska metoden genom att den förnekar input-output-systemet. Detta beror främst på de problem som presenteras av Homunculus-argumentet , som drog slutsatsen att semantisk betydelse inte kunde härledas från symboler utan någon form av inre tolkning. Om någon liten man i en persons huvud tolkade inkommande symboler, vem skulle då tolka den lille mannens input? På grund av spöket av en oändlig regress började den traditionalistiska modellen verka mindre rimlig. Förkroppsligad kognitionsvetenskap syftar alltså till att undvika detta problem genom att definiera kognition på tre sätt.
Kroppens fysiska egenskaper
Den första aspekten av förkroppsligad kognition undersöker den fysiska kroppens roll, särskilt hur dess egenskaper påverkar dess förmåga att tänka. Denna del försöker övervinna symbolmanipulationskomponenten som är ett kännetecken för den traditionalistiska modellen. Djupuppfattning, till exempel, kan bättre förklaras under det förkroppsligade tillvägagångssättet på grund av handlingens rena komplexitet. Djupuppfattning kräver att hjärnan upptäcker de olika näthinnebilderna som erhålls genom avståndet mellan de två ögonen. Dessutom komplicerar kropps- och huvudsignaler detta ytterligare. När huvudet vrids i en given riktning kommer objekt i förgrunden att verka röra sig mot objekt i bakgrunden. Av detta sägs det att någon form av visuell bearbetning sker utan behov av någon form av symbolmanipulation. Detta beror på att objekten som verkar flytta i förgrunden helt enkelt ser ut att röra sig. Denna observation drar slutsatsen att djupet kan uppfattas utan att någon mellanliggande symbolmanipulation är nödvändig.
Ett mer gripande exempel finns genom att undersöka auditiv perception. Generellt sett är ju större avståndet mellan öronen, desto större är möjlig hörsel. Relevant är också mängden densitet mellan öronen, eftersom styrkan på frekvensvågen ändras när den passerar genom ett givet medium. Hjärnans hörselsystem tar hänsyn till dessa faktorer när det bearbetar information, men återigen utan något behov av ett symboliskt manipulationssystem. Detta beror på att avståndet mellan öronen till exempel inte behöver symboler för att representera det. Själva avståndet skapar den nödvändiga möjligheten till större hörselkärpa. Mängden täthet mellan öronen är likartad, genom att det är själva mängden som helt enkelt bildar möjligheten till frekvensförändring. Med hänsyn till kroppens fysiska egenskaper är således ett symboliskt system onödigt och en ohjälpsam metafor.
Kroppens roll i den kognitiva processen
Den andra aspekten hämtar mycket från George Lakoffs och Mark Johnsons arbete med koncept. De hävdade att människor använder metaforer när det är möjligt för att bättre förklara sin yttre värld. Människan har också ett grundläggande lager av begrepp som andra begrepp kan härledas från. Dessa grundläggande begrepp inkluderar rumslig orientering som upp, ner, fram och bak. Människor kan förstå vad dessa begrepp betyder eftersom de direkt kan uppleva dem från sin egen kropp. Till exempel, eftersom mänsklig rörelse kretsar kring att stå upprätt och röra kroppen i en upp-och-ner-rörelse, har människor medfödd dessa begrepp upp och ner. Lakoff och Johnson hävdar att detta är liknande med andra rumsliga orienteringar som fram och bak också. Som tidigare nämnts är dessa grundläggande bestånd av rumsliga begrepp grunden i vilken andra begrepp konstrueras. Glad och ledsen till exempel ses nu som att vara upp respektive ner. När någon säger att de känner sig nere, är det de egentligen säger att de känner sig ledsna till exempel. Så här är poängen att sann förståelse av dessa begrepp är beroende av huruvida man kan ha en förståelse för människokroppen. Så argumentet går att om man saknade en mänsklig kropp, kunde de omöjligt veta vad upp eller ner skulle kunna betyda, eller hur det kunde relatera till känslomässiga tillstånd.
[Jag] föreställer mig en sfärisk varelse som lever utanför något gravitationsfält, utan kunskap eller fantasi om någon annan typ av erfarenhet. Vad kan UP betyda för en sådan varelse?
Även om detta inte betyder att sådana varelser skulle vara oförmögna att uttrycka känslor med andra ord, betyder det att de skulle uttrycka känslor annorlunda än människor. Mänskliga uppfattningar om lycka och sorg skulle vara annorlunda eftersom människan skulle ha olika kroppar. Så då påverkar en organisms kropp direkt hur den kan tänka, eftersom den använder metaforer relaterade till sin kropp som grund för begrepp.
Samspel av lokal miljö
En tredje komponent i det förkroppsligade tillvägagångssättet tittar på hur agenter använder sin närmiljö i kognitiv bearbetning. Det betyder att den lokala miljön ses som en faktisk förlängning av kroppens kognitiva process. Exemplet med en personlig digital assistent (PDA) används för att bättre föreställa sig detta. Denna punkt, som ekar funktionalism (sinnefilosofi), hävdar att mentala tillstånd är individuella av sin roll i ett mycket större system. Så under denna premiss liknar informationen på en handdator den information som lagras i hjärnan. Så om man tror att information i hjärnan utgör mentala tillstånd, så måste det följa att information i handdatorn också är ett kognitivt tillstånd. Tänk också på vilken roll penna och papper spelar i ett komplext multiplikationsproblem. Pennan och papperet är så involverade i den kognitiva processen att lösa problemet att det verkar löjligt att säga att de på något sätt skiljer sig från processen, på ungefär samma sätt som PDA:n används för information som hjärnan. Ett annat exempel undersöker hur människor kontrollerar och manipulerar sin miljö så att kognitiva uppgifter kan utföras bättre. Att lämna sina bilnycklar på en bekant plats så att de inte missas till exempel, eller använda landmärken för att navigera i en obekant stad. Således införlivar människor aspekter av sin omgivning för att hjälpa till med deras kognitiva funktion.
Exempel på värdet av embodied approach
Värdet av förkroppsligande tillvägagångssätt i samband med kognitiv vetenskap är kanske bäst [ citat behövs] förklaras av Andy Clark . Han gör påståendet att hjärnan ensam inte bör vara det enda fokuset för det vetenskapliga studiet av kognition
Det är allt tydligare att, i en mängd olika fall, den enskilda hjärnan inte bör vara det enda stället för kognitivt vetenskapligt intresse. Kognition är inte ett fenomen som framgångsrikt kan studeras samtidigt som man marginaliserar rollerna som kropp, värld och handling.
Följande exempel som används av Clark kommer att bättre illustrera hur förkroppsligat tänkande blir uppenbart [ citat behövs ] i vetenskapligt tänkande.
Blåfenad tonfisk
Thunnus , eller tonfisk, länge förbryllade konventionella biologer med sina otroliga förmågor att accelerera snabbt och uppnå höga hastigheter. En biologisk undersökning av tonfisken visar att den inte borde vara kapabel till sådana bedrifter. Ett svar kan dock hittas när man tar hänsyn till tonfiskens förkroppsligade tillstånd. Blåfenad tonfisk kan dra fördel av och exploatera sin lokala miljö genom att hitta naturligt förekommande strömmar för att öka hastigheten. Tonfisken använder också sin egen fysiska kropp för detta ändamål, genom att använda sin stjärtfena för att skapa de nödvändiga virvlarna och trycket så att den kan accelerera och hålla höga hastigheter. Således använder blåfenad tonfisk aktivt sin lokala miljö för sina egna syften genom egenskaperna hos sin fysiska kropp.
Robotar
Clark använder exemplet med den hoppande roboten som konstruerats av Raibert och Hodgins för att ytterligare demonstrera värdet av embodiment-paradigmet. Dessa robotar var i huvudsak vertikala cylindrar med en enkel hoppande fot. Utmaningen med att hantera robotens beteende kan vara skrämmande eftersom förutom själva programmets krångligheter, fanns det också de mekaniska frågorna om hur foten borde vara konstruerad så att den kunde hoppa. Ett förkroppsligat tillvägagångssätt gör det lättare att se att för att denna robot ska fungera måste den kunna utnyttja sitt system till fullo. Det vill säga att robotens system ska ses ha dynamiska egenskaper i motsats till den traditionella uppfattningen att det bara är en kommandocentral som bara utför åtgärder.
Syn
Clark skiljer mellan två typer av vision , animerad och ren vision. Ren vision är en idé som vanligtvis förknippas med klassisk artificiell intelligens , där vision används för att skapa en rik världsmodell så att tanke och förnuft kan användas för att helt utforska den inre modellen. Med andra ord, ren vision skapar passivt den yttre uppfattbara världen så att förnuftsförmågan bättre kan användas inåtvänd. Animerad vision, däremot, ser vision som det sätt på vilket realtidshandling kan påbörjas. Animerad vision är då mer ett fordon genom vilket visuell information erhålls så att åtgärder kan utföras. Clark pekar på animerad vision som ett exempel på förkroppsligande, eftersom det använder både biologiska och lokala miljösignaler för att skapa en aktiv intelligent process. Tänk på Clarks exempel på att gå till apoteket för att köpa en Kodak-film. I ens sinne är man bekant med Kodak-logotypen och dess varumärkesguldfärg. Således använder man inkommande visuella stimuli för att navigera runt i apoteket tills man hittar filmen. Därför bör syn inte ses som ett passivt system utan snarare en aktiv hämtningsenhet som intelligent använder sensorisk information och lokala miljösignaler för att utföra specifika verkliga handlingar.
Affordance
Inspirerat av den amerikanske psykologen James J. Gibsons arbete understryker detta nästa exempel vikten av handlingsrelevant sensorisk information, kroppsliga rörelser och signaler om lokal miljö. Dessa tre begrepp förenas av begreppet affordanser, som är handlingsmöjligheter som tillhandahålls av den fysiska världen till en given agent. Dessa bestäms i sin tur av agentens fysiska kropp, kapacitet och den lokala miljöns övergripande handlingsrelaterade egenskaper. Clark använder exemplet med en ytterspelare i baseboll för att bättre illustrera begreppet affordance. Traditionella beräkningsmodeller skulle hävda att en utespelare som försöker fånga en flugboll kan beräknas av variabler som ytterspelarens löphastighet och basebollens båge. Gibsons arbete visar dock att en enklare metod är möjlig. Ytterspelaren kan fånga bollen så länge de justerar sin löphastighet så att bollen hela tiden rör sig i en rak linje i deras synfält. Observera att denna strategi använder olika möjligheter som är beroende av framgången för ytterspelaren, inklusive deras fysiska kroppssammansättning, miljön på basebollplanen och den sensoriska information som ytterspelaren erhåller.
Clark påpekar här att den senare strategin att fånga bollen i motsats till den förra har betydande implikationer för uppfattningen. Affordance-metoden visar sig vara icke-linjär eftersom den bygger på spontana realtidsjusteringar. Tvärtom är den tidigare metoden för att beräkna bollens båge linjär eftersom den följer en sekvens av perception, beräkning och utförande av handling. Sålunda utmanar affordance-metoden den traditionella synen på perception genom att argumentera mot uppfattningen att beräkning och introspektion är nödvändiga. Istället borde det ersättas med tanken att perception utgör en kontinuerlig jämvikt av handlingsanpassning mellan agenten och världen. I slutändan hävdar Clark inte uttryckligen att detta är säkert, men han observerar att affordance-metoden kan förklara adaptiv respons på ett tillfredsställande sätt. Detta beror på att de använder miljösignaler som möjliggörs av perceptuell information som aktivt används i realtid av agenten.
Allmänna principer för intelligent beteende
I utformningen av allmänna principer för intelligent beteende avsåg Pfeifer att strida mot äldre principer som ges inom traditionell artificiell intelligens. Den mest dramatiska skillnaden är att principerna endast är tillämpliga på belägna robotagenter i den verkliga världen, en domän där traditionell artificiell intelligens visade minst lovande.
Principen för billig design och redundans : Pfeifer insåg att implicita antaganden från ingenjörer ofta påverkar en kontrollarkitekturs komplexitet väsentligt. Denna insikt återspeglas i diskussioner om skalbarhetsproblemet inom robotik. Den interna bearbetning som behövs för vissa dåliga arkitekturer kan växa ur proportion till nya uppgifter som krävs av en agent.
En av de primära orsakerna till skalbarhetsproblem är att mängden programmering och kunskapsteknik som robotdesignerna måste utföra växer mycket snabbt med komplexiteten i robotens uppgifter. Det finns allt fler bevis för att förprogrammering inte kan vara lösningen på skalbarhetsproblemet ... Problemet är att programmerare introducerar för många dolda antaganden i robotens kod.
De föreslagna lösningarna är att låta agenten utnyttja sin miljös inneboende fysik, att utnyttja begränsningarna för sin nisch och att ha agentmorfologi baserad på sparsamhet och principen om redundans. Redundans återspeglar önskan om felkorrigering av signaler som ges genom duplicering av liknande kanaler. Dessutom återspeglar det önskan att utnyttja sambanden mellan sensoriska modaliteter. (Se redundanta modaliteter ). Designmässigt innebär detta att redundans bör införas med hänsyn inte bara till en sensorisk modalitet utan för flera. Det har föreslagits att sammanslagning och överföring av kunskap mellan modaliteter kan vara grunden för att minska storleken på sinnesdata hämtade från den verkliga världen. Detta löser återigen skalbarhetsproblemet.
Principen för parallella, löst kopplade processer : Ett alternativ till hierarkiska metoder för kunskaps- och handlingsurval . Denna designprincip skiljer sig viktigast från Sense-Think-Act-cykeln för traditionell AI. Eftersom den inte involverar denna berömda cykel, påverkas den inte av ramproblemet .
Principen för sensorisk-motorisk koordination : Idealt sett bör interna mekanismer i en agent ge upphov till saker som minne och val att göra på ett framväxande sätt, snarare än att vara preskriptivt programmerade från början. Den här typen av saker tillåts dyka upp när agenten interagerar med omgivningen. Mottot är, bygg in färre antaganden i agentens styrenhet nu, så att inlärningen kan bli mer robust och idiosynkratisk i framtiden.
Principen om ekologisk balans : Detta är mer en teori än en princip, men dess implikationer är utbredda. Dess påstående är att den interna bearbetningen av ett medel inte kan göras mer komplex om det inte finns en motsvarande ökning av komplexiteten hos medlets motorer, extremiteter och sensorer. Med andra ord kommer den extra komplexiteten som tillförs hjärnan hos en enkel robot inte att skapa någon märkbar förändring i dess beteende. Robotens morfologi måste redan innehålla komplexiteten i sig för att ge tillräckligt med "andrum" för att mer intern bearbetning ska utvecklas.
Värdeprincip : Detta var arkitekturen som utvecklades i Darwin III-roboten av Gerald Edelman . Den förlitar sig starkt på konnektionism .
Kritiska svar
Traditionellt svar på anspråk på lokal miljö
En traditionalist kan hävda att föremål kan användas för att hjälpa till i kognitiva processer, men det betyder inte att de är en del av ett kognitivt system. Glasögon används för att underlätta den visuella processen, men att säga att de är en del av ett större system skulle helt omdefiniera vad som menas med ett visuellt system. Emellertid skulle anhängare av det förkroppsligade tillvägagångssättet kunna hävda att om föremål i miljön spelar den funktionella rollen som mentala tillstånd, så bör inte föremålen i sig räknas till de mentala tillstånden.
Lars Ludwig utforskar sinnesförlängning och beskriver dess roll inom teknik ytterligare. Han föreslår en kognitiv teori om "utökat artificiellt minne", som representerar en teoretisk uppdatering och förlängning av minnesteorierna av Richard Semon .
Se även
- ^ Varela, F., Thompson, E., & Rosch, E. (1991). Det förkroppsligade sinnet: kognitiv vetenskap och mänsklig upplevelse . MIT Press.
- ^ Hutchins, E. (1995). Kognition i det vilda . MIT Press.
- ^ Newen, A., De Bruin, L. & Gallagher, S. (Eds.) (2018), The Oxford Handbook of 4E Cognition . Oxford University Press.
- ^ Shapiro, L. (Red.) (2014), The Routledge Handbook of Embodied Cognition . Routledge Taylor & Francis.
- ^ Turing, Alan (oktober 1950), "Computing Machinery and Intelligence", Mind , LIX (236): 433–460, doi : 10.1093/mind/LIX.236.433 , ISSN 0026-4423
- ^ a b c Shapiro, Larry (mars 2007). "The Embodied Cognition Programme" (PDF) . Filosofi kompass . 2 (2). doi : 10.1111/j.1747-9991.2007.00064.x .
- ^ a b c Clark, Andy (september 1999). "En förkroppslig kognitiv vetenskap?" (PDF) . Trender inom kognitionsvetenskap . 3 (9): 345–351. doi : 10.1016/s1364-6613(99)01361-3 . PMID 10461197 . Arkiverad från originalet (PDF) den 26 mars 2012 . Hämtad 27 juni 2011 .
- ^ a b Pfeifer, R., Scheier, C., Understanding Intelligence (MIT Press, 2001) ISBN 0-262-66125-X
- ^ Stoytchev, A. (2006). Fem grundläggande principer för utvecklingsrobotik NIPS 2006 Workshop om jordning av perception, kunskap och kognition i sensorisk-motorisk upplevelse. Institutionen för datavetenskap, Iowa State U
- ^ Konijn, Paul (2007). Sommarworkshop om multi-sensoriska modaliteter i kognitiv vetenskap upptäckt och identifiering av sällsynta audiovisuella signaler. DIRAC EU IP IST-projekt, Schweiz.
- ^ Ludwig, Lars, Utökat artificiellt minne. Mot en integrerad kognitiv teori om minne och teknik. (Deutsche Nationalbibliothek, 2013)
Vidare läsning
- Braitenberg, Valentino (1986). Fordon: Experiment i syntetisk psykologi . Cambridge, MA: MIT Press. ISBN 0-262-52112-1
- Brooks, Rodney A. (1999). Cambrian Intelligence: The Early History of the New AI . Cambridge, MA: MIT Press. ISBN 0-262-52263-2
- Edelman, G. Wider than the Sky (Yale University Press, 2004) ISBN 0-300-10229-1
- Fowler, C., Rubin, PE, Remez, RE och Turvey, MT (1980). Implikationer för talproduktion av en allmän handlingsteori. I B. Butterworth (Ed.), Language Production, vol. I: Tal och prat (s. 373–420). New York: Academic Press. ISBN 0-12-147501-8
- Lenneberg, Eric H. (1967). Språkets biologiska grunder . John Wiley & Sons. ISBN 0-471-52626-6
- Pfeifer, R. och Bongard JC, Hur kroppen formar hur vi tänker: en ny syn på intelligens (The MIT Press, 2007). ISBN 0-262-16239-3