Cyc

Cyc
	Medurs: Logotyper för Cycs kunskapsbas, inferensmotorer, handlingsbar utdata, intelligent dataurval
Originalförfattare	Douglas Lenat
Utvecklare	Cycorp, Inc.
Initial release	1984 ; 39 år sedan
Stabil frisättning	6.1 / 27 november 2017 ; 5 år sedan
Skrivet i	Lisp , Cycle , SubL
Typ	Ontologi och kunskapsbas och kunskapsrepresentation språk och inferensmotor
Hemsida	www .cyc .com

Cyc (uttalas / ˈ s aɪ k / SYKE ) är ett långsiktigt artificiell intelligensprojekt som syftar till att sammanställa en omfattande ontologi och kunskapsbas som spänner över de grundläggande begreppen och reglerna om hur världen fungerar. I hopp om att fånga kunskap om sunt förnuft fokuserar Cyc på implicit kunskap som andra AI-plattformar kan ta för givet. Detta kontrasteras med fakta man kan hitta någonstans på internet eller hämta via en sökmotor eller Wikipedia. Cyc gör det möjligt för semantiska resonemang att utföra mänskliga resonemang och vara mindre "spröda" när de konfronteras med nya situationer.

Douglas Lenat började projektet i juli 1984 på MCC , där han var rektor 1984–1994, och sedan januari 1995 har han varit under aktiv utveckling av Cycorp -företaget, där han är VD .

Översikt

Behovet av ett massivt symboliskt artificiell intelligensprojekt av detta slag föddes i början av 1980-talet. Tidiga AI-forskare hade riklig erfarenhet under de senaste 25 åren med AI-program som skulle generera uppmuntrande tidiga resultat men som sedan misslyckades med att "skala upp" - gå bortom "utbildningssetet" för att ta itu med ett bredare spektrum av fall. Douglas Lenat och Alan Kay offentliggjorde detta behov och de organiserade ett möte i Stanford 1983 för att ta itu med problemet. Beräkningarna baktill på kuvertet av Lenat, Kay och deras kollegor (inklusive Marvin Minsky , Allen Newell , Edward Feigenbaum och John McCarthy ) indikerade att den ansträngningen skulle kräva mellan 1000 och 3000 årsverken av ansträngning, långt utöver standardmodellen för akademisk projekt. Händelser inom ett år efter mötet gjorde det dock möjligt för en ansträngning av den omfattningen att komma igång.

Projektet startade i juli 1984 som flaggskeppsprojektet för 400-personers Microelectronics and Computer Technology Corporation (MCC), ett forskningskonsortium som startades av två dussin stora USA-baserade företag "för att motverka en då olycksbådande japansk insats inom AI, den så- kallas " femte generationens " projekt. Den amerikanska regeringen reagerade på hotet från den femte generationen genom att anta National Cooperative Research Act från 1984, som för första gången gjorde det möjligt för amerikanska företag att "samverka" om långvarig högriskforskning med hög lönsamhet, och MCC och Sematech växte fram till dra nytta av den tioåriga möjligheten. MCC:s första VD och koncernchef var Bobby Ray Inman , tidigare NSA-direktör och biträdande direktör för Central Intelligence Agency.

Syftet med Cyc-projektet var att kodifiera, i maskinanvändbar form, de miljontals kunskaper som utgör mänskligt sunt förnuft. Detta innebar, längs vägen, (1) utveckla ett adekvat uttrycksfullt representationsspråk, CycL , (2) utveckla en ontologi som spänner över alla mänskliga begrepp ner till någon lämplig detaljnivå, (3) utveckla en kunskapsbas på det ontologiska ramverket, innefattande all mänsklig kunskap om dessa begrepp ner till någon lämplig detaljnivå, och (4) utveckla en slutledningsmotor exponentiellt snabbare än de som används i då konventionella expertsystem, för att kunna dra slutsatser av samma typ och djup som människor är kapabla av, med tanke på deras kunskap om världen.

Lite mer detaljerat:

Representationsspråket CycL började som en förlängning av RLL (det så kallade Representation Language Language, utvecklat 1979–1980 av Lenat och hans doktorand Russell Greiner vid Stanford University), men inom några år efter lanseringen av Cyc-projektet det blev tydligt att även representation av en typisk nyhetsartikel eller roman eller reklam skulle kräva mer än uttryckskraften hos full första ordningens logik , nämligen andra ordningens predikatkalkyl ("Vad är förhållandet mellan regn och vatten?") och sedan t.o.m. högre nivåer av logik inklusive modal logik , reflektion (gör det möjligt för systemet att resonera om dess framsteg hittills, om ett problem som det arbetar med) och kontextlogik (som gör det möjligt för systemet att explicit resonera om de sammanhang där dess olika premisser är och slutsatser kan hålla), icke-monoton logik och omskrivning . År 1989 hade CycL expanderat i uttryckskraft till logik av högre ordning (HOL).
- Triplestore- representationer (som är besläktade med Frame-and-slot- representationsspråken på 1970-talet som RLL kom ifrån) är utbredda idag inom AI. Det kan vara användbart att nämna några exempel som betonar eller bryter den typen av representation, typiskt för de exempel som tvingade Cyc-projektet att gå från en triplestore-representation till en mycket mer uttrycksfull representation under perioden 1984–1989: engelska meningar inklusive negationer ("Fred äger inte en hund"), kapslade kvantifierare ("Varje amerikan har en mamma" betyder för-alla x det finns y... men "Varje amerikan har en president" betyder att det finns y så att för- alla x...), kapslade modaler som "USA tror att Tyskland vill att Nato ska undvika att förfölja..." och det är till och med besvärligt att representera, i en Triplestore , växlingsförhållanden högre än 2, som "Los Angeles är mellan San Diego och San Francisco längs US101."
Cycs ontologi växte till cirka 100 000 termer under projektets första decennium, till 1994, och från och med 2017 innehöll den cirka 1 500 000 termer. Denna ontologi inkluderade:
- 416 000 samlingar (typer, sorter, naturtyper , vilket inkluderar båda typerna av saker som fisk och typer av åtgärder som fiske)
- lite över en miljon individer som representerar
  - 42 500 predikat (relationer, attribut, fält, egenskaper, funktioner),
  - ungefär en miljon allmänt välkända enheter som USA, Barack Obama, TheSigningOfTheUSDeclarationOfIndependence, etc.
  - Ett godtyckligt stort antal ytterligare termer är också implicit närvarande i Cyc ontology, i den meningen att det finns termbetecknande funktioner som CalendarYearFn (när argumentet 2016 ges, betecknar det kalenderåret 2016), GovernmentFn (när det ges argumentet Frankrike, det betecknar Frankrikes regering), Meter (när argumentet 2016 ges, betecknar det ett avstånd på 2,016 kilometer), och häckningar och sammansättningar av sådana funktionsbetecknande termer.
Cyc-kunskapsbasen för allmänna sunt förnuftsregler och påståenden som involverar dessa ontologiska termer skapades till stor del genom handaxiomskrivning; den växte till cirka 1 miljon 1994, och är från och med 2017 cirka 24,5 miljoner och har tagit långt över 1 000 års ansträngning för att bygga.
- Det är viktigt att förstå att de Cyc ontologiska ingenjörerna strävar efter att hålla dessa siffror så små som möjligt, inte blåsa upp dem, så länge som den deduktiva stängningen av kunskapsbasen inte minskar. Anta att Cyc berättas om en miljard enskilda människor, djur etc. Då skulle det kunna berättas 10 ¹⁸ fakta av formen "Mickey Mouse är inte samma individ som <Bullwinkle the Moose/Abraham Lincoln/Jennifer Lopez>". Men istället för det skulle man kunna berätta för Cyc 10 000 Linnéska taxonomiregler följt av bara 10 ⁸ regler av formen "Ingen mus är en älg". Och ännu mer kompakt kunde Cyc istället bara ges de 10 000 Linnéska taxonomireglerna följt av bara en regel av formen "För vilka två Linnéska taxoner som helst, om ingen är explicit känd för att vara en supertaxon av den andra, så är de disjunkta". Dessa 10 001 påståenden har samma deduktiva slutsats som de tidigare nämnda 10 ¹⁸ fakta.
Cyc-inferensmotorns design skiljer det epistemologiska problemet (vilket innehåll ska finnas i Cyc KB) från det heuristiska problemet (hur Cyc effektivt kunde härleda argument hundratals steg djupa, i ett hav av tiotals miljoner axiom). För att göra det förra kan CycL-språket och välförstådd logisk slutledning vara tillräcklig. För det senare använde Cyc en community-of-agents-arkitektur, där specialiserade resonemangsmoduler, var och en med sin egen datastruktur och algoritm, "räckte upp handen" om de effektivt kunde göra framsteg på något av de för närvarande öppna delproblemen. År 1994 fanns det 20 sådana heuristisk nivå (HL) moduler; från och med 2017 finns det över 1 050 HL-moduler.
- Några av dessa HL-moduler är mycket generella, till exempel en modul som cachar Kleene Star ( transitiv stängning ) av alla vanligt använda transitiva relationer i Cycs ontologi.
- Vissa är domänspecifika, till exempel en kemisk ekvationsbalanserare. Dessa kan vara och är ofta en "flykt" till (pekare till) något externt tillgängligt program eller webbtjänst eller onlinedatabas, till exempel en modul för att snabbt "beräkna" den nuvarande befolkningen i en stad genom att veta var/hur man ska leta upp det.

CycL har en offentligt släppt specifikation och dussintals HL-moduler beskrevs i Lenat och Guhas lärobok, men den faktiska Cyc-inferensmotorkoden, och hela listan över 1000+ HL-moduler, är Cycorp-proprietära.

Namnet "Cyc" (från "encyclopedia", uttalat [saɪk] , som " syke ") är ett registrerat varumärke som ägs av Cycorp. Tillgång till Cyc sker genom betalda licenser, men bona fide AI-forskningsgrupper får endast forskningslicenser utan kostnad (jfr ResearchCyc ); från och med 2017 har över 600 sådana grupper världen över dessa licenser.

Typiska kunskapsdelar representerade i Cyc-kunskapsbasen är "Varje träd är en växt" och "Växter dör så småningom". På frågan om träd dör kan slutledningsmotorn dra den uppenbara slutsatsen och svara rätt på frågan.

Det mesta av Cycs kunskap, utanför matematiken, är endast sann som standard. Till exempel, Cyc vet att som standard älskar föräldrar sina barn, när du blir glad ler du, att ta ditt första steg är en stor prestation, när någon du älskar har en stor prestation som gör dig lycklig, och bara vuxna har barn . På frågan om en bild med rubriken "Någon som ser sin dotter ta sitt första steg" innehåller en leende vuxen person, kan Cyc logiskt dra slutsatsen att svaret är Ja och "visa dess arbete " genom att presentera det steg för steg logiska argumentet med hjälp av dessa fem bitar av kunskap från sin kunskapsbas. Dessa är formulerade i språket CycL , som är baserat på predikatkalkyl och har en syntax som liknar den för programmeringsspråket Lisp .

Under 2008 mappades Cyc-resurser till många Wikipedia- artiklar. Cyc är för närvarande ansluten till Wikidata . Framtida planer kan ansluta Cyc till både DBpedia och Freebase .

Mycket av det nuvarande arbetet Cyc fortsätter att vara kunskapsteknik , som representerar fakta om världen för hand och implementerar effektiva slutledningsmekanismer på den kunskapen. Arbetet på Cycorp innebär dock att Cycorp i allt högre grad ger Cyc-systemet förmågan att kommunicera med slutanvändare på naturligt språk och att hjälpa till med den pågående kunskapsbildningsprocessen via maskininlärning och förståelse av naturliga språk . En annan stor satsning på Cycorp är att bygga en svit med Cyc-drivna ontologiska ingenjörsverktyg för att sänka ribban för inträde för individer att bidra till, redigera, bläddra och fråga Cyc.

Liksom många företag har Cycorp ambitioner att använda Cycs naturliga språkbehandling för att analysera hela internet för att extrahera strukturerad data; till skillnad från alla andra, kan det uppmana själva Cyc-systemet att agera som en induktiv fördom och som en bedömare av tvetydighet , metafor och ellips . Det finns få, om några, systematiska benchmarkstudier av Cycs prestanda.

Kunskapsbas

Begreppsnamnen i Cyc är CycL- termer eller konstanter . Konstanter börjar med ett valfritt "#$" och är skiftlägeskänsliga. Det finns konstanter för:

Enskilda föremål som kallas individer , till exempel #$BillClinton eller #$France.
Samlingar , till exempel #$Tree-ThePlant (som innehåller alla träd) eller #$EquivalenceRelation (som innehåller alla ekvivalensrelationer ). En medlem i en samling kallas en instans av den samlingen.
Funktioner , som producerar nya termer från givna. Till exempel kommer #$FruitFn, när den förses med ett argument som beskriver en typ (eller samling) av växter, att returnera samlingen av dess frukter. Enligt konvention börjar funktionskonstanter med en stor bokstav och slutar med strängen "Fn".
Sanningsfunktioner , som kan tillämpas på ett eller flera andra begrepp och returnera antingen sant eller falskt. Till exempel är #$syskon syskonförhållandet, sant om de två argumenten är syskon. Enligt konvention börjar sanningsfunktionskonstanter med en liten bokstav. Sanningsfunktioner kan delas upp i logiska kopplingar (som #$and, #$or, #$not, #$implies), kvantifierare (#$forAll, #$thereExists, etc.) och predikat .

Två viktiga binära predikat är #$isa och #$genls. Den första beskriver att ett föremål är en instans av någon samling, den andra att en samling är en undersamling till en annan. Fakta om begrepp hävdas med hjälp av vissa CycL- meningar . Predikat skrivs före sina argument, inom parentes:

(#$isa #$BillClinton #$UnitedStates President)

"Bill Clinton tillhör samlingen av amerikanska presidenter."

(#$genls #$Tree-ThePlant #$Plant)

"Alla träd är växter."

(#$capitalCity #$Frankrike #$Paris)

"Paris är Frankrikes huvudstad."

Meningar kan också innehålla variabler, strängar som börjar med "?". Dessa meningar kallas "regler". En viktig regel som hävdas om #$isa-predikatet lyder:

(#$ antyder (#$and (#$isa ?OBJ ?SUPERSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))

"Om OBJ är en instans av samlingen SUBSET och SUBSET är en undersamling av SUPERSET , då är OBJ en instans av samlingen SUPERSET". Ett annat typiskt exempel är

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)

vilket innebär att det för varje instans av samlingen #$ChordataPhylum (dvs. för varje chordate ), finns ett hondjur (instans av #$FemaleAnimal), som är dess mor (beskrivs av predikatet #$biologicalMother).

Kunskapsbasen är uppdelad i mikroteorier (Mt) , samlingar av begrepp och fakta som vanligtvis hänför sig till ett visst kunskapsområde. Till skillnad från kunskapsbasen som helhet måste varje mikroteori vara fri från monotona motsägelser. Varje mikroteori är ett förstklassigt objekt i Cyc-ontologin; den har ett namn som är en regelbunden konstant; mikroteorikonstanter innehåller strängen "Mt" enligt konvention. Ett exempel är #$MathMt, mikroteorin som innehåller matematisk kunskap. Mikroteorierna kan ärva från varandra och är organiserade i en hierarki: en specialisering av #$MathMt är #$GeometryGMt, mikroteorin om geometri.

Inferensmotor

En inferensmotor är ett datorprogram som försöker härleda svar från en kunskapsbas. Cyc-inferensmotorn utför allmän logisk deduktion (inklusive modus ponens , modus tollens , universell kvantifiering och existentiell kvantifiering ). Den utför också induktivt resonemang , statistisk maskininlärning och symbolisk maskininlärning och abduktivt resonemang (men naturligtvis sparsamt och använder den befintliga kunskapsbasen som filter och vägledning).

Släpps

OpenCyc

Den första versionen av OpenCyc släpptes våren 2002 och innehöll endast 6 000 koncept och 60 000 fakta. Kunskapsbasen släpptes under Apache-licensen . Cycorp uttalade sin avsikt att släppa OpenCyc under parallella, obegränsade licenser för att möta användarnas behov. CycL och SubL-tolken (programmet som tillåter användare att bläddra och redigera databasen samt att dra slutsatser) släpptes gratis, men bara som en binär, utan källkod . Den gjordes tillgänglig för Linux och Microsoft Windows . Texai-projektet med öppen källkod släppte det RDF -kompatibla innehållet extraherat från OpenCyc. En version av OpenCyc, 4.0, släpptes i juni 2012. OpenCyc 4.0 inkluderade mycket av Cyc-ontologin vid den tiden, som innehöll hundratusentals termer, tillsammans med miljontals påståenden som relaterade termerna till varandra; dessa är dock huvudsakligen taxonomiska påståenden, inte de komplexa regler som finns i Cyc. Kunskapsbasen OpenCyc 4.0 innehöll 239 000 koncept och 2 093 000 fakta.

Huvudpoängen med att släppa OpenCyc var att hjälpa AI-forskare att förstå vad som saknades i vad de nu kallar ontologier och kunskapsgrafer . Det är användbart och viktigt att ha ordentligt taxonomiserade begrepp som person, natt, sömn, liggande, vaken, glad, etc., men det som saknas i OpenCyc -innehållet om dessa termer, men som finns i Cyc KB-innehållet, är de olika reglerna för tumme som de flesta av oss delar om dessa termer: att (som standard i ModernWesternHumanCultureMt) varje person sover på natten, sover liggandes, kan väckas, inte är nöjd med att bli väckt, och så vidare . Den punkten kräver inte kontinuerligt uppdaterade versioner av OpenCyc, så från och med 2017 är OpenCyc inte längre tillgängligt.

ResearchCyc

I juli 2006 släppte Cycorp den körbara filen ResearchCyc 1.0, en version av Cyc riktad till forskarvärlden, utan kostnad. (ResearchCyc var i betastadiet av utveckling under hela 2004; en betaversion släpptes i februari 2005.) Utöver den taxonomiska informationen i OpenCyc innehåller ResearchCyc betydligt mer semantisk kunskap (dvs ytterligare fakta och tumregler) som involverar begreppen i dess kunskapsbas; den innehåller också ett stort lexikon, engelska analys- och genereringsverktyg och Java -baserade gränssnitt för kunskapsredigering och sökning. Dessutom innehåller den ett system för ontologibaserad dataintegration . Från och med 2017 fortsatte regelbundna utgåvor av ResearchCyc att dyka upp, med 600 forskargrupper som använder licenser runt om i världen utan kostnad för icke-kommersiella forskningsändamål. Från och med december 2019 stöds inte längre ResearchCyc. Cycorp förväntar sig att förbättra och se över verktyg för externa utvecklare under de kommande åren.

Ansökningar

Det har varit över hundra framgångsrika tillämpningar av Cyc; här är några inbördes olika instanser:

Läkemedelsterm Thesaurus Manager/Integratör

I över ett decennium har Glaxo använt Cyc för att halvautomatiskt integrera alla stora (hundratusentals termer) tesauri av termer inom läkemedelsindustrin som återspeglar olika användningsområden mellan företag, länder, år och underbranscher. Denna ontologiintegreringsuppgift kräver domänkunskap, ytlig semantisk kunskap, men också godtyckligt djup kunskap om sunt förnuft och resonemang. Läkemedelsordförråden varierar mellan länder, (under)branscher, företag, avdelningar och årtionden. T.ex. vad är ett gelpaket ? Vad är "gatnamnet" för ranitidinhydroklorid ? Var och en av dessa n kontrollerade vokabulärer är en ontologi med cirka 300 000 termer. Glaxo-forskare måste ställa en fråga i deras nuvarande ordförråd , få den översatt till en neutral "sanna betydelse" och sedan få den omvandlad i motsatt riktning för att hitta potentiella matchningar mot dokument som var och en har skrivits för att överensstämma med ett visst känt ordförråd . De hade använt en stor personal för att göra det manuellt. Cyc används som den universella interlingua som kan representera föreningen av alla termers "sanna betydelser" och kan representera 300k transformationerna mellan var och en av dessa kontrollerade vokabulärer och Cyc, och därigenom omvandla ett n²-problem till ett linjärt utan att introducera vanlig sorts "telefonspel" dämpning av betydelse. Dessutom skapas var och en av dessa 300 000 mappningar för varje synonymordbok på ett till stor del automatiserat sätt, av Cyc.

Kunskapsbas för terrorism

Den omfattande kunskapsbasen om terrorism var en applikation av Cyc i utveckling som i slutändan försökte innehålla all relevant kunskap om "terroristgrupper", deras medlemmar, ledare, ideologi, grundare, sponsorer, tillhörigheter, anläggningar, platser, ekonomi, förmågor, avsikter, beteenden , taktik och fullständiga beskrivningar av specifika terroristhändelser. Kunskapen lagras som påståenden i matematisk logik, lämpliga för datorförståelse och resonemang.

Cleveland Clinic Foundation

Cleveland Clinic har använt Cyc för att utveckla ett frågegränssnitt på naturligt språk av biomedicinsk information, som sträcker sig över årtionden av information om kardiothoraxoperationer. En fråga tolkas i en uppsättning CycL- fragment (högre ordningens logik) med öppna variabler (t.ex. "den här frågan talar om en person som utvecklade en endokarditinfektion", "den här frågan handlar om en undergrupp av patienter från Cleveland Clinic som opererades där 2009", etc.); sedan tillämpas olika begränsningar (medicinsk domänkunskap, sunt förnuft, diskurspragmatik, syntax) för att se hur dessa fragment eventuellt skulle kunna passa ihop till en semantiskt meningsfull formell fråga; avsevärt, i de flesta fall finns det exakt ett och endast ett sådant sätt att inkorporera och integrera dessa fragment. Att integrera fragmenten innebär (i) att bestämma vilka öppna variabler i vilka fragment faktiskt representerar samma variabel, och (ii) för alla slutvariabler, bestämma vilken ordning och omfattning av kvantifiering den variabeln ska ha, och vilken typ (universell eller existentiell) . Den logiska (CycL) frågan konverteras sedan till en SPARQL- fråga som skickas till CCF SemanticDB som är dess datasjö .

MathCraft

One Cyc-applikationen syftar till att hjälpa elever att göra matematik på en 6:e klassnivå, vilket hjälper dem att förstå det ämnet mycket djupare. Den bygger på erfarenheten att vi ofta har trott att vi förstått något, men först verkligen förstått det efter att vi behövt förklara eller lära ut det för någon annan. Till skillnad från nästan all annan pedagogisk programvara, där datorn spelar rollen som lärare, har denna applikation av Cyc, kallad MathCraft, Cyc spela rollen som en studiekamrat som alltid är lite mer förvirrad än vad du, användaren, är i ämnet. . Användarens roll är att observera Cyc-avataren och ge den råd, rätta till dess fel, mentora den, få den att se vad den gör fel, etc. Eftersom användaren ger goda råd låter Cyc avataren göra färre misstag av den typen , ur användarens synvinkel verkar det som om användaren just framgångsrikt har lärt den något. Detta är en variant av lärande genom undervisning .

Kritik

Cyc-projektet har beskrivits som "en av de mest kontroversiella ansträngningarna i historien om artificiell intelligens". Catherine Havasi , VD för Luminoso, säger att Cyc är föregångaren till IBM:s Watson . Maskinlärande forskare Pedro Domingos hänvisar till projektet som ett "katastrofiskt misslyckande" av flera skäl, inklusive den oändliga mängden data som krävs för att producera hållbara resultat och oförmågan för Cyc att utvecklas på egen hand.

Robin Hanson , professor i ekonomi vid George Mason University, ger en mer balanserad analys:

Naturligtvis är CYC-projektet öppet för kritik på sina många specifika val. Människor har klagat över dess logik- och språkliknande representationer, över dess urval av prototypiska fall att bygga från (t.ex. uppslagsverksartiklar), över dess fokus på att svara framför att agera, över hur ofta den bygger om kontra att underhålla äldre system, och om att vara privat kontra att publicera allt. Men alla stora projekt som detta skulle skapa sådana tvister, och det är inte uppenbart att något av dess val har varit allvarligt fel. De var tvungna att börja någonstans, och enligt min mening har de nu samlat en kunskapsbas med en verkligt spektakulär storlek, omfattning och integration. Andra arkitekturer kan mycket väl fungera bättre, men om det är i närheten av så viktigt att känna till massor som Lenat tror, skulle jag förvänta mig seriösa AI-försök att importera CYC:s kunskap och översätta den till en ny representation. Ingen annan källa har någonstans i närheten av CYC:s storlek, omfattning och integration.

En liknande känsla uttrycktes av Marvin Minsky : "Tyvärr har de mest populära strategierna bland AI-forskare på 1980-talet hamnat i en återvändsgränd," sa Minsky. Så kallade " expertsystem ", som efterliknade mänsklig expertis inom snävt definierade ämnesområden som juridik och medicin, kunde matcha användarnas frågor till relevanta diagnoser, artiklar och sammanfattningar, men de kunde inte lära sig begrepp som de flesta barn känner till när de är 3 år gammal. "För varje olika typ av problem," sa Minsky, "var konstruktionen av expertsystem tvungen att börja om från början, eftersom de inte ackumulerade sunt förnuft kunskap." Endast en forskare har engagerat sig i den kolossala uppgiften att bygga ett omfattande sunt förnuftsresonemangssystem, enligt Minsky. Douglas Lenat har genom sitt Cyc-projekt riktat in mer än 1 miljon regler rad för rad till en kunskapsbas för sunt förnuft.

Gary Marcus , professor i psykologi och neuralvetenskap vid New York University och medgrundare av ett AI-företag som heter Geometric Intelligence, säger "det representerar ett tillvägagångssätt som skiljer sig mycket från alla djupinlärningssaker som har varit i nyheterna." Detta överensstämmer med Doug Lenats ståndpunkt att "Ibland räcker inte intelligensens faner ".

Stephen Wolfram skriver:

I början av området för artificiell intelligens fanns det många diskussioner om "kunskapsrepresentation", med tillvägagångssätt baserade på olika sätt på det naturliga språkets grammatik, predikatslogikens struktur eller databasernas formalism. Mycket få storskaliga projekt försöktes (Doug Lenats Cyc är ett anmärkningsvärt motexempel).

Marcus skriver:

Fältet skulle mycket väl kunna gynnas om CYC systematiskt beskrevs och utvärderades. Om CYC har löst någon betydande del av sunt förnuftsresonemang är det viktigt att veta det, både som ett användbart verktyg och som en utgångspunkt för vidare forskning. Om CYC har hamnat i svårigheter skulle det vara bra att lära sig av de misstag som gjordes. Om CYC är helt värdelös, kan forskare åtminstone sluta oroa sig för om de uppfinner hjulet på nytt.

Med några års mellanrum sedan den började publiceras (1993), finns det en ny artikel i Wired Magazine om Cyc, en del positiva och en del negativa (inklusive ett nummer som innehöll en av varje).

Anmärkningsvärda anställda

Det här är en lista över några av de anmärkningsvärda personerna som arbetar eller har arbetat med Cyc antingen när det var ett projekt på MCC (där Cyc först startade) eller Cycorp.

Se även

Vidare läsning

Alan Belasco et al. (2004). "Att representera kunskapsluckor effektivt" . I: D. Karagiannis, U. Reimer (Eds.): Practical Aspects of Knowledge Management, Proceedings of PAKM 2004, Wien, Österrike, 2–3 december 2004 . Springer-Verlag, Berlin Heidelberg.
Bertino, Elisa ; Piero, Gian; Zarria, BC (2001). Intelligenta databassystem . Addison-Wesley Professional.
John Cabral och andra (2005). "Konvertera semantisk meta-kunskap till induktiv bias" . I: Proceedings of the 15th International Conference on Inductive Logic Programming . Bonn, Tyskland, augusti 2005.
Jon Curtis et al. (2005). "Om effektiv användning av Cyc i ett frågesvarssystem" . I: Papers from the IJCAI Workshop on Knowledge and Reasoning for Answering Questions . Edinburgh, Skottland: 2005.
Chris Deaton et al. (2005). "The Comprehensive Terrorism Knowledge Base in Cyc" . I: Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005.
Kenneth Forbus et al. (2005). "Kombinera analogi, intelligent informationssökning och kunskapsintegration för analys: En preliminär rapport" . I: Proceedings of the 2005 International Conference on Intelligence Analysis , McLean, Virginia, maj 2005
douglas foxvog (2010), "Cyc". I: Theory and Applications of Ontology: Computer Applications , Springer .
Fritz Lehmann och d. foxvog (1998), " Att sätta kött på benen: frågor som uppstår när man skapar anatomiska kunskapsbaser med rika relationsstrukturer" . I: Knowledge Sharing across Biological and Medical Knowledge Based Systems , AAAI .
Douglas Lenat och RV Guha (1990). Att bygga stora kunskapsbaserade system: representation och slutledning i Cyc-projektet . Addison-Wesley. ISBN 0-201-51752-3 .
James Masters (2002). "Structured Knowledge Source Integration och dess tillämpningar för informationsfusion" . I: Proceedings of the Fifth International Conference on Information Fusion . Annapolis, MD, juli 2002.
James Masters och Z. Güngördü (2003). "Structured Knowledge Source Integration: A Progress Report" I: Integration of Knowledge Intensive Multiagent Systems . Cambridge, Massachusetts, USA, 2003.
Cynthia Matuszek et al. (2006). "En introduktion till syntaxen och innehållet i Cyc." . I: Proc. av 2006 års AAAI vårsymposium om att formalisera och sammanställa bakgrundskunskap och dess tillämpningar på kunskapsrepresentation och frågesvar . Stanford, 2006
Cynthia Matuszek et al. (2005). "Searching for Common Sense: Populating Cyc from the Web" . I: Proceedings of the Twentieth National Conference on Artificiell Intelligens . Pittsburgh, Pennsylvania, juli 2005.
Tom O'Hara et al. (2003). "Inducerande kriterier för lexikal kartläggning av masssubstantiv med hjälp av Cyc Knowledge Base och dess tillägg till WordNet" . I: Proceedings of the Fifth International Workshop on Computational Semantics . Tilburg, 2003.
Fabrizio Morbini och Lenhart Schubert (2009). "Utvärdering av EPILOG: a Reasoner for Episodic Logic" . University of Rochester, Commonsense '09 Conference (beskriver Cycs bibliotek med ~1600 'Commonsense-tester')
Kathy Panton et al. (2002). "Kunskapsbildning och dialog med hjälp av KRAKEN Toolset" . I: Artonde nationella konferensen om artificiell intelligens . Edmonton, Kanada, 2002.
Deepak Ramachandran P. Reagan & K. Goolsbey (2005). "First-Orderized ResearchCyc: Expressivity and Efficiency in a Common-Sense Ontology" . I: Paper från AAAI Workshop on Contexts and Ontologies: Theory, Practice and Applications . Pittsburgh, Pennsylvania, juli 2005.
Stephen Reed och D. Lenat (2002). "Mapping ontologier in Cyc" . I: AAAI 2002 konferensverkstad om ontologier för den semantiska webben . Edmonton, Kanada, juli 2002.
Benjamin Rode et al. (2005). "Mot en modell för återställning av mönster i relationsdata" . I: Proceedings of the 2005 International Conference on Intelligence Analysis . McLean, Virginia, maj 2005.
Dave Schneider et al. (2005). "Samla och hantera fakta för intelligensanalys" . I: Proceedings of the 2005 International Conference on Intelligence Analysis . McLean, Virginia, maj 2005.
Schneider, D., & Witbrock, MJ (2015, maj). "Semantisk konstruktionsgrammatik: överbrygga NL/Logic-klyftan" I Proceedings of the 24th International Conference on World Wide Web (sid. 673–678).
Blake Shepard et al. (2005). "Ett kunskapsbaserat tillvägagångssätt för nätverkssäkerhet: Applying Cyc in the Domain of Network Risk Assessment" . I: Proceedings of the Seventeenth Innovative Applications of Artificial Intelligence Conference . Pittsburgh, Pennsylvania, juli 2005.
Nick Siegel et al. (2004). "Agentarkitekturer: Kombinera styrkorna hos mjukvaruteknik och kognitiva system" . I: Papers from the AAAI Workshop on Intelligent Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems . Teknisk rapport WS-04-07, s. 74–79. Menlo Park, Kalifornien: AAAI Press, 2004.
Nick Siegel et al. (2005). Hypothesis Generation and Evidence Assembly for Intelligence Analysis: Cycorps Nooscape Application" . I Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, maj 2005.
Michael Witbrock et al. (2002). "Ett interaktivt dialogsystem för kunskapsinhämtning på cykel" . I: Proceedings of the artonde internationella gemensamma konferensen om artificiell intelligens . Acapulco, Mexiko, 2003.
Michael Witbrock et al. (2004). "Automatisk OWL-anteckning med hjälp av en stor kunskapsbas" . I: Workshop Notes of the 2004 Workshop on Knowledge Markup and Semantic Annotation vid 3rd International Semantic Web Conference ISWC2004 . Hiroshima, Japan, november 2004, s. 71–80.
Michael Witbrock et al. (2005). "Kunskap föder kunskap: Steg mot assisterad kunskapsinhämtning på cykel" . I: Paper från 2005 AAAI Spring Symposium on Knowledge Collection from Volunteer Contributors (KCVC) . s. 99–105. Stanford, Kalifornien, mars 2005.
William Jarrold (2001). "Validering av intelligens i stora regelbaserade system med sunt förnuft" . "Modellbaserad validering av intelligens: Paper från 2001 AAAI Symposium" (AAAI teknisk rapport SS-01-04).
William Jarrold. (2003). Att använda en ontologi för att utvärdera en stor regelbaserad ontologi: teori och praktik . {\em Performance Metrics for Intelligent Systems PerMIS '03} (NIST Special Publication 1014).

externa länkar

Cycorps hemsida