Kunskapsdiagram
I kunskapsrepresentation och resonemang är kunskapsgraf en kunskapsbas som använder en grafstrukturerad datamodell eller topologi för att integrera data . Kunskapsgrafer används ofta för att lagra sammanlänkade beskrivningar av entiteter – objekt, händelser, situationer eller abstrakta begrepp – samtidigt som de kodar den semantik som ligger till grund för den använda terminologin.
Sedan utvecklingen av den semantiska webben förknippas kunskapsgrafer ofta med länkade öppna dataprojekt, med fokus på sambanden mellan begrepp och enheter. De är också tydligt associerade med och används av sökmotorer som Google , Bing , Yext och Yahoo ; kunskapsmotorer och tjänster för svar på frågor som WolframAlpha , Apples Siri och Amazon Alexa ; och sociala nätverk som LinkedIn och Facebook .
Historia
Begreppet myntades redan 1972 av den österrikiske lingvisten Edgar W. Schneider , i en diskussion om hur man bygger modulära instruktionssystem för kurser. I slutet av 1980-talet University of Groningen och University of Twente tillsammans ett projekt kallat Knowledge Graphs, med fokus på design av semantiska nätverk med kanter begränsade till en begränsad uppsättning relationer, för att underlätta algebror på grafen. Under efterföljande decennier suddades skillnaden mellan semantiska nätverk och kunskapsgrafer ut.
Vissa tidiga kunskapsdiagram var ämnesspecifika. 1985 grundades Wordnet , som fångar semantiska relationer mellan ord och betydelser – en tillämpning av denna idé på själva språket. 2005 grundade Marc Wirk Geonames för att fånga relationer mellan olika geografiska namn och lokaler och associerade enheter. 1998 skapade Andrew Edmonds från Science in Finance Ltd i Storbritannien ett system kallat ThinkBase som erbjöd luddig logikbaserad resonemang i ett grafiskt sammanhang.
2007 grundades både DBpedia och Freebase som grafbaserade kunskapsförråd för allmän kunskap. DBpedia fokuserade uteslutande på data extraherad från Wikipedia, medan Freebase också inkluderade en rad offentliga datauppsättningar. Ingen av dem beskrev sig själva som en "kunskapsgraf" utan utvecklade och beskrev relaterade koncept.
2012 introducerade Google sin Knowledge Graph , som bygger på bland annat DBpedia och Freebase. De inkorporerade senare RDFa , Microdata , JSON-LD- innehåll extraherat från indexerade webbsidor, inklusive CIA World Factbook , Wikidata och Wikipedia . Entitets- och relationstyper associerade med denna kunskapsgraf har organiserats ytterligare med hjälp av termer från schema.org- ordförrådet. Google Knowledge Graph blev ett framgångsrikt komplement till strängbaserad sökning inom Google, och dess popularitet online gjorde att termen blev vanligare.
Sedan dess har flera stora multinationella företag annonserat om sina kunskapsgrafer, vilket ytterligare populariserat termen. Dessa inkluderar Facebook, LinkedIn, Airbnb , Microsoft , Amazon , Uber och eBay .
Under 2019 kombinerade IEEE sina årliga internationella konferenser om "Big Knowledge" och "Data Mining and Intelligent Computing" till den internationella konferensen om kunskapsdiagram.
Definitioner
Det finns ingen gemensam allmänt accepterad definition av en kunskapsgraf. De flesta definitioner ser ämnet genom en semantisk webblins och inkluderar dessa funktioner:
- Flexibla relationer mellan kunskap i aktuella domäner : En kunskapsgraf (i) definierar abstrakta klasser och relationer av entiteter i ett schema, (ii) beskriver huvudsakligen verkliga entiteter och deras inbördes relationer, organiserade i en graf, (iii) möjliggör potentiellt sammanhängande godtyckliga enheter med varandra, och (iv) täcker olika aktuella domäner.
- Allmän struktur : Ett nätverk av enheter, deras semantiska typer, egenskaper och relationer.
- Stöd för resonemang över antagna ontologier : En kunskapsgraf samlar in och integrerar information i en ontologi och använder en resonemang för att härleda ny kunskap.
Det finns dock många kunskapsdiagramrepresentationer för vilka vissa av dessa egenskaper inte är relevanta. För dessa kunskapsdiagram kan denna enklare definition vara mer användbar:
- En digital struktur som representerar kunskap som begrepp och relationerna mellan dem (fakta). En kunskapsgraf kan innehålla en ontologi som gör att både människor och maskiner kan förstå och resonera kring dess innehåll.
Genomföranden
Utöver ovanstående exempel har termen använts för att beskriva öppna kunskapsprojekt som YAGO och Wikidata; federationer som det länkade öppna datamolnet; en rad kommersiella sökverktyg, inklusive Yahoos semantiska sökassistent Spark, Googles Knowledge Graph och Microsofts Satori; och LinkedIns och Facebooks enhetsdiagram.
Termen används också i samband med programvaruapplikationer för anteckningar som låter en användare bygga en personlig kunskapsgraf .
Använda en kunskapsgraf för att resonera över data
En kunskapsgraf representerar formellt semantik genom att beskriva enheter och deras relationer. Kunskapsdiagram kan använda ontologier som ett schemalager. Genom att göra detta tillåter de logisk slutledning för att hämta implicit kunskap snarare än att bara tillåta frågor som begär explicit kunskap.
För att tillåta användningen av kunskapsgrafer i olika maskininlärningsuppgifter har flera metoder för att härleda latenta egenskapsrepresentationer av entiteter och relationer utarbetats. Dessa kunskapsgrafinbäddningar gör att de kan kopplas till maskininlärningsmetoder som kräver funktionsvektorer som ordinbäddningar . Detta kan komplettera andra uppskattningar av begreppsmässig likhet.
Se även
externa länkar
-
Will Douglas Heaven (4 september 2020). "Denna know-it-all AI lär sig genom att läsa hela webben nonstop" . MIT Technology Review . Hämtad 5 september 2020 .
Diffbot bygger den största kunskapsgrafen någonsin genom att tillämpa bildigenkänning och naturligt språkbehandling på miljarder webbsidor.