Minimala mappningar
Minimala mappningar är resultatet av en avancerad teknik för semantisk matchning , en teknik som används inom datavetenskap för att identifiera information som är semantiskt relaterad.
Semantisk matchning har föreslagits som en giltig lösning på det semantiska heterogenitetsproblemet, nämligen att stödja mångfald i kunskap. Givet två grafliknande strukturer, t.ex. klassificeringar, databaser eller XML-scheman och ontologier , är matchning en operator som identifierar de noder i de två strukturerna som semantiskt motsvarar varandra. Till exempel, tillämpad på filsystem, kan den identifiera att en mapp märkt "bil" är semantiskt likvärdig med en annan mapp "bil" eftersom de är synonymer på engelska.
Den föreslagna tekniken fungerar på lättviktsontologier, nämligen trädstrukturer där varje nod är märkt med en naturlig språksats, till exempel på engelska. Dessa meningar översätts till en formell logisk formel (enligt ett entydigt, konstgjort språk ). Formeln kodar nodens betydelse och tar hänsyn till dess position i grafen. Till exempel, om mappen "bil" ligger under en annan mapp "röd" kan vi säga att betydelsen av mappen "bil" är "röd bil" i detta fall. Detta översätts till den logiska formeln "röd OCH bil".
Resultatet av matchning är en mappning, nämligen en uppsättning semantiska överensstämmelser mellan de två graferna. Varje mappningselement är fäst med en semantisk relation , till exempel ekvivalens . Bland alla möjliga mappningar är den minimala mappningen sådan att alla andra mappningselement kan beräknas från den minimala uppsättningen i en tidsperiod som är proportionell mot storleken på ingångsgraferna (linjär tid) och inget av elementen i den minimala uppsättningen kan sjunkit utan att förhindra en sådan beräkning.
Den största fördelen med minimala mappningar är att de minimerar antalet noder för efterföljande bearbetning. Lägg märke till att detta är en ganska viktig egenskap eftersom antalet möjliga mappningar kan nå n × m med n och m storleken på de två indataontologierna. Särskilt minimala mappningar blir avgörande med stora ontologier, t.ex. DMOZ , där även relativt små (icke-minimala) delmängder av antalet möjliga mappningselement, potentiellt miljoner av dem, är ohanterliga.
Minimala mappningar ger användbarhetsfördelar. Många system och motsvarande gränssnitt, mestadels grafiska, har tillhandahållits för hantering av mappningar, men alla skalas dåligt med antalet noder. Visualiseringar av stora grafer är ganska röriga. Underhåll av mindre mappningar är mycket enklare, snabbare och mindre felbenägen.