Semantisk interoperabilitet

Semantisk interoperabilitet är datorsystemens förmåga att utbyta data med entydig, delad mening. Semantisk interoperabilitet är ett krav för att möjliggöra maskinberäknar logik , slutledning, kunskapsupptäckt och datafederation mellan informationssystem .

Semantisk interoperabilitet handlar därför inte bara om paketeringen av data ( syntax ), utan den samtidiga överföringen av betydelsen med datan ( semantik ). Detta åstadkoms genom att lägga till data om data ( metadata ), länka varje dataelement till ett kontrollerat, delat ordförråd . Betydelsen av datan överförs med själva datan, i ett självbeskrivande " informationspaket " som är oberoende av något informationssystem. Det är denna delade vokabulär, och dess associerade länkar till en ontologi , som ger grunden och förmågan till maskinell tolkning, slutledning och logik.

Syntaktisk interoperabilitet (se nedan ) är en förutsättning för semantisk interoperabilitet. Syntaktisk interoperabilitet avser paketerings- och överföringsmekanismerna för data. Inom sjukvården har HL7 använts i över trettio år (vilket går före internet- och webbteknologin), och använder piptecken (|) som dataavgränsare. Den nuvarande internetstandarden för dokumentuppmärkning är XML , som använder "< >" som dataavgränsare. Dataavgränsarna förmedlar ingen mening till data annat än att strukturera data. Utan en dataordbok för att översätta innehållet i avgränsningarna förblir data meningslös. Även om det finns många försök att skapa dataordböcker och informationsmodeller för att associera med dessa datapaketeringsmekanismer, har ingen varit praktisk att implementera. Detta har bara vidmakthållit den pågående "babeliseringen" av data och oförmågan att utbyta data med mening.

Sedan introduktionen av konceptet Semantic Web av Tim Berners-Lee 1999, har det funnits ett växande intresse och tillämpning av W3C -standarderna (World Wide Web Consortium) för att tillhandahålla webbskala semantiskt datautbyte, federation och slutledningsmöjligheter.

Semantisk som en funktion av syntaktisk interoperabilitet

Syntaktisk interoperabilitet, tillhandahållen av till exempel XML eller SQL- standarderna, är en förutsättning för semantik. Det involverar ett gemensamt dataformat och gemensamt protokoll för att strukturera alla data så att sättet att bearbeta informationen kommer att kunna tolkas från strukturen. Det tillåter också upptäckt av syntaktiska fel, vilket gör det möjligt för mottagande system att begära omsändning av alla meddelanden som verkar vara förvanskade eller ofullständiga. Ingen semantisk kommunikation är möjlig om syntaxen är förvrängd eller inte kan representera data. Information som representeras i en syntax kan dock i vissa fall korrekt översättas till en annan syntax. Där korrekt översättning av syntaxer är möjlig kan system som använder olika syntaxer också samverka korrekt. I vissa fall kan förmågan att korrekt översätta information mellan system som använder olika syntaxer vara begränsad till en riktning, när de använda formalismer har olika nivåer av uttrycksfullhet (förmåga att uttrycka information).

En enda ontologi som innehåller representationer av varje term som används i varje tillämpning anses generellt vara omöjlig på grund av det snabba skapandet av nya termer eller tilldelningar av nya betydelser till gamla termer. Men även om det är omöjligt att förutse alla begrepp som en användare kan vilja representera i en dator, finns det möjlighet att hitta någon ändlig uppsättning "primitiva" begreppsrepresentationer som kan kombineras för att skapa något av de mer specifika begrepp som användare kan behövas för en given uppsättning applikationer eller ontologier. Att ha en grundontologi (även kallad övre ontologi ) som innehåller alla dessa primitiva element skulle ge en bra grund för allmän semantisk interoperabilitet och tillåta användare att definiera alla nya termer de behöver genom att använda den grundläggande inventeringen av ontologielement, och fortfarande ha de nya definierade termer korrekt tolkade av något annat datorsystem som kan tolka den grundläggande grundontologin. Huruvida antalet sådana primitiva begreppsrepresentationer i själva verket är ändligt, eller kommer att expandera på obestämd tid, är en fråga under aktiv utredning. Om den är ändlig, kan en stabil grundontologi som är lämplig för att stödja korrekt och allmän semantisk interoperabilitet utvecklas efter att en inledande grundontologi har testats och använts av en mängd olika användare. För närvarande har ingen grundontologi antagits av ett brett samhälle, så en sådan stabil grundontologi finns fortfarande i framtiden.

Ord och betydelser

Ett ihållande missförstånd som återkommer i diskussionen om semantik är "förvirringen av ord och betydelser". Ordens betydelser förändras, ibland snabbt. Men ett formellt språk som det används i en ontologi kan koda begreppens betydelser (semantik) i en form som inte förändras. För att avgöra vad som är betydelsen av ett visst ord (eller term i en databas , till exempel) är det nödvändigt att märka varje fast begreppsrepresentation i en ontologi med det eller de ord eller termer som kan referera till det begrepp. När flera ord refererar till samma (fasta) begrepp i språket kallas detta synonymi ; när ett ord används för att referera till mer än ett begrepp, kallas det tvetydighet .

Tvetydighet och synonymi är bland de faktorer som gör datorförståelse av språk mycket svårt. Användningen av ord för att hänvisa till begrepp (betydelsen av de ord som används) är mycket känslig för sammanhanget och syftet med all användning av många människor läsbara termer. Användningen av ontologier för att stödja semantisk interoperabilitet är att tillhandahålla en fast uppsättning begrepp vars betydelser och relationer är stabila och kan accepteras av användare. Uppgiften att bestämma vilka termer i vilka sammanhang (varje databas är en annan kontext) separeras sedan från uppgiften att skapa ontologin och måste tas upp av designern av en databas, eller designern av ett formulär för datainmatning , eller utvecklare av ett program för språkförståelse. När betydelsen av ett ord som används i något interoperabelt sammanhang ändras, är det för att bevara interoperabilitet nödvändigt att ändra pekaren till ontologielementet/elementen som specificerar betydelsen av ordet.

Krav på kunskapsrepresentation och språk

Ett kunskapsrepresentationsspråk kan vara tillräckligt uttrycksfullt för att beskriva betydelsenyanser inom välförstådda områden. Det finns minst fem komplexitetsnivåer av dessa [ specificera ] .

För generella semistrukturerade data kan man använda ett allmänt språk såsom XML.

Språk med full kraft av första ordningens predikatlogik kan krävas för många uppgifter.

Mänskliga språk är mycket uttrycksfulla, men anses vara för tvetydiga för att tillåta den korrekta tolkning som önskas, med tanke på den nuvarande nivån på mänsklig språkteknologi. Semantiska interoperabilitet sjukvårdssystem utnyttjar data på ett standardiserat sätt när de bryter ner och delar information. Till exempel kan två system nu känna igen terminologi, medicinsymboler, semantisk interoperabilitet sjukvårdssystem utnyttjar data på ett standardiserat sätt när de bryter ner och delar information. Till exempel kan två system nu känna igen terminologi, medicinsymboler och andra nyanser samtidigt som de utbyter data automatiskt, utan mänsklig inblandning.09-apr-2021 och andra nyanser samtidigt som data utbyts automatiskt, utan mänsklig inblandning.09-apr-2021

Förhandsöverenskommelse krävs inte

Semantisk interoperabilitet kan särskiljas från andra former av interoperabilitet genom att överväga om den överförda informationen i sin kommunicerade form har all den betydelse som krävs för att det mottagande systemet ska kunna tolka den korrekt, även när de algoritmer som används av det mottagande systemet är okända för den mottagande systemet . sändande system. Överväg att skicka ett nummer:

Om det numret är avsett att vara summan av pengar som ett företag är skyldigt till ett annat, innebär det någon åtgärd eller brist på åtgärd från både de som skickar det och de som tar emot det.

Det kan tolkas korrekt om det skickas som svar på en specifik begäran och tas emot vid den tidpunkt och i den form som förväntas. Denna korrekta tolkning beror inte bara på siffran i sig, som kan representera nästan vilken som helst av miljontals typer av kvantitativa mätningar, snarare beror den strikt på omständigheterna för överföringen. Det vill säga, tolkningen beror på att båda systemen förväntar sig att algoritmerna i det andra systemet använder numret i exakt samma mening, och det beror vidare på hela enveloppen av sändningar som föregick den faktiska överföringen av det blotta numret.

Om det sändande systemet däremot inte vet hur informationen kommer att användas av andra system, är det nödvändigt att ha en gemensam överenskommelse om hur information med någon specifik betydelse (av många möjliga betydelser) kommer att visas i en kommunikation. För en viss uppgift är en lösning att standardisera en blankett, till exempel en begäran om betalning; denna begäran skulle behöva koda, på ett standardiserat sätt, all information som behövs för att utvärdera den, såsom: agenten som är skyldig pengarna, agenten var skyldig pengarna, arten av den åtgärd som ger upphov till skulden, agenterna, varor , tjänster och andra deltagare i den åtgärden; tidpunkten för åtgärden; skuldbeloppet och valutan i vilken skulden räknas; tid för betalning; den begärda betalningsformen; och annan information. När två eller flera system har kommit överens om hur informationen i en sådan begäran ska tolkas, kan de uppnå semantisk interoperabilitet för den specifika typen av transaktion . För semantisk interoperabilitet i allmänhet är det nödvändigt att tillhandahålla standardiserade sätt att beskriva innebörden av många fler saker än bara kommersiella transaktioner, och antalet begrepp vars representation måste överenskommas är minst flera tusen.

Ontologisk forskning

Hur man uppnår semantisk interoperabilitet för mer än ett fåtal begränsade scenarier är för närvarande en fråga om forskning och diskussion. För problemet med allmän semantisk interoperabilitet krävs någon form av grundontologi (' övre ontologi ') som är tillräckligt omfattande för att ge definitionen av begrepp för mer specialiserade ontologier inom flera domäner. Under det senaste decenniet har mer än tio grundontologier utvecklats, men ingen har ännu antagits av en bred användarbas.

Behovet av en enda omfattande allomfattande ontologi för att stödja semantisk interoperabilitet kan undvikas genom att utforma den gemensamma grundontologin som en uppsättning grundläggande ("primitiva") begrepp som kan kombineras för att skapa logiska beskrivningar av betydelsen av termer som används i lokala domänontologier eller lokala databaser. Denna taktik bygger på principen att:

Om:

(1) man enas om innebörden och användningen av de primitiva ontologielementen i grundontologin, och (2) ontologielementen i domänontologierna är konstruerade som logiska kombinationer av elementen i grundontologin,

Sedan:

De avsedda betydelserna av domänontologielementen kan beräknas automatiskt med hjälp av en FOL (första ordningens logik) resonemang, av vilket system som helst som accepterar betydelsen av elementen i grundontologin och har både grundontologin och de logiska specifikationerna för element i domänontologin.

Därför:

Alla system som vill samverka korrekt med ett annat system behöver bara överföra de data som ska kommuniceras, plus eventuella logiska beskrivningar av termer som används i den datan som skapats lokalt och som inte redan finns i den gemensamma grundontologin.

Denna taktik begränsar sedan behovet av föregående överenskommelse om betydelser till endast de ontologielementen i den gemensamma grundontologin ( FO). Baserat på flera överväganden kan detta kräva färre än 10 000 element (typer och relationer). Men för att underlätta förståelsen och användningen kan fler ontologielement med ytterligare detaljer och detaljer hjälpa till att hitta den exakta platsen i FO där specifika domänkoncept kan hittas eller läggas till.

I praktiken, tillsammans med FO fokuserad på representationer av de primitiva begreppen, kommer sannolikt också en uppsättning domänförlängningsontologier till FO med element specificerade med FO-elementen att användas. Sådana redan existerande tillägg kommer att underlätta kostnaderna för att skapa domänontologier genom att förse befintliga element med den avsedda innebörden, och kommer att minska risken för fel genom att använda element som redan har testats. Domäntilläggsontologier kan vara logiskt inkonsekventa med varandra, och det måste bestämmas om olika domäntillägg används i någon kommunikation.

Huruvida användningen av en sådan enskild grundontologi i sig kan undvikas genom sofistikerade kartläggningstekniker bland oberoende utvecklade ontologier är också under utredning.

Betydelse

Den praktiska betydelsen av semantisk interoperabilitet har mätts av flera studier som uppskattar kostnaden (i förlorad effektivitet) på grund av bristande semantisk interoperabilitet. En studie, som fokuserar på den förlorade effektiviteten i kommunikationen av hälso- och sjukvårdsinformation, uppskattade att 77,8 miljarder USD per år skulle kunna sparas genom att implementera en effektiv interoperabilitetsstandard på det området. Andra studier, av byggindustrin och av biltillverkningsförsörjningskedjan, uppskattar kostnader på över 10 miljarder USD per år på grund av bristande semantisk interoperabilitet i dessa industrier. Totalt kan dessa siffror extrapoleras för att indikera att långt över 100 miljarder USD per år går förlorade på grund av bristen på en allmänt använd standard för semantisk interoperabilitet enbart i USA.

Det har ännu inte gjorts en studie om varje politikområde som kan erbjuda stora kostnadsbesparingar med tillämpning av semantiska interoperabilitetsstandarder. Men för att se vilka policyområden som kan dra nytta av semantisk interoperabilitet, se " Interoperabilitet" i allmänhet. Sådana politikområden är e-förvaltning , hälsa, säkerhet och många fler. EU inrättade också Semantic Interoperability Centre Europe i juni 2007.

Semantisk interoperabilitet för Internet of Things

Digital transformation har enorma fördelar för att göra det möjligt för organisationer att vara effektivare, mer flexibla och smidigare när det gäller att reagera på förändringar i affärs- och driftsförhållanden. Detta innebär behovet av att integrera heterogena data och tjänster i organisationer. Semantisk interoperabilitet adresserar behovet av delad förståelse av innebörden och sammanhanget.

För att stödja detta samarbetar en tvärorganisationsexpertgrupp som involverar ISO/IEC JTC1, ETSI, oneM2M och W3C med AIOTI för att påskynda införandet av semantisk teknologi inom IoT. Gruppen har helt nyligen publicerat två gemensamma vitböcker om semantisk interoperabilitet med namnet "Semantic IoT Solutions - A Developer Perspective" respektive "Mot semantiska interoperabilitetsstandarder baserade på ontologier". Detta följer på framgången med den tidigare vitboken om "Semantisk interoperabilitet för sakernas webben."


Källa:

"Semantiska IoT-lösningar – ett utvecklarperspektiv"

"Mot semantiska interoperabilitetsstandarder baserade på ontologier".

Detta följer på framgången med den tidigare vitboken om "Semantisk interoperabilitet för sakernas webben."

https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability- inriktning-utvecklare-och-standardiseringsingenjörer/

Se även

externa länkar