Osäker slutsats

Osäker slutledning beskrevs först av CJ van Rijsbergen som ett sätt att formellt definiera en fråga och dokumentrelation i informationshämtning . Denna formalisering är en logisk implikation med ett bifogat mått av osäkerhet.

Definitioner

Rijsbergen föreslår att måttet på osäkerhet för ett dokument d till en fråga q är sannolikheten för dess logiska implikation, dvs.

P(d\to q)

En användares fråga kan tolkas som en uppsättning påståenden om det önskade dokumentet. Det är systemets uppgift att sluta sig till om frågepåståendena är sanna. Om de är det, hämtas dokumentet. I många fall räcker inte innehållet i dokument för att hävda frågorna. En kunskapsbas av fakta och regler behövs, men vissa av dem kan vara osäkra eftersom det kan finnas en sannolikhet förknippad med att använda dem för slutledning. Därför kan vi också hänvisa till detta som plausibel slutledning . Sannolikheten för en slutledning $to q}$ \ är en funktion av rimligheten för varje frågepåstående. Istället för att hämta ett dokument som exakt matchar frågan bör vi rangordna dokumenten baserat på deras rimlighet med avseende på den frågan. Eftersom d och q båda genereras av användare är de felbenägna; därför $d\to q$ osäker. Detta kommer att påverka rimligheten för en given fråga.

Genom att göra detta uppnås två saker:

Separera processerna för att revidera sannolikheter från logiken
Separera behandlingen av relevans från behandlingen av förfrågningar

Multimediadokument , som bilder eller videor, har olika slutledningsegenskaper för varje datatyp. De skiljer sig också från textdokumentegenskaper. Ramverket för plausibel slutledning gör att vi kan mäta och kombinera sannolikheterna som kommer från dessa olika egenskaper.

Osäker slutledning generaliserar begreppen autoepistemisk logik , där sanningsvärden antingen är kända eller okända, och när de är kända är de sanna eller falska.

Exempel

Om vi har en fråga om formuläret:

q=A\wedge B\wedge C

där A, B och C är frågepåståenden, då vill vi för ett dokument D ha sannolikheten:

P(D\to (A\wedge B\wedge C))

Om vi omvandlar detta till den villkorliga sannolikheten $P((A\wedge B\wedge C)|D)$ och om frågepåståendena är oberoende kan vi beräkna den totala sannolikheten för implikationen som produkten av de individuella påståendens sannolikheter.

Ytterligare arbete

Croft och Krovetz tillämpade osäker slutledning på ett informationshämtningssystem för kontorsdokument som de kallade OFFICER . I kontorsdokument är antagandet om oberoende giltigt eftersom frågan kommer att fokusera på deras individuella attribut. Förutom att analysera innehållet i dokument kan man också fråga om till exempel författare, storlek, ämne eller samling. De utarbetade metoder för att jämföra dokument- och frågeattribut, sluta sig till deras rimlighet och kombinera det till ett övergripande betyg för varje dokument. Utöver det måste också osäkerheten i dokument- och frågeinnehållet åtgärdas.

Probabilistiska logiska nätverk är ett system för att utföra osäker slutledning; skarpa sanna/falska sanningsvärden ersätts inte bara av en sannolikhet utan också av en konfidensnivå, vilket indikerar sannolikhetens säkerhet.

Markov logiska nätverk tillåter osäkra slutsatser att utföras; osäkerheter beräknas med hjälp av principen om maximal entropi , i analogi med det sätt som Markov-kedjor beskriver osäkerheten hos finita tillståndsmaskiner .

Se även