Probabilistisk relevansmodell
Den probabilistiska relevansmodellen utarbetades av Stephen E. Robertson och Karen Spärck Jones som ett ramverk för framtida probabilistiska modeller . Det är en formalism för informationsinhämtning användbar för att härleda rankningsfunktioner som används av sökmotorer och webbsökmotorer för att rangordna matchande dokument efter deras relevans för en given sökfråga.
Det är en teoretisk modell som uppskattar sannolikheten att ett dokument d j är relevant för en fråga q . Modellen antar att denna sannolikhet för relevans beror på frågan och dokumentrepresentationerna. Dessutom förutsätter det att det finns en del av alla dokument som är att föredra av användaren som svarsuppsättning för fråga q . En sådan idealisk svarsuppsättning kallas R och bör maximera den totala sannolikheten för relevans för den användaren. Förutsägelsen är att dokument i denna uppsättning R är relevanta för frågan, medan dokument som inte finns i uppsättningen är icke-relevanta.
Relaterade modeller
Det finns några begränsningar för detta ramverk som måste åtgärdas genom vidareutveckling:
- Det finns ingen exakt uppskattning för den första körningens sannolikheter
- Indextermer viktas inte
- Villkoren antas vara oberoende av varandra
För att ta itu med dessa och andra problem har andra modeller utvecklats från ramverket för probabilistisk relevans, bland dem den binära oberoende modellen från samma författare. Det mest kända derivatet av detta ramverk är Okapi (BM25) viktningsschemat, tillsammans med BM25F, en modifiering därav.