RetrievalWare
Utvecklare | Snabbsökning och överföring , Convera , Excalibur Technologies, ConQuest Software, Microsoft |
---|---|
Stabil frisättning | 8.2 / 13 oktober 2006
|
Skrivet i | C , C++ , Java |
Operativ system | Cross-plattform |
Typ | Sök och indexera |
RetrievalWare är en sökmotor för företag som betonar bearbetning av naturligt språk och semantiska nätverk som var kommersiellt tillgänglig från 1992 till 2007 och är särskilt känd för sin användning av statliga underrättelseorgan.
Historia
RetrievalWare skapades ursprungligen av Paul Nelson, Kenneth Clark och Edwin Addison som en del av ConQuest Software. Utvecklingen började 1989, men programvaran var inte kommersiellt tillgänglig i stor skala förrän 1992. Tidig finansiering gavs av Rome Laboratory via ett anslag för småföretagsinnovation .
Den 6 juli 1995 slogs ConQuest Software samman med NASDAQ-företaget Excalibur Technologies och produkten ändrades till RetrievalWare. Den 21 december 2000 kombinerades Excalibur Technologies med Intel Corporations division Interactive Media Services för att bilda Convera Corporation . Slutligen, den 9 april 2007, köptes RetrievalWare-programvaran och verksamheten av Fast Search & Transfer, då produkten officiellt togs bort. Microsoft Corporation fortsätter att underhålla produkten för sin befintliga kundbas.
Årliga intäkter för RetrievalWare nådde en topp under 2001 på cirka 40 miljoner US-dollar.
Användning av naturliga språktekniker
RetrievalWare är ett textsökningssystem för relevansrankning med bearbetningsförbättringar hämtade från områdena naturlig språkbehandling (NLP) och semantiska nätverk . NLP-algoritmer inkluderar ordboksbaserad stemming (även känd som lemmatisering ) och ordboksbaserad frasidentifiering. Semantiska nätverk används av RetrievalWare för att utöka de frågeord som användaren anger till relaterade termer med termvikter som bestäms av avståndet från användarens ursprungliga termer. Förutom automatisk expansion fanns ett återkopplingsläge där användare kunde välja innebörden av ordet innan de utför expansionen. De första semantiska nätverken byggdes med WordNet .
Dessutom implementerade RetrievalWare en form av n-gram -sökning (märkt som APRP - Adaptive Pattern Recognition Processing), utformad för att söka över dokument med OCR -fel. Frågetermer är uppdelade i uppsättningar om 2 gram som används för att hitta liknande matchande termer från det inverterade indexet . De resulterande matchningarna viktas baserat på liknande mått och används sedan för att söka efter dokument.
Alla dessa funktioner var tillgängliga senast 1993 och ConQuest mjukvara har hävdat att det var det första kommersiella textsökningssystemet som implementerade dessa tekniker.
Andra anmärkningsvärda funktioner
Andra anmärkningsvärda funktioner i RetrievalWare inkluderar distribuerade sökservrar, synkroniserare för indexering av externa innehållshanteringssystem och relationsdatabaser , en heterogen säkerhetsmodell, dokumentkategorisering , matchning av dokumentfrågor i realtid (profilering), flerspråkiga sökningar (frågor som innehåller termer från flera språk som söker efter dokument som innehåller termer från flera språk), och tvärspråkiga sökningar (frågor på ett språk som söker efter dokument på ett annat språk).
Deltagande i TREC
RetrievalWare deltog i Text Retrieval Conference 1992 (TREC-1), 1993 (TREC-2) och 1995 (TREC-4).
I TREC-1 och TREC-4, RetrievalWare-körningar för manuellt inmatade frågor gav de bästa resultaten baserat på 11-punkters medelvärden för alla sökmotorer som deltog i ad hoc-kategorin där sökmotorer tillåts en enda möjlighet att bearbeta tidigare okända frågor mot en befintlig databas.