Sök på skrivbordet
Desktop sökverktyg söker i en användares egna datorfiler i motsats till att söka på Internet. Dessa verktyg är utformade för att hitta information på användarens dator, inklusive webbläsarhistorik, e-postarkiv, textdokument, ljudfiler, bilder och video. En mängd olika skrivbordssökprogram finns nu tillgängliga; se den här listan för exempel. De flesta skrivbordssökprogram är fristående applikationer. Desktopsökprodukter är programvarualternativ till sökmjukvaran som ingår i operativsystemet , som hjälper användare att sålla bland skrivbordsfiler, e-postmeddelanden, bilagor och mer.
Desktopsökning uppstod som ett problem för stora företag av två huvudsakliga skäl: outnyttjad produktivitet och säkerhet. Enligt analytikerföretaget Gartner är upp till 80 % av vissa företags data låst inuti ostrukturerad data — informationen som lagras på en användares dator, katalogerna (mappar) och filer de har skapat i ett nätverk , dokument lagrade i arkiv som t.ex. som företagsintranät och en mängd andra platser. Dessutom har många företag strukturerad eller ostrukturerad information lagrad i äldre filformat som de inte har tillgång till.
Sektorn väckte stor uppmärksamhet i slutet av 2004 till början av 2005 från kampen mellan Microsoft och Google. Enligt marknadsanalytiker försökte båda företagen att utnyttja sina monopol (av webbläsare respektive sökmotorer ) för att stärka sin dominans. På grund av Googles klagomål om att användare av Windows Vista inte kan välja någon konkurrents datorsökprogram framför det inbyggda, nåddes en överenskommelse mellan det amerikanska justitiedepartementet och Microsoft om att Windows Vista Service Pack 1 skulle göra det möjligt för användare att välja mellan de inbyggda- i och andra skrivbordssökprogram och välj vilket som ska vara standard. Från och med september 2011 tog Google slut för Google Desktop .
Teknologier
De flesta sökmotorer för stationära datorer bygger och underhåller en indexdatabas för att förbättra prestanda vid sökning av stora mängder data . Indexering sker vanligtvis när datorn är inaktiv och de flesta sökapplikationer kan ställas in på att stoppa indexeringen om en bärbar dator körs på batterier, för att spara ström. Det finns dock anmärkningsvärda undantag: Voidtools Everything Search Engine , som utför sökningar över endast filnamn, inte innehåll, kan bygga sitt index från början på bara några sekunder. Ett annat undantag är Vegnos Desktop Search Engine, som utför sökningar över filnamn och filers innehåll utan att bygga några index. Ett index kanske inte heller är uppdaterat när en fråga utförs. I det här fallet kommer de returnerade resultaten inte att vara korrekta (det vill säga en träff kan visas när den inte längre finns där, och en fil kanske inte visas, när det i själva verket är en träff). Vissa produkter har försökt avhjälpa denna nackdel genom att bygga in en realtidsindexeringsfunktion i programvaran. Det finns nackdelar med att inte indexera. Tiden för att slutföra en fråga kan nämligen vara betydande, och den utfärdade frågan kan också vara resurskrävande.
Desktopsökverktyg samlar vanligtvis in tre typer av information om filer:
- fil- och mappnamn
- metadata , såsom titlar, författare, kommentarer i filtyper som MP3 , PDF och JPEG
- filinnehåll, för de typer av dokument som stöds av verktyget
Långsiktiga mål för skrivbordssökning inkluderar möjligheten att söka innehållet i bildfiler, ljudfiler och video efter sammanhang.
Plattformar och deras historia
Windows
Indexeringstjänst en "en bastjänst som extraherar innehåll från filer och konstruerar en indexerad katalog för att underlätta effektiv och snabb sökning" släpptes ursprungligen i augusti 1996, den byggdes för att påskynda manuell sökning efter filer på personliga stationära datorer och företagsdatornätverk . Indexeringstjänst hjälpte till genom att använda Microsofts webbservrar för att indexera filer på önskade hårddiskar. Indexering gjordes efter filformat. Genom att använda termer som användarna angav gjordes en sökning som matchade termer med data i filformaten. Det största problemet som indexeringstjänsten stod inför var det faktum att varje gång en fil lades till måste den indexeras. Detta tillsammans med det faktum att indexeringen cachade hela indexet i RAM, gjorde hårdvaran till en enorm begränsning. Detta gjorde att indexering av stora mängder filer kräver extremt kraftfull hårdvara och mycket långa väntetider.
2003 ersatte Windows Desktop Search (WDS) Microsoft Indexing Service. Istället för att bara matcha termer med detaljerna i filformatet och filnamnen, tar WDS in innehållsindexering till alla Microsoft-filer och textbaserade format som e-post- och textfiler. Detta betyder att WDS tittade på filerna och indexerade innehållet. När en användare sökte efter en term matchade WDS alltså inte längre bara information som filformatstyper och filnamn, utan termer och värden lagrade i dessa filer. WDS kom också med "Omedelbar sökning" vilket betyder att användaren kunde skriva ett tecken och frågan skulle omedelbart börja söka och uppdatera frågan när användaren skrev in fler tecken. Windows Search använde uppenbarligen mycket processorkraft, eftersom Windows Desktop Search bara skulle köras om den var direkt tillfrågad eller när datorn var inaktiv. Även om den bara kördes när du frågade direkt eller när datorn var inaktiv, tog det fortfarande timmar att indexera hela hårddisken. Indexet skulle vara cirka 10 % av storleken på alla filer som det indexerade, t.ex. om de indexerade filerna uppgick till cirka 100 GB, skulle indexstorleken vara 10 GB.
Med lanseringen av Windows Vista kom Windows Search 3.1. Till skillnad från sina föregångare WDS och Windows Search 3.0 kunde 3.1 söka igenom både indexerade och icke-indexerade platser sömlöst. Dessutom RAM och CPU kraftigt, vilket minskade indexeringstiderna oerhört. Windows Search 4.0 körs för närvarande på alla datorer med Windows 7 och uppåt.
Mac OS
1994 introducerades sökmotorn AppleSearch , som gjorde det möjligt för användare att helt söka igenom alla dokument på sin Macintosh-dator, inklusive filformattyper, metadata på dessa filer och innehåll i filerna. AppleSearch var en klient/serverapplikation och krävde som sådan en server skild från huvudenheten för att fungera. Det största problemet med AppleSearch var dess stora resurskrav: "AppleSearch kräver minst en 68040-processor och 5 MB RAM." Vid den tiden kostade en Macintosh-dator med dessa specifikationer cirka $1400; motsvarande $2050 under 2015. Utöver detta kostade själva mjukvaran ytterligare $1400 för en enda licens.
1997 släpptes Sherlock tillsammans med Mac OS 8.5. Sherlock (uppkallad efter den berömda fiktiva detektiven Sherlock Holmes ) integrerades i Mac OS:s filläsare – Finder . Sherlock utökade skrivbordets sökfunktion till World Wide Web, vilket gjorde det möjligt för användare att söka både lokalt och externt. Att lägga till ytterligare funktioner – som internetåtkomst – till Sherlock var relativt enkelt, eftersom detta gjordes genom plugins skrivna som vanliga textfiler. Sherlock inkluderades i alla versioner av Mac OS från Mac OS 8 , innan de fasades ut och ersattes av Spotlight och Dashboard i Mac OS X 10.4 Tiger . Det togs officiellt bort i Mac OS X 10.5 Leopard
Spotlight släpptes 2005 som en del av Mac OS X 10.4 Tiger . Det är ett urvalsbaserat sökverktyg, vilket innebär att användaren anropar en fråga med endast musen. Spotlight låter användaren söka på Internet efter mer information om alla nyckelord eller fraser som finns i ett dokument eller webbsida, och använder en inbyggd miniräknare och Oxford American Dictionary för att ge snabb tillgång till små beräkningar och orddefinitioner. Medan Spotlight initialt har en lång starttid, minskar denna när hårddisken indexeras. När filer läggs till av användaren uppdateras indexet ständigt i bakgrunden med minimala CPU- och RAM-resurser.
Linux
Det finns ett brett utbud av skrivbordssökningsalternativ för Linux-användare, beroende på användarens kompetensnivå, deras preferens att använda skrivbordsverktyg som är tätt integrerade i deras skrivbordsmiljö, kommandoskalsfunktionalitet (ofta med avancerade skriptalternativ) eller webbläsare -baserade användargränssnitt mot lokalt körd programvara. Dessutom skapar många användare sin egen indexering från en mängd olika indexeringspaket (t.ex. ett som extraherar och indexerar PDF/DOC/DOCX/ODT-dokument bra , en annan sökmotor som fungerar med vcard, LDAP och annan katalog/kontakt databaser, såväl som de konventionella sök-
och lokaliseringskommandona
.
Ubuntu
Ubuntu Linux hade inte skrivbordssökning förrän Feisty Fawn 7.04 släpptes . Med hjälp av Tracker- skrivbordssökning var skrivbordssökningsfunktionen mycket lik Mac OS:s AppleSearch och Sherlock. Den innehöll inte bara de grundläggande funktionerna för sortering av filformat och matchning av metadata, utan stöd för sökning genom e-post och snabbmeddelanden lades till. 2014 Recoll till i Linux-distributioner och arbetar med andra sökprogram som Tracker och Beagle för att ge effektiv fulltextsökning. Detta ökade avsevärt de typer av frågor och filtyper som Linux-skrivbordssökningar kunde hantera. En stor fördel med Recoll är att det möjliggör större anpassning av vad som indexeras; Recoll kommer att indexera hela hårddisken som standard, men kan göras för att endast indexera utvalda kataloger, och utelämna kataloger som aldrig kommer att behöva sökas.
openSUSE
Från och med KDE4 introducerades NEPOMUK . Det gav möjligheten att indexera ett brett utbud av skrivbordsinnehåll, e-post och använda semantisk webbteknik (t.ex. RDF ) för att kommentera databasen. Introduktionen stötte på några problem, varav många verkade vara baserade på triplestore . Prestanda förbättrades (åtminstone för frågor) genom att byta backend till en avskalad version av Virtuoso Open Source Edition, men indexering förblev ett vanligt användarklagomål. Baserat på feedback från användare har Nepomuk-indexeringen och sökningen ersatts med Baloo-ramverket baserat på Xapian .