YaCy
Originalförfattare | Michael Christen |
---|---|
Utvecklare | YaCy-gemenskap |
Initial release | 2003 |
Stabil frisättning | 1.924 / 14 december 2020
|
Förvar | |
Skrivet i | Java |
Operativ system | Cross-plattform |
Typ | Överläggsnätverk , sökmotor |
Licens | GPL-2.0 eller senare |
Hemsida |
YaCy (uttalas "ya see") är en gratis distribuerad sökmotor , byggd på principerna för peer-to-peer- nätverk (P2P) skapade av Michael Christen 2003. Motorn är skriven i Java och distribuerad på flera hundra datorer, som september 2006, så kallade YaCy-peers. Varje YaCy-peer genomsöker självständigt Internet, analyserar och indexerar hittade webbsidor och lagrar indexeringsresultat i en gemensam databas (så kallat index) som delas med andra YaCy-peers med hjälp av principerna för peer-to- peer . Det är en sökmotor som alla kan använda för att bygga en sökportal för sitt intranät och hjälpa till att söka på det offentliga internet tydligt.
Jämfört med semi-distribuerade sökmotorer har YaCy-nätverket en distribuerad arkitektur. Alla YaCy-peers är lika och ingen central server existerar. Den kan köras antingen i genomsökningsläge eller som en lokal proxyserver , och indexerar webbsidor som besöks av personen som kör YaCy på sin dator. Flera mekanismer tillhandahålls för att skydda användarens integritet. Tillgång till sökfunktionerna görs av en lokalt körd webbserver som tillhandahåller en sökruta för att ange söktermer och returnerar sökresultat i ett liknande format som andra populära sökmotorer.
Systemkomponenter
YaCy sökmotor är baserad på fyra element:
- Crawler
- En sökrobot som går mellan webbsidor och analyserar deras innehåll.
- Indexerare
- Den skapar ett omvänt ordindex (RWI), dvs varje ord från RWI har sin egen lista med relevanta webbadresser och rankningsinformation. Ord sparas i form av ordhaschar.
- Sök- och administrationsgränssnitt
- Tillverkat som ett webbgränssnitt som tillhandahålls av en lokal HTTP- servlet med servletmotor.
- Datalagring
- Används för att lagra den omvända ordindexdatabasen med hjälp av en distribuerad hashtabell .
Sökmotorteknik
- YaCy är ett komplett sökverktyg med användargränssnitt, index, administration och övervakning.
- YaCy skördar webbsidor med en sökrobot. Dokument analyseras sedan, indexeras och sökindexet lagras lokalt. Om din peer är en del av ett peer-nätverk, slås även ditt lokala sökindex samman med det delade indexet för det nätverket.
- En sökning startas, sedan bidrar det lokala indexet tillsammans med ett globalt sökindex från peers i YaCy-söknätverket.
- YaCy Grid är en andra generationens implementering av YaCy peer-to-peer-sökning. En YaCy Grid-installation består av mikrotjänster som kommunicerar med hjälp av Master Connect Program (MCP).
- YaCy Parser är en mikrotjänst som kan distribueras med Docker . När Parser-komponenten startas söker den efter en MCP och ansluter till den. Som standard söks den lokala värden efter en MCP, men du kan konfigurera en själv.
YaCy-plattformsarkitektur
YaCy använder en kombination av tekniker för nätverk, administration och underhåll av indexering av sökmotorn, inklusive svartlistning, moderering och kommunikation med communityn. Så här utför YaCy dessa operationer:
- Gemenskapens komponenter
- Webbforum
- Statistik
- XML API
- Underhåll
- Webbserver
- Indexering
- Crawler med Balancer
- Peer-to-Peer-serverkommunikation
- Innehållsorganisation
- Svartlistning och filtrering
- Sökgränssnitt
- Bokmärken
- Övervakning av sökresultat
Distribution
YaCy finns i paket för Linux, Windows, Macintosh och även som en Docker-avbildning. YaCy kan också installeras på vilket annat operativsystem som helst genom att manuellt kompilera det eller använda en tarball . YaCy kräver Java 8, OpenJDK 8 rekommenderas.
Debianpaketet kan installeras från ett arkiv tillgängligt på underdomänen på projektets webbplats . Paketet underhålls inte i Debians officiella paketförråd ännu.
Se även
- Dooble – en webbläsare med öppen källkod med en integrerad YaCy Search Engine Tool Widget
Vidare läsning
externa länkar
- Anonymitetsnätverk
- Programvara för flera plattformar
- Distribuerad datalagring
- Gratis programvara för sökmotorer
- Gratis sökrobotar
- Internetfastigheter etablerade 2003
- Internet sökmotorer
- Java (programmeringsspråk) programvara
- Java-plattformsprogramvara
- Peer-to-peer-programvara
- Programvara som använder GPL-licensen