DMOZ
Typ av webbplats |
Webbkatalog |
---|---|
Tillgänglig i | 90 språk, inklusive engelska |
Upplöst | 17 mars 2017 |
Förälder | AOL |
URL | www.dmoz.org ( Arkiverad 2018-01-19 på Wayback Machine ) |
Kommersiell | Nej |
Registrering | Frivillig |
Användare | 90 000 |
Lanserades | 5 juni 1998 |
Nuvarande status | Stängd |
Innehållslicens |
Creative Commons Attribution 3.0 Unported , Open Directory License |
DMOZ (från directory.mozilla.org , ett tidigare domännamn , stiliserat med gemener i sin logotyp) var en flerspråkig katalog med öppet innehåll med World Wide Web- länkar. Webbplatsen och communityn som upprätthöll den var också känd som Open Directory Project ( ODP ) . Det ägdes av AOL (nu en del av Verizon Media ) men konstruerades och underhålls av en grupp frivilliga redaktörer.
DMOZ använde ett hierarkiskt ontologischema för att organisera webbplatslistor. Listor om ett liknande ämne grupperades i kategorier som sedan inkluderade mindre kategorier.
DMOZ stängde den 17 mars 2017 eftersom AOL inte längre ville stödja projektet. Webbplatsen blev en enda målsida den dagen, med länkar till ett statiskt arkiv av DMOZ, och till DMOZs diskussionsforum, där planer på att ändra varumärket och återlansera katalogen diskuteras.
Från och med september 2017 fanns en icke-redigerbar spegel tillgänglig på dmoztools.net, och det tillkännagavs att även om DMOZ URL inte skulle återvända, skulle en efterföljande version av katalogen med namnet Curlie tillhandahållas.
Historia
DMOZ grundades i USA som Gnuhoo av Rich Skrenta och Bob Truel 1998 medan de båda arbetade som ingenjörer för Sun Microsystems . Chris Tolles, som arbetade på Sun Microsystems som marknadschef för nätverkssäkerhetsprodukter, skrev också på 1998 som medgrundare av Gnuhoo tillsammans med medgrundarna Bryn Dole och Jeremy Wenokur. Skrenta hade utvecklat TASS, en förfader till tin , den populära trådade Usenet- nyhetsläsaren för Unix -system. Den ursprungliga kategoristrukturen för Gnuhoo-katalogen baserades löst på strukturen för Usenet-nyhetsgrupper som då existerade.
Gnuhoo-katalogen gick live den 5 juni 1998. Efter att Richard Stallman och Free Software Foundation motsatte sig användningen av Gnu i namnet ändrades Gnuhoo till NewHoo . Yahoo! invände sedan mot användningen av Hoo i namnet, vilket ledde till en föreslagen namnändring till ZURL . Innan han bytte till ZURL förvärvades NewHoo av Netscape Communications Corporation i oktober 1998 och blev Open Directory Project. Netscape släppte Open Directory-data under Open Directory-licensen . Netscape förvärvades av AOL kort därefter och DMOZ var en av tillgångarna som ingick i förvärvet.
När Netscape tog över ansvaret hade Open Directory Project cirka 100 000 webbadresser indexerade med bidrag från cirka 4 500 redaktörer. Den 5 oktober 1999 nådde antalet webbadresser som indexerades av DMOZ en miljon. Enligt en inofficiell uppskattning uppgick webbadresserna i DMOZ till 1,6 miljoner i april 2000, vilket överträffade de i Yahoo! Katalog . DMOZ uppnådde milstolparna att indexera två miljoner webbadresser den 14 augusti 2000, tre miljoner listor den 18 november 2001 och fyra miljoner den 3 december 2003. I april 2013 fanns det 5 169 995 webbplatser listade i över 1 017 500 kategorier. Den 31 oktober 2015 fanns det 3 996 412 webbplatser listade i 1 026 706 kategorier.
I januari 2006 började DMOZ publicera onlinerapporter för att informera allmänheten om utvecklingen av projektet. Den första rapporten omfattade år 2005. Månadsrapporter publicerades därefter fram till september 2006. Dessa rapporter gav större insikt i katalogens funktion än den förenklade statistiken som finns på katalogens framsida. Antalet listor och kategorier som citerades på förstasidan inkluderade kategorierna "Test" och "Bokmärken", men dessa ingick inte i RDF-dumpen som erbjöds användarna. Det fanns cirka 7330 aktiva redaktörer under augusti 2006. 75 151 redaktörer hade bidragit till katalogen den 31 mars 2007. Per april 2013 hade antalet medverkande redaktörer ökat till 97 584.
Systemfel och redigeringsavbrott, oktober till december 2006
Den 20 oktober 2006 drabbades DMOZ:s huvudserver av ett katastrofalt fel som hindrade redaktörer från att arbeta med katalogen fram till den 18 december 2006. Under den perioden var en äldre version av katalogen synlig för allmänheten. Den 13 januari 2007 gjordes formulären för webbplatsförslag och uppdateringslistor tillgängliga igen. Den 26 januari 2007 återupptogs veckopubliceringen av RDF-dumpar. För att undvika framtida avbrott låg systemet på en redundant konfiguration av två Intel-baserade servrar från och med då.
Webbplatsens gränssnitt fick en uppgradering 2016, märkt "DMOZ 3.0", men AOL tog det offline året efter.
Tävlande och spinoff-projekt
När DMOZ blev mer känt dök två andra stora webbkataloger redigerade av volontärer och sponsrade av Go.com och Zeal fram, båda nu nedlagda. Dessa kataloger licensierade inte sitt innehåll för öppen innehållsdistribution .
Konceptet att använda en storskalig gemenskap av redaktörer för att sammanställa onlineinnehåll har framgångsrikt tillämpats på andra typer av projekt. DMOZ:s redigeringsmodell inspirerade direkt åtminstone tre andra frivilliga projekt för öppet innehåll: musiksajten MusicMoz, en restaurangkatalog med öppet innehåll som kallas ChefMoz och ett uppslagsverk som kallas Open Site . Slutligen, enligt Larry Sanger , var DMOZ en del av inspirationen för Nupedia -projektet, ur vilket Wikipedia växte.
Logotyp historik
Innehåll
Gnuhoo lånade grundkonturen för sin initiala ontologi från Usenet . 1998 sa Rich Skrenta: "Jag tog en lång lista med grupper och handredigerade dem till en hierarki." Till exempel representerades ämnet som täcks av nyhetsgruppen comp.ai.alife av kategorin Datorer/AI/Artificial_Life. De ursprungliga uppdelningarna var för vuxen , konst , affärer , datorer , spel , hälsa , hem , nyheter , rekreation , referens , regional , vetenskap , shopping , samhälle , sport och "världen". Medan dessa sexton på toppnivå har förblivit intakta, har ontologin för kategorier på andra och lägre nivå genomgått en gradvis utveckling; betydande förändringar initieras av diskussioner bland redaktörer och implementeras sedan när konsensus nåtts.
I juli 1998 blev katalogen flerspråkig med tillägget av världsklasskategorin . Resten av katalogen listar endast engelska webbplatser. I maj 2005 var sjuttiofem språk representerade. Tillväxttakten för de icke-engelska komponenterna i katalogen hade varit större än den engelska komponenten sedan 2002. Medan den engelska komponenten i katalogen hade nästan 75 % av webbplatserna 2003, växte världsnivån till över 1,5 miljoner webbplatser från och med maj 2005, vilket utgör ungefär en tredjedel av katalogen. Ontologin i icke-engelska kategorier speglar i allmänhet den i den engelska katalogen, även om undantag som återspeglar språkskillnader är ganska vanliga.
Flera av toppkategorierna har unika egenskaper. Vuxenkategorin finns inte på katalogens hemsida men den är helt tillgänglig i RDF-dumpen som DMOZ tillhandahåller . Medan huvuddelen av katalogen är kategoriserad främst efter ämne, kategoriseras Regional kategorin främst efter region. Detta har fått många att se DMOZ som två parallella kataloger: Regional och Aktuell .
Den 14 november 2000 skapades en särskild katalog inom DMOZ för personer under 18 år. Nyckelfaktorer som skiljer detta "Barn och tonåringar"-område från huvudkatalogen är:
- strängare riktlinjer som begränsar listningen av webbplatser till de som är riktade eller "lämpliga" för personer under 18 år;
- kategorinamn såväl som webbplatsbeskrivningar använder ordförråd som är " åldersanpassad ";
- ålderstaggar på varje lista särskiljer innehåll som är lämpligt för barn (12 år och yngre), tonåringar (13 till 15 år gamla) och mogna tonåringar (16 till 18 år gamla);
- Innehåll för barn och tonåringar är tillgängligt som en separat RDF-dump;
- redigeringsbehörigheter är sådana att gemenskapen är parallell med den för DMOZ.
I maj 2005 inkluderade denna del av DMOZ över 32 000 webbplatslistor.
Från början av 2004 var hela webbplatsen i UTF-8- kodning. Dessförinnan hade kodningen varit ISO 8859-1 för engelska språkkategorier och en språkberoende teckenuppsättning för andra språk. RDF-dumparna kodades i UTF-8 från början av 2000.
Underhåll
Katalogförteckningar upprätthölls av redaktörer. Medan vissa redaktörer fokuserar på att lägga till nya listor, fokuserar andra på att behålla de befintliga listorna och vissa gjorde både och. Detta inkluderade uppgifter som att redigera enskilda listor för att korrigera stavnings- och/eller grammatiska fel, samt att övervaka statusen för länkade webbplatser. Ytterligare andra gick igenom webbplatsinlämningar för att ta bort spam och dubbletter av inlagor.
Robozilla var en sökrobot skriven för att kontrollera statusen för alla webbplatser som listas i DMOZ. Med jämna mellanrum flaggade Robozilla sajter som verkade ha flyttats eller försvunnit och redaktörer följde upp dem för att kontrollera sajterna och vidta åtgärder. Denna process var avgörande för katalogen i strävan efter att uppnå ett av dess grundläggande mål: att minska länkrötan i webbkataloger. Kort efter varje körning flyttades webbplatserna markerade med fel automatiskt till den ogranskade kön där redaktörer kan undersöka dem när tiden tillåter.
På grund av populariteten för DMOZ och dess resulterande inverkan på sökmotorernas rankning (Se PageRank ), lockade domäner med förfallen registrering som var listade på DMOZ domänkapning , ett problem som åtgärdades genom att regelbundet ta bort utgångna domäner från katalogen.
Medan företagsfinansiering och personal för DMOZ minskade med tiden, skapade volontärer redigeringsverktyg som länkkontroller för att komplettera Robozilla, kategorisökrobotar, stavningskontroller, sökverktyg som direkt sållar en nyligen publicerad RDF-dump, bokmärken för att automatisera vissa redigeringsfunktioner, mozillabaserade tillägg , och verktyg som hjälpte till att arbeta igenom ogranskade köer.
Licens och krav
DMOZ-data har tidigare gjorts tillgängliga under villkoren för Open Directory License , som krävde en specifik DMOZ-attributionstabell på varje webbsida som använder data.
Open Directory-licensen inkluderade också ett krav att användare av data kontinuerligt kontrollerar DMOZ-webbplatsen för uppdateringar och slutar använda och distribuera data eller verk som härrör från data när en uppdatering sker. Denna begränsning fick Free Software Foundation att hänvisa till Open Directory-licensen som en icke-fri dokumentationslicens, med hänvisning till rätten att omdistribuera en given version som inte är permanent och kravet att kontrollera om det finns ändringar i licensen.
2011 ändrade DMOZ tyst sin licens till en Creative Commons Attribution-licens [ citat behövs ] , som är en gratis licens (och GPL-kompatibel).
RDF dumpar
DMOZ-data görs tillgänglig genom en RDF-liknande dump som publiceras på en nedladdningsserver, där arkiveras även äldre versioner. Nya versioner genereras vanligtvis varje vecka. En DMOZ-redigerare har katalogiserat ett antal buggar som påträffas i DMOZ RDF-dumpen, viktigast av allt att filformatet inte är RDF. Så även om den så kallade RDF-dumpen idag är giltig XML , är den inte giltig RDF och som sådan måste programvara för att bearbeta DMOZ RDF-dumpen vara specifikt skriven för DMOZ-data.
Innehållsanvändare
DMOZ-data driver kärnkatalogtjänsterna för många av webbens största sökmotorer och portaler, inklusive Netscape Search, AOL Search och Alexa . Google Directory använde DMOZ-information tills den stängdes i juli 2011.
Andra användningar görs också av DMOZ-data. Till exempel, våren 2004 Overture en söktjänst för tredje part som kombinerar Yahoo! Katalogsökresultat med DMOZ-titlar, beskrivningar och kategorimetadata. Sökmotorn Gigablast tillkännagav den 12 maj 2005 sin sökbara kopia av DMOZ. Tekniken tillåter sökning av webbplatser listade i specifika kategorier, "i själva verket skapar det omedelbart över 500 000 vertikala sökmotorer".
Den 8 september 2006 listade DMOZ 313 engelskspråkiga webbplatser som använder DMOZ-data samt 238 webbplatser på andra språk. Dessa siffror återspeglar dock inte hela bilden av användningen, eftersom de webbplatser som använder DMOZ-data utan att följa villkoren i DMOZ-licensen inte är listade.
Policies och procedurer
Restriktioner införs för vem som kan bli en DMOZ-redaktör. Den primära gatekeeping-mekanismen är en redigeringsansökningsprocess där redaktörskandidater visar sina redigeringsförmåga, avslöjar anknytningar som kan utgöra en intressekonflikt [ citat behövs ] och på annat sätt ger en känsla av hur sökanden sannolikt skulle passa in i DMOZ-kulturen och uppdraget. En majoritet av ansökningarna avslås men återansökan är tillåten och ibland uppmuntras. Samma standarder gäller för redaktörer av alla kategorier och underkategorier. [ citat behövs ]
DMOZ:s redigeringsmodell är hierarkisk . När de blir redaktörer har individer i allmänhet redigeringsbehörigheter i endast en liten kategori. När de har visat grundläggande redigeringsfärdigheter i enlighet med redigeringsriktlinjerna är de välkomna att ansöka om ytterligare redigeringsprivilegier i antingen en bredare kategori eller annan kategori i katalogen. Mentorskapsrelationer mellan redaktörer uppmuntras och interna forum ger nya redaktörer möjlighet att ställa frågor. [ citat behövs ]
DMOZ har sina egna interna forum, vars innehåll endast är avsett för redaktörer att kommunicera med varandra i första hand om redigering av ämnen. Tillgång till forumen kräver ett redaktörskonto och redaktörer förväntas hålla innehållet i dessa forum privat.
Med tiden kan seniora redaktörer beviljas ytterligare privilegier som återspeglar deras redigeringserfarenhet och ledarskap inom redigeringsgemenskapen. Det enklaste är att redigera alla privilegier, vilket gör att en redaktör kan komma åt alla kategorier i katalogen. Metaprivilegier tillåter dessutom redaktörer att utföra uppgifter som att granska redigeringsprogram, ställa in kategorifunktioner och hantera externa och interna missbruksrapporter. Cateditall- privilegier liknar att redigera alla , men bara för en enda katalogkategori. På liknande sätt liknar catmod- privilegier meta , men bara för en enda katalogkategori. Catmv- privilegier tillåter redaktörer att göra ändringar i katalogontologi genom att flytta eller byta namn på kategorier. Alla dessa privilegier beviljas av administratörer och personal, vanligtvis efter diskussion med meta- redaktörer. [ citat behövs ]
introducerades en ny nivå av privilegier som kallas admin . Administratörsstatus beviljades till ett antal långa metas av personalen. Administratörer har möjlighet att ge editall+-privilegier till andra redaktörer och att godkänna nya katalogomfattande policyer, befogenheter som tidigare bara varit tillgängliga för root-redaktörer (personal).
Alla DMOZ-redigerare förväntas följa DMOZ:s redigeringsriktlinjer. Dessa riktlinjer beskriver grunderna för redigering: vilka typer av webbplatser som får listas och vilka inte; hur webbplatslistor bör tituleras och beskrivas på ett löst konsekvent sätt; konventioner för namngivning och konstruktion av kategorier; begränsningar av intressekonflikter för redigering av webbplatser som redaktören kan äga eller på annat sätt vara ansluten till; och en uppförandekod inom samhället. Redaktörer som upptäcks ha brutit mot dessa riktlinjer kan kontaktas av personal eller senior redaktörer, få sina redigeringsbehörigheter nedskurna eller förlora sina redigeringsbehörigheter helt. DMOZ riktlinjer revideras med jämna mellanrum efter diskussion i redaktörsforum. [ citat behövs ]
Kontrovers och kritik
Det har länge förekommit anklagelser om att frivilliga DMOZ-redaktörer ger fördelaktig behandling av sina egna webbplatser samtidigt som de motarbetar sina konkurrenters ansträngningar i god tro. Sådana anklagelser framförs av ODP:s personal och meta-redaktörer, som har befogenhet att vidta disciplinära åtgärder mot frivilliga redaktörer som misstänks ha ägnat sig åt kränkande redigeringsmetoder. 2003 introducerade DMOZ ett nytt system för offentlig missbruksrapportering som gör det möjligt för allmänheten att rapportera och spåra anklagelser om kränkande uppförande av redaktörer med hjälp av ett onlineformulär. Obehindrad diskussion om DMOZ:s påstådda brister har blivit vanligare på vanliga diskussionsforum för webbansvariga . Även om webbplatspolicyer föreslår att en enskild webbplats endast ska skickas till en kategori, från och med oktober 2007, hade Topix.com, en nyhetssajt som drivs av DMOZ-grundaren Rich Skrenta, mer än 17 000 listor.
Tidigt i DMOZs historia gav dess personal representanter för utvalda företag, som Rolling Stone eller CNN , redigeringsåtkomst för att lista enskilda sidor från deras webbplatser. Länkar till enskilda CNN-artiklar lades till fram till 2004, men togs bort helt från katalogen i januari 2008 på grund av att innehållet var föråldrat och inte ansågs värt ansträngningen att underhålla. Det har inte gjorts några liknande experiment med redigeringspolicyn sedan dess.
Ägande och förvaltning
Underliggande vissa kontroverser kring DMOZ är dess ägande och förvaltning. Några av de ursprungliga GnuHoo-volontärerna kände att de hade blivit lurade att gå med i ett kommersiellt företag. I varierande grad har dessa klagomål fortsatt fram till idag.
Vid DMOZ:s start tänkte man inte mycket på idén om hur DMOZ skulle hanteras och det fanns inga officiella forum , riktlinjer eller vanliga frågor .
Allteftersom tiden gick blev ODP-redaktörsforumen de facto DMOZ-parlamentet, och när en av DMOZ:s anställda skulle lägga upp en åsikt i forumen skulle det betraktas som ett officiellt beslut. Trots det började DMOZ-personal att ge betrodda seniorredaktörer ytterligare redigeringsprivilegier, inklusive möjligheten att godkänna nya editorapplikationer, vilket så småningom ledde till en stratifierad hierarki av uppgifter och privilegier bland DMOZ-redaktörer, där DMOZ:s betalda personal hade sista ordet angående DMOZ:s policyer. och procedurer.
Robert Keating, rektor för Touchstone Consulting Group i Washington, DC sedan 2006, arbetade som AOL:s programchef för DMOZ sedan 2004. Han började arbeta för AOL 1999 som seniorredaktör för AOL Search, sedan som chefredaktör, AOL Search, DMOZ, och sedan som medieekosystemchef, AOL Product Marketing.
Procedurer för borttagning av redaktör
DMOZ:s förfaranden för borttagning av redaktörer övervakas av DMOZ:s personal och meta-redaktörer. Enligt DMOZ:s officiella redaktionella riktlinjer tas redaktörer bort på grund av kränkande redigeringsmetoder eller okvilt beteende. Diskussioner som kan resultera i disciplinära åtgärder mot frivilliga redaktörer äger rum i ett privat forum som endast kan nås av DMOZ:s personal och meta-redaktörer. Frivilliga redaktörer som diskuteras får inte besked om att sådana förfaranden äger rum. Vissa människor tycker att detta arrangemang är osmakligt och vill istället ha en diskussion som är mer modellerad som en rättegång i det amerikanska rättssystemet.
I artikeln "Editor Removal Explained" konstaterar DMOZ-metareaktör Arlarson att "en stor del av förvirringen om borttagning av redaktörer från DMOZ beror på falska eller vilseledande uttalanden från tidigare redaktörer".
DMOZ:s riktlinjer för konfidentialitet förbjuder alla nuvarande DMOZ-redaktörer som kan veta något från att diskutera orsakerna till specifika borttagningar av redaktörer, men en lista med potentiella orsaker fanns i riktlinjerna. Tidigare har detta lett till att borttagna DMOZ-redaktörer undrat varför de inte kan logga in på DMOZ för att utföra sitt redigeringsarbete.
David F. Prenatt, Jr., tidigare DMOZ-redaktör netesq , och en annan före detta redaktör känd under aliaset The Cunctator , hävdar båda att de har tagits bort för att de inte håller med personalen om ändringar av policyer, särskilt DMOZ:s upphovsrättspolicy . Enligt deras påståenden använder personalen ursäkten för uncivilt beteende som ett sätt att ta bort besvärande redaktörer.
Svartlistning av anklagelser
Senior DMOZ-redaktörer har möjlighet att bifoga "varning" eller "lista inte"-anteckningar till enskilda domäner, men ingen redaktör har den ensidiga möjligheten att blockera vissa webbplatser från att listas. Webbplatser med dessa anteckningar kan fortfarande vara listade och ibland tas anteckningar bort efter en viss diskussion.
Hierarkisk struktur
Kritik av DMOZ:s hierarkiska struktur uppstod omkring 2005. Många anser att hierarkiska kataloger är för komplicerade. Med uppkomsten av Web 2.0 började folksonomier att dyka upp , och vissa redaktörer föreslog att folksonomier, nätverk och riktade grafer är mer "naturliga" och lättare att hantera än hierarkier.
programvara
Sök
ODPSearch-programvaran är en härledd version av Isearch som är öppen källkod , licensierad under Mozilla Public License .
Redaktörsforum
ODP Editor Forums kördes ursprungligen på programvara som var baserad på det proprietära Ultimate Bulletin Board-systemet. I juni 2003 bytte de till phpBB- systemet med öppen källkod . Från och med 2007 drevs dessa forum av en modifierad version av phpBB.
Buggspårning
Bugspårningsmjukvaran som används av ODP är Bugzilla och webbservern Apache . Squid webbproxyserver användes också men den togs bort i augusti 2007 när lagringsservrarna omorganiserades. Alla dessa applikationer är öppen källkod.
Gränssnitt
DMOZ-databasen/redigeringsmjukvaran är sluten källkod (även om Richard Skrenta sa i juni 1998 att han övervägde att licensiera den under GNU General Public License ). Detta har lett till kritik från det tidigare nämnda GNU-projektet, av vilka många också kritiserade DMOZ-innehållslicensen. Innehållet släpptes senare under en Creative Commons-licens, som är kompatibel med GNU-licensen.
Som sådan har det gjorts vissa ansträngningar för att tillhandahålla alternativ till DMOZ. Dessa alternativ skulle göra det möjligt för grupper av likasinnade redaktörer att skapa och underhålla sina egna webbkataloger med öppen källkod/öppet innehåll.
ChefMoz
Chef Moz , en utlöpare av DMOZ, var en öppen innehållskatalog med länkar till restauranger på World Wide Web . Webbplatsen har byggts och underhållits av en grupp frivilliga redaktörer och ägs av Netscape .
Chef Moz, i likhet med dess moder DMOZ, använde ett hierarkiskt ontologischema för att organisera webbplatslistor. Listor om ett liknande ämne grupperades i kategorier, som sedan kan inkludera mindre kategorier.
Den 17 februari 2011 bekräftade DMOZ-administratören "lisagirl" att kocken Moz var död.
Tillväxt
Från starten 2000 till november 2009 (när det blev omöjligt för redaktörer att logga in på sajten) hade ChefMoz vuxit till att bli den största globala katalogen över restauranger på internet. Det totala antalet restauranger som indexerats sedan 2000 registreras i följande tabell:
ÅR | Antal restauranger |
---|---|
2000 | 48 000 |
2001 | 75 000 |
2002 | 179 000 |
2003 | 208 000 |
2004 | 258 000 |
2005 | 266 000 |
2006 | 275 000 |
2007 | 315 000 |
2008 | 325 000 |
Se även
externa länkar
- dmoz.org (officiell webbplats) på Wayback Machine (arkiverad 14 mars 2017)
- DMOZ på Curlie
- Arkiv för dmoz.org (tillgänglig 14 maj 2021)
- dmoztools.net , DMOZ statisk spegel
- Curlie Efterträdaren till DMOZ
- Chef Moz på Internet Archive