Projekt Gutenberg

Projekt Gutenberg
Project Gutenberg logo.svg
Etablerade
december 1971 ; 51 år sedan ( 1971-12 ) (första dokumentet publicerat)
Samling
Storlek Över 60 000 dokument
Hemsida gutenberg .org

Project Gutenberg ( PG ) är en volontärinsats för att digitalisera och arkivera kulturella verk, samt att "uppmuntra skapandet och distributionen av e-böcker ." Det grundades 1971 av den amerikanske författaren Michael S. Hart och är det äldsta digitala biblioteket . De flesta av föremålen i dess samling är fullständiga texter av böcker eller enskilda berättelser i det offentliga området . Alla filer kan nås gratis under en layout i öppet format , tillgänglig på nästan vilken dator som helst. Den 3 oktober 2015 hade Project Gutenberg nått 50 000 objekt i sin samling av gratis e-böcker.

Utgåvorna är tillgängliga i vanlig text såväl som andra format, som HTML , PDF , EPUB , MOBI och Plucker där det är möjligt. De flesta utgåvor är på engelska , men många icke-engelska verk är också tillgängliga. Det finns flera anslutna projekt som tillhandahåller ytterligare innehåll, inklusive region- och språkspecifika verk. Project Gutenberg är nära knuten till Distributed Proofreaders , en internetbaserad gemenskap för korrekturläsning av skannade texter.

Project Gutenberg är uppkallat efter Johannes Gutenberg , som introducerade boktryck med lös typ i Europa.

Historia

Michael S. Hart (vänster) och Gregory Newby (höger) från Project Gutenberg , vid Hackers on Planet Earth (HOPE) Conference, 2006.

Michael S. Hart startade Project Gutenberg 1971 med digitaliseringen av USA:s självständighetsförklaring . Hart, en student vid University of Illinois , fick tillgång till en Xerox Sigma V stordator i universitetets Material Research Lab. Genom vänliga operatörer fick han ett konto med praktiskt taget obegränsad mängd datortid; dess värde vid den tiden har sedan dess på olika sätt uppskattats till 100 000 $ eller 100 000 000 $. Hart förklarade att han ville "ge tillbaka" denna gåva genom att göra något man kunde anse vara av stort värde. Hans första mål var att göra de 10 000 mest konsulterade böckerna tillgängliga för allmänheten utan eller utan kostnad i slutet av 1900-talet.

Den 4 juli 1971, efter att ha inspirerats av en gratis tryckt kopia av USA:s självständighetsförklaring, bestämde han sig för att skriva in texten i en dator och att överföra den till andra användare på datornätverket.

— Gregory B. Newby

Denna speciella dator var en av de 15 noderna ARPANET , datornätverket som skulle bli Internet . Hart trodde en dag att allmänheten skulle få tillgång till datorer och bestämde sig för att göra litteratur tillgängliga i elektronisk form gratis. Han använde en kopia av USA:s självständighetsförklaring i sin ryggsäck, och detta blev den första Project Gutenberg- e-texten . Han döpte projektet till Johannes Gutenberg , den tyska tryckeriet från 1400-talet som drev den rörliga tryckpressrevolutionen .

I mitten av 1990-talet drev Hart Project Gutenberg från Illinois Benedictine College . Fler frivilliga hade anslutit sig till insatsen. Han skrev in all text manuellt fram till 1989 då bildskannrar och programvara för optisk teckenigenkänning förbättrades och blev mer tillgängliga, vilket gjorde bokskanning mer genomförbart. Hart kom senare till en överenskommelse med Carnegie Mellon University , som gick med på att administrera Project Gutenbergs ekonomi. När mängden e-texter ökade började volontärer ta över projektets dagliga verksamhet som Hart hade drivit.

Den italienska volontären Pietro Di Miceli utvecklade och administrerade den första Project Gutenberg-webbplatsen och startade utvecklingen av Project online-katalogen. Under hans tio år i denna roll (1994–2004) vann projektwebbsidorna ett antal utmärkelser, ofta med i "bästa på webben", vilket bidrog till projektets popularitet.

Från och med 2004 gjorde en förbättrad onlinekatalog Project Gutenberg-innehåll lättare att bläddra i, komma åt och hyperlänka . Project Gutenberg är nu värd för ibiblio vid University of North Carolina i Chapel Hill .

Hart dog den 6 september 2011 i sitt hem i Urbana, Illinois, vid 64 års ålder.

CD- och DVD-projekt

I augusti 2003 skapade Project Gutenberg en CD som innehåller cirka 600 av de "bästa" e-böckerna från samlingen. CD-skivan finns tillgänglig för nedladdning som en ISO-avbildning . När användare inte kan ladda ner CD-skivan kan de begära att få en kopia skickad till dem utan kostnad.

I december 2003 skapades en DVD som innehöll nästan 10 000 föremål. På den tiden representerade detta nästan hela samlingen. I början av 2004 blev DVD:n även tillgänglig via post.

I juli 2007 släpptes en ny upplaga av DVD:n innehållande över 17 000 böcker, och i april 2010 släpptes en DVD med två lager, innehållande nästan 30 000 föremål.

Majoriteten av DVD-skivorna, och alla CD-skivor som skickats av projektet, spelades in på inspelningsbara media av frivilliga. De nya DVD-skivorna med dubbla lager tillverkades dock, eftersom det visade sig vara mer ekonomiskt än att låta frivilliga bränna dem. I oktober 2010 har projektet skickat cirka 40 000 skivor. Från och med 2017 har leveransen av gratis CD-skivor upphört, även om ISO-avbildningen fortfarande är tillgänglig för nedladdning.

Insamlingens omfattning

Tillväxt av Project Gutenberg-publikationer från 1994 till 2015

I augusti 2015 gjorde Project Gutenberg anspråk på över 60 000 föremål i sin samling, med i genomsnitt över 50 nya e-böcker som läggs till varje vecka. Det är främst litteraturverk från den västerländska kulturtraditionen . Förutom litteratur som romaner, poesi, noveller och dramatik har Project Gutenberg även kokböcker , uppslagsverk och nummer av tidskrifter. Project Gutenberg-samlingen har också några icke-textobjekt som ljudfiler och musikfiler.

De flesta utgåvor är på engelska, men det finns också betydande antal på många andra språk. Från och med april 2016 är de icke-engelska språken mest representerade: franska, tyska, finska, holländska, italienska och portugisiska.

När det är möjligt är Gutenberg-utgåvor tillgängliga i vanlig text , huvudsakligen med US-ASCII -teckenkodning men ofta utvidgade till ISO-8859-1 (behövs representera tecken med accent på franska och Scharfes på tyska, till exempel). Förutom att vara fri från upphovsrätt, har kravet på en latinsk ( teckenuppsättning ) textversion av utgåvan varit ett kriterium för Michael Hart sedan grundandet av Project Gutenberg, eftersom han tror att detta är det format som med största sannolikhet kommer att vara läsbart i en förlängd framtid . Av nödvändighet har detta kriterium behövt utökas ytterligare för den ansenliga samlingen av texter på östasiatiska språk som kinesiska och japanska som nu finns i samlingen, där UTF-8 används istället.

Andra format kan också släppas när de skickas in av volontärer. Det vanligaste icke-ASCII-formatet är HTML , som gör att uppmärkning och illustrationer kan inkluderas. Vissa projektmedlemmar och användare har efterfrågat mer avancerade format och tror att de är lättare att läsa. Men vissa format som inte är lätta att redigera, som PDF , anses i allmänhet inte passa in i målen för Project Gutenberg. Project Gutenberg har också två alternativ för masterformat som kan skickas in (från vilka alla andra filer genereras): anpassade versioner av Text Encoding Initiative- standarden (sedan 2005) och reStructuredText (sedan 2011).

Från och med 2009 började Project Gutenberg-katalogen erbjuda automatiskt genererade alternativa filformat, inklusive HTML (när det inte redan tillhandahålls), EPUB och plucker .

Ideal

Michael Hart sa 2004, "Projekt Gutenbergs uppdrag är enkelt: 'Att uppmuntra skapandet och distributionen av e-böcker'". Hans mål var "att tillhandahålla så många e-böcker i så många format som möjligt för hela världen att läsa på så många språk som möjligt". Likaså är en projektslogan att "bryta ner okunnighetens och analfabetismens barer", eftersom dess volontärer siktar på att fortsätta sprida offentlig läskunnighet och uppskattning för det litterära arvet precis som folkbiblioteken började göra i slutet av 1800-talet.

Projekt Gutenberg är avsiktligt decentraliserat; det finns ingen urvalspolicy som anger vilka texter som ska läggas till. Istället arbetar enskilda volontärer med det de är intresserade av, eller har tillgängligt. Projekt Gutenberg-kollektionen är avsedd att bevara föremål på lång sikt, så att de inte kan gå förlorade vid en lokal olycka. I ett försök att säkerställa detta säkerhetskopieras hela samlingen regelbundet och speglas på servrar på många olika platser.

upphovsrätt

Project Gutenberg är noga med att verifiera statusen för sina e-böcker enligt USA:s upphovsrättslagstiftning . Material läggs till i Project Gutenberg-arkivet först efter att det har fått ett upphovsrättsligt tillstånd, och register över dessa tillstånd sparas för framtida referens. Project Gutenberg gör inte anspråk på ny upphovsrätt på titlar som det publicerar. Istället uppmuntrar det deras fria reproduktion och distribution.

De flesta böcker i Project Gutenberg-samlingen distribueras som allmän egendom enligt USA:s upphovsrättslagstiftning. Det finns också några upphovsrättsskyddade texter, som science fiction -författaren Cory Doctorow , som Project Gutenberg distribuerar med tillstånd. Dessa är föremål för ytterligare begränsningar som specificeras av upphovsrättsinnehavaren, även om de vanligtvis tenderar att vara licensierade under Creative Commons .

"Project Gutenberg" är ett varumärke som tillhör organisationen, och märket kan inte användas i kommersiell eller modifierad vidaredistribution av texter som är allmän egendom från projektet. Det finns inga juridiska hinder för återförsäljning av verk i den offentliga egendomen om alla referenser till Project Gutenberg tas bort, men Gutenberg-bidragsgivare har ifrågasatt lämpligheten av att direkt och kommersiellt återanvända innehåll som har formaterats av frivilliga. Det har förekommit fall där böcker fråntagits tillskrivningen till projektet och sålts i vinstsyfte i Kindle Store och andra bokhandlare, en var boken Fox Trapping från 1906 .

Webbplatsen var inte tillgänglig i Tyskland , som ett resultat av ett domstolsbeslut från S. Fischer Verlag angående verk av Heinrich Mann , Thomas Mann och Alfred Döblin . Även om de var allmän egendom i USA, erkände den tyska domstolen (Frankfurt am Main Regional Court) intrånget av upphovsrätter som fortfarande är aktiva i Tyskland och hävdade att webbplatsen Project Gutenberg var under tysk jurisdiktion eftersom den innehåller innehåll på tyska språk och är tillgänglig i Tyskland. Denna dom fastställdes av appellationsdomstolen i Frankfurt den 30 april 2019 (11 U 27/18). Hovrätten i Frankfurt har inte gett tillstånd till ytterligare överklagande till den federala domstolen (Bundesgerichtshof), men en ansökan om tillstånd att överklaga har lämnats in till den federala domstolen. Den 4 oktober 2020 var den ansökan fortfarande anhängig (Federal Court of Justice I ZR 97/19). Enligt Project Gutenberg Literary Archive Foundation, "I oktober 2021 nådde parterna ett förlikningsavtal. Enligt villkoren i avtalet kommer Project Gutenberg e-böcker av de tre författarna att blockeras från Tyskland tills deras tyska upphovsrätt upphör att gälla. Enligt villkoren i förlikningen är blocket för hela Tyskland inte längre på plats. Övriga villkor i förlikningen är konfidentiella."

Webbplatsen har varit blockerad i Italien sedan maj 2020.

Kritik

Textfilerna använder formatet för vanlig text kodad i UTF-8 och är vanligtvis radbryts med 65–70 tecken, med stycken separerade med en dubbel radbrytning. Under de senaste decennierna har det resulterande utseendet och avsaknaden av en uppmärkningsmöjlighet ofta uppfattats som intetsägande och som en nackdel med detta format. Project Gutenberg försöker lösa detta genom att göra många texter tillgängliga i HTML-, ePub- och PDF-versioner också. HTML-versioner av äldre texter är autogenererade versioner. Ett annat icke-vinstdrivande projekt, Standard Ebooks , syftar till att ta itu med dessa problem med sin samling av publika titlar som är formaterade och formaterade. Det korrigerar problem relaterade till design och typografi.

I december 1994 kritiserades Project Gutenberg av Text Encoding Initiative för att inte inkludera dokumentation eller diskussion om de beslut som var oundvikliga vid utarbetandet av en text, eller för att i vissa fall inte dokumentera vilken av flera (motstridiga) versioner av en text som har varit den. digitaliseras.

Urvalet av tillgängliga verk (och utgåvor) har bestämts av popularitet, lätt att skanna, vara utan upphovsrätt och andra faktorer; detta skulle vara svårt att undvika i alla crowd-sourced projekt.

I mars 2004 inleddes ett initiativ av Michael Hart och John S. Guagliardo för att tillhandahålla immateriella egendomar till låg kostnad. Det ursprungliga namnet för detta projekt var Project Gutenberg 2 (PG II), vilket skapade kontroverser bland PG-volontärer på grund av återanvändningen av projektets varumärkesskyddade namn för ett kommersiellt företag.

Projekt Gutenberg Litteraturarkiv Stiftelsen

År 2000 chartrades ett icke-vinstdrivande företag , Project Gutenberg Literary Archive Foundation, Inc. 501(c)(3) EIN : 64-6221541 i Mississippi , USA , för att hantera projektets juridiska behov. Donationer till den är avdragsgilla .

Gregory B. Newby, medan assisterande professor vid UNC School of Information and Library Science , och en mångårig Project Gutenberg-volontär, blev 2001 stiftelsens första VD , senare chef för Arctic Region Supercomputing Center , senare Compute Canadas Chief Technology Officer.

Partners

  • Project Gutenberg Consortia Center är specialiserat på samlingar av samlingar. Dessa har inte den redaktionella tillsynen eller konsekventa formateringen av huvudprojektet Gutenberg. Tematiska samlingar, såväl som många språk, visas. Detta sponsras av worldlibrary.net , som är värd för self.gutenberg.org , en självpublicerande portal.
  • ibiblio , vid University of North Carolina i Chapel Hill , är nu värd för Project Gutenberg
  • Distribuerade korrekturläsare: År 2000 grundade Charles Franks Distributed Proofreaders (DP), som gjorde det möjligt för korrekturläsning av skannade texter att distribueras bland många frivilliga över Internet. Denna insats ökade antalet och variationen av texter som läggs till i Project Gutenberg, samt gjorde det lättare för nya volontärer att börja bidra. DP blev officiellt anslutet till Project Gutenberg 2002. Från och med 2018 utgjorde de 36 000+ DP-bidragna böckerna nästan två tredjedelar av de nästan 60 000 böckerna i Project Gutenberg.

Systerprojekt

Alla systerprojekt är oberoende organisationer som delar samma ideal och har fått tillstånd att använda varumärket Project Gutenberg . De har ofta ett särskilt nationellt eller språkligt fokus.

Lista över systerprojekt

  • Project Gutenberg Australia är värd för många texter som är allmän egendom enligt australiensisk upphovsrättslagstiftning , men fortfarande under upphovsrätt (eller av osäker status) i USA, med fokus på australiensiska författare och böcker om Australien.
  • Projekt Gutenberg Kanada . digitalt bibliotek för kanadensiska offentliga texter.
  • Projekt Gutenberg-DE gör anspråk på upphovsrätt för sin produkt och begränsar åtkomsten till läsbara webbversioner av dess texter.
  • Project Gutenberg Europe drivs av Project Rastko i Serbien . Det syftar till att vara ett projekt Gutenberg för hela Europa, och började publicera projekt 2005. Det använder Distributed Proofreaders för att snabbt producera e-texter.
  • Project Gutenberg Luxembourg publicerar mestadels, men inte uteslutande, böcker som är skrivna på luxemburgska .
  • Projekti Lönnrot, startat av finska Project Gutenberg-volontärer, har fått sitt namn från den finske filologen Elias Lönnrot (1802–1884)
  • Projekt Gutenberg från Filippinerna syftar till att "göra så många böcker tillgängliga för så många människor som möjligt, med särskilt fokus på Filippinerna och de filippinska språken".
  • Projekt Gutenberg Ryssland (Rutenberg) syftar till att samla in böcker som är allmän egendom på slaviska språk, särskilt på ryska. Diskussionen om projektet och dess juridiska sida började i april 2012. Ordet Rutenberg är en kombination av orden "Ryssland" och "Gutenberg".
  • Project Gutenberg Self Publishing Portal även känd som Project Gutenberg Self-Publishing Press , av Project Gutenberg Consortia Center Till skillnad från själva Gutenberg-projektet tillåter Project Gutenberg Self-Publishing inlämning av texter som aldrig publicerats tidigare, inklusive självpublicerade e-böcker. Lanserades 2012, äger även domänen "gutenberg.us".
  • Projekt Gutenberg från Taiwan försöker arkivera upphovsrättsfria böcker med särskilt fokus på Taiwan på engelska, mandarin och Taiwan-baserade språk. Det är ett speciellt projekt från Forumosa.com
  • Projekt Runeberg , Nordisk litteratur
  • ReadingRoo.ms , hemmet för Project Gutenberg PrePrints

Affiliates

Se även

externa länkar

Lyssna på den här artikeln ( 17 minuter )
Spoken Wikipedia icon
Den här ljudfilen skapades från en revidering av denna artikel daterad 23 juli 2007 ( 2007-07-23 ) och återspeglar inte efterföljande redigeringar.