Google Böcker

Google Böcker
Google Books logo 2020.svg
Skärmdump
Google books screenshot.png
Typ av webbplats
Digitalt bibliotek
Ägare Google
URL böcker .google .com
Lanserades oktober 2004 ; 18 år sedan ( 2004-10 ) (som Google Print)
Nuvarande status Aktiva

Google Books (tidigare känd som Google Book Search , Google Print och med kodnamnet Project Ocean ) är en tjänst från Google Inc. som söker igenom hela texten i böcker och tidskrifter som Google har skannat, konverterat till text med hjälp av optisk teckenigenkänning (OCR), och lagras i sin digitala databas. Böcker tillhandahålls antingen av förläggare och författare via Google Books Partner Program eller av Googles bibliotekspartner genom biblioteksprojektet. Dessutom har Google samarbetat med ett antal tidskriftsförlag för att digitalisera deras arkiv.

Publisher-programmet var först känt som Google Print när det introducerades på bokmässan i Frankfurt i oktober 2004. Google Books Library Project, som skannar verk i bibliotekspartners samlingar och lägger till dem i den digitala inventeringen, tillkännagavs i december 2004 .

Google Books-initiativet har hyllats för sin potential att erbjuda oöverträffad tillgång till vad som kan bli den största onlinesamlingen av mänsklig kunskap och främja demokratisering av kunskap . Men det har också kritiserats för potentiella upphovsrättsbrott och bristande redigering för att rätta till de många fel som införts i de skannade texterna genom OCR-processen.

I oktober 2019 firade Google 15 år med Google Books och angav antalet skannade böcker som mer än 40 miljoner titlar. Google uppskattade 2010 att det fanns cirka 130 miljoner distinkta titlar i världen och uppgav att de hade för avsikt att skanna dem alla. Skanningsprocessen i amerikanska akademiska bibliotek har dock saktat ner sedan början. Google Books skanningsansträngningar har varit föremål för rättstvister, inklusive Authors Guild v. Google , en grupptalan i USA, som avgjordes till Googles fördel (se nedan). Detta var ett stort fall som var nära att ändra upphovsrättspraxis för föräldralösa verk i USA.

Detaljer

Resultat från Google Böcker visas både i den universella Google-sökningen och på den särskilda sökwebbplatsen för Google Böcker ( books.google.com ).

Som svar på sökfrågor tillåter Google Böcker användare att se helsidor från böcker där söktermerna förekommer om boken inte är upphovsrättsskyddad eller om upphovsrättsinnehavaren har gett tillstånd. Om Google anser att boken fortfarande är skyddad av upphovsrätt ser en användare "utdrag" av text runt söktermerna. Alla instanser av söktermerna i boktexten visas med en gul markering.

De fyra åtkomstnivåerna som används på Google Böcker är:

  • Fullständig vy : Böcker i allmän egendom är tillgängliga för "fullständig visning" och kan laddas ner gratis. In-print-böcker som förvärvats genom partnerprogrammet är också tillgängliga för fullständig visning om förlaget har gett tillstånd, även om detta är sällsynt.
  • Förhandsgranskning : För böcker i tryck där tillstånd har beviljats ​​är antalet sidor som kan visas begränsat till en "förhandsgranskning" som ställs in av en mängd åtkomstbegränsningar och säkerhetsåtgärder, vissa baserade på användarspårning. Vanligtvis kan förlaget ställa in hur stor andel av boken som är tillgänglig för förhandsgranskning. Användare är begränsade från att kopiera, ladda ner eller skriva ut bokförhandsvisningar. En vattenstämpel med texten "Upphovsrättsskyddat material" visas längst ner på sidorna. Alla böcker som förvärvats genom partnerprogrammet är tillgängliga för förhandsgranskning.
  • Utdragsvy : En "utdragsvy" – två till tre rader med text som omger den sökta söktermen – visas i fall där Google inte har tillstånd från upphovsrättsinnehavaren att visa en förhandsgranskning. Det kan bero på att Google inte kan identifiera ägaren eller att ägaren har avböjt tillstånd. Om en sökterm förekommer många gånger i en bok visar Google inte mer än tre utdrag, vilket hindrar användaren från att se för mycket av boken. Google visar inte heller några utdrag för vissa uppslagsböcker, till exempel ordböcker, där visning av jämna utdrag kan skada marknaden för verket. Google hävdar att inget tillstånd krävs enligt upphovsrättslagen för att visa utdragsvyn.
  • Ingen förhandsvisning : Google visar även sökresultat för böcker som inte har digitaliserats. Eftersom dessa böcker inte har skannats är deras text inte sökbar och endast metadata som titel, författare, förlag, antal sidor, ISBN, ämne och upphovsrättsinformation, och i vissa fall en innehållsförteckning och boksammanfattning är tillgängliga. I själva verket liknar detta en onlinebibliotekskortkatalog.

Som svar på kritik från grupper som American Association of Publishers och Authors Guild tillkännagav Google en opt-out- policy i augusti 2005, genom vilken upphovsrättsägare kunde tillhandahålla en lista över titlar som de inte vill skannas, och begäran skulle respekteras. Företaget uppgav också att det inte skulle skanna några upphovsrättsskyddade böcker mellan augusti och 1 november 2005, för att ge ägarna möjlighet att bestämma vilka böcker som skulle uteslutas från projektet. Upphovsrättsinnehavare har alltså tre val med avseende på alla verk:

  1. Den kan delta i partnerprogrammet för att göra en bok tillgänglig för förhandsgranskning eller fullständig visning, i vilket fall den delar intäkter från visningen av sidor från arbetet som svar på användarfrågor.
  2. Det kan låta Google skanna boken under biblioteksprojektet och visa utdrag som svar på användarfrågor.
  3. Den kan välja bort biblioteksprojektet, i vilket fall Google inte kommer att skanna boken. Om boken redan har skannats kommer Google att återställa sin åtkomstnivå till "Ingen förhandsgranskning".

De flesta skannade verk finns inte längre i tryck eller kommersiellt tillgängliga.

Förutom att skaffa böcker från bibliotek, skaffar Google även böcker från sina förlagspartner genom "Partnerprogrammet" – utformat för att hjälpa förläggare och författare att marknadsföra sina böcker. Förläggare och författare skickar antingen en digital kopia av sin bok i EPUB- eller PDF- format, eller en tryckt kopia till Google, som görs tillgänglig på Google Böcker för förhandsgranskning. Förlaget kan kontrollera procentandelen av boken som är tillgänglig för förhandsgranskning, med ett minimum på 20 %. De kan också välja att göra boken fullt synlig och till och med låta användare ladda ner en PDF-kopia. Böcker kan också göras tillgängliga för försäljning på Google Play. Till skillnad från biblioteksprojektet väcker detta inga upphovsrättsliga problem eftersom det utförs i enlighet med ett avtal med förlaget. Förlaget kan när som helst välja att frånträda avtalet.

För många böcker visar Google Böcker de ursprungliga sidnumren. Emellertid Tim Parks , som skrev i The New York Review of Books 2014, att Google hade slutat tillhandahålla sidnummer för många nya publikationer (troligen de som förvärvats genom partnerprogrammet) "förmodligen i allians med förlagen, för att tvinga fram de av oss som behöver förbereda fotnoter för att köpa pappersutgåvor."

Scanning av böcker

Projektet startade 2002 under kodnamnet Project Ocean. Googles medgrundare Larry Page hade alltid haft ett intresse av att digitalisera böcker. När han och Marissa Mayer började experimentera med bokskanning 2002 tog det 40 minuter för dem att digitalisera en 300-sidig bok. Men strax efter det hade tekniken utvecklats till den grad att skanningsoperatörer kunde scanna upp till 6000 sidor i timmen.

Google etablerade utsedda skanningscenter dit böcker transporterades med lastbilar. Stationerna kunde digitaliseras med en hastighet av 1 000 sidor per timme. Böckerna placerades i en specialbyggd mekanisk vagga som justerade bokryggen på plats medan en rad ljus och optiska instrument skannade de två öppna sidorna. Varje sida skulle ha två kameror riktade mot den för att fånga bilden, medan en avståndsmätare LIDAR lade ett tredimensionellt laserrutnät på bokens yta för att fånga papprets krökning. En mänsklig operatör skulle bläddra för hand och använda en fotpedal för att ta fotografierna. Utan att behöva platta till sidorna eller justera dem perfekt nådde Googles system inte bara en anmärkningsvärd effektivitet och hastighet utan hjälpte också till att skydda de ömtåliga samlingarna från att bli överhantering. Efteråt gick de råa bilderna igenom tre nivåer av bearbetning: först använde de-warping-algoritmer LIDAR-data för att fixa sidornas krökning. Sedan för optisk teckenigenkänning (OCR) de råa bilderna till text, och slutligen extraherade en annan omgång algoritmer sidnummer, fotnoter, illustrationer och diagram.

Många av böckerna skannas med en anpassad Elphel 323-kamera med en hastighet av 1 000 sidor per timme. Ett patent som tilldelades Google 2009 avslöjade att Google hade kommit med ett innovativt system för att skanna böcker som använder två kameror och infrarött ljus för att automatiskt korrigera för krökningen av sidorna i en bok. Genom att konstruera en 3D-modell av varje sida och sedan "de-warpa" den, kan Google presentera sidor med platt utseende utan att verkligen behöva göra sidorna platta, vilket kräver användning av destruktiva metoder som avbindning eller glasplåtar för att individuellt platta ut varje sida, vilket är ineffektivt för storskalig skanning.

Google beslutade att utelämna färginformation till förmån för bättre rumslig upplösning, eftersom de flesta böcker som inte omfattas av upphovsrätt vid den tiden inte innehöll färger. Varje sidbild passerades genom algoritmer som särskiljde text- och illustrationsregionerna. Textregioner bearbetades sedan via OCR för att möjliggöra fulltextsökning. Google har lagt ned avsevärda resurser på att ta fram optimala komprimeringstekniker, med sikte på hög bildkvalitet och samtidigt hålla filstorlekarna minimala för att möjliggöra åtkomst för internetanvändare med låg bandbredd.

Webbplatsens funktionalitet

För varje arbete genererar Google Böcker automatiskt en översiktssida. Den här sidan visar information extraherad från boken – dess publiceringsdetaljer, en högfrekvent ordkarta, innehållsförteckningen – såväl som sekundärt material, såsom sammanfattningar, läsarrecensioner (ej läsbara i mobilversionen av webbplatsen) och länkar till andra relevanta texter. En besökare på sidan kan till exempel se en lista över böcker som delar en liknande genre och tema, eller så kan de se en lista över aktuella stipendier i boken. Detta innehåll erbjuder dessutom interaktiva möjligheter för användare som är inloggade på sitt Google-konto . De kan exportera bibliografiska data och citat i standardformat , skriva sina egna recensioner, lägga till dem i sitt bibliotek för att taggas, organiseras och delas med andra människor. Därför samlar Google Böcker in dessa mer tolkande element från en rad källor, inklusive användarna, tredjepartswebbplatser som Goodreads och ofta bokens författare och utgivare.

Faktum är att Google har lagt till flera funktioner på webbplatsen för att uppmuntra författare att ladda upp sina egna böcker. Författarna kan tillåta besökare att ladda ner sin e-bok gratis, eller så kan de ställa in sitt eget inköpspris. De kan ändra priset fram och tillbaka och erbjuda rabatter när det passar dem. Dessutom, om en bokförfattare väljer att lägga till ett ISBN , LCCN eller OCLC -postnummer kommer tjänsten att uppdatera bokens url för att inkludera den. Sedan kan författaren ställa in en specifik sida som länkens ankare. Det här alternativet gör deras bok lättare att hitta.

Ngram Viewer

Ngram Viewer är en tjänst kopplad till Google Books som visar hur ofta ord används i boksamlingen. Tjänsten är viktig för historiker och lingvister eftersom den kan ge en inblick i mänsklig kultur genom ordanvändning under tidsperioder. Detta program har fallit under kritik på grund av fel i metadata som används i programmet.

Innehållsfrågor och kritik

Projektet har fått kritik för att dess uttalade mål att bevara föräldralösa och utgångna verk är i fara på grund av att skannade data har fel och att sådana problem inte kan lösas.

Användare kan rapportera fel i Googles skannade böcker på support.google.com/books/partner/troubleshooter/2983879 .

Skanningsfel

En hand skannad i en Google-bok

Skanningsprocessen är föremål för fel. Vissa sidor kan till exempel vara oläsliga, upp och ner eller i fel ordning. Forskare har till och med rapporterat om skrynkliga sidor, mörka tummar och fingrar och utsmetade eller suddiga bilder. Om den här frågan säger en förklaring från Google i slutet av skannade böcker:

Digitaliseringen på den mest grundläggande nivån bygger på sidbilder av de fysiska böckerna. För att göra den här boken tillgänglig som en ePub-formaterad fil har vi tagit dessa sidbilder och extraherat texten med Optical Character Recognition (eller OCR för kort) teknik. Extrahering av text från sidbilder är en svår ingenjörsuppgift. Fläckar på de fysiska böckernas sidor, snygga typsnitt, gamla typsnitt, trasiga sidor etc. kan alla leda till fel i den extraherade texten. Imperfect OCR är bara den första utmaningen i det slutliga målet att gå från samlingar av sidbilder till extraherade textbaserade böcker. Våra datoralgoritmer måste också automatiskt bestämma bokens struktur (vilka är sidhuvuden och sidfötter, var bilderna placeras, om texten är vers eller prosa, och så vidare). Genom att göra detta rätt kan vi återge boken på ett sätt som följer originalbokens format. Trots våra ansträngningar kan du se stavfel, skräptecken, främmande bilder eller saknade sidor i den här boken. Baserat på våra uppskattningar bör dessa fel inte hindra dig från att njuta av bokens innehåll. De tekniska utmaningarna med att automatiskt konstruera en perfekt bok är skrämmande, men vi fortsätter att göra förbättringar av vår OCR- och bokstrukturextraktionsteknik.

Från och med 2009 uppgav Google att de skulle börja använda reCAPTCHA för att hjälpa till att fixa de fel som hittats i Google Book-skanningar. Denna metod skulle bara förbättra skannade ord som är svåra att känna igen på grund av skanningsprocessen och kan inte lösa fel som vända sidor eller blockerade ord.

Skanningsfel har inspirerat konstverk som publicerade samlingar av anomala sidor och en Tumblr- blogg.

Fel i metadata

Forskare har ofta rapporterat skenande fel i metadatainformationen Google Böcker – inklusive felaktigt tillskrivna författare och felaktiga publiceringsdatum. Geoffrey Nunberg , en lingvist som forskar om förändringar i ordanvändning över tid, märkte att en sökning efter böcker publicerade före 1950 och som innehöll ordet "internet" gav osannolika 527 resultat. Woody Allen nämns i 325 böcker som skenbart publicerades innan han föddes. Google svarade Nunberg genom att skylla huvuddelen av felen på externa entreprenörer.

Andra metadatafel som rapporterats inkluderar publiceringsdatum före författarens födelse (t.ex. 182 verk av Charles Dickens före hans födelse 1812); felaktiga ämnesklassificeringar (en utgåva av Moby Dick som finns under "datorer", en biografi om Mae West klassificerad under "religion"), motstridiga klassificeringar (10 upplagor av Whitman's Leaves of Grass, alla klassificerade som både "fiktion" och "facklitteratur"), felaktigt stavade titlar, författare och förläggare ( Moby Dick: or the White "Wall" ) och metadata för en bok felaktigt bifogade till en helt annan bok (metadata för ett matematiskt verk från 1818 leder till en romansk roman från 1963).

En granskning av metadataelementen för författare, titel, utgivare och publiceringsår för 400 slumpmässigt utvalda Google Books-poster gjordes. Resultaten visar att 36 % av böckerna i digitaliseringsprojektet innehöll metadatafel. Denna felfrekvens är högre än vad man kan förvänta sig att hitta i en typisk bibliotekskatalog online.

Den totala felfrekvensen på 36,75 % som hittades i den här studien tyder på att Google Böckers metadata har en hög felfrekvens. Medan "stora" och "mindre" fel är en subjektiv distinktion baserad på det något obestämda konceptet "finnbarhet", bör de fel som finns i de fyra metadataelement som undersökts i denna studie alla anses vara stora.

Metadatafel baserade på felaktiga skannade datum gör forskning med hjälp av Google Books Project-databasen svår. Google har endast visat ett begränsat intresse för att åtgärda dessa fel.

Språkfrågor

Vissa europeiska politiker och intellektuella har kritiserat Googles ansträngningar på grund av språklig imperialism . De hävdar att eftersom den stora majoriteten av de böcker som föreslås ska skannas är på engelska, kommer det att resultera i en oproportionerlig representation av naturliga språk i den digitala världen. Tyska, ryska, franska och spanska, till exempel, är populära språk i stipendium. Den oproportionerliga online-betoningen på engelska kan dock forma tillgången till historiska stipendier, och i slutändan tillväxten och riktningen för framtida stipendier. Bland dessa kritiker finns Jean-Noël Jeanneney , tidigare president för Bibliothèque nationale de France .

Google Books kontra Google Scholar

Även om Google Books har digitaliserat ett stort antal tidigare nummer av tidskrifter, inkluderar dess skanningar inte de metadata som krävs för att identifiera specifika artiklar i specifika nummer. Detta har fått skaparna av Google Scholar att starta ett eget program för att digitalisera och vara värd för äldre tidskriftsartiklar (i överenskommelse med deras utgivare).

Bibliotekspartners

Google Books Library Project syftar till att skanna och göra sökbara samlingar på flera stora forskningsbibliotek . Tillsammans med bibliografisk information är textavsnitt från en bok ofta synliga. Om en bok saknar upphovsrätt och är allmän egendom är boken fullt tillgänglig att läsa eller ladda ner .

Upphovsrättsskyddade böcker som skannats genom biblioteksprojektet görs tillgängliga på Google Böcker för att se utdrag. När det gäller kvaliteten på skanningar, erkänner Google att de "inte alltid är av tillräckligt hög kvalitet" för att kunna erbjudas till försäljning på Google Play. På grund av förmodade tekniska begränsningar ersätter Google inte skanningar med versioner av högre kvalitet som kan tillhandahållas av utgivarna.

Projektet är föremål för stämningsansökan Authors Guild v. Google , inlämnad 2005 och avgjorde till Googles fördel 2013, och igen, efter överklagande, 2015.

Upphovsrättsägare kan göra anspråk på rättigheterna för en skannad bok och göra den tillgänglig för förhandsgranskning eller fullständig visning (genom att "överföra" den till sitt partnerprogramkonto), eller begära att Google hindrar boktexten från att sökas igenom.

Antalet institutioner som deltar i biblioteksprojektet har ökat sedan starten.

Inledande partners

Meddelande om projektet vid Michigan University Library
  • Harvard University , Harvard University Library
    Harvard University Library och Google genomförde ett pilotprojekt under hela 2005. Projektet fortsatte, med syftet att öka online-tillgången till Harvard University Library, som omfattar mer än 15,8 miljoner volymer. Även om fysisk tillgång till Harvards biblioteksmaterial i allmänhet är begränsad till nuvarande Harvard-studenter, fakulteter och forskare, eller till forskare som kan komma till Cambridge, har Harvard-Google-projektet utformats för att göra det möjligt för både medlemmar av Harvard-gemenskapen och användare överallt att upptäcka verk i Harvard-samlingen.
  • University of Michigan , University of Michigan Library
    I mars 2012 skannades 5,5 miljoner volymer.
  • New York Public Library
    I det här pilotprogrammet samarbetar NYPL med Google för att erbjuda en samling av sina böcker som är allmän egendom, som kommer att skannas i sin helhet och göras tillgängliga gratis för allmänheten online. Användare kommer att kunna söka och bläddra i hela texten i dessa verk. När skanningsprocessen är klar kan böckerna nås från både New York Public Librarys webbplats och från Googles sökmotor.
  • University of Oxford , Bodleian Library
  • Stanford University , Stanford University Libraries ( SULAIR )

Ytterligare partners

Andra institutionella partners har anslutit sig till projektet sedan partnerskapet först tillkännagavs:

Historia

2002 : En grupp teammedlemmar på Google lanserar officiellt projektet "hemliga "böcker". Googles grundare Sergey Brin och Larry Page kom på idén som senare blev Google Books medan de fortfarande tog examen vid Stanford 1996. Historiesidan på Google Books-webbplatsen beskriver deras första vision för detta projekt: "i en framtida värld där enorma samlingar av böcker digitaliseras, folk skulle använda en " webbsökare " för att indexera böckernas innehåll och analysera kopplingarna mellan dem, för att fastställa en given boks relevans och användbarhet genom att spåra antalet och kvaliteten på citat från andra böcker." Detta team besökte platserna för några av de större digitaliseringsinsatserna vid den tiden, inklusive Library of Congresss American Memory Project , Project Gutenberg och Universal Library för att ta reda på hur de fungerar, såväl som University of Michigan, Pages alma mater, och basen för sådana digitaliseringsprojekt som JSTOR och Making of America. I ett samtal med den dåvarande universitetspresidenten Mary Sue Coleman , när Page fick reda på att universitetets nuvarande uppskattning för att skanna alla bibliotekets volymer var 1 000 år, berättade Page för Coleman att han "tror att Google kan hjälpa till att få det att hända om sex. "

2003 : Teamet arbetar med att utveckla en höghastighetsskanningsprocess samt programvara för att lösa problem i udda typstorlekar, ovanliga teckensnitt och "andra oväntade egenheter."

December 2004 : Google signalerade en förlängning av sitt Google Print-initiativ som kallas Google Print Library Project. Google tillkännagav partnerskap med flera högprofilerade universitetsbibliotek och offentliga bibliotek, inklusive University of Michigan , Harvard ( Harvard University Library ), Stanford ( Green Library ), Oxford ( Bodleian Library ) och New York Public Library . Enligt pressmeddelanden och universitetsbibliotekarier planerade Google att digitalisera och tillgängliggöra cirka 15 miljoner volymer via sin Google Books-tjänst inom ett decennium. Tillkännagivandet utlöste snart kontroverser, eftersom förläggare och författarföreningar ifrågasatte Googles planer på att digitalisera, inte bara böcker i det offentliga området, utan även titlar som fortfarande är under upphovsrätt.

September–oktober 2005 : Två stämningar mot Google anklagar att företaget inte har respekterat upphovsrätten och har underlåtit att kompensera författare och utgivare på rätt sätt. Den ena är en grupptalan på uppdrag av författare (Authors Guild v. Google, 20 september 2005) och den andra är en civilrättslig process väckt av fem stora förlag och Association of American Publishers . (McGraw Hill v. Google, 19 oktober 2005)

November 2005 : Google ändrade namnet på denna tjänst från Google Print till Google boksökning. Dess program som gör det möjligt för förläggare och författare att inkludera sina böcker i tjänsten döptes om till Google Books Partner Program, och partnerskapet med bibliotek blev Google Books Library Project .

2006 : Google lade till en "ladda ned en pdf"-knapp till alla sina böcker som inte omfattas av upphovsrätten, som är offentliga. Det lade också till ett nytt webbläsargränssnitt tillsammans med nya "Om den här boken"-sidor.

Augusti 2006 : University of California System meddelade att de skulle gå med i Books digitaliseringsprojekt. Detta inkluderar en del av de 34 miljoner volymerna inom de cirka 100 bibliotek som hanteras av systemet.

September 2006 : Complutense University of Madrid blev det första spanskspråkiga biblioteket som gick med i Google Books Library Project.

Oktober 2006 : University of Wisconsin–Madison tillkännagav att de skulle gå med i digitaliseringsprojektet Book Search tillsammans med Wisconsin Historical Society Library. Tillsammans har biblioteken 7,2 miljoner innehav.

November 2006 : University of Virginia gick med i projektet. Dess bibliotek innehåller mer än fem miljoner volymer och mer än 17 miljoner manuskript, sällsynta böcker och arkiv.

Januari 2007 : University of Texas i Austin meddelade att de skulle gå med i digitaliseringsprojektet Book Search. Minst en miljon volymer skulle digitaliseras från universitetets 13 biblioteksorter.

Mars 2007 : Bayerska statsbiblioteket tillkännagav ett samarbete med Google för att skanna mer än en miljon verk som är offentliga och slutna i tryck på tyska samt engelska, franska, italienska, latin och spanska.

Maj 2007 : Ett partnerskap för bokdigitaliseringsprojekt tillkännagavs gemensamt av Google och Cantonal and University Library of Lausanne .

Maj 2007 : Boekentoren - biblioteket vid Ghent University tillkännagav att det skulle delta med Google i att digitalisera och göra digitaliserade versioner av 1800-talsböcker på franska och nederländska språk tillgängliga online.

Maj 2007: Mysore University meddelar att Google kommer att digitalisera över 800 000 böcker och manuskript – inklusive cirka 100 000 manuskript skrivna på sanskrit eller kannada på både papper och palmblad.

Juni 2007 : Kommittén för institutionellt samarbete (omdöpt till Big Ten Academic Alliance 2016) meddelade att dess tolv medlemsbibliotek skulle delta i att skanna 10 miljoner böcker under de kommande sex åren.

Juli 2007 : Keio University blev Googles första bibliotekspartner i Japan med tillkännagivandet att de skulle digitalisera minst 120 000 offentliga böcker.

Augusti 2007 : Google meddelade att de skulle digitalisera upp till 500 000 både upphovsrättsskyddade och offentliga föremål från Cornell University Library . Google skulle också tillhandahålla en digital kopia av alla verk som skannats för att införlivas i universitetets eget bibliotekssystem.

September 2007 : Google lade till en funktion som tillåter användare att dela utdrag av böcker som är offentliga. Utdragen kan visas exakt som de gör i skannade boken, eller som vanlig text.

September 2007 : Google lanserade en ny funktion som heter "Mitt bibliotek" som låter användare skapa personliga anpassade bibliotek, urval av böcker som de kan märka, recensera, betygsätta eller söka i fulltext.

December 2007 : Columbia University lades till som en partner i digitaliseringen av offentliga verk.

Maj 2008 : Microsoft minskade och planerade att avsluta sitt skanningsprojekt , som hade nått 750 000 böcker och 80 miljoner tidskriftsartiklar.

Oktober 2008 : En uppgörelse nåddes mellan förlagsbranschen och Google efter två års förhandlingar. Google gick med på att kompensera författare och förläggare i utbyte mot rätten att göra miljontals böcker tillgängliga för allmänheten.

Oktober 2008 : HathiTrust "Shared Digital Repository" (senare känt som HathiTrust Digital Library) lanseras gemensamt av Committee on Institutional Cooperation och de 11 universitetsbiblioteken i University of California-systemet, som alla var Googles partnerbibliotek, för att att arkivera och ge akademisk tillgång till böcker från deras samlingar som skannats av Google och andra.

November 2008 : Google nådde bokmärket på 7 miljoner för föremål som skannats av Google och deras förlagspartners. 1 miljon var i fullständigt förhandsgranskningsläge och 1 miljon var fullt synliga och nedladdningsbara verk i offentlig egendom. Omkring fem miljoner var slut .

December 2008 : Google tillkännagav införandet av tidskrifter i Google Böcker. Titlar inkluderar New York Magazine , Ebony och Popular Mechanics

Februari 2009 : Google lanserade en mobilversion av Google boksökning, som gör det möjligt för iPhone- och Android-telefonanvändare att läsa över 1,5 miljoner offentliga verk i USA (och över 500 000 utanför USA) med en mobil webbläsare. Istället för sidbilder visas bokens klartext.

Maj 2009 : Vid den årliga BookExpo- kongressen i New York signalerade Google sin avsikt att introducera ett program som skulle göra det möjligt för förlag att sälja digitala versioner av sina senaste böcker direkt till konsumenter via Google.

December 2009 : En fransk domstol stängde av genomsökningen av upphovsrättsskyddade böcker som publicerats i Frankrike och sa att detta bröt mot upphovsrättslagarna. Det var den första stora rättsliga förlusten för skanningsprojektet.

April 2010 : Bildkonstnärer ingick inte i den tidigare rättegången och förlikningen, är målsägandegrupperna i en annan rättegång och säger att de har för avsikt att granska mer än bara Google Böcker. "Den nya grupptalan", löd uttalandet, "går bortom Googles biblioteksprojekt och inkluderar Googles andra systematiska och genomgripande intrång i rättigheterna för fotografer, illustratörer och andra bildkonstnärer."

Maj 2010 : Det rapporterades att Google skulle lansera en digital bokhandel som heter Google Editions . Det skulle konkurrera med Amazon, Barnes & Noble, Apple och andra elektroniska bokhandlare med sin egen e-bokbutik. Till skillnad från andra skulle Google Editions vara helt online och inte kräva en specifik enhet (som Kindle, Nook eller iPad).

Juni 2010 : Google passerade 12 miljoner skannade böcker.

Augusti 2010 : Det tillkännagavs att Google har för avsikt att skanna alla kända befintliga 129 864 880 böcker inom ett decennium, vilket uppgår till över 4 miljarder digitala sidor och 2 biljoner ord totalt.

December 2010 : Google eBooks (Google Editions) lanserades i USA.

December 2010 : Google lanserade Ngram Viewer, som samlar in och ritar data om ordanvändning i sin boksamling.

Mars 2011 : En federal domare förkastade uppgörelsen mellan förlagsbranschen och Google.

Mars 2012 : Google passerade 20 miljoner skannade böcker.

Mars 2012 : Google nådde en uppgörelse med utgivare.

Januari 2013 : Dokumentären Google and the World Brain visades på Sundance Film Festival .

November 2013 : Dom i Authors Guild v. Google , USA:s distriktsdomare Denny Chin ställer sig på Googles sida med hänvisning till skälig användning. Författarna sa att de skulle överklaga.

Oktober 2015 : Överklagandedomstolen ställde sig på Googles sida och förklarade att Google inte bröt mot upphovsrättslagen. Enligt New York Times har Google skannat mer än 25 miljoner böcker.

April 2016 : USA:s högsta domstol avböjde att pröva Authors Guilds överklagande, vilket innebär att underdomstolens beslut stod fast, och Google skulle få skanna biblioteksböcker och visa utdrag i sökresultat utan att bryta mot lagen.

Status

Google har varit ganska hemlighetsfull när det gäller sina planer på framtiden för Google Books-projektet. Skanningsverksamheten hade saktat ner sedan åtminstone 2012, vilket bekräftades av bibliotekarierna vid flera av Googles partnerinstitutioner. Vid University of Wisconsin hade hastigheten minskat till mindre än hälften av vad den var 2006. Bibliotekarierna har dock sagt att den minskande takten kan vara ett naturligt resultat av att projektet mognat – till en början togs högar av böcker helt upp för skanning medan nu bara de titlar som inte redan hade skannats behövde beaktas. Företagets egen Google Books-tidslinjesida nämnde ingenting efter 2007 ens 2017, och Google Books-bloggen slogs samman med Google Search-bloggen 2012.

Trots att de vann den decennielånga rättstvisten 2017, har The Atlantic sagt att Google har "alla utom stängt av sin skanningsoperation." I april 2017 Wired att det bara fanns ett fåtal Google-anställda som arbetade med projektet och att nya böcker fortfarande skannades, men i en betydligt lägre takt. Den kommenterade att den decennielånga juridiska striden hade fått Google att förlora sin ambition.

Juridiska frågor

Genom projektet digitaliserades biblioteksböcker något urskillningslöst oavsett upphovsrättsstatus, vilket ledde till ett antal stämningar mot Google. I slutet av 2008 hade Google enligt uppgift digitaliserat över sju miljoner böcker, varav endast cirka en miljon verk i det offentliga området. Av resten var en miljon upphovsrättsskyddade och i tryck, och fem miljoner var upphovsrättsskyddade men ur tryck. 2005 väckte en grupp författare och förläggare en stor grupptalan mot Google för intrång i de upphovsrättsskyddade verken. Google hävdade att det bevarade "föräldralösa verk" – böcker som fortfarande är under upphovsrätt, men vars upphovsrättsinnehavare inte kunde hittas.

Authors Guild och Association of American Publishers stämde Google separat 2005 för dess bokprojekt, med hänvisning till "massivt upphovsrättsintrång ." Google motsatte sig att dess projekt representerade en rimlig användning och är den digitala tidsålderns motsvarighet till en kortkatalog med varje ord i publikationen indexerat. Rättegångarna konsoliderades och så småningom föreslogs en förlikning . Förlikningen fick betydande kritik på en mängd olika grunder, inklusive antitrust, integritet och otillräcklighet hos de föreslagna klasserna av författare och förläggare. Förlikningen avslogs så småningom, och utgivarna gjorde upp med Google kort därefter. Authors Guild fortsatte sitt fall och 2011 certifierades deras föreslagna klass . Google överklagade beslutet, med ett antal amici som hävdade att klassen var otillräcklig, och den andra kretsen avvisade klasscertifieringen i juli 2013 och återförvisade fallet till distriktsdomstolen för övervägande av Googles försvar för tillåten användning .

Under 2015 lämnade Authors Guild in ytterligare ett överklagande mot Google för att behandlas av den andra amerikanska appellationsdomstolen i New York. Google vann fallet enhälligt baserat på argumentet att de inte visade folk hela texten utan istället utdrag, och de tillåter inte människor att olagligt läsa boken. I en rapport uppgav domstolar att de inte gjorde intrång i upphovsrättslagar, eftersom de var skyddade enligt klausulen om tillåten användning.

Authors Guild försökte igen 2016 överklaga beslutet och tog denna gång deras fall till prövning i Högsta domstolen. Fallet avslogs, vilket lämnade andra kretsens beslut i fallet intakt, vilket innebar att Google inte bröt mot upphovsrättslagarna. Detta fall skapade också ett prejudikat för andra liknande fall när det gäller lagar om tillåten användning, eftersom det ytterligare förtydligade lagen och utökade den. Sådant förtydligande påverkar andra skanningsprojekt som liknar Google.

Andra rättegångar följde författargillets ledning. 2006 drogs en tysk stämningsansökan, som tidigare lämnats in, tillbaka. I juni 2006 meddelade Hervé de la Martinière, en fransk förläggare känd som La Martinière och Éditions du Seuil , sin avsikt att stämma Google France. År 2009 tilldömde Paris Civil Court 300 000 EUR (cirka 430 000 USD ) i skadestånd och ränta och ålade Google att betala 10 000 EUR om dagen tills det tar bort förlagets böcker från sin databas. Domstolen skrev, "Google brutit mot författarens upphovsrättslagar genom att fullständigt reproducera och göra tillgängliga" böcker som Seuil äger utan dess tillåtelse och att Google "begick brott mot upphovsrätten, vilket är till skada för utgivarna". Google sa att det kommer att överklaga. Syndicat National de l'Edition, som gick med i rättegången, sa att Google har skannat cirka 100 000 franska verk under upphovsrätt.

I december 2009 lämnade den kinesiska författaren Mian Mian in en civilrättslig stämningsansökan på $8 900 mot Google för att ha skannat hennes roman, Acid Lovers . Detta är den första stämningsansökan som har lämnats in mot Google i Kina. I november samma år anklagade China Written Works Copyright Society (CWWCS) Google för att skanna 18 000 böcker av 570 kinesiska författare utan tillstånd. Google gick den 20 november med på att tillhandahålla en lista över kinesiska böcker som de hade skannat, men företaget vägrade att erkänna att de "bröt mot" upphovsrättslagar. [ opålitlig källa? ]

I mars 2007 anklagade Thomas Rubin, biträdande chefsjurist för upphovsrätt, varumärken och affärshemligheter på Microsoft, Google för att ha brutit mot upphovsrättslagen med deras boksökningstjänst. Rubin kritiserade specifikt Googles policy att fritt kopiera alla verk tills upphovsrättsinnehavaren uppmanas att sluta.

Googles licensiering av verk som är allmän egendom är också ett problem på grund av användningen av digitala vattenmärkningstekniker med böckerna. Vissa publicerade verk som är offentliga, såsom alla verk skapade av den amerikanska federala regeringen , behandlas fortfarande som andra verk under upphovsrätt och är därför låsta efter 1922.

Liknande projekt

  • Project Gutenberg är en volontärinsats för att digitalisera och arkivera kulturverk, för att "uppmuntra skapande och distribution av e-böcker". Det grundades 1971 av Michael S. Hart och är det äldsta digitala biblioteket. Den 3 oktober 2015 nådde Project Gutenberg 50 000 föremål i sin samling.
  • Internet Archive är en ideell organisation som digitaliserar över 1000 böcker om dagen, samt speglar böcker från Google Books och andra källor. I maj 2011 var den värd för över 2,8 miljoner böcker som är allmän egendom, mer än de ungefärliga 1 miljon böcker som är allmän egendom på Google Böcker. Open Library , ett systerprojekt till Internet Archive, lånar ut 80 000 skannade och köpta kommersiella e-böcker till besökarna på 150 bibliotek.
  • HathiTrust upprätthåller HathiTrust Digital Library sedan 13 oktober 2008, som bevarar och ger tillgång till material som skannats av Google, några av Internet Archive-böckerna och vissa skannats lokalt av partnerinstitutioner. Från och med maj 2010 omfattar den cirka 6 miljoner volymer, varav över 1 miljon är offentliga (åtminstone i USA).
  • ACLS Humanities E-Book , en onlinesamling med över 5 400 böcker av hög kvalitet inom humaniora och relaterade samhällsvetenskaper, tillgänglig genom institutionell prenumeration.
  • Microsoft finansierade genomsökningen av 300 000 böcker för att skapa Live Search Books i slutet av 2006. Det pågick till maj 2008, då projektet övergavs och böckerna gjordes fritt tillgängliga på Internet Archive.
  • National Digital Library of India (NDLI) är ett projekt under Ministry of Human Resource Development, Indien. Målet är att integrera flera nationella och internationella digitala bibliotek i en enda webbportal. NDLI ger kostnadsfri tillgång till många böcker på engelska och indiska språk.
  • Europeana länkar till ungefär 10 miljoner digitala objekt från och med 2010, inklusive video, foton, målningar, ljud, kartor, manuskript, tryckta böcker och tidningar från de senaste 2 000 åren av europeisk historia från över 1 000 arkiv i Europeiska unionen.
  • Gallica från det franska nationalbiblioteket länkar till cirka 4 000 000 digitaliserade böcker, tidningar, manuskript, kartor och ritningar etc. Det digitala biblioteket skapades 1997 och fortsätter att expandera med en takt på cirka 5 000 nya dokument per månad. Sedan slutet av 2008 finns de flesta av de nya skannade dokumenten tillgängliga i bild- och textformat. De flesta av dessa dokument är skrivna på franska.
  • Wikikälla
  • Runivers

Se även

Vidare läsning

  •   Hoffmann, Anna Lauren (2016). "Google Books, Libraries, and Self-Respect: Information Justice beyond Distributions". Library Quarterly . 86 : 76–92. doi : 10.1086/684141 . S2CID 146482065 .
  • Jeanneney, Jean-Noël (2008). Google and the Myth of Universal Knowledge: A View from Europe . Chicago, IL: University of Chicago Press.

externa länkar