Astrofysik datasystem

SAO/NASA Astrophysics Data System
Ads logo full light background.svg
Producent Smithsonian Astrophysical Observatory för National Aeronautics and Space Administration ( USA)
Historia 1992 till idag
Tillgång
Kosta Fri
Rapportering
Discipliner Astronomi och fysik
Rekorddjup Index & abstrakt & fulltext
Geospatial täckning Över hela världen
Länkar
Hemsida www .adsabs .harvard .edu

SAO /NASA Astrophysics Data System ( ADS ) är en onlinedatabas med över 16 miljoner astronomi- och fysikartiklar från både referentgranskade och icke-refererande granskade källor. Sammanfattningar finns tillgängliga gratis online för nästan alla artiklar, och fullständiga skannade artiklar finns tillgängliga i Graphics Interchange Format (GIF) och Portable Document Format (PDF) för äldre artiklar. Det utvecklades av National Aeronautics and Space Administration (NASA) och förvaltas av Smithsonian Astrophysical Observatory .

ADS är ett kraftfullt forskningsverktyg och har haft en betydande inverkan på effektiviteten av astronomisk forskning sedan den lanserades 1992. Litteratursökningar som tidigare skulle ha tagit dagar eller veckor kan nu utföras på några sekunder via ADS-sökmotorn, som är specialbyggd för astronomiska behov. Studier har funnit att fördelen för astronomin av ADS motsvarar flera hundra miljoner US-dollar årligen, och systemet beräknas ha tredubblat läsekretsen av astronomiska tidskrifter.

Användning av ADS är nästan universell bland astronomer över hela världen, och därför kan ADS-användningsstatistik användas för att analysera globala trender inom astronomisk forskning. Dessa studier har visat att mängden forskning en astronom bedriver är relaterad till bruttonationalprodukten per capita ( BNP ) i det land där han/hon är baserad, och att antalet astronomer i ett land är proportionellt mot BNP. av det landet, så den totala mängden forskning som görs i ett land är proportionell mot kvadraten på dess BNP dividerat med dess befolkning.

Historia

Under många år var ett växande problem inom astronomisk forskning (som i andra akademiska discipliner) att antalet artiklar publicerade i de stora astronomiska tidskrifterna ökade stadigt, vilket innebar att astronomerna kunde läsa allt mindre av de senaste forskningsrönen. Under 1980-talet såg astronomer att den begynnande teknologin som låg till grund för Internet så småningom kunde användas för att bygga ett elektroniskt indexeringssystem av astronomiska forskningsdokument som skulle göra det möjligt för astronomer att hålla sig à jour med ett mycket större utbud av forskning.

Det första förslaget på en databas med sammanfattningar av tidskrifter gjordes vid en konferens om astronomi från stora databaser i Garching bei München 1987. Den första utvecklingen av ett elektroniskt system för åtkomst av astrofysiska sammanfattningar ägde rum under de följande två åren; 1991 ägde diskussioner rum om hur man integrerade ADS med SIMBAD -databasen, som innehåller alla tillgängliga katalogbeteckningar för objekt utanför solsystemet, för att skapa ett system där astronomer kunde söka efter alla papper som skrivits om ett givet objekt.

En första version av ADS, med en databas bestående av 40 artiklar, skapades som ett proof of concept 1988, och ADS-databasen kopplades framgångsrikt ihop med SIMBAD-databasen sommaren 1993. Skaparna trodde att detta var den första användningen av Internet för att möjliggöra samtidig sökning av transatlantiska vetenskapliga databaser. Fram till 1994 var tjänsten tillgänglig via proprietär nätverksprogramvara, men den överfördes till den begynnande World Wide Web tidigt samma år. Antalet användare av tjänsten fyrdubblades under de fem veckorna efter introduktionen av den webbaserade tjänsten ADS.

Till en början var tidskriftsartiklarna som var tillgängliga via ADS skannade bitmappar skapade från papperstidskrifterna, men från 1995 och framåt började Astrophysical Journal publicera en onlineupplaga, snart följt av de andra huvudtidskrifterna som Astronomy and Astrophysics and the Monthly Meddelanden från Royal Astronomical Society . ADS gav länkar till dessa elektroniska utgåvor från deras första framträdande. Sedan cirka 1995 har antalet ADS-användare fördubblats ungefär vartannat år. ADS har nu avtal med nästan alla astronomiska tidskrifter, som levererar abstracts. Skannade artiklar från så långt tillbaka som i början av 1800-talet finns tillgängliga via tjänsten som nu innehåller över åtta miljoner dokument. Tjänsten distribueras över hela världen, med tolv speglingsplatser i tolv länder på fem kontinenter, med databasen synkroniserad med hjälp av veckouppdateringar med hjälp av rsync , ett speglingsverktyg som tillåter uppdateringar till endast de delar av databasen som har ändrats. Alla uppdateringar triggas centralt, men de initierar skript på spegelsidorna som "drar" uppdaterad data från ADS-huvudservrarna.

Data i systemet

1284 tidningar om M101 är tillgängliga via ADS, från så länge sedan som 1850.

Artiklar indexeras i databasen efter deras bibliografiska register, som innehåller information om tidskriften de publicerades i och olika tillhörande metadata , såsom författarlistor, referenser och citat . Ursprungligen lagrades dessa data i ASCII- format, men så småningom uppmuntrade begränsningarna av detta databasunderhållarna att migrera alla poster till ett XML- format (Extensible Markup Language) år 2000. Bibliografiska poster lagras nu som ett XML-element, med underelement för olika metadata.

Sedan tillkomsten av onlineupplagor av tidskrifter laddas sammandrag in i ADS på eller före publiceringsdatumet för artiklarna, med hela tidskriftstexten tillgänglig för prenumeranter. Äldre artiklar har skannats och ett sammandrag skapas med programvara för optisk teckenigenkänning . Skannade artiklar från före ca 1995 finns vanligtvis gratis, efter överenskommelse med tidskriftsförlagen.

Skannade artiklar lagras i TIFF- format, i både medium och hög upplösning . TIFF-filerna konverteras på begäran till GIF-filer för visning på skärmen och PDF- eller PostScript -filer för utskrift. De genererade filerna cachelagras sedan för att eliminera onödigt frekventa regenereringar för populära artiklar. Från och med 2000 innehöll ADS 250 GB skanningar, som bestod av 1 128 955 artikelsidor omfattande 138 789 artiklar. År 2005 hade detta vuxit till 650 GB, och förväntas växa ytterligare, till cirka 900 GB år 2007. Ingen ytterligare information har publicerats.

Databasen innehöll till en början bara astronomiska referenser, men har nu vuxit till att inkludera tre databaser, som täcker astronomi (inklusive planetvetenskap och solfysik) referenser, fysik (inklusive instrumentation och geovetenskap) referenser, såväl som förtryck av vetenskapliga artiklar från arXiv . Astronomidatabasen är den överlägset mest avancerade och dess användning står för cirka 85 % av den totala ADS-användningen. Artiklar tilldelas de olika databaserna efter ämne snarare än tidskrift de publiceras i, så att artiklar från en tidskrift kan förekomma i alla tre ämnesdatabaserna. Separationen av databaserna gör att sökningen inom varje disciplin kan skräddarsys, så att ord automatiskt kan ges olika viktfunktioner i olika databassökningar, beroende på hur vanliga de är inom det aktuella fältet.

Data i förtrycksarkivet uppdateras dagligen från arXiv , huvudarkivet för fysik och astronomiförtryck. Tillkomsten av preprint-servrar har, liksom ADS, haft en betydande inverkan på takten inom astronomisk forskning, eftersom papper ofta görs tillgängliga från preprint-servrar veckor eller månader innan de publiceras i tidskrifterna. Inkorporeringen av preprints från arXiv i ADS innebär att sökmotorn kan returnera den senaste forskningen som finns tillgänglig, med reservationen att preprints kanske inte har granskats eller korrekturlästs till den standard som krävs för publicering i huvudtidskrifterna. ADS:s databas länkar förtryck med efterföljande publicerade artiklar där det är möjligt, så att citat- och referenssökningar kommer att returnera länkar till tidskriftsartikeln där förtrycket citerades.

Mjukvara och hårdvara

Mjukvaran körs på ett system som är skrivet speciellt för det, vilket möjliggör omfattande anpassning för astronomiska behov som inte skulle ha varit möjligt med databasprogramvara för allmänna ändamål . Skripten är designade för att vara så plattformsoberoende som möjligt, med tanke på behovet av att underlätta spegling på olika system runt om i världen, även om den växande användningen av Linux som valfritt operativsystem inom astronomi har lett till ökad optimering av skripten för installation på den plattformen.

Den huvudsakliga ADS-servern finns vid Center for Astrophysics | Harvard & Smithsonian i Cambridge, Massachusetts , och är en dubbel 64-bitars X86 Intel- server med två fyrkärniga 3,0 GHz - processorer och 32 GB RAM , som kör CentOS 5.4 Linux - distributionen. Speglar finns i Brasilien, Kina, Chile, Frankrike, Tyskland, Indien, Indonesien, Japan, Ryssland, Sydkorea, Storbritannien och Ukraina.

Indexering

ADS får för närvarande sammanfattningar eller innehållsförteckningar från nästan tvåhundra tidskriftskällor. Tjänsten kan ta emot data som hänvisar till samma artikel från flera källor och skapar en bibliografisk referens baserat på de mest korrekta uppgifterna från varje källa. Den vanliga användningen av TeX och LaTeX av nästan alla vetenskapliga tidskrifter underlättar i hög grad införlivandet av bibliografiska data i systemet i ett standardiserat format, och att importera HTML -kodade webbaserade artiklar är också enkelt. ADS använder Python- och Perl -skript för att importera, bearbeta och standardisera bibliografiska data.

Den till synes vardagliga uppgiften att konvertera författarnamn till ett standardformat för efternamn , initialt är faktiskt en av de svårare att automatisera, på grund av det stora utbudet av namnkonventioner runt om i världen och möjligheten att ett förnamn som Davis kan vara ett första namn , mellannamn eller efternamn. Den korrekta omvandlingen av namn kräver en detaljerad kunskap om namnen på författare som är verksamma inom astronomi, och ADS har en omfattande databas med författarnamn, som också används för att söka i databasen (se nedan).

För elektroniska artiklar är en lista med referenser som ges i slutet av artikeln lätt att extrahera. För skannade artiklar bygger referensextraktion på OCR. Referensdatabasen kan sedan "inverteras" för att lista citaten för varje artikel i databasen. Citeringslistor har använts tidigare för att identifiera populära artiklar som saknas i databasen; mestadels var dessa från före 1975 och har nu lagts till i systemet.

Rapportering

Databasen innehåller nu över åtta miljoner artiklar. När det gäller de stora tidskrifterna för astronomi ( Astrophysical Journal , Astronomical Journal , Astronomy and Astrophysics , Publications of the Astronomical Society of the Pacific och Monthly Notices of the Royal Astronomical Society ) är täckningen komplett, med alla nummer indexerade från nummer 1 till nutid. Dessa tidskrifter står för ungefär två tredjedelar av artiklarna i databasen, medan resten består av artiklar publicerade i över 100 andra tidskrifter från hela världen, samt i konferenshandlingar.

Även om databasen innehåller det fullständiga innehållet i alla större tidskrifter och många mindre tidskrifter, är dess täckning av referenser och citat mycket mindre komplett. Referenser i och citeringar av artiklar i de stora tidskrifterna är ganska kompletta, men referenser som "privat kommunikation", "i press" eller "in preparation" kan inte matchas, och författarfel i referenslistor introducerar också potentiella fel. Astronomiska artiklar kan citera och citeras av artiklar i tidskrifter som faller utanför räckvidden för ADS, såsom kemi- , matematik- eller biologitidskrifter .

Sökmotor

Ett exempel på en komplex sökning som kombinerar objekt, titel och abstrakta frågor med ett datumfilter

Sedan starten har ADS utvecklat en mycket komplex sökmotor för att söka i abstrakt- och objektdatabaserna. Sökmotorn är skräddarsydd för att söka efter astronomiska sammanfattningar, och motorn och dess användargränssnitt förutsätter att användaren är väl insatt i astronomi och kan tolka sökresultat som är designade för att returnera mer än bara de mest relevanta artiklarna. Databasen kan efterfrågas för författares namn, astronomiska objekts namn, titelord och ord i den abstrakta texten, och resultaten kan filtreras enligt ett antal kriterier. Det fungerar genom att först samla synonymer och förenkla söktermer enligt beskrivningen ovan, och sedan generera en "inverterad fil", som är en lista över alla dokument som matchar varje sökterm. Den användarvalda logiken och filtren tillämpas sedan på denna inverterade lista för att generera de slutliga sökresultaten.

Frågor om författarens namn

Systemet indexerar författarnamn efter efternamn och initialer och tar hänsyn till möjliga variationer i stavning av namn med hjälp av en lista med varianter. Detta är vanligt när det gäller namn inklusive accenter som omljud och translitterationer från arabisk eller kyrillisk skrift . Ett exempel på en post i författarens synonymlista är:

AFANASJEV, V
AFANAS'EV, V
AFANAS'IEV, V
AFANASEV, V
AFANASYEV, V
AFANS'IEV, V
AFANSEV, V

Objektnamnsökningar

Möjligheten att söka efter papper om specifika astronomiska objekt är ett av ADS:s mest kraftfulla verktyg. Systemet använder data från SIMBAD , NASA/IPAC Extragalactic Database , International Astronomical Union Circulars och Lunar and Planetary Institute för att identifiera papper som hänvisar till ett visst objekt, och kan även söka efter objektposition, lista papper som rör objekt inom en 10 bågminuters radie av en given höger uppstigning och deklination . Dessa databaser kombinerar de många katalogbeteckningarna ett objekt kan ha, så att en sökning efter Plejaderna också kommer att hitta tidningar som listar det berömda öppna klustret i Oxen under någon av dess andra katalogbeteckningar eller populära namn, såsom M45, de sju systrarna eller Melotte 22.

Titel och abstrakta sökningar

Sökmotorn filtrerar först söktermer på flera sätt. Ett M följt av ett mellanslag eller bindestreck tar bort mellanslag eller bindestreck, så att sökningen efter Messier- katalogobjekt förenklas och en användarinmatning av M45, M 45 eller M-45 resulterar i att samma fråga exekveras; på liknande sätt NGC- beteckningar och vanliga söktermer som Shoemaker Levy och T Tauri avskalade från utrymmen. Oviktiga ord som AT, OR och TO tas bort, även om fallkänslighet i vissa fall bibehålls, så att medan a nd ignoreras, A nd konverteras till " Andromedae " och H er konverteras till " Herculis ", men hon ignoreras.

Synonymersättning

När söktermerna har förbehandlats, efterfrågas databasen med den reviderade söktermen, samt synonymer till den. Förutom enkel synonymersättning som att söka efter både plural- och singularformer , söker ADS också efter ett stort antal specifikt astronomiska synonymer. Till exempel spektrograf och spektroskop i princip samma betydelse, och i ett astronomiskt sammanhang är metallicitet och överflöd också synonyma. ADS synonymlista skapades manuellt, genom att gruppera listan med ord i databasen enligt liknande betydelser.

Förutom engelska synonymer söker ADS även efter engelska översättningar av utländska söktermer och vice versa, så att en sökning på det franska ordet soleil hämtar referenser till Sun , och artiklar på andra språk än engelska kan returneras av engelska söktermer.

Synonymersättning kan inaktiveras vid behov, så att en sällsynt term som är en synonym till en mycket vanligare term (som " datumlinje " snarare än " datum ") kan sökas specifikt efter.

Urvalslogik

Sökmotorn tillåter urvalslogik både inom fält och mellan fält. Söktermer i varje fält kan kombineras med OR, AND, enkel logik eller boolesk logik , och användaren kan ange vilka fält som ska matchas i sökresultaten. Detta gör att komplexa sökningar kan byggas; till exempel kan användaren söka efter papper som rör NGC 6543 ELLER NGC 7009 , där papperstitlarna innehåller (radie ELLER hastighet) OCH INTE (överflöd ELLER temperatur).

Resultatfiltrering

Sökresultat kan filtreras enligt ett antal kriterier, inklusive att ange ett intervall av år som "1945 till 1975", "2000 till idag" eller "före 1900", och vilken typ av tidskrift artikeln visas i - icke - peer reviewed artiklar som konferenshandlingar kan uteslutas eller specifikt sökas efter, eller specifika tidskrifter kan inkluderas i eller exkluderas från sökningen.

Sökresultat

Sökresultatsida från ADS – A, F, G, C, R etc. är länkar till tillhörande data för varje sammanfattning såsom fulltextartikel, citat, läs också uppsatser och så vidare.

Även om det var tänkt som ett sätt att komma åt abstracts och artiklar, tillhandahåller ADS en betydande mängd kompletterande information tillsammans med sökresultat. För varje returnerat sammandrag tillhandahålls länkar till andra artiklar i databasen som det refereras till och som citerar skriften, och en länk till ett förtryck, där det finns. Systemet genererar också en länk till "läs också" artiklar – det vill säga de som har blivit vanligast tillgängliga för dem som läser artikeln. På detta sätt kan en ADS-användare avgöra vilka tidningar som är mest intressanta för astronomer som är intresserade av ämnet för en viss uppsats.

Länkar till objektnamndatabaserna SIMBAD och/eller NASA Extragalactic Database returneras också, via vilka en användare snabbt kan ta reda på grundläggande observationsdata om objekten som analyserats i ett dokument och hitta ytterligare artiklar om dessa objekt.

Inverkan på astronomi

ADS används nästan universellt som ett forskningsverktyg bland astronomer, och det finns flera studier som har uppskattat kvantitativt hur mycket effektivare ADS har gjort astronomi; en uppskattade att ADS ökade effektiviteten av astronomisk forskning med 333 heltidsekvivalenter forskningsår per år, och en annan fann att dess effekt 2002 motsvarade 736 heltidsforskare, eller all astronomisk forskning som gjordes i Frankrike. ADS har tillåtit litteratursökningar som tidigare skulle ha tagit dagar eller veckor att genomföra att genomföras på några sekunder, och det uppskattas att ADS har ökat läsekretsen och användningen av den astronomiska litteraturen med en faktor på cirka tre sedan starten.

I monetära termer utgör denna effektivitetsökning en avsevärd summa. Det finns cirka 12 000 aktiva astronomiska forskare över hela världen, så ADS motsvarar cirka 5 % av astronomernas arbetande befolkning. Den globala astronomiska forskningsbudgeten uppskattas till mellan 4 000 och 5 000 miljoner USD, så värdet av ADS för astronomi skulle vara cirka 200–250 miljoner USD årligen. Dess driftsbudget är en liten bråkdel av detta belopp.

Den stora betydelsen av ADS för astronomer har erkänts av Förenta Nationerna , vars generalförsamling har berömt ADS för dess arbete och framgång, och särskilt noterat dess betydelse för astronomer i utvecklingsländerna, i rapporter från FN:s kommitté för fredliga Användning av yttre rymden . En rapport från 2002 från en besökande kommitté till Center for Astrophysics sade samtidigt att tjänsten hade "revolutionerat användningen av den astronomiska litteraturen", och att den förmodligen var det mest värdefulla enskilda bidraget till astronomiforskningen som CfA har gjort under sin livstid ".

Sociologiska studier med användning av ADS

Eftersom det används nästan universellt av astronomer kan ADS avslöja mycket om hur astronomisk forskning är fördelad över världen. De flesta användare kommer åt systemet från högskolor, vars IP-adress enkelt kan användas för att fastställa användarens geografiska plats. Studier visar att de högsta per capita-användarna av ADS är Frankrike och Nederländerna-baserade astronomer, och medan mer utvecklade länder (mätt med BNP per capita ) använder systemet mer än mindre utvecklade länder; sambandet mellan BNP per capita och ADS-användning är inte linjärt. Omfattningen av ADS-användning per capita överstiger vida intervallet för BNP per capita, och grundforskning som utförs i ett land, mätt med ADS-användning, har visat sig vara proportionell mot kvadraten på landets BNP dividerat med dess befolkning.

ADS-användningsstatistik tyder också på att astronomer i mer utvecklade länder tenderar att vara mer produktiva än de i mindre utvecklade länder. Mängden grundforskning som utförs är proportionell mot antalet astronomer i ett land multiplicerat med BNP per capita. Statistik antyder också att astronomer i europeiska kulturer bedriver ungefär tre gånger så mycket forskning som astronomer i asiatiska kulturer , vilket kanske tyder på kulturella skillnader i vikten av astronomisk forskning.

ADS har också använts för att visa att andelen astronomiartiklar med en författare har minskat avsevärt sedan 1975 och att astronomiska artiklar med mer än 50 författare har blivit vanligare sedan 1990.

Se även

externa länkar