OPeNDAP

OPeNDAP är en akronym för " Open-source Project for a Network Data Access Protocol ", en strävan fokuserad på att förbättra hämtningen av avlägsna, strukturerad data genom en webbaserad arkitektur och ett disciplinneutralt Data Access Protocol (DAP). Protokollet används ofta, särskilt inom geovetenskap , och är lagrat på HTTP och dess nuvarande specifikation är DAP4, även om den tidigare DAP2-versionen fortfarande används i stor utsträckning. Utvecklad och avancerad (öppet och i samarbete) av den ideella OPeNDAP, Inc., är DAP avsedd att möjliggöra fjärr, selektiv datahämtning som en lättanropad webbtjänst. OPeNDAP, Inc. utvecklar och underhåller även nollkostnadsimplementeringar (referens) av DAP-protokollet i mjukvara på både serversidan och klientsidan.

"OPeNDAP" används ofta i stället för "DAP" för att beteckna protokollet men kan också referera till en hel DAP-baserad datahämtningsarkitektur. Andra DAP-centrerade arkitekturer, såsom THREDDS och ERDDAP, NOAA GEO-IDE UAF ERDDAP uppvisar betydande interoperabilitet med varandra såväl som med system som använder OPeNDAPs egna (öppen källkod) servrar och mjukvara.

En DAP-klient kan vara en vanlig webbläsare eller till och med ett kalkylblad, dock med begränsad funktionalitet (se OPeNDAPs webbsida om tillgänglig klientprogramvara ). Mer typiskt är DAP-klienter:

  • Dataanalys- eller datavisualiseringsverktyg (som MATLAB , IDL , Panoply , GrADS , Integrated Data Viewer , Ferret och ncBrowse) som deras författare har anpassat för att möjliggöra DAP-baserad datainmatning;
  • Liknande anpassade webbapplikationer (som Dapper Data Viewer, aka DChart)
  • Liknande anpassade slutanvändarprogram (på vanliga språk)

Oavsett deras typ, och om de utvecklas kommersiellt eller av en slutanvändare, länkar klienter nästan universellt till DAP-servrar genom bibliotek som implementerar DAP2- eller DAP4-protokollet på ett eller annat språk. OPeNDAP erbjuder bibliotek med öppen källkod i C++ och Java , men många klienter förlitar sig på gemenskapsutvecklade bibliotek som PyDAP eller, särskilt, NetCDF- sviten. Utvecklade och underhållna av Unidata-programmet vid UCAR i flera programmeringsspråk, alla NetCDF- bibliotek inkluderar inbäddade funktioner för att hämta (array-stil) data från DAP-servrar.

En dataanvändande klient refererar till en datauppsättning genom sin URL och begär metadata eller innehåll genom att utfärda (vanligtvis genom ett inbäddat DAP-bibliotek) en HTTP-begäran till en DAP-server. Innehållsförfrågningar föregås vanligtvis av förfrågningar om metadata som beskriver strukturen och andra detaljer om den refererade datamängden. Med denna information kan klienten konstruera DAP-begränsningsuttryck för att hämta specifikt innehåll (dvs. delmängder) från källan. OPeNDAP-servrar erbjuder olika typer av svar, beroende på den specifika formen av klientens begäran, inklusive XML, JSON, HTML och ASCII. Som svar på förfrågningar om innehåll kan OPeNDAP-servrar svara med flerdelade mime-dokument som inkluderar en binär del med NetCDF eller DAP-native-kodning. (Dessa binära former erbjuder kompakta sätt att leverera stora volymer innehåll, och den DAP-native formen kan till och med streamas om så önskas.)

OPeNDAPs mjukvara för att bygga DAP-servrar (ovanpå Apache ) kallas Hyrax och inkluderar adaptrar som underlättar servering av en mängd olika källdata. DAP-servrar möjliggör oftast (fjärr)åtkomst till (stora) HDF- eller NetCDF-filer, men källdata kan finnas i databaser eller andra format, inklusive användardefinierade. När källdata är organiserade som filer möjliggör DAP-hämtningar, via underinställning , finare åtkomst än vad FTP gör . Dessutom kan OPeNDAP-servrar aggregera delmängder från flera filer för leverans i en enda hämtning. Sammantaget kan subsetting, aggregering och streaming ge betydande dataåtkomsteffektivitet, även i närvaro av långsamma nätverk.

OPeNDAP och andra DAP-servrar används operativt i statliga myndigheter, inklusive NASA och NOAA , för att ge tillgång till geovetenskapliga data, inklusive satellitbilder och andra informationskällor med stora volymer. DAP-datamodellen omfattar en omfattande uppsättning datastrukturer, inklusive flerdimensionella arrayer och kapslade sekvenser (dvs. poster), kompletterade med en motsvarande rik uppsättning begränsningsuttryck. Därför har OPeNDAP-arkitekturen för datahämtning visat användbarhet över ett brett spektrum av vetenskapliga datatyper, inklusive data som genereras via simuleringar och data som genererats via observationer (oavsett om det är fjärravkänd eller mätt in situ).

externa länkar