Klimat- och prognosmetadatakonventioner

Climate and Forecast (CF) -metadatakonventionerna är konventioner för beskrivning av geovetenskapliga data, avsedda att främja bearbetning och delning av datafiler . Metadata som definieras av CF-konventionerna ingår i allmänhet i samma fil som data, vilket gör filen "självbeskrivande". Konventionerna ger en definitiv beskrivning av vad datavärdena som finns i varje netCDF- variabel representerar, och av datas rumsliga och tidsmässiga egenskaper, inklusive information om rutnät, såsom rutnätscellgränser och metoder för medelvärdesberäkning av celler. Detta gör det möjligt för användare av filer från olika källor att bestämma vilka variabler som är jämförbara, och är en grund för att bygga mjukvaruapplikationer med kraftfull dataextraktion , rutnätsombildning, dataanalys och datavisualisering .

Historia och evolution

CF-konventionerna infördes 2003, efter flera års utveckling genom ett samarbete som inkluderade personal från amerikanska och europeiska klimat- och väderlaboratorier. Konventionerna innehöll generaliseringar och tillägg till de tidigare Cooperative Ocean/Atmosphere Research Data Service (COARDS) konventionerna och Gregory/Drach/Tett (GDT) konventionerna. När omfattningen av CF-konventionerna växte tillsammans med dess användarbas, antog CF-gemenskapen en öppen förvaltningsmodell . I december 2008 antogs trion av standarder, netCDF+CF+ OPeNDAP , av IOOS som en rekommenderad standard (nummer 08-012) för representation och transport av rutnätsdata. CF-konventionerna betraktas av NASA Standards Process Group (SPG) och andra som mer allmänt tillämpliga standarder.

Applikationer och användarbas

CF-konventionerna har antagits av en mängd olika nationella och internationella program och aktiviteter inom geovetenskap. Till exempel krävdes de för utdata från klimatmodellen som samlats in för interjämförande projekt med kopplade modeller , som används i stor utsträckning för utvärderingsrapporter från den mellanstatliga panelen för klimatförändringar . De främjas som en viktig del av samordningen av forskarsamhället av World Climate Research Program . De används också som en teknisk grund för ett antal mjukvarupaket och datasystem, inklusive Climate Model Output Rewriter (CMOR), som är efterbehandlingsprogram för klimatmodelldata, och Earth System Grid, som distribuerar klimat- och annan data . CF-konventionerna har också använts för att beskriva de fysiska fälten som överförs mellan individuella programvarukomponenter för jordsystemmodeller, såsom atmosfär- och havkomponenter, när modellen körs.

Datatyper som stöds

CF är avsedd för användning med tillståndsuppskattningar och prognosdata , i atmosfären, havet och andra fysiska domäner. Den designades i första hand för att adressera rutnätsdatatyper som numeriska väderprognosmodeller och klimatologiska data där databinning används för att införa en vanlig struktur. Men CF-konventionerna är också tillämpliga på många klasser av observationsdata och har antagits av ett antal grupper för sådana tillämpningar.

Dataformat som stöds

CF har sitt ursprung som en standard för data skriven i netCDF , men dess struktur är generell och den har anpassats för användning med andra dataformat. Till exempel har användningen av CF-konventionerna med i hierarkiskt dataformat undersökts.

Designprinciper

Flera principer styr utvecklingen av CF-konventioner:

  • Data bör vara självbeskrivande, utan externa tabeller som behövs för tolkning.
  • Konventioner bör utvecklas endast efter behov, snarare än att förutse eventuella behov.
  • Konventioner bör inte vara betungande att använda för vare sig dataskrivare eller dataläsare.
  • Metadata ska vara läsbara av människor såväl som tolkbara av program.
  • Redundans bör undvikas för att förhindra inkonsekvenser vid skrivning av data.

Specifika CF-metadatadeskriptorer använder värden för attribut för att representera

  • Datahärkomst : titel , institution , kontakt , källa (t.ex. modell), historik (revisionsspår av operationer), referenser , kommentar
  • Beskrivning av tillhörande aktivitet: projekt , experiment
  • Beskrivning av data: units , standard_name , long_name , auxiliary_variables , missing_value , valid_range , flag_values ​​, flag_meanings
  • Beskrivning av koordinater: koordinater , gränser , grid_mapping (med formula_terms ) ; tid specificerad med referens_tid ("tid sedan T0") och kalenderattribut .
  • Betydelsen av rutnätsceller: cell_methods , cell_measures , och klimatologisk statistik.

En central del av CF-konventionerna är CF Standard Name Table. CF-standardnamntabellen associerar unikt ett standardnamn med varje geofysisk parameter i en datamängd, där varje namn ger en exakt beskrivning av fysiska storheter som representeras. Observera att detta är strängvärdet för standard_name , inte namnet på parametern. CF-standardnamntabellen identifierar över 1 000 fysiska kvantiteter, var och en med en exakt beskrivning och tillhörande kanoniska enheter . Riktlinjer för konstruktion av CF-standardnamn finns dokumenterade på konventionens webbplats.

Som ett exempel på informationen som tillhandahålls av CF-standardnamn inkluderar posten för atmosfärstryck vid havsnivå:

  • standardnamn: air_pressure_at_sea_level
  • beskrivning: sea_level betyder medelhavsnivå , som ligger nära geoiden i havsområden. Lufttryck vid havsnivå är den kvantitet som ofta förkortas som MSLP eller PMSL.
  • kanoniska enheter: Pa

programvara

  • NetCDF-Java Library analyserar CF-konventioner och skapar koordinatsystemobjekt från dem
  • OriginPro version 2021b stöder netCDF CF Convention. Genomsnittsberäkning kan utföras under import för att möjliggöra hantering av stora datamängder i en GUI-programvara.
  • Xarray Python-biblioteket analyserar och avkodar data som lagras enligt CF-konventioner .
  • Iris Python-biblioteket "drar mycket från NetCDF CF-metadatakonventionerna som en källa för sin datamodell" .

externa länkar