PRONOM

PRONOM ( Public Record Office och Nôm 喃 ) är ett webbaserat tekniskt register för att stödja digitala bevarandetjänster, utvecklat av Storbritanniens nationella arkiv . PRONOM var det första och förblir, hittills, det enda operativa offentliga filformatsregistret i världen, även om "Magic File"-förrådet för File Command har tjänat denna roll i en mindre formell kapacitet i två decennier. Andra projekt för att utveckla tekniska register, inklusive UK Digital Curation Centers Representation Information Registry, och Global Digital Format Registry- projektet vid Harvard University , pågår nu.

PRONOMs ursprung ligger i kravet på att ha tillgång till tillförlitlig teknisk information om de elektroniska handlingar som finns hos Riksarkivet. Per definition är elektroniska register inte i sig läsbara för människor - filformat kodar information till en form som endast kan bearbetas och göras begriplig av mycket specifika tekniska miljöer. Tillgängligheten till denna information är därför mycket sårbar för teknisk föråldrad . Teknisk information om strukturen för dessa filformat, och de mjukvaru- och hårdvarumiljöer som krävs för att stödja dem, är därför en förutsättning för alla digitala bevarandesystem. PRONOM utvecklades för att tillhandahålla denna funktion, till en början som en intern resurs för Riksarkivets personal, och därefter som en offentlig, webbaserad resurs.

Utveckling

Den första versionen av PRONOM utvecklades av National Archives digitala bevarandeavdelning ledd av Adrian Brown i mars 2002. PRONOM 2 släpptes i december 2002 och gav stöd för utvecklingen av flerspråkiga versioner av registret. Webbaktiveringen av PRONOM (PRONOM 3) i februari 2004 representerade startpunkten för utvecklingen av PRONOM som en viktig onlineresurs för den internationella digitala bevarandegemenskapen.

PRONOM 4, som släpptes i oktober 2005, inkluderar en betydande omarbetning av den underliggande datamodellen för att möjliggöra insamling av detaljerad teknisk information om filformat och stödja framtida interoperabilitet med andra planerade registersystem, och lanseringen av programvaran DROID för automatisk identifiering av filformat .

uppdatering för att stödja förbättringar av DROID och släpptes 2006. En mycket mer omfattande uppdatering planeras för 2007, som kommer att inkludera exponeringen av PRONOMs kärnfunktioner genom webbtjänstgränssnitt . Detta arbete är en del av Seamless Flow-programmet för att positionera National Archives för att ta emot och hantera framtida myndighetshandlingar i elektroniska format.

I framtiden kan PRONOM delta som en nod i det planerade Global Digital Format Registry- projektet.

National Archives vann 2007 Digital Preservation Award sponsrat av Digital Preservation Coalition , för sitt arbete med PRONOM och DROID.

Tjänster

Det tekniska kärnregistret stöder ett antal specifika tjänster:

PRONOM-registret tillhandahåller en sökbar webbdatabas med teknisk information om filformat, de programvaruverktyg som krävs för att komma åt dem och de tekniska miljöer som krävs för att komma åt dem. Användare kan söka efter format och programvara med hjälp av en mängd olika kriterier, såsom format eller programvarunamn och filtillägg . PRONOM har även information om supportperioder för mjukvaruprodukter och kan även efterfrågas utifrån detta. Förutom visning på skärmen kan registerinformation exporteras i XML , CSV och utskriftsvänliga format. PRONOM-webbplatsen tillåter användare att skicka in ny information för inkludering i PRONOM.

PRONOM Persistent Unique Identifier (PUID)-schemat

PRONOM Persistent Unique Identifier (PUID) är ett utökningsbart schema med beständiga, unika och entydiga identifierare för poster i PRONOM-registret. Sådana identifierare är grundläggande för utbyte och hantering av digitala objekt, genom att tillåta mänskliga eller automatiserade användaragenter att entydigt identifiera, och dela denna identifiering av, representationsinformationen som krävs för att stödja åtkomst till ett objekt. Detta är en dygd både av identifierarens inneboende unikhet och dess bindning till en definitiv beskrivning av representationsinformationen i ett register som PRONOM.

För närvarande är PUID-schemat begränsat till en speciell klass av representationsinformation: formatet i vilket ett digitalt objekt är kodat. Format ansågs vara en särskild prioritet för ett sådant system, eftersom inget befintligt, universellt tillämpligt system tillhandahåller detta. Unix magiska siffror och Macintosh -datagafflar tillhandahåller en del av denna funktionalitet, men detsamma gäller inte i DOS- eller Microsoft Windows- miljöer. Filtillägget med tre tecken är varken standardiserat eller unikt och tolkas olika av olika miljöer. På samma sätt ger inte IANA MIME -typschemat tillräcklig granularitet eller täckning för att uppfylla kraven för unika identifierare. PUID-schemat har utvecklats för det enda syftet att tillhandahålla sådana identifierare.

Schemat har antagits som det rekommenderade kodningsschemat för att beskriva filformat i den senaste versionen av UK e-Government Metadata Standard . Schemat är utformat för att kunna utökas och kan utökas i framtiden för att inkludera andra klasser av representationsinformation i PRONOM, såsom komprimeringsmetoder , teckenkodningsscheman och operativsystem .

PUIDs kan uttryckas som Uniform Resource Identifiers med hjälp av info:pronom/ namnutrymmet, vars detaljer är tillgängliga från info URI-registret. Varken PUID-schemat, eller dess uttryck som en info-URI, stöder någon inneboende avledningsmekanism, dvs en PUID löser sig inte till en Uniform Resource Locator . Riksarkivet planerar dock att utveckla en rad tjänster för att exponera PRONOM-registerinnehåll, inklusive en upplösningstjänst för PUID.

DROID

DROID (Digital Record Object Identification) är ett mjukvaruverktyg utvecklat av National Archives för att utföra automatiserad batchidentifiering av filformat. Det är ett av en planerad serie verktyg som använder PRONOM för att tillhandahålla specifika digitala bevarandetjänster. DROID använder interna (bytesekvens) och externa (filtillägg) signaturer för att identifiera och rapportera specifika filformatversioner av digitala filer. Dessa signaturer lagras i en XML-signaturfil, genererad från information registrerad i PRONOM tekniska register. Nya och uppdaterade signaturer läggs regelbundet till PRONOM, och DROID kan konfigureras för att automatiskt ladda ner uppdaterade signaturfiler från PRONOM-webbplatsen via webbtjänster .

DROID låter filer och mappar väljas från ett filsystem för identifiering. Efter att identifieringsprocessen har körts kan resultaten matas ut i XML , CSV eller utskriftsvänliga format.

DROID är ett plattformsoberoende Java- verktyg. Den innehåller ett dokumenterat, offentligt API och kan anropas från både GUI och kommandoradsgränssnitt .

Framtida tjänster

Föreslagna framtida tjänster inkluderar formatriskbedömningar och bevarandeplanering, och den automatiserade genereringen av migreringsvägar för konvertering mellan format.

Se även

externa länkar