Xena (mjukvara)
Xena är programvara med öppen källkod för användning i digitalt bevarande . Xena är en förkortning för XML Electronic Normalizing for Archives.
Xena är en Java- applikation som utvecklades av National Archives of Australia . Den är tillgänglig gratis under GNU General Public License .
Version 6.1.0 släpptes 31 juli 2013. Källkod och binärfiler för Linux, OS X och Windows är tillgängliga från SourceForge . Men från och med 2018 underhålls eller stöds det inte längre.
Driftsätt
Xena försöker undvika digital inkurans genom att konvertera filer till ett öppet specificerat format, som ODF eller PNG . Om filformatet inte stöds eller alternativet Binär normalisering är valt, kommer Xena att utföra ASCII Base64- kodning på binära filer och linda in utdata i XML-metadata. Den resulterande .xena-
filen är ren text, även om själva datainnehållet inte är direkt läsbart för människor. Den exakta originalfilen kan hämtas genom att ta bort metadata och vända Base64-kodningen, med hjälp av en intern viewer.
Funktioner
Plattformar som stöds av Xena är Microsoft Windows , Linux och Mac OS X.
Xena använder en serie plugins för att identifiera filformat och konvertera dem till ett lämpligt öppet specificerat format.
Xena har ett applikationsprogrammeringsgränssnitt som gör det möjligt för alla någorlunda skickliga Java-utvecklare att utveckla en plugin för att täcka en ny filtyp.
Xena kan behandla enskilda filer eller hela kataloger. När en hel katalog bearbetas kan den bevara den ursprungliga katalogstrukturen för de konverterade posterna.
Xena kan skapa vanliga textversioner av filformat som TIFF , Word och PDF , med hjälp av Tesseract (programvara) .
Xena-gränssnittet eller Xena Viewer kan användas för att visa eller exportera en Xena-fil (tillägget .xena
) i dess målfilformat. Dessa filer innehåller den normaliserade filen samt all extra information som är relevant för normaliseringsprocessen. Xena Viewer stöder massexport av Xena-filer till målfilformat.
Xena kan användas via dess grafiska användargränssnitt eller kommandoraden .
För att Xena ska fungera fullt ut krävs en lokal installation av följande externa programvara:
- LibreOffice- svit - för att konvertera kontorsdokument till OpenDocument-format
- Tesseract - för att skapa vanliga textversioner av filformat
- ImageMagick - för att konvertera en delmängd av bildfiler till PNG
- Readpst - för att konvertera Microsoft Outlook PST-filer till XML. Readpst är en del av libpsts gratisprogramsvit med öppen källkod .
- FLAC - för att konvertera ljudfiler till FLAC-format. Detta krävs också för att spela upp ljudfiler med Xena.
Filtyper som stöds
Xena kommer att känna igen och bearbeta filtyperna nedan, plus några andra av mindre betydelse. Filtyper som inte stöds kommer automatiskt att genomgå binär normalisering.
Office filformat:
- Microsoft Office- filer (inklusive MS Office XML , SYLK -kalkylblad och Rich Text Format ) konverteras till motsvarande OpenDocument-filer
- Microsoft Outlook PST- filer analyseras för sina individuella meddelanden, som konverteras till XML-filer och en Xena-indexfil skapas
- Microsoft Project MPP-filer konverteras till XML
- OpenOffice.org XML- filer (SXC, SXI, SXW) konverteras till motsvarande OpenDocument-format
- WordPerfect WPD-filer konverteras till OpenDocument ODT
- OpenDocument- dokument (ODT, ODS, ODB, ODP) bevaras oförändrade
- Acrobat PDF-filer lagras som binära filer
- Mailbox-filer (MBX) konverteras till individuella XML-filer
Grafik:
- BMP , GIF , PSD , PCX , RAS och X Window System XBM och XPM bitmappsfiler konverteras till PNG ; TIFF- filer får dessutom inbäddad metadata lagrad i Xena XML. Om Tesseract OCR-programvaran är installerad kommer text att extraheras från TIFF-filer.
- OpenDocument Drawings (ODG) och SVG -filer är inslagna i Xena XML
- JPG- och PNG-filer lagras oförändrade
Arkivfiler:
- Filer extraheras från arkiv ( zip , GZIP , TAR/TAR.gz , JAR , WAR , Mac binär) och normaliseras till en separat Xena-fil. En Xena-indexfil skapas, som när den öppnas i den interna Xena-visningsprogrammet visar filerna i en tabell.
Ljudfiler:
Databaser:
- SQL- filer bearbetas som vanlig text insvept i XML
Andra filtyper:
- HTML konverteras till XHTML
- TXT-textfiler lagras som vanlig text insvept i XML; CSS-filer lagras som vanlig text insvept i XML
Recensioner
En recension av den 22 april 2010 i Practical e-Records gav Xena betyget 82/100 poäng. För närvarande har Xena inget målbevarandeformat för videofiler.
- ^ "Recension av XENA Normalization Software" . 2010-04-22. Arkiverad från originalet 2012-07-08.