Rekordorienterat filsystem
Inom datavetenskap är ett rekordorienterat filsystem ett filsystem där data lagras som samlingar av poster . Detta i motsats till ett byte-orienterat filsystem, där data behandlas som en oformaterad ström av byte . Det finns flera olika möjliga postformat; detaljerna varierar beroende på det specifika systemet. Generellt kan formaten ha fast längd eller variabel längd, med olika fysiska organisationer eller utfyllnadsmekanismer; metadata kan associeras med filposterna för att definiera postlängden, eller så kan data vara en del av posten. Olika åtkomstmetoder för poster kan tillhandahållas, till exempel kan poster hämtas i sekventiell ordning , med nyckel eller efter postnummer.
Ursprung och egenskaper
Rekordorienterade filsystem associeras ofta med stordatoroperativsystem, såsom OS/360 och efterföljare och DOS/360 och efterföljare , och mellanregisteroperativsystem, såsom RSX-11 och VMS . Men de har sitt ursprung tidigare i mjukvara som Input/Output Control System (IOCS).
Record-orienterade filsystem kan stödjas på andra media än direktåtkomstenheter. En kortlek med hålkort kan betraktas som en rekordorienterad fil. Ett magnetband är ett exempel på ett medium som kan stödja poster med enhetlig längd eller variabel längd.
I ett registerfilsystem utformar en programmerare de poster som kan användas i en fil. Alla applikationsprogram som får åtkomst till filen, oavsett om de lägger till, läser eller uppdaterar poster, delar en förståelse för posternas design. I DOS/360, OS/360 och deras efterföljare finns det inga begränsningar för de bitmönster som utgör dataposten, dvs. det finns inget avgränsningstecken; detta är inte alltid sant i annan programvara, t.ex. vissa posttyper för RCA File Control Processor (FCP) på 301, 501, 601 och 3301.
Filen uppstår när en begäran om filskapande skickas till filsystemet. Viss information om filen kan inkluderas i skapandebegäran. Denna information kan ange att filen har fast längd på poster (alla poster har samma storlek) tillsammans med storleken på posterna. Alternativt kan specifikationen ange att posterna är av variabel längd, tillsammans med den maximala postlängden. Ytterligare information inklusive blockeringsfaktor, binär vs. text och maximalt antal poster kan anges.
Det kan vara tillåtet att endast läsa början av en post; nästa sekventiell läsning returnerar nästa samling av data (post) som skribenten avsåg att grupperas tillsammans. Det kan också vara tillåtet att endast skriva början av en post. I dessa fall är posten utfylld med binära nollor eller med mellanslag, beroende på om filen känns igen som en binär fil eller en textfil.
Vissa operativsystem kräver att biblioteksrutiner som är specifika för postformatet inkluderas i programmet. Detta innebär att ett program som ursprungligen förväntades läsa en postfil med variabel längd inte kan läsa en fil med fast längd. Dessa operativsystem måste tillhandahålla filsystemverktyg för att konvertera filer mellan ett format och ett annat. Detta innebär att kopiering av filen (vilket kräver extra lagringsutrymme, tid och koordination) kan vara nödvändigt.
Andra operativsystem inkluderar olika rutiner och associerar lämplig rutin, baserat på filorganisationen, vid exekveringstidpunkten.
I båda fallen måste betydande mängder kod för att hantera poster tillhandahållas i skyddade rutiner för att säkerställa filintegritet.
Ett alternativ till en Record-orienterad fil är en stream. I en strömfil, där filsystemet behandlar filer som en ostrukturerad sekvens av byte. Ansökningarna kan, men behöver inte, införa en journalstruktur. Detta tillvägagångssätt minskar avsevärt storleken och komplexiteten på biblioteket och minskar antalet verktyg som krävs för att underhålla filer.
En vanlig tillämpningskonvention för textfiler representerade som strömmar är att använda en ny radavgränsare för att separera eller avsluta poster, vanligtvis CR , CRLF eller LF. Tyvärr är CPU-tiden som krävs för att analysera för postavgränsaren betydande och uteslutningen av postavgränsarmönstret från data är ofta oönskat.
En alternativ konvention är att inkludera ett längdfält i varje post. Skrivarapplikationen ansvarar för att införa eventuell poststruktur och läsarapplikationen ansvarar för att separera posterna.
Fördelar och kostnader
En postorienterad fil har flera fördelar. Efter att ett program har skrivit en samling av data som en post har programmet som läser den posten förståelsen av denna data som en samling. Även om det är tillåtet att endast läsa början av en post, returnerar nästa sekventiell läsning nästa samling av data (post) som skribenten avsåg att grupperas tillsammans. En annan fördel är att posten har en längd och det finns ingen begränsning på bitmönstren som utgör dataposten, dvs det finns inget avgränsningstecken.
Det finns en kostnad förknippad med rekordorienterade filer. Längddefinitionen tar plats. På ett magnetband tar den definitionen formen av ett mellanrum mellan skivorna. På en disk måste ett metadataområde allokeras. Detta är minimalt i en fil där alla poster är lika långa. På en fil som består av poster med varierande längd definieras en maximal postlängd för att bestämma storleken på längdmetadata som är associerade med varje post.
Se även
- Stream (dator)
- Datauppsättning (IBM stordator)
- Filer-11
- CMS filsystem
- ISAM / VSAM
- Distributed Data Management Architecture (DDM)
- Record-oriented fil (DDM)