Archiveren en erfgoed

Archiveren kan verschillende grondslagen hebben. Het kan zijn dat je graag wíl archiveren, zoals een museum of bibliotheek doet. Of er wordt gearchiveerd omdat het móet, omdat je de overheid bent of omdat je documenten voor een bepaalde tijd moet bewaren. Dus archiveren omdat je wil, of omdat je moet.

Altijd voordeel

Wat je motivatie ook is, geld kost het altijd. Als je wil archiveren is de bereidheid om de portemonnee te trekken wat groter dan in het geval van moeten. Maar ook in het geval van moeten archiveren kun je van de voordelen genieten. Als je goed archiveert kun je allerlei zaken terugvinden. Wat is de bestelhistorie van een bepaalde klant en wat heeft hij toen betaald? Data is een waardevolle bron.

Doe het wel goed!

De volgende vraag is dan: hoe bewaar je het goed? Duur wordt het pas als je het niet goed bewaart. Als je mail in je exchangeserver laat zitten of documenten die je weinig gebruikt op de snelle, dure opslag laat staan, neemt het onnodig ruimte in. Elke keer wordt het opnieuw geback-upt en gemigreerd bij nieuwe hardware. Allemaal onnodige kosten. Maar als je je statische data in een archief plaats, maak je gebruik van een langzamere, maar goedkopere storage. Je primaire, dure storage, wordt kleiner en goedkoper en vraagt minder onderhoud. Dat is dubbele winst en de besparing is dan ook meestal groter dan de kosten van het archief.

Archiveer je E-mail!

Om nog even terug te komen op e-mailarchivering: dat wordt meer en meer actueel. Veel mailboxen puilen uit en nemen veel ruimte in beslag. Daar komt nog bij dat overheden verplicht worden om de data uit mails te bewaren. Dat moet je dus goed archiveren. De opslagcapaciteit van een mailserver is niet zo groot, maar vraagt wel om een krachtige processor. Overvolle mailboxen vertragen het systeem, dus door te investeren in archivering voor mail, bespaar je niet alleen op dure, primaire opslag maar ook op kracht van je processor.

Erfgoed

Een aantal jaar geleden plaatste de Koninklijke Bibliotheek één hele petabyte (1000 terabyte) aan Silent Bricks. Met de toenemende hoeveelheid data én allerlei toepassingen is de behoefte aan opslagruimte groter dan ooit.

Voor de KB is het prettig dat het mogelijk is om de hoeveelheid storage ruimte stapsgewijs uit te breiden. Op die manier zit je niet langere tijd ‘opgescheept’ met opslagruimte die je nog niet gebruikt, inclusief de kosten die daarbij horen. Deze stapsgewijze uitbreiding leidde uiteindelijk tot één petabyte aan Silent Bricks.

Vendor-neutraal

Vendor-neutrale archieven zijn belangrijk om een zogenaamde vendor-lock-in, de afhankelijkheid van een bepaalde fabrikant, te voorkomen. Een vendor-lock-in is vervelend en vaak duur als de fabrikant in kwestie voor elke wijziging (bijv. omdat een nieuw besturingssysteem nodig wordt) of voor een migratie nieuwe licenties in rekening brengt. Niet alleen vervelend en duur, maar soms ook dramatisch, wordt een vendor-lock-in echter als de fabrikant van wie het functioneren van het archief afhankelijk is niet meer bestaat, en de archiefgegevens daarom helemaal niet meer toegankelijk of te migreren zijn.

Bij langdurige opslag is het dus uiterst belangrijk een systeem te hebben waar ten alle tijden (statische) informatie opgevraagd, geraadpleegd en verhuisd kan worden, zonder dat hiervoor de ondersteuning in welke vorm dan ook van een of meerdere fabrikanten nodig is.

En hoe zit dit met de andere genoemde opslagmedia? Microfilm en cd’s/dvd’s zijn gestandaardiseerde media, de bijbehorende leesapparaten worden door meerdere fabrikanten geproduceerd. Ook al zijn dit bij de cd- en dvd-lezers inmiddels alleen nog twee of drie kunnen wij deze media voorlopig(!) nog als fabrikant onafhankelijk beschouwen. De Silent Cubes hebben geen speciaal leesapparaat nodig, deze vraag is dus hier niet van toepassing.

De SilentCubes worden niet via een bestandssysteem maar via een standaard netwerkshare benaderd, de vraag naar het bestandssysteem is hier dus niet belangrijk.

Bij de vraag naar vendorneutraliteit van een archief moet dus zowel naar de hardware als naar de software gekeken worden. Bij cd’s, dvd’s en SilentCubes zijn wij betreffende de hardware niet afhankelijk van de fabrikant – deze media zijn met willekeurige besturingssystemen en hardware componenten wereldwijd met open standaarden leesbaar. Dan nog moeten wij ervoor zorgen dat de gegevens op deze media in een softwareformaat geschreven zijn dat onafhankelijk van fabrikanten te lezen en te migreren is, om inderdaad een vendor-neutraal archief te hebben.

Schrijf in voor tips en info

Wij schrijven regelmatig blogs over actuele onderwerpen uit de wereld van digitale opslagtechnologie. Meld je hier aan om over nieuwe blogs geïnformeerd te worden.