Eisen aan back-up en archief

 

De eisen aan back-up systemen en archiefsystemen divergeren op sommige punten, simpelweg omdat de soort van opgeslagen gegevens verschilt. Wij zullen in dit document uitleggen wat deze verschillen zijn en waar ze invloed op de keuze van hardware hebben. Wij zien dat in het verleden een tape een goede keuze voor back-up medium en een CD een goede keuze voor archief medium was. En wij zien dat de moderne alternatieven voor de oude systemen de Silent Bricks (back-up) en de Silent Cubes (archief) zijn.

Om de verschillen tussen een digitaal archief en een data back-up goed in kaart te brengen is het handig eerst te kijken wat de doelen van een archief en van een back-up zijn. Met andere woorden: hoezo back-uppen wij en hoezo archiveren wij?

 

De intentie van een back-up is in het geval van dataverlies de verloren informatie weer toegankelijk te maken en dit liefst zo snel mogelijk om de bedrijfscontinuïteit zo min mogelijk te storen. Een back-up is dus altijd een kopie van originele gegevens waarbij deze meestal met de tijd wijzigen.

 

De intentie van een archief is een verzameling van onveranderlijke gegevens die langdurig bewaard moeten worden te creëren. Een archief is dus geen kopie van gegevens maar bevat de originele gegevens. De snelheid waarmee uit het archief gelezen kan worden is minder bedrijfskritisch, wél is het belangrijk dat het archief eenvoudig en snel doorzocht kan worden.

 

De voornaamste verschillen tussen een back-up en een archief zijn dus dat een back-up gemaakt wordt voor snelle data recovery en een archief gemaakt wordt voor het langdurige bewaren van originele gegevens die meestal niet dagelijks gebruikt worden.
Dit heeft invloed op de geschikte hardware en software, het is bijvoorbeeld geen probleem dat back-up hardware en software vaak in propriëtair formaat op speciale hardware schrijft – het gaat immers alleen om een kopie van originele gegevens. Bij een technologische verandering kunnen wij gewoon een nieuwe kopie maken.
Bij een archief is het echter fataal als wij onze originele gegevens van een aantal jaren geleden niet meer kunnen benaderen omdat de hiervoor nodige hardware of software niet meer beschikbaar is. Archieven moeten daarom zogenaamde vendor neutral archives – d.w.z. onafhankelijk van fabrikanten – zijn.

 

Nu is het niet zo dat archieven en back-ups helemaal niets gemeen hebben, er zijn natuurlijk wel enkele gemeenschappelijke eisen: aangezien de hoeveelheid gegevens permanent toeneemt moeten de capaciteiten van zowel ons archief als van ons back-up systeem uit te breiden zijn. Uit kostenoverwegingen moeten beide systemen met weinig administratief werk te beheren zijn en ze moeten zo energiezuinig als mogelijk zijn. Dit laatste geldt in bijzondere mate voor ons archief: aangezien een archief voor lange tijd, vaak voor decennia en soms voor eeuwig is aangelegd heeft het energieverbruik een bijzonder zwaarwegend aandeel in de TCO (total cost of ownership).

 

De onderstaande tabel geeft een overzicht over de eigenschappen van back-up en archief:

 

Archief

Back-up

Snel terugzetten van grote   hoeveelheden data

Nee, gegevens worden naar behoefte rechtstreeks in het archief benaderd

Ja, om bedrijfscontinuïteit in geval van calamiteit te waarborgen

Snel doorzoekbaar

Ja, willekeurige gegevens   moeten in willekeurige volgorde op te vragen zijn

Nee, het is bekend welk back-up medium te gegevens bevat die terug gezet moeten worden

Bevat originele gegevens

Ja, altijd

Nee, altijd een kopie

Herschrijfbaar

Nee, moet WORM zijn om gegevensintegriteit te waarborgen

Ja, de originele gegevens waar het back-up de kopie van is kunnen veranderen

Langdurig

Ja, dit is kenmerkend voor een archief

Meestal niet, de kopie moet alleen zolang beschikbaar zijn als het   origineel geldig is

Bevat onveranderlijke gegevens

Ja, dit is kenmerkend voor een archief

Meestal niet

Capaciteit uitbreidbaar

Ja, de hoeveelheid gegevens zal naar verwachting verder toenemen

Ja, de hoeveelheid gegevens zal naar verwachting verder toenemen

Weinig administratie

Ja, omdat archieven over lange periodes beheerd moeten worden is het belangrijk dat de kosten hiervoor laag zijn

Ja, omdat back-ups regelmatig (dagelijks) gemaakt worden is het belangrijk dat het beheer eenvoudig is

Fysiek gescheiden van het datacenter / bedrijfsnetwerk

Nee, integendeel moet een archief meestal rechtstreeks te benaderen   zijn

Ja, om bij een lokale destructie (brand, sabotage, aardbeving, …) nog over een kopie te beschikken

Energiezuinig

Ja, omdat archieven over lange periodes actief zijn is het bijzonder belangrijk het energieverbruik laag te   houden

Niet meer dan bij andere apparatuur die dagelijks gebruikt wordt

Regelmatige gegevenscontrole

Ja, om dataintegriteit over een lange periode te waarborgen moeten de gegevens regelmatig gecontroleerd   worden

Nee, het moet alleen zeker gesteld zijn dat back-up en restore altijd   werken

Niet propriëtair, dus opgebouwd   uit standaard componenten met standaard software protocollen

Ja, omdat de gegevens ook na lange tijd nog benaderbaar moeten zijn moet een archief vendor neutral zijn, dus onafhankelijk van bepaalde hardware, software of besturingssystemen die   mogelijk ophouden te bestaan

Nee, omdat een back-up altijd een momentele kopie van actuele gegevens is kan eenvoudig overgegaan worden op andere technologie

 

Om te bepalen welke storage technologie voor welke toepassing geschikt is kunnen wij deze tabel gebruiken om de verschillende media te toetsen. Als wij dit doen zullen wij – niet echt verbazend – zien dat een technologie, die speciaal voor een bepaalde toepassing ontwikkeld is de eisen voor deze toepassing ook het beste vervuld.

 

Zo zijn tape en RDX systemen goed geschikt voor back-up, want grote hoeveelheden data kunnen snel "bulk" terug gezet worden, de media zijn herschrijfbaar en daardoor meerdere keren te gebruiken, tape en RDX systemen zijn door aanschaf van extra cartridges goedkoop uit te breiden, en ze zijn relatief energiezuinig omdat ze alleen voor het schrijven en lezen van gegevens energie verbruiken, het bewaren  van de gegevens zelf (bandje ligt in de kast) kost geen energie.
Tape en RDX systemen zijn echter ongeschikt voor archiefdoeleinden want ze voldoen aan veel van de eisen voor archieven niet, bijv. het WORM criterium, de regelmatige gegevenscontrole, de snelle doorzoekbaarheid, de duurzaamheid van de opslag.

 

De Silent Cubes zijn speciaal ontwikkeld met het oogmerk op archival storage, ze zijn dan ook niet geschikt voor back-up, alleen al omdat ze niet herschrijfbaar zijn. Maar ze zijn bij uitstek geschikt voor dat waar ze voor gemaakt zijn: archief opslag. Silent Cubes zijn hardwarematig beveiligd tegen het overschrijven van de gegevens, ze zijn dus een écht WORM systeem, gemaakt voor het langdurig bewaren voor gegevens, die regelmatig en automatisch op integriteit gecontroleerd worden. Daarbij is een Silent Cube uiterst energiezuinig en opgebouwd uit standaard componenten met standaard netwerkprotocollen.

 

Optische media zoals CDs, DVDs en BDs zijn ontwikkelt voor de digitale distributie van (mediale) gegevens. Hiervoor zijn ze ook zeer geschikt omdat ze goed transportabel zijn en een grote oppervlakte voor bedrukkingen hebben. Optische media zijn echter ongeschikt voor back-up  omdat ze (op uitzonderingen na) niet herschrijfbaar zijn en vaak niet voldoende capaciteit bieden. Ze zijn beperkt geschikt voor archief-opslag: het zijn WORM media, dus gegevens kunnen niet overschreven worden,  maar de capaciteit is beperkt en een regelmatige gegevenscontrole is omslachtig.

 

RAID systemen zijn ongeschikt voor zowel back-up en archief. RAID systemen zijn ontwikkelt om snelle, relatief betrouwbare toegang tot permanent veranderlijke gegevens (bijv. databases) te geven, voor back-up en archief zijn ze te duur, te slecht uit te breiden en te energie-intensief. Voor archief doeleinden zijn ze tevens veel te onbetrouwbaar.

 

De volgende tabellen geven een overzicht over de verschillende systemen en hun geschiktheid voor back-up en archief.

 

Eisen aan een back-up systeem:

 

RAID

Optisch

Tape / RDX

Silent Cube

Snel grote hoeveelheden data   terugzetten

Ja             

Nee

Ja

Ja

Herschrijfbaar

Ja

Nee

Ja

Nee

Capaciteit uitbreidbaar

Ja, maar zeer duur

Ja

Ja

Ja

Weinig administratie

Ja

Nee, jukeboxen en drivers moeten beheerd worden

Nee, tape libraries en drivers moeten beheerd worden

Ja

Energiezuinig

Nee

Ja

Ja

Ja

Mogelijkheid tot fysieke   scheiding

Ja, met een tweede installatie

 

Ja

Ja

Ja, met een tweede installatie

 

 

 

Eisen aan een archief-systeem:

 

RAID

Optisch

Tape / RDX

Silent Cube

Snel doorzoekbaar

Ja             

Gemiddeld

Nee

Ja

Niet herschrijfbaar (WORM)

Nee

Ja

Nee

Ja

Langdurig veilig

Nee, alleen korttijdig.

Ja,  maar geen redundantie

Nee

Ja, viervoudig redundant

Capaciteit uitbreidbaar

Ja, maar zeer duur

Ja

Ja

Ja

Weinig administratie

Ja

Nee, jukeboxen en drivers moeten beheerd worden

Nee, tape libraries en drivers moeten beheerd worden

Ja

Energiezuinig

Nee

Ja

Ja

Ja

Regelmatige gegevens-controle

Nee, alleen met additionele software

Nee, alleen met additionele software

Nee, alleen met additionele software

Ja, door ingebouwde digitale audit

Niet propriëtair

Nee, RAID systemen zijn altijd vendor afhankelijk

Nee, voor jukeboxen zijn vendor afhankelijke drivers voor elk besturingssysteem nodig

Nee, voor tape libraries zijn vendor afhankelijke drivers voor elk besturingssysteem nodig. Tape formaten zijn verschillend en het opslagformaat is afhankelijk van de gebruikte software

Ja, met standaard componenten worden de Silent Cubes via standaard netwerkprotocollen (TCP/IP, Ethernet) als standaard share (SMB, CIFS, NFS) vanuit elk besturingssysteem aangesproken. Geheel vendor neutral dus.

 

Het is overduidelijk dat het Silent Cube systeem het meest geschikte opslag systeem voor archieven is. Dit is ook niet verbazingwekkend aangezien dit systeem speciaal voor archieven ontwikkeld is.

 

Voor back-up zijn in de meeste gevallen tape of RDX systemen het meest geschikt alhoewel hier wel uitzonderingen zijn: bij een zeer bedrijfskritisch omgeving kan het zinvol zijn een tweede RAID systeem als back-up-eenheid in te zetten en de hoge energie- en aanschafkosten voor lief te nemen.

 

Uiteraard moet ook van een archief een fysiek gescheiden back-up in de vorm van een kopie gemaakt worden, anders kunnen zulke rampen gebeuren als bij de brand van de bibliotheek van Alexandrië of onlangs bij het instorten van het stadsarchief van Keulen door de bouw van de metro. In beide gevallen zijn grote hoeveelheden erfgoed voor altijd verloren gegaan.
Aan het back-up van een archief zijn bijna dezelfde eisen gesteld als aan alle andere back-ups, maar met één uitzondering: omdat de originele gegevens (het archief) nooit wijzigen hoeft het back-up van een archief niet herschrijfbaar te zijn. Dit maakt wederom de Silent Cube het meest geschikte systeem voor een archival back-up, vooral omdat hierdoor direct een compleet zelfstandig werkend archief ontstaat dat in geval van een calamiteit onmiddellijk ter beschikking staat, zonder dat eerst gegevens van een back-up medium terug gezet moeten worden. Maximale redundantie dus.

 

De conclusie is dat voor back-up systemen meestal de oude tapes of de moderne RDX systemen gebruikt kunnen worden en voor archief systemen altijd de Silent Cubes de juiste oplossing zowel voor de originele data als voor de back-up kopie zijn.

 

©2013, Comex bv, www.comex.eu

 

Dit document mag zonder uitdrukkelijke toestemming vrij gepubliceerd en/of verdeeld worden,  echter uitsluitend in zijn geheel, onder benoeming van de bron en onder verwijzing naar de website www.comex.eu. Voor publicatie van delen uit dit document kunt u toestemming vragen onder Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.

 

U kunt dit document hier als PDF downloaden.

Contact

Over ons

Wij zijn een klein creatief team gespecialiseerd in digitale opslagsystemen voor archief, back-up en content distribution. Ons doel is voor alle klanten de meest optimale oplossing te vinden en de klanten bij het gebruik van onze systemen perfect te ondersteunen.

Laatste blogs

Data analytics vraagt om snelle beschikbaarheid van data

Geschreven op 02 juni 2020

Natuurlijk betaal je geen losgeld! Toch?

Geschreven op 12 mei 2020


Schrijf nu in voor tips en info

COMEX logoSchrijf in voor tips en info

Wij schrijven regelmatig blogs over actuele onderwerpen uit de wereld van digitale opslagtechnologie. Meld je hier aan om over nieuwe blogs geïnformeerd te worden.

Voornaam
Achternaam
E-mailadres

Adres

COMEX
Vogt 21, 6422 RK Heerlen

+31-43-3088400
office@comex.eu
support@comex.eu