De vier pijlers van secundaire storage.

Waar moet je op letten bij de keuze van een secundair storage systeem? 

Het is zoals in real life: de sexy primaire storage systemen krijgen 80% van de aandacht (en van het budget) en de saaie secundaire storage krijgt 80% van het werk (datavolume). Terwijl de primaire storage vanwege snelle technologische veranderingen gemiddeld om de drie jaar vervangen wordt, moet opslag voor back-up en archief veel langer mee gaan. Niemand vind het prettig om de 3 jaar Tera- of zelfs Petabytes aan data te verhuizen. De keuze voor een (of meerdere?) secundaire opslagsysteem moet weloverwogen zijn. Hierbij spelen de volgende vier criteria een rol. 

1. Dataveiligheid

Op zich wel logisch: als je een storage systeem voor back-up en archivering inzet, zou het zelf geen additionele back-up nodig moeten hebben. We kunnen het thema veiligheid in drie niveaus onderverdelen:

Beveiliging op toegangsniveau voorkomt dataverlies of datamanipulatie door aanvallers of gebruikersfouten. Afhankelijk van de toepassing kies je voor regelmatige of zelfs automatische snapshots en bescherm je door hardware-WORM. Toenemend waargenomen aanvallen, zoals ransomware, maar ook bewuste of abusieve pogingen om data te wissen, worden zo effectief voorkomen.

Beveiliging op hardwareniveau beschermt tegen dataverlies door uitval van gegevensdragers. Je bereikt dit door kopieën of redundantie toe te passen, zodat een gedefinieerd aantal van de gebruikte gegevensdragers uit kan vallen zonder dataverlies. De meest bekende methode is RAID, wat echter niet veilig genoeg is zonder aanvullende maatregelen. RAIDz, als onderdeel van ZFS, en met name in de variant triple parity, biedt al beduidend meer veiligheid omdat het sluipende fouten en daarmee falen van een rebuild meestal voorkomt. Erasure coding, de aangewezen opvolger van RAID, beschouwen we als bijzonder veilig. Erasure coding vergt beduidend minder systeemresources bij een rebuild en is zeer flexibel te configureren, bijvoorbeeld met viervoudige redundantie.

Beveiliging op systeemniveau beschermt tegen dataverlies door totale uitval. Als een systeem door brand, waterschade of diefstal niet meer bruikbaar of toegankelijk is, helpt de beste technologie niet meer. Alleen door replicatie naar een tweede locatie kun je deze calamiteiten opvangen. Meestal spiegel je hiervoor het gehele systeem identiek, maar sommige systemen staan ook replicatie naar een tweede locatie op dataniveau toe. Het voordeel van replicatie op dataniveau is duidelijk: beide systemen kun je op hun locatie als productiesysteem gebruiken en naar de andere locatie repliceren.

2. Flexibiliteit

Gebruikelijk bedraagt de investeringscyclus in de IT-sector 3 jaar. Secundaire storage moet echter veel langer zijn werk verrichten. Daarom is het essentieel dat dit storage systeem maximale flexibiliteit biedt om voor de toekomst gewapend te zijn.

De schaalbaarheid is hier het eerste aspect dat in het oog valt. De behoefte aan opslagcapaciteit groeit rap, en nagenoeg niemand kan voorspellen hoeveel data in 3, 5 of 10 jaar opgeslagen zal worden. Als je een storage systeem bij de aanschaf al zo moet dimensioneren dat alle mogelijkheden zijn afgedekt, is meestal een hoge investering nodig. Daarom zijn systemen die elastisch met de behoefte kunnen schalen, meer geschikt. Het is hierbij belangrijk dat de schaalbaarheid gegarandeerd blijft, zelfs als de oorspronkelijk gebruikte soort gegevensdragers niet meer beschikbaar is.

Bij de flexibiliteit hoort ook dat de configuratie van het systeem niet al te vastligt. Welke bestandssystemen, softwaretoepassingen en applicaties ondersteunen ze? Kun je SSD’s toevoegen als het prijsniveau in de buurt van harde schijven komt? Kun je storagegedeeltes flexibel aan verschillende toepassingen toewijzen, en kunnen deze ook onafhankelijk van elkaar groeien of krimpen?

Vergeet ook niet de connectiviteit van het gekozen systeem. Afhankelijk van de gewenste toepassing kan het nodig of wenselijk zijn dat de fysieke verbinding met de toenemende behoeftes meegroeit. Waar vandaag 1 GBit ethernet gebruikelijk is, vereisen morgen al 10, 40 of 100 GBit. Als je de storage vast met de servercomponenten verbindt, betekent een upgrade meestal een vervanging van het gehele systeem.

3. Offline-mogelijkheden

Alle data zijn permanent online, in de cloud en overal en altijd beschikbaar. Dit brengt echter een aantal nadelen en risico’s met zich mee die voor secundaire storage systemen problematisch kunnen worden. Permanent toegankelijke dataopslag stelt data ook permanent bloot aan hackers en ransomware. Massief gedistribueerde opslagstructuren (cloud) leiden tot onzekerheden betreffende het omgaan met gevoelige data en zijn vaak niet in overeenstemming met wettelijke regels en voorschriften zoals de AVG. Daarom ervaren offline-geschikte opslagmedia de laatste tijd opnieuw toenemende aandacht. Het buzzword hierbij is “air gap”. Wat je niet verbindt maar door een fysiek gat – een air gap – scheidt, kan niet geïnfecteerd worden omdat er geen toegang mogelijk is. Het is natuurlijk wenselijk dat je geen aanvullende offline-kopieën moet maken die je dan beveiligd in een kluis bewaart. Het omgaan met dit soort offline-media is zo omslachtig dat je hoopt, deze media nooit nodig te hebben. Natief offline-geschikte niet-lineaire media geven je wél de mogelijkheid om data snel en zonder ingewikkeld kopiëren weer beschikbaar te stellen.

4. Weinig complexiteit

Het laatste kriterium is de reducering van de storagecomplexiteit. De reducering van de complexiteit is in de IT sector een van de grote thema’s van de komende jaren, bijna geen instelling of onderneming kan specialisten voor elk component in huis hebben. Duidelijk: de primaire storage heeft bijzondere aandacht en moet individueel op de performancebehoeftes afgestemd zijn. Voor de langdurige opslag geldt echter: minder is meer. De meer systemen betrokken zijn, de meer contactpersonen, configuraties, user interfaces en service contracten er zijn. Omdat secundaire storage systemen voor langdurige bewaring gemaakt zijn, spelen ook de duur van de servicecontracten en de mogelijkheid tot verlenging bij gelijkblijvende voorwaarden een rol. 

Conclusie 

Veiligheid en schaalbaarheid zijn voor de hand liggende eisen aan een opslagsysteem voor back-up en archief, echter zijn hier al behoorlijke verschillen te zien. Aanvullend komen de nieuwe (oude) eisen naar offline mogelijkheden omdat “always online” vaak niet aan de beveiligingseisen voldoet en toenemend aan aanvallen blootgesteld is. Overkoepelend staat de wens naar “fire & forget”: een secundaire storage moet ongecompliceerd en langdurig betrouwbaar zijn werk verrichten: data veilig bewaren. 

Schrijf in voor tips en info

Wij schrijven regelmatig blogs over actuele onderwerpen uit de wereld van digitale opslagtechnologie. Meld je hier aan om over nieuwe blogs geïnformeerd te worden.