De vier pijlers van secundaire storage.

Waar moet je op letten bij de keuze van een secundair storage systeem? 

Het is zoals in real life: de sexy primaire storage systemen krijgen 80% van de aandacht (en van het budget) en de saaie secundaire storage krijgt 80% van het werk (datavolume). Terwijl de primaire storage vanwege snelle technologische veranderingen gemiddeld om de drie jaar vervangen wordt moet opslag voor back-up en archief veel langer mee gaan. Niemand vind het prettig om de 3 jaar Tera- of zelfs Petabytes aan data te verhuizen. De keuze voor een (of meerdere?) secundaire opslagsysteem moet weloverwogen zijn. Hierbij spelen de volgende vier criteria een rol. 

1. Dataveiligheid

Op zich wel logisch: als een storage systeem voor back-up en archivering ingezet wordt zou het zelf geen additioneel back-up nodig moeten hebben. Het thema veiligheid kan hier in drie niveaus onderverdeeld worden:

Beveiliging op toegangsniveau om beveiligd te zijn tegen dataverlies of datamanipulatie door aanvallers of gebruikersfouten. Afhankelijk van de toepassing zijn regelmatige of zelfs automatische snapshots en de bescherming door hardware-WORM de juiste keuze. Toenemend waargenomen aanvallen door bijv. ransomware, maar ook bewuste of abusieve pogingen om data te wissen wordt zo effectief een grendel voorgeschoven.

Beveiliging op hardwareniveau om tegen dataverlies door uitval van gegevensdragers beschermd te zijn. Dit wordt bereikt door kopieën of redundantie zodat een gedefinieerd aantal van de gebruikte gegevensdragers uit kan vallen zonder dat dataverlies optreedt. De meest bekende is hier RAID wat echter niet als veilig genoeg wordt aangezien om zonder aanvullende maatregelen te kunnen voldoen. RAIDz als onderdeel van ZFS, met name in de variant triple parity, is hier al beduidend veiliger omdat sluipende fouten en daarmee een falen van een rebuild meestal voorkomen kan worden. Als bijzonder veilig wordt erasure coding, de aangewezen opvolger van RAID, beschouwd. Erasure coding vergt beduidend minder systeemresources bij het rebuild en is aanvullend zeer flexibel te configureren, bijv. ook met viervoudige redundantie.

Beveiliging op systeemniveau om tegen dataverlies door totale uitval beveiligd te zijn. Als een systeem door brand, waterschade of diefstal niet meer bruikbaar of toegankelijk is helpt ook de beste technologie niet meer. Deze calamiteiten kunnen alleen door een replicatie naar een tweede locatie opgevangen worden. Meestal moet hiervoor het gehele systeem identiek gespiegeld worden, sommige systemen staan ook het repliceren naar een tweede locatie op dataniveau toe. Het voordeel van de replicatie op dataniveau is duidelijk: beide systemen kunnen op hun locatie als productiesysteem gebruikt worden en telkens naar de andere locatie repliceren.

2. Flexibiliteit

Gebruikelijk bedraagt de investeringscyclus in de IT sector 3 jaar. Secundaire storage moet echter zijn werk veel langer verrichten. Daarom is het essentieel dat dit storage systeem maximale flexibiliteit biedt om voor de toekomst gewapend te zijn.

De schaalbaarheid is hier het eerste aspect dat in het oog valt. De behoefte aan opslagcapaciteit groeit rap, nagenoeg niemand kan voorspellen hoeveel data in 3, 5 of 10 jaar opgeslagen worden. Als een storage systeem reeds bij de aanschaf zo gedimensioneerd moet zijn dat alle mogelijkheden afgedekt zijn, is meestal een hoge investering nodig. Meer geschikt zijn daarom systemen die elastisch met de behoefte schaalbaar zijn. Een belangrijk punt hierbij is dat de schaalbaarheid ook dan nog gegarandeerd moet zijn als de oorspronkelijk gebruikte soort gegevensdragers niet meer beschikbaar is.

Bij de flexibiliteit hoort ook dat de configuratie van het systeem niet al te vastgelegd is. Welke bestandssystemen, softwaretoepassingen en applicaties worden ondersteund? Is een aanvulling met SSDs mogelijk als het prijsniveau in de buurt van de harde schijven komt? Kunnen storagegedeeltes flexibel aan verschillende toepassingen toegewezen worden – en kunnen deze ook onafhankelijk van elkaar groeien of krimpen?

Niet te vergeten is ook de connectiviteit van het gekozen systeem. Afhankelijk van de gewenste toepassing kan het nodig of wenselijk zijn dat de fysieke verbinding met de toenemende behoeftes groeit. Waar vandaag 1 GBit ethernet gebruikelijk is zijn morgen al 10, 40 of 100 GBit vereist. Als de storage vast met de servercomponenten verbonden is betekend een upgrade meestal een vervanging van het gehele systeem.

3. Offline-mogelijkheden

Alle data zijn permanent online, in de cloud en overall en altijd beschikbaar. Dit bergt echter een aantal nadelen en risico’s die voor secundaire storage systemen problematisch kunnen worden. Permanent toegankelijke dataopslag is ook permanent aan hackers en ransomware blootgesteld. Massief gedistribueerde opslagstructuren (cloud) leiden tot onzekerheden betreffende het omgaan met gevoelige data en zijn vaak niet in overeenstemming met wettelijke regels en voorschriften zoals de AVG. Daarom ervaren offline-geschikte opslagmedia in de laatste tijd opnieuw toenemende aandacht. Het buzzword hierbij is “air gap”. Wat niet verbonden is maar door een fysiek gat – een air gap – gescheiden is, kan niet geïnfecteerd worden omdat geen toegang mogelijk is. Wenselijk is hierbij natuurlijk dat men niet aanvullende offline-kopieën moet maken die dan beveiligd in een kluis bewaard kunnen worden. Het omgaan met dit soort offline-media is zo omslachtig dat de hoop overweegt, deze media nooit nodig te hebben. Natief offline-geschikte niet-lineaire media geven wél de mogelijkheid data snel en zonder ingewikkeld kopiëren weer beschikbaar te stellen.

4. Weinig complexiteit

Het laatste kriterium is de reducering van de storagecomplexiteit. De reducering van de complexiteit is in de IT sector een van de grote thema’s van de komende jaren, bijna geen instelling of onderneming kan specialisten voor elk component in huis hebben. Duidelijk: de primaire storage heeft bijzondere aandacht en moet individueel op de performancebehoeftes afgestemd zijn. Voor de langdurige opslag geldt echter: minder is meer. De meer systemen betrokken zijn, de meer contactpersonen, configuraties, user interfaces en service contracten er zijn. Omdat secundaire storage systemen voor langdurige bewaring gemaakt zijn, spelen ook de duur van de servicecontracten en de mogelijkheid tot verlenging bij gelijkblijvende voorwaarden een rol. 

Conclusie 

Veiligheid en schaalbaarheid zijn voor de hand liggende eisen aan een opslagsysteem voor back-up en archief, echter zijn hier al behoorlijke verschillen te zien. Aanvullend komen de nieuwe (oude) eisen naar offline mogelijkheden omdat “always online” vaak niet aan de beveiligingseisen voldoet en toenemend aan aanvallen blootgesteld is. Overkoepelend staat de wens naar “fire & forget”: een secundaire storage moet ongecompliceerd en langdurig betrouwbaar zijn werk verrichten: data veilig bewaren. 

Schrijf in voor tips en info

Wij schrijven regelmatig blogs over actuele onderwerpen uit de wereld van digitale opslagtechnologie. Meld je hier aan om over nieuwe blogs geïnformeerd te worden.