Waarom je wel of niet zou deduppen

Deduplicatie is de techniek om dubbele data in storage te elimineren. Deduplicatiesystemen worden veel in back-upstorage gebruikt; ze rekenen al gauw met bereikbare rates als 20:1, wat deels wel klopt, maar als je uitgaat van 10:1 gemiddeld zit je wellicht veiliger. Oftewel: met 20 terabyte back-upstorage kun je in principe 200 terabyte aan data kwijt. De data worden immers gededupliceerd. Prachtig, want het scheelt hardwarekosten.

Appels en peren

Tegelijkertijd is het vergelijken van de kosten op dit gebied al snel een kwestie van appels en peren. Dat wil zeggen: vergelijk gededupliceerde systemen eens met niet-gededupliceerde systemen. Om te beginnen is de berekening van de hoeveelheid benodigde storage feitelijk wat vreemd. Als je 200 TB storage nodig hebt kun je dus kiezen voor een systeem met 20 TB en deduplicatie. Daar zitten echter wat addertjes onder het gras. Het belangrijkste addertje is deze: als je je back-up op een dedup-systeem schrijft, doe je dat met de hoop dat je nooit een restore hoeft te doen. Maar wel met het oog op het idee dat dat wellicht ooit nodig is. Immers: dat is waarom je een back-up maakt. Een restore vanaf een dedupsysteem gaat echter vele malen langzamer in vergelijking met een systeem dat niet gededupt is. Bij een dedup moeten data van verschillende plekken bij elkaar gezocht worden en dat is een langdurig proces. En dat in een situatie waarin je je systeem juist weer snel up and running wil hebben.

Bloksgewijs

Een ander punt van aandacht is dat bij deduplicatiesystemen de data bloksgewijs worden gededupliceerd. Verwijzingen naar de losse blokjes worden in een database bijgehouden. Als in die database een fout sluipt, is de complete back-up in feite waardeloos. Zonder deze dedup-database krijg je je data niet meer terug. Als een verwijzing niet meer klopt, zijn alle bestanden die het blok bevatten niet meer leesbaar.

Besparen op je storage

Natuurlijk willen we allemaal besparen op de kosten van back-up storage. Het is wel een overweging om te kijken of je niet liever de deduplicatie van de back-up software gebruikt. Normaal gesproken is die methode veiliger, maar ook minder effectief. Als je geld wil besparen op storagehardware, zodat je minder capaciteit nodig hebt, overweeg dan goed of je een hardwarematige deduplicatie op de storage gebruikt, of liever de deduplicatie van de back-up software. Dat vraagt echt om een zorgvuldige afweging van voor- en nadelen.

Meer weten?

Neem gerust contact met ons op voor vragen en opmerkingen. We geven u met plezier alle informatie!

Schrijf in voor tips en info

Wij schrijven regelmatig blogs over actuele onderwerpen uit de wereld van digitale opslagtechnologie. Meld je hier aan om over nieuwe blogs geïnformeerd te worden.