ZFS deduplicato

data deduplicationNell’ultimo periodo ZFS è stato un pò appannato, per via di alcune cause legali intentate da NetApp, e a causa di alcuni contrasti sulle licenze, motivi che sono probabilmente alla base anche dell’abbandono da parte di Apple del previsto supporto al file system.

Tuttavia dal punto di vista tecnico lo sviluppo non si è fermato, ed è stato da poco annunciato che ZFS supporterà la deduplicazione dei dati, a livello di blocchi.

Si tratterà di un processo sincrono, cioè in tempo reale, senza attendere che la CPU si trovi in un momento morto. Questa scelta deriva dalla scelta progettuale dare priorità all’evitare lo spreco di spazio, piuttosto che alla preservazione dei cicli di clock della CPU. Inoltre lo sviluppo di ZFS da per scontata la presenza di un sistema operativo sottostante che gestisca il multithreading (OpenSolaris, ovviamente) e che sia in grado di sfruttare un hardware in cui l’incremento dei cicli di cpu sia superiore a quello delle fasi di I/O.

L’attivazione della deduplicazione sarà estremamente semplice, ovvero attraverso il comando zfs set dedup=on. Bisognerà però stare attenti a non abusarne in casi in cui i dati presenti sul file system non presentino significative quantità di duplicazioni effettive, in quanto questo si tradurrebbe in aumenti di carico per la CPU senza benefici rilevanti.

E’ ancora allo studio la preparazione di una utility di controllo e ripristino del file system in caso di eventi di danneggiamento disastrosi e imprevisti, analoga al tradizionale fsck ben noto a tutti gli utenti unix.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.