È ormai quasi certo che il supporto nativo a ZFS in Linux non verrà implementato (bisogna accontentarsi di FUSE) ma fa comunque piacere sapere che il famoso filesystem libero sviluppato da Sun ha guadagnato una nuova funzionalità, la de-duplicazione ZFS deduplication.
Come il nome stesso fa intendere, si tratta di una funzionalità che permette di ridurre l´occupazione su disco semplicemente evitando di memorizzare informazioni già presenti.
La de-duplicazione può operare a diversi livelli (file, blocchi, byte) e per ciascuno di essi esegue un checksum con una funzione hash (di default SHA256); ogni "blocco" di dati viene memorizzato in una tabella assieme al suo hash, la sua locazione e un contatore: per ogni nuovo dato con un hash già esistente, ZFS andrà semplicemente ad incrementare il contatore.
È chiaro che questa funzionalità possa avere effetti ridotti su una macchina desktop ma immaginatene l´effetto su un server che ospita backup, macchine virtuali o repository di sorgenti: si potrebbe avere una notevole riduzione di occupazione.
Le probabilità di collisione sono estremamente basse (minori di quelle relative al verificarsi di errori non rilevati in memorie di tipo ECC) ed è comunque possibile attivare un´opzione di ulteriore verifica.
Maggiori informazioni sul funzionamento della ZFS deduplication sono presenti nell´annuncio ufficiale.