Installare e abilitare Deduplicazione datiInstall and enable Data Deduplication

Si applica a Windows Server (Canale semestrale), Windows Server 2016Applies to Windows Server (Semi-Annual Channel), Windows Server 2016

In questo argomento viene descritto come installare Deduplicazione dati, valutare i carichi di lavoro per la deduplicazione e abilitare la deduplicazione dei dati su volumi specifici.This topic explains how to install Data Deduplication, evaluate workloads for deduplication, and enable Data Deduplication on specific volumes.

Nota

Se si intende eseguire Deduplicazione dati in un Cluster di failover, ogni nodo del cluster deve avere installato il ruolo del server Deduplicazione dati.If you're planning to run Data Deduplication in a Failover Cluster, every node in the cluster must have the Data Deduplication server role installed.

Installare deduplicazione datiInstall Data Deduplication

Importante

KB4025334 contiene un rollup delle correzioni per Deduplicazione dati, comprese importanti correzioni per l'affidabilità, e ti consigliamo di installarla per usare Deduplicazione dati con Windows Server 2016.KB4025334 contains a roll up of fixes for Data Deduplication, including important reliability fixes, and we strongly recommend installing it when using Data Deduplication with Windows Server 2016.

Installare deduplicazione dati tramite Server ManagerInstall Data Deduplication by using Server Manager

  1. In Aggiunta guidata ruoli e funzionalità selezionare Ruoli server e quindi Deduplicazione dati.In the Add Roles and Feature wizard, select Server Roles, and then select Data Deduplication.
    Installare deduplicazione dati tramite Server Manager: selezionare deduplicazione dati da ruoli del ServerInstall Data Deduplication via Server Manager: select Data Deduplication from Server Roles
  2. Fare clic su Avanti fino a quando il pulsante Installa non è attivo e quindi fare clic su Installa.Click Next until the Install button is active, and then click Install.
    Installare deduplicazione dati tramite Server Manager: fare clic su InstallaInstall Data Deduplication via Server Manager: click install

Installare deduplicazione dati tramite PowerShellInstall Data Deduplication by using PowerShell

Per installare Deduplicazione dati, eseguire il comando di PowerShell seguente come amministratore:To install Data Deduplication, run the following PowerShell command as an administrator:
Install-WindowsFeature -Name FS-Data-Deduplication

Per installare la deduplicazione dei dati in un'installazione di Nano Server:To install Data Deduplication in a Nano Server installation:

  1. Creare un'installazione di Nano Server con l'archiviazione installata come descritto in Guida introduttiva a Nano Server.Create a Nano Server installation with the Storage installed as described in Getting Started with Nano Server.
  2. Da un server che esegue Windows Server 2016 in qualsiasi modalità diversa da Nano Server o da un PC Windows con installato Strumenti di amministrazione remota del server (RSAT), installare Deduplicazione dati con un riferimento esplicito all'istanza di Nano Server, sostituendo 'MyNanoServer' con il nome effettivo dell'istanza di Nano Server:From a server running Windows Server 2016 in any mode other than Nano Server, or from a Windows PC with the Remote Server Administration Tools (RSAT) installed, install Data Deduplication with an explicit reference to the Nano Server instance (replace 'MyNanoServer' with the real name of the Nano Server instance):
    Install-WindowsFeature -ComputerName <MyNanoServer> -Name FS-Data-Deduplication
    

    -OPPURE- -- OR --

Connettersi in remoto all'istanza di Nano Server con la comunicazione remota di PowerShell e usare Gestione e manutenzione immagini distribuzione per installare Deduplicazione dati:Connect remotely to the Nano Server instance with PowerShell remoting and install Data Deduplication by using DISM:

```PowerShell
Enter-PSSession -ComputerName MyNanoServer 
dism /online /enable-feature /featurename:dedup-core /all
```

Abilitare la deduplicazione dei datiEnable Data Deduplication

Determinare quali carichi di lavoro sono indicati per deduplicazione datiDetermine which workloads are candidates for Data Deduplication

Deduplicazione dati può sensibilmente ridurre i costi di utilizzo dei dati delle applicazioni server, riducendo la quantità di spazio su disco occupato dai dati ridondanti.Data Deduplication can effectively minimize the costs of a server application's data consumption by reducing the amount of disk space consumed by redundant data. Prima di abilitare la deduplicazione, è importante comprendere le caratteristiche del proprio carico di lavoro per assicurarsi di ottenere le massime prestazioni di archiviazione.Before enabling deduplication, it is important that you understand the characteristics of your workload to ensure that you get the maximum performance out of your storage. Le classi di carichi di lavoro da considerare sono due:There are two classes of workloads to consider:

  • I carichi di lavoro consigliati che hanno dimostrato di avere sia set di dati per cui la deduplicazione si è rivelata molto vantaggiosa sia modelli di uso delle risorse compatibili con il modello di post-elaborazione della deduplicazione dei dati.Recommended workloads that have been proven to have both datasets that benefit highly from deduplication and have resource consumption patterns that are compatible with Data Deduplication's post-processing model. È consigliabile abilitare sempre Deduplicazione dati su questi carichi di lavoro:We recommend that you always enable Data Deduplication on these workloads:
    • Condivisioni di file server generali come condivisioni di team, home directory utente, cartelle di lavoro e condivisioni per lo sviluppo del software.General purpose file servers (GPFS) serving shares such as team shares, user home folders, work folders, and software development shares.
    • Server VDI (Virtual Desktop Infrastructure).Virtualized desktop infrastructure (VDI) servers.
    • Applicazioni di backup virtualizzate, ad esempio Microsoft Data Protection Manager (DPM).Virtualized backup applications, such as Microsoft Data Protection Manager (DPM).
  • I carichi di lavoro che possono trarre vantaggio dalla deduplicazione, ma non sempre sono indicati per la deduplicazione.Workloads that might benefit from deduplication, but aren't always good candidates for deduplication. Ad esempio, i carichi di lavoro seguenti possono andare bene per la deduplicazione, ma è necessario valutare prima i vantaggi che possono trarne:For example, the following workloads could work well with deduplication, but you should evaluate the benefits of deduplication first:
    • Host Hyper-V per uso genericoGeneral purpose Hyper-V hosts
    • Server SQLSQL servers
    • Server line-of-businessLine-of-business (LOB) servers

Valutare i carichi di lavoro per la deduplicazione dei datiEvaluate workloads for Data Deduplication

Importante

Se si esegue un carico di lavoro consigliato, è possibile ignorare questa sezione e passare a Abilitare Deduplicazione dati per il carico di lavoro.If you are running a recommended workload, you can skip this section and go to Enable Data Deduplication for your workload.

Per determinare se un carico di lavoro è idoneo alla deduplicazione, rispondere alle domande seguenti.To determine whether a workload works well with deduplication, answer the following questions. Se non si è certi dell'idoneità di un carico di lavoro, eseguire una distribuzione pilota di Deduplicazione dati in un set di dati di test per il carico di lavoro e osservarne le prestazioni.If you're unsure about a workload, consider doing a pilot deployment of Data Deduplication on a test dataset for your workload to see how it performs.

  1. Set di dati del carico di lavoro ha una duplicazione sufficiente per trarre vantaggio dall'abilitazione della deduplicazione?Does my workload's dataset have enough duplication to benefit from enabling deduplication?
    Prima di abilitare Deduplicazione dati per un carico di lavoro, verificare quanta duplicazione ha il set di dati del carico di lavoro tramite lo Strumento di valutazione risparmio deduplicazione dati Microsoft, o DDPEval.Before enabling Data Deduplication for a workload, investigate how much duplication your workload's dataset has by using the Data Deduplication Savings Evaluation tool, or DDPEval. Dopo aver installato la deduplicazione dei dati, è possibile trovare questo strumento nel percorso C:\Windows\System32\DDPEval.exe.After installing Data Deduplication, you can find this tool at C:\Windows\System32\DDPEval.exe. DDPEval valuta il potenziale per l'ottimizzazione su volumi direttamente connessi (incluse unità locali o volumi condivisi cluster) e condivisioni di rete mappate o non mappate.DDPEval can evaluate the potential for optimization against directly connected volumes (including local drives or Cluster Shared Volumes) and mapped or unmapped network shares.
      
    L'esecuzione di DDPEval.exe restituirà un output simile al seguente:Running DDPEval.exe will return an output similar to the following:
     
    Data Deduplication Savings Evaluation Tool
    Copyright 2011-2012 Microsoft Corporation. All Rights Reserved.
      
    Evaluated folder: E:\Test
    Processed files: 34
    Processed files size: 12.03MB
    Optimized files size: 4.02MB
    Space savings: 8.01MB
    Space savings percent: 66
    Optimized files size (no compression): 11.47MB
    Space savings (no compression): 571.53KB
    Space savings percent (no compression): 4
    Files with duplication: 2
    Files excluded by policy: 20
    Files excluded by error: 0

  2. Che cosa modelli IO del carico di lavoro a set di dati relativo? Quali prestazioni ha il carico di lavoro?What do my workload's I/O patterns to its dataset look like? What performance do I have for my workload?
    Deduplicazione dati consente di ottimizzare i file come un processo periodico, anziché quando il file viene scritto su disco.Data Deduplication optimizes files as a periodic job, rather than when the file is written to disk. È quindi importante esaminare i modelli di lettura prevista del carico di lavoro per il volume deduplicato.As a result, it is important to examine is a workload's expected read patterns to the deduplicated volume. Poiché Deduplicazione dati sposta il contenuto di file nell'archivio blocchi e tenta il più possibile di organizzare l'archivio blocchi per file, le operazioni di lettura offrono prestazioni ottimali quando vengono applicate a intervalli sequenziali di un file.Because Data Deduplication moves file content into the Chunk Store and attempts to organize the Chunk Store by file as much as possible, read operations perform best when they are applied to sequential ranges of a file.

    I carichi di lavoro simili ai database hanno in genere modelli di lettura più casuali rispetto ai modelli di lettura sequenziali poiché in genere i database non garantiscono che il layout del database sarà ottimale per tutte le query che possono essere eseguite.Database-like workloads typically have more random read patterns than sequential read patterns because databases do not typically guarantee that the database layout will be optimal for all possible queries that may be run. Dal momento che le sezioni dell'archivio blocchi potrebbero esistere in tutto il volume, l'accesso agli intervalli di dati nell'archivio blocchi per le query di database può introdurre una latenza maggiore.Because the sections of the Chunk Store may exist all over the volume, accessing data ranges in the Chunk Store for database queries may introduce additional latency. I carichi di lavoro a prestazioni elevate sono particolarmente sensibili a questa latenza maggiore mentre altri carichi di lavoro di tipo database possono non esserlo altrettanto.High performance workloads are particularly sensitive to this extra latency, but other database-like workloads might not be.

    Nota

    Questi problemi riguardano principalmente i carichi di lavoro di archiviazione in volumi costituiti da supporti di archiviazione rotazionali tradizionali (noti anche come unità disco rigido o HDD).These concerns primarily apply to storage workloads on volumes made up of traditional rotational storage media (also known as Hard Disk drives, or HDDs). Tutte le infrastrutture di archiviazione flash (note anche come unità disco stato solido, o unità SSD), sono meno influenzate dai modelli IO casuali perché una delle proprietà dei supporti flash è il tempo di accesso uguale a tutti i percorsi sul supporto.All-flash storage infrastructure (also known as Solid State Disk drives, or SSDs), is less affected by random I/O patterns because one of the properties of flash media is equal access time to all locations on the media. Di conseguenza, la deduplicazione non introduce la stessa quantità di latenza per le letture nei set di dati del carico di lavoro archiviati in tutti i supporti flash, come avviene nei supporti di archiviazione tradizionale rotazionali.Therefore, deduplication will not introduce the same amount of latency for reads to a workload's datasets stored on all-flash media as it would on traditional rotational storage media.

  3. Quali sono i requisiti di risorse del carico di lavoro sul server?What are the resource requirements of my workload on the server?
    Dal momento che Deduplicazione dati usa un modello di post-elaborazione, deve avere periodicamente risorse di sistema sufficienti per completare l'ottimizzazione e altri processi.Because Data Deduplication uses a post-processing model, Data Deduplication periodically needs to have sufficient system resources to complete its optimization and other jobs. Ciò significa che i carichi di lavoro con tempo di inattività, ad esempio la sera o nei fine settimana, sono ottimi candidati per la deduplicazione e i carichi di lavoro che vengono eseguiti ogni giorno per tutto il giorno.This means that workloads that have idle time, such as in the evening or on weekends, are excellent candidates for deduplication, and workloads that run all day, every day may not be. Anche i carichi di lavoro che non hanno alcun tempo di inattività possono essere validi candidati per la deduplicazione se non hanno requisiti di risorse elevati nel server.Workloads that have no idle time may still be good candidates for deduplication if the workload does not have high resource requirements on the server.

Abilitare la deduplicazione dei datiEnable Data Deduplication

Prima di abilitare la deduplicazione dei dati, è necessario scegliere il tipo di uso che rispecchia maggiormente il carico di lavoro.Before enabling Data Deduplication, you must choose the Usage Type that most closely resembles your workload. I tipi di utilizzo inclusi in Deduplicazione dati sono tre.There are three Usage Types included with Data Deduplication.

Abilitare la deduplicazione dei dati tramite Server ManagerEnable Data Deduplication by using Server Manager

  1. Selezionare Servizi file e archiviazione in Server Manager.Select File and Storage Services in Server Manager.
    Fare clic su servizi File e archiviazioneClick File and Storage Services
  2. Selezionare Volumi da Servizi file e archiviazione.Select Volumes from File and Storage Services.
    Fare clic su volumiClick Volumes
  3. Fare clic con il pulsante destro del mouse sul volume desiderato e selezionare Configura deduplicazione dati.Right-click the desired volume and select Configure Data Deduplication.
    Fare clic su Configura deduplicazione datiClick Configure Data Deduplication
  4. Selezionare il tipo di utilizzo desiderato dalla casella di riepilogo a discesa e selezionare OK.Select the desired Usage Type from the drop-down box and select OK.
    Selezionare il tipo di utilizzo desiderato dall'elenco a discesaSelect the desired Usage Type from the drop down
  5. Se si sta eseguendo un carico di lavoro consigliato, la procedura termina qui.If you are running a recommended workload, you're done. Per altri carichi di lavoro, vedere Altre considerazioni.For other workloads, see Other considerations.

Nota

Per altre informazioni sull'esclusione di estensioni di file o cartelle e sulla selezione della pianificazione della deduplicazione, nonché sui motivi per cui si vuole eseguire questa operazione, vedere Configuring Data Deduplication (Configurazione di Deduplicazione dati).You can find more information on excluding file extensions or folders and selecting the deduplication schedule, including why you would want to do this, in Configuring Data Deduplication.

Abilitare la deduplicazione dei dati tramite PowerShellEnable Data Deduplication by using PowerShell

  1. In un contesto con autorizzazioni di amministratore eseguire il comando di PowerShell seguente:With an administrator context, run the following PowerShell command:

    Enable-DedupVolume -Volume <Volume-Path> -UsageType <Selected-Usage-Type>
    
  2. Se si sta eseguendo un carico di lavoro consigliato, la procedura termina qui.If you are running a recommended workload, you're done. Per altri carichi di lavoro, vedere Altre considerazioni.For other workloads, see Other considerations.

Nota

I cmdlet di PowerShell di Deduplicazione dati, inclusi Enable-DedupVolume, possono essere eseguiti in remoto mediante l'aggiunta del parametro -CimSession con una sessione CIM.The Data Deduplication PowerShell cmdlets, including Enable-DedupVolume, can be run remotely by appending the -CimSession parameter with a CIM Session. Ciò è particolarmente utile per l'esecuzione in modalità remota dei cmdlet di PowerShell di deduplicazione dati per un'istanza di Nano Server.This is particularly useful for running the Data Deduplication PowerShell cmdlets remotely against a Nano Server instance. Per creare una nuova sessione CIM eseguire New-CimSession.To create a new CIM Session run New-CimSession.

Altre considerazioniOther considerations

Importante

Se si esegue un carico di lavoro consigliato, è possibile ignorare questa sezione.If you are running a recommended workload, you can skip this section.

Domande frequenti (FAQ)Frequently asked questions (FAQ)

Voglio eseguire la deduplicazione dei dati nel set di dati per carico di lavoro X. È supportata?I want to run Data Deduplication on the dataset for X workload. Is this supported?
A parte i carichi di lavoro che notoriamente non sono interoperabili con Deduplicazione dati, l'integrità dei dati completa di Deduplicazione dati è supportata con tutti i carichi di lavoro.Aside from workloads that are known not to interoperate with Data Deduplication, we fully support the data integrity of Data Deduplication with any workload. I carichi di lavoro consigliati sono supportati da Microsoft anche per le prestazioni.Recommended workloads are supported by Microsoft for performance as well. Le prestazioni di altri carichi di lavoro dipendono notevolmente dalle attività che eseguono sul server.The performance of other workloads depends greatly on what they are doing on your server. È necessario determinare quale impatto ha Deduplicazione dati sul carico di lavoro in termini di prestazioni e se questo è accettabile per questo carico di lavoro.You must determine what performance impacts Data Deduplication has on your workload, and if this is acceptable for this workload.

Quali sono i requisiti di ridimensionamento del volume per i volumi deduplicati?What are the volume sizing requirements for deduplicated volumes?
In Windows Server 2012 e Windows Server 2012 R2, i volumi dovevano essere ridimensionati con attenzione per assicurarsi che Deduplicazione dati potesse far fronte alla varianza nel volume.In Windows Server 2012 and Windows Server 2012 R2, volumes had to be carefully sized to ensure that Data Deduplication could keep up with the churn on the volume. Questo significava in genere che la dimensione massima media di un volume deduplicato per un carico di lavoro di varianza elevato era 1-2 TB e la dimensione assoluta massima consigliata era 10 TB.This typically meant that the average maximum size of a deduplicated volume for a high-churn workload was 1-2 TB, and the absolute maximum recommended size was 10 TB. In Windows Server 2016 queste limitazioni sono state rimosse.In Windows Server 2016, these limitations were removed. Per altre informazioni, vedere What's new in Data Deduplication (Novità di Deduplicazione dati).For more information, see What's new in Data Deduplication.

È necessario modificare la pianificazione o altre impostazioni di deduplicazione dati per i carichi di lavoro consigliati?Do I need to modify the schedule or other Data Deduplication settings for recommended workloads?
No, i tipi di utilizzo specificati sono stati creati per offrire valori predefiniti ragionevoli per i carichi di lavoro consigliati.No, the provided Usage Types were created to provide reasonable defaults for recommended workloads.

Quali sono i requisiti di memoria per deduplicazione dati?What are the memory requirements for Data Deduplication?
I requisiti minimi di memoria per Deduplicazione dati sono 300 MB + 50 MB per ogni TB di dati logici.At a minimum, Data Deduplication should have 300 MB + 50 MB for each TB of logical data. Ad esempio, se si sta ottimizzando un volume di 10 TB, è necessario un minimo di 800 MB di memoria allocata per la deduplicazione (300 MB + 50 MB * 10 = 300 MB + 500 MB = 800 MB).For instance, if you are optimizing a 10 TB volume, you would need a minimum of 800 MB of memory allocated for deduplication (300 MB + 50 MB * 10 = 300 MB + 500 MB = 800 MB). Mentre la deduplicazione dei dati può ottimizzare un volume con una quantità di memoria così ridotta, risorse così vincolate rallenteranno i processi di deduplicazione dei dati.While Data Deduplication can optimize a volume with this low amount of memory, having such constrained resources will slow down Data Deduplication's jobs.

In una situazione ottimale Deduplicazione dati deve avere almeno 1 GB di memoria per ogni TB di dati logici.Optimally, Data Deduplication should have 1 GB of memory for every 1 TB of logical data. Ad esempio, se si sta ottimizzando un volume di 10 TB, la quantità di memoria allocata ottimale per la deduplicazione dei dati sarebbe di 10 GB (1 GB * 10).For instance, if you are optimizing a 10 TB volume, you would optimally need 10 GB of memory allocated for Data Deduplication (1 GB * 10). Questo rapporto garantisce prestazioni massime per i processi di Deduplicazione dati.This ratio will ensure the maximum performance for Data Deduplication jobs.

Quali sono i requisiti di archiviazione per la deduplicazione dati?What are the storage requirements for Data Deduplication?
In Windows Server 2016 Deduplicazione dati supporta dimensioni di volume fino a 64 TB.In Windows Server 2016, Data Deduplication can support volume sizes up to 64 TB. Per altre informazioni, vedere What's new in Data Deduplication (Novità della deduplicazione dei dati).For more information, view What's new in Data Deduplication.