Definir os casos de uso e a interoperabilidade da Desduplicação de Dados

Concluído

As economias de eliminação de duplicação de dados variam de acordo com o tipo de dados, a combinação de dados, o tamanho dos volumes e os arquivos que esses volumes contêm. Você tem a opção de avaliar a economia por volume antes de habilitar a desduplicação.

Casos de uso de eliminação de duplicação de dados

A lista a seguir fornece cenários típicos de desduplicação e suas respetivas economias de espaço de volume:

Caso de utilização Conteúdo Economia de espaço
Documentos do utilizador Publicação ou compartilhamento de conteúdo de grupo, pastas base do usuário e redirecionamento de perfil para acessar arquivos offline 30 a 50 por cento
Compartilhamentos de implantação de software Binários de software, arquivos cab, arquivos de símbolos, imagens e atualizações 70 a 80 por cento
Bibliotecas de virtualização Armazenamento de arquivos de disco rígido virtual (ou seja, arquivos .vhd e .vhdx) para provisionamento para hipervisores 80 a 95 por cento
Partilha de ficheiros gerais uma combinação de todos os tipos de dados previamente identificados 50 a 60 por cento

A volume hosting optimized data with 80% savings.

Com base nas economias potenciais e no uso típico de recursos no Windows Server, os candidatos à implantação para desduplicação são classificados como ideais, devem ser avaliados ou não como candidatos ideais.

  • Candidatos ideais para a desduplicação:
    • Servidores de redirecionamento de pasta.
    • Depósito de virtualização ou biblioteca de provisionamento.
    • Compartilhamentos de implantação de software.
    • Volumes de backup do Microsoft SQL Server e do Microsoft Exchange Server.
    • Arquivos em servidores de arquivos de expansão (SOFS), volumes compartilhados de cluster (CSVs).
    • VHDs de backup virtualizado (por exemplo, Microsoft System Center Data Protection Manager).
    • VHDs VDI de infraestrutura de desktop virtualizada (apenas VDIs pessoais).

Importante

Na maioria das implantações de VDI, é necessário um planejamento especial para considerar tempestades de inicialização. Este termo refere-se à situação em que muitos utilizadores tentam iniciar sessão simultaneamente na sua VDI, normalmente no início de um dia útil. Uma tempestade de inicialização impõe uma carga pesada ao sistema de armazenamento VDI e pode resultar em longos atrasos para os usuários de VDI durante o login inicial. Você pode minimizar o impacto das tempestades de inicialização habilitando a desduplicação. Dessa forma, os blocos lidos do armazenamento de desduplicação em disco durante a inicialização de VMs são armazenados em cache na memória. Como resultado, as leituras subsequentes não exigem acesso frequente aos blocos no disco porque eles estão disponíveis no cache.

  • Deve ser avaliado com base no conteúdo:

    • Servidores de linha de negócios (LOB).
    • Provedores de conteúdo estático.
    • Servidores Web.
    • Computação de alto desempenho (HPC).
  • Não são candidatos ideais para a desduplicação:

    • Hosts Microsoft Hyper-V.
    • Serviço de Atualização do Windows Server (WSUS).
    • Volumes de banco de dados do SQL Server e do Exchange Server.

Avalie as economias com a Ferramenta de Avaliação de Desduplicação

Você pode usar a Ferramenta de Avaliação de Desduplicação, DDPEval.exe, para determinar a economia esperada da desduplicação em um volume específico. DDPEval.exe suporta a avaliação de unidades locais e compartilhamentos remotos mapeados ou não mapeados.

Gorjeta

Quando você instala o recurso de desduplicação, DDPEval.exe é instalado automaticamente no diretório \Windows\System32\.

Interoperabilidade de Eliminação de Dados Duplicados

No Windows Server, você deve considerar as seguintes tecnologias relacionadas e possíveis problemas ao implantar a Eliminação de Duplicação de Dados:

Windows BranchCache

Você pode otimizar o acesso aos dados pela rede de longa distância (WAN) habilitando o BranchCache nos sistemas operacionais Windows Server e Windows client. Ao combinar as duas tecnologias, todos os arquivos desduplicados já são indexados e hashados, o que acelera o processamento de solicitações de dados de uma filial. Isso é como pré-indexar ou pré-hashing um servidor habilitado para BranchCache.

Nota

O BranchCache é um recurso que pode reduzir a utilização da WAN e melhorar a capacidade de resposta do aplicativo de rede quando os usuários acessam o conteúdo em um escritório central a partir de filiais. Quando você habilita o BranchCache, uma cópia do conteúdo recuperado do servidor Web ou do servidor de arquivos é armazenada em cache na filial. Se outro cliente na filial solicitar o mesmo conteúdo, o cliente poderá baixá-lo diretamente da rede de filiais local em vez de ter que usar novamente a WAN para recuperar o conteúdo do escritório central.

Clusters de Ativação Pós-falha

Os Clusters de Failover suportam totalmente a Desduplicação de Dados, o que significa que os volumes desduplicados farão failover normalmente entre os nós do cluster. No entanto, isso requer que você instale o recurso de Desduplicação de Dados em cada nó do cluster que participa de um failover.

Quotas FSRM

Embora você não deva criar uma cota fixa em uma pasta raiz de volume habilitada para desduplicação, você pode usar o Gerenciador de Recursos de Servidor de Arquivos (FSRM) para criar uma cota flexível nesse cenário. Quando o FSRM encontrar um arquivo desduplicado, ele identificará o tamanho lógico do arquivo para cálculos de cota. Consequentemente, o uso da cota (incluindo quaisquer limites de cota) não muda quando a desduplicação processa um arquivo. Todas as outras funcionalidades de cota do FSRM, incluindo cotas flexíveis de raiz de volume e cotas em subpastas, funcionarão conforme o esperado ao usar a desduplicação.

Nota

O FSRM é um conjunto de ferramentas que ajudam a identificar, controlar e gerenciar o tipo e a quantidade de dados armazenados em seus servidores. O FSRM permite configurar cotas rígidas ou flexíveis em pastas e volumes. Uma cota rígida impede que os usuários salvem arquivos depois que o limite de cota é atingido; Enquanto uma cota flexível não impõe o limite de cota, ela gera uma notificação quando os dados sobre o volume atingem um limite.

Replicação DFS

A Desduplicação de Dados é compatível com a Replicação DFS (Distributed File System). Otimizar ou desotimizar um arquivo não acionará uma replicação porque o arquivo não é alterado. A Replicação DFS usa RDC (compactação diferencial remota) (não os blocos no armazenamento de blocos) para economia over-the-wire.