Tutorial: Copiar dados para o Azure Data Box via NFS

Importante

O Azure Data Box agora dá suporte à atribuição de camada de acesso no nível de blob. As etapas contidas neste tutorial refletem o processo de cópia de dados atualizado e são específicas para bloquear blobs.

Para obter ajuda com a determinação da camada de acesso apropriada para seus dados de blob de bloco, consulte a seção Determinar camadas de acesso apropriadas para blobs de bloco. Siga as etapas contidas na seção Copiar dados para o Data Box para copiar seus dados para a camada de acesso apropriada.

As informações contidas nesta seção aplicam-se a pedidos feitos após 1º de abril de 2024.

Este tutorial descreve como ligar e copiar dados do computador anfitrião com a IU Web local.

Neste tutorial, irá aprender a:

  • Pré-requisitos
  • Ligar ao Data Box
  • Copiar dados para o Data Box

Pré-requisitos

Antes de começar, certifique-se de que:

  1. Conclua o Tutorial: Configurar o Azure Data Box.
  2. Recebe a sua Data Box e o estado da encomenda no portal é Entregue.
  3. Tem um computador anfitrião que inclui os dados que pretende copiar para o Data Box. O seu computador anfitrião deve:
    • Executar um sistema operativo suportado.
    • Estar ligado a uma rede de alta velocidade. Recomendamos vivamente que tenha, pelo menos, uma ligação de 10 GbE. Se não estiver disponível uma ligação de 10 GbE, poderá ser utilizada uma ligação de dados de 1 GbE, mas as velocidades de cópia serão afetadas.

Ligar ao Data Box

Com base na conta de armazenamento selecionada, o Data Box cria até:

  • Três partilhas para cada conta de armazenamento associada de GPv1 e GPv2.
  • Uma partilha para o armazenamento premium.
  • Um compartilhamento para uma conta de armazenamento de blob, contendo uma pasta para cada uma das quatro camadas de acesso.

A tabela a seguir identifica os nomes dos compartilhamentos do Data Box aos quais você pode se conectar e o tipo de dados carregados na sua conta de armazenamento de destino. Ele também identifica a hierarquia de compartilhamentos e diretórios para os quais você copia seus dados de origem.

Tipo de armazenamento Nome da partilha Entidade de primeiro nível Entidade de segundo nível Entidade de terceiro nível
Blob de blocos <storageAccountName>_BlockBlob <\accessTier> <\nome_do_contêiner> <\blockBlob>
Blob de páginas <\storageAccountName>_PageBlob <\nome_do_contêiner> <\pageBlob>
Armazenamento de ficheiros <\storageAccountName>_AzFile <\nome_do_arquivocompartilhamento> <\ficheiro>

Não é possível copiar arquivos diretamente para a pasta raiz de qualquer compartilhamento do Data Box. Em vez disso, crie pastas dentro do compartilhamento Data Box, dependendo do seu caso de uso.

Os blobs de bloco suportam a atribuição de camadas de acesso no nível do arquivo. Antes de copiar arquivos para o compartilhamento de blob de bloco, a prática recomendada é adicionar novas subpastas dentro da camada de acesso apropriada. Em seguida, depois de criar novas subpastas, continue adicionando arquivos a cada subpasta, conforme apropriado.

Um novo contêiner é criado para qualquer pasta que resida na raiz do compartilhamento de blob de bloco. Qualquer arquivo dentro da pasta é copiado para a camada de acesso padrão da conta de armazenamento como um blob de bloco.

Para obter mais informações sobre camadas de acesso de blob, consulte Camadas de acesso para dados de blob. Para obter informações mais detalhadas sobre as práticas recomendadas da camada de acesso, consulte Práticas recomendadas para usar camadas de acesso de blob.

A tabela a seguir mostra o caminho UNC para os compartilhamentos em seu Data Box e a URL correspondente do caminho de Armazenamento do Azure para a qual os dados são carregados. O URL do caminho de Armazenamento do Microsoft Azure final pode derivar do caminho da partilha UNC.

Tipos de Armazenamento do Azure Partilhas de Data Box
Blobs de bloco do Azure
  • Caminho UNC para as partilhas: \\<DeviceIPAddress>\<storageaccountname_BlockBlob>\<accessTier>\<ContainerName>\myBlob.txt
  • URL do Armazenamento do Microsoft Azure: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.txt
  • Blobs de páginas do Azure
  • Caminho UNC para as partilhas: \\<DeviceIPAddress>\<storageaccountname_PageBlob>\<ContainerName>\myBlob.vhd
  • URL do Armazenamento do Microsoft Azure: https://<storageaccountname>.blob.core.windows.net/<ContainerName>/myBlob.vhd
  • Ficheiros do Azure
  • Caminho UNC para as partilhas: \\<DeviceIPAddress>\<storageaccountname_AzFile>\<ShareName>\myFile.txt
  • URL do Armazenamento do Microsoft Azure: https://<storageaccountname>.file.core.windows.net/<ShareName>/myFile.txt
  • Se você estiver usando um computador host Linux, execute as etapas a seguir para configurar o Data Box para permitir o acesso a clientes NFS.

    1. Forneça os endereços IP dos clientes permitidos que podem aceder à partilha. Na IU Web local, aceda à página Ligar e copiar. Em Configurações do NFS, selecione Acesso do cliente NFS.

      Configurar o acesso do cliente NFS

    2. Forneça o endereço IP do cliente NFS e selecione Adicionar. Pode configurar o acesso para vários clientes NFS ao repetir este passo. Selecione OK.

      Configurar o endereço IP de um cliente NFS

    3. Certifique-se de que o computador anfitrião do Linux tem uma versão suportada do cliente NFS instalada. Utilize a versão específica para a distribuição Linux.

    4. Depois de o cliente NFS estar instalado, utilize o comando seguinte para montar a partilha NFS no seu dispositivo Data Box:

      sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>

      Use o exemplo a seguir para se conectar a um compartilhamento do Data Box usando NFS. No exemplo, o IP do dispositivo Data Box é 10.161.23.130. O compartilhamento Mystoracct_Blob é montado no ubuntuVM e o ponto de montagem é /home/databoxubuntuhost/databox.

      sudo mount -t nfs 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      Para clientes Mac, você precisa adicionar uma opção extra da seguinte maneira:

      sudo mount -t nfs -o sec=sys,resvport 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      Importante

      Não é possível copiar arquivos diretamente para a pasta raiz da conta de armazenamento. Dentro da pasta raiz de uma conta de armazenamento de blob de bloco, você encontrará uma pasta correspondente a cada uma das camadas de acesso disponíveis.

      Para copiar seus dados para o Azure Data Box, você deve primeiro selecionar a pasta correspondente a uma das camadas de acesso. Em seguida, crie uma subpasta dentro da pasta dessa camada para armazenar seus dados. Finalmente, copie seus dados para a subpasta recém-criada. Sua nova subpasta representa o contêiner criado na conta de armazenamento durante a ingestão. Seus dados são carregados para esse contêiner como blobs.

    Determinar camadas de acesso apropriadas para blobs de bloco

    Importante

    As informações contidas nesta seção aplicam-se a pedidos feitos após 1ºde abril de 2024.

    O Armazenamento do Azure permite armazenar dados de blob de bloco em várias camadas de acesso dentro da mesma conta de armazenamento. Essa capacidade permite que os dados sejam organizados e armazenados de forma mais eficiente com base na frequência com que são acessados. A tabela a seguir contém informações e recomendações sobre as camadas de acesso do Armazenamento do Azure.

    Escalão de serviço Recomendação Melhor prática
    Muito Interessado Útil para dados on-line acessados ou modificados com frequência. Esse nível tem os custos de armazenamento mais altos, mas os menores custos de acesso. Os dados neste nível devem estar em uso regular e ativo.
    Esporádico Útil para dados on-line acessados ou modificados com pouca frequência. Esse nível tem custos de armazenamento mais baixos e custos de acesso mais altos do que o nível quente. Os dados nessa camada devem ser armazenados por pelo menos 30 dias.
    Sem Interesse Útil para dados on-line acessados ou modificados raramente, mas ainda exigindo recuperação rápida. Esse nível tem custos de armazenamento mais baixos e custos de acesso mais altos do que o nível legal. Os dados nesta camada devem ser armazenados por um período mínimo de 90 dias.
    Arquivo Útil para dados offline raramente acessados e com requisitos de latência mais baixos. Os dados nesta camada devem ser armazenados por um período mínimo de 180 dias. Os dados removidos da camada de arquivamento dentro de 180 dias estão sujeitos a uma taxa de exclusão antecipada.

    Para obter mais informações sobre camadas de acesso de blob, consulte Camadas de acesso para dados de blob. Para obter práticas recomendadas mais detalhadas, consulte Práticas recomendadas para usar camadas de acesso de blob.

    Você pode transferir seus dados de blob de bloco para a camada de acesso apropriada copiando-os para a pasta correspondente dentro do Data Box. Esse processo é discutido com mais detalhes na seção Copiar dados para o Azure Data Box .

    Copiar dados para o Data Box

    Depois de se conectar a um ou mais compartilhamentos do Data Box, a próxima etapa é copiar dados. Antes de começar a cópia de dados, considere as seguintes limitações:

    • Certifique-se de que copia os seus dados para a partilha que corresponde ao formato de dados necessário. Por exemplo, copie dados de blob de bloco para o compartilhamento de blobs de bloco. Copie VHDs para o compartilhamento de blob de página. Se o formato de dados não corresponder ao tipo de compartilhamento apropriado, o carregamento de dados no Azure falhará durante uma etapa posterior.
    • Ao copiar dados para os compartilhamentos AzFile ou PageBlob , primeiro crie uma pasta na raiz do compartilhamento e, em seguida, copie os arquivos para essa pasta.
    • Ao copiar dados para o compartilhamento BlockBlob , crie uma subpasta dentro da camada de acesso desejada e, em seguida, copie os dados para a subpasta recém-criada. A subpasta representa um contêiner no qual os dados são carregados como blobs. Não é possível copiar arquivos diretamente para a pasta raiz de um compartilhamento.
    • Ao copiar dados, verifique se o tamanho dos dados está em conformidade com os limites de tamanho descritos nos limites de tamanho da conta de armazenamento do Azure.
    • Carregamentos simultâneos pelo Data Box e outro aplicativo que não seja Data Box podem resultar em falhas no trabalho de upload e corrupção de dados.
    • Se você usar os protocolos SMB e NFS para cópias de dados, recomendamos que:
      • Use contas de armazenamento diferentes para SMB e NFS.
      • Não copie os mesmos dados para o mesmo destino final no Azure usando SMB e NFS. Nestes casos, não é possível determinar o resultado final.
      • Embora copiar via SMB e NFS em paralelo possa funcionar, não recomendamos fazer isso, pois é propenso a erros humanos. Aguarde até que a cópia de dados SMB esteja concluída antes de iniciar uma cópia de dados NFS.
    • Ao copiar dados para o compartilhamento de blob de bloco, crie uma subpasta dentro da camada de acesso desejada e, em seguida, copie os dados para a subpasta recém-criada. A subpasta representa um contêiner para o qual seus dados são carregados como blobs. Não é possível copiar arquivos diretamente para a pasta raiz na conta de armazenamento.
    • Se ingerir nomes de diretório e arquivo que diferenciam maiúsculas de minúsculas de um compartilhamento NFS para NFS no Data Box:
      • O caso está preservado no nome.

      • Os arquivos não diferenciam maiúsculas de minúsculas.

        Por exemplo, se copiar SampleFile.txt e Samplefile.Txt, o caso é preservado no nome quando copiado para o Data Box. No entanto, como eles são considerados o mesmo arquivo, o último arquivo carregado substitui o primeiro arquivo.

    Importante

    Certifique-se de manter uma cópia dos dados de origem até poder confirmar que os dados foram copiados para o Armazenamento do Azure.

    Se estiver a utilizar um computador anfitrião do Linux, utilize um utilitário de cópia semelhante ao Robocopy. Algumas das alternativas disponíveis no Linux são rsync, FreeFileSync, Unison, ou Ultracopier.

    O comando cp é uma das melhores opções para copiar um diretório. Para obter mais informações sobre a utilização, aceda a cp man pages.

    Se estiver usando rsync a opção para uma cópia multi-threaded, siga estas diretrizes:

    • Instale o pacote CIFS Utils ou NFS Utils consoante o sistema de ficheiros utilizado pelo cliente Linux.

      sudo apt-get install cifs-utils

      sudo apt-get install nfs-utils

    • Install rsync and Parallel (varia dependendo da versão distribuída do Linux).

      sudo apt-get install rsync

      sudo apt-get install parallel

    • Crie um ponto de montagem.

      sudo mkdir /mnt/databox

    • Monte o volume.

      sudo mount -t NFS4 //Databox IP Address/share_name /mnt/databox

    • Espelhe a estrutura do diretório de pastas.

      rsync -za --include='*/' --exclude='*' /local_path/ /mnt/databox

    • Copie os ficheiros.

      cd /local_path/; find -L . -type f | parallel -j X rsync -za {} /mnt/databox/{}

      onde j especifica o número de paralelização, X = número de cópias paralelas

      Recomendamos que comece com 16 cópias paralelas e aumente o número de threads consoante os recursos disponíveis.

    Importante

    Os seguintes tipos de arquivos Linux não são suportados: links simbólicos, arquivos de caracteres, arquivos de bloco, soquetes e pipes. Esses tipos de arquivo resultarão em falhas durante a etapa Preparar para envio .

    As notificações são exibidas durante a proeza de cópia para identificar erros.

    Transferir e ver erros em Ligar e Copiar

    Selecione Transferir lista de problemas.

    Faça o download da lista de problemas para um erro de cópia

    Abra a lista para ver os detalhes do erro e selecione o URL de resolução para ver a resolução recomendada.

    Problemas em uma lista de problemas de erro de cópia

    Para obter mais informações, veja a secção Para obter mais informações, veja a secção Ver registos de erros durante a cópia de dados para o Data Box. Para obter uma lista detalhada de erros durante a cópia de dados, veja a secção Resolver problemas do Data Box.

    Para garantir a integridade dos dados, a soma de verificação é calculada inline à medida que os dados são copiados. Quando a cópia estiver concluída, verifique o espaço utilizado e o espaço livre no seu dispositivo.

    Verificar o espaço livre e utilizado no dashboard

    Próximos passos

    Neste tutorial, ficou a conhecer tópicos do Azure Data Box, como:

    • Pré-requisitos de cópia de dados do Data Box
    • Conectando-se ao Data Box
    • Determinando camadas de acesso apropriadas para blobs de bloco
    • Copiar dados para o Data Box

    Avance para o tutorial seguinte para saber como enviar o Data Box de volta para a Microsoft.