Tutorial: Copia de datos a Azure Data Box Disk mediante NFS

En este tutorial se describe cómo conectarse al equipo host y copiar datos desde él mediante la interfaz de usuario web local.

En este tutorial, aprenderá a:

  • Requisitos previos
  • Conexión a un dispositivo Data Box
  • Copia de datos a un dispositivo Data Box

Requisitos previos

Antes de comenzar, asegúrese de que:

  1. Ha completado el Tutorial: Instalación de un dispositivo Azure Data Box.
  2. Ha recibido su dispositivo Data Box y el estado del pedido en el portal se actualiza a Delivered (Entregado).
  3. Tiene un equipo host con los datos que desea copiar en su dispositivo Data Box. El equipo host debe:
    • Ejecutar un sistema operativo admitido.
    • Estar conectado a una red de alta velocidad. Es muy recomendable tener una conexión de 10 GbE como mínimo. Si no hay disponible una conexión de 10 GbE, se puede usar un vínculo de datos de 1 GbE, pero las velocidades de copia se verán afectadas.

Conexión a un dispositivo Data Box

En función de la cuenta de almacenamiento seleccionada, Data Box crea hasta:

  • Tres recursos compartidos para cada cuenta de almacenamiento asociada (GPv1 y GPv2).
  • Un recurso compartido para Premium Storage.
  • Un recurso compartido para una cuenta de Blob Storage.

En los recursos compartidos de blob en bloques y en páginas, las entidades de primer nivel son contenedores y las entidades de segundo nivel son blobs. En los recursos compartidos de Azure Files, las entidades de primer nivel son los recursos compartidos y las entidades de segundo nivel son los archivos.

En la tabla siguiente se muestra la ruta de acceso UNC a los recursos compartidos en la dirección URL de la ruta de acceso de Data Box y Azure Storage donde se cargan los datos. La dirección URL final de la ruta de acceso de Azure Storage se puede derivar a partir de la ruta de acceso UNC al recurso compartido.

Tipo de instancia de Azure Storage Recursos compartidos de Data Box
Blobs en bloques de Azure
  • Ruta de acceso UNC a recursos compartidos: //<DeviceIPAddress>/<StorageAccountName_BlockBlob>/<ContainerName>/files/a.txt
  • Dirección URL de Azure Storage: https://<StorageAccountName>.blob.core.windows.net/<ContainerName>/files/a.txt
  • Blobs en páginas de Azure
  • Ruta de acceso UNC a recursos compartidos: //<DeviceIPAddres>/<StorageAccountName_PageBlob>/<ContainerName>/files/a.txt
  • Dirección URL de Azure Storage: https://<StorageAccountName>.blob.core.windows.net/<ContainerName>/files/a.txt
  • Azure Files
  • Ruta de acceso UNC a recursos compartidos: //<DeviceIPAddres>/<StorageAccountName_AzFile>/<ShareName>/files/a.txt
  • Dirección URL de Azure Storage: https://<StorageAccountName>.file.core.windows.net/<ShareName>/files/a.txt
  • Blobs en bloques de Azure (archivo)
  • Ruta de acceso UNC a recursos compartidos: //<DeviceIPAddres>/<StorageAccountName_BlockBlobArchive>/<ContainerName>/files/a.txt
  • Dirección URL de Azure Storage: https://<StorageAccountName>.blob.core.windows.net/<ContainerName>/files/a.txt
  • Si usa un equipo host Linux, realice los pasos siguientes para configurar un dispositivo Data Box para que pueda acceder a los clientes NFS.

    1. Proporcione las direcciones IP de los clientes autorizados que pueden acceder al recurso compartido. En la interfaz de usuario web local, vaya a la página Connect and copy (Conectar y copiar). En NFS settings (Configuración de NFS), haga clic en NFS client access (Acceso de cliente NFS).

      Configure NFS client access

    2. Proporcione la dirección IP del cliente NFS y haga clic en Add (Agregar). Para configurar el acceso para varios clientes NFS, repita este paso. Haga clic en OK.

      Configure IP address of an NFS client

    3. Asegúrese de que el equipo host de Linux tiene instalada una versión admitida del cliente NFS. Use la versión específica para su distribución de Linux.

    4. Una vez instalado el cliente NFS, use el siguiente comando para montar el recurso compartido NFS en el dispositivo Data Box:

      sudo mount <Data Box device IP>:/<NFS share on Data Box device> <Path to the folder on local Linux computer>

      En el ejemplo siguiente se muestra cómo conectarse mediante NFS a un recurso compartido de Data Box. La dirección IP del dispositivo Data Box es 10.161.23.130; el recurso compartido Mystoracct_Blob se monta en la máquina virtual ubuntuVM y el punto de montaje es /home/databoxubuntuhost/databox.

      sudo mount -t nfs 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      Para los clientes de Mac, debe agregar una opción adicional como sigue:

      sudo mount -t nfs -o sec=sys,resvport 10.161.23.130:/Mystoracct_Blob /home/databoxubuntuhost/databox

      Cree siempre una carpeta para los archivos que se va a copiar en el recurso compartido y, después, copie los archivos en ella. La carpeta que se creó en los recursos compartidos de blob en bloques y blob en páginas representa un contenedor en el que los datos se cargan como blobs. No se pueden copiar los archivos directamente en la carpeta root de la cuenta de almacenamiento.

    Copia de datos a un dispositivo Data Box

    Una vez que esté conectado a los recursos compartidos de Data Box, el siguiente paso es copiar los datos. Antes de comenzar la copia de datos, revise las consideraciones siguientes:

    • Es responsabilidad suya asegurarse de que copia los datos en los recursos compartidos que se corresponden con el formato de datos adecuado. Por ejemplo, copie los datos de blobs en bloques en la carpeta para blobs en bloques. Copia de discos duros virtuales en blobs en páginas. Si el formato de los datos no coincide con el recurso compartido correspondiente, la carga de datos en Azure producirá un error más adelante.
    • Al copiar los datos, asegúrese de que su tamaño se ajusta a los límites descritos en los límites de tamaño de las cuentas de almacenamiento de Azure.
    • Si los datos que va a cargar el dispositivo Data Box los están cargando a la vez otras aplicaciones fuera del dispositivo Data Box, podría provocar errores en el trabajo de carga y daños en los datos.
    • Si usa los protocolos SMB y NFS para las copias de datos, se recomienda que:
      • Use diferentes cuentas de almacenamiento para SMB y NFS.
      • No copie los mismos datos en el mismo destino final de Azure mediante SMB y NFS. En estos casos, no se puede determinar el resultado final.
      • Aunque la copia a través de SMB y NFS en paralelo puede funcionar, no se recomienda hacerlo, ya que esto es propenso a errores humanos. Espere hasta que se complete la copia de datos SMB antes de iniciar una copia de datos NFS.
    • Cree siempre una carpeta para los archivos que se va a copiar en el recurso compartido y, después, copie los archivos en ella. La carpeta que se creó en los recursos compartidos de blob en bloques y blob en páginas representa un contenedor en el que los datos se cargan como blobs. No se pueden copiar los archivos directamente en la carpeta root de la cuenta de almacenamiento.
    • Si se ingieren nombres de archivos y directorios que distinguen entre mayúsculas y minúsculas de un recurso compartido de NFS en NFS en Data Box:
      • Se conservan las mayúsculas y minúsculas en el nombre.

      • Los archivos no distinguen mayúsculas de minúsculas.

        Por ejemplo, si copia SampleFile.txt y Samplefile.Txt, se conservarán las mayúsculas y minúsculas del nombre cuando se copian en Data Box, pero el segundo archivo sobrescribirá el primero porque considera que son el mismo archivo.

    Importante

    Asegúrese de conservar una copia de los datos de origen hasta que pueda confirmar que Data Box los ha transferido a Azure Storage.

    Si su equipo es un host Linux, use una utilidad de copia similar a Robocopy. Algunas de las alternativas disponibles en Linux son rsync, FreeFileSync, Unison o Ultracopier.

    El comando cp es una de las mejores opciones para copiar un directorio. Para más información sobre cómo usarlo, consulte las páginas sobre cp.

    Si usa la opción rsync para una copia multiproceso, siga estas directrices:

    • Instale el paquete CIFS Utils o NFS Utils según el sistema de archivos que use el cliente Linux.

      sudo apt-get install cifs-utils

      sudo apt-get install nfs-utils

    • Instale rsync y Parallel (varía según la versión de la distribución de Linux).

      sudo apt-get install rsync

      sudo apt-get install parallel

    • Cree un punto de montaje.

      sudo mkdir /mnt/databox

    • Monte el volumen.

      sudo mount -t NFS4 //Databox IP Address/share_name /mnt/databox

    • Refleje la estructura de directorios de carpetas.

      rsync -za --include='*/' --exclude='*' /local_path/ /mnt/databox

    • Copie los archivos.

      cd /local_path/; find -L . -type f | parallel -j X rsync -za {} /mnt/databox/{}

      donde "j" especifica el número de la paralelización; X = número de copias en paralelo.

      Se recomienda empezar con 16 copias en paralelo y aumentar el número de subprocesos según los recursos disponibles.

    Importante

    No se admiten los siguientes tipos de archivos de Linux: vínculos simbólicos, archivos de caracteres, archivos de bloqueo, sockets y canalizaciones. Estos tipos de archivo generarán errores durante el paso Preparación para el envío.

    Si durante el proceso de copia se produce algún error, aparecerá una notificación.

    Download and view errors on Connect and copy

    Seleccione Descargar la lista de problemas.

    Download the issues list for a copy error

    Abra la lista para ver los detalles del error y seleccione la dirección URL de resolución para ver la resolución recomendada.

    Issues in a copy error issues list

    Para más información, consulte Ver registro de errores durante la copia de datos en Data Box. Para obtener una lista detallada de errores durante la copia de datos, consulte Solución de problemas de Data Box.

    Para garantizar la integridad de los datos, la suma de comprobación se calcula a medida que los datos se copian. Una vez completada la copia, compruebe el espacio utilizado y el espacio disponible en el dispositivo.

    Verify free and used space on dashboard

    Pasos siguientes

    En este tutorial, ha obtenido información acerca de varios temas relacionados con Azure Data Box, como:

    • Requisitos previos
    • Conexión a un dispositivo Data Box
    • Copia de datos a un dispositivo Data Box

    En el siguiente tutorial aprenderá a enviar su dispositivo Data Box a Microsoft.