你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure Data Box 限制

部署和操作 Microsoft Azure Data Box 时请考虑这些限制。 下表介绍了 Data Box 的这些限制。

Data Box 服务限制

  • 如果通过 Data Box 服务使用多个存储帐户,则所有存储帐户应属于同一 Azure 区域。
  • 我们建议使用不超过三个存储帐户。 使用更多存储帐户可能影响性能。

Data Box 限制

  • Data Box 最多可存储导入和导出的 5 亿个文件。
  • Data Box 在云中最多支持 512 个容器或共享。 用户共享中的顶层目录将成为云中的容器或 Azure 文件共享。
  • 由于 ReFS 元数据空间消耗,Data Box 用量容量可能小于 80 TiB。
  • Data Box 在 NFS 共享上一次最多支持 10 个客户端连接。

Azure 存储限制

本部分介绍了应用于 Data Box 服务的 Azure 存储服务限制,以及 Azure 文件、Azure 块 blob 和 Azure 页 blob 的必需命名约定。 请仔细查看存储限制并遵循所有建议。

有关 Azure 存储服务限制的最新信息以及对共享、容器和文件进行命名的最佳做法,请转到:

重要

如果有任何文件或目录超出了 Azure 存储服务限制,或者不符合 Azure 文件/Blob 命名约定,则这些文件或目录不会通过 Data Box 服务引入到 Azure 存储中。

数据复制和上传注意事项

导入命令

Data Box 导入命令的注意事项包括:

  • 容器、共享和文件夹:
    • 不要直接将文件复制到任何预创建的共享。 需要在共享下创建文件夹,然后将文件复制到该文件夹。
    • StorageAccount_BlockBlob 和 StorageAccount_PageBlob 下的文件夹为容器。 例如,容器创建为 StorageAccount_BlockBlob/container 和 StorageAccount_PageBlob/container
    • 直接在 StorageAccount_AzFile 下创建的每个文件夹都将转换为 Azure 文件共享。
    • Azure Blob 存储不支持目录。 如果在 StorageAccount_BlockBlob 文件夹下创建文件夹,将以 blob 的名义创建虚拟文件夹。 对于 Azure 文件,将维护实际的目录结构。
  • 合并文件夹内容:
    • 写入到 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 共享中的每个文件将分别上传为块 blob 和页 blob
    • 如果文件夹与现有容器同名,则文件夹的内容将与容器的内容合并。 云中尚未有的文件或 Blob 将添加到容器中。 如果某个文件或 Blob 与容器中已有的文件或 Blob 同名,则会覆盖现有文件或 Blob。
    • 如果容器具有同名的现有存档 blob,上传到存档层中的 blob 将失败。 当 blob 位于存档层时,无法对其进行读取或修改。 如果需要覆盖 blob,请确保 blob 未设置为存档。 有关详细信息,请参阅存档访问层
    • 在 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 文件夹下创建的任何空目录层次结构(没有任何文件)都不会上传
  • Azure Data Box 不支持将数据导入 NFS Azure 文件共享。 如果将数据从 Data Box 复制到现有的 NFS Azure 文件共享中,名称与源文件夹相同,会产生冲突。 为了解决此冲突,Data Box 会将源共享重命名为 databox-<GUID>,并将其作为 SMB Azure 文件共享上传到目标存储帐户。
  • 如果将 SMB 和 NFS 协议用于数据副本,建议:
    • 对 SMB 和 NFS 使用不同的存储帐户。
    • 不要使用 SMB 和 NFS 将相同的数据复制到 Azure 中的同一端目标。 在这些情况下,最终的结果不可确定。
    • 尽管可以同时通过 SMB 和 NFS 进行复制,但我们不建议这样做,因为这很容易出现人为错误。 等待 SMB 数据复制完成,然后启动 NFS 数据复制。
  • 上传管理:
    • 为了提高数据上传期间的性能,建议在存储帐户上启用大型文件共享并将共享容量增大到 100 TiB
    • 如果将数据上传到 Azure 时发生任何错误,则会在目标存储帐户中创建一个错误日志。 当上传完成时,可以找到此错误日志的路径,并且可以查看此日志来采取纠正措施。 在验证上传的数据之前,不要删除源中的数据。
    • 根据保留 Azure Data Box 的文件 ACL、属性和时间戳中的指南将数据上传到 Azure 文件存储时,可以保留文件元数据和 NTFS 权限。
    • 在将 Blob 和 Azure 文件存储上传到云时,将保留文件的层次结构。 例如,你在以下路径复制了一个文件:<container folder>\A\B\C.txt。 此文件将上传到云中的相同路径。
    • 如果文件的“CreateTime”或“LastWriteTime”字段在上传期间超出允许的大小,则 Azure 文件属性中的原始日期替换为“9999 年 12 月 31 日,周五,23:59:59”。 文件上传成功,未引发任何错误。

导出命令

Data Box 导出命令的注意事项包括:

  • Data Box 是一种基于 Windows 的设备,不支持区分大小写的文件名。 例如,Azure 中可能有两个不同的文件,其名称大小写不同。 请勿使用 Data Box 来导出这些文件,因为文件将在设备上被覆盖。
  • 如果输入文件或标记中存在引用相同数据的重复标记,则 Data Box 导出可能会跳过或覆盖文件。 Azure 门户显示的文件数和数据大小可能不同于设备上数据的实际大小。
  • Data Box 通过 SMB 将数据导出到基于 Windows 的系统,并受文件和文件夹的 SMB 限制的约束。 名称不受支持的文件和文件夹不会导出。
  • 从前缀到容器的映射为 1:1。
  • 文件名的大小最大为 1024 个字符。 超过此长度的文件名不会被导出。
  • (在命令创建过程中上传的)Xml文件中的重复前缀会导出 。 重复的前缀不会被省略。
  • 页 blob 和容器名称区分大小写。 如果大小写不匹配,将找不到 blob 和/或容器。

Azure 存储帐户大小限制

下面是对复制到存储帐户的数据的大小限制。 请确保上传的数据符合这些限制。 有关这些限制的最新信息,请参阅 Blob 存储的可伸缩性和性能目标Azure 文件存储的可伸缩性和性能目标

复制到 Azure 存储帐户的数据的大小 默认限制
块 Blob 和页 blob 最大限制与为 Azure 订阅规定的存储限制相同,并且包含来自所有源(包括 Data Box)的数据。
Azure 文件
  • 如果在创建 Data Box 订单之前启用 Data Box,则 Data Box 将支持大型文件共享 (100 TiB)。
  • Data Box 支持 Azure 高级文件共享,允许存储帐户中的所有共享总共有 100 TiB。

Azure 对象大小限制

下面是可以写入的 Azure 对象的大小。 请确保上传的所有文件都符合这些限制。

Azure 对象类型 默认限制
块 blob 14 TiB
页 blob 4 TiB
以页 Blob 格式上传的文件都必须是 512 字节对齐(整数倍),否则上传失败。
VHD 和 VHDX 为 512 字节对齐。
Azure 文件 4 TiB
托管磁盘 4 TiB
有关大小和限制的详细信息,请参阅:
  • 标准 SSD 的可伸缩性目标
  • 高级 SSD 的可伸缩性目标
  • 标准 HDD 的可伸缩性目标
  • 托管磁盘的定价和计费
  • Azure 块 blob、页 blob 和文件命名约定

    实体 约定
    块 Blob 和页 Blob 的容器名称 必须是有效的 DNS 名称,长度为 3 到 63 个字符。
    必须以字母或数字开头。
    只能包含小写字母、数字和连字符 (-)。
    每个连字符 (-) 字符的前后必须紧接字母或数字。
    名称中不允许连续的连字符。
    Azure 文件的共享名 同上
    Azure 文件的目录和文件名
  • 保留大小写,不区分大小写,并且长度不能超过 255 个字符。
  • 不能以正斜杠 (/) 结尾。
  • 如有,则将自动删除。
  • 不允许使用以下字符:" \ / : | < > * ?
  • 必须正确地对保留的 URL 字符进行转义。
  • 不允许使用非法的 URL 路径字符。 \uE000 之类的码位是无效的 Unicode 字符。 也不允许使用某些 ASCII 或 Unicode 字符,如控制字符(0x00 到 0x1F、\u0081 等等)。 有关适用于 HTTP/1.1 中字符串的规则,请参阅第 2.2 节 RFC 2616:基本规则和 RFC 3987。
  • 不允许使用以下文件名:LPT1、LPT2、LPT3、LPT4、LPT5、LPT6、LPT7、LPT8、LPT9、COM1、COM2、COM3、COM4、COM5、COM6、COM7、COM8、COM9、PRN、AUX、NUL、CON、CLOCK$、圆点字符 (.) 和两个圆点字符 (..)。
  • 块 Blob 和页 Blob 的 Blob 名称
  • Blob 名称区分大小写,只能包含字符的任意组合。
  • Blob 名称的长度必须为 1 到 1,024 个字符。
  • 必须正确地对保留的 URL 字符进行转义。
  • 构成 Blob 名称的路径段数目不能超过 254 个。 路径段是指对应于虚拟目录名称的相邻分隔符(例如,正斜杠“/”)之间的字符串。