FILESTREAM 概述

大量数据(如文本文档、图像和视频)均为非结构化的数据。这类非结构化的数据通常存储在数据库之外,以便与数据库中的结构化数据分隔开来。这种分隔可能会增加数据管理的复杂程度。或者,如果数据与结构化存储相关联,则可能会限制文件流功能和性能。

通过将 varbinary(max) 二进制大型对象 (BLOB) 数据以文件形式存储在文件系统上,FILESTREAM 使 SQL Server 数据库引擎和 NTFS 文件系统成为了一个整体。Transact-SQL 语句可以插入、更新、查询、搜索和备份 FILESTREAM 数据。通过 Win32 文件系统接口可以流式方式访问数据。

FILESTREAM 使用 NT 系统缓存来缓存文件数据。这有助于减少 FILESTREAM 数据可能对数据库引擎性能产生的任何影响。由于没有使用 SQL Server 缓冲池,因此该内存可用于查询处理。

注意注意

即使启用了透明数据加密,也不会加密 FILESTREAM 数据。

有关如何使用 FILESTREAM 的详细说明,请参阅 FILESTREAM 存储入门

何时使用 FILESTREAM

在 SQL Server 中,BLOB 可以是将数据存储在表中的标准 varbinary(max) 数据,也可以是将数据存储在文件系统中的 FILESTREAM varbinary(max) 对象。数据的大小和应用情况决定您应该使用数据库存储还是文件系统存储。如果满足以下条件,则应考虑使用 FILESTREAM:

  • 所存储的对象平均大于 1 MB。

  • 快速读取访问很重要。

  • 您开发的是使用中间层作为应用程序逻辑的应用程序。

对于较小的对象,将 varbinary(max) BLOB 存储在数据库中通常会提供更为优异的流性能。

FILESTREAM 存储

FILESTREAM 存储以 varbinary(max) 列的形式实现,在该列中数据以 BLOB 的形式存储在文件系统中。BLOB 的大小仅受文件系统容量大小的限制。文件大小为 2 GB 的 varbinary(max) 标准限制不适用于存储在文件系统中的 BLOB。

若要指定列应将数据存储在文件系统中,请对 varbinary(max) 列指定 FILESTREAM 属性。这样数据库引擎会将该列的所有数据存储在文件系统,而不是数据库文件中。

FILESTREAM 数据必须存储在 FILESTREAM 文件组中。FILESTREAM 文件组是包含文件系统目录而非文件本身的专用文件组。这些文件系统目录称为“数据容器”。数据容器是数据库引擎存储与文件系统存储之间的接口。 

使用 FILESTREAM 存储时,请考虑以下内容:

  • 如果表包含 FILESTREAM 列,则每一行都必须具有唯一的一个非空行 ID。

  • 不能嵌套 FILESTREAM 数据容器。

  • 使用故障转移群集时,FILESTREAM 文件组必须位于共享磁盘资源上。

  • FILESTREAM 文件组可位于压缩卷上。

集成安全性

在 SQL Server 中,保护 FILESTREAM 数据的方式与其他数据相同,即通过在表级或列级授予权限。如果用户具有访问表中 FILESTREAM 列的权限,则用户可打开关联文件。

注意注意

FILESTREAM 数据不支持加密。

仅对用于运行 SQL Server 服务帐户的帐户授予访问 FILESTREAM 容器的 NTFS 权限。建议不对其他帐户授予访问数据容器的权限。

集成管理

由于 FILESTREAM 作为 varbinary(max) 列实现并直接集成到数据库引擎中,因此绝大多数 SQL Server 管理工具和函数在使用过程中不会修改 FILESTREAM 数据。例如,您可以对 FILESTREAM 数据使用所有备份模式和恢复模式,并且 FILESTREAM 数据是与数据库中的结构化数据一起进行备份的。如果您不想将 FILESTREAM 数据与关系数据一起备份,则可以使用部分备份将 FILESTREAM 文件组排除在外。

用于访问 BLOB 数据的双编程模型

在将数据存储在 FILESTREAM 列中之后,即可通过使用 Transact-SQL 事务或 Win32 API 访问文件。

Transact-SQL 访问

可以使用 Transact-SQL 来插入、更新和删除 FILESTREAM 数据: 

  • 您可以使用插入操作用 null 值、空值或相对较短的内联数据预填充 FILESTREAM 字段。但是,大量数据将以流的方式更有效地导入到使用 Win32 接口的文件中。

  • 更新 FILESTREAM 字段时,即会修改文件系统中的基础 BLOB 数据。将 FILESTREAM 字段设置为 NULL 即会删除与该字段相关联的 BLOB 数据。您不能使用作为 UPDATE**.**Write() 实现的 Transact-SQL 成块更新以对数据执行部分更新。

  • 当删除行或者删除或截断包含 FILESTREAM 数据的表时,将会删除文件系统中的基础 BLOB 数据。

文件系统流访问

在 SQL Server 事务上下文中支持 Win32 流。在事务之内,可以使用 FILESTREAM 函数来获取文件的逻辑 UNC 文件系统路径。接着使用 OpenSqlFilestream API 来获取文件句柄。然后 Win32 文件流接口(如 ReadFile()WriteFile())可使用此句柄通过文件系统访问并更新文件。 

由于文件操作属于事务操作,因此您无法通过文件系统删除或重命名 FILESTREAM 文件。

语句模型

FILESTREAM 文件系统访问通过使用文件打开和关闭来构建 Transact-SQL 语句模型。当打开文件句柄时,语句开始;当关闭句柄时,语句结束。例如,关闭写句柄时将激发表上注册的任何可能的 AFTER 触发器,就如 UPDATE 语句结束一样。

存储命名空间

在 FILESTREAM 中,数据库引擎控制 BLOB 物理文件系统的命名空间。PathName 是一个新增的内部函数,它提供对应于表中每个 FILESTREAM 单元的 BLOB 的逻辑 UNC 路径。应用程序使用此逻辑路径来获取 Win32 句柄并通过使用常见的 Win32 文件系统接口对 BLOB 数据进行操作。如果 FILESTREAM 列的值为 NULL,则此函数将返回 NULL。

事务文件系统访问

GET_FILESTREAM_TRANSACTION_CONTEXT() 是一个新增的内部函数,它提供表示与会话相关联的当前事物的标记。事务必须已启动,且仍未被中止或提交。通过获取标记,应用程序将 FILESTREAM 文件系统流操作与已启动的事务绑定在一起。在没有显式启动的事务的情况下,此函数将返回 NULL。

在提交或中止事务之前必须关闭所有文件句柄。如果在事务范围之外仍有句柄处于打开状态,则对句柄执行的其他读取将失败,对句柄执行的其他写入将成功,但实际数据不会写入磁盘中。与此类似,如果数据库或数据库引擎实例关闭,则所有处于打开状态的句柄均无效。

事务持久性

在事务提交时,数据库引擎通过使用 FILESTREAM 可确保通过文件系统流访问进行修改的 FILESTREAM BLOB 数据的事务持久性。

从远程客户端写透

对 FILESTREAM 数据的远程文件系统访问是通过 Server Message Block (SMB) 协议启用的。如果客户端为远程客户端,则客户端不对任何写入操作进行缓存。写入操作将始终发送到服务器。服务器端可对数据进行缓存。建议运行在远程客户端上的应用程序合并小型写入操作,以减小使用较大数据大小的写入操作数量。

不支持通过使用 FILESTREAM 句柄创建内存映射视图(内存映射 I/O)。如果内存映射用于 FILESTREAM 数据,则数据库引擎将无法保证数据的一致性和持久性或数据库的完整性。

Windows 徽标认证

已经针对 Windows Server 2008 R2 对 FILESTREAM RsFx 驱动程序进行了认证。有关详细信息和目录文件下载,请参阅 Microsoft 下载中心中的 SQL Server 2008 R2 FileStream 驱动程序 Windows 徽标认证