大容量导入和导出 XML 文档的示例

可以将 XML 文档大容量导入到 SQL Server 数据库中,也可以从 SQL Server 数据库中大容量导出 XML 文档。本主题提供了这两种情况的示例。

若要将数据从一个数据文件大容量导入 SQL Server 表或未分区视图,可以使用以下工具或命令:

  • bcp 实用工具

    还可以使用 bcp 实用工具将数据从可执行 SELECT 语句的 SQL Server 数据库的任意位置(包括分区视图)导出。

  • BULK INSERT

  • INSERT ...SELECT * FROM OPENROWSET(BULK...)

有关详细信息,请参阅使用 bcp 实用工具导入和导出大容量数据使用 BULK INSERT 或 OPENROWSET(BULK...) 导入大容量数据

示例

下列示例说明了以下操作内容:

  • A. 以二进制字节流的形式大容量导入 XML 数据

  • B. 将 XML 数据大容量导入现有行中

  • C. 从包含 DTD 的文件中大容量导入 XML 数据

  • D. 使用格式化文件显式指定字段终止符

  • E. 大容量导出 XML 数据

A. 以二进制字节流的形式大容量导入 XML 数据

在从文件大容量导入 XML 数据时,如果文件中包含您要应用的编码声明,则应在 OPENROWSET(BULK…) 子句中指定 SINGLE_BLOB 选项。SINGLE_BLOB 选项可确保 SQL Server 中的 XML 分析器根据 XML 声明中指定的编码方案导入数据。

示例表

若要测试示例 A,必须创建示例表 T。

USE tempdb
CREATE TABLE T (IntCol int, XmlCol xml)
GO

示例数据文件

在运行示例 A 之前,必须先创建一个 UTF-8 编码文件 (C:\SampleFolder\SampleData3.txt),该文件应包含指定了 UTF-8 编码方案的以下示例实例。

<?xml version="1.0" encoding="UTF-8"?>
<Root>
          <ProductDescription ProductModelID="5">
             <Summary>Some Text</Summary>
          </ProductDescription>
</Root>

示例 A

此示例使用 INSERT ... SELECT * FROM OPENROWSET(BULK...) 语句中的 SINGLE_BLOB 选项从名为 SampleData3.txt 的文件中导入数据,并在包含单列的示例表 T 中插入一个 XML 实例。

INSERT INTO T(XmlCol)
SELECT * FROM OPENROWSET(
   BULK 'c:\SampleFolder\SampleData3.txt',
   SINGLE_BLOB) AS x

注释

在这个例子中,通过使用 SINGLE_BLOB,可以避免 XML 文档的编码(由 XML 编码声明所指定)与服务器隐含使用的字符串代码页不匹配的问题。

如果使用 NCLOB 或 CLOB 数据类型且遇到代码页或编码冲突,则必须执行下列操作之一:

  • 删除 XML 声明,以成功导入 XML 数据文件的内容。

  • 在查询的 CODEPAGE 选项中指定一个代码页,该代码页须与 XML 声明中使用的编码方案相匹配。

  • 使用非 Unicode XML 编码方案匹配或解析数据库排序规则设置。

[返回页首]

B. 将 XML 数据大容量导入现有行中

此示例使用 OPENROWSET 大容量行集提供程序向示例表 T 中的现有行添加一个 XML 实例。

注意注意

若要运行此示例,必须先完成示例 A 中提供的测试脚本。该示例创建了 tempdb.dbo.T 表,并从 SampleData3.txt 中大容量导入数据。

示例数据文件

示例 B 使用的是上例所使用 SampleData3.txt 示例数据文件的修改版本。若要运行此示例,请按如下所示修改此文件的内容:

<Root>
          <ProductDescription ProductModelID="10">
             <Summary>Some New Text</Summary>
          </ProductDescription>
</Root>

示例 B

-- Query before update shows initial state of XmlCol values.
SELECT * FROM T
UPDATE T
SET XmlCol =(
SELECT * FROM OPENROWSET(
   BULK 'C:\SampleFolder\SampleData3.txt',
           SINGLE_BLOB
) AS x
)
WHERE IntCol = 1
GO

[返回页首]

C. 从包含 DTD 的文件中大容量导入 XML 数据

安全说明安全说明

若非您的 XML 环境有特殊要求,建议不要启用对文档类型定义 (DTD) 的支持。启用 DTD 支持会增加服务器的可攻击外围应用,并且可能会使它受到拒绝服务攻击。如果必须启用 DTD 支持,可以通过仅处理可信的 XML 文档来降低安全风险。

在尝试使用 bcp 命令从包含 DTD 的文件中导入 XML 数据的过程中,可能会出现如下错误:

“SQLState = 42000,NativeError = 6359”

“错误 = [Microsoft][SQL Server Native Client][SQL Server]不允许使用内部子集 DTD 分析 XML。请将 CONVERT 与样式选项 2 一起使用,以启用有限的内部子集 DTD 支持。”

“BCP 复制 %s 失败”

若要解决此问题,可以使用 OPENROWSET(BULK...) 函数,并在命令的 SELECT 子句中指定 CONVERT 选项,以从包含 DTD 的数据文件中导入 XML 数据。该命令的基本语法如下:

INSERT ... SELECT CONVERT(…) FROM OPENROWSET(BULK...)

示例数据文件

在测试此大容量导入示例之前,需要先创建一个包含以下示例实例的文件 (C:\temp\Dtdfile.xml):

<!DOCTYPE DOC [<!ATTLIST elem1 attr1 CDATA "defVal1">]><elem1>January</elem1>

示例表

示例 C 使用由以下 CREATE TABLE 语句创建的 T1 示例表:

USE tempdb
CREATE TABLE T1(XmlCol xml);
GO

示例 C

此示例使用 OPENROWSET(BULK...),并在 SELECT 子句中指定了 CONVERT 选项,从而将 XML 数据从 Dtdfile.xml 导入到了示例表 T1 中。

INSERT T1
  SELECT CONVERT(xml, BulkColumn, 2) FROM 
    OPENROWSET(Bulk 'c:\temp\Dtdfile.xml', SINGLE_BLOB) [rowsetresults]

执行 INSERT 语句后,会将 DTD 从 XML 中提取出来,并存储到 T1 表中。

[返回页首]

D. 使用格式化文件显式指定字段终止符

下面的示例说明如何大容量导入 XML 文档 Xmltable.dat。

示例数据文件

Xmltable.dat 中的文档包含两个 XML 值,每行一个。第一个 XML 值的编码为 UTF-16,第二个值的编码为 UTF-8。

下面的十六进制转储显示了此数据文件的内容:

FF FE 3C 00 3F 00 78 00-6D 00 6C 00 20 00 76 00  *..<.?.x.m.l. .v.*
65 00 72 00 73 00 69 00-6F 00 6E 00 3D 00 22 00  *e.r.s.i.o.n.=.".*
31 00 2E 00 30 00 22 00-20 00 65 00 6E 00 63 00  *1...0.". .e.n.c.*
6F 00 64 00 69 00 6E 00-67 00 3D 00 22 00 75 00  *o.d.i.n.g.=.".u.*
74 00 66 00 2D 00 31 00-36 00 22 00 3F 00 3E 00  *t.f.-.1.6.".?.>.*
3C 00 72 00 6F 00 6F 00-74 00 3E 00 A2 4F 9C 76  *<.r.o.o.t.>..O.v*
0C FA 77 E4 80 00 89 00-00 06 90 06 91 2E 9B 2E  *..w.............*
99 34 A2 34 86 00 83 02-92 20 7F 02 4E C5 E4 A3  *.4.4..... ..N...*
34 B2 B7 B3 B7 FE F8 FF-F8 00 3C 00 2F 00 72 00  *4.........<./.r.*
6F 00 6F 00 74 00 3E 00-00 00 00 00 7A EF BB BF  *o.o.t.>.....z...*
3C 3F 78 6D 6C 20 76 65-72 73 69 6F 6E 3D 22 31  *<?xml version="1*
2E 30 22 20 65 6E 63 6F-64 69 6E 67 3D 22 75 74  *.0" encoding="ut*
66 2D 38 22 3F 3E 3C 72-6F 6F 74 3E E4 BE A2 E7  *f-8"?><root>....*
9A 9C EF A8 8C EE 91 B7-C2 80 C2 89 D8 80 DA 90  *................*
E2 BA 91 E2 BA 9B E3 92-99 E3 92 A2 C2 86 CA 83  *................*
E2 82 92 C9 BF EC 95 8E-EA 8F A4 EB 88 B4 EB 8E  *................*
B7 EF BA B7 EF BF B8 C3-B8 3C 2F 72 6F 6F 74 3E  *.........</root>*
00 00 00 00 7A                                   *....z*

示例表

大容量导入或导出 XML 文档时,应当使用在任何文档中都不可能出现的字段终止符;例如,在连续四个 Null (\0) 后紧跟字母 z:\0\0\0\0z。

此示例说明如何为 xTable 示例表使用此字段终止符。若要创建此示例表,请使用下列 CREATE TABLE 语句:

USE tempdb
CREATE TABLE xTable (xCol xml);
GO

示例格式化文件

必须在格式化文件中指定字段终止符。示例 D 使用了一个名为 Xmltable.fmt 的非 XML 格式化文件,该文件包含以下内容:

9.0
1
1       SQLBINARY     0       0       "\0\0\0\0z"    1     xCol         ""

可以使用此格式化文件并通过 bcp 命令、BULK INSERT 语句或 INSERT ... SELECT * FROM OPENROWSET(BULK...) 语句将 XML 文档大容量导入到 xTable 表中。

示例 D

此示例在 BULK INSERT 语句中使用 Xmltable.fmt 格式化文件来导入 XML 数据文件 Xmltable.dat 中的内容。

BULK INSERT xTable 
FROM 'C:\Xmltable.dat'
WITH (FORMATFILE = 'C:\Xmltable.fmt');
GO

[返回页首]

E. 大容量导出 XML 数据

下面的示例使用 bcp 命令和同一个 XML 格式化文件从上一示例所创建的表中大容量导出 XML 数据。在下面的 bcp 命令中,<server_name> 和 <instance_name> 代表必须使用相应的值替换的占位符:

bcp bulktest..xTable out a-wn.out -N -T -S<server_name>\<instance_name>
注意注意

在数据库中持久保留 XML 数据时,SQL Server 不保存 XML 编码。因此,在导出 XML 数据时,XML 字段的原始编码将不可用。导出 XML 数据时,SQL Server 使用 UTF-16 编码。

[返回页首]