你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

文档智能查询字段提取

**文档智能现在支持使用查询字段来扩展任何预生成模型的架构,以提取所需的特定字段。 还可以将查询字段添加到布局中,以从表单或文档中提取字段。

注意

文档智能工作室查询字段提取目前可用于布局和预生成模型(UX.Tax 预生成模型除外)。

查询字段或键值对

查询字段和键值对执行类似的函数,在确定要使用哪一个时,需要注意一些区别。

  • 键值对仅适用于布局和发票模型。 如果要扩展预生成模型的架构,请使用查询字段。

  • 你不知道要提取的具体字段,或者字段数较大(大于 20),键值对可能是更好的解决方案。

  • 键值对会提取键和值,因为它们存在于表单或文档中,你需要规划所有键变体。 例如 键 First NameGiven Name。 使用查询字段,你可以定义键和模型,让它们仅提取相应的值。

  • 当所需的值不能描述为文档中的键值对时,请使用查询字段。 例如,合同的协议日期。

对于查询字段提取,请指定要提取的字段,文档智能会相应地分析文档。 下面是一个示例:

  • 如果要在文档智能工作室中处理合同,请使用 2024-02-29-preview2023-10-31-preview 或更高的 API 版本:

    文档智能工作室的查询字段按钮的屏幕截图。

  • AnalyzeDocument 请求过程中,你可以传递字段标签列表,如Party1Party2TermsOfUsePaymentTermsPaymentDate 以及 TermEndDate

    文档智能工作室中查询字段选择窗口的屏幕截图。

  • 除了查询字段,响应还包含模型输出。 有关每个模型提取的功能或架构的列表,请参阅《模型分析功能》。

查询字段 REST API 请求**

将查询字段功能与常规文档模型结合使用,并将字段添加到提取过程,而无需训练自定义模型:

POST https://{endpoint}/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=Terms,PaymentDate HTTP/1.1
Host: *.cognitiveservices.azure.com
Content-Type: application/json
Ocp-Apim-Subscription-Key:

{
  "urlSource": "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/sample-layout.pdf"
}

后续步骤