着色器常量 (HLSL)

项目
01/20/2024

在着色器模型 4 中，着色器常量存储在内存中的一个或多个缓冲区资源中。它们可以组织成两种类型的缓冲区：常量缓冲区 (cbuffer) 和纹理缓冲区 (tbuffer)。常量缓冲区针对常量变量使用情况进行了优化，其特点是访问延迟较低，CPU 更新更频繁。出于此原因，其他大小、布局和访问限制适用于这些资源。纹理缓冲区像纹理一样进行访问，并且对于任意索引数据的性能更好。无论使用哪种类型的资源，应用程序可创建的常量缓冲区或纹理缓冲区的数量没有限制。

声明常量缓冲区或纹理缓冲区看起来非常类似于 C 中的结构声明，其中添加了 register 和 packoffset 关键字，用于手动分配寄存器或打包数据。


BufferTypeName [: register(b#)] { VariableDeclaration [: packoffset(c#.xyzw)]; ... };

参数

BufferType

[in] 缓冲区类型。

BufferType	说明
cbuffer	常量缓冲区
tbuffer	纹理缓冲区

Name

[in] 包含唯一缓冲区名称的 ASCII 字符串。

register(b#)

[in] 可选关键字，用于手动打包常量数据。常量只能在常量缓冲区中打包在寄存器中，其中起始寄存器由寄存器编号 (#) 提供。

VariableDeclaration

[in] 变量声明，类似于结构成员声明。这可以是任何 HLSL 类型或效果对象（纹理或采样器对象除外）。

packoffset(c#.xyzw)

[in] 可选关键字，用于手动打包常量数据。常量可打包在任何常量缓冲区中，其中寄存器编号由 (#) 提供。子分量打包（使用 xyzw 重排）适用于大小适合单个寄存器（不跨寄存器边界）的常量。例如，float4 无法打包在以 y 分量开始的单个寄存器中，因为它不适合四分量寄存器。

备注

常量缓冲区允许将着色器常量组合在一起并同时提交，而不是逐个调用来单独提交每个常量，这减少了更新着色器常量所需的带宽。

常量缓冲区是像缓冲区一样访问的专用缓冲区资源。每个常量缓冲区最多可容纳 4096 个向量；每个向量最多包含四个 32 位值。每个管道阶段最多可绑定 14 个常量缓冲区（保留 2 个额外槽供内部使用）。

纹理缓冲区是像纹理一样访问的专用缓冲区资源。纹理访问（与缓冲区访问相比）可针对任意索引数据提供更好的性能。每个管道阶段最多可绑定 128 个纹理缓冲区。

缓冲区资源旨在最大程度地减少设置着色器常量开销。效果框架（请参阅 ID3D10Effect 接口）将管理更新常量和纹理缓冲区，你也可使用 Direct3D API 更新缓冲区（请参阅复制和访问资源数据 (Direct3D 10) 以获取信息）。应用程序还可将数据从另一个缓冲区（例如呈现器目标或流输出目标）复制到常量缓冲区中。

有关在 D3D10 应用程序中使用常量缓冲区的详细信息，请参阅资源类型 (Direct3D 10) 和创建缓冲区资源 (Direct3D 10)。

有关在 D3D11 应用程序中使用常量缓冲区的详细信息，请参阅 Direct3D 11 中的缓冲区简介和如何：创建常量缓冲区。

常量缓冲区不需要将视图绑定到管道。但是，纹理缓冲区需要视图，并且必须绑定到纹理槽（或使用效果时必须与 SetTextureBuffer 绑定）。

有两种方法可打包常量数据：使用寄存器 (DirectX HLSL) 和 packoffset (DirectX HLSL) 关键字。

Direct3D 9 与 Direct3D 10 和 11 之间的差异：

与 Direct3D 9 中的常量自动分配不同（Direct3D 9 不执行打包，而是将每个变量分配给一组 float4 寄存器），HLSL 常量变量遵循 Direct3D 10 和 11 中的打包规则。

组织常量缓冲区

常量缓冲区允许将着色器常量组合在一起并同时提交，而不是逐个调用来单独提交每个常量，这减少了更新着色器常量所需的带宽。

有效使用常量缓冲区的最佳方法是，根据它们的更新频率将着色器变量组织成常量缓冲区。这样，应用程序就可最大程度地减少更新着色器常量所需的带宽。例如，着色器可能会声明两个常量缓冲区，并根据更新频率组织每个缓冲区中的数据：需要基于每个对象更新的数据（如世界矩阵）分组到一个可针对每个对象进行更新的常量缓冲区中。这与描述场景特征的数据是分开的，因此更新频率可能要低得多（当场景发生更改时）。

cbuffer myObject
{       
    float4x4 matWorld;
    float3   vObjectPosition;
    int      arrayIndex;
}
 
cbuffer myScene
{
    float3   vSunPosition;
    float4x4 matView;
}

默认常量缓冲区

有两个默认常量缓冲区可用，即 $Global 和 $Param。使用用于 cbuffer 的相同打包方法，将放置在全局范围内的变量隐式添加到 $Global cbuffer。在效果框架外部编译着色器时，函数参数列表中的统一参数显示在 $Param 常量缓冲区中。在效果框架内部编译时，所有统一参数都必须解析为全局范围内定义的变量。

示例

下面是一个来自 Skinning10 示例（它是由矩阵数组组成的纹理缓冲区）的示例。

tbuffer tbAnimMatrices
{
    matrix g_mTexBoneWorld[MAX_BONE_MATRICES];
};

此示例声明手动分配一个常量缓冲区以从特定寄存器开始，并按子分量打包特定元素。

cbuffer MyBuffer : register(b3)
{
    float4 Element1 : packoffset(c0);
    float1 Element2 : packoffset(c1);
    float1 Element3 : packoffset(c1.y);
}

着色器模型 4

着色器常量 (HLSL)

参数

备注

组织常量缓冲区

默认常量缓冲区

示例

反馈

反馈

其他资源

着色器常量 (HLSL)

参数

备注

组织常量缓冲区

默认常量缓冲区

示例

相关主题

反馈

反馈

其他资源