m4x4 - vs
4 要素ベクトルと 4x4 行列の積を計算します。
構文
m4x4 dst, src0, src1 |
---|
この場合
- dst はデスティネーション レジスタです。結果は 4 要素ベクトルになります。
- src0 は 4 要素ベクトルを表すソース レジスタです。
- src1 は 4x4 行列を表すソース レジスタです。これは、連続する 4 つのレジスタの最初のレジスタに相当します。
解説
頂点シェーダーのバージョン | 1_1 | 2_0 | 2_x | 2_sw | 3_0 | 3_sw |
---|---|---|---|---|---|---|
m4x4 | x | x | x | x | x | x |
デスティネーション レジスタには xyzw (デフォルト) マスクが必要です。正負の反転およびスィズルの修飾子は、src0 には使用できますが、src1 には使用できません。
スィズルおよび正負の反転の修飾子は、src0 レジスタに対しては無効です。dest レジスタと src0 レジスタを同じにすることはできません。
次のコードは、実行される演算を示しています。
dest.x = (src0.x * src1.x) + (src0.y * src1.y) + (src0.z * src1.z) +
(src0.w * src1.w);
dest.y = (src0.x * src2.x) + (src0.y * src2.y) + (src0.z * src2.z) +
(src0.w * src2.w);
dest.z = (src0.x * src3.x) + (src0.y * src3.y) + (src0.z * src3.z) +
(src0.w * src3.w);
dest.w = (src0.x * src4.x) + (src0.y * src4.y) + (src0.z * src4.z) +
(src0.w * src4.w);
入力ベクトルはレジスタ src0 にあります。下の展開に示すように、入力の 4x4 行列は、レジスタ src1 と、それに続く 3 つの上位レジスタにあります。
この処理は一般に、射影行列による位置座標のトランスフォームに使われます。この命令は、次に示すように一連の内積として実装されます。
m4x4 r0.xyzw, r1, c0 will be expanded to:
dp4 r0.x, r1, c0
dp4 r0.y, r1, c1
dp4 r0.z, r1, c2
dp4 r0.w, r1, c3