_mm_permute2_ps
更新 : 2011 年 3 月
Visual Studio 2010 SP1 が必要です。
Microsoft 固有の仕様 →
XOP XMM 命令 vpermil2ps を生成して、1 つ目と 2 つ目のソースから浮動小数点値を選択します。ゼロ設定は任意で行います。
__m128 _mm_permute2_ps (
__m128 src1,
__m128 src2,
__m128i selector,
int control
);
パラメーター
[入力] src1
4 個の 32 ビット浮動小数点値を含む 128 ビットのパラメーター。[入力] src2
4 個の 32 ビット浮動小数点値を含む 128 ビットのパラメーター。[入力] selector
4 個の 32 ビット整数セレクター値を含む 128 ビットのパラメーター。[入力] control
結果の値をゼロに設定するかどうかを決定する方法を制御する 32 ビットの整数パラメーター。
戻り値
4 個の 32 ビット浮動小数点値を含む 128 ビットの結果 r。
結果の各値は、ゼロか、src1 および src2 の 8 個の 32 ビット浮動小数点値から選択された値になります。
必要条件
組み込み |
アーキテクチャ |
---|---|
_mm_permute2_ps |
XOP |
ヘッダー ファイル <intrin.h>
解説
selector の 4 個の各ダブルワードによって、結果の対応するダブルワードの値が src1 および src2 の 8 個の 32 ビット浮動小数点値から選択されます。 この値は、control の値および selector ダブルワードのビット 3 の値に応じて、結果に書き込まれる前にゼロで置換できます。
selector のダブルワードごとに、3 つの下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 3 により src1[0] から src1[3] が選択され、値 4 から 7 により src2[0] から src2[3] が選択されます。
selector の各ダブルワードの次のビットは、以下では "一致" ビットと呼んでいます。 selector の各ダブルワードの上位 28 ビットは無視されます。
4 つ目のソース control では、結果値を 0 に設定する場合の条件を決定します。 control の値は 0、1、2、または 3 にする必要があります。 control が 0 または 1 の場合は、選択された浮動小数点値がターゲットに書き込まれます。 control が 2 の場合、selector の対応する一致ビットが 0 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 1 であればゼロが書き込まれます。 control が 3 の場合、対応する一致ビットが 1 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 0 であればゼロが書き込まれます。
vpermil2ps 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。
使用例
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128 a, b, d;
__m128i select;
int i;
for (i = 0; i < 4; i++) {
a.m128_f32[i] = i;
b.m128_f32[i] = i+4;
}
select.m128i_i32[0] = 5;
select.m128i_i32[1] = 1 + 8; // turn on match bit
select.m128i_i32[2] = 2;
select.m128i_i32[3] = 6 + 8; // turn on match bit
d = _mm_permute2_ps(a, b, select, 0); // just select, don't zero
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
d = _mm_permute2_ps(a, b, select, 2); // zero if match is 1
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
d = _mm_permute2_ps(a, b, select, 3); // zero if match is 0
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
}
参照
参照
その他の技術情報
Visual Studio 2010 SP1 用に追加された XOP 組み込み
履歴の変更
日付 |
履歴 |
理由 |
---|---|---|
2011 年 3 月 |
このコンテンツを追加。 |
SP1 機能変更 |