_mm_permute2_ps

更新 : 2011 年 3 月

Visual Studio 2010 SP1 が必要です。

Microsoft 固有の仕様 →

XOP XMM 命令 vpermil2ps を生成して、1 つ目と 2 つ目のソースから浮動小数点値を選択します。ゼロ設定は任意で行います。

__m128 _mm_permute2_ps (
   __m128 src1,
   __m128 src2,
   __m128i selector,
   int control
);

パラメーター

  • [入力] src1
    4 個の 32 ビット浮動小数点値を含む 128 ビットのパラメーター。

  • [入力] src2
    4 個の 32 ビット浮動小数点値を含む 128 ビットのパラメーター。

  • [入力] selector
    4 個の 32 ビット整数セレクター値を含む 128 ビットのパラメーター。

  • [入力] control
    結果の値をゼロに設定するかどうかを決定する方法を制御する 32 ビットの整数パラメーター。

戻り値

4 個の 32 ビット浮動小数点値を含む 128 ビットの結果 r。

結果の各値は、ゼロか、src1 および src2 の 8 個の 32 ビット浮動小数点値から選択された値になります。

必要条件

組み込み

アーキテクチャ

_mm_permute2_ps

XOP

ヘッダー ファイル <intrin.h>

解説

selector の 4 個の各ダブルワードによって、結果の対応するダブルワードの値が src1 および src2 の 8 個の 32 ビット浮動小数点値から選択されます。 この値は、control の値および selector ダブルワードのビット 3 の値に応じて、結果に書き込まれる前にゼロで置換できます。

selector のダブルワードごとに、3 つの下位ビットによって src1 または src2 の浮動小数点値のいずれかが選択されます。値 0 から 3 により src1[0] から src1[3] が選択され、値 4 から 7 により src2[0] から src2[3] が選択されます。

selector の各ダブルワードの次のビットは、以下では "一致" ビットと呼んでいます。 selector の各ダブルワードの上位 28 ビットは無視されます。

4 つ目のソース control では、結果値を 0 に設定する場合の条件を決定します。 control の値は 0、1、2、または 3 にする必要があります。 control が 0 または 1 の場合は、選択された浮動小数点値がターゲットに書き込まれます。 control が 2 の場合、selector の対応する一致ビットが 0 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 1 であればゼロが書き込まれます。 control が 3 の場合、対応する一致ビットが 1 であれば選択された浮動小数点値がターゲットに書き込まれますが、一致ビットが 0 であればゼロが書き込まれます。

vpermil2ps 命令は、XOP ファミリの命令の一部です。 この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。 この命令に対するハードウェア サポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。 このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。

使用例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128 a, b, d;
    __m128i select;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128_f32[i] = i;
        b.m128_f32[i] = i+4;
    }
    select.m128i_i32[0] = 5;
    select.m128i_i32[1] = 1 + 8; // turn on match bit
    select.m128i_i32[2] = 2;
    select.m128i_i32[3] = 6 + 8; // turn on match bit
    d = _mm_permute2_ps(a, b, select, 0); // just select, don't zero
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
    d = _mm_permute2_ps(a, b, select, 2); // zero if match is 1
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
    d = _mm_permute2_ps(a, b, select, 3); // zero if match is 0
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
}
  

参照

参照

__cpuid, __cpuidex

その他の技術情報

_mm256_permute2_ps

_mm_permute2_pd

Visual Studio 2010 SP1 用に追加された XOP 組み込み

履歴の変更

日付

履歴

理由

2011 年 3 月

このコンテンツを追加。

SP1 機能変更