_mm_haddq_epi8

[アーティクル]
08/09/2011

更新 : 2011 年 3 月

Visual Studio 2010 SP1 が必要です。

Microsoft 固有の仕様 →

XOP 命令 vphaddbq を生成して、ソースに対して整数水平加算を実行します。

__m128i _mm_haddq_epi8 (
   __m128i src
);

パラメーター

[入力] src
16 個の 8 ビット符号付き整数を含む 128 ビットのパラメーター。

戻り値

2 個の 64 ビット符号付き整数を含む 128 ビットの結果 r。

r[i] := src[8*i] + src[8*i+1]) + src[8*i+2] + src[8*i+3] +
        src[8*i+4] + src[8*i+5] + src[8*i+6] + src[8*i+7];

必要条件

組み込み	アーキテクチャ
_mm_haddq_epi8	XOP

ヘッダーファイル <intrin.h>

解説

src の 8 個の連続する 8 ビット符号付き整数値の 2 個の各グループが加算され、結果として 64 ビット符号付き整数が算出されます。その結果がターゲットの対応する値として格納されます。この命令ではオーバーフローは起こりません。

vphaddbq 命令は、XOP ファミリの命令の一部です。この組み込みを使用する前に、プロセッサでこの命令がサポートされていることを確認してください。この命令に対するハードウェアサポートを確認するには、InfoType を 0x80000001 にして __cpuid 組み込みを呼び出し、CPUInfo[2] (ECX) のビット 11 をチェックします。このビットは、命令がサポートされている場合は 1 になり、サポートされていない場合は 0 になります。

使用例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128i a, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128i_i8[i] = -128;
        a.m128i_i8[i+4] = i-128;
        a.m128i_i8[i+8] = 10*i;
        a.m128i_i8[i+12] = 127;
    }
    d = _mm_haddq_epi8(a);
    for (i = 0; i < 2; i++) printf_s(" %I64d", d.m128i_i64[i]);
    printf_s("\n");
}