_mm_sha_epi64

更新:2011 年 3 月

需要 Visual Studio 2010 SP1。

Microsoft 专用

生成 XOP 指令 vpshaq 以执行每个四字的第一个源中由第二个源指定的数量的算术移位。

__m128i _mm_sha_epi64 (
   __m128i src,
   __m128i counts
);

参数

  • [in] src
    包含两个 64 位带符号整数的 128 位参数。

  • [in] counts
    包含十六个 8 位带符号整数的 128 位参数。

返回值

包含两个 64 位带符号整数的 128 位结果 r。

r[i] := (counts[8*i] >= 0) ? src[i] << counts[8*i] :
                             src[i] >> -counts[8*i]);

要求

内部

体系结构

_mm_sha_epi64

XOP

头文件 <intrin.h>

备注

将 src 中的每个 64 位带符号整数值按照 counts 的字节(与其低序位字节相对应)中的值所指定的位数移动,并将该 64 位带符号整数结果存储为目标中相应的值。 如果 counts 中的值为正,则向左移位(向最高有效位)并且零向右端移动;否则,向右移位并且零向左端移动。 如果移位计数大于 63,则相应的结果值为 0;如果移位计数小于 ﹣63,则结果为 ﹣1,如果 src 的值为负,则为 0。 忽略 counts 中的其他值。

vpshaq 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。

示例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128i a, b, d;
    int i, j;
    unsigned __int64 temp;
    for (i = 0; i < 2; i++) {
        temp = 0;
        for (j = 0; j < 16; j++) {
            temp = temp << 4 | (8*i + j + 7) % 16;
        }
        a.m128i_u64[i] = temp;
        b.m128i_i8[8*i] = 21*i - 11;
    }
    d = _mm_sha_epi64(a, b);
    printf_s("data:       ");
    for (i = 0; i < 2; i++) printf_s(" %016I64x", a.m128i_u64[i]);
    printf_s("\nshifted by  ");
    for (i = 0; i < 2; i++) printf_s(" %16d", b.m128i_i8[8*i]);
    printf_s("\ngives       ");
    for (i = 0; i < 2; i++) printf_s(" %016I64x", d.m128i_u64[i]);
    printf_s("\n");
}
  

请参见

参考

__cpuid, __cpuidex

其他资源

_mm_sha_epi8

_mm_sha_epi16

_mm_sha_epi32

_mm_shl_epi64

_mm_rot_epi64

针对 Visual Studio 2010 SP1 添加的 XOP 内部函数

修订记录

Date

修订记录

原因

2011 年 3 月

添加了本内容。

SP1 功能更改。