_mm_permute2_ps

更新:2011 年 3 月

需要 Visual Studio 2010 SP1。

Microsoft 专用

生成 XOP XMM 指令 vpermil2ps 以从浮点值前两个源的值(具有可选零位调整)中进行选择。

__m128 _mm_permute2_ps (
   __m128 src1,
   __m128 src2,
   __m128i selector,
   int control
);

参数

  • [in] src1
    包含四个 32 位浮点值的 128 位参数。

  • [in] src2
    包含四个 32 位浮点值的 128 位参数。

  • [in] selector
    包含四个 32 位整数选择器值的 128 位参数。

  • [in] control
    32 位整数参数,可控制决定结果中是否为零值的方法。

返回值

包含四个 32 位浮点值的 128 位结果 r。

该结果中的每个值为零,或者是从 src1 和 src2 中的八个 32 位浮点值中选择的值。

要求

内部

体系结构

_mm_permute2_ps

XOP

头文件 <intrin.h>

备注

selector 中四个双字的每个为其对于该结果的相应双字选择的值,来自 src1 和 src2 的八个 32 位浮点值的其中之一。 在将此值写入结果之前可用零来替换,取决于 control 的值以及 selector 双字的位 3 的值。

对于 selector 中的每个双字,三个低序位选择 src1 或 src2 的其中一个浮点值,使用值 0 到 3 选择 src1 [0] 到 src1 [3],使用值 4 到 7 选择 src2 [0] 到 src2 [3]。

selector 中每个双字的下一个位将被称为以下的“匹配”位。 忽略 selector 中的每个高序位 28 位双字。

第四个源,control,确定要将结果值设置为 0 的条件。 control 的值必须为 0、1、2 或 3。 如果 control 是 0 或 1,则所选的浮点值将被写入该目标。 如果 control 为 2,则当 selector 中相应的匹配位为 0 时,将所选的浮点值写入该目标,但是当该匹配位为 1 时,将写入零。 如果 control 为 3,则当相应的匹配位为 1 时,将所选的浮点值写入该目标,但是当该匹配位为 0 时,将写入零。

vpermil2ps 指令是 XOP 系列指令的一部分。 在您使用此内部函数之前,必须确保处理器支持该指令。 若要确定此指令的硬件支持,调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查和 CPUInfo[2] (ECX) 的位 11。 当该指令受支持时,此位为 1,否则为 0。

示例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128 a, b, d;
    __m128i select;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128_f32[i] = i;
        b.m128_f32[i] = i+4;
    }
    select.m128i_i32[0] = 5;
    select.m128i_i32[1] = 1 + 8; // turn on match bit
    select.m128i_i32[2] = 2;
    select.m128i_i32[3] = 6 + 8; // turn on match bit
    d = _mm_permute2_ps(a, b, select, 0); // just select, don't zero
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
    d = _mm_permute2_ps(a, b, select, 2); // zero if match is 1
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
    d = _mm_permute2_ps(a, b, select, 3); // zero if match is 0
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
}
  

请参见

参考

__cpuid, __cpuidex

其他资源

_mm256_permute2_ps

_mm_permute2_pd

针对 Visual Studio 2010 SP1 添加的 XOP 内部函数

修订记录

Date

修订记录

原因

2011 年 3 月

添加了本内容。

SP1 功能更改。