_mm_nmacc_sd

项目
08/12/2011

更新：2011 年 3 月

需要 Visual Studio 2010 SP1。

Microsoft 专用

生成 FMA4 XMM 指令 vfnmaddsd 以执行单精度舍入双精度浮点取负乘法-加法的低序位浮点值源的值。

__m128d _mm_nmacc_sd (
   __m128d src1,
   __m128d src2,
   __m128d src3
);

参数

[in] src1
在该低序位四字中包含 64 位浮点值的 128 位参数。
[in] src2
在该低序位四字中包含 64 位浮点值的 128 位参数。
[in] src3
在该低序位四字中包含 64 位浮点值的 128 位参数。

返回值

包含两个 64 位浮点值的 128 位结果 r。

r[0] := -(src1[0] * src2[0]) + src3[0];
r[1] := 0.;

要求

内部	体系结构
_mm_nmacc_sd	FMA4

头文件 <intrin.h>

备注

将 src1 中的低序位双精度浮点值乘以 src2 中相应的值。将结果取负，然后加上 src3 中相应的值，并将该结果存储为目标中相应的值。 src1、src2 和 src3 中的其他值被忽略，并且该结果的高序位双精度浮点值被设置为 0。乘法-取负-加法使用末尾处单精度舍入进行，如同中间结果都计算到无限精度。

vfnmaddsd 指令是 FMA4 系列指令的一部分。在您使用此内部函数之前，必须确保处理器支持该指令。若要确定此指令的硬件支持，调用 InfoType = 0x80000001 的 __cpuid 内部函数并检查 CPUInfo[2] (ECX) 的位 16。当该指令受支持时，此位为 1，否则为 0。

示例

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128d a, b, c, d;
    int i;
    for (i = 0; i < 2; i++) {
        a.m128d_f64[i] = i;
        b.m128d_f64[i] = 2.;
        c.m128d_f64[i] = 3.;
    }
    d = _mm_nmacc_sd(a, b, c);
    for (i = 0; i < 2; i++) printf_s(" %.3lf", d.m128d_f64[i]);
    printf_s("\n");
}