_mm256_msub_pd

아티클
08/10/2011

업데이트: 2011년 3월

Visual Studio 2010 SP1이 필요합니다.

Microsoft 전용

FMA4 YMM 명령 vfmsubpd를 생성하여 소스의 한 번 반올림 배정밀도 부동 소수점 곱하기-빼기를 수행합니다.

__m256d _mm256_msub_pd (
   __m256d src1,
   __m256d src2,
   __m256d src3
);

매개 변수

[in] src1
4개의 64비트 부동 소수점 값을 포함하는 256비트 매개 변수입니다.
[in] src2
4개의 64비트 부동 소수점 값을 포함하는 256비트 매개 변수입니다.
[in] src3
4개의 64비트 부동 소수점 값을 포함하는 256비트 매개 변수입니다.

반환 값

4개의 64비트 부동 소수점 값을 포함하는 256비트 결과 r입니다.

r[i] := src1[i] * src2[i] - src3[i];

요구 사항

내장	아키텍처
_mm256_msub_pd	FMA4

헤더 파일 <intrin.h>

설명

src1의 각 4개 배정밀도 부동 소수점 값을 src2의 해당 값에 곱하고 src3의 해당 값을 곱에서 빼고 결과는 대상에 해당 값으로 저장됩니다. 각 곱하기- 빼기 쌍은 중간 결과가 무한 정밀도로 계산된 것처럼 마지막에 한 번 반올림하여 수행됩니다.

vfmsubpd 명령은 FMA4 명령군의 일부입니다. 이 intrinsic을 사용하기 전에 프로세서가 이 명령을 지원하는지 확인해야 합니다. 이 명령에 대한 하드웨어 지원을 확인하려면 InfoType = 0x80000001을 사용하여 __cpuid intrinsic을 호출하고 CPUInfo[2] (ECX)의 비트 16을 확인합니다. 명령이 지원되는 경우 비트는 1이고, 그렇지 않으면 0입니다.

예제

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256d a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m256d_f64[i] = i;
        b.m256d_f64[i] = 2.;
        c.m256d_f64[i] = 3.;
    }
    d = _mm256_msub_pd(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3lf", d.m256d_f64[i]);
    printf_s("\n");
}