_mm256_maddsub_ps

아티클
08/10/2011

업데이트: 2011년 3월

Visual Studio 2010 SP1이 필요합니다.

Microsoft 전용

FMA4 YMM 명령 vfmaddsubps를 생성하여 교대로 소스의 한 번 반올림 부동 소수점 곱하기-더하기/빼기를 수행합니다.

__m256 _mm256_maddsub_ps (
   __m256 src1,
   __m256 src2,
   __m256 src3
);

매개 변수

[in] src1
8개의 32비트 부동 소수점 값을 포함하는 256비트 매개 변수입니다.
[in] src2
8개의 32비트 부동 소수점 값을 포함하는 256비트 매개 변수입니다.
[in] src3
8개의 32비트 부동 소수점 값을 포함하는 256비트 매개 변수입니다.

반환 값

8개의 32비트 부동 소수점 값을 포함하는 256비트 결과 r입니다.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

요구 사항

내장	아키텍처
_mm256_maddsub_ps	FMA4

헤더 파일 <intrin.h>

설명

src1에서 각 8개 단정밀도 부동 소수점 값을 src2의 해당 값에 곱합니다. src3의 각 짝수 번호 소스 값을 해당 곱에서 빼고 각 홀수 번호 값을 해당 곱에 더하며 각 결과는 대상에 해당 값으로 저장됩니다. 각 곱하기- 더하기/빼기 쌍은 중간 결과가 무한 정밀도로 계산된 것처럼 마지막에 한 번 반올림하여 수행됩니다.

vfmaddsubps 명령은 FMA4 명령군의 일부입니다. 이 intrinsic을 사용하기 전에 프로세서가 이 명령을 지원하는지 확인해야 합니다. 이 명령에 대한 하드웨어 지원을 확인하려면 InfoType = 0x80000001을 사용하여 __cpuid intrinsic을 호출하고 CPUInfo[2] (ECX)의 비트 16을 확인합니다. 명령이 지원되는 경우 비트는 1이고, 그렇지 않으면 0입니다.

예제

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256 a, b, c, d;
    int i;
    for (i = 0; i < 8; i++) {
        a.m256_f32[i] = i;
        b.m256_f32[i] = 2.;
        c.m256_f32[i] = 3.;
    }
    d = _mm256_maddsub_ps(a, b, c);
    for (i = 0; i < 8; i++) printf_s(" %.3f", d.m256_f32[i]);
    printf_s("\n");
}