_mm_maddsub_ps
업데이트: 2011년 3월
Visual Studio 2010 SP1이 필요합니다.
Microsoft 전용
FMA4 XMM 명령 vfmaddsubps를 생성하여 교대로 소스의 한 번 반올림 부동 소수점 곱하기-더하기/빼기를 수행합니다.
__m128 _mm_maddsub_ps (
__m128 src1,
__m128 src2,
__m128 src3
);
매개 변수
[in] src1
4개의 32비트 부동 소수점 값을 포함하는 128비트 매개 변수입니다.[in] src2
4개의 32비트 부동 소수점 값을 포함하는 128비트 매개 변수입니다.[in] src3
4개의 32비트 부동 소수점 값을 포함하는 128비트 매개 변수입니다.
반환 값
4개의 32비트 부동 소수점 값을 포함하는 128비트 결과 r입니다.
r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd
요구 사항
내장 |
아키텍처 |
---|---|
_mm_maddsub_ps |
FMA4 |
헤더 파일 <intrin.h>
설명
src1에서 각 4개 단정밀도 부동 소수점 값을 src2의 해당 값에 곱합니다. src3의 각 짝수 번호 소스 값을 해당 곱에서 빼고 각 홀수 번호 값을 해당 곱에 더하며 각 결과는 대상에 해당 값으로 저장됩니다. 각 곱하기- 더하기/빼기 쌍은 중간 결과가 무한 정밀도로 계산된 것처럼 마지막에 한 번 반올림하여 수행됩니다.
vfmaddsubps 명령은 FMA4 명령군의 일부입니다. 이 intrinsic을 사용하기 전에 프로세서가 이 명령을 지원하는지 확인해야 합니다. 이 명령에 대한 하드웨어 지원을 확인하려면 InfoType = 0x80000001을 사용하여 __cpuid intrinsic을 호출하고 CPUInfo[2] (ECX)의 비트 16을 확인합니다. 명령이 지원되는 경우 비트는 1이고, 그렇지 않으면 0입니다.
예제
#include <stdio.h>
#include <intrin.h>
int main()
{
__m128 a, b, c, d;
int i;
for (i = 0; i < 4; i++) {
a.m128_f32[i] = i;
b.m128_f32[i] = 2.;
c.m128_f32[i] = 3.;
}
d = _mm_maddsub_ps(a, b, c);
for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
printf_s("\n");
}
참고 항목
참조
기타 리소스
Visual Studio 2010 SP1용으로 추가된 FMA4 내장 함수
변경 기록
날짜 |
변경 내용 |
이유 |
---|---|---|
2011년 3월 |
이 내용이 추가되었습니다. |
SP1 기능 변경 |