_mm_maddsub_ps

Требуется Visual Studio 2010 с пакетом обновления 1 (SP1).

Только для систем Microsoft

Формирует инструкцию vfmaddsubps FMA4 XMM для выполнения операции попеременного умножения-сложения/вычитания с одним округлением значений двойной точности с плавающей запятой над своими источниками.

__m128 _mm_maddsub_ps (
   __m128 src1,
   __m128 src2,
   __m128 src3
);

Параметры

  • [входящий] src1
    128-битный параметр, содержащий четыре 32-битных значения с плавающей запятой.

  • [входящий] src2
    128-битный параметр, содержащий четыре 32-битных значения с плавающей запятой.

  • [входящий] src3
    128-битный параметр, содержащий четыре 32-битных значения с плавающей запятой.

Возвращаемое значение

128-битный результат r, содержащий четыре 32-битных значения с плавающей запятой.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

Требования

Встроенный объект

Архитектура

_mm_maddsub_ps

FMA4

Файл заголовка <intrin.h>

Заметки

Каждое из четырех значений одиночной точности с плавающей запятой в параметре src1 умножается на соответствующее значение в параметре src2. Каждое значение-источник с четным номером в параметре src3 вычитается из соответствующего ему произведения, каждое значение с нечетным номером складывается с соответствующим ему произведением, после чего каждый результат сохраняется в виде соответствующего значения в целевом объекте. Каждая пара операций умножения-сложения/вычитания выполняется с одним округлением в конце, как если бы промежуточные результаты вычислялись с бесконечной точностью.

Инструкция vfmaddsubps входит в состав семейства инструкций FMA4. Прежде чем использовать эту встроенную инструкцию, необходимо убедиться, что процессор ее поддерживает. Чтобы определить, имеется ли аппаратная поддержка этой инструкции, вызовите встроенную инструкцию __cpuid с InfoType = 0x80000001 и проверьте бит 16 в CPUInfo[2] (ECX). Этот бит равен 1, если инструкция поддерживается, и 0 в противном случае.

Пример

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m128 a, b, c, d;
    int i;
    for (i = 0; i < 4; i++) {
        a.m128_f32[i] = i;
        b.m128_f32[i] = 2.;
        c.m128_f32[i] = 3.;
    }
    d = _mm_maddsub_ps(a, b, c);
    for (i = 0; i < 4; i++) printf_s(" %.3f", d.m128_f32[i]);
    printf_s("\n");
}
  

См. также

Ссылки

__cpuid, __cpuidex

Другие ресурсы

_mm256_maddsub_ps

_mm_msubadd_ps

_mm_maddsub_pd

Встроенные объекты FMA4, добавленные в Visual Studio 2010 с пакетом обновления 1 (SP1)

Журнал изменений

Дата

Журнал

Причина

Март 2011

Добавлено это содержимое.

Изменение функции SP1.