Share via


_mm256_maddsub_ps

Se requiere Visual Studio 2010 SP1.

Específicos de Microsoft

Genera la instrucción FMA4 YMM vfmaddsubps para realizar un par alternativo multiplicar-sumar o restar en una única ronda de punto flotante de sus orígenes.

__m256 _mm256_maddsub_ps (
   __m256 src1,
   __m256 src2,
   __m256 src3
);

Parámetros

  • [in] src1
    Un parámetro de 256 bits que contiene ocho valores de punto flotante de 32 bits.

  • [in] src2
    Un parámetro de 256 bits que contiene ocho valores de punto flotante de 32 bits.

  • [in] src3
    Un parámetro de 256 bits que contiene ocho valores de punto flotante de 32 bits.

Valor devuelto

Un resultado de 256 bits r que contiene ocho valores de punto flotante de 32 bits.

r[i] := src1[i] * src2[i] - src3[i]; // i even
r[i] := src1[i] * src2[i] + src3[i]; // i odd

Requisitos

Intrínseco

Arquitectura

_mm256_maddsub_ps

FMA4

Archivo de encabezado <intrin.h>

Comentarios

El valor correspondiente en src2 multiplica cada uno de los ocho valores de punto flotante de precisión sencilla en src1. Cada valor de origen par de src3 se resta de su producto correspondiente, cada valor impar se agrega a su producto correspondiente y cada resultado se almacena como el valor correspondiente en el destino. Cada par multiplicar-sumar o restar se realiza al final en una única ronda, como si los resultados intermedios se calcularan con precisión infinita.

La instrucción vfmaddsubps forma parte de la familia FMA4 de instrucciones. Antes de utilizar este intrínseco, debe asegurarse de que el procesador admite esta instrucción. Para determinar la compatibilidad del hardware para obtener esta instrucción, llame a __cpuid intrínseco con InfoType = 0x80000001 y compruebe el bit 16 de CPUInfo [2] (ECX). Este bit es 1 cuando se admite la instrucción, de lo contrario es 0.

Ejemplo

#include <stdio.h>
#include <intrin.h>
int main()
{
    __m256 a, b, c, d;
    int i;
    for (i = 0; i < 8; i++) {
        a.m256_f32[i] = i;
        b.m256_f32[i] = 2.;
        c.m256_f32[i] = 3.;
    }
    d = _mm256_maddsub_ps(a, b, c);
    for (i = 0; i < 8; i++) printf_s(" %.3f", d.m256_f32[i]);
    printf_s("\n");
}
  

Vea también

Referencia

__cpuid, __cpuidex

Otros recursos

_mm_maddsub_ps

_mm256_msubadd_ps

_mm256_maddsub_pd

Intrínsecos FMA4 agregados para Visual Studio 2010 SP1

Historial de cambios

Fecha

Historial

Motivo

Marzo de 2011

Se agrega este contenido.

Cambio de características de SP1.