Share via


estructura DML_ELEMENT_WISE_ADD1_OPERATOR_DESC (directml.h)

Agrega cada elemento de ATensor a su elemento correspondiente en BTensor y coloca el resultado en el elemento correspondiente de OutputTensor, con la opción de activación fusionada.

f(a, b) = FusedActivation(a + b)

La descripción del operador de activación fusionada, si se proporciona, ejecuta el operador de activación especificado en la salida.

Este operador admite la ejecución en contexto, lo que significa que OutputTensor tiene permiso para alias uno o varios de los tensores de entrada durante el enlace.

Sintaxis

struct DML_ELEMENT_WISE_ADD1_OPERATOR_DESC {
  const DML_TENSOR_DESC   *ATensor;
  const DML_TENSOR_DESC   *BTensor;
  const DML_TENSOR_DESC   *OutputTensor;
  const DML_OPERATOR_DESC *FusedActivation;
};

Miembros

ATensor

Tipo: const DML_TENSOR_DESC*

Tensor que contiene las entradas del lado izquierdo.

BTensor

Tipo: const DML_TENSOR_DESC*

Tensor que contiene las entradas del lado derecho.

OutputTensor

Tipo: const DML_TENSOR_DESC*

Tensor de salida en el que se van a escribir los resultados.

FusedActivation

Tipo: _Maybenull_ const DML_OPERATOR_DESC*

Una capa de activación fusionada opcional que se aplicará después de la adición. Para obtener más información, consulta Uso de operadores fusionados para mejorar el rendimiento.

La activación fusionada solo se puede usar cuando el tipo de datos de salida es FLOAT16 o FLOAT32.

Comentarios

Disponibilidad

Este operador se introdujo en DML_FEATURE_LEVEL_2_0.

Restricciones tensor

ATensor, BTensor y OutputTensor deben tener el mismo DataType, DimensionCount y Sizes.

Compatibilidad con Tensor

DML_FEATURE_LEVEL_3_0 y versiones posteriores

Tensor Clase Recuentos de dimensiones admitidos Tipos de datos admitidos
ATensor Entrada De 1 a 8 FLOAT32, FLOAT16
BTensor Entrada De 1 a 8 FLOAT32, FLOAT16
OutputTensor Resultados De 1 a 8 FLOAT32, FLOAT16

DML_FEATURE_LEVEL_2_0 y versiones posteriores

Tensor Clase Recuentos de dimensiones admitidos Tipos de datos admitidos
ATensor Entrada De 4 a 5 FLOAT32, FLOAT16
BTensor Entrada De 4 a 5 FLOAT32, FLOAT16
OutputTensor Resultados De 4 a 5 FLOAT32, FLOAT16

Requisitos

Requisito Value
Cliente mínimo compatible Windows 10, versión 2004 (10.0; Compilación 19041)
Servidor mínimo compatible Windows Server, versión 2004 (10.0; Compilación 19041)
Encabezado directml.h

Consulte también