/arch (x86)

项目
06/09/2015

在 x86 上为代码生成指定体系结构。另请参阅 /arch (x64) 和 /arch (ARM)。

/arch:[IA32|SSE|SSE2|AVX|AVX2]

参数

/arch:IA32
指定未增强指令，同时为浮点计算指定 x87。
/arch:SSE
启用对 SSE 指令的使用。
/arch:SSE2
启用对 SSE2 指令的使用。这是 x86 平台上的默认指令（如果未指定 /arch 选项）。
/arch:AVX
启用对 Intel 高级矢量扩展指令的使用。
/arch:AVX2
启用对 Intel 高级矢量扩展 2 指令的使用。

备注

SSE 和 SSE2 指令在各种 Intel 和 AMD 处理器中均存在。 Intel 浅桥处理器和 AMD Bulldozer 处理器上存在 AVX 说明。 AVX2 指令受 Intel Haswell 和 Broadwell 处理器以及 AMD 基于挖掘机处理器支持。

_M_IX86_FP、__AVX__ 和 __AVX2__ 宏指示已使用 /arch 编译器选项（如果有）。有关详细信息，请参阅预定义的宏。 Visual Studio 2013 Update 2（版本 12.0.34567.1）中引入了 /arch:AVX2 选项和 __AVX2__ 宏。

在指定 /arch 时，优化程序将选择何时以及如何使用 SSE 和 SSE2 指令。当确定使用 SSE/SSE2 指令和寄存器肯定要比使用 x87 浮点寄存器堆栈更快时，将 SSE 和 SSE2 指令用于某些标量浮点计算。因此，你的代码实际上将混合使用 x87 和 SSE/SSE2 来进行浮点计算。此外，通过 /arch:SSE2，可将 SSE2 指令用于某些 64 位整数运算。

除了使用 SSE 和 SSE2 指令之外，编译器还使用在支持 SSE 和 SSE2 的处理器修订版上提供的其他指令。例如，在 Intel 处理器的 Pentium Pro 修订版中首次出现的 CMOV 指令。

由于默认情况下 x86 编译器生成使用 SSE2 指令的代码，因此你必须指定 /arch:IA32 以针对 x86 处理器禁用 SSE 和 SSE2 指令的生成。

/arch 仅影响本机函数的代码生成。当使用 /clr 进行编译时，/arch 对托管的函数的代码生成没有影响。

/arch 和 /QIfist 不能用于同一编译。具体而言，如果不使用 _controlfp 修改 FP 控制字，则运行时启动代码会将 x87 FPU 控制字精度控制字段设置为 53 位。因此，表达式中的每个浮点型和双运算都使用 53 位有效数和 15 位指数。但是，每个 SSE 单精度运算都使用 24 位有效数和 8 位指数，而 SSE2 双精度运算使用 53 位有效数和 11 位指数。有关详细信息，请参阅_control87、_controlfp、__control87_2。在单个表达式树中可能会出现这些差异，而在每一子表达式后存在用户赋值的情况下则不会。考虑以下情况：

    r = f1 * f2 + d;  // Different results are possible on SSE/SSE2.

相对于：

   t = f1 * f2;   // Do f1 * f2, round to the type of t.
   r = t + d;     // This should produce the same overall result 
                  // whether x87 stack is used or SSE/SSE2 is used.