并行模式库 (PPL)

并行模式库 (PPL) 提供命令式编程模型,以促进开发并发应用程序的可扩展性和易用性。 PPL 构建在并发运行时的计划和资源管理组件上。 通过提供并行作用于数据的泛型安全算法和容器,提高应用程序代码与基础线程机制之间的抽象级别。 使用 PPL 还可以开发通过为共享状态提供替代方案实现缩放的应用程序。

PPL 提供以下功能:

  • 任务并行:基于 Windows 线程池来并行执行多个工作项(任务)的机制

  • 并行算法:基于并发运行时来并行处理数据集合的泛型算法

  • 并行容器和对象:对元素提供安全并发访问的泛型容器类型

示例

PPL 提供类似于 C++ 标准库的编程模型。 下面的示例展示 PPL 的多种功能。 串行和并行计算若干 Fibonacci 数字。 这两种计算都作用于 std::array 对象。 示例还控制台输出了进行两种计算所需的时间。

串行版本使用 C++ 标准库 std::for_each 算法来遍历数组并将结果存储在 std::vector 对象中。 并行版本执行相同的任务,但使用的是 PPL concurrency::parallel_for_each 算法并将结果存储在 concurrency::concurrent_vector 对象中。 concurrent_vector 类可以使每个循环迭代并发添加元素,而无需同步对容器的写访问。

由于 parallel_for_each 并发操作,因此本示例的并行版本必须排列 concurrent_vector 对象的顺序才能生成与串行版本相同的结果。

请注意,此示例使用朴素法计算斐波那契数;但是,此方法说明了并发运行时如何提高长时间计算的性能。

// parallel-fibonacci.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <concurrent_vector.h>
#include <array>
#include <vector>
#include <tuple>
#include <algorithm>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Computes the nth Fibonacci number.
int fibonacci(int n)
{
   if(n < 2)
      return n;
   return fibonacci(n-1) + fibonacci(n-2);
}

int wmain()
{
   __int64 elapsed;

   // An array of Fibonacci numbers to compute.
   array<int, 4> a = { 24, 26, 41, 42 };

   // The results of the serial computation.
   vector<tuple<int,int>> results1;

   // The results of the parallel computation.
   concurrent_vector<tuple<int,int>> results2;

   // Use the for_each algorithm to compute the results serially.
   elapsed = time_call([&] 
   {
      for_each (begin(a), end(a), [&](int n) {
         results1.push_back(make_tuple(n, fibonacci(n)));
      });
   });   
   wcout << L"serial time: " << elapsed << L" ms" << endl;
   
   // Use the parallel_for_each algorithm to perform the same task.
   elapsed = time_call([&] 
   {
      parallel_for_each (begin(a), end(a), [&](int n) {
         results2.push_back(make_tuple(n, fibonacci(n)));
      });

      // Because parallel_for_each acts concurrently, the results do not 
      // have a pre-determined order. Sort the concurrent_vector object
      // so that the results match the serial version.
      sort(begin(results2), end(results2));
   });   
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;

   // Print the results.
   for_each (begin(results2), end(results2), [](tuple<int,int>& pair) {
      wcout << L"fib(" << get<0>(pair) << L"): " << get<1>(pair) << endl;
   });
}

以下是具有四个处理器的计算机的输出示例。

serial time: 9250 ms
parallel time: 5726 ms

fib(24): 46368
fib(26): 121393
fib(41): 165580141
fib(42): 267914296

完成每个循环迭代所需的时间各不相同。 parallel_for_each 的性能由最后完成的操作决定。 因此,本示例的串行版本与并行版本不会有线性的性能提高。

Title 说明
任务并行 描述 PPL 中任务和任务组的角色。
并行算法 描述如何使用并行算法,如 parallel_forparallel_for_each
并行容器和对象 描述 PPL 提供的各种并行容器和对象。
PPL 中的取消操作 说明如何取消并行算法当前正在执行的工作。
并发运行时 描述可以简化并发编程并包含相关主题链接的并发运行时。