分享方式:


如何:使用可組合的類別改善效能

此範例示範如何使用 concurrency::combinable 類別來計算質素 std::array 物件中 數位的總和。 類別 combinable 會藉由消除共用狀態來改善效能。

提示

在某些情況下,平行對應 ( concurrency::p arallel_transform ) 和 reduce ( concurrency:: parallel_reduce ) 可提供效能 combinable 改善。 如需使用對應和縮減作業產生與此範例相同結果的 範例,請參閱 平行演算法。

範例 - 累積

下列範例會使用 std::accumulate 函式來計算質素陣列中的元素總和。 在此範例中, a 是 物件 array ,而 函 is_prime 式會判斷其輸入值是否為質數。

prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
   return acc + (is_prime(i) ? i : 0);
});

範例 - parallel_for_each

下列範例示範平行處理上一個範例的天真方式。 這個範例會使用 concurrency::p arallel_for_each 演算法平行處理陣列,以及 平行存取::critical_section 物件來同步存取 prime_sum 變數。 此範例不會調整,因為每個執行緒都必須等待共用資源可供使用。

critical_section cs;
prime_sum = 0;
parallel_for_each(begin(a), end(a), [&](int i) {
   cs.lock();
   prime_sum += (is_prime(i) ? i : 0);
   cs.unlock();
});

範例 - 可組合

下列範例會使用 物件來改善上一個 combinable 範例的效能。 此範例不需要同步處理物件;它會調整, combinable 因為 物件可讓每個執行緒獨立執行其工作。

combinable物件通常會在兩個步驟中使用。 首先,藉由平行執行工作來產生一系列的精細計算。 接下來,將計算結合 (或 reduce) 成最終結果。 這個範例會使用 concurrency::combinable::local 方法來取得本機總和的參考。 然後,它會使用 concurrency::combinable::combine 方法與 std::p lus 物件,將本機計算結合至最終結果。

combinable<int> sum;
parallel_for_each(begin(a), end(a), [&](int i) {
   sum.local() += (is_prime(i) ? i : 0);
});
prime_sum = sum.combine(plus<int>());

範例 - 序列和平行

下列完整範例會以序列和平行方式計算質數的總和。 此範例會列印到主控台執行這兩項計算所需的時間。

// parallel-sum-of-primes.cpp
// compile with: /EHsc
#include <windows.h>
#include <ppl.h>
#include <array>
#include <numeric>
#include <iostream>

using namespace concurrency;
using namespace std;

// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{
   __int64 begin = GetTickCount();
   f();
   return GetTickCount() - begin;
}

// Determines whether the input value is prime.
bool is_prime(int n)
{
   if (n < 2)
      return false;
   for (int i = 2; i < n; ++i)
   {
      if ((n % i) == 0)
         return false;
   }
   return true;
}

int wmain()
{   
   // Create an array object that contains 200000 integers.
   array<int, 200000> a;

   // Initialize the array such that a[i] == i.
   iota(begin(a), end(a), 0);

   int prime_sum;
   __int64 elapsed;

   // Compute the sum of the numbers in the array that are prime.
   elapsed = time_call([&] {
      prime_sum = accumulate(begin(a), end(a), 0, [&](int acc, int i) {
         return acc + (is_prime(i) ? i : 0);
      });
   });   
   wcout << prime_sum << endl;   
   wcout << L"serial time: " << elapsed << L" ms" << endl << endl;

   // Now perform the same task in parallel.
   elapsed = time_call([&] {
      combinable<int> sum;
      parallel_for_each(begin(a), end(a), [&](int i) {
         sum.local() += (is_prime(i) ? i : 0);
      });
      prime_sum = sum.combine(plus<int>());
   });
   wcout << prime_sum << endl;
   wcout << L"parallel time: " << elapsed << L" ms" << endl << endl;
}

下列範例輸出適用於具有四個處理器的電腦。

1709600813
serial time: 6178 ms

1709600813
parallel time: 1638 ms

編譯程式碼

若要編譯器代碼,請複製程式碼,然後將它貼到 Visual Studio 專案中,或貼到名為 parallel-sum-of-primes.cpp 的檔案中,然後在 Visual Studio 命令提示字元視窗中執行下列命令。

cl.exe /EHsc parallel-sum-of-primes.cpp

穩固程式設計

如需使用對應和縮減作業來產生相同結果的 範例,請參閱 平行演算法。

另請參閱

平行容器和物件
combinable 類別
critical_section 類別