数据并行(任务并行库)

数据并行指的是对源集合或数组的元素同时(即,并行)执行相同操作的场景。 在数据并行操作中,对源集合进行分区,以便多个线程能够同时在不同的网段上操作。

任务并行库 (TPL) 支持通过 System.Threading.Tasks.Parallel 类实现的数据并行。 此类对 for 循环和 foreach 循环(Visual Basic 中的 ForFor Each)提供了基于方法的并行执行。 你为 Parallel.ForParallel.ForEach 循环编写的循环逻辑与编写连续循环的相似。 无需创建线程或列工作项。 在基本循环中,不需要加锁。 TPL 为你处理所有低级别的工作。 若要详细了解如何使用 Parallel.ForParallel.ForEach,请下载文档并行编程模式:了解并通过 .NET Framework 4 应用并行模式。 下面的代码示例演示了一个简单的 foreach 循环及其并行等效项。

注意

本文档使用 lambda 表达式在 TPL 中定义委托。 如果不熟悉 C# 或 Visual Basic 中的 lambda 表达式,请参阅 PLINQ 和 TPL 中的 Lambda 表达式

// Sequential version
foreach (var item in sourceCollection)
{
    Process(item);
}

// Parallel equivalent
Parallel.ForEach(sourceCollection, item => Process(item));
' Sequential version        
For Each item In sourceCollection
    Process(item)
Next

' Parallel equivalent
Parallel.ForEach(sourceCollection, Sub(item) Process(item))

并行循环运行时,TPL 将数据源进行分区,以便该循环可以同时对多个部分进行作用。 在后台,任务计划程序基于系统资源和工作负荷来划分任务。 如有可能,如果工作负荷变得不平衡了,计划程序将重新分配多个线程与处理器之间的工作。

注意

你也可以提供你自己的自定义分区程序或计划程序。 有关详细信息,请参阅 PLINQ 和 TPL 的自定义分区程序任务计划程序

Parallel.ForParallel.ForEach 方法都有多个过载,可让你停止或中断循环执行,监视其它线程上循环的状态,保持本地线程状态,完成本地线程对象,控制并发程度等等。 启用此功能的帮助器类型包括 ParallelLoopStateParallelOptionsParallelLoopResultCancellationTokenCancellationTokenSource

有关详细信息,请参阅并行编程模式:了解并应用与 .NET Framework 4 的并行模式

PLINQ 支持使用声明性或查询类语法的数据并行。 有关详细信息,请参阅并行 LINQ (PLINQ)

Title 描述
如何:编写简单的 Parallel.For 循环 描述如何编写遍历任何数组或可变址 IEnumerable<T> 源集合的 For 循环。
如何:编写简单的 Parallel.ForEach 循环 描述如何编写遍历任何 IEnumerable<T> 源集合的 ForEach 循环。
如何:从 Parallel.For 循环停止或中断 描述如何停止或中断并行循环,以便所有线程都获得该操作的通知。
如何:编写具有线程局部变量的 Parallel.For 循环 描述如何编写 For 循环,该循环中每个线程都维持有对其它任何线程不可见的私有变量,以及如何在循环完成时,同步所有线程的结果。
如何:使用分区本地变量编写 Parallel.ForEach 循环 描述如何编写 ForEach 循环,该循环中每个线程都维持有对其它任何线程不可见的私有变量,以及如何在循环完成时,同步所有线程的结果。
如何:取消 Parallel.For 或 ForEach 循环 描述如何通过使用 System.Threading.CancellationToken 取消并行循环
如何:加快小型循环主体的速度 描述在循环主体极小时加快执行速度的方法。
任务并行库 (TPL) 提供任务并行库的概述。
并行编程 介绍.NET Framework 中的并行编程。

请参阅