线程是指程序中的一个单一的顺序控制流,它很好地刻划了紧耦合共享主存的多处理机体系结构上的并行处理行为。
进程作为资源的分配单位和保护单位,为线程提供运行的静态环境,但在处理机上调度的基本单位却是线程。
在传统上,并发多任务的实现采用的是在操作系统(OS)级运行多个进程。由于各个进程拥有自己独立的运行环境,进程间的耦合关系差,并发粒度过于粗糙,并发实现也不太容易。当前,采用多处理机构成超高性能计算机成为主流。为发挥新体系结构的并行效率提出一些新概念和支持并行程序的机制。在这种背景下,针对传统UNIX中进程的概念在支持中微粒度并行程序设计方面的不足,提出了线程概念。如果把进程所占资源与进程中的运行代码相分离,那么在一个地址空间中便可运行多个指令流,由此产生线程概念。这一概念在表达应用问题本身的并行性方面较传统进程有较大优势,尤其在共享主存的多处理机硬件环境上有更好的运行效率。但是,线程尚没有统一的定义,一般说来,所谓线程(或称线索),指程序中的一个单一的顺序控制流。
图1和图2分别示意了把一个任务按2个并发进程和2个并发线程分解后的情况。比较这两张图中进程与进程之间、线程与线程之间的关系可以看出,进程间的关系比较疏远。各个进程是在自己独有的地址空间内执行,不但寄存器和堆栈是独有的,动态数据堆、静态数据区和程序代码也相互独立。而线程间的关系则要紧密得多,虽然各线程为保持自己的控制流而独有寄存器和堆栈,但由于两线程从属于同一进程,它们共享同一地址空间,所以动态堆、静态数据区及程序代码为各线程共享。进程作为独立的实体,它为线程提供运行的资源并构成静态环境。线程是处理机调度的基本单位。如果说进程概念很好地描述了单机操作系统行为,那么线程概念则很好地描述了多机系统中的并行处理行为,将起到进程在单机操作系统中类似的历史作用。


进程通常被定义为一个正在运行的程序的对象的实例,它有两个部分组成:
一个是操作系统用来管理进程的内核对象。内核对象也是系统用来存放关于进程的统计信息的地方。
另一个是地址空间,它包含所有可执行模块或DLL的代码和数据。它还包含动态内存分配的空间。如线程堆栈和堆(Heaps)分配空间。
进程是不活泼的。要是进程完成某项操作,它必须拥有一个在它的环境中运行的线程,该线程负责执行包含在进程的地址空间中的代码。实际上,单个进程可能包含若干个线程,所有这些线程都“同时”执行进程地址空间中的代码。为此,每个线程都有他自己的一组CPU寄存器(即,线程的上下文,定义在:WinNT.h头文件中)和它自己的堆栈。但是,由于Windows中,是针对进程来分配系统资源的。所以,线程的堆栈实际上位于其所属进程的虚拟地址空间中。每个进程至少拥有一个线程,来执行进程地址空间中的代码。如果没有线程来执行进程的地址空间中的代码,那么进程就没有存在的理由了,系统将自动撤销该进程和它的地址空间。
若要使所有线程都能运行,操作
