有多少种方法可以实现多线程同步和互斥？什么是同步和互斥，操作系统如何实现同步和互斥，进程和线程之间的关系是什么，进程比线程的开销是多少？

最编程 2024-03-30 18:46:04

...

文章目录

计算机基础知识
- 进程和线程
- 计算机的资源
- 内核
- - 操作系统的内核
  - 用户态和内核态
  - 内核线程和用户线程
- 进程的开销比线程大在了哪里？
线程的同步和互斥
- 什么是同步，什么是互斥？
- 操作系统实现同步的方式
- 操作系统实现互斥的方法：

在讲同步和互斥之前，需要先熟悉一些计算机相关的基础概念

计算机基础知识

进程和线程

进程（Process），顾名思义就是正在执行的应用程序，是软件的执行副本。而线程是轻量级的进程。
进程是分配资源的基础单位。而线程是程序执行的基本单位。

每一种应用，比如游戏，执行后是一个进程。但是游戏内部需要图形渲染、需要网络、需要响应用户操作，这些行为不可以互相阻塞，必须同时进行，这样就设计成线程。现代的CPU以多线程为主，如下内容也主要是说多线程，我们讲的调度更多的也是线程的调度。

计算机的资源

我们经常讲操作系统需要分配资源，最重要的 3 种资源是：计算资源（CPU）、内存资源和文件资源。计算机的CPU是有限的，而需要执行的任务往往有多个，CPU无法同时执行所有的任务，只能挨个执行，这就相当于是给任务（线程）分配了计算资源，得到了计算资源的任务就可以被执行。文件资源比如计算机中存储的文件是文件资源。

归根到底不管是计算机的组成还是操作系统，都面临着资源有限，而使用资源的任务（用户）却非常多，如何合理的安排资源，使得任务都能得到更好的执行，不管是线程和进程的设计也好，还是计算机的三级存储结构也好，都是在权衡利弊以及成本的基础上，为了更好的统筹规划资源而设计出来的。

内核

操作系统的内核

在这里插入图片描述

用户态和内核态

在这里插入图片描述

内核线程和用户线程

线程设计出来后，因为只被分配了计算资源（CPU），因此被称为轻量级进程。被分配的方式，就是由操作系统调度线程。操作系统创建一个进程后，进程的入口程序被分配到了一个主线程执行，这样看上去操作系统是在调度进程，其实是调度进程中的线程。

这种被操作系统直接调度的线程，我们也成为内核级线程。另外，有的程序语言或者应用，用户（程序员）自己还实现了线程。相当于操作系统调度主线程，主线程的程序用算法实现子线程，这种情况我们称为用户级线程。Linux 的 PThread API 就是用户级线程，KThread API 则是内核级线程。

进程的开销比线程大在了哪里？

以Linux为例：Linux 中创建一个进程自然会创建一个线程，也就是主线程。创建进程需要为进程划分出一块完整的内存空间，有大量的初始化操作，比如要把内存分段（堆栈、正文区等）。创建线程则简单得多，只需要确定 PC 指针和寄存器的值，并且给线程分配一个栈用于执行程序，同一个进程的多个线程间可以复用堆栈。因此，创建进程比创建线程慢，而且进程的内存开销更大。

线程的同步和互斥

什么是同步，什么是互斥？

同步：线程同步并不是说线程同时运行，而是让线程按照一定的顺序执行，使得最后的数据能达到同步。考虑这么一个场景，教室里很多学生，每个学生都在说话，七嘴八舌的，一片混论。如果这些同学挨个起来发言，或者是是以一个组为单位来发言，就会显得井然有序，大家也都能听到他们在说什么。同理，多线程的情况下，如果不加以控制，多个线程一起对数据进行添加或者是修改，数据会异常混论，就像是七嘴八舌的声音一样。我们写程序的目的，无非就是为了处理数据，处理数据的输入和输出，如果最后得到的输出不受你的控制，这个程序还有什么用？

互斥：有一些资源，比如：打印机。一次只能被一个线程访问，不允许多个线程同时访问，这种资源叫做临界资源。因此一个线程在访问这种资源的时候，其它线程不能访问，这就叫做互斥。【临界区：访问临界资源的那一段代码就叫做临界区。线程只有先进入临界区的才能访问到临界资源。】

一般来说：要实现同步，就得先实现互斥。比如上面同步中所举的那个场景，我们要让学生挨个起来发言，就得先保证一个同学发言的时候，其它同学不要发言，这就是一种互斥。

操作系统实现同步的方式

使用互斥量（Mutex）：采用互斥对象机制，只有拥有互斥对象的线程才有访问公共资源的权限。因为互斥对象只有一个，所以可以保证公共资源不会被多个线程同时访问。比如Java中的synchronized关键词和各种Lock都是这种机制。
使用信号量（Semphares）：它允许同一时刻多个线程访问同一资源，但是需要控制同一时刻访问此资源的最大线程数量

什么是信号量呢？可以看一下如下的例子

考虑有两个函数up和down。up将lock增 1，down将lock减 1。当 lock 为 0 时，如果还在down这个函数里，那么会自旋。

其中的cas是指CPU中的原子操作其伪代码形式可以这样表示：cas(&oldValue, expectedValue, targetValue)。比如我们要执行a++；假设a的初值为0，则可以这么写cas(&a, 0, 1)，表示什么意思呢？先去存储a的地址空间中取出a的值，如果a的值是0，我就执行更新操作，使得a的值变为1，然后再写回去，否则不更新a的值。为什么执行一个a++都要这么麻烦呢？为的就是再多线程并发的情况下防止其它线程更改a的值

up(&lock){
  while(!cas(&lock, lock, lock+1)) { }
}

down(&lock){
  while(!cas(&lock, lock, lock - 1) || lock == 0){}
}

考虑到多线程的情况下执行下面这个程序

int lock = 2;
down(&lock);
// 临界区
up(&lock);

如果只有一个线程在临界区，那么lock等于 1，第 2 个线程还可以进入。如果两个线程在临界区，第 3 个线程尝试down的时候，会陷入自旋锁。当然我们也可以用其他方式来替代自旋锁，比如让线程休眠。

当lock初始值为 1 的时候，这个模型就是实现互斥（mutex）。如果 lock 大于 1，那么就是同时允许多个线程进入临界区。这种方法，我们称为信号量（semaphore）。

使用事件（Event）：比如Wait/Notify：通过通知操作的方式来保持多线程同步。

操作系统实现互斥的方法：

软件实现互斥的方法

单标志法：设置一个公共的整形变量：turn。比如turn = 1则表示运行1这个进程进入临界区获得临界资源，其它线程则不允许进入。
双标志法先检查：每个线程在进入临界区访问临界资源之前，先查看临界资源是否正在被访问，若正在被访问，该线程需要进行等待；若临界资源没有被访问，该线程则进入临界区访问临界资源。我们可以设置一个标志数组flag[]，flag[i] = true，则表示i这个线程在访问临界资源，flag[i] = false则表示该线程没有访问临界资源。当i线程检测到没有其它线程在访问临界资源时，则进入临界区，并将flag[i]设置为true。

可能出现的问题：两个线程同时进入临界区。因为线程是先查看有没有其它线程在访问临界资源，然后在没有其它线程访问临界资源时再进入临界区访问临界资源，这两个步骤间是有一定的时间间隔的。考虑两个线程T1和T2。T1先检查有没有线程没有访问临界资源，检查结果发现，没有其它线程访问临界资源，于是准备进入临界区访问临界资源，T1正准备进入却还没有进入的时候。【发生这样原因除了是因为执行的过程中存在时间间隔，还有个原因就是可能会发生线程切换】T2也开始检查有没有线程访问临界资源，检查结果发现没有线程访问临界资源，于是T2也开始准备进入临界区访问临界资源。这下好了，T1和T2都检测到没有其它线程在访问临界资源，于是，都进入了临界区，很显然违背了互斥。
双标志法后检查：双标志法先检查是先检测临界资源的状态，然后再设置自己的标志。双标志后检查则相反：若一个线程准备访问临界资源，先将自己的标志位设置为true，然后再检查其它的线程的标志位，若检测到其它某个线程的标志位为true，则该线程等待，否则进入临界区。

可能出现的问题：导致饥饿状态，没有一个线程能进入临界区。考虑两个线程T1和T2。T1准备访问临界资源，于是将自己的标志位设置为true。在T1还未开始检测其它线程的状态时，T2刚好也准备访问临界资源，于是T2也赶紧将自己的标志位设置为true。这下好了，这两个线程检查是否有其它线程访问临界资源的时候，都能检查到对方的标志位为true，这两个线程就这样僵持着，互相都无法访问临界资源
Peterson（彼得森）算法：除了用一个flag[]数组来标志线程是否在访问临界资源或者是是否正准备访问临界资源，还设置了一个公共变量turn。

伪代码如下：

考虑两个线程i和j。

首先考虑3的那种情况。首先是i线程准备访问临界资源，于是将自己的标志位设置为true。然后呢，i线程假设此刻是j线程在访问临界区，于是将true设置为j。就在此时，j线程也准备访问临界资源，于是将自己的标志位设置为true，j线程也同样做了一个假设，假设此刻是i线程在访问临界区，于是把true的值设置为了i。最终，true的值变成了i。紧接着i线程开始在while循环中判断条件了，flag[j] == true成立，但是turn的值已经被j线程设置为了i，于是turn == j不成立，因此该循环条件不满足，i线程不执行该循环，i线程成功进入到临界区，避免了双标志法后检查产生的饥饿问题。

硬件实现方法

中断屏蔽方法

当一个线程获得了CPU的计算资源时，除非发生中断，否则，是不会发生线程切换的。我们的计算机能同时运行多个程序，并不是说这些程序同时获得了CPU的计算资源，而是CPU在不停地切换线程或者是进程，比如先执行A线程，执行了一会以后，然后对A线程发起中断请求，A线程被中断了，然后交出了运行权，接着发生线程切换。然后CPU又赶紧去执行B线程。B线程执行了一会有切换到其它线程。CPU的运算速度非常快，很短的时间内就能执行大量的代码，而线程切换的速度又非常快，所以给我们造成了一种程序在并行执行的现象。

一个线程准备访问临界资源时，先屏蔽中断，屏蔽了中断就意味着这样该线程不会被中断，某种程度上就意味着该线程是独占CPU了，其它线程不会被得到执行，只有当该线程执行完毕，再开启中断以后，其它线程才可能得到执行。
硬件指令方法

在计算机中，有一些指令是原子级的指令，也就是说指令在执行的过程中，不会发生线程切换而导致执行过程被中断。比如TAS(Test and Set)，CAS(Compare and Swap)。回想我们用软件实现互斥的方法的时候，比如双标志检查法，不管是先检查还是后检查。都存在着被打断的问题。比如T1线程先检测，发现没有其它线程使用临界资源，正当T1准备进入还没有进入的时候，T2线程却来捣乱了，偷偷将一些标志位给发生了改变。由于T1已经检测过了，所以它以为一切正常，继续执行，殊不知有些内容已经被修改了。如果我们把T1检测是否有其它线程使用中断，如果没有，将自己的值设置为true，否则，继续轮询这些操作封装成一个原子过程，也就是T1在执行这些代码的时候，一气呵成的执行完毕，不允许其它线程插进来捣乱，就不会发生同时进入临界区或者是发生饥饿的现象了。

参考
《王道操作系统考研复习指导》

上一篇： JAVA 互斥实现方案 JAVA 多线程互斥

下一篇：竞争问题：深入理解和解决方案