第八章:并发
本章在第七章"进程间通信与信号"的基础上,引入了两大核心机制:
- 线程(Thread):将"进程"拆分为资源容器(Process)和执行单元(Thread),支持同一进程内的多线程并发
- 同步原语(Synchronization Primitives):互斥锁(Mutex)、信号量(Semaphore)、条件变量(Condvar),解决多线程共享资源的竞争问题
通过本章的学习和实践,你将理解:
- 线程与进程的区别和联系
- 线程的创建、退出和等待机制
- 竞态条件(Race Condition)和临界区(Critical Section)的概念
- 互斥锁的原理和实现(自旋锁 vs 阻塞锁)
- 信号量的 P/V 操作及其应用(互斥和同步)
- 条件变量与管程(Monitor)的概念
- 死锁的概念和检测算法
前置知识:建议先完成第一章至第七章的学习,理解裸机启动、Trap 处理、系统调用、多任务调度、虚拟内存、进程管理、文件系统、管道和信号。
项目结构
ch8/
├── .cargo/
│ └── config.toml # Cargo 配置:交叉编译目标和 QEMU runner
├── .gitignore # Git 忽略规则
├── build.rs # 构建脚本:编译用户程序,打包 easy-fs 磁盘镜像
├── Cargo.toml # 项目配置与依赖
├── LICENSE # GPL v3 许可证
├── README.md # 本文档
├── rust-toolchain.toml # Rust 工具链配置
├── test.sh # 自动测试脚本
└── src/
├── main.rs # 内核主体:初始化、调度循环、系统调用实现(含线程和同步原语)
├── fs.rs # 文件系统管理 + 统一的 Fd 枚举
├── process.rs # 进程与线程结构:Process(资源容器)+ Thread(执行单元)
├── processor.rs # 处理器管理:PThreadManager(双层管理器)
└── virtio_block.rs # VirtIO 块设备驱动
一、环境准备
1.1 安装 Rust 工具链
|
验证:
1.2 添加 RISC-V 64 编译目标
1.3 安装 QEMU 模拟器
Ubuntu / Debian:
macOS(Homebrew):
验证:
1.4 安装额外工具
1.5 获取源代码
方式一:只获取本实验
方式二:获取所有实验
二、编译与运行
2.1 编译
构建过程与第六、七章相同:build.rs 会自动下载编译 tg-user 用户程序,打包到 fs.img 磁盘镜像中。
环境变量说明:
TG_USER_DIR:指定本地 tg-user 源码路径TG_USER_VERSION:指定 tg-user 版本(默认0.2.0-preview.1)TG_SKIP_USER_APPS:跳过用户程序编译LOG:设置日志级别
2.2 运行(基础模式)
QEMU 命令(与第六、七章相同,挂载 fs.img 块设备):
2.3 运行(练习模式)
练习模式加载不同的用户测例集(ch8_exercise),用于测试死锁检测等扩展功能。
2.4 预期输出
[tg-ch8 ...] Hello, world!
[ INFO] .text ---> 0x80200000..0x8023xxxx
[ INFO] .rodata ---> 0x8023xxxx..0x8024xxxx
[ INFO] .data ---> 0x8024xxxx..0x81exxxxx
[ INFO] .boot ---> 0x81exxxxx..0x81exxxxx
[ INFO] (heap) ---> 0x81exxxxx..0x83200000
[ INFO] MMIO range -> 0x10001000..0x10002000
Rust user shell
>> ch8b_threads
...
threads test passed!
Shell: Process 2 exited with code 0
>>
你可以在 Shell 中运行各种多线程和同步测试程序:
ch8b_threads:基础多线程创建和 join 测试ch8b_sync_sem:使用信号量的同步测试ch8b_sync_condvar:使用条件变量的同步测试
2.5 运行测试
三、操作系统核心概念
3.1 为什么需要线程?
在前几章中,进程 既是资源容器也是执行单元。这种模型在以下场景效率不高:
| 场景 | 问题 |
|---|---|
| 并行计算 | 一个大型计算任务需要多个 CPU 核心同时执行 |
| 交替等待 I/O | 进程中的多个任务可能分别等待不同的 I/O 完成 |
| 服务并发 | 服务器需要同时处理多个客户端请求 |
如果每个并发任务都创建一个独立进程,会带来巨大的开销:
- 地址空间复制:fork 需要复制整个地址空间
- 资源隔离:进程之间不共享内存,通信需要通过管道等机制
- 切换开销:进程切换需要切换页表(刷新 TLB)
线程 解决了这些问题:同一进程的多个线程共享地址空间和文件描述符,但各自有独立的执行上下文(寄存器、栈)。线程间切换不需要切换页表,通信可以直接通过共享内存。
第七章:一个进程 = 一个线程
┌────────────────────────────┐
│ Process │
│ 地址空间 + 文件 + 上下文 │
└────────────────────────────┘
第八章:一个进程 = 多个线程
┌────────────────────────────┐
│ Process │
│ 地址空间 + 文件 + 同步原语 │
│ ┌────────┐ ┌────────┐ │
│ │Thread 0│ │Thread 1│ ... │
│ │上下文 │ │上下文 │ │
│ │用户栈 │ │用户栈 │ │
│ └────────┘ └────────┘ │
└────────────────────────────┘
3.2 线程模型
线程与进程的关系
| 属性 | 进程(Process) | 线程(Thread) |
|---|---|---|
| 地址空间 | 独享 | 共享(同进程线程共享) |
| 文件描述符 | 独享 | 共享 |
| 同步原语 | 独享 | 共享 |
| 执行上下文 | — | 独享(寄存器、栈指针) |
| TID | — | 独享 |
| 调度 | — | 线程是调度的基本单位 |
内核数据结构
/// 线程(执行单元)
/// 进程(资源容器)
线程相关系统调用
| 系统调用 | 功能 |
|---|---|
thread_create(entry, arg) |
在当前进程中创建新线程,入口为 entry,参数为 arg |
gettid() |
获取当前线程的 TID |
waittid(tid) |
等待指定线程退出,返回其退出码 |
thread_create 的关键步骤:
1. 在地址空间中搜索未映射的页面区域
2. 分配 2 页用户栈
3. 创建新的 LocalContext,设置入口地址和参数
4. 创建 Thread 对象,加入线程管理器
5. 返回新线程的 TID
管理器的变化
| 特性 | 第七章 | 第八章 |
|---|---|---|
| 全局管理器 | PManager |
PThreadManager |
| 管理层次 | 单层(进程) | 双层(进程 + 线程) |
| 调度单位 | 进程 | 线程 |
| task-manage feature | proc |
thread |
3.3 竞态条件与互斥
竞态条件(Race Condition)
当多个线程同时访问共享资源且至少一个是写操作时,就可能出现竞态条件:
线程 A: 线程 B:
load count → 5 load count → 5
add 1 → 6 add 1 → 6
store count ← 6 store count ← 6
期望结果:count = 7
实际结果:count = 6 ← 数据竞争!
临界区与互斥
解决竞态条件的方法是互斥(Mutual Exclusion):确保同一时刻只有一个线程可以进入临界区(访问共享资源的代码段)。
关键术语:
| 概念 | 说明 |
|---|---|
| 临界区(Critical Section) | 访问共享资源的代码段 |
| 互斥(Mutual Exclusion) | 同一时刻只有一个线程在临界区 |
| 原子性(Atomicity) | 操作不可被中断 |
| 死锁(Deadlock) | 多个线程互相等待对方释放资源 |
| 饥饿(Starvation) | 某个线程长期无法获取资源 |
3.4 互斥锁(Mutex)
基本概念
互斥锁是最基本的同步原语,提供 lock 和 unlock 两个操作:
lock(mutex) ← 获取锁(如果锁被占用则阻塞)
// 临界区操作
unlock(mutex) ← 释放锁
锁的类型
| 类型 | 获取失败时 | 优点 | 缺点 |
|---|---|---|---|
| 自旋锁(Spin Lock) | 忙等待(循环检查) | 无上下文切换开销 | 浪费 CPU 时间 |
| 阻塞锁(Blocking Lock) | 阻塞线程,进入等待队列 | 不浪费 CPU | 有上下文切换开销 |
本实现中使用阻塞锁(MutexBlocking):
lock(tid):若已锁定,将 tid 加入等待队列并返回 false(阻塞);否则获取锁返回 trueunlock():若等待队列非空,弹出一个线程 ID 返回(唤醒);否则释放锁
锁的性质
一个好的锁实现应满足三个性质:
- 互斥性(Mutual Exclusion):同时只有一个线程持有锁
- 公平性(Fairness):每个等待的线程最终都能获取锁
- 性能(Performance):获取和释放锁的开销尽可能小
系统调用
| 系统调用 | 功能 |
|---|---|
mutex_create(blocking) |
创建互斥锁(blocking=true 为阻塞锁) |
mutex_lock(mutex_id) |
加锁 |
mutex_unlock(mutex_id) |
解锁 |
3.5 信号量(Semaphore)
基本概念
信号量由 Dijkstra 在 1965 年提出,是一种更通用的同步原语。信号量是一个带有等待队列的计数器,提供两个原子操作:
| 操作 | 荷兰语名 | 语义 |
|---|---|---|
| P(down/wait) | Proberen(尝试) | 计数器减 1,若 < 0 则阻塞 |
| V(up/signal) | Verhogen(增加) | 计数器加 1,若有等待者则唤醒一个 |
信号量的用途
| 初始值 | 用途 | 说明 |
|---|---|---|
| 1 | 互斥(二值信号量) | 等价于互斥锁 |
| 0 | 同步 | 一个线程等待另一个线程的事件 |
| N | 资源计数 | 控制最多 N 个线程同时访问资源池 |
示例:使用信号量实现互斥
Semaphore sem = new Semaphore(1); // 初始值 = 1
Thread A: Thread B:
P(sem) P(sem) ← 如果 A 先执行,B 阻塞
// 临界区 // 临界区
V(sem) V(sem)
示例:使用信号量实现同步
Semaphore done = new Semaphore(0); // 初始值 = 0
Thread A(生产者): Thread B(消费者):
produce_data(); P(done); ← 阻塞等待 A 完成
V(done); consume_data();
系统调用
| 系统调用 | 功能 |
|---|---|
semaphore_create(res_count) |
创建信号量(初始计数 = res_count) |
semaphore_up(sem_id) |
V 操作(释放资源,可能唤醒等待者) |
semaphore_down(sem_id) |
P 操作(获取资源,可能阻塞) |
3.6 条件变量(Condvar)
为什么需要条件变量?
互斥锁只能保证"互斥",但不能高效地实现"等待某个条件成立"。例如,生产者-消费者问题中,消费者需要等待"缓冲区非空"这个条件:
// 用互斥锁的低效实现(忙等待)
loop {
mutex_lock(m);
if buffer.is_empty() {
mutex_unlock(m);
yield(); // 释放锁后让出 CPU,再重新尝试
continue;
}
data = buffer.pop();
mutex_unlock(m);
break;
}
条件变量提供了更高效的解决方案:
mutex_lock(m);
while buffer.is_empty() {
condvar_wait(cv, m); // 原子地释放锁 + 阻塞 + 被唤醒后重新获取锁
}
data = buffer.pop();
mutex_unlock(m);
管程(Monitor)
条件变量通常和互斥锁配合使用,二者合在一起被称为管程。管程有三种语义:
| 语义 | 特点 |
|---|---|
| Hoare 语义 | signal 后立即切换到被唤醒线程 |
| Hansen 语义 | signal 必须是临界区最后一个操作 |
| Mesa 语义 | signal 只是"提示",被唤醒线程需重新检查条件 |
本实现采用类似 Mesa 语义:condvar_signal 只是将等待线程加入就绪队列,被唤醒线程重新尝试获取锁时可能发现条件已不满足,因此需要在 while 循环中使用 condvar_wait。
内部实现
wait_with_mutex(tid, mutex):- 释放 mutex(可能唤醒另一个等待 mutex 的线程)
- 将 tid 加入条件变量的等待队列
- 返回 false 表示阻塞
signal():从等待队列弹出一个线程 ID 返回
系统调用
| 系统调用 | 功能 |
|---|---|
condvar_create(arg) |
创建条件变量 |
condvar_signal(condvar_id) |
唤醒一个等待线程 |
condvar_wait(condvar_id, mutex_id) |
等待条件变量(释放锁 + 阻塞 + 重获取锁) |
3.7 线程阻塞与唤醒
当线程尝试获取已被占用的同步原语时,需要进入阻塞态:
线程 A:mutex_lock(0)
→ MutexBlocking::lock(tid_A) 返回 false
→ 系统调用返回 ret = -1
→ 主循环判断 Id::MUTEX_LOCK && ret == -1
→ processor.make_current_blocked()
→ 线程 A 从就绪队列移除
线程 B:mutex_unlock(0)
→ MutexBlocking::unlock() 返回 Some(tid_A)
→ processor.re_enque(tid_A)
→ 线程 A 重新加入就绪队列
关键代码(在主循环中):
SEMAPHORE_DOWN | MUTEX_LOCK | CONDVAR_WAIT =>
3.8 死锁
死锁的定义
当一组线程中的每个线程都在等待另一个线程持有的资源时,就发生了死锁(Deadlock)。
经典示例——哲学家就餐问题:
哲学家 A:持有叉子 1,等待叉子 2
哲学家 B:持有叉子 2,等待叉子 3
哲学家 C:持有叉子 3,等待叉子 1
→ 循环等待 → 死锁!
死锁的四个必要条件
| 条件 | 说明 |
|---|---|
| 互斥 | 资源同时只能被一个线程使用 |
| 持有并等待 | 线程持有资源的同时等待其他资源 |
| 非抢占 | 资源只能由持有者主动释放 |
| 循环等待 | 存在线程间的资源等待环 |
3.9 系统调用汇总
| syscall ID | 名称 | 功能 | 状态 |
|---|---|---|---|
| 1000 | thread_create |
创建线程 | 新增 |
| 1001 | gettid |
获取线程 TID | 新增 |
| 1002 | waittid |
等待线程退出 | 新增 |
| 1010 | mutex_create |
创建互斥锁 | 新增 |
| 1011 | mutex_lock |
加锁 | 新增 |
| 1012 | mutex_unlock |
解锁 | 新增 |
| 1020 | semaphore_create |
创建信号量 | 新增 |
| 1021 | semaphore_up |
V 操作 | 新增 |
| 1022 | semaphore_down |
P 操作 | 新增 |
| 1030 | condvar_create |
创建条件变量 | 新增 |
| 1031 | condvar_signal |
唤醒等待线程 | 新增 |
| 1032 | condvar_wait |
等待条件变量 | 新增 |
| 469 | enable_deadlock_detect |
启用/禁用死锁检测(练习) | 练习 |
| 59 | pipe |
创建管道 | 继承 |
| 129 | kill |
发送信号 | 继承 |
| 56/57 | open/close |
打开/关闭文件 | 继承 |
| 63/64 | read/write |
读取/写入 | 继承 |
| 93 | exit |
退出 | 继承 |
| 220/221 | fork/exec |
创建/替换进程 | 继承 |
四、代码解读
4.1 src/main.rs —— 内核主体
与第七章的区别:
- 新增
tg_syscall::init_thread()初始化线程系统调用 - 新增
tg_syscall::init_sync_mutex()初始化同步原语系统调用 - 全局管理器从
PManager变为PThreadManager(双层管理) - 初始化时创建的是
(Process, Thread)对 - 主调度循环中新增线程阻塞处理:
SEMAPHORE_DOWN/MUTEX_LOCK/CONDVAR_WAIT返回 -1 时,调用make_current_blocked()将线程移出就绪队列- 返回非 -1 时,正常挂起(时间片轮转)
impls模块新增Threadtrait(thread_create/gettid/waittid)和SyncMutextrait
4.2 src/process.rs —— 进程与线程
核心变化:Process + Thread 分离
| 结构 | 管理内容 |
|---|---|
Thread |
TID、ForeignContext(寄存器 + satp) |
Process |
PID、地址空间、fd_table、signal、semaphore_list、mutex_list、condvar_list |
from_elf():同时创建 Process 和 Threadfork():深拷贝地址空间和 fd_table,同步原语列表不继承(子进程创建空列表)exec():替换地址空间和主线程上下文
4.3 src/processor.rs —— 双层管理器
pub type ProcessorInner = ;
ThreadManager:维护所有 Thread 实体和就绪队列(FIFO 调度)ProcManager:维护所有 Process 实体find_next():从就绪队列取出下一个 Thread 执行make_current_blocked():将当前 Thread 标记为阻塞态re_enque(tid):将被唤醒的 Thread 重新加入就绪队列
4.4 src/fs.rs —— 文件系统(与第七章相同)
统一的 Fd 枚举(File / PipeRead / PipeWrite / Empty),所有线程共享同一个 fd_table。
4.5 Cargo.toml —— 依赖说明
与第七章相比新增的依赖:
| 依赖 | 说明 |
|---|---|
tg-sync |
同步原语实现(MutexBlocking、Semaphore、Condvar) |
tg-task-manage(thread feature) |
双层管理器框架(PThreadManager) |
五、编程作业:死锁检测
5.1 问题描述
目前的 mutex 和 semaphore 相关的系统调用不会分析资源的依赖情况,用户程序可能出现死锁。我们希望系统中加入死锁检测机制,当发现可能发生死锁时拒绝对应的资源获取请求。
5.2 银行家算法
一种检测死锁的算法如下:
定义三个数据结构:
- 可利用资源向量 Available:含有 m 个元素的一维数组,每个元素代表可利用的某一类资源的数目,其初值是该类资源的全部可用数目。
Available[j] = k表示第 j 类资源的可用数量为 k。 - 分配矩阵 Allocation:n x m 矩阵,表示每类资源已分配给每个线程的资源数。
Allocation[i,j] = g表示线程 i 当前已分得第 j 类资源的数量为 g。 - 需求矩阵 Need:n x m 矩阵,表示每个线程还需要的各类资源数量。
Need[i,j] = d表示线程 i 还需要第 j 类资源的数量为 d。
算法运行过程:
-
设置两个向量:
- 工作向量
Work,初始时Work = Available - 结束向量
Finish[0..n-1] = false
- 工作向量
-
从线程集合中找到一个能满足下述条件的线程:
Finish[i] == false Need[i,j] <= Work[j]若找到,执行步骤 3;否则执行步骤 4。
-
当线程
thr[i]获得资源后,可顺利执行直至完成,释放分配给它的资源:Work[j] = Work[j] + Allocation[i,j] Finish[i] = true跳转回步骤 2。
-
如果
Finish[0..n-1]都为 true,则系统处于安全状态;否则系统处于不安全状态,即出现死锁。
5.3 新增系统调用
enable_deadlock_detect:
- syscall ID: 469
- 功能:为当前进程启用或禁用死锁检测功能
- 参数:
is_enable为 1 表示启用死锁检测,0 表示禁用 - 说明:
- 开启后,
mutex_lock和semaphore_down如果检测到死锁,应拒绝并返回-0xDEAD - 简便起见可对 mutex 和 semaphore 分别进行检测
- 开启后,
- 返回值:成功返回 0,出错返回 -1
5.4 实验要求
目录结构:
tg-ch8/
├── Cargo.toml(内核配置文件)
├── src/(内核源代码,需要修改)
│ ├── main.rs(内核主函数,包括系统调用接口实现)
│ ├── fs.rs(文件系统相关)
│ ├── process.rs(进程结构)
│ ├── processor.rs(进程/线程管理器)
│ └── virtio_block.rs(VirtIO 块设备实现)
└── tg-user/(用户程序,运行时自动拉取,无需修改)
└── src/bin(测试用例)
说明:
tg-user会在运行时自动拉取到tg-ch8/tg-user目录下- 只需修改
tg-ch8/src/目录下的内核代码
运行练习测例:
然后在终端中输入 ch8_usertest 运行,这个测例打包了所有你需要通过的测例。
运行自动化测试:
说明:本次实验框架变动较大,不要求合并之前的实验内容,只需通过 ch8 的全部测例和其他章节的基础测例即可。
六、本章小结
通过本章的学习和实践,你完成了操作系统中并发编程的核心机制:
- 线程模型:将进程拆分为资源容器(Process)和执行单元(Thread),支持同一进程内的多线程并发
- 互斥锁:通过 lock/unlock 保证临界区互斥访问,使用等待队列实现阻塞式互斥
- 信号量:P/V 操作支持计数型资源管理,可用于互斥和同步
- 条件变量:配合互斥锁使用,高效实现"等待条件成立"的模式
- 线程阻塞与唤醒:资源不可用时阻塞,资源释放时唤醒等待者
- 死锁:理解死锁的四个必要条件和银行家算法
七、思考题
-
线程 vs 进程:在什么场景下应该使用多线程而非多进程?反过来呢?请从安全性、性能和编程难度三个角度比较。
-
自旋锁 vs 阻塞锁:本实现使用了阻塞锁(
MutexBlocking),为什么不用自旋锁?在什么场景下自旋锁比阻塞锁更合适? -
信号量 vs 条件变量:两者都能实现线程同步。在"生产者-消费者"问题中,使用信号量和条件变量各有什么优劣?
-
死锁检测 vs 死锁预防:银行家算法是一种死锁检测/预防方法。你还知道哪些方法?各有什么优缺点?
-
fork 与线程:在多线程进程中调用 fork 会发生什么?Linux 中有什么特殊处理?本实现中是如何处理的?
-
公平性:本实现中的就绪队列使用 FIFO 调度。如果一个线程频繁获取和释放锁,会不会导致其他线程饥饿?如何改进?
-
条件变量的 while 循环:为什么
condvar_wait通常需要放在while循环中而不是if语句中?请用 Mesa 语义解释。
参考资料
- rCore-Tutorial-Guide 第八章
- rCore-Tutorial-Book 第八章
- OSTEP: Concurrency
- Dijkstra's Semaphore (1965)
- Dining Philosophers Problem
License
Licensed under GNU GENERAL PUBLIC LICENSE, Version 3.0.