一文彻底搞懂协程(coroutine)是什么

什么是协程

总结:程序员可以控制的,类似用户级线程

我们可以简单的认为:协程就是用户态的线程,但是上下文切换的时机是靠调用方(写代码的开发人员)自身去控制的。

同时,协程和用户态线程非常接近,用户态线程之间的切换不需要陷入内核,但部分操作系统中用户态线程的切换需要内核态线程的辅助。

下面是一个简单的例子:

void A() {

cout << 1 << " ";

cout << 2 << " ";

cout << 3 << " ";

}

void B() {

cout << "x" << " ";

cout << "y" << " ";

cout << "z" << " ";

}

int main(void) {

A();

B();

}

在单线程中,上述函数的输出为:

1 2 3 x y z

如果我们用 libco 库将上面程序改造一下:

void A() {

cout << 1 << " ";

cout << 2 << " ";

co_yield_ct(); // 切出到主协程

cout << 3 << " ";

}

void B() {

cout << "x" << " ";

co_yield_ct(); // 切出到主协程

cout << "y" << " ";

cout << "z" << " ";

}

int main(void) {

... // 主协程

co_resume(A); // 启动协程 A

co_resume(B); // 启动协程 B

co_resume(A); // 从协程 A 切出处继续执行

co_resume(B); // 从协程 B 切出处继续执行

}

同样在单线程中,改造后的程序输出如下:

1 2 x 3 y z

可以看出,切出操作是由 co_yield_ct() 函数实现的,而协程的启动和恢复是由 co_resume 实现的。函数 A() 和 B() 并不是一个执行完才执行另一个,而是产生了 “交叉执行“ 的效果,这就是通过协程实现的!

线程挺好的,我们为什么需要协程呢?

因为有些时候我们在执行一些操作(尤其是IO操作)时,不希望去做“创建一个新的线程”这种重量级的操作来异步处理。而是希望:在当前线程执行中,暂时切换到其他任务中执行,同时在IO真正准备好了之后,再切换回来继续执行!

相比于多开一个线程来操作,使用协程的好处:

减少了线程的重复高频创建;

尽量避免线程的阻塞;

提升代码的可维护与可理解性(毕竟不需要考虑多线程那一套东西了);

同时,下面是一些协程的特点:

协程可以主动让出 CPU 时间片;(注意:不是当前线程让出 CPU 时间片,而是线程内的某个协程让出时间片供同线程内其他协程运行;)

协程可以恢复 CPU 上下文;当另一个协程继续执行时,其需要恢复 CPU 上下文环境;

协程有个管理者,管理者可以选择一个协程来运行,其他协程要么阻塞,要么ready,或者died;

运行中的协程将占有当前线程的所有计算资源;

协程天生有栈属性,而且是 lock free;

协程、线程和进程之间的关系

协程、线程、进程之间的关系和比较

特性

进程

线程

协程

执行单位

独立的执行单元

进程内的执行单元

线程内的执行单元

内存空间

独立内存空间

共享进程内存空间

共享线程内存空间

切换开销

较低

最低

通信方式

IPC(进程间通信)

共享内存

共享内存、共享状态

调度方式

由操作系统内核调度

由操作系统内核调度

由用户程序自行调度

并发/并行性

并发和并行

并发和并行

并发(单线程),多线程可并行

应用场景

独立程序、服务器进程等

多任务处理、并发编程

IO 密集型任务、异步编程

协程、线程、进程的关系总结

进程包含线程: 一个进程可以包含多个线程,线程是进程的组成部分,多个线程共享进程的资源。

线程包含协程: 一个线程可以包含多个协程,协程是在用户态实现的轻量级线程,可以在单个线程内部实现多任务切换。

协程与线程、进程的区别: 协程与线程、进程最大的区别在于调度方式。进程和线程由操作系统调度,协程由用户程序自行调度,切换更加高效。

适用场景

进程: 适用于需要高隔离度、稳定性较高的场景,比如独立服务、数据库等。

线程: 适用于计算密集型任务、多任务并发执行、利用多核 CPU 的场景,比如 Web 服务器、数据处理等。

协程: 适用于 IO 密集型任务、异步编程、轻量级多任务切换的场景,比如网络爬虫、异步框架等。