设计原理
Go 语言中最常见的、也是经常被人提及的设计模式就是:不要通过共享内存的方式进行通信,而是应该通过通信的方式共享内存。在很多主流的编程语言中,多个线程传递数据的方式一般都是共享内存,为了解决线程竞争,我们需要限制同一时间能够读写这些变量的线程数量,然而这与 Go 语言鼓励的设计并不相同。
虽然我们在 Go 语言中也能使用共享内存加互斥锁进行通信,但是 Go 语言提供了一种不同的并发模型,即通信顺序进程(Communicating sequential processes,CSP)1。Goroutine 和 Channel 分别对应 CSP 中的实体和传递信息的媒介,Goroutine 之间会通过 Channel 传递数据
上图中的两个 Goroutine,一个会向 Channel 中发送数据,另一个会从 Channel 中接收数据,它们两者能够独立运行并不存在直接关联,但是能通过 Channel 间接完成通信。
先入先出
目前的 Channel 收发操作均遵循了先进先出的设计,具体规则如下:
- 先从 Channel 读取数据的 Goroutine 会先接收到数据;
- 先向 Channel 发送数据的 Goroutine 会得到先发送数据的权利;
无锁管道
锁是一种常见的并发控制技术,我们一般会将锁分成乐观锁和悲观锁,即乐观并发控制和悲观并发控制,无锁(lock-free)队列更准确的描述是使用乐观并发控制的队列。乐观并发控制也叫乐观锁,很多人都会误以为乐观锁是与悲观锁差不多,然而它并不是真正的锁,只是一种并发控制的思想。
乐观并发控制本质上是基于验证的协议,我们使用原子指令 CAS(compare-and-swap 或者 compare-and-set)在多线程中同步数据,无锁队列的实现也依赖这一原子指令。
Channel 在运行时的内部表示是 runtime.hchan,该结构体中包含了用于保护成员变量的互斥锁,从某种程度上说,Channel 是一个用于同步和通信的有锁队列,使用互斥锁解决程序中可能存在的线程竞争问题是很常见的,我们能很容易地实现有锁队列。
然而锁导致的休眠和唤醒会带来额外的上下文切换,如果临界区过大,加锁解锁导致的额外开销就会成为性能瓶颈。1994 年的论文 Implementing lock-free queues 就研究了如何使用无锁的数据结构实现先进先出队列,而 Go 语言社区也在 2014 年提出了无锁 Channel 的实现方案,该方案将 Channel 分成了以下三种类型:
- 同步Channel - 不需要缓冲区,发送方会直接将数据交给(Handoff)接收方;
- 异步Channel - 基于环形缓存的传统生产者消费者模型;
chan struct{}
类型的异步Channel -struct{}
类型不占用内存空间,不需要实现缓冲区和直接发送(Handoff)的语义。
这个提案的目的也不是实现完全无锁的队列,只是在一些关键路径上通过无锁提升 Channel 的性能。社区中已经有无锁 Channel 的实现,但是在实际的基准测试中,无锁队列在多核测试中的表现还需要进一步的改进。
数据结构
|
|
字段解释
qcount
: 队列中的元素数量
dataqsiz
: 底层循环数组的长度
buf
: 指向底层循环数组的指针,只针对有缓冲区的channel
elemsize
:channel
中的元素数据类型大小
closed
:channel
是否被关闭的标识
elemtype
:channel
中的元素类型
sendx
: 已发送元素在循环数组中的索引
recvx
: 已接收元素在数组中的索引
recvq
: 等待接收的goroutine
队列
sendq
: 等待发送的goroutine
队列
lock
: 保护channel
中所有字段,保证每个读或者写channel
都是原子的。
sendq
和 recvq
存储了当前Channel由于缓冲区空间不足二阻塞的 Goroutine
列表,这些等待队列使用双向链表runtime.waitq
表示,结构如下:
|
|
runtime.sudog
表示一个在等待列表中的Goroutine
,该结构中存储了两个分别指向前后runtime.sudog
的指针以构成链表。
创建管道
语法如下:
|
|
Go 语言中所有Channel的床架都会使用 make
关键字。编译器会将make(chan int, 10)
表达式转换成 OMAKE
类型的节点,并在类型检查阶段将OMAKE
类型的节点转换成OMAKECHAN
类型:
|
|
这一阶段会对传入的make
关键字的缓冲区大小进行检查,如果我们不向make
传递表示缓冲区大小参数,那么就会设置一个默认值0,也就是当前的Channel不存在缓冲区。
OMAKECHAN
类型的节点最终都会在SSA中间代码生成阶段之前被转换成调用runtime.makechan或者runtime.makechan64函数:
|
|
runtime.makechan 和 runtime.makechan64 会根据传入的参数类型和缓冲区大小创建一个新的 Channel 结构,其中后者用于处理缓冲区大小大于 2 的 32 次方的情况,因为这在 Channel 中并不常见,所以我们重点关注 runtime.makechan:
|
|
上述代码根据 Channel 中收发元素的类型和缓冲区的大小初始化 runtime.hchan 和缓冲区:
- 如果当前Channel中不存在缓冲区,那么就只会为
runtime.hchan
分配一段内存空间; - 如果当前Channel中存储的类型不是指针类型,会为当前的Channel和底层的数组分配一块连续的内存空间;
- 在默认情况下会单独为
runtime.hchan
和缓冲区分配内存。
在函数的最后会统一更新runtime.hchan
的elemsize
、elemtype
和datasize
几个字段。
发送数据
我们想要向Channel
发送数据时,就需要使用 ch <- i
语句,编译器会将它解析成OSEND
节点并在cmd/compile/internal/gc.walkexpr
中转换成runtime.chansend1:
|
|
chansend1
只是调用了runtime.chansend
并传入Channel
和需要发送的数据。chansend
是向Channel
中发送数据时一定会调用的函数,该函数包含了发送数据的全部逻辑,如果我们在调用时将block
参数设置成true
,那么表示当前发送操作是阻塞的。
源码位置:src/runtime/chan.go#L160
|
|
在发送数据的逻辑执行之前会先为当前 Channel 加锁,防止多个线程并发修改数据。如果 Channel 已经关闭,那么向该 Channel 发送数据时会报 “send on closed channel” 错误并中止程序。
因为runtime.chansend
函数的实现比较复杂,所以我们将该函数的执行过程分为以下三部分:
- 当存在等待的接收者,通过
runtime.send
直接将数据发送给阻塞的接收者; - 当缓冲区存在空余空间时,将发送的数据写入Channel的缓冲区;
- 当不存在缓冲区或者缓冲区已满,等待其他 Goroutine从Channel接收数据。
直接发送
如果目标Channel没有被关闭并且已经有处于读等待的Goroutine,那么runtime.chansend
会从接收队列recvq
中取出最先陷入等待的Goroutine
并直接向它们发送数据:
|
|
发送数据时会调用runtime.send
,该函数的执行可以分为两个部分:
- 调用
runtime.sendDirect
将发送的数据直接拷贝到x = <-c
表达式中变量x
所在的内存地址上; - 调用
runtime.goready
将等待接收数据的Goroutine标记成可运行状态Grunnable
并把该Goroutine放到发送方所在的处理器runnext
上等待执行,该处理器在下一次调度时会立刻唤醒数据的接收方;
|
|
需要注意的是,发送数据的过程只是将接收方的Goroutine放到了处理器的runnext
中,程序没有立刻执行该Goroutine。
缓冲区
如果创建的Channel包含缓冲区并且Channel中的数据没有装满,会执行下面这段代码:
|
|
在这里我们首先会使用 runtime.chanbuf
计算出下一个可以存储数据的位置,然后通过 runtime.typedmemmove
将发送的数据拷贝到缓冲区中并增加 sendx 索引和 qcount 计数器。
如果当前Channel的缓冲区未满,向Channel发送的数据会存储在Channel的sendx
索引所在的位置,并将sendx
索引加1,,因为这里的buf
是一个循环数组,所以当sendx
等于dataqsiz
时会重新回到数组开始的位置。
阻塞发送
当Channel没有接收者能够处理数据时,向Channel发送数据会被下游阻塞,当然使用select
关键字可以向Channel非阻塞的发送消息。向Channel阻塞地发送数据会执行下面的代码。
|
|
- 调用 runtime.getg 获取发送数据使用的 Goroutine;
- 执行 runtime.acquireSudog 获取 runtime.sudog 结构并设置这一次阻塞发送的相关信息,例如发送的 Channel、是否在 select 中和待发送数据的内存地址等;
- 将刚刚创建并初始化的 runtime.sudog 加入发送等待队列,并设置到当前 Goroutine 的 waiting 上,表示 Goroutine 正在等待该 sudog 准备就绪;
- 调用 runtime.goparkunlock 将当前的 Goroutine 陷入沉睡等待唤醒;
- 被调度器唤醒后会执行一些收尾工作,将一些属性置零并且释放 runtime.sudog 结构体;
函数在最后会返回 true 表示这次我们已经成功向 Channel 发送了数据。
小结
我们在这里可以简单梳理和总结一下使用 ch <- i 表达式向 Channel 发送数据时遇到的几种情况:
- 如果当前 Channel 的 recvq 上存在已经被阻塞的 Goroutine,那么会直接将数据发送给当前 Goroutine 并将其设置成下一个运行的 Goroutine;
- 如果 Channel 存在缓冲区并且其中还有空闲的容量,我们会直接将数据存储到缓冲区 sendx 所在的位置上;
- 如果不满足上面的两种情况,会创建一个 runtime.sudog 结构并将其加入 Channel 的 sendq 队列中,当前 Goroutine 也会陷入阻塞等待其他的协程从 Channel 接收数据;
发送数据的过程中包含几个会触发Goroutine调度的时机:
- 发送数据时发现 Channel 上存在等待接收数据的 Goroutine,立刻设置处理器的 runnext 属性,但是并不会立刻触发调度;
- 发送数据时并没有找到接收方并且缓冲区已经满了,这时会将自己加入 Channel 的 sendq 队列并调用 runtime.goparkunlock 触发 Goroutine 的调度让出处理器的使用权;
接收数据
接收数据有两种写法,一种是只值返回接收数据,第二种是返回接收数据和channel
的关闭状态两个字段,当接收到响应类型的零值时需要判断是真实的发送者发送的数据,还是channel被关闭后,返回给接收者的默认类型的零值,可以使用第二种返回channel
的关闭状态。
|
|
这两种不同的方法经过编译器的处理都会变成 ORECV 类型的节点,后者会在类型检查阶段被转换成 OAS2RECV 类型。虽然不同的接收方式会被转换成 runtime.chanrecv1 和 runtime.chanrecv2 两种不同函数的调用,但是这两个函数最终还是会调用 runtime.chanrecv。
当我们从一个空 Channel 接收数据时会直接调用 runtime.gopark 让出处理器的使用权。
|
|