Go语言基础之并发
有人将Go语言比作21世纪的C语言,第一是因为Go语言设计简单,第二是因为21世纪最重要的就是并行程序设计,而Go语言从语言层面就支持并行了。
goroutine
goroutine是Go语言并行设计的核心。goroutine的本质是协程,但是比线程更小,十几个goroutine可能体现在底层也就五六个线程。Go语言内部已经帮你实现了这些goroutine之间的内存共享。执行goroutine只需要极少的栈内存(大概4~5KB),当然也会根据相应的数据伸缩。正因为如此,可以同时运行成千上万个并发任务。goroutine比thread更易用、更高效、更轻便。
goroutine是通过Go的runtime管理的一个线程管理器。 goroutine通过go
关键字实现,其实本质上就是一个函数。
1 | go hello(a, b, c) |
通过关键字go
就启动了goroutine。来看一个例子
1 | package main |
可以看到go
关键字很方便地实现了并发编程。上面的多个goroutine运行在同一个进程里,共享内存数据,不过设计上还是要遵循:不要通过共享来通信,而要通过通信来共享。
Go 1.5以前调度器仅使用单线程,也就是说只实现了并发。想要发挥多核处理器的并行,需要在我们的程序中显式调用 runtime.GOMAXPROCS(n) 告诉调度器同时使用多个线程。GOMAXPROCS 设置了同时运行逻辑代码的系统线程的最大数量,并返回之前的设置。如果n < 1,不会改变当前设置。Go 1.5以后将标识并发系统线程个数的runtime.GOMAXPROCS的初始值由1改为了运行环境的CPU核数。
channels
goroutine运行在相同的地址空间,因此访问共享内存必须做好同步。那么goroutine之间如何进行数据的通信的呢?答案是channel。Go提供了一个很好的通信机制channel。channel可以和Unix Shell中的双向通道做类比,即可以通过它发送和接受值。这些值只能是特定的类型,channel类型。定义一个channel时,也需要定义发送到channel的值的类型。注意,必须使用make
关键字创建channel
1 | ci := make(chan int) |
channel通过操作符<-
来接收和发送数据
1 | ch <- v // 发送v到channel ch. |
举个具体的例子
1 | package main |
乍一看,以为x应该输出为6,y输出为15。但结果恰恰相反,说明了goroutine的执行顺序是倒叙执行的,最后一个goroutine先执行,然后是倒数第二个,以此类推。默认情况下,channel接收和发送数据都是阻塞的,除非另一端已经准备好,这样就使得goroutines同步变的更加的简单,而不需要显式的lock。所谓阻塞,也就是如果读取(value := <-ch)它将会被阻塞,直到有数据接收。其次,任何发送(ch<-5)将会被阻塞,直到数据被读出。无缓冲channel是在多个goroutine之间同步很棒的工具。
有缓冲Channels
上面我们介绍了默认的非缓存类型的channel,不过Go也允许指定channel的缓冲大小,很简单,就是channel可以存储多少元素。ch:= make(chan bool, 4),创建了可以存储4个元素的bool 型channel。在这个channel 中,前4个元素可以无阻塞的写入。当写入第5个元素时,代码将会阻塞,直到其他goroutine从channel 中读取一些元素,腾出空间。语法如下
1 | ch := make(chan type, value) |
当 value = 0 时,channel 是无缓冲阻塞读写的,当value > 0 时,channel 有缓冲、是非阻塞的,直到写满 value 个元素才阻塞写入。看一个具体的例子
1 | package main |
Range和Close
上面这个例子中,我们需要读取两次c,这样不是很方便,Go考虑到了这一点,所以也可以通过range,像操作slice或者map一样操作缓存类型的channel,请看下面的例子
1 | package main |
for i := range c
能够不断的读取channel里面的数据,直到该channel被显式的关闭。上面代码我们看到可以显式的关闭channel,生产者通过内置函数close
关闭channel。关闭channel之后就无法再发送任何数据了,在消费方可以通过语法v, ok := <-ch
测试channel是否被关闭。如果ok返回false,那么说明channel已经没有任何数据并且已经被关闭。
记住应该在生产者的地方关闭channel,而不是消费的地方去关闭它,这样容易引起panic
另外记住一点的就是channel不像文件之类的,不需要经常去关闭,只有当你确实没有任何发送数据了,或者你想显式的结束range循环之类的
Select
我们上面介绍的都是只有一个channel的情况,那么如果存在多个channel的时候,我们该如何操作呢,Go里面提供了一个关键字select
,通过select
可以监听channel上的数据流动。
select
默认是阻塞的,只有当监听的channel中有发送或接收可以进行时才会运行,当多个channel都准备好的时候,select是随机的选择一个执行的。
1 | package main |
在select
里面还有default语法,select
其实就是类似switch的功能,default就是当监听的channel都没有准备好的时候,默认执行的(select不再阻塞等待channel)。
1 | select { |
超时
有时候会出现goroutine阻塞的情况,那么我们如何避免整个程序进入阻塞的情况呢?我们可以利用select来设置超时,通过如下的方式实现:
1 | func main() { |
runtime goroutine
runtime包中有几个处理goroutine的函数:
Goexit
退出当前执行的goroutine,但是defer函数还会继续调用
Gosched
让出当前goroutine的执行权限,调度器安排其他等待的任务运行,并在下次某个时候从该位置恢复执行。
NumCPU
返回 CPU 核数量
NumGoroutine
返回正在执行和排队的任务总数
GOMAXPROCS
用来设置可以并行计算的CPU核数的最大值,并返回之前的值。
总结
Go语言通过goroutine来实现并发操作。goroutine其本质是协程,是比线程更小的存在。比起线程而言更易用、更高效、更轻便。在使用goroutine时,记住我们要遵循的原则,不要通过共享来通信,要通过通信来实现共享。另外,goroutine通过channel来实现数据之间的通信。创建channel需要使用make
关键字。