在操作系统中 进程是资源分配的最小单位,线程是 CPU 调度的最小单位。无论是创建多进程还是创建多线程来解决问题,都要消耗一定的时间来创建进程、创建线程、以及管理他们之间的切换。
随着我们对于效率的追求不断提高,基于单线程来实现并发 又成为一个新的课题,即只用一个主线程(很明显可利用的 CPU 只有一个)情况下实现并发。这样就可以节省创建线进程所消耗的时间。
为此我们需要先回顾下并发的本质:切换+保存状态
CPU 正在运行一个任务,会在两种情况下切走去执行其他的任务(切换由操作系统强制控制)
- 一种情况是该任务发生了阻塞
- 另外一种情况是该任务计算的时间过长
ps:在介绍进程理论时,提及进程的三种执行状态,而线程才是执行单位,所以也可以将上图理解为线程的三种状态
第二种情况并不能提升效率,只是为了让 CPU 能够雨露均沾,实现看起来所有任务都被“同时”执行的效果,如果多个任务都是纯计算的,这种切换反而会降低效率。
为此我们可以基于 yield 来验证。yield 本身就是一种在单线程下可以保存任务运行状态的方法,我们来简单复习一下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42
|
import time def consumer(res): pass def producer(): res = [] for i in range(10000000): res.append(i) return res start = time.time() res=producer() consumer(res) stop = time.time() print(stop-start)
import time def consumer(): while True: x = yield def producer(): g = consumer() next(g) for i in range(10000000): g.send(i) start=time.time()
producer() stop=time.time() print(stop-start)
|
第一种情况的切换。在任务一遇到 IO 情况下,切到任务二去执行,这样就可以利用任务一阻塞的时间完成任务二的计算,效率的提升就在于此。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
| import time def consumer(): while True: x=yield def producer(): g=consumer() next(g) for i in range(10000000): g.send(i) time.sleep(2) start = time.time() producer() stop = time.time() print(stop-start)
|
对于单线程下,我们不可避免程序中出现 IO 操作,但如果我们能在自己的程序中(即用户程序级别,而非操作系统级别)控制单线程下的多个任务能在一个任务遇到 IO 阻塞时就切换到另外一个任务去计算,这样就保证了该线程能够最大限度地处于就绪态,即随时都可以被 CPU 执行的状态,相当于我们在用户程序级别将自己的 IO 操作最大限度地隐藏起来,从而可以迷惑操作系统,让其看到:该线程好像是一直在计算,IO 比较少,从而更多的将CPU 的执行权限分配给我们的线程。
协程的本质就是:在单线程下,由用户自己控制一个任务遇到 IO 阻塞了就切换另外一个任务去执行,以此来提升效率。为了实现它,我们需要找寻一种可以同时满足以下条件的解决方案:
- 可以控制多个任务之间的切换,切换之前将任务的状态保存下来,以便重新运行时,可以基于暂停的位置继续执行。
- 作为1的补充:可以检测 IO 操作,在遇到 IO 操作的情况下才发生切换
协程介绍
协程:是单线程下的并发,又称微线程,纤程。英文名 Coroutine。
一句话说明什么是线程:协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的。
需要强调的是:
- Python 的线程属于内核级别的,即由操作系统控制调度(如单线程遇到 IO 或执行时间过长就会被迫交出 CPU 执行权限,切换其他线程运行)
- 单线程内开启协程,一旦遇到 IO ,就会从应用程序级别(而非操作系统)控制切换,以此来提升效率(!!!非 IO 操作的切换与效率无关)
对比操作系统控制线程的切换,用户在单线程内控制协程的切换
优点如下:
- 协程的切换开销更小,属于程序级别的切换,操作系统完全感知不到,因而更加轻量级
- 单线程内就可以实现并发的效果,最大限度地利用 CPU
缺点如下:
- 协程的本质是单线程,无法利用多核,可以是一个程序开启多个进程,每个进程内开启多个线程,每个线程内开启协程
- 协程指的是单个线程,因而一旦协程出现阻塞,将会阻塞整个线程
总结协程特点:
- 必须在只有一个单线程里实现并发
- 修改共享数据不需加锁
- 用户程序里自己保存多个控制流的上下文栈
- 附加:一个协程遇到 IO 操作自动切换到其它协程(如何实现检测 IO,yield、greenlet 都无法实现,就用到了gevent模块(select机制))
提供协程支持的语言包括 Python,lua,go,erlang, scala和rust。
进程、线程、协程
- 多进程能够利用多核优势,但是进程间通信比较麻烦,另外,进程数目的增加会使性能下降,进程切换的成本较高。程序流程复杂度相对I/O多路复用要低。
- I/O多路复用是在一个进程内部处理多个逻辑流程,不用进行进程切换,性能较高,另外流程间共享信息简单。但是无法利用多核优势,另外,程序流程被事件处理切割成一个个小块,程序比较复杂,难于理解。
- 线程运行在一个进程内部,由操作系统调度,切换成本较低,另外,他们共享进程的虚拟地址空间,线程间共享信息简单。但是线程安全问题导致线程学习曲线陡峭,而且易出错。
Python 中 GIL 的存在,导致多线程一直不是很好用,相形之下,协程的优势就更加突出了。
- 协程有编程语言提供,由程序员控制进行切换,所以没有线程安全问题,可以用来处理状态机,并发请求等。但是无法利用多核优势。
上面的四种方案可以配合使用,我比较看好的是进程+协程的模式。
Greenlet 模块
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| from greenlet import greenlet def eat(name): print('%s eat 1' %name) g2.switch('egon') print('%s eat 2' %name) g2.switch() def play(name): print('%s play 1' %name) g1.switch() print('%s play 2' %name) g1=greenlet(eat) g2=greenlet(play) g1.switch('egon')
|
单纯的切换(在没有 IO 的情况下或者没有重复开辟内存空间的操作),反而会降低程序的执行速度
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
| import time def f1(): res=1 for i in range(100000000): res+=i def f2(): res=1 for i in range(100000000): res*=i start=time.time() f1() f2() stop=time.time() print('run time is %s' %(stop-start))
from greenlet import greenlet import time def f1(): res=1 for i in range(100000000): res+=i g2.switch() def f2(): res=1 for i in range(100000000): res*=i g1.switch() start=time.time() g1=greenlet(f1) g2=greenlet(f2) g1.switch() stop=time.time() print('run time is %s' %(stop-start))
|
greenlet 只是提供了一种比 generator 更加便捷的切换方式,当切到一个任务执行时如果遇到 IO,那就原地阻塞,仍然是没有解决遇到 IO 自动切换来提升效率的问题。
单线程里的这 20 个任务的代码通常会既有计算操作又有阻塞操作,我们完全可以在执行任务1时遇到阻塞,就利用阻塞的时间去执行任务2。。。。如此,才能提高效率,这就用到了Gevent模块。
Gevent 模块
Gevent 是一个第三方库,可以轻松通过gevent实现并发同步或异步编程,它是以C扩展模块形式接入 Python的轻量级协程。 Greenlet全部运行在主程序操作系统进程的内部,但它们被协作式地调度。
1 2 3 4 5 6 7 8
| g1=gevent.spawn(func,1,,2,3,x=4,y=5)
g2=gevent.spawn(func2) g1.join() g2.join()
g1.value
|
上例 gevent.sleep(2)
模拟的是 gevent 可以识别的 IO 阻塞,而 time.sleep(2)
或其他的阻塞, gevent 是不能直接识别的需要用下面一行代码,打补丁,就可以识别了
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| from gevent import monkey;monkey.patch_all() import gevent import time def eat(): print('eat food 1') time.sleep(2) print('eat food 2') def play(): print('play 1') time.sleep(1) print('play 2') g1=gevent.spawn(eat) g2=gevent.spawn(play) gevent.joinall([g1,g2]) print('主')
|
我们可以用 threading.current_thread().getName()
来查看每个 g1 和 g2,查看的结果为 DummyThread-n,即假线程
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
| from gevent import monkey;monkey.patch_all() import threading import gevent import time def eat(): print(threading.current_thread().getName()) print('eat food 1') time.sleep(2) print('eat food 2') def play(): print(threading.current_thread().getName()) print('play 1') time.sleep(1) print('play 2') g1=gevent.spawn(eat) g2=gevent.spawn(play) gevent.joinall([g1,g2]) print('主')
|
Gevent之同步与异步
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
| from gevent import spawn,joinall,monkey;monkey.patch_all() import time def task(pid): """ Some non-deterministic task """ time.sleep(0.5) print('Task %s done' % pid) def synchronous(): for i in range(10): task(i) def asynchronous(): g_l=[spawn(task,i) for i in range(10)] joinall(g_l) print('DONE') if __name__ == '__main__': print('Synchronous:') synchronous() print('Asynchronous:') asynchronous()
|