3 minute read

1. yield is a pun

感觉 python 把 yield 设计成了双关:

  • 于 generator 它表示 “产出 (value)”
  • 于 coroutine 它表示 “出让 (execution)”

但是 yield from 只于 generator 有 semantic 的意思 (“从 … 产出 value”),于 coroutine 就显得很无厘头 (所以改成 await 了)

2. blocking / non-blocking

blocking 的主语是 task/function/subroutine 这些 runnable,被 block 的对象是 process/thread/execution 这些 application。

需要注意的是 block 指整个 main process/thread 被 block,情况有:

  1. main process/thread 自身被 block
  2. main process/thread 启动的 coroutine 被 block

应该尽量避免 main process/thread 被 block

在 asyncio application 中,一般情况下 event loop 在 main process/thread 内被创建。而 event loop 你可以想象成是个发牌机器 (不停地发 coro.send(value)),如果 event loop 所在的 main process/thread 被 block,coroutines 就无法持续被触发,影响效率。

IO-bound vs CPU-bound tasks wrapped in coroutines

对单个 coroutine 而言:

  • await 等待 IO-bound operation 那不叫 blocked:
    • 因为此时可以 switch to other coroutine,因为你当前的 coroutine 只需要等待,没有别的 instruction 要跑
      • 比如 “等待 file loading to RAM”、”等待 server response” 这样的场合
  • await 等待 CPU-bound operation 是 blocked:
    • 因为这种情况下无法 switch,因为你当前 coroutine 还是有任务要跑
      • 比如 “等待大型矩阵运算” 这样的场合

那 best practice 当然是让 coroutine 跑 non-blocking 的任务。如果一定要跑 blocking 的任务,分情况处理:

  • 如果 blocking 的任务是第三方的 API 不能改,可以把 blocking 的任务 wrap 到 new thread/sub-process,从而转化成一个 non-blocking 的任务再传递给 coroutine
  • 如果条件允许,可以针对这个第三方的 API 开发 non-blocking 的版本,或者替换成已有的 alternative non-blocking 版本

3. Why asyncio is fast?

下面的图示里:

  • ab 都表示 statement / CPU instruction 在执行的状态
  • / 表示 being blocked 的状态

假设两个任务都是 “执行 -> 等待 IO -> 执行” 的 pattern,如果把它们在单线程内 sequentially 执行,会是下面的情形:

Time Elapsed : |-------------------------------|
Single Thread:  aaaaa/////aaaaa bbbbb/////bbbbb
Subroutine   : | subroutine_A  | subroutine_B  |      

如果用 asyncio 执行的话,会是这样的情形 (注意 asyncio 仍然是单线程):

Time Elapsed : |--------------------|
Single Thread:  aaaaabbbbbaaaaabbbbb
coroutine_A  :  aaaaa/////aaaaa 
coroutine_B  :       bbbbb/////bbbbb
  • main thread 在等待 coroutine_A 的 IO 时 switch 到 coroutine_B 去跑 statement / CPU instruction
  • 然后轮到等待 coroutine_B 的 IO 时,又 switch 回 coroutine_A 去跑剩下的 statement / CPU instruction
  • 相当于 main thread 没有闲下来空等
    • 其实就是小时候学的统筹方法:先烧开水,等水烧开的时候洗茶杯、准备茶叶,水烧开就能马上泡茶;不要空等着烧开水

总结一下就是:asyncio is concurrent but not parallel.

  • 关于 concurrency vs parallelism 这个经典的问题可以参考 What is the difference between concurrency and parallelism?
    • 在 asyncio 的 context 里就是说 2 个 coroutines 可以同时存在 (concurrent),但不能同时运行 (non-parallel)
  • 从另一个角度来说,asyncio 是单线程,所以肯定不是 parallel
    • 所以 asyncio 的速度来自于它的 concurrency
      • concurrent 的结果就是:asyncio 的程序的 statements / CPU instructions in total 还是在一个 process/thread 里跑的,它只是把等待 IO 的时间都拿来跑其他 coroutine 的 statements / CPU instructions 了

4. Race Conditions?

race condition 在 asyncio application 中是仍然可能存在的 (比如让 coroutines 同时 access global variables?),但相对 multithreading 肯定是更容易被解决的 (cooperative + non-parallel 总比 preemptive + parallel 要好处理吧?)

5. 题外话:time.sleep() vs asyncio.sleep()

首先 time.sleep() 既不是 IO-bound 也不是 CPU-bound,但仍然是 blocking:

  • IO-bound task 的特点是:如果换了更快的 IO 设备,这个 task 可以 get faster
  • CPU-bound task 的特点是:如果换了更快的 CPU (higher GHz),这个 task 可以 get faster
  • 但无论你是换 IO 设备还是换 CPU,time.sleep() 1 秒永远是 1 秒,不会 get faster 也不会 get slower,所以它既不是 IO-bound 也不是 CPU-bound
  • 无论是在 main process/thread 还是 coroutine 里调用 time.sleep(),都会 block main process/thread

asyncio.sleep() 是一个 non-blocking 版本,它只会让 coroutine sleep.

它的实现如下:

>>> % ipython3
Python 3.8.2 (default, Dec 21 2020, 15:06:04)
Type 'copyright', 'credits' or 'license' for more information
IPython 7.19.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]: import asyncio

In [2]: asyncio.sleep??
Signature: asyncio.sleep(delay, result=None, *, loop=None)
Source:
async def sleep(delay, result=None, *, loop=None):
    """Coroutine that completes after a given time (in seconds)."""
    if delay <= 0:
        await __sleep0()
        return result

    if loop is None:
        loop = events.get_running_loop()
    else:
        warnings.warn("The loop argument is deprecated since Python 3.8, "
                      "and scheduled for removal in Python 3.10.",
                      DeprecationWarning, stacklevel=2)

    future = loop.create_future()
    h = loop.call_later(delay,
                        futures._set_result_unless_cancelled,
                        future, result)
    try:
        return await future
    finally:
        h.cancel()
File:      /Library/Developer/CommandLineTools/Library/Frameworks/Python3.framework/Versions/3.8/lib/python3.8/asyncio/tasks.py
Type:      function

6. 题外话:与 GIL 的区别与联系

GIL 参见 Python GIL: Global Interpreter Lock

仔细研究下就会发现:”GIL 控制下的 multi-thread” 和 “multi-corotine” 的协作方式是一样的:

  • CPU instructions 无法并行,必须 serial 执行 (文中为了简化局势,姑且假设了单个 thread/corotine 在执行 CPU instructions 不会被 switch)
  • IO 部分都是 concurrent 运行

总结一下:

  Task Scheduler Task Spawner Task Runner Blockable?
multi-thread Interpreter + GIL Main Process (single) thread ?
multi-corotine Event Loop Main Thread (single) corotine ?

注意:

  • 说 multi-thread 的 scheduler 是 Interpreter + GIL 不一定准确,宽泛一点可以认为这个 scheduler 直接就是 OS
  • multi-thread 的场景下,OS 凌驾于 main process 之上
    • 但在 multi-thread 的场景下,main thread 可以控制 event loop
  • python 有 lib 可以自定义 event scheduler,支持 thread 的 scheduling,但这不在本文的讨论范围内

我们接着讨论 blocking 的问题:

  • 首先,被 blocked 的对象一定要一分为二地讨论,即它到底:
    • 是 task runner 被 blocked 了?
    • 还是 scheduler 被 blocked 了?
  • 其次,引起 blocking 的原因也有两种,即:
    • IO-bound (极端点,考虑 “read a 10GB file”),和
    • CPU-bound (极端点,考虑 “an infinite loop”)

对 multi-thread 而言:

Blockability IO-bound Task CPU-bound Task
Task Runner: thread blocked thread 一直在跑,所以 not blocked
Task Scheduler: OS not blocked 如果一直不 switch 到另外的 thread 的话 => “表现为” blocked
    如果 switch 到另外的 thread 的话 => not blocked

对 multi-corotine 而言:

Blockability IO-bound Task CPU-bound Task
Task Runner: corotine blocked corotine 一直在跑,所以 not blocked
Task Scheduler: Event Loop async io => not blocked main thread 被单个 corotine 一直占据,且无法 switch 到另外的 corotine,所以一定是 blocked
  sync io => blocked  

对比一下就能发现:asynchronous IO 并不是啥新鲜玩意儿,OS 级别早就实现了 (参考 Does all asynchronous I/O ultimately implemented in polling?),而 asyncio 做的无法就是把 OS 处理 thread 级别的 asynchronous IO 的逻辑搬运到 corotine 的场景下。

Categories:

Updated:

Comments