Go语言defer语句的三种机制整理

作者:面向人生编程 时间:2024-05-02 16:25:25 

Golang 的 1.13 版本 与 1.14 版本对 defer 进行了两次优化,使得 defer 的性能开销在大部分场景下都得到大幅降低,其中到底经历了什么原理?

这是因为这两个版本对 defer 各加入了一项新的机制,使得 defer 语句在编译时,编译器会根据不同版本与情况,对每个 defer 选择不同的机制,以更轻量的方式运行调用。

堆上分配

在 Golang 1.13 之前的版本中,所有 defer 都是在堆上分配,该机制在编译时会进行两个步骤:

  1. 在 defer 语句的位置插入 runtime.deferproc,当被执行时,延迟调用会被保存为一个 _defer 记录,并将被延迟调用的入口地址及其参数复制保存,存入 Goroutine 的调用链表中。

  2. 在函数返回之前的位置插入 runtime.deferreturn,当被执行时,会将延迟调用从 Goroutine 链表中取出并执行,多个延迟调用则以 jmpdefer 尾递归调用方式连续执行。

这种机制的主要性能问题存在于每个 defer 语句产生记录时的内存分配,以及记录参数和完成调用时参数移动的系统调用开销。

栈上分配

Go 1.13 版本新加入 deferprocStack 实现了在栈上分配的形式来取代 deferproc,相比后者,栈上分配在函数返回后 _defer 便得到释放,省去了内存分配时产生的性能开销,只需适当维护 _defer 的链表即可。

编译器有自己的逻辑去选择使用 deferproc 还是 deferprocStack,大部分情况下都会使用后者,性能会提升约 30%。不过在 defer 语句出现在了循环语句里,或者无法执行更高阶的编译器优化时,亦或者同一个函数中使用了过多的 defer 时,依然会使用 deferproc。

开放编码

Go 1.14 版本继续加入了开发编码(open coded),该机制会将延迟调用直接插入函数返回之前,省去了运行时的 deferproc 或 deferprocStack 操作,在运行时的 deferreturn 也不会进行尾递归调用,而是直接在一个循环中遍历所有延迟函数执行。

这种机制使得 defer 的开销几乎可以忽略,唯一的运行时成本就是存储参与延迟调用的相关信息,不过使用此机制需要一些条件:

  1. 没有禁用编译器优化,即没有设置 -gcflags "-N";

  2. 函数内 defer 的数量不超过 8 个,且返回语句与延迟语句个数的乘积不超过 15;

  3. defer 不是在循环语句中。

该机制还引入了一种元素 —— 延迟比特(defer bit),用于运行时记录每个 defer 是否被执行(尤其是在条件判断分支中的 defer),从而便于判断最后的延迟调用该执行哪些函数。

延迟比特的原理:

同一个函数内每出现一个 defer 都会为其分配 1 个比特,如果被执行到则设为 1,否则设为 0,当到达函数返回之前需要判断延迟调用时,则用掩码判断每个位置的比特,若为 1 则调用延迟函数,否则跳过。

为了轻量,官方将延迟比特限制为 1 个字节,即 8 个比特,这就是为什么不能超过 8 个 defer 的原因,若超过依然会选择堆栈分配,但显然大部分情况不会超过 8 个。

用代码演示如下:


deferBits = 0 // 延迟比特初始值 00000000

deferBits |= 1<<0 // 执行第一个 defer,设置为 00000001
_f1 = f1 // 延迟函数
_a1 = a1 // 延迟函数的参数
if cond {
 // 如果第二个 defer 被执行,则设置为 00000011,否则依然为 00000001
 deferBits |= 1<<1
 _f2 = f2
 _a2 = a2
}
...
exit:
// 函数返回之前,倒序检查延迟比特,通过掩码逐位进行与运算,来判断是否调用函数

// 假如 deferBits 为 00000011,则 00000011 & 00000010 != 0,因此调用 f2
// 否则 00000001 & 00000010 == 0,不调用 f2
if deferBits & 1<<1 != 0 {
 deferBits &^= 1<<1 // 移位为下次判断准备
 _f2(_a2)
}
// 同理,由于 00000001 & 00000001 != 0,调用 f1
if deferBits && 1<<0 != 0 {
 deferBits &^= 1<<0
 _f1(_a1)
}

总结

以往 Golang defer 语句的性能问题一直饱受诟病,最近正式发布的 1.14 版本终于为这个争议画上了阶段性的句号。如果不是在特殊情况下,我们不需要再计较 defer 的性能开销。

参考资料

[1] Ou Changkun - Go 语言原本

[2] 峰云就她了 - go1.14实现defer性能大幅度提升原理

[3] 34481-opencoded-defers

来源:https://www.cnblogs.com/zkqiang/p/12389420.html

标签:Go语言,defer语句
0
投稿

猜你喜欢

  • css布局自适应高度方法

    2007-05-11 17:03:00
  • CentOS7下mysql 8.0.16 安装配置方法图文教程

    2024-01-22 11:49:56
  • Yii2中的场景(scenario)和验证规则(rule)详解

    2024-04-28 09:43:50
  • 详解springboot 使用c3p0数据库连接池的方法

    2024-01-19 04:59:09
  • mysql错误处理之ERROR 1665 (HY000)

    2024-01-21 12:16:54
  • MySQL数据库优化详解

    2024-01-23 12:51:55
  • python实现通过pil模块对图片格式进行转换的方法

    2021-03-06 01:55:54
  • c#连接mysql数据库的方法

    2024-01-23 02:52:32
  • Python列表操作方法详解

    2021-05-17 14:45:58
  • Go语言中的IO操作及Flag包的用法

    2024-04-27 15:31:31
  • MySQL如何根据不同条件联查不同表的数据if/case

    2024-01-21 14:20:10
  • php判断用户是否关注微信公众号

    2024-04-28 09:45:25
  • 简单了解python关键字global nonlocal区别

    2023-07-26 15:47:07
  • mysql模糊匹配多个值的两种方法实例

    2024-01-27 10:12:06
  • JavaScript实现Tab标签页切换的最简便方式(4种)

    2024-04-17 10:30:36
  • python入门之基础语法学习笔记

    2022-09-08 18:15:49
  • Python开发之QT解决无边框界面拖动卡屏问题(附带源码)

    2023-10-31 09:31:29
  • python用quad、dblquad实现一维二维积分的实例详解

    2022-02-17 05:32:51
  • Python中super().__init__()测试以及理解

    2023-08-25 02:22:04
  • 仿微博字符限制效果实现代码

    2024-04-28 09:51:18
  • asp之家 网络编程 m.aspxhome.com