Linux 5.9 将改进页面锁以解决性能倒退的问题

来自:cnBeta 2020-09-28

Phoronix 报道称,基于 AMD 霄龙(EPYC)平台的 Linux 5.0 ~ 5.9 内核基准测试表明,开发中的 Linux 5.9 内核在某些工作负载情况下存在性能退化的问题。据悉,该问题主要出现在 Apache HTTPD Web 服务器等测试项目中。为了解决这个问题,由 Linus Torvalds 主导的开发团队决定将之一分为二,并提出了基于页面锁定公平性的解决方案。

(来自:Phoronix)

这个问题的底层原理有些复杂,简单讲就是由于页面锁太讲究 " 公平性 ",有时反而会导致性能的倒退。

Linus Torvalds 和其他开发者共同研究了如何进一步改善页面锁定行为,并于今日将一个短期解决方案合并到了 Linux 5.9 的主线补丁更新中。

这项名叫 2a9127fcf229 的合并提交(mm: rewrite wait_on_page_bit_common ( ) logic"),允许更改页面锁中控制非公平性的参数。若在有锁的情况下等待,系统就会严格按照顺序来调动数据。

这项修订旨在消除长期存在的 " 看门狗 " 故障,其涉及在极端负载状况下的页面锁定。在此过程中,如果遭到其它页面的锁定,相关进程很可能陷入永久等待。

此外虽然 Linux 5.9 在某些基准测试项目上的跑分很是亮眼,但副作用却是导致其它一些基准测试项目的性能出现大幅滑退,比如平均延迟和吞吐量的恶化。

本次修订并非完全撤销此前的策略,而是引入了对页面锁定非公平性的可控制方案。虽然默认设置已经相对均衡,但有需要的开发者仍可通过 sysctl 接口进行调整。

显然,这些方案都围绕着页面锁定的重要性、以及某些锁定状况下的竞争程度来展开,但主要的争论似乎与 IO 无关(页面锁的起源)、对于页面文件的映射也是相对稳定的(除了错误地插入页表)。

此外开发者也可通过 sysctl sysctl_page_lock_unfairness(或 / proc / sys / vm / page_lock_unfairness)来调节内核页面锁定的非公平性程度(默认数值 0 为公平模式)。