如何在Linux中调整IO调度 Linux磁盘性能优化-小浪学习网

答案：调整linux IO调度器需先查看当前调度器，临时修改可通过写入/sys/block/设备/queue/scheduler，永久修改需在GRUB中添加elevator参数并更新配置；常见调度器有CFQ、NOOP、DEADLINE、mq-deadline、kyber、bfq，分别适用于公平调度、低开销直通、低延迟、多队列低延迟、快速响应和桌面场景；选择应基于IO模式、硬件类型和应用需求，结合iostat、iotop、fio等工具分析，并避免在SSD或虚拟化环境中使用过度调度，注意内核版本与多队列支持，必要时可微调调度器参数。

如何在Linux中调整IO调度 Linux磁盘性能优化

在linux系统中，调整IO调度器是优化磁盘性能的一项关键策略，它能根据你的存储硬件类型和应用工作负载，显著提升系统的响应速度和吞吐量。理解并选择合适的IO调度器，能够让你的磁盘资源得到更高效的利用，从而直接影响到整个系统的流畅性和性能表现。

解决方案

要调整Linux中的IO调度器，通常涉及以下几个步骤：

首先，你需要知道你的系统当前正在使用哪个IO调度器，以及有哪些可用的选项。可以通过查看

/sys/block/

目录下的设备信息来获取。例如，对于

sda

这块硬盘，你可以执行：

cat /sys/block/sda/queue/scheduler

输出会类似这样：

[mq-deadline] kyber bfq none

。方括号

[]

里显示的就是当前正在使用的调度器。

要临时更改IO调度器，你可以直接将新的调度器名称写入对应的文件。这在测试不同调度器效果时非常有用，重启后会恢复原状。例如，将

sda

的调度器改为

noop

：

echo noop > /sys/block/sda/queue/scheduler

如果你的系统中有多个磁盘，你需要为每个需要调整的磁盘单独执行此操作。

为了使更改永久生效，通常有几种方法。最常见且推荐的方式是通过修改GRUB配置文件。编辑

/etc/default/grub

文件，找到

GRUB_CMDLINE_LINUX_DEFAULT

这一行，在其中添加

elevator=<调度器名称>

。例如，设置为

noop

：

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash elevator=noop"

修改后，别忘了更新GRUB配置：

sudo update-grub

然后重启系统，新的IO调度器就会生效。另一种持久化方法是创建

udev

规则，这对于需要为特定设备设置特定调度器的情况更为灵活，但相对复杂一些。

Linux中常见的IO调度器有哪些，以及它们各自适合的应用场景？

在Linux的世界里，IO调度器就像是交通警察，负责协调和优化磁盘请求的顺序，以提高效率。但不同的“警察”有不同的执勤风格，适合处理的“交通状况”也各不相同。

早期的调度器中，

CFQ (Completely Fair Queuing)

曾是许多发行版的默认选择。它致力于为所有进程提供“公平”的IO带宽，通过为每个进程维护一个独立的请求队列，并进行时间片轮转。这在多用户、多任务的通用桌面或服务器环境中表现不错，因为它能确保没有单个进程会完全饿死。然而，这种公平性有时会引入额外的延迟，尤其是在SSD这种本身就很快的存储介质上，或者对于需要极低延迟的数据库应用来说，它可能会成为瓶颈。我个人在处理大量小文件随机读写的场景时，发现CFQ的开销有时反而会拖慢整体性能。

noop

调度器，顾名思思义，它几乎不做任何复杂的调度，只是简单地将IO请求以先进先出的方式传递给块设备。它就像一个“傻瓜式”的调度器，其优势在于开销极低。对于现代的SSD、NVMe设备，或者是在虚拟化环境中，当底层存储系统（如硬件RAID控制器或SAN）已经有自己的复杂调度机制时，

noop

往往是最佳选择。在这种情况下，让Linux内核进行额外的调度只会徒增开销，因为真正的调度工作已经在更低层完成了。我自己在使用高性能SSD时，几乎都会优先考虑

noop

或其多队列版本

mq-noop

，因为这能最大程度地发挥硬件的原始性能。

DEADLINE

调度器则更注重请求的“截止时间”。它为读请求和写请求分别维护队列，并尝试在每个请求到达其预设的截止时间前完成。这种设计非常适合那些对延迟敏感的应用，比如数据库服务器。通过优先处理即将超时的请求，

DEADLINE

能有效减少IO请求的平均等待时间，从而提高应用的响应速度。在我的经验里，对于那些需要频繁进行随机读写，并且对响应时间有较高要求的数据库实例，

DEADLINE

往往能带来比

CFQ

更好的表现。

随着Linux内核的发展和存储技术的进步，特别是多队列块层（

blk-mq

）的引入，出现了一批新的调度器，如

mq-deadline

、

kyber

和

bfq

。这些调度器是为充分利用多核CPU和高速NVMe等并行IO设备而设计的。

mq-deadline

是

DEADLINE

在多队列架构下的实现，保留了其低延迟的优势。

BFQ (Budget Fair Queuing)

则致力于提供更佳的桌面交互响应性，它能为交互式应用提供更可预测的IO性能，减少卡顿感。这些新一代调度器在现代系统中越来越常见，并针对新的硬件特性进行了优化。

如何根据我的具体工作负载来判断哪个IO调度器最适合？

选择一个“最佳”的IO调度器，从来都不是一个简单的公式问题，它更像是一门艺术，需要你深入了解自己的系统和应用。这其中没有放之四海而皆准的答案，更多的是一种基于观察、分析和实验的迭代过程。

首先，你需要成为一个“侦探”，去探究你的系统IO模式到底是什么样的。这包括几个关键问题：

读写比例： 你的应用是主要进行读操作，还是写操作，或者两者兼有？
IO模式： 主要是顺序读写（比如大文件传输、视频流），还是随机读写（比如数据库事务、Web服务器的小文件访问）？
IO大小： 是大量的小块IO，还是少量的大块IO？
IOPS和延迟： 你的应用对每秒IO操作数（IOPS）和IO延迟有什么要求？

你可以使用一些强大的命令行工具来收集这些信息。

iostat -x 1

是一个非常棒的工具，它能实时显示每个设备的详细IO统计信息，包括IOPS、吞吐量、平均队列长度和平均服务时间。通过观察

%util

（设备利用率）、

await

（平均IO等待时间，包括排队和处理时间）和

svctm

（平均服务时间），你可以初步判断磁盘是否是瓶颈，以及IO请求是否在队列中等待过久。

iotop

则能让你看到哪些进程正在产生大量的IO，这对于定位IO密集型应用非常有帮助。

仅仅观察是不够的，你还需要进行“模拟实验”。

fio (Flexible I/O Tester)

是一个工业级的IO基准测试工具，它能模拟各种复杂的IO模式，包括随机读写、顺序读写、不同块大小、不同并发度等。我会用

fio

来创建与我实际应用场景相似的负载，然后在不同的IO调度器下运行这些测试，比较它们的性能指标，比如IOPS、吞吐量和延迟。例如，如果你运行一个数据库，你可以模拟一个高并发、小块、随机读写的负载；如果你在做视频编辑，则可以模拟大块顺序读写。

此外，你还需要考虑你的存储硬件。对于传统的机械硬盘（HDD），由于其物理寻道时间的限制，调度器（如

CFQ

或

DEADLINE

）通过优化请求顺序来减少磁头移动，效果会比较明显。但对于固态硬盘（SSD）或NVMe设备，它们的随机访问性能极佳，内部已经有非常复杂的并行处理机制，此时像

noop

或

mq-noop

这样不做额外调度的选项，反而能减少不必要的开销，让硬件直接发挥其最大潜力。

最终，选择往往是一个权衡的过程。如果你的系统是通用服务器，负载混合，那么

CFQ

可能是一个稳妥的起点。如果你的应用对延迟非常敏感，比如数据库，那么

DEADLINE

或

mq-deadline

可能更合适。如果你的存储是高性能SSD或NVMe，并且底层有硬件RAID控制器，那么

noop

或

mq-noop

通常是最佳选择。没有一劳永逸的配置，你需要持续监控，并在必要时进行调整。

在调整IO调度器时，有哪些常见的误区或需要注意的高级考量？

在IO调度器的调整之路上，确实存在一些常见的误区，同时也有一些高级的考量点，这些往往决定了优化是成功还是适得其反。

一个非常普遍的误区是，认为所有高性能存储都应该使用最复杂的调度器。我见过不少朋友，在高性能的SSD或NVMe设备上，仍然坚持使用

CFQ

，结果发现性能不升反降。这是因为现代SSD内部已经有非常复杂的闪存转换层（FTL）和并行调度机制。当你在Linux内核层面再叠加一个复杂的

CFQ

调度器时，实际上是在做重复工作，甚至可能因为内核调度器与设备内部调度器之间的不协调，引入额外的延迟和开销。对于这类设备，

noop

或

mq-noop

通常是更优的选择，因为它将IO请求直接传递给设备，让设备自身去发挥其最佳调度能力。

另一个需要注意的点是虚拟化环境。在虚拟机内部，如果存储是通过虚拟化层（如VirtIO）提供的，那么虚拟机内部的IO调度器可能对实际的物理IO影响有限。在这种情况下，通常建议虚拟机内部使用

noop

，而将真正的IO调度优化放在宿主机层面。宿主机的IO调度器选择，则需要根据宿主机上运行的虚拟机数量、类型以及底层物理存储的特性来决定。

对于硬件RAID控制器，情况也类似。许多高性能的硬件RAID卡本身就带有强大的缓存和复杂的IO调度逻辑。此时，在Linux操作系统层面选择

noop

，让RAID卡来处理实际的IO调度，通常能获得更好的性能。如果Linux内核再进行一次调度，可能会干扰RAID卡的优化策略。

此外，内核版本也是一个重要的考量因素。随着Linux内核的不断演进，IO调度器的实现也在不断优化，甚至有新的调度器被引入，旧的调度器被废弃。例如，

blk-mq

（多队列块层）是现代内核处理IO请求的基础架构，它能更好地利用多核CPU和高速存储设备的并行性。基于

blk-mq

的调度器，如

mq-deadline

、

kyber

和

bfq

，在新的内核版本中表现通常优于传统的单队列调度器。因此，了解你当前使用的内核版本，以及它支持哪些调度器，是进行有效优化的前提。

最后，不要忽视调度器特定的参数调整。虽然我们通常只关注调度器的选择，但某些调度器（如

DEADLINE

或

bfq

）也提供了一些可调参数，比如

fifo_batch

（批量处理的请求数量）或

slice_idle

（在切换到其他进程前，当前进程可以空闲等待新请求的时间）。这些参数可以进一步微调调度器的行为，以适应更精细的负载。然而，这些参数的调整需要非常谨慎，通常只在对IO模式有深入理解，并且通过基准测试发现瓶颈时才进行。盲目调整可能会导致性能下降。我的建议是，先选择正确的调度器，如果还有性能瓶颈，再考虑深入研究这些参数。记住，IO调度器的优化是一个持续的、需要反复验证的过程，没有一劳永逸的银弹。

文章版权归作者所有，未经允许请勿转载。

THE END