零拷贝是网络编程中的关键技术,许多性能优化都离不开它。在Java程序中,常用的零拷贝技术包括mmap(内存映射)和sendfile。那么,这些技术在操作系统中的设计是怎样的呢?我们将分析mmap和sendfile这两种零拷贝技术,并探讨nio中如何使用零拷贝来优化传统io的数据读写。
传统IO模型
DMA : direct memory access 直接内存拷贝( 不使用CPU )
mmap优化通过内存映射,mmap将文件映射到内核缓冲区,同时用户空间可以共享内核空间的数据。这样,在进行网络传输时,就可以减少内核空间到用户空间的拷贝次数,如下图所示:
mmap示意图
sendFile优化在linux 2.1版本中引入了sendFile函数,其基本原理如下:数据根本不经过用户态,直接从内核缓冲区进入到Socket Buffer。由于与用户态完全无关,这就减少了一次上下文切换。示意图和小结如下:
立即学习“Java免费学习笔记(深入)”;
sendFile示意图
提示:零拷贝从操作系统的角度来看,是没有CPU拷贝的。在Linux 2.4版本中,进行了修改,避免了从内核缓冲区拷贝到SocketBuffer的操作,直接拷贝到协议栈,从而再次减少了数据拷贝,如下图和小结所示:
sendFile优化后的示意图
这里其实有一次CPU拷贝(Kernel buffer -> socket buffer),但拷贝的信息很少,比如Length和offset信息,可以忽略。
零拷贝的再次理解我们所说的零拷贝,是从操作系统的角度来说的,因为内核缓冲区之间没有数据是重复的(只有kernel buffer有一份数据)。零拷贝不仅带来了更少的数据复制,还能带来其他的性能优势,例如更少的上下文切换,更少的CPU缓存伪共享以及无CPU校验和计算。
mmap和sendFile的区别如下:
- mmap适合小数据量读写,sendFile适合大文件传输。
- mmap需要4次上下文切换,3次数据拷贝;sendFile需要3次上下文切换,最少2次数据拷贝。
- sendFile可以利用DMA方式减少CPU拷贝,而mmap则不能(必须从内核拷贝到Socket缓冲区)。
零拷贝案例需求: 使用传统IO方法传递一个大文件,使用NIO零拷贝方式(transferTo)传递一个大文件,并比较两种传递方式的耗时。
以下是服务器端的代码:
package com.dance.netty.nio.demo.zerocopy; import java.net.InetSocketAddress; import java.nio.ByteBuffer; import java.nio.channels.ServerSocketChannel; import java.nio.channels.SocketChannel; public class ZeroCopyServer { public static void main(String[] args) throws Exception { InetSocketAddress inetSocketAddress = new InetSocketAddress(7001); ServerSocketChannel open = ServerSocketChannel.open(); open.socket().bind(inetSocketAddress); for (;;){ SocketChannel accept = open.accept(); int countSize = 0; ByteBuffer allocate = ByteBuffer.allocate(4096); while (-1 != countSize){ countSize = accept.read(allocate); allocate.rewind(); // 倒置 position=0 Mark 作废 } } } }
以下是客户端的代码:
package com.dance.netty.nio.demo.zerocopy; import java.io.File; import java.io.FileInputStream; import java.net.InetSocketAddress; import java.nio.channels.FileChannel; import java.nio.channels.SocketChannel; import java.time.Duration; import java.time.Instant; public class ZeroCopyClient { public static void main(String[] args) throws Exception { SocketChannel open = SocketChannel.open(); boolean connect = open.connect(new InetSocketAddress(7001)); // 获取文件Channel File file = new File("src/main/resources/01.jpeg"); FileChannel channel = new FileInputStream(file).getChannel(); Instant startTime = Instant.now(); /* * 在Linux下,一个transferTo方法就可以传输完成 * 在windows下,调用一次transferTo 只能传输8M,就需要分段传输文件,而且要记录传输时的位置 * transferTo 底层使用零拷贝 */ long l = channel.transferTo(0, channel.size(), open); System.out.println(l); Instant endTime = Instant.now(); System.out.println("用时:" + Duration.between(startTime,endTime).toMillis() + "ms"); channel.close(); } }
执行结果如下:
6806用时:3ms
零拷贝博客链接:https://www.php.cn/link/5b4e256d43c2e28b425581832a4e0a09
我认为这篇博客写的非常不错。
AIO基本介绍: JDK7引入了Asynchronous I/O,即AIO。在进行IO编程时,常用到两种模式:Reactor和Proactor。Java的NIO就是Reactor模式,当有事件触发时,服务器端得到通知进行相应的处理。AIO,即NIO2.0,称为异步非阻塞IO,AIO引入了异步通道的概念,采用了Proactor模式,简化了程序编写,有效的请求才启动线程。其特点是,先由操作系统完成后才通知服务端程序启动线程去处理,一般适用于连接数较多,且连接时间较长的应用。目前AIO还没有广泛应用,Netty也是基于NIO,而不是AIO,因此就不在这里详细讲解AIO了。有兴趣的可以参考以下链接:
BIO、NIO和AIO对比图:
举例说明:
- 同步阻塞:到理发店理发,就一直等着,直到轮到自己理发。
- 同步非阻塞:到理发店理发,发现前面有其他人,给理发师说一下先干其他事情,一会过来看是否轮到自己。
- 异步非阻塞:给理发师打电话,让理发师上门服务,自己干其他事情,理发师上门通知,来你家给你理发。
NIO完结撒花花。