博客 最清晰的零拷贝详解,看一遍就会

最清晰的零拷贝详解,看一遍就会

   数栈君   发表于 2023-08-07 09:50  229  0

1.前置知识

1.1.内存分段和CPU的态

现代计算机在加载操作系统、正常启动后,其内存会主要分成两大段:

    ●内核段


    ●用户段


内核段:

操作系统本质上是一个计算机的管理程序,该程序相关的所有资源,被存放在内核段中。

用户段:

用户段用来存放各个进程的数据和指令。

根据所访问的内存段的不同,CPU会处于不同的态,访问用户段的时候处于用户态,访问内核段的时候处于内核态。

1.2.计算机IO的过程

在程序执行时有很多高耗时操作,比如IO操作就是。当计算机执行IO操作的时候,IO设备的速度肯定是远远落后于CPU的速度的,IO没有完成,后续依赖的数据没到位,程序也没办法继续向下执行,于是CPU就只好赋闲,傻傻的等IO执行完成,再继续向下运行程序,无疑这会造成CPU资源的浪费,使得计算机的工作效率变得很低。

于是现代操作系统中将CPU划分成了很多时间片,不同时间片可以去运行不同的程序,比如:

这一秒运行的A程序,

下一秒运行的B程序,

再下一秒再运行A程序。

这样间插执行就会避免傻等带来的CPU资源的浪费,如果IO耗时2秒,那么CPU至少还有1秒被其它程序使用到了。

后来操作系统用了更激进的方式来处理IO指令,让CPU的时间一丝一毫都不被浪费,这种处理方式就是遇见IO指令,直接启动IO后,CPU直接转去执行其它任务,当IO完成后发送一个中断信号给CPU,让CPU中断当前的任务,转过来继续执行IO后的程序:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/07c610fb37d0a6ecc3c3a279203c2f0d..png
  


1.3.IO与内存

计算机进行IO的时候,本质上会为每一个IO设备在内存中分配一块空间,向这块空间里进行读写,即可完成IO。为什么给IO设备分配的内存会是在内核段里喃?主要是基于两点进行考虑的:

    ●安全性

    ●特权操作

安全性:

I/O 操作通常需要与计算机的外部设备(如磁盘、网络设备等)进行交互,如果允许各个进程自己私自与外部设备进行交互,IO的内存放在各个进程内部,太散了,不是很好进行安全控制,相反,如果将IO的内存放在内核段,就很便于集中管理,可以附加一些安全机制上去。

特权操作:

首先IO指令本身就是特权指令,会让CPU进入内核态,其次进行IO的时候会用到中断信号,也涉及到特权指令,也要求CPU处于内核态,所以如果IO内存是在内核段中,让CPU提前进入内核状态,也避免了后面来回切状态造成的时间浪费。

整个IO在内存中的流转过程如下:

读的时候磁盘拷贝到内核段、内核段拷贝到用户段,

写的时候用户段拷贝到内核段、内核段拷贝到磁盘。

一共四次复制。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/5b310be5e74e6997ec80f89f08680538..png
  

特别说明:

我知道其它很多地方这里将图画成了这个样子:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/2d074cab48ea0e67098846362e76349b..png
  

这是因为他描绘的这次IO是从磁盘上读出来然后写到网络上去,网卡和磁盘可以理解为两个不同的IO设备,所以他们在内核段中的IO内存,地址是不同的。但是如果仅仅是对磁盘的一次本地IO,那么进行IO的内核段地址会是同一个,在同一个地址内进行读写。这里为了涵盖多种情况,所以博主没有将它分开,读者悉知。

2.零拷贝

零拷贝(Zero-copy)是一种优化技术,并不是一次拷贝都不做,而是旨在减少数据在系统内部的复制操作,从而提高数据传输的效率。它的主要目标是减少内存到内存之间的数据拷贝。

零拷贝有两种实现方式:

    1.MMap

    2.SendFile

2.1.MMap

通过上文我们知道一次IO,数据会进行四次拷贝,MMap这种方式在将内核段中的数据拷贝到用户段的这次拷贝中,拷贝的不是数据,而是数据的映射,这样在用户段中进行数据处理完后,就不必再从用户段拷贝回内核段,从而减少了一次拷贝。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/9066a0ed420b123ca269fb954749667e..png
  

之所以能实现这样的效果是得益于操作系统底层有两种读操作:

    1.读取数据:常见的系统调用如 read()(用于文件描述符)或 recv()(用于套接字)用于从文件或套接字中读取数据。这些系统调用从相应的输入源(如磁盘、网络等)读取数据,并将其复制到应用程序提供的缓冲区中。这种方式涉及了数据的复制,因为数据需要从内核态复制到用户态缓冲区中。

    2.读取映射:另一种方式是通过内存映射(Memory Mapping)来实现读取操作。通过将文件或设备的数据映射到进程的内存区域中,应用程序可以直接访问内存映射区域中的数据,而无需使用传统的 read() 系统调用。在这种情况下,应用程序可以通过直接读取内存映射区域中的数据来获取文件或设备的内容,避免了中间的数据复制。

特别说明:

还是和上文类似,画图的问题。这里为了涵盖,本地IO和网络IO两种情况,内核段没拆成几个设备的不同地址空间,但是如果是从磁盘中读,然后向网络中写,是跨了IO设备的,所以中间有个内核段地址间的复制过程,如下图:

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/f1a9b237aaf99dea43ba2a3bbc85f11b..png
  

2.2.SendFile

SendFile更狠,直接就不走用户段,直接就是从内核段的一个内存地址复制到另一个内存地址,主要是拿来进行网络传输的,从本地磁盘读数据,读到一个地址里,然后将这个地址里的数据复制给另一个IO设备的地址,这个地址就可以是网络IO的地址。很明显sendFile有一个弊病,就是没走用户段的话,数据没办法处理,所以其只是一种用于实现数据传输的 "零拷贝" 技术,而不能直接进行数据处理。并且SendFile还存在大小限制。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/862d8bf855d5dbc9354d905c94eaa498..png
  

3.JAVA中的零拷贝

零拷贝需要进行系统调用才能实现,很明显要我们手写实现零拷贝是很底层、很麻烦的,好在JAVA在NIO中封装了mmap、SendFile两种零拷贝的API,当我们想在JAVA中使用零拷贝时,直接调API即可。

很多同学在NIO中老是搞不明白channel和buffer的关,容易晕,这里博主一句话总结一下:

JavaNlO中 的Channel就相当于操作系统中的内核缓冲区,而Buffer就相当于操作系统中的用户缓冲区。

mmap:

MappedByteBuffer mappedByteBuffer = new RandomAccessFile(file, "r")
                                                            .getChannel()
                                                        .map(FileChannel.MapMode.READ_ONLY, 0, len);


SendFile:

sendFile进行网络传输:

FileChannel sourceChannel = new RandomAccessFile(sourceFile, "rw").getChannel();
SocketChannel socketChannel = SocketChannel.open(sa);
sourceChannel.transferTo(0, sourceChannel.size(), socketChannel);

sendFile进行文件拷贝:

try (FileChannel srcChannel = new FileInputStream(src).getChannel();
        FileChannel targetChannel = new FileInputStream(target).getChannel()) {
        srcChannel.transferTo(0, srcChannel.size(), targetChannel );
} catch (IOException e) {
        e.printStackTrace();
}

免责申明:

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu

《数栈V6.0产品白皮书》下载地址:
https://fs80.cn/cw0iw1

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:
https://github.com/DTStack

0条评论
上一篇:Kafka概论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群