科大訊飛:說說零拷貝技術和多路複用技術?

磊哥課程 2024-07-01 13:21:07

零拷貝技術和多路複用技術是現代計算機系統和網絡編程中兩項重要的優化手段,旨在提高數據處理和傳輸的效率。如高性能框架 Netty 中,即使用了零拷貝技術又使用了多路複用技術,同時來保證 Netty 框架的高性能運行。

1.零拷貝技術

零拷貝(Zero-copy)技術是一種計算機操作系統中用于提高數據傳輸效率的優化策略。在傳統的數據傳輸過程中,需要將數據從一個緩沖區拷貝到另一個緩沖區,然後再傳輸給目標。這涉及到多次的 CPU 和內存之間的數據拷貝操作,會消耗 CPU 的時間和內存帶寬。而零拷貝技術通過直接共享數據的內存地址,避免了中間的拷貝過程,從而提高了數據傳輸的效率。

1.1 傳統IO

要搞明白零拷貝技術就要先搞清楚傳統 IO 的執行流程,傳統的 IO 的執行流程如下:

① 用戶態 VS 內核態

操作系統有用戶態和內核態之分,這是因爲計算機體系結構中的操作系統設計了兩個不同的執行環境,以提供不同的功能和特權級別。

用戶態(User Mode)是指應用程序運行時的執行環境。在用戶態下,應用程序只能訪問受限資源,如應用程序自身的內存空間、CPU 寄存器等,並且不能直接訪問操作系統的底層資源和硬件設備。內核態(Kernel Mode)是指操作系統內核運行時的執行環境。在內核態下,操作系統具有更高的權限,可以直接訪問系統的硬件和底層資源,如 CPU、內存、設備驅動程序等。② DMA技術

DMA(Direct Memory Access,直接內存訪問)技術,繞過 CPU,直接在內存和外設之間進行數據傳輸。這樣可以減少 CPU 的參與,提高數據傳輸的效率。

1.2 零拷貝技術

零拷貝技術可以利用 Linux 下的 MMap、sendFile 等手段來實現,使得數據能夠直接從磁盤映射到內核緩沖區,然後通過 DMA 傳輸到網卡緩存,整個過程中 CPU 只負責管理和調度,而無需執行實際的數據複制指令。

① MMap

MMap(Memory Map)是 Linux 操作系統中提供的一種將文件映射到進程地址空間的一種機制,通過 MMap 進程可以像訪問內存一樣訪問文件,而無需顯式的複制操作。

使用 MMap 可以把 IO 執行流程優化成以下執行步驟:

傳統的 IO 需要四次拷貝和四次上下文(用戶態和內核態)切換,而 MMap 只需要三次拷貝和四次上下文切換,從而能夠提升程序整體的執行效率,並且節省了程序的內存空間。

② senFile 方法

在 Linux 操作系統中 sendFile() 是一個系統調用函數,用于高效地將文件數據從內核空間直接傳輸到網絡套接字(Socket)上,從而實現零拷貝技術。這個函數的主要目的是減少 CPU 上下文切換以及內存複制操作,提高文件傳輸性能。

使用 sendFile() 可以把 IO 執行流程優化成以下執行步驟:

1.3 零拷貝技術應用

在 Java 中,以下幾個地方使用了零拷貝技術:

NIO(New I/O)通道:java.nio.channels.FileChannel 提供了 transferTo() 和 transferFrom() 方法,可以直接將數據從一個通道傳輸到另一個通道,例如從文件通道直接傳輸到 Socket 通道,整個過程無需將數據複制到用戶空間緩沖區,從而實現了零拷貝。Socket Direct Buffer:在 JDK 1.4 及更高版本中,Java NIO 支持使用直接緩沖區(DirectBuffer),這類緩沖區是在系統堆外分配的,可以直接由網卡硬件進行 DMA 操作,減少數據在用戶態與內核態之間複制次數 ,提高網絡數據發送效率。Apache Kafka 或者 Netty 等高性能框架:這些框架在底層實現上通常會利用 Java NIO 的上述特性來優化數據傳輸,如 Kafka 生産者和消費者在傳輸消息時會用到零拷貝技術以提升性能。2.多路複用技術

多路複用技術則是一種讓單個進程(或線程)能夠同時監視多個描述符(如文件描述符、socket描述符)的技術,當其中任何一個描述符准備好進行讀、寫或者異常操作時,就會通知該進程。這種方式可以顯著提高並發處理能力,減少系統開銷,特別是在處理大量並發連接時。

主要的多路複用技術包括:

select:最基礎的多路複用接口,但受限于最大文件描述符數量,且每次調用都需要重新傳入所有待檢查的描述符集合。poll:相對于 select 有所改進,使用鏈表管理描述符,解決了文件描述符數量限制問題,但仍存在效率問題。epoll:提供了更高效的事件通知機制,僅關注發生變化的文件描述符,避免了無謂的遍曆,特別適用于高並發場景。

在 Java 中,可以通過 NIO(非阻塞 I/O)庫中的 Selector 實現多路複用,結合諸如 FileChannel.transferTo() 等方法實現零拷貝,從而在開發高性能網絡應用和服務時顯著提升數據處理和傳輸的效率。

課後思考

Netty 中使用了哪種零拷貝技術?它的多路複用和 NIO 的多路複用有什麽區別?

0 阅读:83

磊哥課程

簡介:感謝大家的關注