1.1.2 I/O多路復用技術
在I/O編程過程中,當需要同時處理多個客戶端接入請求時,可以利用多線程或者I/O多路復用技術進行處理。I/O多路復用技術通過把多個I/O的阻塞復用到同一個select的阻塞上,從而使得系統在單線程的情況下可以同時處理多個客戶端請求。與傳統的多線程/多進程模型比,I/O多路復用的最大優勢是系統開銷小,系統不需要創建新的額外進程或者線程,也不需要維護這些進程和線程的運行,降低了系統的維護工作量,節省了系統資源,I/O多路復用的主要應用場景如下。
◎ 服務器需要同時處理多個處于監聽狀態或者多個連接狀態的套接字;
◎ 服務器需要同時處理多種網絡協議的套接字。
目前支持I/O多路復用的系統調用有select、pselect、poll、epoll,在Linux網絡編程過程中,很長一段時間都使用select做輪詢和網絡事件通知,然而select的一些固有缺陷導致了它的應用受到了很大的限制,最終Linux不得不在新的內核版本中尋找select的替代方案,最終選擇了epoll。epoll與select的原理比較類似,為了克服select的缺點,epoll作了很多重大改進,現總結如下。
1.支持一個進程打開的socket描述符(FD)不受限制(僅受限于操作系統的最大文件句柄數)。
select最大的缺陷就是單個進程所打開的FD是有一定限制的,它由FD_SETSIZE設置,默認值是1024。對于那些需要支持上萬個TCP連接的大型服務器來說顯然太少了??梢赃x擇修改這個宏然后重新編譯內核,不過這會帶來網絡效率的下降。我們也可以通過選擇多進程的方案(傳統的Apache方案)解決這個問題,不過雖然在Linux上創建進程的代價比較小,但仍舊是不可忽視的,另外,進程間的數據交換非常麻煩,對于Java由于沒有共享內存,需要通過Socket通信或者其他方式進行數據同步,這帶來了額外的性能損耗,增加了程序復雜度,所以也不是一種完美的解決方案。值得慶幸的是,epoll并沒有這個限制,它所支持的FD上限是操作系統的最大文件句柄數,這個數字遠遠大于1024。例如,在1GB內存的機器上大約是10萬個句柄左右,具體的值可以通過cat/proc/sys/fs/file-max察看,通常情況下這個值跟系統的內存關系比較大。
2.I/O效率不會隨著FD數目的增加而線性下降。
傳統的select/poll另一個致命弱點就是當你擁有一個很大的socket集合,由于網絡延時或者鏈路空閑,任一時刻只有少部分的socket是“活躍”的,但是select/poll每次調用都會線性掃描全部的集合,導致效率呈現線性下降。epoll不存在這個問題,它只會對“活躍”的socket進行操作-這是因為在內核實現中epoll是根據每個fd上面的callback函數實現的,那么,只有“活躍”的socket才會主動的去調用callback函數,其他idle狀態socket則不會。在這點上,epoll實現了一個偽AIO。針對epoll和select性能對比的benchmark測試表明:如果所有的socket都處于活躍態-例如一個高速LAN環境,epoll并不比select/poll效率高太多;相反,如果過多使用epoll_ctl,效率相比還有稍微的下降。但是一旦使用idle connections模擬WAN環境,epoll的效率就遠在select/poll之上了。
3.使用mmap加速內核與用戶空間的消息傳遞。
無論是select,poll還是epoll都需要內核把FD消息通知給用戶空間,如何避免不必要的內存復制就顯得非常重要,epoll是通過內核和用戶空間mmap同一塊內存實現。
4.epoll的API更加簡單。
包括創建一個epoll描述符、添加監聽事件、阻塞等待所監聽的事件發生,關閉epoll描述符等。
值得說明的是,用來克服select/poll缺點的方法不只有epoll,epoll只是一種Linux的實現方案。在freeBSD下有kqueue,而dev/poll是最古老的Solaris的方案,使用難度依次遞增。kqueue是freebsd的寵兒,它實際上是一個功能相當豐富的kernel事件隊列,它不僅僅是select/poll的升級,而且可以處理signal、目錄結構變化、進程等多種事件,kqueue是邊緣觸發的。/dev/poll是Solaris的產物,是這一系列高性能API中最早出現的。Kernel提供一個特殊的設備文件/dev/poll,應用程序打開這個文件得到操作fd_set的句柄,通過寫入pollfd來修改它,一個特殊的ioctl調用用來替換select,不過由于出現的年代比較早,所以/dev/poll的接口實現比較原始。
到這里,I/O的基礎知識已經介紹完畢,從1.2章節開始介紹Java的I/O演進歷史,從BIO到NIO是Java通信類庫邁出的一小步,但卻對Java在高性能通信領域的發展起到了關鍵性的推動作用。隨著基于NIO的各類NIO框架的發展,以及基于NIO的Web服務器的發展,Java在很多領域取代了C和C++,成為企業服務端應用開發的首選語言。